视频智能分析、行为分析算法、边缘计算AI盒子

发布时间: 2026-02-15 09:10:51

随着DeepSeek、Qwen等大模型陆续开源，大模型正经历一场深刻的“下沉运动”。云端的神话，开始寻求地面的答案——当智能需要在城市道路、园区街角、工厂产线中实时涌现，我们面临的，是海量数据、严苛延时与有限功耗的终极博弈。边缘计算专用方案，已成为大模型规模化落地的关键。在这一浪潮中，算能以芯见智，推出了多个边缘计算场景解决方案，在智能落地的广度和深度上取得了巧妙平衡

Part1：驭算开物开源芯动

2025年，随着DeepSeek、通义千问等顶尖模型相继开源，行业焦点正从“规模竞赛”转向“落地竞速”。当智能从云端下沉至边缘，算能正在用其坚实的算力底座铺就这最后一公里。

1. 持续适配CNN开源模型，打造轻量大型多模态模型（L2M2）场景落地应用。

2. 适配ChatGLM | Llama | Qwen | MiniCPM | DeepSeek等主流边缘大模型，部署代码全部开源。

3. 助力合作伙伴完成"视频/音频+AI“场景落地，拓展边缘智能的交互边界。

Part2：多元适配深度优化

算能深入主流开源模型架构，完成了从传统CNN模型到大语言模型和多模态大模型的全面兼容与性能攻坚。更重要的是，我们将这些深度优化的能力，凝结为一整套标准化、高性能的边缘AI硬件产品，让端侧的模型部署，从一项复杂的工程挑战，转变为高效可靠的标准化流程。

1. 完整模型适配矩阵

**视觉模型**

https://github.com/sophgo/sophon-demo/tree/release/sample/YOLOv34

检测	YOLOv34 \| YOLOv5 \| YOLOv7 \| YOLOv10 YOLOX \| YOLO_world
	YOLOv8_det \| YOLOv9_det \| YOLOv11_det YOLOv12_det
	YOLOv5_opt \| YOLOv5_fuse
	YOLOv8_obb \| YOLOv11_obb
	YOLOv8_pose \| OpenPose \| HRNet_pose
	ppYOLOv3 \| ppYoloe
	SSD \| D-FINE
	RetinaFace \| SCRFD
	DirectMHP
识别	LPRNet \| PP-OCR
	CenterNet
	C3D \| SlowFast
	P2PNet
分类	ResNet \| Recognize-Anything \| YOLOv8_plus_cls
分类	CLIP \| SuperGlue \| LightStereo
分割	P2PNet
	segformer \| SAM \| SAM2
	yolact \| YOLOv8_plus_seg \| YOLOv8_plus_seg_fuse YOLOv9_seg
生成	StableDiffusionV1.5 \| StableDiffusionXL \| FLUX.1
生成	Real-ESRGAN
跟踪	DeepSORT
跟踪	ByteTrack

**音频模型**

https://github.com/sophgo/sophon-demo/tree/release/sample/WeNet

类型	模型
识别	WeNet
	Whisper
	Seamless
	CAM++
优化	FaceFormer
优化	MP_SENet
生成	VITS_CHINESE
生成	ChatTTS

**大语言模型**

https://github.com/sophgo/sophon-demo/tree/release/sample/ChatGLM2

类型	模型
Chat系列	ChatGLM2 \| ChatGLM3 \| ChatGLM4
Qwen系列	Qwen-7b Qwen1.5-1.8B \| Qwen1.5-7B Qwen2-7b Qwen2.5-0.5B \| Qwen2.5-1.5B \| Qwen2.5-3B \| Qwen2.5-7B Qwen3-0.6B \| Qwen3-1.7B \| Qwen3-4B \| Qwen3-7B
	QwQ-32B
DeepSeek系列	deepseek-r1-distill-qwen-1.5b deepseek-r1-distill-qwen-7b
	deepseek-r1-distill-qwen2-1.5b deepseek-r1-distill-qwen2-7b deepseek-r1-distill-qwen2-14b
Mini CPM系列	MiniCPM \| MiniCPM3 \| MiniCPM4

**多模态大模型**

https://github.com/sophgo/sophon-demo/tree/release/sample/Qwen-VL-Chat

类型	模型
Qwen系列	Qwen-VL-Chat Qwen2-VL \| Qwen2.5-VL-3B \| Qwen2.5-VL-7B Qwen3-VL-2B \| Qwen3-VL-4B \| Qwen3-VL-8B
Intern系列	InternVL2 \| InternVL3-2B \| InternVL3-8B
其他	Vila \| Llama3_2_Vision \| MiniCPMV-4B GroundingDINO \| Phi4mm \| VITA1_5 \| BLIP

模型适配参考链接：

https://github.com/sophgo/sophon-demo

2. 深度优化性能强大

● LLM适配性能

● VLM适配性能

Part3：算力为基生态共创

1. 视觉模型典型应用产品——全时全域感知计算一体机

全时全域一体机是智能体的数字基础设施，通感算定安一体化，是城市智能体的“数智基站”，广泛应用于路边灯杆、街角箱柜、社区机房等系统中。

2. 音频模型典型应用产品——谈话记录拾音器

提供语音实时转写，支持生僻词配置识别等功能，准确率高。支持全文转写，关键词告警等特色功能。产品应用在需要语音转录的场景如司法审讯或教育过程录制等。

3. 大语言模型典型应用产品——AI NAS

覆盖2~6盘位组合，配套移动端(Android & IOS)/PC端/TV端管理平台。能集中管理家庭所有IPC，并支持“对话式”文搜功能：AI自动分类人物与场景，用自然语言搜索文件与照片，并通过AI Agent自动处理任务，是每个家庭的私人管家。

4. 多模态大模型典型应用产品——智能分析主机

集IPC接入、存储、管理、智能分析、智能展示于一体，实现智能文搜、图搜、精确目标分析、周界防范和人/车视频结构化等智能分析应用的边缘计算主机。

Part4：持算笃行芯向未来

过去的一年，算能始终持算力芯片之基，笃行业赋能之行。我们的边缘产品矩阵，为产业智能的落地提供了坚实底座。从核心的算力硬件到开源的软件工具，从标杆性的一体机产品到与生态伙伴共创的行业方案，算能正与产业同行，将智能算力转化为千行百业切实的生产力与创新力。

边缘计算AI盒子、执法记录仪、一体化布控球等目前支持的AI智能算法、视频智能分析算法有哪些，

https://www.besovideo.com/detail?t=1&i=297

统一视频~融合通信指挥调度~安全生产可视化管控平台smarteye与AI盒子的融合相关图片， https://www.besovideo.com/detail?t=1&i=338

AI盒子使用手册，https://www.besovideo.com/detail?t=1&i=340