视频智能分析、行为分析算法、边缘计算AI盒子
随着DeepSeek、Qwen等大模型陆续开源,大模型正经历一场深刻的“下沉运动”。云端的神话,开始寻求地面的答案——当智能需要在城市道路、园区街角、工厂产线中实时涌现,我们面临的,是海量数据、严苛延时与有限功耗的终极博弈。边缘计算专用方案,已成为大模型规模化落地的关键。在这一浪潮中,算能以芯见智,推出了多个边缘计算场景解决方案,在智能落地的广度和深度上取得了巧妙平衡
Part1:驭算开物 开源芯动
2025年,随着DeepSeek、通义千问等顶尖模型相继开源,行业焦点正从“规模竞赛”转向“落地竞速”。 当智能从云端下沉至边缘,算能正在用其坚实的算力底座铺就这最后一公里。
1. 持续适配CNN开源模型,打造轻量大型多模态模型(L2M2)场景落地应用。
2. 适配ChatGLM | Llama | Qwen | MiniCPM | DeepSeek等主流边缘大模型,部署代码全部开源。
3. 助力合作伙伴完成"视频/音频+AI“场景落地,拓展边缘智能的交互边界。
Part2:多元适配 深度优化
算能深入主流开源模型架构,完成了从传统CNN模型到大语言模型和多模态大模型的全面兼容与性能攻坚。更重要的是,我们将这些深度优化的能力,凝结为一整套标准化、高性能的边缘AI硬件产品,让端侧的模型部署,从一项复杂的工程挑战,转变为高效可靠的标准化流程。
1. 完整模型适配矩阵
**视觉模型**
https://github.com/sophgo/sophon-demo/tree/release/sample/YOLOv34
|
检测 |
YOLOv34 | YOLOv5 | YOLOv7 | YOLOv10 YOLOX | YOLO_world |
|
YOLOv8_det | YOLOv9_det | YOLOv11_det YOLOv12_det |
|
|
YOLOv5_opt | YOLOv5_fuse |
|
|
YOLOv8_obb | YOLOv11_obb |
|
|
YOLOv8_pose | OpenPose | HRNet_pose |
|
|
ppYOLOv3 | ppYoloe |
|
|
SSD | D-FINE |
|
|
RetinaFace | SCRFD |
|
|
DirectMHP |
|
|
识别 |
LPRNet | PP-OCR |
|
CenterNet |
|
|
C3D | SlowFast |
|
|
P2PNet |
|
|
分类 |
ResNet | Recognize-Anything | YOLOv8_plus_cls |
|
CLIP | SuperGlue | LightStereo |
|
|
分割 |
P2PNet |
|
segformer | SAM | SAM2 |
|
|
yolact | YOLOv8_plus_seg | YOLOv8_plus_seg_fuse YOLOv9_seg |
|
|
生成 |
StableDiffusionV1.5 | StableDiffusionXL | FLUX.1 |
|
Real-ESRGAN |
|
|
跟踪 |
DeepSORT |
|
ByteTrack |
**音频模型**
https://github.com/sophgo/sophon-demo/tree/release/sample/WeNet
|
类型 |
模型 |
|
识别 |
WeNet |
|
Whisper |
|
|
Seamless |
|
|
CAM++ |
|
|
优化 |
FaceFormer |
|
MP_SENet |
|
|
生成 |
VITS_CHINESE |
|
ChatTTS |
**大语言模型**
https://github.com/sophgo/sophon-demo/tree/release/sample/ChatGLM2
|
类型 |
模型 |
|
Chat系列 |
ChatGLM2 | ChatGLM3 | ChatGLM4 |
|
Qwen系列 |
Qwen-7b Qwen1.5-1.8B | Qwen1.5-7B Qwen2-7b Qwen2.5-0.5B | Qwen2.5-1.5B | Qwen2.5-3B | Qwen2.5-7B Qwen3-0.6B | Qwen3-1.7B | Qwen3-4B | Qwen3-7B |
|
|
QwQ-32B |
|
DeepSeek系列 |
deepseek-r1-distill-qwen-1.5b deepseek-r1-distill-qwen-7b |
|
|
deepseek-r1-distill-qwen2-1.5b deepseek-r1-distill-qwen2-7b deepseek-r1-distill-qwen2-14b |
|
Mini CPM系列 |
MiniCPM | MiniCPM3 | MiniCPM4 |
https://github.com/sophgo/sophon-demo/tree/release/sample/Qwen-VL-Chat
|
类型 |
模型 |
|
Qwen系列 |
Qwen-VL-Chat Qwen2-VL | Qwen2.5-VL-3B | Qwen2.5-VL-7B Qwen3-VL-2B | Qwen3-VL-4B | Qwen3-VL-8B |
|
Intern系列 |
InternVL2 | InternVL3-2B | InternVL3-8B |
|
其他 |
Vila | Llama3_2_Vision | MiniCPMV-4B GroundingDINO | Phi4mm | VITA1_5 | BLIP |
模型适配参考链接:
https://github.com/sophgo/sophon-demo
2. 深度优化性能强大
● LLM适配性能
● VLM适配性能
Part3:算力为基 生态共创
1. 视觉模型典型应用产品——全时全域感知计算一体机
全时全域一体机是智能体的数字基础设施,通感算定安一体化,是城市智能体的“数智基站”,广泛应用于路边灯杆、街角箱柜、社区机房等系统中。
2. 音频模型典型应用产品——谈话记录拾音器
提供语音实时转写,支持生僻词配置识别等功能,准确率高。支持全文转写,关键词告警等特色功能。产品应用在需要语音转录的场景如司法审讯或教育过程录制等。
3. 大语言模型典型应用产品——AI NAS
覆盖2~6盘位组合,配套移动端(Android & IOS)/PC端/TV端管理平台。能集中管理家庭所有IPC,并支持“对话式”文搜功能:AI自动分类人物与场景,用自然语言搜索文件与照片,并通过AI Agent自动处理任务,是每个家庭的私人管家。
4. 多模态大模型典型应用产品——智能分析主机
集IPC接入、存储、管理、智能分析、智能展示于一体,实现智能文搜、图搜、精确目标分析、周界防范和人/车视频结构化等智能分析应用的边缘计算主机。
Part4:持算笃行 芯向未来
过去的一年,算能始终持算力芯片之基,笃行业赋能之行。我们的边缘产品矩阵,为产业智能的落地提供了坚实底座。从核心的算力硬件到开源的软件工具,从标杆性的一体机产品到与生态伙伴共创的行业方案,算能正与产业同行,将智能算力转化为千行百业切实的生产力与创新力。
边缘计算AI盒子、执法记录仪、一体化布控球等目前支持的AI智能算法、视频智能分析算法有哪些,
https://www.besovideo.com/detail?t=1&i=297
统一视频~融合通信指挥调度~安全生产可视化管控平台smarteye与AI盒子的融合相关图片, https://www.besovideo.com/detail?t=1&i=338
AI盒子使用手册,https://www.besovideo.com/detail?t=1&i=340
