视频智能分析、行为分析算法、边缘计算AI盒子

发布时间: 2026-02-15 09:10:51

随着DeepSeek、Qwen等大模型陆续开源,大模型正经历一场深刻的“下沉运动”。云端的神话,开始寻求地面的答案——当智能需要在城市道路、园区街角、工厂产线中实时涌现,我们面临的,是海量数据、严苛延时与有限功耗的终极博弈。边缘计算专用方案,已成为大模型规模化落地的关键。在这一浪潮中,算能以芯见智,推出了多个边缘计算场景解决方案,在智能落地的广度和深度上取得了巧妙平衡

Part1:驭算开物 开源芯动

2025年,随着DeepSeek、通义千问等顶尖模型相继开源,行业焦点正从“规模竞赛”转向“落地竞速”。 当智能从云端下沉至边缘,算能正在用其坚实的算力底座铺就这最后一公里。

1. 持续适配CNN开源模型,打造轻量大型多模态模型(L2M2)场景落地应用。

2. 适配ChatGLM | Llama | Qwen | MiniCPM | DeepSeek等主流边缘大模型,部署代码全部开源。

3. 助力合作伙伴完成"视频/音频+AI“场景落地,拓展边缘智能的交互边界。

 

Part2:多元适配 深度优化

算能深入主流开源模型架构,完成了从传统CNN模型到大语言模型和多模态大模型的全面兼容与性能攻坚。更重要的是,我们将这些深度优化的能力,凝结为一整套标准化、高性能的边缘AI硬件产品,让端侧的模型部署,从一项复杂的工程挑战,转变为高效可靠的标准化流程。

1. 完整模型适配矩阵

**视觉模型**

https://github.com/sophgo/sophon-demo/tree/release/sample/YOLOv34

检测

YOLOv34 | YOLOv5 | YOLOv7 | YOLOv10

YOLOX | YOLO_world

YOLOv8_det | YOLOv9_det | YOLOv11_det

YOLOv12_det

YOLOv5_opt | YOLOv5_fuse

YOLOv8_obb | YOLOv11_obb

YOLOv8_pose | OpenPose | HRNet_pose

ppYOLOv3 | ppYoloe

SSD | D-FINE

RetinaFace | SCRFD

DirectMHP

识别

LPRNet | PP-OCR

CenterNet

C3D | SlowFast

P2PNet

分类

ResNet | Recognize-Anything | YOLOv8_plus_cls

CLIP | SuperGlue | LightStereo

分割

P2PNet

segformer | SAM | SAM2

yolact | YOLOv8_plus_seg | YOLOv8_plus_seg_fuse

YOLOv9_seg

生成

StableDiffusionV1.5 | StableDiffusionXL | FLUX.1

Real-ESRGAN

跟踪

DeepSORT

ByteTrack

**音频模型**

https://github.com/sophgo/sophon-demo/tree/release/sample/WeNet

类型

模型

识别

WeNet

Whisper

Seamless

CAM++

优化

FaceFormer

MP_SENet

生成

VITS_CHINESE

ChatTTS

**大语言模型**

https://github.com/sophgo/sophon-demo/tree/release/sample/ChatGLM2

类型

模型

Chat系列

ChatGLM2 | ChatGLM3 | ChatGLM4

Qwen系列

Qwen-7b

Qwen1.5-1.8B | Qwen1.5-7B

Qwen2-7b

Qwen2.5-0.5B | Qwen2.5-1.5B | Qwen2.5-3B | Qwen2.5-7B

Qwen3-0.6B | Qwen3-1.7B | Qwen3-4B | Qwen3-7B

 

QwQ-32B

DeepSeek系列

deepseek-r1-distill-qwen-1.5b

deepseek-r1-distill-qwen-7b

 

deepseek-r1-distill-qwen2-1.5b

deepseek-r1-distill-qwen2-7b

deepseek-r1-distill-qwen2-14b

Mini CPM系列

MiniCPM | MiniCPM3 | MiniCPM4

 **多模态大模型**

https://github.com/sophgo/sophon-demo/tree/release/sample/Qwen-VL-Chat

类型

模型

Qwen系列

Qwen-VL-Chat

Qwen2-VL | Qwen2.5-VL-3B | Qwen2.5-VL-7B

Qwen3-VL-2B | Qwen3-VL-4B | Qwen3-VL-8B

Intern系列

InternVL2 | InternVL3-2B | InternVL3-8B

其他

Vila | Llama3_2_Vision | MiniCPMV-4B

GroundingDINO | Phi4mm | VITA1_5 | BLIP

模型适配参考链接:

https://github.com/sophgo/sophon-demo

 

2. 深度优化性能强大

● LLM适配性能

 

● VLM适配性能

 

Part3:算力为基 生态共创

1. 视觉模型典型应用产品——全时全域感知计算一体机

全时全域一体机是智能体的数字基础设施,通感算定安一体化,是城市智能体的“数智基站”,广泛应用于路边灯杆、街角箱柜、社区机房等系统中。

2. 音频模型典型应用产品——谈话记录拾音器

提供语音实时转写,支持生僻词配置识别等功能,准确率高。支持全文转写,关键词告警等特色功能。产品应用在需要语音转录的场景如司法审讯或教育过程录制等。

 

3. 大语言模型典型应用产品——AI NAS

覆盖2~6盘位组合,配套移动端(Android & IOS)/PC端/TV端管理平台。能集中管理家庭所有IPC,并支持“对话式”文搜功能:AI自动分类人物与场景,用自然语言搜索文件与照片,并通过AI Agent自动处理任务,是每个家庭的私人管家。

 

4. 多模态大模型典型应用产品——智能分析主机

集IPC接入、存储、管理、智能分析、智能展示于一体,实现智能文搜、图搜、精确目标分析、周界防范和人/车视频结构化等智能分析应用的边缘计算主机。

 

Part4:持算笃行 芯向未来

过去的一年,算能始终持算力芯片之基,笃行业赋能之行。我们的边缘产品矩阵,为产业智能的落地提供了坚实底座。从核心的算力硬件到开源的软件工具,从标杆性的一体机产品到与生态伙伴共创的行业方案,算能正与产业同行,将智能算力转化为千行百业切实的生产力与创新力。

边缘计算AI盒子、执法记录仪、一体化布控球等目前支持的AI智能算法、视频智能分析算法有哪些,

https://www.besovideo.com/detail?t=1&i=297

统一视频~融合通信指挥调度~安全生产可视化管控平台smarteye与AI盒子的融合相关图片, https://www.besovideo.com/detail?t=1&i=338

 

AI盒子使用手册,https://www.besovideo.com/detail?t=1&i=340