视觉大模型技术与应用

汽车系统工程

会员

视觉大模型技术与应用
视觉大模型可以解决传统机器视觉方案的标注成本高、泛化能力弱、场景迁移难的痛点。本讲座介绍视觉大模型的解决方案和行业实践经验。
主讲：刘老师,哈佛大学人工智能方向博士后/高级访问学者
时间：2026年1月24日
费用：免费
地点：在线交流，会议网址报名接收后通知
限制人数：100人

交流安排
1. 行业为什么需要视觉大模型
        • 传统视觉方案的痛点
        • 大模型带来的改变
2. 视觉大模型的通用能力底座
        • 通用检测、分割、识别
        • 零样本 / 小样本
        • 语言驱动视觉理解
3. 图像分割大模型的行业实践
        • 工业与制造
                。SAM：工件、缺陷区域分割
                。 Grounded-SAM：语言描述定位
        • 异常安防与城市治理
                。 SAM2：视频目标连续分割
                。 Semantic-SAM：城市要素语义分割
        • 机器人与智能系统
                。Sa2VA：视觉能力进入 Agent
                。从“看见”到“行动”
4. 行业落地模式总结
      • 大模型 ≠ 直接替代业务系统
      • “大模型 + 行业规则 + 小模型”的组合路线
5. 未来展望
      • 视觉大模型的产业化趋势
      • 从单点算法到智能平台
目标听众：关注AI的技术人员
请关注"火龙果"官方微信号，可以订阅讲座实录，还可以了解后续的课程，欢迎参与！

问题收集（以下问题将在讲座中进行讨论或解答）

1. 视觉大模型嵌入式应用能力及方案视觉大模型嵌入式应用进展
视觉大模型训练需要的专业能力
如何通过对大模型对任意类型文本精进行自动识别和标注

2. 视觉大模型的推理效率是否成为规模化应用的主要障碍

3. 视觉大模型如何应用于水下小目标智能识别

4. 空中识别低空小型无人机技术能达到什么水平？或有什么技术路线。
在低空飞行场景中，视觉大模型如何实现“看见”到“理解”？

5. 视觉大模型嵌入式应用能力及方案
视觉大模型嵌入式应用进展

6. SAM和大模型如何融合

7. 如何通过对大模型对任意类型文本精进行自动识别和标注
推荐几个自动标注工具
如果自动搜集网络上的垂域信息，包括书籍、论文、专利

8. 视觉大模型训练需要的专业能力

9. 向量数据库、视觉大模型的泛化能力、性能和硬件开销各有什么优劣？
图片搜索向量数据库、视觉大模型哪个好？
视觉大模型能不能切分并分布式部署？

最新活动计划

UAF架构体系与实践 7-23[北京]

SysML和EA系统设计与建模 7-16[深圳]

Spec 驱动开发(SDD)实战 7-28[北京]

AI辅助软件测试方法与实践 7-31[在线]

AI智能体开发技术实践 8-6[上海]

基于UML和EA系统分析设计 8-20[上海]