求知 文章 文库 Lib 视频 iPerson 课程 认证 咨询 工具 讲座 Model Center 汽车系统工程   模型库  
会员   
 
要资料
 

 
  • 视觉大模型技术与应用
  • 视觉大模型可以解决传统机器视觉方案的标注成本高、泛化能力弱、场景迁移难的痛点。本讲座介绍视觉大模型的解决方案和行业实践经验。
  •  
  • 主讲:刘老师,哈佛大学人工智能方向博士后/高级访问学者
  • 时间:2026年1月24日
  • 费用:免费
  • 地点:在线交流,会议网址报名接收后通知
  • 限制人数:100人
  • 交流安排

  • 1. 行业为什么需要视觉大模型
            • 传统视觉方案的痛点
            • 大模型带来的改变
    2. 视觉大模型的通用能力底座
            • 通用检测、分割、识别
            • 零样本 / 小样本
            • 语言驱动视觉理解
    3. 图像分割大模型的行业实践
            • 工业与制造
                    SAM:工件、缺陷区域分割
                     Grounded-SAM:语言描述定位
            • 异常安防与城市治理
                     SAM2:视频目标连续分割
                     Semantic-SAM:城市要素语义分割
            • 机器人与智能系统
                    Sa2VA:视觉能力进入 Agent
                     从“看见”到“行动”
    4. 行业落地模式总结
          • 大模型 ≠ 直接替代业务系统
          • “大模型 + 行业规则 + 小模型”的组合路线
    5. 未来展望
          • 视觉大模型的产业化趋势
          • 从单点算法到智能平台
  • 目标听众:关注AI的技术人员
  • 请关注"火龙果"官方微信号,可以订阅讲座实录,还可以了解后续的课程,欢迎参与!
  •  
 
  • 问题收集(以下问题将在讲座中进行讨论或解答)

1. 视觉大模型嵌入式应用能力及方案视觉大模型嵌入式应用进展
视觉大模型训练需要的专业能力
如何通过对大模型对任意类型文本精进行自动识别和标注
2. 视觉大模型的推理效率是否成为规模化应用的主要障碍
3. 视觉大模型如何应用于水下小目标智能识别
4. 空中识别低空小型无人机技术能达到什么水平?或有什么技术路线。
在低空飞行场景中,视觉大模型如何实现“看见”到“理解”?
5. 视觉大模型嵌入式应用能力及方案
视觉大模型嵌入式应用进展
6. SAM和大模型如何融合
7. 如何通过对大模型对任意类型文本精进行自动识别和标注
推荐几个自动标注工具
如果自动搜集网络上的垂域信息,包括书籍、论文、专利
8. 视觉大模型训练需要的专业能力
9. 向量数据库、视觉大模型的泛化能力、性能和硬件开销各有什么优劣?
图片搜索向量数据库、视觉大模型哪个好?
视觉大模型能不能切分并分布式部署?




最新活动计划
嵌入式软件测试方法&实践 3-20[在线]
MBSE理论方法到工作实践 3-28[北京]
需求分析与管理 4-21[在线]
基于LLM的Agent应用开发 4-18[北京]
SysML和EA系统设计建模 4-23[北京]
基于本体的体系架构设计 4-24[北京]
认证课:OCSMP-MU 周末班[在线]