求知 文章 文库 Lib 视频 iPerson 课程 认证 咨询 工具 讲座 Model Center 汽车系统工程   模型库  
会员   
 
要资料
 

 
  • AI大模型与智能体评测方法与工具
  • 针对AI大模型与智能体选型,优化效果度量等需求,需要对其进行客观量化评测,本主题通过案例全面讲解评测流程、方法与工具,并对评测结果进行解读、瓶颈与优化策略分析。
  •  
  • 主讲:赵老师,研发质量与效能总监/技术专家
  • 时间:2026年5月23日 上午 10:00-11:00
  • 费用:免费
  • 地点:在线交流,会议网址报名接收后通知
  • 限制人数:100人
  • 交流安排

  • 1. AI大模型与智能体评测流程
    2. AI大模型与智能体主要评测指标
    3. 通过大模型自动生成评测数据
    4. 利用Opencompass评测大模型
    5. 利用Ragas进行AI智能体评测
    6. 评测指标解读
    7. RAG性能瓶颈分析
    8. RAG优化策略
  • 目标听众:关注AI研发与测试的人员
  • 请关注"火龙果"官方微信号,可以订阅讲座实录,还可以了解后续的课程,欢迎参与!
  •  
 
  • 问题收集(以下问题将在讲座中进行讨论或解答)

做模型的公司很多,怎么选呢,尤其是一些免费的,怎么能及时知道对应的场景更新

如何运用AI实现软件代码质量审查

智能体的选择
如何确保代码与产品质量
多agent协作

如何评测含多个大小模型的智能体?
对于用户能自由设置工具、技能的智能体,评测时要注意哪些问题?
如何选出智能体+RAG组合性能较好的方案?

通过大模型收集的数据,怎么判断数据是有效的?

主要想了解大模型和智能体相关知识

智能体测试方法







最新活动计划
AI辅助企业网络安全与治理 6-11[北京]
基于模型的数据治理 6-16[北京]
Spec 驱动开发(SDD)实战 6-12[北京]
具身智能技能与实践 6-11[厦门]
AI智能体开发技术实践 6-24[上海]
AI辅助软件测试方法与实践 6-26[在线]