工作职责:
1、深度洞察C端用户需求,构建 AI 产品质量评测体系,科学制定评测指标与标准,确保评测项目高效执行,输出专业详尽的评测报告,精准捕捉并提炼用户体验痛点,持续推动C端产品用户体验升级。
2、主导大模型在 C 端产品溶地的效果评估工作,针对文生文、多模态理解与生成等核心能力展开全面评测,深度分析不同大模型在多元用户需求场景下的性能表现,为大模型的精准落地提供坚实数据支撑。
3、聚焦 AI 产品垂类技能,对算法效果进行迭代评测,通过深度数据分析挖掘优化方向,协同算法团队推进算法优化,实现产品核心功能的持续迭代与性能提升。
4、构建自动化评测方案,紧跟模型能力发展趋势,积极探索全模态评测技术,推动评测体系的智能化、高效化升级,提升整体评测效能。
任职资格:
1、本科及以上学历,5年相关工作经验,熟悉大模型基本原理,或具备大模型相关项目实践经验,对 AI 行业发展动态有敏锐洞察力。
2、深入理解 AI类产品的能力边界与技术特性,能够精准把握用户需求,具备从用户视角评估产品质量的能力。
3、具备基础自动化技能,熟练掌握 Python编程,熟悉接口测试流程,可进行简单脚本开发,能够通过自动化手段提升评测效率。
4、熟练使用 Excel,精通各类函数应用,具备高效的数据计算、处理与分析能力,能够从海量数据中提取关键信息。
5、拥有出色的沟通协调能力、严谨的逻辑思维能力与深度数据分析能力,善于发现问题并提出系统性解决方案,具备良好的团队协作精神与项目推进能力。