找回密码
立即注册
搜索
热搜: 活动 交友 discuz
发新帖

1万

积分

0

好友

5722

主题
发表于 2025-12-29 15:40 | 查看: 76076| 回复: 0 北京
  市场监管总局相关负责人介绍,作为首部聚焦通用大模型的国家标准,该系列标准填补了技术评价体系空白,明确了性能、安全与服务能力要求,配套评测能力已获中国合格评定国家认可委员会认可。
  基于此构建的“求索”-LMBench评测基准,整合方法、数据集与自动化平台,成为行业公认的“能力标尺”。评测体系已形成主流大模型白名单,为央企、国企选型提供依据,并支撑中国石化、南方电网等建设行业大模型,完成对华为盘古、讯飞星火、中国移动“九天”等模型的场景验证。
  截至目前,标准工具已完成千余项评测任务,调用大模型超95万次,精准识别幻觉控制、内容安全等共性问题,助力近30家厂商技术迭代,推动形成“研发—评测—应用—升级”闭环。
  此外,标准国际化也在同步推进。面向东盟编制英语、老挝语、高棉语版本,填补了区域空白;中国开源模型架构已被新加坡等国的项目采用,彰显标准引领下的全球影响力。
来源:科技日报


图片转载于网络(如有侵权,请联系删除)

免责声明|内容转载于其他平台 不代表本平台观点立场

长期征集各类线索| 邮箱:wytglx@163.com

您需要登录后才可以回帖 登录 | 立即注册

小黑屋|《中国企业报》河北有限公司北京大数据中心 ( 京ICP备2025127075号 )|网站地图

GMT+8, 2026-3-21 00:44 , Processed in 0.168627 second(s), 29 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表