> 资讯 > 社会

技术积淀 教育基因:讯飞星火在大模型实测中夺冠

人阅读 2025-06-25 15:47:14业界资讯

     2025年6月24日,随着今年北京中考语文作文题目的揭晓,一场围绕“一堂科学课”展开的特别较量悄然上演。

     在知名科技媒体“电脑报”的组织下,DeepSeek-R1、字节豆包、讯飞星火、通义千问、腾讯混元、文心一言GPT七大主流大模型同台竞技,实测北京中考语文作文。本次测试聚焦题目二“一堂科学课”,其开放性要求模型在有限篇幅内整合科学史实、技术应用与情感升华,较侧重日常生活的题目一“这样生活更健康”更需具备思辨能力,也跟大模型的科技属相更相关

     为了确保公平,所有参与测试大模型统一关闭联网功能,打开深度思考,以文本形式提问,并邀请全国性课程体系研发专家中考命题高级研究员敬笑笑,及全国头部教培机构师训负责人全国高考语文高端论坛组织者、分享人李欣雅参与由这两位资深语文教育专家分别进行打分,取两位老师的平均分作为最终评分的形式进行实测。

     最终,讯飞星火凭借平均38.5分(满分40分)的优异成绩脱颖而出,本次横评榜首

 


(注:图源/电脑报制图)

 

     讯飞星火此次夺冠绝非偶然前不久,在界面财联社旗下的独立科技媒体“电厂”最新发布的六大国产大模型(讯飞星火、DeepSeek、字节豆包、通义千问、腾讯混元、文心一言高考作文实测中讯飞星火也位列六大国产大模型之首。

讯飞星火在中高考中的优异表现并非偶然,而是其“技术 教育”双轮驱动的必然结果

     首先,在数据积累方面,具有显著的教育专业性。依托科大讯飞21年教育行业深耕经验,覆盖全国5万所中小学的庞大数据资源,使模型能精准把握各地教育特点。从深度思考过程中,提及了一类卷标准,就可以看出,研发团队从海量数据中针对性筛选考纲素材及高分作文范例。

     其次,在算法层面,作文生成任务对AI模型提出了独特挑战。与其他文本生成场景不同,作文题目通常仅提供有限的主题要求,缺乏详细prompt提示或多轮提问,但对应的优秀范文却存在显著差异。这种"单一题目对应海量表达方式"的特点,大幅增加了模型训练时准确理解并执行指令的难度,而讯飞星火大模型在‘机器思维链’的深厚基础上,深度融合了更多的教育优质数据,以‘教学思维链’驱动的深度推理大模型

     科大讯飞作为中国人工智能“国家队”

LOT物联网

iot产品 iot技术 iot应用 iot工程

Powered By LOT物联网  闽ICP备2024036174号-1

联系邮箱:support1012@126.com