讯飞联手华为 首次“训练”出“全国产算力下推理模型”

大皖新闻讯 1月15日,科大讯飞发布了当前全国产算力平台上唯一的深度推理大模型“讯飞星火X1”。据了解,尽管在全国产算力平台上训练深度推理模型遭遇了诸多挑战,但科大讯飞携手华为,最终成功“训练”出我国首个基于全国产算力训练的具备深度思考和推理能力的大模型。

讯飞星火X1中文数学能力在国内领先

在发布演示中,研究员们展示了讯飞星火X1解答高考题、AIME竞赛题以及高中奥赛题的表现。讯飞星火X1不仅准确给出了这些题目的答案,还对解题思路和步骤进行了详细拆解。与通用大模型相比,其解题过程更接近人类的“慢思考”方式。“深度推理模型有三大典型特征:一是化繁为简,将复杂问题分步拆解简化;二是进行自我探索和反思验证;三是基于答案正确与否的优质反馈信息进行强化训练。”据介绍,讯飞星火X1在近期参加的小初高(含竞赛)、大学(含竞赛)、AIME、MATH 500等多项“考试”中成绩十分亮眼,用更少的算力,实现了业界一流的效果,在国内领先。

一直以来,讯飞星火坚持走全国产化路线。尽管在全国产算力平台上训练深度推理模型遭遇了诸多挑战,但科大讯飞携手华为,成功攻克了训练推理强交互、高吞吐推理优化以及国产算子优化等一系列难题,最终成功训练出讯飞星火X1。

据了解,早在2023年10月,科大讯飞与华为联合打造的首个国产万卡算力集群“飞星一号”平台上线。一年后,科大讯飞、华为、合肥市大数据资产运营有限公司三方联合打造的国产超大规模智算平台“飞星二号”正式启动,引领国产大模型底座的发展。

据了解,基于全国产算力,讯飞星火X1目前已经率先在教育等真实场景中实现了应用落地。而在医疗领域,讯飞星火X1的模型策略已取得初步验证成效,可使得专科辅助诊断和复杂病历内涵质控的准确率均达90%。

讯飞星火4.0 Turbo底座能力再升级

此次发布,讯飞星火4.0 Turbo底座能力也实现了全新升级,七大核心能力全面提升,全面对标OpenAI 最新版的GPT-4o。据介绍,此次升级最重要的特点,是针对行业、企业的痛点问题,在数学能力、行业知识、图文识别、长文本能力等能力上实现提升。

比如,图文识别能力直接关乎着企业能否高效地采编和利用行业、私域数据,是大模型“学习”的基础。在各行各业的实际工作中,经常面临图文识别的“疑难杂症”:如医疗的体检报告、法院的文书、学术论文、企业合同等,还有复杂长表格、杂乱版式、手写公式、印章手写合同、倾斜少线等情况。

而讯飞星火4.0 Turbo图文识别能力升级,使得通用文档版面分析、文字识别的准确率相对提升了40%,复杂表格结构、潦草手写文字等方面的准确率相对提升了60%,可以解决上述难题,大幅提升高价值数据的获取能力。此次升级还针对性地提升了文档要素检测能力,在知识切分和构建的粒度上更加精细、准确,能有效防止大模型幻觉,同时发布了扫描文档解析的极速版本,文档理解速度提升了10倍以上。对于一份500页的项目文件,从扫描、识别到解析的全过程,仅需2分钟即可全部完成。

大模型的长文本能力一直是用户关注的重点,特别是在企业知识问答这类严谨的应用场景中,用户对大模型幻觉的容忍度几乎为零。因此,讯飞星火推出了基于智能体的全新长文本框架,并行业首发了句子级溯源功能。这一新框架优化了超长注意力机制,同时利用大规模网页和书籍数据进行知识关联式合成,使得知识回复的错误率降低了40%,句子级溯源效果更是超越了GPT-4o,缓解了问答搜索服务中因大模型幻觉而需要反复溯源确认的应用落地难题。

大皖新闻记者 项磊

编辑  许正文

—— 本文由大皖新闻原创 未经授权不得转载 ——

评论一下
评论 0人参与,0条评论
还没有评论,快来抢沙发吧!
最热评论
最新评论
已有0人参与,点击查看更多精彩评论
返回顶部