1月15日,科大讯飞以线上的形式举行讯飞星火大模型升级发布会,会上宣布讯飞星火4.0 Turbo底座能力再次全新升级。此次升级显著增强了数学、行业知识理解、图文识别以及长文本处理等方面的能力,并首次发布了混域知识搜索技术,进一步解决行业、企业痛点。
得益于与多个行业龙头企业的深入合作,讯飞星火4.0 Turbo在金融、油气、能源、电力、钢铁和航空等领域的应用效能得到了显著提升,综合能力的绝对提升全部超过10%,展现了其在推动产业智能化升级方面的强大潜力。
七大核心能力全面提升,解决行业、企业痛点
在当前市场环境下,不少大模型公司纷纷放弃预训练,底座模型的迭代也变得缓慢。然而,作为“人工智能国家队”的科大讯飞,一直坚守初心,持续投入底座模型的训练与优化。讯飞星火4.0 Turbo作为其最新成果,实现了七大核心能力的全面提升,展现了其在AI领域的深厚底蕴与强大实力。
本次讯飞星火4.0 Turbo的升级,结合了来自不同行业龙头企业的落地诉求、C端2亿多用户的真实反馈,让大模型能够支撑更长的长文本、理解更复杂的图文、减少幻觉问题,同时让大模型在行业的理解能力上有更大的提升。
在数学能力方面,讯飞星火4.0 Turbo实现了10.5%的显著提升,这一进步不仅让大模型在数学教学、金融分析等领域的能力再上新台阶,更为科研工作提供了强有力的支持。
图文识别能力直接关系到企业能否高效地采集和利用行业及私域数据,这是大模型“学习”的基础。为此,讯飞星火4.0 Turbo特别强化了复杂场景的图文识别能力。此次升级使得通用文档版面分析、文字识别的准确率提升了40%,复杂表格结构、潦草手写文字等方面的准确率提升了60%。
发布会现场,科大讯飞的研究员们通过一系列生动的案例演示了讯飞星火4.0 Turbo的强大功能。例如,在医疗领域,该模型能够准确识别体检报告中复杂的表格和手写文字;在法律领域,法院文书、印章手写合同等内容也能被迅速解析。
无论是学术论文中复杂的长表格,还是企业合同中杂乱无章的板式,讯飞星火4.0 Turbo都能轻松应对,展现出了卓越的识别与处理能力。这一升级不仅提升了高价值数据的获取效率,更为各行业的智能化发展注入了新的动力。
不仅如此,对比测试也表明,讯飞星火4.0 Turbo的图文识别能力显著领先国内和国际最优竞品,此外还针对性地提升了文档要素检测能力,在知识切分和构建的粒度上更加精细、准确,能有效防止大模型幻觉。同时,面向成百上千页扫描文档解析的极速版本也同步发布,文档理解速度提升了10倍以上。这意味着,讯飞星火4.0 Turbo面对一份500页的项目文件,从扫描、识别到解析的全过程,仅需2分钟即可全部完成。
此外,讯飞星火还推出了基于智能体的全新长文本框架,并行业首发了句子级溯源功能。这一新框架优化了超长注意力机制,同时利用大规模网页和书籍数据进行知识关联式合成,使得知识回复的错误率降低了40%,句子级知识溯源准确率达90% ,句子级溯源效果更是超越了GPT-4o,大幅缓解了问答搜索服务中因大模型幻觉而需要反复溯源确认的应用落地难题。
“技术+应用”正向循环,打造“最懂行业”的大模型
发布会上,科大讯飞还展示了讯飞星火2024年的成绩单。第三方权威数据显示,科大讯飞在去年的大模型招投标中表现卓越,中标数量和中标金额都是第一,毫无争议地成为了2024年度大模型中标项目的“标王”。在应用类项目中,数字人与客服、知识问答与知识平台、智能编程等应用场景表现尤为突出。而在中标金额方面,科大讯飞更是以绝对优势领先,超过了第二名到第六名的中标金额之和,彰显了其在市场中的强大竞争力与品牌影响力。
这份成绩单的背后,是科大讯飞在通信、金融、能源、教育、政务和医疗等多个行业的广泛布局与深耕细作。其91个中标项目涵盖了多个重要领域,主要客户均为央国企等重量级单位,还与客户共同打磨了近百个智能体应用。
实践出真知,这些都是讯飞星火大模型越来越好的原因之一。此次发布会,基于图文、长文本能力的提升和行业应用能力的积累,科大讯飞行业还首发了混域知识搜索技术。该技术能够实现对个人知识、企业知识、业务系统数据、精品行业数据以及互联网信息的综合搜索。用户只需一次提问,即可获得综合搜索后的结果,大幅提升了信息搜索效率。
通过“技术+应用”的不断正向循环,讯飞星火学习到了丰富的行业高价值知识,研发团队更是通过收集大量高质量的行业数据,自制高质量数据集,不断磨砺出更加精准、高效的行业大模型。基于此,讯飞星火4.0 Turbo在金融、油气、能源、电力、钢铁、航司等多个关键领域均取得了显著成果,综合能力的绝对提升全部超过10%,成为了“最懂行业的大模型”。
下一步,科大讯飞将继续深化与各行业的合作,不断优化和完善讯飞星火4.0 Turbo的各项功能,为更多企业和用户提供更高效、更智能的解决方案。
本文来源:财经报道网