6月27日下午,国产AI企业科大讯飞在京发布全新国产最强模型——讯飞Spark大型模型V4.0,七大核心能力全面提升,整体超越GPT-4 Turbo;以及快速构建专属AI助手的Spark企业智能平台等产品,致力于“打造更懂你的AI助手”。
具体来说,相较于前代版本,讯飞Spark大模型V4.0在文本生成、语言理解、知识问答、逻辑推理、数学能力、编码能力、多模态能力等七大核心能力上实现全面提升,整体对标GPT-4 Turbo,在8个国际主流测试集上位列第一,并在图文识别能力、长文本能力等方面进一步升级,在国产大模型中全面领先。
同时,基于讯飞Spark V4.0模型能力,科大讯飞全面打造更懂你的AI助手,首批14款智能助手上线,展示面向专业领域的个性化应用、升级版讯飞小易APP、讯飞AI学习机、30秒可批改15位学生作业的Spark智能批改机等。Spark语音模型进一步升级,已实现74种语言及方言免切换对话,同时解决强干扰场景下语音识别问题;此外,科大讯飞还发布了Spark企业智能助手平台,并推出Spark商机助手、Spark评标助手等典型智能助手案例。
科大讯飞董事长刘庆峰表示,科大讯飞Spark V4.0是国内万卡计算集群全球唯一完全自主可控的大规模模型。未来大规模模型会改变信息的分发和获取方式,改变人与人之间交互的方式,改变内容的生产方式,改变我们整个产业形态和竞争格局,改变科研范式,这是大家都能看到的大趋势和未来,所以中国要建立自主可控的底层大规模模型能力,有了基础才有可能在各个专业领域、各个垂直行业实现超越。
自2023年9月全面开放以来,讯飞Spark APP在安卓公开市场下载量已达1.31亿次,位居国内第一。同时,讯飞Spark Lite API已宣布永久免费。因此,无论从“量”还是“质”(能力)来看,讯飞Spark都已成为国产平板大屏领域一面重要的“旗帜”。
那么,国产最强车型下一步会“翻滚”到哪里呢?当然是投入使用。
大机型竞争下半场:一边打价格战,一边注重落地
如果说2023年是世界发现生成式AI的一年,那么2024年则是企业真正使用大AI模型和生成式AI技术并从中获得商业价值的一年。
据麦肯锡近期发布的全球调查报告显示,65%的受访者表示其所在公司频繁使用生成式人工智能,这一数字几乎是10个月前的调查结果(33%)的两倍。其中,服务业对人工智能技术的使用增幅最大。
同时,四分之三(75%)的受访者预测生成式人工智能将在未来几年为其行业带来重大或颠覆性的变化。
另一组数据显示,到2023年,中国AI企业数量已超过4000家,AI核心产业规模达5784亿元,增速达13.9%。中国生成式AI企业采用率已达15%,市场规模约14.4万亿元。
显然,随着新一轮AI技术热情的爆发,全球各行业、各初创企业都在期待借助生成式AI来加速创新、提高生产力、构思和开发新产品、改善客户体验、提高员工效率、激发创造力、优化业务流程。
目前,中国AI大模型已进入竞争的“下半场”:一边打价格战,一边抓落实,争夺中国14万亿的生成式AI市场。
其中,价格战方面,今年5月份以来,大机型价格战愈演愈烈,API调用价格已降至“白菜价”,同时,暂停对中国开发者API供应也引发关注,国内大机型纷纷开启无痛搬迁模式,将大机型价格降至“免费”水平。
6月26日,科大讯飞率先推出五项“Spark API普惠政策”,包括永久免费使用Spark Lite版本、免费试用Spark Pro版本一个月、免费赠送1亿个Spark Max版本等。科大讯飞还首次发布Spark 4.0 Ultra版本并推出买一送一优惠,并提供技术专家一对一支持服务。这一系列举措无疑为开发者提供了极大的便利和实惠。
随着国内外竞争日趋激烈,国产大规模模型的未来充满挑战与机遇,而作为首个基于国产算力训练的大规模模型,科大讯飞Spark的稳定性、可靠性受国际环境变化影响最小。
科大讯飞在5月份的投资者关系活动上进一步解释,其开放平台向全行业提供人工智能能力和整体解决方案,主要采取免费+支持的策略。基础能力免费,而其他公司无法提供的更高性能、个性化定制服务则需要收费。
与此同时,国产大佬们在落地层面迎来竞争,医疗、金融、能源、教育、游戏等领域成为AI落地的重要场景。
对于企业客户来说,通过利用AI大模型强大的技术能力,不仅可以低成本地进行模型选取、模型微调和部署,使用全栈效率工具方案,还可以通过API、MaaS等方式将大模型和AI Agent集成到工作流中,使生成式AI技术在中国亿万企业中快速落地。
“今天大模型投入这么大,怎么去落地?这是当前AI领域的一个重要机会,怎么才能科学合理地投入,让大模型真正做到刚需价廉?”6月27日,刘庆峰不仅发布了科大讯飞Spark大模型4.0,还全面公布了一系列科大讯飞的实际应用。
在C端层面,讯飞Spark APP及桌面版全面升级改版,并率先发布“个人空间”,用户可以上传自己的工作、学习、生活、健康等信息,形成每个人独有的知识库,再结合个性,让大模型生成更加个性化的内容。同时,讯飞Spark首批推出14款智能体,针对特定场景打造专属助手。此外,Spark大模型还打通了整个讯飞C端软硬件产品生态,千万智能硬件用户一键拥有“Spark全家桶”。比如讯飞智能办公本、智能录音笔的文件,都可以一键同步到Spark个人空间,让Spark可以写公文、做PPT、生成待办事项等。
在医疗领域,升级后的讯飞Spark医疗大模型核心能力全面超越GPT-4 Turbo。在此基础上,讯飞小医APP能力不断升级,覆盖1600种常见疾病、2800种常用药品、6000种常见检查检测,满足用户就诊前、吃药时、检查后等核心场景的健康需求。目前,讯飞小医APP累计下载量达1200万次,用户好评率达98.8%,主动推荐率达42%。
在教育领域,Spark智能阅卷机发布,半分钟内即可完成15份学生作业的阅卷,阅卷过程模拟真人笔迹,与老师平时阅卷几乎无异,因此,Spark智能阅卷机为老师减轻了90%的作业阅卷负担。相比传统的解题式视频学习,全新升级的讯飞AI学习机通过AI问答辅导,让孩子的学习完成率提升至90%,错题率提升至93%。
在语音大模型领域,Spark语音大模型发布支持37种语言37种方言的“自由对话”。其中37种语言的识别效果领先于-V3,37种方言的识别效果平均提升30%。还解决了强干扰场景下的语音识别问题,发布了针对极复杂场景的语音转录技术。刘庆峰还表示,语音将成为万物互联时代人机交互的主要方式,人机交互最重要的场景是远场、噪音、多人说话、多语言。因此,万物互联时代的AIUI(人工智能用户界面)必须满足远场高噪音、多语言多方言、全双工、多模态等标准。
在车辆层面,Spark汽车智能座舱全面升级,不仅具备多语言、方言的“自由交互”,还具备多情绪、多模态超拟人化交互,让人车交互更加人性化。目前,科大讯飞语音交互产品在国内拥有稳定的市场份额,Spark大模版已为一汽、奇瑞、广汽、江淮、长城等车企的众多车型赋能智能交互体验。
在大模型赋能方面,科大讯飞还针对家电、运营商、机器人等行业场景,打造了云边端一体化、软硬一体化的解决方案。针对具身智能、人形机器人企业的需求,科大讯飞还发布了业界首个支持多模态交互的机器人超级大脑平台2.0,目前已有超过400家机器人企业采用了科大讯飞机器人超级大脑平台。
在企业智能体层面,刘庆峰认为,智能体平台已经到了为每个岗位打造专属助手的时机。因此,Spark企业智能体平台将聚焦智能体关键能力,覆盖400+AI原子能力,整合90+外部信息源,打通100+内部IT系统,让企业能够基于业务场景快速构建可行的智能体应用。平台还围绕生产域、科技创新域、办公域、管理域等推出了32个企业智能体,供企业即插即用。此外,基于企业智能体平台,科大讯飞打造了Spark商机助手、Spark评标助手等典型应用案例,覆盖采购品类超过4000个。其中,Spark评标助手智能评标人机一致率达98%,投标异常检测率超过80%,在降低采购成本的同时,大幅提升了企业评标效率。
刘庆峰透露,Spark开发者生态加速壮大,5个月内开发者数量新增100多万,开发者总数达到702万。因此,越来越多的开发者加入Spark生态,在刚需场景中释放更多应用价值。
落地成果:上半年科大讯飞中标14个项目,大部分来自央企
“我们能走多远,取决于我们是否拥有自主开发、可控的支撑(人工智能发展)基础能力。”刘庆峰说。
因此,我们不仅要看讯飞Spark大模型的技术能力,更要看其实现的具体效果。
自去年5月6日发布以来,科大讯飞Spark大型模型已成为国家能源集团、中国石油、中国移动、人保财险、太平洋保险、交通银行、奇瑞汽车、一汽集团、大众汽车、江淮集团、海尔集团、美的集团等多个领域龙头企业的首选。
据中国政府采购网、中国招标投标公共服务平台等渠道不完全统计,2024年上半年,“大样板”和工信部全国服务招标合同数量达234个,其中二季度中标58个,环比一季度增长一倍以上。234个中标项目中,科大讯飞中标14个,其中11个来自央企,包括中国联通雄安工业互联网、宁波银行、招商局集团等,位居全国大样板领域中标项目前列。
显然,科大讯飞Spark大模型在To B/G端已经形成了一定的规模,在运营商、金融、教育、能源、政务、汽车等多个领域涌现出一大批AIGC、大模型项目,使得生成式AI技术开始渗透到各行各业。
例如在医疗领域,科大讯飞在财报发布会上提到,安徽近2000家公立医院中99%接入了科大讯飞打造的“影像云”云平台,大幅提升了X光片效果和成本,预计仅安徽一年就能省下20亿元,被国家卫健委评为全国规模最大、效果最好的省级影像云平台。而且随着其效果和用户量的不断增长,将形成良性迭代,推动AI技术商业模式健康发展。
在科研领域,与中科院、文献研究信息中心合作研发的代码大模型Spark Big Model,在科研成果发布、论文阅读、学术翻译等方面,显著帮助科研人员提升工作效率。同时,科大讯飞利用Spark Big Model实现了蛋白质设计,设计成功率由0.1%提升至64%,提升了640倍。此外,科大讯飞Spark Big Model在核聚变预测方面也发挥了更为显著的效果。
即便是针对“痛风患者能喝北京豆汁吗”这样的健康问题,科大讯飞Spark模型也能很好地回答和解决需求。
钛媒体AGI的编辑也在发布会展厅体验了大模“坐上”驾驶舱的效果,总体来说,科大讯飞Spark大模无论是开空调、点餐,都能给出不错的反馈,随时做出响应。
目前,科大讯飞Spark大模型已经助力10多家汽车厂商、60多款车型,覆盖23种语言、中国、欧洲、中东、南美等多个国家和地区。值得一提的是,今年3月,大众汽车曾使用Spark大模型进行测评,测试结果超出预期,从而将科大讯飞Spark大模型接入其汽车产品。
在此前的业绩会上,刘庆峰提到,2024年,Spark大模型的商业化路径有四条:
第一是赋能科大讯飞C端(消费端)硬件,保持高速增长;第二是在科大讯飞看好的教育、医疗、汽车、金融、能源及运营商赛道落地;第三是通过科大讯飞开放平台赋能外部开发者,获取营收;第四是科大讯飞在2022年发布超脑2030计划,希望机器人能够走进千家万户,这将是一个巨大的应用方向。认知智能大模型目前的进展,验证了科大讯飞超脑计划中对多模态感知、多维表达技术演进的预测,基于Spark大模型的全栈机器人能力,已经赋能372家以人形态为主的机器人客户。
“只要通用基础能力跟上,行业就有机会超越。中国和美国之间的基础模型能力还有半年到一年的动态追赶过程,但中国是唯一一个不会完全落后的国家。作为中国国家队,科大讯飞正在不断缩小与美国同行的差距。例如,科大讯飞的Spark 大模型核心能力全面超越GPT-4 Turbo。”刘庆峰说。
“唯有拥有自主可控、蓬勃发展的生态系统,中国的AGI才有未来。”
最后我回到了科大讯飞公司。
1999年,还在读博士的刘庆峰在导师王仁华的支持下,带领五位同学创立了科大讯飞,公司成立以来,他们一直专注于人工智能技术,并在中文语音合成技术上探索出第一批产业化成果。
2008年,科大讯飞成功登陆资本市场,成为中国语音行业第一家上市公司,也是中国第一家由大学生创办并成功上市的公司。
2014年,科大讯飞作出战略判断,提出下一阶段的发展将从“智能语音”走向“认知智能”,使命更新为“让机器能听、能说、能理解、能思考”。
2019年科大讯飞成立20周年之际,刘庆峰发表了《因为深谋远虑,所以坚定》致全体员工的信,在信中他坚定地预测:未来十年,在5G的推动下,万物互联将正式成为IT产业第六次浪潮,语音将成为人机交互最重要的方式;未来十年,人类沟通互动的大趋势将不可阻挡,人类语言的巴别塔也终将在十年内建成;未来十年,人工智能将深刻改变全球的生产生活方式,人工智能将赋能各行各业,人机耦合将无处不在。
要知道,当时人工智能还未出现,就连中国也还处在质疑人工智能发展的舆论漩涡之中,而科大讯飞的思路,却在2024年迎来了前所未有的新战略机遇。
25年来,全球人工智能产业历经跌宕起伏,但科大讯飞对人工智能技术的坚持始终没有改变。
得益于科大讯飞在AI技术上的不断创新,刘庆峰发布的讯飞Spark大模型已成为全球唯一完全自主研发、运行在国产算力平台上的大模型,并以月度速度更新迭代。利用国产算力、数据和算法,Spark大模型已整体超越最新的GPT-4 Turbo。
从长期来看,这一策略也得到了资本市场的认可。据科大讯飞介绍,从2008年上市至2023年底,公司营收增长超过76倍,公司市值较发行市值增长超过78倍,市值在千亿元左右。
今年6月9日,科大讯飞迎来成立25周年。
刘庆峰在25周年主题演讲中提出,未来,科大讯飞将利用Spark大模型赋能现有软件、硬件和行业产品,形成基础基础;开拓以央企为代表的重点行业客户市场;开拓新兴赛道的软硬件融合授权和新硬件机会;万物互联时代,AI助手的入口级战略机会;推动“讯飞超脑2030”计划,迈向家庭陪伴机器人万亿级市场。
刘庆峰坦言:今天大模型不仅要打基础,更要围绕刚需的使用场景,打造真正的核心优势。“从国内外通用人工智能(AGI)的发展看,都是‘大平台加英雄主义’。没有通用大模型的基础能力,没有算法、数据等各方面的积累,就没法做出改变世界的大模型应用和产品。所以我们必须站在大平台上。”刘庆峰说。
回首25年,从创业之初的简陋工作室,到如今的现代化办公楼;从只有几个人的团队,到如今拥有上万名员工的上市公司,科大讯飞25年风雨兼程,终于不负众望,成长为参天大树。
刘庆峰表示,只有繁荣自主的生态,才能成就中国通用人工智能(AGI)的大未来。面向未来人工智能新生态,他强调,要重视源头技术生态、智能体生态、应用生态和产业生态,实现自主可控、软硬结合,才能实现大模型的深度落地;要科学理性地认清中美在大模型上的综合差距,有快速追赶的信心,从源头技术到产业生态再到应用落地的整套策略,打造真正自主可控、具有长远意义的人工智能产业生态。
“今天,作为大家的AI助手‘科大讯飞Spark’,我们的使命就是解放生产力、释放想象力,通过我们的能力,让每一个伟大的公司成功,让每一个人成为伟大的人。期待和大家一起挺起胸膛、燎原之势。”刘庆峰在演讲最后说道。
(本文首发于钛媒体App,作者:林志嘉,编辑:胡润峰)


