百川智能发布全链路领域增强大模型Baichuan4-Finance,金融能力领先GPT-4o

   日期:2024-12-23     来源:网络整理    作者:二手钢材网    浏览:274    评论:0    
核心提示:在FLAME-Cer评测中,Baichuan4-Finance在银行、保险、基金、证券等多个资格认证领域的准确率均突破了95%,整体准确率93.62%,大幅领先GPT-4o和XuanYuan3-70B-Chat,超出GPT-4o近20%。

领先性是什么意思_领先金融一体机_

在中国人民大学金融学院新发布的评估体系FLAME评估中,该模型名列榜首。具体来说,FLAME由两个方向的评估基准组成:一是FLAME-Cer主要面向模型专业金融能力评估,涵盖CPA、CFA、FRM等14类权威金融资格认证;其次,FLAME-Sce聚焦模型的场景应用能力包括10个一级核心金融业务场景、21个二级细分金融业务场景、近百个三级金融应用任务。

在FLAME-Cer评测中,银行、保险、基金、证券等多个资质认证领域准确率超过95%,整体准确率达93.62%,大幅领先于GPT-4o和-70B-Chat,并超过GPT -4o 近20%。 GPT-4o被公认为金融领域最全面的通用模型之一,而-70B-Chat是国内第一个开源的中文金融模型。

在FLAME-Sce评测中,一级核心金融业务场景整体可用率达到84.15%,其中金融数据计算、金融知识理论等场景可用率超过90%。在实际应用场景中的表现还是非常不错的。

此外,为了提升模型的专业能力又不失通用能力,模型还打造了一套全链路领域增强解决方案,涵盖高质量数据集构建、模型预训练、微调、强化学习等从模型开发到场景应用的全过程,实现了模型特殊能力和通用能力的同步提升,提高了模型在多个场景下的可用性。 (文猛)

领先金融一体机__领先性是什么意思

海量信息、精准解读,尽在新浪财经APP

 
打赏
 
更多>同类资讯

0相关评论
推荐热播视讯

推荐视频

    Copyright © 2017-2020  二手钢材网  版权所有  
    Powered By DESTOON 皖ICP备20008326号-2