百川智能发布全链路领域增强大模型Baichuan4-Finance,金融能力领先GPT-4近20%

   日期:2024-12-24     来源:网络整理    作者:二手钢材网    浏览:216    评论:0    
核心提示:【TechWeb】12月23日消息,百川智能发布全链路领域增强大模型Baichuan4-Finance。不仅如此,在国内主流开源金融评测基准FinanceIQ上Baichuan4-Finance同样超越了GPT-4o和XuanYuan3-70B,整体准确率达到79.23%,领先GPT-4o近13%。

-金融专业能力和场景应用能力领先GPT-4o近20%,在中国人民大学金融学院新发布的评估系统FLAME和国内主流开源金融评估基准中排名第一。

据介绍,——可以在效率提升、风控合规、客户服务、决策支持等诸多层面为金融行业带来全方位的价值提升。 - 可以帮助金融从业人员处理文件审核、客户咨询、产品营销等大量日常工作,也可以凭借深厚的金融专业知识和对法律法规的理解,为机构提供精准的风险识别和合规保障。此外,还可以凭借强大的数据分析能力,为管理层提供专业的市场洞察和决策建议。

目前,-API已在百川智能官网正式上线。

整体准确率领先GPT-4o近20%,在多个金融评测榜单中排名第一。

FLAME(Large-Model and )是中国人民大学金融学院于12月17日发布的金融评估系统(地址:)。

FLAME作为金融领域最新的评估体系,兼顾专业性和实用性,由两个方向的评估基准组成。其中FLAME-Cer主要面向模特专业财务能力评估,涵盖CPA、CFA、FRM等14类权威财务资格认证; FLAME-Sce重点关注模型的场景应用能力,包含10个一级核心金融业务场景。 21个二级细分金融业务场景和近百个三级金融应用任务。

FLAME-Cer评测结果显示——银行、保险、基金、证券等多个资质认证领域准确率均超过95%,整体准确率达93.62%,大幅领先于GPT-4o和-70B——聊聊,超过GPT -4o 近20%。 GPT-4o被公认为金融领域最全面的通用模型之一,而-70B-Chat是国内第一个开源的中文金融模型。

在FLAME-Sce评测中,一级核心金融业务场景整体可用率达到84.15%,其中金融数据计算、金融知识理论等场景可用率超过90%。在实际应用场景中的表现还是非常不错的。

不仅如此,在国内主流开源金融评估基准上——还超越了GPT-4o和-70B,整体准确率达到79.23%,领先GPT-4o近13%。

业内首创自我约束训练项目,模特财务专项能力和通用能力同步提升。

如何让模型在提升专业能力的同时又不失通用能力,是大模型在具体场景落地的最大障碍。针对这一问题,百川智能打造了覆盖从模型开发到场景应用全流程的全链路领域增强解决方案,包括高质量数据集构建、模型预训练、微调、强化学习等。

在模型训练阶段,通过业界首创的领域自约束训练技术,百川智能达到了模型特殊能力和通用能力同步提升的效果,大幅提升了模型在多场景下的可用性。而——正是该计划的最新成果,全链路金融领域的增强,不仅掌握了扎实的金融理论基础,还拥有丰富的多场景实际应用能力。

具体来说,-的优质金融数据集全面严谨,包括金融专业教材和学术著作、顶级金融期刊文章、监管机构政策文件、金融法律法规等核心专业金融知识数据,还涵盖金融领域专业问答宝典、企业财务报表及年报、金融研究分析报告等实际应用数据为模型财务能力的提升提供了良好的底层支撑。

在此基础上,-还在领域自我约束训练过程中引入了更高精度的通用数据,与高质量的金融数据进行混合训练,最终达到保持模型通用能力、金融能力稳步提升的效果。

此外,百川智能在训练后过程中还做了很多增强工作,比如:通过合成数据和指令数据对模型进行有监督的微调;强化学习策略中,针对数学计算等金融领域特别关注的场景进行样本增强。等,进一步提高模型性能。

值得一提的是,为了更好地帮助金融企业将大模型应用到各种现实场景中,百川智能还在其官网发布了全链路领域的增强技术报告,详细介绍了包括“域自约束”在内的细节。培训”包括所有技术细节。此举不仅将大大提升金融行业对大模型的理解,也将有效增强金融企业部署大模型的能力和意愿。

据悉,百川智能目前已服务上千家客户,包括北电数智、完美世界游戏、爱奇艺、360集团、圣学教育、爱学堂等各行业龙头企业,并与新雅达、用友、软通动力、新智软件、大观数据、华盛天成等众多行业生态合作伙伴,以及华为、曙光等硬件厂商,中国移动、中国移动等运营商电信、联通达成合作,共同打造百川模式生态。

 
打赏
 
更多>同类资讯

0相关评论
推荐热播视讯

推荐视频

    Copyright © 2017-2020  二手钢材网  版权所有  
    Powered By DESTOON 皖ICP备20008326号-2