本文作者:真实自我

百川智能发布Baichuan4-Finance大模型,金融场景能力领先GPT-4o近20%

真实自我 今天 21
百川智能发布Baichuan4-Finance大模型,金融场景能力领先GPT-4o近20%摘要: 直播吧月日讯今日湖人客场不敌骑士遭遇两连败此役湖人全队共获得次罚球罚中了记骑士全队仅有次罚球罚中记月日消息百川智能正式发布全链路领域增强金融大模型该模型专业能力和场景应用能力大幅领...

直播吧10月31日讯 今日湖人客场110-134不敌骑士遭遇两连败。此役,湖人全队共获得33次罚球,罚中了28记;骑士全队仅有8次罚球,罚中5记。...

12月23日消息,百川智能正式发布全链路领域增强金融大模型——Baichuan4-Finance。该模型专业能力和场景应用能力大幅领先GPT-4o,在中国人民大学财政金融学院新近发布的评测体系FLAME以及国内主流开源金融评测基准FinancelQ上均登上榜首。

据介绍,此次发布的Baichuan4-Finance基于智能自主研发的全链路领域增强技术方案,涵盖了从数据集构建、模型预训练到微调和强化学习的完整流程。尤其是在训练阶段,该模型首次引入领域自约束训练技术,使其在金融专业能力和多场景适配能力上实现了同步提升。

据悉,攻克了专项能力和泛化能力平衡问题这一模型落地应用的最大阻碍后,Baichuan4-Finance能够在效率提升、风控合规、客服、决策支持等诸多层面为金融行业带来全方位的价值提升。例如,它能够帮助金融从业者处理文档审核、客户咨询、产品营销等大量日常工作,还能依托深厚的金融专业知识和法律法规理解能力,为机构提供精准的风险识别和合规保障。此外,还可以凭借强大的数据分析能力为管理层提供专业的市场洞察和决策建议。

FLAME评测分为FLAME-Cer(金融资格认证能力评测)和FLAME-Sce(金融场景应用能力评测)两个方向,其中FLAME-Cer覆盖CPA、CFA、FRM等14类权威金融资格认证。在这一评测中,Baichuan4-Finance整体准确率达到93.62%,在 、保险、基金等领域的准确率均突破95%,领先GPT-4o近20%。

而在FLAME-Sce的场景应用能力评测中,其一级核心金融业务场景的整体可用率达到84.15%,在金融数据计算和金融知识理论等细分场景中的可用率更是超过90%。

除了FLAME体系,Baichuan4-Finance在国内主流的金融评测基准FinanceIQ上也同样超越了GPT-4o和XuanYuan3-70B,整体准确率达到79.23%,领先GPT-4o近13%。

据介绍,百川智能为该模型构建了一套 且严谨的金融数据集,覆盖了金融专业教材、 金融期刊论文、政策文件、金融法律法规等核心数据,同时囊括企业财报、研究报告、金融专业问答集等实践应用类数据。

为了进一步提升模型的通用能力和金融专项能力,百川智能在领域自约束训练中引入了混合数据策略。通过将高精度的通用数据与高质量的金融数据共同训练,Baichuan4-Finance不仅避免了模型能力单一化的弊端,还实现了通用能力和金融能力的双向增强。此外,在后续训练环节,百川智能通过合成数据和指令数据对模型进行微调,同时针对数学计算等关键场景进行样本增强,显著提升了模型的场景适配能力与执行效率。

软通动力指出,该模型完美契合了客户对通用能力与金融专业能力并重的需求,自部署以来,客户满意度提升了20%。(袁宁)

本文来自 科技报道,更多资讯和深度内容,关注我们。

百川智能发布Baichuan4-Finance大模型,金融场景能力领先GPT-4o近20%