目前,大模型在金融领域的应用已初具规模。当下,积极创新大模型技术,加快推动大模型与与金融行业整合发展,是助力大模型落地金融各大场景的主要研究方向。度小满一直以来不断创新大模型技术,提升自身在大模型等前沿技术领域的技术实力。在百度世界·度小满金融大模型前沿发展论坛上,度小满CEO朱光表示:未来五年,生成式AI将成为度小满在金融领域的主攻方向。
度小满不断加大金融垂类大模型及应用布局
10月17日下午,百度世界·度小满金融大模型前沿发展论坛在北京召开,中国工程院院士邬贺铨在大会上表示“金融大模型改变了金融科技的范式,重塑金融行业的工作方式,改变了金融服务生态。”
中国工程院院士邬贺铨发表主题演讲
邬贺铨指出,金融大模型的发展需要全行业共同参与,合作开发,“基础大模型多数从通用语料训练生成,通识能力强,可作聊天对话,但缺少行业专业知识,需要大模型提供方与垂直行业合作开发行业大模型”。
以度小满的开源金融大模型“轩辕”为例,它是将预训练数据(一般预训练、金融预训练)和指令数据(一般指令、金融指令)随机混洗到一个训练数据中进行混合微调,通过多阶段逐渐训练缓解预训练和微调间数据不匹配问题,提高模型的表达、理解、迁移和泛化能力。
度小满CEO朱光表示,“未来五年,生成式AI在金融领域的应用,将成为度小满最重要的战略方向。度小满将不断加大金融垂类大模型及应用的布局和投入,和业界一起把握机遇,推动新一轮金融科技发展浪潮。”
金融大模型的发展仍面临三方面挑战
邬贺铨认为,金融大模型的发展目前仍面临着三方面挑战。首先是金融行业对数据安全性、隐私合规性都有着严格的要求。尤其是在风控方面,对时效性与精准性要求严格,而一般的基础大模型透明性、可信性、专业性不足,很难直接迁移为金融大模型。
第二点是金融大数据在成本与质量上的平衡问题。由于金融行业内的数据难以共享,因此金融大模型的数据规模远远不及通用语料,导致金融大模型难以产生“智能涌现”的效果。
第三则是本地私有部署需要自建算力设施,对软硬件产品有严格的信创要求,而且参数规模大则算力成本高。
对于金融大模型的落地应用途径,邬贺铨院士建议:一是从可控入手开发应用,例如智能客服、智能运营、写文章、写邮件等安全的领域出发。二是从人机混合智能切入,例如在初期阶段先让金融大模型与传统模型共存,经应用考验后再将金融大模型逐步替代传统模型。同时还可以通过变换场景,丰富大模型的场景迁移学习能力,或加入反事实的数据来测试,改进AI的学习本质,提高模型的泛化能力。也可以在金融大模型训练或微调时通过有监督学习思维链的模式,通过专家介入引导它一步一步地进行思维推理。
中国工程院院士邬贺铨(左)与度小满CEO朱光(右)交流
从开源金融大模型“轩辕”开始,度小满持续加强对前沿技术的研究力度,积极攻克技术难题,推动生成式AI在金融领域落地。未来,度小满将继续聚焦金融大模型,不断创新大模型在金融领域的应用与落地途径,借助前沿科技提高对金融数据的理解与应用能力。
(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )