大模型狂飙突进之后,各行各业关注的焦点,逐渐转移到了大模型的实用性与商业化,关注大模型在具体场景中能解决什么问题。
其中,金融场景是许多大模型厂商和创业者都很关注的领域,由于市场规模大、客户付费能力强、对AI技术采纳早、领域专业性强易于构建数据壁垒……这些先天优势,让金融领域的垂类大模型,展现出极强的落地和商用潜力,同时也掀起了激烈的市场竞争。
不仅基础大模型厂商积极向金融领域进发,和金融伙伴联合推出行业大模型,一些垂类企业也在积极研发,Bloomberg率先推出了自研的BloombergGPT……这些面向金融场景的大模型,究竟有何差异呢?
最近,权威大模型评测榜单 C-Eval 刚刚更新,其中清华&智谱Al、OpenAl、商汤科技、容联云等位居前列。
高达50~100亿参数的容联云赤兔大模型,专注于金融垂类大模型,其成绩表现超过了几乎所有同等规模的模型,以轻量级模型跻身GPT4等千亿模型为主的TOP梯队。
百模大战之后,通用大模型成为少数玩家的游戏,更小参数、更易部署、更懂行业、更低落地成本的垂类大模型成为诸多行业和企业用户关注的焦点。
我们不妨以表现突出的容联云赤兔为例,来聊一聊大模型在垂直行业的落地,究竟该点亮哪些技能点。
赤兔飞驰,在大模型赛场一战成名
赤兔,被认为是马中之王,是战场上日行万里的悍将。从这个角度看,容联云赤兔确实“模如其名”,在百模大战中展现出和赤兔马一样的风采:
首先是快。今年7月,容联云在上海世界人工智能大会上发布了赤兔大模型,成为行业首个专注金融垂类大模型,到今天跻身权威榜单第六,崛起速度是非常迅疾的。
其次是猛。C-Eval是由清华大学、上海交通大学和爱丁堡大学合作构建的面向中文语言模型的综合性考试评测集,包含13948道多项选择题,涵盖52个不同学科和四个难度级别,是目前较为权威的中文AI大模型评测榜单。赤兔大模型能跻身TOP梯队,获得第六的成绩,属实是垂类大模型的一员猛将了。
垂类大模型更重要的是精。因为大模型落地的一个普遍痛点,是场景和效果不确定,将大模型和金融行业需求精准对接,需要在数据工程、知识工程、提示工程、应用探索等多方面,下“巧功夫”。目前,赤兔大模型已经探索出了一些垂直场景,比如其赋能的沟通智能2.0,专注解决客服和营销场景下的知识库、人工座席辅助及陪练、问答机器人、金牌销售等需求,精准释放大模型的技术价值。
总体来说,容联云赤兔不仅在大模型评测赛场上一马当先,更重要的是,其在实用性和商业化探索上也迈出了重要一步,展现出国产大模型的落地速度和商用潜力。
金融+大模型,需要一个“四边形战士”
当许多大模型厂商和创业公司,在为如何回收高昂的模型训练成本发愁的时候,容联云赤兔所走的垂类大模型之路,展现出了较为清晰的商用前景和价值转化能力。
不由地使我们好奇,容联云赤兔究竟做对了什么?一言以蔽之,大模型在垂直行业的落地需要的是在知识、数据、可信、成本等层面没有短板的“四边形战士”, 容联云正是将这些工作做到前面、做到实处、做出差异化竞争力,才能一马当先。
1.知识层面。机器学习的模式是提出抽象化特征并反向输送给机器,从而实现智能,大模型也不例外。但到底提取什么特征,如何给出评估决策,这些环节都存在大量领域知识和行业Know-How。不搞清楚这些问题,缺少知识驱动,大模型只能“大力出奇迹”,一味追求庞大规模参数,带来产业落地难以承受的高成本、部署难度、幻觉和不确定性。
为解决这一问题,“赤兔大模型”结合金融领域知识进行训练,可以真正理解客户的开放问题,根据不同的业务需求和场景特点匹配相应回答,提高金融服务的效果。
2.数据层面。AI离不开数据,大模型尤其依赖超大规模的数据积累和标注。同时,要读懂垂直行业如金融场景,只有通用数据还不够,必须学习丰富的金融语料来 理解金融内容,以保证大模型生成内容的质量和准确性。而领域数据,往往涉及到行业机密和隐私数据,是很难获得的、高壁垒的。这一点上,赤兔大模型展现出了特别的优势。据了解,容联云首先通过开源和公开数据让赤兔大模型获得基础能力,然后依托容联云长期积累的金融、营销等领域数据构建领域模型,以解决特定行业的问题。在实际服务过程中,进一步基于业务数据和行业知识进行模型迭代,不断提升赤兔大模型对金融的理解能力。
3.可信层面。金融业“稳健经营”的要求,是一个严谨严肃的复杂场景,对大模型的可信、可靠、可解释等要求非常高。如果大模型在生成过程中出现幻觉、答非所问、无中生有,这对于需要精准决策的金融用户是无法接受的。解决这一问题,一方面需要专门的算法、数据工程等进行质量控制,同时要选择恰当的场景并进行定制,以达到金融客户采购所要求的质量。比如,赤兔大模型聚焦在一些容错率较高的场景,如客服、营销等,金融机构借助赤兔大模型,可以生成一套金牌话术,在电话咨询等环节提高在线留存率,避免客户流失,进而提高交易成交率。在一些交易类的敏感业务、用户体验要求极高的投诉类业务,“赤兔”的进入也更加谨慎,用更长的周期来探索。
4.成本层面。一个共识是,行业和企业引入大模型是为了用的,为了降本增效发挥价值的,不是为了跟别人比拼先进性的。用大模型就要考虑到投入产出比。不仅企业用户要考量大模型的使用成本,对于大模型的开发厂商来说,面对不低的训练推理和长期维护成本,也需要在研发投入和商业回报周期之间进行平衡。
容联云CEO孙昌勋曾提到,在实际落地场景中,金融客户更多使用十亿级参数规模的模型来完成服务。所以,赤兔大模型在参数规模和模型性能之间做到了极高的效率,以50~100亿的参数达到了极高的生成能力,为客户提供更高的性价比和满足私有化部署的要求。以智能客服领域为例,基于赤兔大模型,容联云生成式一体化智能客服平台,能将知识生产效率提升70%,对话构建成本下降80%,将服务效率翻倍。
不难看出,大模型要落地金融行业并不简单,至少要具备“四边形战士”的条件,才能在产业化道路上快速前进,这也是容联云赤兔“一马当先”的特别之处。
一马当先,垂类大模型向何处去?
我们都不希望大模型的火爆只是昙花一现,而是 融入产业智能化,实现长期繁荣。垂类大模型如何走的更远?容联云赤兔大模型的战略选择,在今天也非常值得我们思考。
具体来看,容联云赤兔在几次选择中都选对了:
大模型的目标,选择了“致用”。
作为行业大模型的初入局者,容联云将大模型应用的立足点放在自身优势行业——从2013年开始积累的金融行业,面向服务的上万个客户,提供匹配当前大模型能力和需求的产品,在客服、营销等场景中先完成落地。
孙昌勋曾说过,行业大模型不是无限制地攀登技术高峰,而是在满足客户需求的前提下,尽可能节省成本。聚焦场景,解决具体问题,赤兔大模型的致用,才有后续的无限可能性。
大模型的优势,选择了“高能”。
从年初快进到“百模大战”,我们看到太多企业和创业公司为了追逐“风口”而入局大模型,却没有考虑到后续的模型、商业等问题,要么仓促离场,要么模型推出后很快无人问津。
大模型落地业务场景的过程,不是一蹴而就的,后续还需要业务对接、数据互通、应用探索、平台建设、运维服务等一系列工作。容联云就非常注重大模型的长期能力:
具备云通讯领域老兵的优势,形成了“通讯+数据+智能”的综合技术能力,为赤兔深入金融场景,提供技术上的“硬实力”。此外,大模型会涉及到敏感隐私数据,因此来自行业客户,尤其是金融行业的信任,是大模型厂商至为关键的“软实力”。据了解,容联云已经和数家标杆性客户进行联合共创,每家客户都专门派了团队,和客户一起做大模型之下的行业应用、产品迭代和更新,这又会进一步增强双方的联接和信任,为“赤兔”的产业化铺下道路。
大模型的商业化路径,则一开始就选择了聚焦“行业”。
大家应该都听过“田忌赛马”的故事,在白热化的市场竞争中,恰当的策略才能获得商业化成功,形成良性循环。大模型的持续发展,离不开行之有效的产业化策略。正如容联云创始人兼CEO 孙昌勋所说,AI大模型更应该聚焦到行业,聚焦到客户需求。相比涉及各领域的通用大模型,企业其实更需要专精于某一领域的行业大模型。因此,在选择赤兔大模型的应用场景时,容联云优先考虑的还是匹配客户需求以及商业化空间,加速了赤兔大模型的落地和价值兑现。
有一句俗语,说“努力”是速度,“选择”是方向,方向错了,越努力反而越快走向失败。
对于成本高昂、竞争激烈的大模型,面对群雄逐鹿的局面,更需要谨慎出手、做对“选择”。
像容联云赤兔这样,在垂类场景里深耕,不断锤炼“四边形战士”的能力。
这条脚踏实地的路,才是大模型行稳致远、做深向实的正确方向。
免责声明:此文内容为第三方自媒体作者发布的观察或评论性文章,所有文字和图片版权归作者所有,且仅代表作者个人观点,与 无关。文章仅供读者参考,并请自行核实相关内容。投诉邮箱:editor@fromgeek.com。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。