银行招投标透露了金融大模型落地的哪些信号？

频道：社会资讯日期：2023-11-14 浏览：63805

如何用好数据――金融机构在移动互联网时代就存在的难题，在AI时代同样存在

� � � � � � � � �

文 | 周公子

编| 周星星

近期，一份来自银行的千亿级别大模型采购结果公布，引发不少科技公司关注。与此同时，也有不少银行密集发布了“大模型”相关的需求调研、项目采购信息，有部分中标信息已经公示。小周整理了部分公开的招投标文件发现，目前已有明确“落地”需求的多为大型商业银行，并且需求多与模型训练、语言模型、数据处理相关。

一方面，这些公告固然是金融大模型正式“走出纸面规划”，开始落地到行业应用的信号；

另一方面，综合公告的情况亦可窥见，目前金融行业大模型谈“效果”依然为时尚早，这些需求后面真正的“难题”被看见，也许只是开始。

这种现状，或许恰好印证了此前恒生电子(600570)对数百家金融机构的走访调研结果：AI大模型在金融领域的应用只有8%在立项阶段，17%在测试阶段，超过70%的金融机构还处于调研阶段，在实际落地应用过程中的是极少数。

Part 1

多家银行公布大模型招投标项目

除了大家熟知的“大厂”们，银行供应商“预选”之列也让业内看到，“外脑”还有更丰富的选择。

今年10月，招商银行(600036)披露了“招商银行预训练基础大语言模型（千亿级）采购项目”结果，中选供应商为“上海稀宇科技有限公司”。

据悉，这家中标招行大模型项目的上海公司，也就是MiniMax，国内最早入场大模型创业的公司之一，创始团队出身中科院系，创始人是前商汤科技副总裁、通用智能技术负责人闫俊杰。MiniMax成立于2021年，比刚杀入AI大模型市场的另一家明星公司百川智能，还要早成立2年。今年，MiniMax还拿到了来自腾讯的2.5亿美元投资。而和MiniMax一起参与招行招标的还有清华大学系的智谱AI和all in大模型的百度。

招商银行之外，工商银行、建设银行、邮储银行、华夏银行(600015)等也在最近公布了他们在大模型方面的招投标项目或结果。

其中，华夏银行的招标项目也与大语言模型应用相关，具体项目名称为“华夏银行大语言模型应用（智能算例部分）”，主要为系统硬件设备采购。

此外，中信银行(601998)信用卡也于今年11月7日发布了“中信银行信用卡中心大模型训练GPU服务器需求调研公告”，虽只是前期项目需求调研，不作为入围或招标入选依据，但亦可窥见其对大模型相关服务的潜在需求。

据现有公开资料不完全统计，目前银行大模型相关招标项目并不多，且集中于大中银行。

银行招投标透露了金融大模型落地的哪些信号？

来源：周观新金融根据银行官网公开资料整理

可见，落到实际应用当中，不少银行依然考虑引入“外脑”，借助科技公司的力量完善自身大模型建设和应用。

Part 2

银行现阶段重点需求较为集中

而结合招投标、业界讨论及财报等公开资料来看，银行等金融机构关注的大模型落地应用需求较为集中。目前，业内的共识性关注的，可降本提效，亦可广泛应用场景的场景主要包括客户服务、智能研投、风险控制、欺诈检测、运营管理等。

从各家银行更为详细的半年报亦可窥见，大模型和人工智能被给予厚望，场景也离不开上述几种。

例如，招商银行的半年报就提到，要提升大模型的建设能力，打造面向智能化时代的应用平台：

加快新技术应用推广，提升GPT类自然语言处理大模型的建设能力，并重点发掘其在全流程财富管理中的应用，投产FinGPT创意中心，加快大模型应用模式探索。推进智慧财富引擎、智慧营销引擎、智慧运营引擎、智慧风控引擎、智慧客服引擎五大引擎建设，打造智能化时代的智慧应用平台。

招商银行之外，平安、兴业、农行、交行、工商银行等，无一不在半年报中提到了大模型的战略展望，以及零星的布局进展。

例如，工商银行提到，“完成人工智能AI大模型能力建设应用规划，在国内同业率先实现百亿级基础大模型在知识运营市场、金融市场投研助手等多个场景应用。”

比如智能客服，只能机械回复“设定指令”的情况依然比较普遍，对进一步灵魂响应客户诉求、服务响应等，依然远远不够。用消费者视角来概况就是，目前多数银行的智能客服，从“人工智障”真正进化到“人工智能”，依然有比较大的进步空间。

而基于大模型的智能客服，普遍被认为有更好的语音、语义理解能力，甚至是图文生成能力，是提升多种自动化服务客户体验感的关键。

Part 3

核心难点：用好数据

技术之外，安全和数据才是短时间内金融大模型落地最难迈过去的坎。

由于对安全、合规要求较高的特殊性，金融机构通常不会在第三方基础大模型上构建专业大模型，而是采用数据私有化、模型私有化、本地私有云方式构建大模型。

最直观的对比是，ChatGPT是开放环境里用开放数据，除技术之外也坐拥大量公开数据，双管齐下才能“大力出奇迹”，快速搭建护城河。而金融机构是在自己家的安全保密环境里用自家数据训练自家的AI大模型，这种方式虽然安全，但问题是成本高、技术门槛高，不是谁都有钱有实力能干。

换句话说，金融大模型落地到应用时，出于安全性、行业竞争性等因素考虑，其可用数据更多来源于自身，如何用好“窄而垂直”的数据会是一大挑战。

一个正面例子是彭博的Bloom?bergGPT，同样是金融赛道的选手，它突围的关键因素之一，就是用好数据。

2023年3月底，彭博发布了500亿参数、基于开源大模型Bloom研发的金融大语言模型Bloom?bergGPT，这是全球首个金融大模型，随后也引发了全球市场对金融垂直领域大模型的关注。

在Bloom大模型的基础上，Bloom?bergGPT在其积累超过多年的金融行业专有数据基础上再进行精调训练――3630亿Tokens金融数据集、3450亿Tokens公共数据集上进行了训练。

正是因为有这样的高质量的行业专属数据集和数据基础，在金融领域自然语言处理（NLP）任务上，Bloom?bergGPT的表现明显优于其他类似规模的开放模型，在一般NLP基准上的表现也达到甚至超过同行的平均水平。

正因为如此，上半年业界普遍认为 “大模型+垂直行业数据”模式预会成为 AI 落地垂直行业的典型范式。而进入下半年之后，行业大模型的演进路线也确实是如此。

彭博的金融大模型基于BLOOM的开源模型结合金融专业数据进行精调训练

“我们要解决数据的问题。” 刘曙峰在谈及金融大模型应用时也特别提及，要解决现有的数据、私有的数据、公有的数据，以及数据如何不断的产生、获取和形成数据飞轮的闭环。

所以，金融大模型应用，核心难点远不仅是技术能力问题。

数据非常关键，更关键的是，如何“合规”、“安全”地用好数据。

相比制造、交通等行业，金融领域的数字化更早、更深，数据本来应该是优势所在，但由于监管、安全等缘故，数据的价值挖掘并没有被充分利用――金融机构曾经在移动互联网时代就存在过的问题，如今面对来势汹汹的AI时代，亦同样存在。

未来，金融大模型的应用能否冲破这个局限，且拭目以待。

―THE END―

原创文章，未经授权，请勿转载。

投资有风险，入市须谨慎，以上观点分享不构成投资建议。

本文首发于微信公众号：周观新金融。文章内容属作者个人观点，不代表和讯网立场。投资者据此操作，风险请自担。

关键词：金融银行

上一篇：风暴中的合盛硅业：原总经理更换8位律师欲“夺回”股权激励 “意外”牵出上市公司危废处理问题

下一篇：普安农商银行：金融赋能奏响致富“椒”响曲