专访农业银行研发中心副总经理赵焕芳:大模型赋能银行数字化转型提质增效

2023年11月20日 15:11   21世纪经济报道 21财经APP   李愿

21世纪经济报道 记者李愿 北京报道

在以ChatGPT等为代表的人工智能大模型应用快速发展背景下,今年3月,中国农业银行在同业中率先推出类ChatGPT的AI大模型应用ChatABC(中文名:小数),并在该行科技问答场景进行了内部试点。目前,ChatABC试点情况如何,未来还有哪些规划?如何看待大模型对银行业数字化转型的影响,以及对未来发展有何展望,《21世纪经济报道》记者近日对中国农业银行研发中心副总经理赵焕芳进行了专访。

赵焕芳对记者表示,大模型的出现会加速银行数字化转型的效率和质量,是各个银行必须重视的发展方向。但大模型在金融领域的应用,目前还处于探索试点的初级阶段,主要是面临算力需求大、数据要求高、模型定制难、场景深入难、生态构建难、人才培养难六个方面的挑战。

“国内金融机构优先在智能客服、知识问答、辅助编程、智能办公等领域开展探索尝试。”谈及具体应用时,赵焕芳告诉记者,ChatABC目前在智能问答、智能客服、辅助编程、智能办公、智能风控等多个领域同步进行试点,今年下半年还进一步提出“大模型+”的建设理念,规划了智能客服、智能研发、智慧三农等9大领域,30余个场景,逐步培育“大模型+”生态,赋能数字化转型提质增效。

赵焕芳认为,大模型未来可期,为了更好推进大模型在银行业的应用,希望行业一起,能够构建更大范围的大模型应用生态体系,提供大模型快速落地、快速见效的探索实践案例,加强人才培养和技术交流,共享时代赋予的AI大模型技术发展红利。

赵焕芳,受访者供图

大模型为银行业数字化转型提供更强有力支撑

《21世纪》:你怎么看大模型对金融机构尤其是银行业业务的影响,是否会对银行数字化转型逻辑带来改变?

赵焕芳:大模型让人工智能走向了通用人工智能,业界普遍认为点燃了AI革命的“浏览器时刻”和 “iPhone时刻”。以ChatGPT(GPT-4)为代表的大模型在逻辑推理、对话、多模态信息理解与生成等方面,展现了巨大的应用潜力。

大模型极大提升了AI应用的效率。拿武侠做个类比,传统AI模型像是学会了八卦刀、梯云纵的武林人士,每一门武功都需要专门学习,且学习时间很长。大模型就像学会了九阴真经,打通了任督二脉,不管是少林长拳,还是武当太极拳,都能很快学会,而且威力巨大。大模型相对于传统AI模型,就体现为通用智能的能力更强,适用场景更广泛,应用效率更高。

大模型之所以能够具备一定程度的通用智能,来源于大模型特有的两个特点,一个叫“顿悟”,一个叫“涌现”。“顿悟”是指模型学习了大量的样本之后,忽然对于未知的样本有了很好的预测能力,例如:学习了大量的1+1=2,2+2=4的案例后,顿悟了四则运算的规律,就是所谓的“书读百遍,其义自见”;“涌现”是指,当模型参数量大到一定量级之后,出现一个非线性的智能能力的跳变,涌现出非常强的逻辑推理能力和思维能力,就是所谓的“忽如一夜春风来,千树万树梨花开”。

银行的数字化转型的本质是用数据+算法的手段,以数字能力建设为核心,利用数字技术对业务流程、服务模式、运营方式等进行数字化重塑和改造,提高经营效率、提升服务水平等。银行的数字化转型,“用数”是关键。而以大模型为代表的人工智能,则是“用数”的高级阶段,应用大模型预计未来会降低“用数”的门槛、提升“用数”的效能,数字技术可以更深入地赋能营销、风控、运营、决策等银行业务,为银行业数字化转型提供更强有力的支撑。

总结来说,大模型的出现会加速银行数字化转型的效率和质量,是各个银行必须重视的发展方向。

《21世纪》:大模型发展较好的国家,银行业在哪些场景上有大模型的应用,这对我国银行业有何启示?

赵焕芳:当前,国内外一些金融机构,都在积极探索大模型。例如:彭博在今年3月30日发布了BloombergGPT,该模型支持在舆论分析、量化交易、风险控制等多个方面赋能金融企业,与之类似的还有开源的FinGPT;摩根斯坦利则集成了OpenAI的服务作为财务顾问工具;摩根大通则利用大模型分析电子邮件的潜在风险。

当然,国外金融业在大模型的应用上也存在截然不同的态度。诸如美国银行、花旗银行、德意志银行、高盛和富国银行等,认为大模型存在数据安全和隐私保护等方面的问题,因此限制员工和交易过程中使用ChatGPT等服务。

对大模型应用的两种态度,一定程度上反映了目前大模型的创新突破和应用局限。如何既发挥大模型的优势,同时避免带来安全隐患,给我们的启示有如下三点:

一是安全为基:金融机构的数据是高度敏感,涉及客户隐私和金融安全,必须在安全可控的环境下训练、微调和使用大模型,严格按照《生成式人工智能服务管理暂行办法》等监管要求开展相关工作,保持底线思维,稳步推进,切实维护国家金融安全和客户公共利益。

二是可控为要:金融机构使用大模型必须采用私有化部署方式,预训练的数据要确保合法性、合规性和准确性,避免模型出现价值观、伦理道德、知识混淆等方面的问题。在通用大模型的基础上需要进一步微调形成熟悉本领域、本单位的专用大模型,更好地支持行内的场景应用。

三是应用为王:大模型是高投入的领域,面临算力、数据、人才等多方面的挑战,金融机构要坚持“边用边建”的指导思想,找准应用场景的切入口,优先在知识检索、客服辅助、编码生成等方面积累经验,并逐步向风控、决策、投研等核心业务领域深入探索,分步骤完成体系建设,积极稳妥地持续释放业务价值。

大模型金融领域应用处于探索试点初级阶段

《21世纪》:我国⼤模型如果要将大规模应用到银行业的具体场景上,可能面临哪些障碍或者短板?

赵焕芳:大模型在金融领域的应用,目前还处于探索试点的初级阶段,仍然面临以下几个方面的挑战:

第一,算力需求大。大模型需要大算力,英伟达GPU算力受限。国内头部厂商的芯片需要加快发展,尤其是生态建设要尽快培育。同时算力资源的高效调度、异构融合和提质挖潜,也是突破算力限制的重要方向。

第二,数据要求高。大模型训练依赖有组织的、高质量的数据,银行要建立完整的大数据体系,持续推进数据治理和质量提升,进一步完善数据清洗、标注工作平台和流程;要有更完善的数据安全、数据隐私保护的机制,确保模型训练、应用的全流程闭环的管理。

第三,模型定制难。现在通用的大模型多,但是行业大模型、垂直领域大模型少,真正懂银行的大模型更是只能自主定制。定制模型投入高、周期长、难度大,需要银行具备算力、人才等各方面的储备。训练和使用中还要解决模型遗忘、模型对齐等难题。

第四,场景深入难。目前大模型的概念很热,各种应用效果宣传的也很多,但是要和真实业务结合,却往往是“有想法、没办法”,归根结底是大模型存在“幻觉”的局限性。如何扬长避短,把大模型应用到更核心、更严谨的业务场景中是扩大应用的重中之重。

第五,生态构建难。大模型的快速、深入应用依赖于完整的生态支撑。大模型相关技术快速发展,很难由一家企业机构全部包办。如何构建产学研各界协同创新的生态系统是大模型走向产业深度应用的挑战。

第六,人才培养难。懂大模型、懂金融、懂数据的复合型人才是一将难求。传统AI人才面对大模型,也在算力资源调度、模型训练稳定性、模型性能调优等方面需要补课。尤其是金融机构如何进行大模型人才的培养、如何把AI人才持续盘活,是亟需解决的难题。

国家网信办联合发改委、教育部等部门发布了《生成式人工智能服务管理办法(征求意见稿)》。该办法在促进生成式人工智能健康发展和规范应用,维护国家安全和公民利益方面给出了根本遵循。既是促进生成式人工智能健康发展的重要要求,也是防范生成式人工智能服务风险的现实需要。一定程度上采取有效措施鼓励生成式人工智能创新发展,同时实行包容审慎和分类分级监管。我们也会持续保持对于法律法规、监管政策的跟踪和落实,审慎应用,守住数据安全和金融安全的底线。

《21世纪》:算⼒是我国⼤模型⾼质量发展的短板之⼀,你认为银⾏业可以采取哪些⽅式来应对,农业银⾏是如何做的?

赵焕芳:算力是阻碍金融行业大模型发展的障碍之一。众所周知,目前先进的GPU芯片受到限制。金融机构要加快布局多元化的AI芯片,共同培育软硬一体化的生态体系。有条件的金融机构建议建立全面自主的算力环境,但是考虑到算力的建设成本高、周期长,需要机房、网络、供电等配套的同步升级,不具备条件的银行也可以租用公有云算力快速满足需求。

面对GPU算力短缺的问题,农业银行的策略是“开源节流”:

开源,稳步扩展多元化算力支持能力:布局多元化算力体系,构建云原生的AI算力基础;联合国内头部AI算力厂商持续推进大模型与基础设施的适配,积极推进国内头部算力芯片试点验证,同时推动多元化芯片与原有GPU算力集群的异构融合,保持对算力资源的整体高效利用。

节流,高效利用现有算力资源:主要是对现有算力资源进行挖潜。一方面持续进行AI框架优化,通过应用加速框架、量化压缩等方法,持续探索降低训练侧、推理侧的算力资源占用。另一方面推进动态算力调度。结合算力上云与算力编排,实现计算任务的细粒度动态调度,支持计算资源的动态均衡分配,提升AI算力的利用效率。

农业银行正逐步培育“大模型+”生态

《21世纪》:目前银行机构在积极探索大模型在银行应用场景的落地,主要聚焦在哪些方面,不同类型的银行有何不同?农业银行在哪些领域作了尝试,效果如何?

赵焕芳:国内金融机构优先在智能客服、知识问答、辅助编程、智能办公等领域开展探索尝试,一方面是大模型在这些场景上有更好的表现,另一方面是这些场景相对来说对大模型的“幻觉”容忍度更高。

具体应用的时候,金融机构综合资源投入、技术积累等方面的考量,采用不同的策略。大型银行更倾向于“深度定制、建用结合”的自建模式,注重大模型能力体系建设,包括算力、AI平台、模型训练能力等;会结合自身数据优势训练定制化的大模型,会更加聚焦于自身大模型能力的沉淀,打造平台化的支撑模式。中小型银行可能会采取“直接引入、轻量快速”的引用策略,会更关注行业大模型、通用大模型的直接引入,通过API调用等形式,快速轻量对接场景应用。

农业银行始终坚持对前沿技术的敏感和热情,构建了算力、数据、模型、工具和应用五位一体的人工智能创新体系。在今年3月份创新推出大模型小数(ChatABC),该模型拥有百亿级参数,具备问答、翻译、编码等功能。目前在智能问答、智能客服、辅助编程、智能办公、智能风控等多个领域同步进行试点。其中智能问答场景已提供超过200万次问答服务;辅助编码场景支持代码生成、单测生成、代码翻译等功能,已超过8万行代码投入生产应用。

今年下半年,我们进一步提出“大模型+”的建设理念,按照模型即服务(MAAS)方式,快速融入业务场景,规划了智能客服、智能研发、智慧三农等9大领域,30余个场景,逐步培育“大模型+”生态,赋能数字化转型提质增效。

《21世纪》:你对⼤模型在银⾏业的未来发展有何展望,同时在各⽅⾯的政策上有何意见建议?

赵焕芳:随着大模型在探索中前进,在尝试中创新,未来以大模型为创新引擎,可能为银行业带来三个新的趋势:

新生态。从各自为战的独立应用到共享的大模型生态。当前国产大模型快速迭代升级,行业应用积极布局,进入了互相促进、相互牵引的良好局面。未来一定会从通用大模型到行业垂直大模型、企业私有大模型等多种模型共存,形成产业化、规模化应用生态体系。

新应用。从辅助支持型应用到经营决策的核心流程应用。受限于大模型幻觉、数据隐私保护等问题,当前大模型主要以辅助支持类为主,例如辅助编程、辅助问答等。未来随着大模型能力的提升,以及知识图谱、知识库等技术能力的加持,大模型会进一步应用到核心业务流程,如风险防控、智能投研等场景。

新产品。从原有流程优化到大模型驱动模式创新。当前大模型的应用多是在现有流程中的嵌入和优化,并没有出现类似ChatGPT的颠覆性金融产品。随着大模型能力的增强和应用的深入,肯定会发展出颠覆性的金融产品,大模型驱动的模式创新才是未来竞争最大的变数。

大模型未来可期,为了更好推进大模型在银行业的应用,有如下建议:

一是规范指引:建议要加快出台大模型在金融行业应用的标准规范,要对大模型在银行业的应用给予适当的包容度,在坚守安全底线的基础上,适当鼓励行业和企业进行主动创新。

二是协同创新:希望产学研各界联合发力,面向业务赋能的最终目标,持续提升大模型能力。在算力、模型、平台和人才培养等方面加强经验交流,协同推进孵化重点场景应用试点。

三是稳妥推进:大模型还在快速发展过程中,其中会有技术、数据和法规各方面的风险和挑战,尚未形成行业统一的解决方案。金融业在应用大模型过程中要坚持安全为第一考量,积极探索,稳妥推进,及时与监管部门同步相关进展,确保过程安全可控。

希望行业一起,能够构建更大范围的大模型应用生态体系,提供大模型快速落地、快速见效的探索实践案例,加强人才培养和技术交流,共享时代赋予的AI大模型技术发展红利。

关注我们