朱太辉:大金融模型“破”与“立”

2024-06-06


近年来,参数巨大、结构复杂的大模型迅速迭代,模型“出现”能力突出,在数据处理能力、问题解决能力、结果可解释性等方面取得重大突破。随着模型响应速度的大幅提高和成本的大幅降低,大模型的应用范围逐渐扩大到各行各业。正是因为如此,有人认为,随着大模型时代的到来,“每个行业都可以再做一次”。


金融业是数字化、智能化的先锋,也是大型技术落地的最佳领域。从对传统金融工作流程的创新,到深度渗透到各种金融行业和场景功能(如营销、客服、投资、风险控制、研究报告等)。),大模型在金融行业的应用全景中展示了以数据为主线、以场景为主导的数字智能新业态。另一方面,金融业作为一个经营资金和风险的行业,对科技创新应用的稳定性和安全性有更高的要求。目前大模型技术还不成熟,风险隐藏在金融行业的应用中。推动大金融模式高质量发展的核心是做好创新和谨慎平衡,关键是妥善处理“三大关系”。


一是平衡通用模型与专用模型的协同关系,防止“模型鸿沟”出现在大、中、小金融之间。


由于不同类型的金融企业、大、中、小金融机构在研发、人才、资源保障等方面存在较大差异,从目前的发展趋势来看,大模型赋能金融企业数字智化转型应遵循“通用基础大模型” 金融业的大模型 “共生方式”机构专用大模型,避免使大模型成为大、中、小金融机构智化转型的“鸿沟”。


首先,作为金融数字智化转型的基础设施,需要金融管理部门或金融行业协会加强统筹协调,整合调用行业内外技术能力,建立国家级/行业级大模型培训推理平台,实现数据和计算能力的核算和统一调度。在此基础上,实力雄厚、资源丰富的大型金融机构可以通过行业大模型培训推出自己的专用大模型(如JP Morgan推出了专门的IndexGPT);科技资源和能力有限的中小金融机构可以通过金融云和API直接调用金融行业的大模型,或者根据业务着陆场景构建具体的应用小模型。


第二,平衡模型能力与语料输入协同融合的关系,防止生产力和生产要素的“桶效应”


对于大型应用来说,模型能力属于生产力,语料输入属于生产要素,两者缺一不可。


就模型能力而言,首先要保证大模型能力的不断“出现”,逐步解决“一本正经的废话”模型幻觉等问题;其次,需要提高模型参数的透明度和可解释性,处理好“模型黑盒”问题。此外,我们还需要关注基于反馈的强化学习模式(无论是依靠人工反馈的强化学习RLHF还是依靠模型反馈的强化学习RLMF),以及大模型的应用错误和模型风险。


关于语料输入,首先要处理大模型训练中文语料不足的问题,对金融相关政务数据和管理数据进行分类分类和开放共享,持续“喂养”金融大模型训练。;其次,不断提高输入语料质量,提高输入端数据的整体性、客观性和及时性;此外,还需要协调数据调用和客户授权以及隐私保护的平衡。


第三,平衡模型应用与金融监管合作的关系,防止管控滞后导致大模型“粗暴生产”


就监管的有效性而言,随着大型金融模型应用的普及,首先要坚持“技术中性”(科技创新既可以用于金融业务,也可以用于金融监管),创新与大型金融模型发展相匹配的监管方式;其次,及时制定数据调用、模型培训、模型管理、模型部署等标准指导。,让大型金融模型创新应用“有据可依”;另外,实时跟进制定或者修改金融监管法规,确保控制规范的合理性和完整性。


就监管一致性而言,大型金融模型的推广应用包括大量的模型交互、数据交互和应用交互(插件),涉及大量的算法和计算率服务导出,需要协同完善信息技术的外包控制;其次,对大型金融模型应用的监管需要加强与网络信息部门大型模型备案管理的协调;此外,大型金融模型应用 “数据不动模型动”、“原始数据不出域,数据可用不可见”等,要做好与金融“功能监管、穿透监管和信用监管的协调工作。


要处理好以上三大关系,我国金融大模型创新应用有望在“破”与“立”之间创造新的出路,成为金融高质量发展的“加速器”。


论文来源:朱太辉,金融模式“破”与“立”,2024年中国农村金融第10期。


本文来自微信公众号“太辉研究”(ID:作者:朱太辉,36氪经授权发布,taihuiyanjiu202308)。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com