网络安全检测|网络安全服务|网络安全扫描-香港墨客投资移动版

主页 > 业界资讯 > imtoken

基于金融大模型的智能投行建设研究(4)

  总而言之,大模型在制式文档方面会起到非常大的作用,基本上可以让机器来全部生成。但在非制式文档方面,更多是起到抽取信息填充的作用,或辅助生成分析话术供人工修正。

  (三)基于大模型智能核查

  证券投行业务包括IPO、债权融资、并购重组、资产证券化、股权融资、新三板挂牌等,每个业务条线都涵盖大量的文书工作并受到强监管。特别是对非结构的数据处理和整合,这部分工作是影响各条线业务执行效率和效益的关键因素。比如投行业务中的IPO工作,会涉及大量底稿工作,包括招股说明书、发行公告、审计报告、本次发行申请及授权文件、发行保荐书等文书对象的编排制作,还是会涉及银行流水核查、尽职调查、财务反粉饰等审查环节。借助了金融大模型能力实现智能核查,则重构和优化业务流程,缩短流程周期,提升人效。智能核查内容包括但不限于如下:

  篇章目录格式

  文书规范(含错别字/敏感词等)

  格式(含日期格式、数值格式等)

  财务数据审查(含多文本交叉核验)

  非财务数据审查(股权结构,董监高等)

  信披审查

  主体评级一致性

  监管法律规范要求等

  实际上,大模型更多的工作在于底稿数据提取(包括审计报告、财务报告、上市保荐书、公司章程、资质证明、专利证书等),核查规则设计更多依赖于规则引擎。大模型能够极大提升对底稿数据、尽调数据等相关指标的提取,再输送给规则引擎,从而保障了智能核查的质量。从这个层面来看,大模型要做的工作和智能抽取无异。

  还有一部分就是错别字和语义纠错层面,即文书规范层面。这方面大模型具备无可比拟的优势,因为它学习了大量“通才”知识,又专修了金融领域的“专才”知识,知识面非常广,能够更准确的判断出申报材料中是否存在错别字或语义不顺等情况。下面进行测试说明:

  1.错误类型

  本次研究包括如下错误类型:

  成语检查

  连字检查

  金额检查(大小写)

  错别字检查

  缺词检查

  敏感词检查

  2.测试集

  本次测试集约1395条,包含了如上所罗列的错误类型。部分样例间下图。“原文”一列为正确内容,“错误原文”一列为包含错误的内容,并用黄色高亮区别。


图10:错别字核语义记错-测试样例集

  3.测试结果

  某开源错别字/语义纠错模型VS基于大模型的错别字识别/语义纠错


图11:传统语义纠错模型和基于大模型的语义纠错模型效果比较

  对比两者的测试结果,可以看出基于大模型测试的F1值大幅度领先,其在文书规范核查层面有非常不错的成效。

  五、总结与展望

  未来,广发证券将围绕金融科技发展战略,持续打造投行数智化体系,探索金融大模型在投行领域的应用,以金融大模型为基座全面升级智能投行系统,构建智能抽取、智能生成、智能核查等能力,赋能投行文档智能一体化处理方案建设。有效支撑投行全业务品种、全生命周期的数智化管理,提升在注册制下的投行执业质量、风险控制水平、信息披露质量。

(责任编辑:admin)