技术领域
[0001] 本发明属于金融风险管理/控制领域,具体地,涉及一种模型风险控制平台。
相关背景技术
[0002] 模型风险管理(MRM)在2008年金融危机之前一直被视为操作风险的一个子域,之后MRM在监管干预激增的推动下发展成为具有明确定义的领域。2011年美联储在SR11‑7中发布了有关模型风险管理的监管指南,在全球范围内发起和塑造MRM实践,影响了行业惯例和全球银行及监管机构采取的措施。目前北美模型质量管理体系最为完善,分为三道防线:一线人员负责模型开发工作;二线负责模型的验证工作以及监管合规工作,也有带来模型风险的可能;三线负责模型审计工作,主要负责监督一线和二线的工作流程。监管内容覆盖了模型的整个生命周期,包括模型概念化、模型设计、模型开发、模型投产前验证、模型评估和审批、模型部署、模型上线、模型投产后验证和监控、模型退役和归档等多个环节。截至
2019年北美已将100%的受监管模型和98%的非监管模型纳入模型质量管理体系,该比例在亚洲仅为69%和35%。现今的模型风险管理体系大量依赖监管人员的经验判断,并且由于机器学习等复杂模型的大规模普及,存在监管人员数量不够经验不足的情况。鉴于此有部分公司为提高模型风险管理效率开始了自动化探索。该类探索目前主要以简化数据挖掘和模型探索过程为主,比如DataRobot可支持数据自动预处理,清洗和特征工程等,并可支持同步比较各类不同模型的模拟结果以选出最优模型。
[0003] 现有的模型风险控制规范是依据2011年美联储SR11‑7监管信中中有关模型风险管理的监管指南发展而来,依赖以人力为核心的三道防线,更适用于传统金融模型的监管流程。由于SR11‑7是指导性文件,未强制规定各类金融模型具体的管理流程,因此各家金融机构的模型管理流程,风险分类及监控规则不统一,模型风险的量化和度量标准也尚未有共识。另一方面,随着机器学习和AI技术在金融领域的普及及广泛应用,模型质量监管面临着监管数据量空前加大,模型可解释性降低的问题,传统人力验证模型受到了更大的挑战。现有MRM框架对数据的管理规范已显落后,同时依赖压力情景为输入的传统压力/敏感度测试方法对机器学习和A I模型的适用性下降。这一矛盾在亚洲金融业尤其突出,因其对大数据驱动分析/机器学习方法的快速采用与其对模型风险的认识缺乏之间存在巨大差距。为应对新的挑战,提高管理效率,一些外国金融机构开始自研和购买第三方自动化工具,这类工具更专注数据探索和模型拟合效果对比的部分,可简化和规范数据探索和模型选择过程,但缺乏对整个MRM流程的把控,模型记录文档及监控流程控制也并未涉及。再者市场上也没有一款可记录全公司的模型并可分析模型风险迭代的工具。而在亚洲范围内,模型风险的概念还未普及,市场上仅有几个与MRM工具相关的探索性研究,但都是针对模型全生命周期管理的某一方面,例如针对特定的某一类模型如风险模型等,或针对大数据开发等。
[0004] 故目前,并没有一种能够解决上述技术问题,克服上述技术弊端的技术方案,特别是没有一种能涵盖整个模型生命周期的全类型模型风险控制平台。
具体实施方式
[0018] 为了更好的使本发明的技术方案清晰地表示出来,下面结合附图对本发明作进一步说明。
[0019] 图1示出了本发明的具体实施方式的,一种模型风险控制平台的模块连接示意图,如图1所示的一种模型风险控制平台,其用于对全类型模型进行全生命周期的风险管理,该平台可搭建在个人机上也可以搭建在云平台上,主要使用Python,htm l,css,javascr i pt和she l l等编程语言等。文档的自动生成功能主要借助了python的docx,pypandoc,j i nja2等第三方插件来规范白皮书的版式等信息。
[0020] 本领域技术人员理解,其至少包括模型开发空间1以及模型存档空间2,模型开发空间1与模型存档空间2连接通讯,其中,模型存档空间2用于接受来自模型开发空间1的数据并将其转化为格式化数据后进行存储,来自模型开发空间1的数据至少包括特征数据以及特征图表,涵盖了模型存档的功能模块,模型开发/测试人员可按照平台的规范建议进行模型开发,并可在各个阶段填写记录,平台可根据记录自动生成文档便于之后的风险管理。在这样的实施例中,所述模型开发空间1相当于模型前端,其可以接收来自用户的各种修改、增减、创建等指令,而所述模型存档空间2则可以将所有来自于模型开发空间1的各个维度的数据进行格式化转化,进而形成标准化数据后进行存储。
[0021] 进一步地,模型开发空间1至少包括模型基本信息输入模块11,其用于创建和/或修改模型基本信息,模型基本信息包括模型名称、模型用途,模型功能概述、模型组织架构、人员列表、模型风险等级,模型管理规范,模型维护更新信息、上下游模型的运维信息,模型基本信息将被作为特征数据输出至模型存档空间2。例如平台可以以下拉菜单的形式提供组织结构,开发人员等信息,用户只需选择相应内容,同时,平台会根据模型监测结果自动添加更新信息,模型运维人员也可添加模型的风险等级,管理规范,维护更新等信息,用户可查询模型的上下游依赖关系,尤其是上下游模型的运维信息以及时更新/修改当前模型的风险等级,在这样的实施例中,所述用于创建和/或修改模型基本信息可以以表格的形式呈现,也可以通过代码的形式创建修改,还可以通过勾选等方式进行模型特征的填充。
[0022] 进一步地,模型开发空间1还包括数据探索模块12,所述数据探索模块12用于获取开发人员的离线数据探索总结上传的数据源信息、数据相关性信息、数据质量总结信息、各类图表信息以及链入数据后台进行数据在线探索确定的数据信息,其中,数据源信息、数据相关性信息、数据质量总结信息、各类图表信息以及链入数据后台进行数据在线探索确定的数据信息被作为特征数据和/或特征图表输出至模型存档空间2。
[0023] 本发明会提供针对不同数据/模型的数据质量控制指南以供开发人员参考。所述开发人员的离线数据探索总结上传的数据源信息、数据相关性信息、数据质量总结信息、各类图表信息以及链入数据后台进行数据在线探索确定的数据信息会自动存储并写入白皮书归档。与此同时,如公司内部有云数据中台,本发明也可支持链入数据中后台进行数据在线探索,并将数据的各类信息写入模型白皮书。
[0024] 进一步地,模型开发空间1还包括模型开发和验证模块13,其用于实现模型开发工作的总结上传和云数据的在线建模,其中,实现模型开发工作的总结上传和云数据的在线建模的输入数据将被作为特征数据和/或特征图表输出至模型存档空间2,在此部分开发人员需完成的模型开发和验证工作主要包括申明该模型的假设和缺陷、模型方法论,最终采用的设计方案及与其他测试方案的对比,模型的拟合结果分析、可解释性,压力/敏感度测试等,该平台可根据模型的使用范围自动推荐相关性数据、常用模型以及常用模型的管理规范等,例如针对一些市场风险模型,误差修正或分段拟合模型是比较常见的模型,压力/敏感度测试为必选内容等等。
[0025] 进一步地,模型开发空间1还包括用于获取模型部署信息的模型部署模块14,模型部署信息包括开发代码、部署代码的存储地址和管理规范、模型的部署规划以及本地模型和线上部署模型的运行对比结果,其中,模型部署信息将被作为特征数据输出至模型存档空间2,这样可以保证部署的准确性。
[0026] 进一步地,在模型开发和验证模块的基础上,模型开发空间1还包括模型监控更新模块15,其用于根据模型预测结果与观察结果之间的差值是否超过监控阈值来判断是否告知开发人员和/或测试人员,其中,监控阈值将被作为特征数据输出至模型存档空间2,根据模型风险的等级,模型需要按季度/年度进行与观察数据的对比监测,对于快速迭代的模型,可按需求加大频率,本模型风险控制平台可按照需要自动检索模型的监测结果并及时更新模型信息,开发人员在此处写明偏离观察结果的报警阈值,若模型预测结果与观察结果差距超过阈值,平台会自动发送警告邮件给开发/测试人员。
[0027] 进一步地,模型存档空间2至少包括白皮书模块21,特征数据以及特征图表将被填入白皮书模块后格式化为标准段落章节,用户只需要输入关键字,数据和图表,后台程序会将关键信息填入白皮书模板并生成完整段落和章节,生成的模型白皮书格式统一,有利于关键信息提取和分析,可以规范白皮书撰写并减少模型开发/测试人员的工作量,为今后在公司层面进行模型整合,上下游梳理以及风险传递等工作创造便利。
[0028] 进一步地,模型风险控制平台在接收到调用指令后,从模型存档空间2的白皮书模块21中调用与调用指令相关联的标准段落章节,以供开发人员和/或测试人员使用。
[0029] 本领域技术人员理解,首先本发明致力于对全类型模型进行全生命周期的风险管理,统一和规范模型开发及管理流程,填补国内/亚洲模型风险管理的操作规范缺失。模型管理平台的功能涵盖整个模型的生命周期,包括1)模型立项,2)数据探索,3)模型开发,4)模型验证,5)模型部署,6)模型监控和7)更新与退役。模型开发/测试人员可按照平台的规范建议进行模型开发,并可在各个阶段填写记录。平台可根据记录自动生成文档便于之后的风险管理。
[0030] 其次,本发明侧重于建立自动化模型管理平台以有效开展模型风险管理,提高模型监管效率。该平台可根据模型的使用范围自动推荐相关性数据、常用模型以及常用模型的管理规范等。例如针对一些市场风险模型,误差修正或分段拟合模型是比较常见的模型,压力/敏感度测试为必选内容等等。平台的另一个自动化设计是针对文档的生成及更新,各阶段开发/运维人员的输入信息都会自动纳入模型白皮书生成器,在平台上用户下载的文档都会囊括最新的模型信息,便于管理。同时由于平台可记录公司内部所有模型数据,用户可在本发明上整合内部模型,梳理模型的上下游关系,分析模型风险对下游的传递,理清风险。
[0031] 图2示出了本发明的第一实施例的,一种模型风险控制平台全生命周期的管理流程示意图,在这样的实施例中,所述模型风险控制平台全生命周期包括但不限于模型的基本信息、数据探索、模型开发、模型验证、模型部署以及模型监控、更新与退役,这些将作为模型开发空间中的必要数据与本申请的模型存档空间相通讯,在一个优选地实施例中,作为本发明的核心技术方案,本发明中所示出的白皮书模块21并不仅仅局限于一个,而可以有很多个,进一步地,多个所述白皮书模块21设置在所述模型存档空间中,而模型开发空间中的任意一个或多个模块相对应所述模型存档空间中的一个或多个白皮书模块21,在此不予赘述。
[0032] 在此提供的算法和显示不与任何特定计算机、虚拟装置或者其它设备固有相关。各种通用装置也可以与基于在此的示教一起使用。根据上面的描述,构造这类装置所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
[0033] 在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实施例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
[0034] 类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
[0035] 此外,本领域技术人员理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
[0036] 本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域技术人员理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
[0037] 应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。词语“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。
[0038] 以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变形或修改,这并不影响本发明的实质内容。