人工智能时代前沿技术社区

首页 > 人工智能 > 热点

微众税银首席风险官许卫 :AI在金融风控领域的实践应用 | 2018FMI人工智能与大数据高峰论坛(深圳站)

10月28日FMI-2018人工智能与大数据高峰论坛深圳场圆满落幕,微众税银首席风险官许卫以AI在金融风控领域的实践应用为主题进行了精彩的分享。

作者: | 2018-11-08 10:17:00

7许卫.jpg

10月28日FMI-2018人工智能与大数据高峰论坛深圳场圆满落幕,微众税银首席风险官许卫以AI在金融风控领域的实践应用为主题进行了精彩的分享。

以下是许卫演讲内容,飞马网根据现场速记进行了不改变原意的编辑(有删减): 

许卫:很高兴来到这个论坛,我今天的主要目的是和大家分享自己在工作中的心得和经验,希望给大家在今后的职业发展道路上提供一点帮助。如果有些人觉得有点收获,我觉得就不虚此行。 

我主要是做金融的,所以今天给大家分享的主要是模型在金融领域的细分。 

我的工作生态

工作十几年,在这期间我接触了很多机器学习的方法和工作我也做很多这方面的事情。实际上,在金融风控领域,一个很重要的主题是怎么样在人群里面挑选出优质的金融服务人群,挑选出风险最高的要避免的人群通过控制风险,极大化收益,做这样的事情。

以前金融里面有一个文章Too Big to Fail,不知道有多少人看过这个电影?金融是关乎国际民生的领域,2008年金融危机的时候,美国有些银行因为过于激进的策略和方法导致风险集中暴露,美国政府当时花很多钱救援这些金融机构和银行后来被很多人诟病说是纳税人的钱买单这个文章讲的这件事情,系统重要性的金融机构影响很大,实际上金融危机后变得比较保守。新技术的采用上相对科技公司比较保守。这其实对我们在座的各位也是机会。不管是谷歌还是Face book,是国内的支付宝或者是腾讯这边,先锐的科技公司出来,如果应用到金融领域实际上是有很多空间可以做这件事情的。

我们都知道,美国四大银行有上百年的以上的历史,但是美国第一资本银行30年内做到第五、第六的位置,靠的是所谓的“量化分析”的技术它做的这件事情,我觉得对于各位或者对于国内其实有一定的启发。我还在公司的时候CEO曾经在全公司大会上讲过最近几年招了8000个软件工程师,多么大的市场和投入 

统计模型vs机器学习

传统的统计方法,最经典的是线性回归,比如人群的身高、体重,不同时间点的分布,在传统理论里面是非常简单的,线性回归可以了,这是非常简单的传统方法。 

量化分析在金融的应用就比较复杂。选择麦肯锡当年做的案例,比如说AB是两个不同的风险区分的指标,现在不同的圈里有不同的风险人群分析,我们如果简单做统计分析的模型,如图所示很难区分出来好坏人群。但是我们的模型里面如果用机器学习的方法,可以很精准的把好的人群和坏的人群区分出来这只是举例两个维度的结果现实过程中完全不止两个,可能有几百个变量。在金融里面要花很大力气研究这些变量到底怎么相互影响、怎么相互关联,怎么影响到我们的结果。当然机器学习也有些不足的地方,比如可解释性。给一个新客户放款100万,机器学习说这是好的,不能告诉为什么是好的,这样风险部门会认为存在很大的风险。如果这种风险累积,就是很大的风险了美国的监管部门在这块也有要求,对所谓的因果关系的理解 

行业应用的梳理

机器学习或者人工智能在金融行业应用非常广,去年年底我参加一个论坛,当时请了很多谷歌、亚马逊等人工智能实验室的人来做论坛。为什么金融公司请这样的人来?因为人工智能在金融领域的应用还在方兴未艾的阶段。 

欺诈的识别如果刷支付宝或者是腾讯的产品,怎么确认是本人,而不是盗了帐号。有种类型:一是开帐号的时候,怎么识别这个人是不是本人?这种欺诈是对人群的区分。其次,在信用卡或者消费金融的领域,每笔要识别如各位有手机,你拿手机还,你上一秒在这里,几分钟之后出现在千里之外,这是不是认为有欺诈?你也要考虑错误距离的概念,有可能这个人坐飞机的,可能要考虑时间问题。

欺诈的模型已经用到了机器学习的技术。里面有个很重要的速率的变量。这个客户最近这段时间有多少次申请贷款、多少次寻求金融服务,如果非常频繁寻求,说明对资金的渴求,那这个事情你的欺诈就会高。另外客户填一个表,用多长时间填地址,如果连自己家庭地址都是犹豫不决,写来写去,这个时间上也是一个欺诈指标。

营销的优化比如第一资本广告投放一年的预算是10亿美金以上,怎么做到最好的优化,最大的效果。做一个AB test,不同的流程设计,差别都很大。

风险的Credit scoring对人群的风险进行分类。

运营的优化在银行里面客服团队,客户打电话进来,现在都是语音识别,自动的做回答在上市公司里面,很多后台的服务人员有上万的团队,上万人是巨大的开支。按照算法进行优化分发,大大节省人力开支,提高客户满意度。

前面四个是现在用的非常成熟的或者已经广泛应用的领域。 

统计模型和机器学习的优劣势

业务角度讲,不管是机器学习还是深度学习还是传统的方法,都是一个工具,都是为了完成最优的结果,都是为了推动业务的发展。

工具角度进行比较,统计学习模型,需要很多的假设,不管是服从正态分布还是贝叶斯理论,这种假设是不是合适,要打问号。另外如果样本量很小,怎么从几十个样本里推算出规律,传统模型处理这种问题很多。相应的,机器学习对大数据处理很强对变量关系,统计学习更多是处理线性关系和一些非线性关系,机器学习处理更复杂的关系能力更强一些金融里面处理几百个变量的非线性关系很好,准确度机器学习很好。我们之前做过一个项目,两个组同时做模型,同样的事情,一个组做传统方法,一个组做机器学习,最后进行比较,机器学习的方法精确度更高一些。如果是非常经验丰富的人做统计模型,也能够逼近。 

机器学习一些缺点,我之前负责过一个项目,小微企业贷款风险建模。最开始的模型了很多变量,实际上是data driven。发现虽然精度提高了,但是稳定性不够,实际使用上需要做很多优化。

金融领域需要可解释性,可解释性是非常重要的。不能是完全的黑盒子。比如现在做欺诈,道高一尺、魔高一丈,很多欺诈公司是想方设法找漏洞。所以对这块的反应速度要求很高,精度要求很高,可解释性要求就降低了。还有模型的稳定度,稳定度之前解释过,就不再赘述。还有计算的成本,现在这块对大家不是特别大的限制,但是后来发现也有限制,因为有些公司数据量也是很大。当模型封装之后,效率什么样,很多时候要求毫秒级别的响应,是不是做到实时毫秒级别的响应,要求非常高。 

不同方式的比较金融建模

金融建模里面最传统的方法是识别人的好坏,最直接的方法是逻辑回归。现在流行的是决策树GBDT从最传统的方法讲起,当时我们是拿着传统的SAS做分析,现在Python做分析,发现区别存在,同样的事情同样的方法去选,最后选出来的结果不一样。这很可能导致我对客户的识别。就需要解释、搞清楚差别的原因比如变量选择,我们拿GBDT做变量选择,我们选出的变量也不一样,可能有很大的差别。

当时有一个团队让他做各种不同的软件比较、做分析,把这些东西做归纳。

比如传统方法,对缺失值处理很严谨,每个怎么做传统的SAS R直接略掉这个,这个不好,因为对样本是一个损失。对现在的方法可能直接给了一个错误出来这是对逻辑负责,对决策树直接过了,不会给任何错误。对分类变量,比如是好是,是哪个地方来的,变量之间的关系不是数据存在,或者不存在数值线性的意义。整个变量的impution,怎么做变量的差值等等,它是不是能自动识别这种变量等等。

二是算法,是用回归染色回归这种传统的统计方法,还是用弹性网络,可能很多选择。

不同模型优化的比较用的比较多的两个指标是AUC和KS,这两个指标大家可能非常熟悉,拿SAS比,发现SAS的结果和其他软件是比较一致的。这是一个开源的东西,需要对结果做一下检测。比如我用SAS,我是每年付SAS很多钱,SAS确保这个软件的结果可验证,没有任何问题。但是Python不能给我保证,我必须自己验证。有的公司没有这方面要求,因为这个东西风险低,对金融机构,尤其比较大的金融机构是由开源软件的验证要求 

总结

一、现在建模不是简单跑软件代码,同时也是为了解这个事情之后再做选择。可能投机取巧的是,我非常快速找这种代码,不管是干嘛,很快出结果,所谓调包侠。我们要深入了解后面的东西,尤其要理解,只有这样,才能真正做出有价值的东西。

二、我们现在做了很多开源软件的评估,对不同软件进行比较,这也是一个很有意义的事情,一个控制风险,二是帮助深刻理解这些后面的算法和限制。我们很多时候拿这个软件,可能不会,但是实际上这个事情也是十分重要的。三、最后想从我慢慢走向业务端的经验来讲,最开始技术,不断进行技术方面的学习逐渐意识到技术是一个核心的东西,但是真正要做好,也需要加入对数据整个业务的理解。如果有了这些,加上技术未来在职业发展道路上就会有更广阔的天地 

这是我的简单分享。