当前位置:首页 > 云计算 >

银联智策呼延如生:万事达、中国银联大数据的实践和应用

发布时间:2015-04-30 17:15:13 来源:中国软件网 作者:
[摘要]第八届中国软件渠道大会于4月28日在京隆重召开,除了上午10位行业专家分别针对各高端领域进行了洞察性分析,下午首设移动应用与云计算、互联网+、大数据三大分论坛,并行展示新技术带来的变革,为与会者带来一次新技术的听觉设宴。大数据分论坛由中关村大数据产业联盟副秘书长陈新河主持,共有6位行业专家发表了演讲。银联

第八届中国软件渠道大会于4月28日在京隆重召开,除了上午10位行业专家分别针对各高端领域进行了洞察性分析,下午首设移动应用与云计算、 “互联网+”、大数据三大分论坛,并行展示新技术带来的变革,为与会者带来一次新技术的听觉设宴。

大数据分论坛由中关村大数据产业联盟副秘书长陈新河主持,共有6位行业专家发表了演讲。银联智策首席执行官呼延如生在会上发表了以“万事达、中国银联大数据的实践和应用”为主题的精彩演讲.(以下内容根据现场速记整理,如有不妥请谅解!)

银联智策-呼延如生

呼延如生:今天来了以后感觉到三点,一个是感觉到大家的热情非常高,一个是今天讲的东西都特别特别酷,还有一个是年轻,在座的都很年轻。我们今天在这个讲台上跟大家分享,可能明年就是你们来跟我们分享了,创业的机会都在。这次非常感谢陈秘书长,让我来跟大家讲金融这么一个课题,我想问一下,在座的各位谁是金融行业的,有没有?有一位。今天这个题目可能对多数人来说有一点新,我们陈老师有很多其他的一些讲座,群里有一些活动,希望大家以后一起继续这个课题。金融大数据,首先说大数据是相对比较新的概念,大家接触一个新的概念的时候要了解这个概念和概念体系本身,背后的理论框架再看创业实践的问题。我想我作为一个金融大数据的实践者,从我个人的经验跟大家先梳理一下金融里面几个主要的问题。

我到1999年学自然语言处理,读的第一篇文献就是李开复的博士论文,他解决了当时非常难的问题,就是怎么能把连续的一句话变成文字。当时我们做的问题更难一点,就是大家开会的时候,交谈的时候怎么能实时感应成文字,如果感应成文字速记人员再改,这就非常快了。后来到我毕业的时候我就在思考,我们做的事情还是有点简单,因为这个话说完了,我再一个个的修改,一个个过滤,滤过成一个文字,是看到这个东西。那么有什么东西更难一点呢?就是说这个人来了,我想向毛总借一百万,什么时候还?比如说我想买个房子,30年以后还,敢不敢借?你现在有多少钱,今天是千万富翁、亿万富翁,你可能明天企业就倒闭了,分文没有,你怎么还这个钱,所以金融是这么一个问题,是关于未来的一个预测,所以我当时就去了增长非常快的金融公司,那时候还是销售金融公司,用信用卡方式发放贷款。现在成为美国第五大银行,享有美国金融里面的“苹果”美誉,是一个非常创新的公司。

做什么呢,做风险分析和定价系统,这时候我又有了一个想法,想法是什么呢?因为在这个金融公司里面是机器和人的结合,数据跟计算机分析,下面还有做策略的人,用一套规则确定这个贷款贷不贷,信用卡批不批给你,这个东西能不能全自动化?当时SAP有个机会,要做金融解决方案,就去了,做了一套全自动化的金融定价系统。后来2008年金融危机来了,这个公司说我们要做大数据,因为抵御危机的办法就是用大数据。那时候是做不出来的,包括现在还有一个理念,金融是大数据驱动还有最后一要能呈现的,人脑可以理解的一个规则和规矩,后面我再去讲。

2008年回去以后就接触到SaaS,全球研发的一些专家,包括一些首席科学家,跟脸书都有很多的交流,做大数据方面的工作,这就奠定了我在金融大数据里面的一些基础,到2012年的时候就到了万事达,负责亚太和非洲大数据方面的业务,当时又接触到中国的问题。这是我面临的第三个问题,美国数据都是现成的,都在征信据和数据供应商,他都给你弄好了你可以买得到。现在中国面临着数据分散在很多地方,刚才也有好几位专家提到,就是说真正能买到的数据不一定是值钱的,值钱的数据你也拿不到,怎么办?2012年底我就到了中国银联,来创建银联智策这家公司。

我们还是要回到大数据基本的概念,作为大数据的从业者,我们怎么用一句话来概括大数据?大数据有很多文献和著述,在座的各位可能听了很多,也读了很多。作为一个从业者我实际上只关心这一句话,就是奥巴马政府里面的一句话,他是一种新的能源,是一种新的生产力,是一种新的石油,他从金融、教育、旅行、零售各个行业开展。今天特别荣幸有张总给大家详细介绍了沃尔玛,这里有很多公司,都是非常著名的互联网企业,但是并不代表非互联网企业就不用大数据。

我这里就不详细讲沃尔玛了,因为张总已经讲的非常生动了,但是沃尔玛有两点,它其实是用大数据预测他的供应商价格底线,能把供应商的利润压到最低,所以他的成本是最低的,沃尔玛的东西是最便宜的,在美国所有超市里面。他的成长秘密,你看过去十年里面利润增长率是其他普通零售业的两倍。我们再看另外一家公司,2002年他是经历了金融危机,他仍然赚钱,就是用大数据做驱动,风险评价。我简单提两句,它是个销售金融公司,后来我们谈到互联网消费金融的时候会谈到。它当时创建的时候,整个消费金融跟中国现在非常像,那时候申请信用卡,信用卡利率都是一样的,只有有身份的人是个身份的象征,普通老百姓,尤其是穷人是申请不了信用卡的。当年我作为一个穷学生到美国,第一章信用卡就是它给的,额度是500块钱。这个商业模式没有人看好,但是有一本书在进危机的时候很有名的书《大短线》,里面就讲了一个故事。真正特别勇敢的投资人来研究,说股票这么研究为什么不去买,找到他们内部的人事去座谈,认为它是很与众不同的,是这么一个故事,这么一个公司。

真正金融大数据的核心是什么呢?我们现在讲讲金融的核心实际上就是个钱包,我们现在看到支付宝的钱包里面你打开会有很多应用,可以在里面借钱,可以在里面花钱,你可以看自己的征信评分。微信也是,微信钱包包括了我们个人所有跟金融相关的支付。如果我们钱多了要存起来,想包括用钱生钱,用钱做投资,可以用钱买房买车做借贷,我对怎么投资有疑问也可以找一些专家,原则上这所有的东西都可以收到钱包里去,谁在做这些事呢?就是下面我们谈到的互联网金融。

有一句话说如果银行就在你的手里,你可以实时互动,而且所有的服务都是定制化的,那这是不是就是银行业的未来。他现在就在看2015年以后的事情,金融应该是什么样的发展途径。我们看2013年,称之为中国金融互联网的元年,代表性的事件就是余额宝的推出,推出来不出3个月就卖了600亿。它的商业模式实际上是一个基金电商,跟天弘基金合作去卖基金,大家把钱放在余额宝里实际上是买基金了。10月份百度推出了百发,是10亿元的总盘子,4小时就卖完了。百发不是基金电商,而是基金代理,是跟广发基金联合搞了一个百度百发指数,百度有个基金代理的牌照,是这么来做事情的,做法不太一样。

2014年互联网金融发生了几件大事,首先是互联网金融写入了政府工作报告,第二个事情是我们批了八家征信公司,还有四家民营银行,包括腾讯的。还有一个炒作,说我们李克强总理还去微众银行按按纽,发了一笔纯线上的贷款,当然这是纯炒作了。互联网金融的发展最后回到钱包,这个钱包是互动的,服务都是为你定制化的。那怎么才能做到这一点?相当于钱包有智能在里面。线上信贷平台,理财平台,信贷平台所谓的P2P这些创新都在里面,理财平台像基金、余额宝都算,营销平台像360金融的垂直搜索,还有一些其他的模式,O2O都要大数据来支撑才能实现职能。

先看大数据部分,首先要有数据源,目前用的是中国银联,有电信运营商,零售数据,比如说零售数据我们谈到了沃尔玛,有很多零售数据,还有各个银行上报的征信数据,还有很多其他的非结构化数据。这些数据进行整合之后,我们进行数据的处理,标准化信息和匹配,我们会整合成数据产品知识的中心。基于这个我们还要有一个决策服务的引擎,来支撑我们的战略实现。为什么?因为金融有三个核心的业务,一个是要获取一个新的账户,一个是要对账户的全生命周期进行管理,还要对反欺诈进行必要的业务操作。所有的东西都是基于用户行为的,实际上是看两个,一个是我为你提供了金融服务,你有没有还钱的欲望,还有有没有还钱的能力,你有没有钱还,这完全是基于人的行为的分析和定价,这是金融的核心。也就是说大数据要来支撑金融创新,这是比较要用的大数据的地方。

我再简单的来讲一讲,根据我过去的经验,怎么来实现,怎么来回答上述问题。这是银联智策金融大数据的部分,谈到大数据的话,一般我们要讲到三个,一个是你要有数据资源,另外要有相应的技术和处理加工,另外还要有业务的专业知识,这三个支点要形成一个大数据商业模式的三个核心。如果大家想在大数据里面创新也好,职业发展也好,有三个核心能力。个人的三个核心能力:一个要能够去编程,能直接操作数据。另外要懂统计、建模、数据挖掘这些,偏数据分析的,建模的能力。还有业务的能力,对行业业务非常懂。我们公司就是紧紧围绕这三个点,建立了三个有时。中国银联每年有200笔交易,有多少张银行卡?50多亿张,覆盖1500万家商户,220个国家和地区。有8亿持卡人,400多家发卡机构跟10几家权威机构数据合作,在互联网上进行数据抓取,进行不断的补充和扩张。今天大家都分享了很多技术,我就不讲了,基本上是通用的Hadoop这些。

我们是跟SaaS全球的研发中心幼战略合作,我们用了基于Hadoop的分析系统,专业团队上我们有50%+国际经验的团队,覆盖了金融、咨询、IT,80%以上是硕士,40%以上是博士。在数据里面要做哪些应用呢?首先要对宏观经济形势进行一些把握,第一个金融是完全对经济的依赖性非常大的产业,为什么美国有金融危机?就是因为房价跌了,对房地产的影响。那我们能不能对房地产市场进行很好的把握?一个房价指数是直接影响到一个房贷,这个人能不能还得起,能不能还得清,愿不愿意还。在美国金融危机的时候在拉斯维加斯,有的房子一下跌了70%,如果这个人花了100万买房子,最后只剩30万,他怎么还这个房贷。所以银联的数据可以看到,30多个行业跟消费相关的,100多家上市公司的股票,我们可以看到比如说青岛啤酒一共卖了多少,这跟企业的财报是相关的,对大家投资的选择也是相关的。同时宏观经济的因素会直接放在模型里,进行风险测算和定价,这部分是必需的。

下面是我们去驱动金融策略,银行放贷最后是一个审批过程,这个过程都是一些规则,那些规则怎么里的?怎么制定这些规则?一般要有银行的专家,放贷员加上模型共同制定。我们要在客户里面给它建立一种大数据驱动的这么一种策略,决策模式,这就是为我们应用大数据创造一个适合的环境,最后建立我们金融创新的核心,一个是信用评估产品,征信类的。目前大家听的比较多的是征信,那么怎么具体用到策略里面?有一个定价的问题,就是怎么直接应用到策略里面,有一个优化的问题。所以一个是银联智策的综合评分体系,有驱动策略的,这是核心。

我举个例子,大家都很关心房地产,今天也有专家讲了讲他们在房地产行业上很关注的点。我们只要看住宅销售的情况就可以了,这是银联智策从大家刷卡买房子看到的,灰线是统计局发布的金额,这个趋势拟合的非常好,2004年以来基本上是下行的,2012年初和2014年初两个跌落的点,这跟统计局这个地方有比较大的差异,主要是每个季节和年底的时候,房企、开发商会集中上报,这个波动反而是不正常,不真实的。这个银联的房地产交易指数体现出来的形势拟合的好,而且更平滑也更真实,这对于大家做决策是非常有用的。

还有这个指数可以细化到全国、省、市三个级别,绿的都是温度不够高的,反而是在西部地区房价交易是呈上升的趋势,这大家对全国范围内看房产市场都是非常有效的。这是我们的UPA Scores综合评价体系,个人方面有社会地位、财富能力这几块,商户潜力有经营趋势、竞争力这几方面来评价的。征信评分大家也可以看到,这背后有一套非常复杂的算法,把所有因素都综合利用。这就是一个应用,这个应用我就不展开讲了,无论是个人还是小微商户,找到银行或者P2P小贷公司来申请贷款,总是要对他的还款能力进行评价,这样代换机构可以做决策和分析,然后来决定授信的额度。

这个简单讲一下评分到底是怎么算出来的,这个大家可能对这个比较感兴趣。我们会看不同的指标,也就是形成不同的模型,不同的模型再以不同的权重拿出来。再看数据源,我们基于中国银联的数据,互联网数据,客户数据和其他数据,在数据本身的基础上进行延伸,基本上是上万个基础变量,在基础上做变量的选择,最后根据不同的度量指标形成模型,再有一个大的评分。这里用的都是人工智能、统计分析这些技术的结合,看起来跟现在比较热的深度学习是有点像的,但是这是手工做的,而深度学习是一个非常自动化的过程。

最后到这里为止,这就是一个决策的问题,因为我们谈了我们有大数据,我们进行模型,然后推动一个决策,但是决策能不能自动化?目前这个决策在金融机构里还没有实现完全的自动化,它是风险专家,大数据驱动模型的过程,这里面讲在客户的筛选和选取阶段,审批阶段,管理阶段,在策略里面都有哪些要素。大家如果对做软件,做系统感兴趣的话,你可以把这里面的这些要素软件化,形成银行可以直接用的基于云的SAS的决策系统,这样金融的问题我觉得今天跟大家就是开了一个头,核心就是在你的钱包里,你想实现智能的话就要用大数据推动,而这个大数据推动是专家的知识和人工智能或者人工智能的过程,希望以后大家能经常到陈老师,陈秘书长的活动里多参与参与,因为里面会就每一个课题都展开的非常专业。比如说征信有很多专家给大家讲很多征信的问题,模型也有很多专家讲不同模型怎么做,决策、定价怎么去做,大家可以学到非常非常多,非常感谢大家!

第八届中国软件渠道大会与您相约5月25日沈阳站,诚邀您莅临参会!

【返回首页】