资讯中心

如何在金融领域实践互联网级别机器学习?

来源:数据分析网 原标题:氪信CEO朱明杰:互联网级别机器学习在金融领域的实践
2016/7/22 13:50:46
32597
导读:过去十多年的机器学习,成功的应用都是在互联网上,搜索,广告,推荐,可以说互联网达到了数据时代。
  【中国智能制造网 名家论坛】本文内容源自氪信CEO朱明杰朗迪中国峰会的演讲。朱明杰应大会邀请,围绕金融的核心问题——风控,做出了“互联网级别机器学习在金融领域的实践”的主题演讲。
  
  如何在金融领域实践互联网级别机器学习?

       以下为演讲摘录:
  
  大家好,我是CreditX氪信的创始人朱明杰,刚才的圆桌很精彩。我是互联网人,做了十多年的机器学习,也就是用机器代替人去处理数据做决策和判断。过去十多年的机器学习,成功的应用都是在互联网上,搜索,广告,推荐,可以说互联网达到了数据时代。而到金融创新这个领域,如何实现互联网级别的机器学习和人工智能,大家都刚刚起步,我今天想讲讲我们CreditX在金融领域实践互联网级别机器学习的一些经验和思考。
  
  普惠环境下金融风控的痛点
  
  我一直认为,“科技进步是被业务需求逼出来的”。过去我们在互联网行业靠算法和机器,都是被逼的,为什么,因为数据量实在太大了,你想去淘宝搜个手机壳,让阿里的同学人肉从上亿的商品里帮你找出喜欢合适的,那根本不可能。传统金融场景里,一笔100万的贷款主要靠风控人员和关系,那是可行的;而到了银行的信用卡中心,积压的申请审核,让审批人员每周加班,都批不完。那现在互联网金融要面临更加普惠的场景,比如几百块钱一笔的手机贷,靠铺人力一定是行不通的。所以,这已经不单单是提升运营效率问题,而是必须要把活儿交给机器,让机器来学习人的风控经验,机器人变成风控专家。
  
  但是我们在金融场景里讨论机器学习和人工智能,面临着现实的两个难点:
  
  个问题是数据太少。我们知道金融数据是非常稀疏的,而且现在很多的金融产品形式在以前是根本没有发生过的。所以根本不存在十几年的数据积累的问题。换句话说也就是缺少训练数据,也就是俗称的冷启动,缺数据;其次金融出一个坏账,少则一个月多则几个月,积累这部分数据要等很久,相对于在互联网搜索领域内可以迅速拿到点击反馈,两者差别很大,所以数据的缺失是阻碍机器来学习人的经验的巨大障碍;
  
  第二个问题是数据太多。我说的数据太多的意思是数据特征维度太多,远远超过了人的处理能力。不像传统的金融十几维度的特征变量,人来调一调公式终归是可以应对的。但现在面临这么多维度的数据,大家也想了很多很好的愿景,包括刚才几位嘉宾也在讨论很多数据都可以用。为什么用不上呢?这个问题在于我们有什么办法可以有一个很强的表达能力将这些很原始的,也可以叫若变量的数据特征利用起来。而讲弱特征数据组合起来,与结果联系起来,让人的直观经验可以理解,让风控专家去反馈。因为在金融场景内,不能像互联网的机器学习都是一个黑盒子,一堆数据扔进去,等结果来反馈迭代,但是金融场景内,特别强调模型的可解释性,这样才能把人的风控经验和直观感受跟数据表现结果关联起来。在这个基础上,我们才能说把人的经验介入到利用数据进行机器学习建模的操作中去。做到特征要能够追溯回去,尤其是金融的反馈结果要等很久,需要人能够快速干预反馈。

热门评论

上一篇:智能制造产业升级浪潮中 大数据扮演什么角色?

下一篇:AI与人机关系将走向何方 听听人工智能专家怎么说

相关新闻

<