4月22日,“2021第六届亚太银行数字化创新博览会”于上海举办,会议旨在分享银行数字化创新领域前沿资讯并共同探讨未来发展趋势。本届会议共吸引来自国有大型商业银行、股份制商业银行、城商行、金融科技企业等代表五百余人,DataVisor维择科技中国区首席运营官杨居正应邀出席“智能风控与不良资产处置”分论坛,并作题为《金融科技与智能风控:2021再思考》的主题演讲。
杨居正从大数据、人工智能及智能风控三大话题切入,以发展的眼光看待其各自变化。
2020年抗击疫情, 大数据“一战成名”,为社会立功的同时亦为自身正名,中国的数字化社会治理手段已经充分证明了其强大的力量;而数据作为一种重要的生产要素,也愈加受到关注。杨居正表示,当下数据可以被用于疫情防控、社会治理,未来便能够用于赋能产业、升级业务。谨慎乐观地预测,未来数据可发挥的空间将趋大。同时他也指出,于市场而言,规范有序是健康发展的前提,因此数据使用的门槛也将相应提升。
人工智能与智能风控方面,概念炒作的阶段已然过去,务实操作的实践正有序推进。大家谈及人工智能,已经从赞其无所不能,变为感其仍需完善。这一变化并不意味着AI概念的破灭;而是说明AI已实现充分落地,全面渗入日常业务实践。
立足智能风控行业,杨居正表示,数据不存在“完美”一说,不断精进数据采集、加工及应用能力才是无限趋近“完美”的唯一途径。要习惯于充分利用已有的数据,挖掘现有资源的潜力,将“沙中淘金“视为常态。大部分时候我们面临的问题是数据太少,缺少必要的信息用以支持决策;另有一些时候,我们面临的问题是数据很多,抑或是太多。如银行机构,各个业务的不同场景均会产生大量数据,种类繁多的系统背后,是成百上千套格式各异的数据表。上述数据信息没有合理的打通与共享,自然无法发挥最大的效能。以银行发送的信用卡余额分期营销短信为例,通常情况下,短信都会加上“如果您已经还款,请忽略本信息。”这很有可能是数据没有充分打通、共享造成的,反而会导致已还款客户还需要再次重复查询。
同时也有部分时候,存在数据与场景不匹配的问题。同样的数据,一旦用途不同,采集的方式、维度、字段会有很大的差异。比如,很多银行都使用了app埋点服务,但一般都是用于描绘客户画像、服务于营销,而非旨在深化风控能力。
杨居正表示,数据的整合、加工处理是一项系统工程,应该针对风控需求、构建一个风控数据引擎或者数据中台。通过这样一个引擎,将原始的数据信息衍生出丰富的特征字段,这些特征字段可以是非常复杂的动态数据信息,能够用来支持规则和模型的实时计算需要,既集成了行业领先的专家经验,又具备了支持互联网化的高性能架构。此外,面对互联网化的业务场景,特征工程平台的调整、反应速度也应该从线下的节奏(以天和周为单位)变成线上的节奏(分钟、秒、甚至毫秒),天下武功,唯快不破,这是智能风控的基础。而维择科技的特征平台便是基于上述理念而搭建的中台产品。
智能风控的长足发展,应由点到面升级风控技术,实现对新型欺诈套路的快速识别。杨居正谈到,现有成熟的风控手段以规则和有监督机器学习为代表,多以过去的专家经验形成规则,或用历史数据的拟合和模拟来构建模型。上述相对被动的方式较容易被攻破。区别于此,无监督机器学习是一种重要的范式创新,它不依赖于历史标签,可以实现对新攻击模式的预测和自学习,按照“好人分散、坏人扎堆”的逻辑,用高维特征空间的异常聚集来识别坏用户,从被动的亡羊补牢,走向主动的未雨绸缪。遵循“用算法为数据补位”的模式,无监督机器学习也能够对现有的风控手段进行全面的补充,对现有的风控系统进行“升维”,从而对于欺诈行为进行“降维打击”。
在实际应用的过程中,无监督机器学习可以对现有风控体系产生如下三方面的影响:
1、化整为零:将现有的个体检测聚合为群组识别,并案处理,极大地提高了案件调查的效率;
2、一网打尽:现有的检测可能是查到部分问题用户,而无监督的方法可以将高可疑用户、低可疑用户一并检测,避免出现“漏网之鱼”;
3、查缺补漏:现有的规则、有监督检测总是基于历史数据和已知信息,对于未知问题的检测和发掘,正是人工智能工具的智能之处,这也正是无监督机器学习的领先标志。
新浪声明:所有会议实录均为现场速记整理,未经演讲者审阅,新浪网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。
责任编辑:梁斌 SF055
原标题:维择科技杨居正未来数据可发挥的空间将趋大