无忧支付网首页
站内搜索
您当前的位置:主页 > 相关文档 >

支付清算风险管理中人工智能技术的运用

添加时间:2022-07-08

  一、人工智能在支付清算领域的发展现状

  人工智能是指对人类智能的模拟、延伸和扩展,其在金融领域的主要应用方向为机器学习、生物特征识别、语音语义识别及知识图谱等,在支付清算领域可应用于智能账户、智能支付工具、智能清算系统、智能监管等。人工智能技术不仅可以辅助支付清算主体提供便捷、高效的服务,还可以在风险监管等方面为支付清算工作提供保障。

  (一)国外人工智能技术在支付清算领域的应用

  印度Ci Cl银行、HDFC银行已在行内反洗钱、支付交易管理等不同领域引入人工智能技术。新加坡星展银行利用生物识别及人工智能集成等技术开创了纯数字银行Dig Bank,创造了新的支付方式,开启了支付银行的创新革命。意大利尤克利德利用人工智能技术试图获得用户支付体验,以实现业务自动化。

  摩根大通将人工智能技术应用于投行、交易和清算股票。Fraugster是德国和以色列的合作伙伴,使用人工智能来检测支付欺诈和准确预测欺诈行为。Yandex利用深度学习计算技术对安全和恶意网站进行分类,以确保网络支付的安全性。英国银行Nat West通过i Phone应用程序中的人脸识别实现了使用人脸识别登录银行APP的能力。

  (二)国内人工智能技术在支付清算领域的应用

  在“金融科技”兴起的大环境下,国内银行和非银行支付机构采用的人工智能技术按照降低成本和提升效率两条路线,正重塑着支付行业。平安银行通过手机银行首创“智能语音”支付功能,实现“语音支付”、“语音取现”等操作,同时实现“智能钱柜”,完成系统记账与出纳分离的现金自动处理模式。交通银行开发的“能听、会说、能思考、会判断”的智能理财机器人,能够为客户提供专业的金融服务。与此同时,非银行支付机构也加快了人工智能在支付业务的融合。

  支付宝利用人脸识别技术,完成了支付流程的身份认证工作,还利用人工智能技术对转账行为进行评估,用以判断是否有诈骗风险。财付通、支付宝等支付机构还推出了“无感支付”业务。

  (三)内蒙古自治区人工智能技术在支付清算领域的应用

  内蒙古自治区五家地方性法人银行支付系统直接者中,自治区农村信用社联合社自2019年7月起,陆续对自助设备、智能柜员机、手机银行等交易渠道加入人脸识别技术进行了相关系统开发,截至2020年共有自助柜员机试运行机构93家、接入设备3958台,智能柜台试运行机构93家、接入设865台,手机银行网贷服务平台全面加入人脸识别技术;蒙商银行于2015年将指纹识别技术应用于柜员登录业务系统,随后将OCR识别技术应用于手机银行App中,并使用厅堂智能机器人与客户进行简单对话、传递物品、查询等互助功能,除此之外,智能投顾系统、贷款审批辅助分析系统等智能创新系统也已陆续在分支机构推广应用。

  内蒙古支付系统呼和浩特城市处理中心CCPC,以首府生产系统运行主中心和旗县灾备系统运行副中心的系统架构设计,并在两地两中心双活模式下生产运行,供配电系统、消防系统、暖通系统以及动环系统等支付系统基础环境的运行监控,不同程度地运用了智能化,支付系统的辅助系统实现异常情况下的自动预警提示,支付系统清算风险科技管理手段得以应用。

  综上所述,作为与信息技术融合最深的行业之一,金融业积极推动人工智能应用落地,在确保业务连续性、提升业务效率、优化成本控制、完善风控体系、推动产品创新等方面取得了明显突破。

网联清算

  二、人工智能在支付清算风险管理中应用探析

  风险是指某一特定危险情况发生的可能性和后果的组合。对于应用系统而言,风险的发生主要是指由于各种确定或不确定的因素导致的应用系统没有按照设定方式运行,以至于运行结果没有达到预期效果的各种情况。支付系统风险不仅对其运行构成威胁,还会对支付业务连续性有一定影响,甚至可能引发系统性金融风险。

  (一)人工智能应用的路径选择

  1.利用系统日志进行风险检测。系统日志是记录系统中硬件、软件和系统问题的信息,是系统性能以及异常监控的重要数据来源。在系统风险管理中,异常检测是构建安全可靠系统的重要一步。实践中,通常会使用安全软件对系统进行风险检测,而安全软件提示的问题时常会提及系统日志信息,一般情况下的处理方式是按照软件指示进行删除操作,但系统管理者并不了解问题的根源。

  使用安全软件虽然可以在一定程度上对系统进行保护,但同时也为风险的发生添加了新的可能。而直接对日志信息加以利用不仅可以解决系统运行中存在的问题,还可以预防潜在风险的发生。

  2.系统日志检测方法选择。因系统日志具有非结构化、强时效性和出现异常类型较多的特点,所以在选择日志检测方法时应重点考量以下几个方面的因素:

  一是因日志信息在各式和语义方面与系统之间均有着较大的差异,故不可普遍使用基于规则的检测方法。二是对日志信息的监测必须要及时,但日志数据是以数据流的形式进行输入和传输,意味着对全部数据进行分析的方法不适用。三是可以对系统所产生的全部异常信息进行捕捉和分析,且对未知的异常信息也要有一定的判定能力。

  基于上述考量,本文选择了基于深度学习的日志异常检测方法,该方法通过对执行路径进行异常检测、对参数和性能进行异常检测、对工作流进行异常检测三个步骤进行,然后综合其判断结果最终对系统异常进行确定。

  (二)人工智能应用于日志检测的模型构建

  面对现代系统正在以每小时约50Gb的速度生成大量日志以及大规模并行使得现代系统行为日渐复杂等问题,针对系统日志信息所做的自动异常检测方法就显得尤为重要。计算机技术就是为帮助使用者解决重复且大量的工作,而人工智能技术的目的则是使得计算机技术在解决重复且大量工作的基础上,可以学习之前工作过程中的经验,完成计算之外的“判断”和“决定”,甚至可以为使用者“提出建议”等一系列操作。从而帮助工作人员实时监控支付系统运行情况,为技术人员提供更多的参考信息,以此保障支付清算系统平稳运行。

  1.日志信息异常检测的步骤。针对系统日志信息的异常检测主要分为四个步骤:

  一是日志信息的搜集。搜集的方式有多种,可以利用系统运行本身所产生的日志信息,但由于日志信息一般不轻易用作他处,故通常实验所使用的日志信息来源于互联网的公开数据集或者通过程序模拟生成相关日志信息。

  二是日志信息的解析。解析的目的是将日志信息按一定模板进行提取,使得日志信息可以按照统一格式进行存储,从而构造模型训练所需的原始日志信息。

  三是日志信息特征提取。由于模型所识别的信息是数字信息,所以日志信息解析为单独的事件之后,需要将文本信息转化为数字特征向量,使得机器学习模型可以利用日志信息。

  四是日志信息异常检测。检测方法可以分为有监督异常检测和无监督异常检测。

  有监督异常检测是指模型通过数据的标记来“学习”日志信息的正常和异常状态,训练模型时所得到的训练数据越多,模型的精确度就越高;而无监督异常检测则是指模型训练时所得到的训练数据没有人为的数据标记,通常在模型训练过程中通过归一化、聚类等方式进行多次修正,使模型在训练过程中自主学习日志信息所包含的正常和异常状态。有监督模型中常用且成熟的有LR、决策树和支持向量机(SVM);无监督模型有LOF、Isolation Forest、PCA、Invariants Mining(不变量挖掘)、CLustering(聚类)、Deep Log和Auto Encoder(自动编码器)。

  2. 模型模拟训练。

  (1)训练环境。模型训练所使用的HDFS数据和BGL数据基本都来源于生产系统并由相关领域的专家手动标记,共有15923592条日志信息,同时其中也包含365298条异常日志信息,用于模型训练和模型验证时的训练数据和测试数据。HDFS数据集中包含11175692条数据,其来源于Amazon EC2平台,这一数据集中的数据记录每项操作,是唯一表示某一时刻的特定操作,因为可以很容易地被分为日志序列,经过处理将日志序列进行特征提取,生成575061个向量,其中被标记为异常数据的数据样本有16838个。

  BGL数据集中包含4747963条数据信息,由Lawrence Livermore国家实验室的Blue Gene超级计算机记录,这些数据没有标识符,所以通过固定大小将数据按特定长度切位日志序列,然后进行向量提取,其中包含348460条异常信息。

  本文中所使用的方法是在python环境下实现的检测方法,对于使用有监督的方法,利用机器学习中常用的Scikit-learing实现Logistic回归、决策树和SVM的学习模型。模型中所使用的参数是在实验过程中多次手动调节得到的最优值。其中,SVM中还尝试了核函数和相关参数,发现线性核函数支持向量机与核函数进行比较精确度高。同时,对于Logistic回归进行了不同参数的尝试,并对其进行了调整以便获得模型的最佳性能。

  (2)模型训练及结果评估。关于模型的性能,使用精确度、召回率及F-measure(这一系列实验中常用的度量标准)来对模型性能进行评估,精确度测量的是异常数量与正常数量的百分比(如2-1),召回率测量的是实际异常的百分比(2-2),F-measure测量精度与召回率的谐波率(2-3)。

公式

  根据现有数据集,我们将其中的80%作为训练集,剩余的20%作为测试集。由于时间及模型训练所需的环境等问题,本文只进行了一个方法的调试和测试。由于不同方法所使用的的原理及算法本身的侧重点不同,所以结果会有不同。

日志数据的聚类可视化解析

图1 日志数据的聚类可视化解析

  从图1中表示日志数据的聚类可视化解析结果,大类表示准确的日志数据,小类表示准确率不太高的日志数据,但也表示数据集中一部分日志数据的走向,而零星分散的点表示异常的日志信息。在训练过程中,将图中小圈标记位置的数据进行剔除后再次进行聚类操作,得到最终的分类标准。同时,由于数据的稀缺,还可以将位置较为异常(小圈标注的数据)标记为异常数据,以供后续工作的开展。

训练过程中不同规模数据集训练结果

图2 训练过程中不同规模数据集训练结果

  从图2中可以看到在训练的不同阶段,不同规模的数据集在准确率的评估条件下的表现结果。可以看出,数据量大的数据集相较于小规模的数据集表现摇号,比较符合人工智能模型在训练过程中数据集越大,模型的训练效果越好的特点。500M和100M的数据集在训练的不同阶段有着不一样的表现,但整体趋势可以看到,随着训练迭代的进行,模型的训练结果逐渐趋近于平稳,但不同数据集所训练的模型效果还是有所差异。

模型训练结果

图3 模型训练结果

  从图3中可以看到通过调试、训练得到的模型使用三个判断标准得到的相应的结果。100M数据集所训练的结果相较于500M和1G的数据集结果要好,通过观察训练集和测试集发现,由于所用数据集属于同一来源,所以类型相似,同时小规模数据集的测试集也较小,训练时所划分的分类也更细更小,所以小规模数据集所得到的结果更好,但是使用1G的数据集所得到的模型更加稳定。

  三、人工智能在支付清算风险管理中的策略展望

  通过人工智能在支付系统清算风险管理中的应用验证,基于支付清算系统日志检测方法,分析日志信息的异常检测结果,得出系统日志异常检测支持支付系统风险研判的理论依据。

  (一)深度论证

  本文所尝试实现的模型论证数据是基于互联网公开的数据以及爬虫的相关结果,由于支付清算系统运行所产生的日志信息较为敏感,所以不能在实验阶段进行使用,这样也会导致模型无法直接应用于系统中进行模型性能验证。同时,基于深度学习的日志异常检测方法分为有监督和无监督两种方法,本文所验证的实验使用的是有监督的方法,从两种方法的原理来看,无监督方法更适用于训练数据和验证数据较少的实验中。

  但是,无监督方法的不确定性、可失败的可能都比较大,需要通过多次训练进行纠正误差来调整模型,通常使用无监督方法的基于深度学习的模型训练所需时间是使用有监督方法的一倍甚至更多,但所需数据是有监督模型所需数据量的一半甚至更少,数据量与模型训练时间成反比。两种方法各有其优势,也有其劣势,可以尝试通过不同的方法对系统日志检测模型进行建模、训练以及验证,使其实现最优选择。

  (二)应用展望

  人工智能模型的训练需要大量的真实数据输入进行模型构建,为了保证实验所得出的模型适用于支付系统清算风险防控,可以根据支付清算系统所产生的日志信息进行数据构建,或者可以在安全的情况下使用支付清算系统所产生的日志信息进行模型构建,这样训练所得到的模型会更具针对性且在更短的时间内得到实际应用。

  但需要关注的是,人工智能技术应用研究必然会需要海量数据的收集与处理,这样就可能造成数据安全隐患,同时存在信息泄露的风险,支付清算系统日志信息对于支付系统安全稳定有着重要作用,所以对于数据的使用应慎之又慎。

  人工智能、大数据、云存储、区块链等技术持续推进金融体系的数字化转型,金融科技的进步为支付清算行业的发展注入了强大的动力,随着相关技术的逐渐成熟,未来支付清算风险管理也会更加智能化,不断减少人工大量成本,逐步提高科技管理投入,从而降低支付系统风险发生的可能性。

关闭

1.点击下面按钮复制微信号

***********

2.打开微信→查找微信号

加为好友 开始支付接入