信托专题研究:信托业务风险管理智能化研究(四)

投中流程的智能化应用与落地

1.投中智能化应用的场景模式

(1)法律文本制定与审核。信托因具备横跨货币市场、资本市场、实业市场领域的行业特征,拥有股权、债权以及多种形式灵活的运用方式和多品类的产品结构,造成信托法律文本具有复杂性,同时鉴于频频发布的各类监管政策,信托法律文本又需要具有灵活性。因此在法律意见和文本部分,可以借助AI工具,通过逻辑运算完成交易结构建议和交易文本推送,通过系统辅助工具完成法律文本智能比对与审核,提升交易结构和文本审核速度,避免要素遗漏并减少人工操作误差。

(2)合同签订环节。除了制定法律文本,投中环节还包括合同签订、如涉及抵质押的还包括手续的落实和权证的取得,以及结合项目自身情况需要核验的其他资料等环节,而其中投中环节合同签订的真实有效至关重要,因此在合同签订环节尽可能的采取目前最先进的科技技术支持,通过身份识别、远程视频等方式来保证合同签订的真实性、有效性。

2.智能化应用的落地路线

(1)可应用的智能化技术阐述。信托公司的一些在投中合同签订环节需要对签订合同的交易对手进行身份识别、需要对现场拍摄的一些留存视频及照片进行佐证等,这些手段目的就是为了防范项目的欺诈风险。而在这些场景下,人工智能可提供的对签章自然人验证技术主要有:人脸识别、声纹识别、反PS技术等,对企业办公地点验证的GPS定位技术等。我们开发了见证APP,可实现一人实地一人视频的方式双人见证并录制合同签订的过程,并可截取细节图片,显示时间及地点,以及签订人员。其中用到了身份证别技术中的人脸识别、视频通讯技术即通话双方可同时入镜、GPS定位技术、以及反PS技术,并对声纹应用留有接口,待有成熟业务场景时可直接启用。

鉴于信托法审工作主要集中在交易结构的法律分析、交易文本的起草及内外部谈判及沟通上,其核心需求是大量的文字处理及分析应用,因此能够发挥作用的人工智能技术主要集中在光学字符识别技术(Optical Character Recognition,简称OCR技术)、自然语言处理技术(Natural Language Process,NLP)和人工神经网络这三大技术上。

①身份识别技术(人脸识别、声纹识别等)。身份鉴定一般可分为三类:基于特定物品;基于特定知识;基于生物特征。目前,个人身份识别主要使用ID卡(基于特定物品)和密码(基于特定知识)等手段,随着生物特征识别技术发展,有了更加方便可靠的办法来进行身份鉴定。生物特征是人体天然携带的信息,与传统的密码、身份信息相比,具有唯一性、稳定性、防伪性、不可抵赖性。生物特征可细分为生理特征和行为特征两种。一些常用的生理特征包括DNA、指纹、虹膜、人脸、视网膜、指静脉、耳型、声纹、掌形等,常用的行为特征有步态、签名等。生物特征识别技术可以通过光学、声学、传感器、计算机技术等进行采集,并通过一系列算法形成唯一性的特征值,系统对特征值进行判断,实现以高准确率完成安全认证核心的身份鉴别相比于传统的安全技术和产品,生物识别技术具有精度高、速度快、防伪性好等特点,在金库管理、柜台身份认证、网上金融与电子商务等领域都已经有很好的应用。比如远程开户、无卡取款、刷脸支付、在线信贷等在金融领域的应用也日益增多。同其它生物识别技术相比,人脸识别技术具以下优越性:

一是使用方便,用户接受度高人脸识别技术使用通用的摄像机作为识别信息获取装置,以非接触的方式在识别对象未察觉的情况下完成识别过程。

二是识别精确度高,速度快。与其它生物识别技术相比,人脸识别技术的识别精度处于较高的水平,误识率、拒认率较低。

三是不易仿冒,人脸识别技术要求识别对象必须亲临识别现场,他人难以仿冒。举例来说,用合法用户的断指即可仿冒合法用户的身份而使识别系统无从觉察。

人脸识别技术作为生物特征识别领域中一种基于生物特征的识别,是通过计算机提取人脸特征,并根据这些特征进行身份验证的一种技术。概括地说,人脸识别技术是一种高精度、易于使用、稳定性高、难仿冒、性价比高,目前广泛运用在考勤打卡;安全验证系统信用卡验证;刑事案件侦破;出入口控制,如北京奥运会和杭州G20峰会应用人脸识别技术进行安保;人机交互领域;金融行业,如支付宝推出了刷脸功能等。投中最重要的环节之一就是确认合同签订者的身份。结合众多生物识别技术,人脸识别加OCR身份验证可以方便准确的确定签订者的身份。

声纹识别,生物识别技术的一种,也称为说话人识别,是一种通过声音判别说话人份的技术。声纹识别技术有两类,即说话人辨认和说话人确认。不同的任务和应用会使用不同的声纹识别技术,如缩小刑侦范围时可能需要辨认技术,而银行交易时则需要确认技术。

声纹识别(Voiceprint Recognition,VR)即说话人识别(Speaker Recognition,SR),是利用说话人的语音判断说话人身份的生物特征识别技术。其应用场景主要有两类,即说话人辨认(Speaker Identification)和说话人确认(Speaker Verification)。前者用以判断某段语音是若干人(或海量语音)中的哪一个所说的,是“多选一”问题;而后者用以确认某段语音是否指定的某个人所说的,是“一对一判别”问题,银行系统多属于后者应用,即用于识别服务对象的身份是否正确。

②视频通信技术。视频通信,又称视频电话,通常指基于互联网和移动互联网端,通过手机之间实时传送人的语音和图像的一种通信方式。随着4G网络的正式商用,无线网络覆盖越来越完善,网络带宽不断增大,数据传输速率不断提高,移动无线通信网络带来的便捷,使通过无线网络进行实时视频传输成为可能。以智能手机为代表的移动便携设备已经非常普及。为构建面向移动环境的实时视频传输系统提供了新的机遇。

③定位技术。全球卫星定位系统(Globe Posi-tioning System,GPS)是美国国防部从1973年开始,历经20年的开发而完成的新一代卫星导航系统,其最初的目的就是利用GPS伪距离测量进行实时定位,为其潜艇、水面舰只、飞机、火箭、导弹、地面车辆及部队提供实时导航,但随着GPS定位技术的发展,它在全球的应用范围也在逐渐扩大。目前,在民用领域,如航天、航空、航海、测量、勘探等,GPS技术已被大量地采用。近年来,随着形势的需要,金融行业也逐步开始应用该技术建立运钞车安全防范体系。

一段时间以来,社会上一些犯罪分子把目标对准金融系统,大肆进行犯罪活动,尤其是银行的“流动金库”——运钞车由于存在载钞量大、在进行跨地区调拨时联络困难等因素,其安全保卫工作一直是各级银行的难点。为了改善运钞车在调拨途中的通讯保障能力,银行科技部门采取了多种技术手段,如用短波、超短波车载通讯设备等,但由于存在着地形复杂而产生的通讯盲点多、在地区交界处频率协调难、跨区范围大以至通讯质量差等不利状况,安全的隐患依然存在。如今,利用GPS建立银行运钞车监控管理系统,可以很好地解决这一困扰金融部门多年的难题。

对于信托公司而言,信托公司在投融资面签阶段,需要人工前往面签地或项目现场进行检查,部分人员会存在不前往目的地,或者签订人不承认合同签署在办公地点等欺诈风险。将GPS定位技术融入面签见证系统能防范此类欺诈风险。

④反PS技术。对于网络情况差,视频画质不清楚的场景,以便对项目进行后续的跟踪管理。但是这个过程会存在照片造假的风险,而大多数照片造假是工作人员提供经PS处理过的照片而非真实照片。为防范这一风险,研究和推广反PS技术在信托项目尽调、面签、投后现场检查等环节的使用成为一个需求点。

Adobe最近宣布已经开发出一项新技术,使用AI和深度学习来帮助检测图像是否被PS。根据公开的技术细节是通过检查噪点分布,路径,光线和像素值等指标,来判断是否P图。常见的PS方法主要有三种。

一是拼接,组合两个单独图像的合成一张成品图;二是去除,图像中的部分或物体被完全去除,使它看起来像是从来没有过。三是复制移动,将图像中的某个对象从一个位置复制或新增到另一个位置。

从Adobe实验室中走出来的反PS技术的工作原理如下:

RGB通道+噪点——在CVPR 2018上公布的通道技术图。可以看出,根据通道反向追溯技术。让卷积层来快速辨别图像是否经过处理。平常使用智能手机的人可能会有疑惑:截屏是不是就没有通道轨迹了?但我们仔细看,是通过通道技术中的噪点来追溯的。

噪点+光线——通道和噪点只能辨别一部分粗糙的P图。精致的P图还是很难被认出的。在精致P图面前只有通深度学习的大量训练,通过噪点加光线会更加容易发现一些细节。有些细节会违背光学常理,显的很突兀。

当然还有些辅助手段,比如像素的平均分布比例、路径的连贯性等,最终来衡量图片是否有造假嫌疑。

⑤光学字符识别技术(OCR)。OCR技术的工作原理是通过电子设备扫描纸质资料上打印或书写的字符,采用光电转换装置将字符转换成电信号,并由计算机进行检测暗、亮模式确定其形状,然后用字符识别算法将形状翻译成计算机文字的过程。

随着这项技术的日趋成熟,相关软件已经进入了人工智能阶段,其对于印刷体汉字识别正确率能达到99%以上,对于手写汉字识别率也已达到70%以上,在神经网络技术的加持下,OCR技术对手写字符的识别率可以达到90%以上,甚至可以做到对数据库中没有的语言的识别。该等技术可以用于信托法审工作中录入及识别相关尽职调查信息、证照信息以及纸质版本的交易文件,可极大地提高录入效率及准确度。

⑥自然语言处理技术(NLP)。NLP技术作为研究如何实现人与计算机之间用自然语言进行有效沟通的技术,主要功能是通过计算机可识别算法对自然语言的各级语言单位(字、词、语句、篇章等)进行转换、传输、存储、分析等处理。NLP技术的主要研究目标是建立能够用于表示人类使用的自然语言的数学模型,以及通过建立合适的计算框架来实现这样的模型及其应用。NLP技术的应用及优势大体可以分为以下两个方面:

一是对单个文档进行充分挖掘,通过对单个文档的结构分析、文本摘要、关键信息抽取等操作,旨在挖掘单个文档中有价值的信息,应用场景包括文本检索领域、搜索引擎和智能问答等。其优势在于对于单个文本进行解构及文义识别,既能够辅助提取核心信息,也能为下一步文档的分类、识别奠定数据基础。

二是对多个文档的处理,旨在对多个文档进行分类、聚类,通过提取文本的某些特征形成对多个文档分类的逻辑规则,应用场景包括文件自动管理,文本审核,观点分析等,其优势在于通过大量的样本分析,在人工神经网络的配合下,可以在一定程度上替代专家型法审人员创建的人工逻辑规则,逐步实现智能化的分析及文字输出。

⑦人工神经网络(深度学习)。人工神经网络技术是通过模仿生物大脑神经系统结构,使用分层级的大量算法及函数和模拟神经元来使软件拥有学习能力。相比传统的逻辑学推理演算建立的专家系统,人工神经网络是基于统计学的生物神经网络模拟,拥有类似生物的判断和感知能力,大大提高了精确度和效率并且做到真实的自我学习,在自我学习的过程中以人类无法比拟的速度不间断地增强自己的能力深度和广度,可以成为真正的强人工智能系统。

人工神经网络的学习方式主要有以下五种:监督式学习,无监督式学习,混合式学习,联想式学习及最适化学习。由于系统可以自行从未经处理的资料库中分析规律提取信息,不需要对历史资料的内容进行人工的转换或是标准化,无论哪种学习方式都比传统的专家系统对软件技术人员的需求小很多。对信托法审工作的智能系统建立来说,法审律师与科技开发人员的互相沟通和理解是一大重点也是比较耗时耗力的工作,若以人工神经网络技术作为智能系统的基础,这方面的效率会大大增加。

人工神经网络已被广泛运用在决策生成、金融产品自动交易系统、数据挖掘、神经机器翻译等领域且已趋近成熟。要做到法审工作的智能化分析以及交易文件及法审意见的输出,人工神经网络系统与NLP技术的配合是目前最实际可行的路径。国外多家著名律所已开始从不同方向,与不同的人工神经网络技术提供商合作,尝试开发内部使用或是面对客户的人工智能法律处理系统。拥有人工神经网络的人工智能系统可将对科技开发人员需求最小化、易用度和智能度最大化。因各基础技术已趋近成熟,目前的挑战主要是整合不同技术达到新的、更高级的功能,不论对任何领域来说,人工神经网络技术都是整合的这些技术并生成一个完整系统的领导技术。

(2)技术的解决方案阐述。

①法律文本审核的解决方案。信托法务进行合同审核,一般可分为如下审查维度。首先,合同是由一定结构体系的条款组成的,合同审核要遵循合同的结构体系。结构体系是指组成合同的条款的排列逻辑。合同条款可以按合同履行的时间顺序进行排列,也可以按合同履行的工作内容进行排列。如一份信托股权投资合同,条款可能多达数百条,必须按一定内在逻辑分类排序,否则肯定杂乱无章,不易理解,更不易发现风险。合同审核工作,做的第一步,便是把合同的结构和逻辑理清。其次,法务合同审核时,也是有标准的注意事项的。根据前人经验总结,合同审核一要审查主体资格是否合格,二要看约定内容是否合法,三要注意合同条款是否实用,四要审查权利义务是否明确,五要看交易需求能否满足。这是审核合同的内容要注意的事项。另外,从合同内在逻辑以及合同标准化角度来看,条款内容是否存在冲突,标准模块和必备条款是否缺乏,也是合同审查中必须注意的方面。针对上述信托业务中的合同审查流程与逻辑,基于当前的人工智能技术,可以通过如下路径实现合同法律审查的各个维度:

A.关键字/词。无论合同条款是基于合同履行的时间顺序还是工作内容分类,“关键字/词”是重要的标志和训练人工智能的抓手。无论是人工浏览合同还是人工智能系统审查合同,因为法律用语具有规范性和法定刑,因此即使字、词、句、段的排列、取舍千变万化,核心字/词基本趋同,如《信托贷款合同》避不开“本金”“利息”“放款前提”“担保措施”“违约责任”等基本合同要素。因此,按照关键字/词甚至条款标题对文本内容进行识别、分类、排序具有可行性。如某些合同未采用标准化法律用语而是使用通俗表述,我们也可以通过NLP实现通俗表述到法律语言的联想和关联。

B.要素抓取。基于关键字/词,对合同中各关键要素进行抓取即成为可能。从抓取方式而言,包括:从标准化文本的特定位置抓取特定信息的方式,以及运用爬虫技术设定规则从非标准化文本中抓取信息的方式。而从抓取对象而言,往往是《合同法》所规定的合同成立的各必备要素以及在特定交易类型中对交易各方权利义务具有重要影响的特定要素。同时,在信托工作中,文本审查不仅包含对文本本身内容的审查,更包含对文本是否符合公司商业决策(表现形式一般为项目批复、风控意见书,等)的审查,因此文本审查的参考文件如项目批复甚至尽调报告也是人工智能合同审查中要素抓取的重要数据来源。

C.文本/要素对比。在人工法审或人工智能辅助法审工作中,对比工作是重要的环节,包括同一文本不同版本的对比、不同文本同一要素的对比等。对于不同文本间的要素对比,可以通过前文要素抓取的方式加以解决;而对于同一文本的对比,目前大多依赖于Word自带的基本对比功能或者Beyond Compare、Ultra Compare、Textdiff等专注于文本对比的专业软件。Word对比功能对字体、段落甚至标点符号的调整均极为敏感,且对比结果显示较为简陋,不能较好地支持信托法审在大量非标准化文本工作环境中的技术需要。而前述专业软件虽然可以解决前述问题,但对扫描版、水印版、编辑锁定版的文本往往并不支持。

鉴于此,基于OCR+专业对比功能的综合技术运用能够较好地解决目前信托合同审查中的痛点,OCR技术能够将所有显示为图像或可以转化为图像(如将编辑锁定文本通过打印扫描的方式进行采集)的合同素材高精度地转化为可编辑、易审查、能对比的文本形式,继而通过专业对比软件功能直观、简洁地将合同的重大修改或不符点展示给法审人员或者法审系统。而对于法审系统而言,运用NLP技术即可识别当次修改或者不符点是实质性修改还是语义上的措辞细节修正。

②反欺诈面签的解决方案。以平安信托的反欺诈面签APP为例,利用人脸识别、OCR、视频技术等实现可防控操作风险与道德风险的移动视频面签。

A.实现自然人身份验证。身份认证方案能够帮助识别在信托项目投中阶段线下面签环节,签字人是否为【真人】且为【本人】,从而更加快捷地完成身份核实工作,大大降低项目面签的欺诈风险。身份认证的方案流程主要是:通过OCR身份证识别获取身份证ID信息,经过活体检测判断,将捕获的人脸图片与通过身份证ID查询到的公民证件照,进行人脸对比,判断用户为【真人】且为【本人】,而对于公安系统留存照片与自然人目前面貌差异较大的,系统设有人工核验功能。

B.实现合同面签订过程记录。操作人员通过公司UM账号及密码登录进行,同时见证人号UM账号及人像会呈现在视频画面,即实现对见证人双方的记录。通过系统定位,照片及视频画面会呈现合同签署地点及时间。通过视频对合同盖章的过程进行录制。为了方便后续查询,除对所有过程进行视频进行录制外,对于重点见证环节支持拍照上传功能,比如在合同签署地址的门牌号和公司LOGO前,以及“公章用印过程”照片,要求至少2张照片留存,且照片清晰中印章要求清晰可见,包括不限于,盖章人出境照、手部动作特写照。对于合同签署页拍摄可以达到文字、印章名称能够清晰辨认。通过上述的流程实现合同签字全流程的真实记录,避免了道德风险。

(3)技术服务提供商的介绍。平安信托在投中阶段风险管理领域运用了人脸识别、OCR识别身份证件、反PS等多种技术加强风险管理能力。技术实现的过程中,在自身技术积累储备的基础上,与多家技术服务提供商进行相关技术的探讨合作。现列出各种技术服务较具代表性的提供商,供行业参考。


作者:中国信托业协会
摘自:《2018年信托业专题研究报告》

留下评论