信托专题研究:信托业务风险管理智能化研究(三)

投前流程的智能化应用与落地

1.投前智能化应用的场景模式

截至2017 年末,行业信托资产规模为26.24万亿元,其中10% 的业务为房地产信托业务,因此房地产业务无论从规模还是成熟程度来说均是比较高的,故信托应先针对较成熟的房地产业务特点开发智能化应用,通过房地产试点而后逐步推广至其他行业。

作为资金密集型行业,房地产具有投资周期长、投资规模大、区域性及政策性强等特性,由此决定了房地产类项目的风险影响因素比其他类投资项目更多,从项目自身、政策环境、市场环境、整体经济环境,到开发商自身经营能力、客户购买偏好等均会影响房地产类项目的投资收益。

一是行业与宏观经济联系紧密,受宏观经济形势及宏观调控影响较明显。由于房地产兼具消费品和资本品属性,行业发展与经济、金融和社会民生有密切关系。一方面,经济增长形势、收入水平以及就业状况都会对行业需求产生重要影响。另一方面,行业自身发展状况也在很大程度上影响着宏观经济。房地产作为政府重点管控行业,受到土地、法律、产业、财政和货币等诸多方面的调控政策影响。

二是区域分化明显,各地房地产市场存在较大差异性。我国地域辽阔,东中西各版块资源禀赋和经济发展状况差异巨大,各地房地产行业受到区位差异、经济发展水平、人口流动、土地供应以及“一城一策”等多方面因素的影响,市场分化明显,热点一二线和偏远三四线城市行业发展状况迥异。

三是资金投入量大,属典型的资本密集型和高负债行业。房地产是资金密集型行业,从房地产开发供给到产品销售,都严重依赖外部金融杠杆。在表内融资的同时,许多房企还涉及表外融资和民间融资,隐形负债进一步推高了金融杠杆,增加了行业的偿债风险。当行业或金融政策收紧时,容易遭遇资金链断裂的流动性风险。充分了解企业控股股东和实际控制人特点,尽量摸清企业实际负债情况,是房地产风险管理投前阶段的一个重点和难点。

四是业务周期和结算周期长,财务报表波动性大且存在滞后性。房地产的业务周期和结算周期较长,但财务报表按照会计准则要求仍以年度为周期编制,很难反映企业完整的业务周期和财务周期,因此报表的波动性比较大。房地产企业静态报表存在滞后性,基于企业损益表和现金流量表来分析房企的长期信用风险往往并不可靠。

五是资产具有各异性,价值评估较为复杂。各异性是指房地产市场中不可能有两宗完全相同的房地产,每一宗物业在房地产市场中的地位和价值不可能与其他物业完全一样。由于投资方式的不同,采用假设开发、收益还原、现金流量折现、市场法等估值方法不同,对同一资产的估值结果也不尽相同,最终估值往往需要进行综合比较确定。

因此鉴于房地产业务涉及信托投资的各方面,先开发房地产业务的智能化应用,通过房地产试点而后逐步推广至其他行业是比较好的一个路径。比如在机器感知应用方面,可利用人工智能技术获取多维数据,助力房地产业务的投前尽调、企业画像形成和反欺诈鉴别。在机器认知应用方面,可利用深度学习、强化学习、知识图谱等人工智能技术分析预测宏观经济、区域房地产市场走势和企业财务数据等信息,为交易对手信用评级和房地产投资决策提供参考。

2. 智能化应用的落地路线

(1)可应用的智能化技术阐述。在业务投前阶段,信托公司最核心的工作就是通过尽职调查、设定准入要求和科学的评审,来对业务风险进行有效把控。因此该阶段最能被利用的技术就是机器学习技术,利用算法和数据,使计算机在某些场景下具有认知和判断能力,替代人脑的部分作用,可以和人一起工作,协同完成某项任务。

①机器学习的定义。机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科,是当经验以数据形式存储,研究算法使得计算机可以从经验数据中学习,学习到的结果(模型)是可以对新情况(更好地)完成某个任务。根据该定义,机器学习的核心就是模型加算法,通过建设模型,利用算法来解决实际问题。

②机器学习的主流学习形式。机器学习的主流学习方式为两种,一是监督学习(supervised learning),二是非监督学习(unsupervised learning)。监督学习,即在机械学习过程中提供对错指示。一般实在是数据组中包含最终结果(0,1)。通过算法让机器自我减少误差。这一类学习主要应用于分类和预测(regression & classify)。监督学习从给定的训练数据集中学习出一个函数,当新的数据到来时,可以根据这个函数预测结果。监督学习的训练集要求是包括输入和输出,也可以说是特征和目标。训练集中的目标是由人标注的。常见的监督学习算法包括回归分析和统计分类。

非监督学习又称归纳性学习(clustering)利用K 方式(Kmeans),建立中心(centriole),通过循环和递减运算(iteration&descent)来减小误差,达到分类的目的。

③机器学习的主流算法。

A. 逻辑回归(Logistic Regression,LR)。回归分析是被用来研究一个被解释变量(Explained Variable)与一个或多个解释变量(Explanatory Variable)之间关系的统计技术。被解释变量有时也被称为因变量(Dependent Variable),与之相对应地,解释变量也被称为自变量(Independent Variable)。回归分析的意义在于通过重复抽样获得的解释变量的已知或设定值来估计或者预测被解释变量的总体均值。

Logistic 模型是一种广义的线性回归分析模型,其因变量可以是二分类,也可以是多分类的。面对一个回归或者分类问题,建立代价函数,然后通过优化方法迭代求解出最优的模型参数。由于逻辑回归主要是针对被解释变量即相应变量为分类变量的情况,其应用范围是当被解释变量为离散或者多分类情况。在金融领域内,常被使用于信用评估、资产评估、风险预警等。

B. 随机森林(Random Forest,RF)。随机森林是由美国科学家LeoBreiman 将其在1996 年提出的Bagging 集成学习理论与Ho 在1998 年提出的随机子空间方法相结合,于2001 年发表的一种机器学习算法。随机森林是一个集成学习模型,是K 个子决策树为基础的基本分类器,通过集成学习后得到的组合分类器,本质上它属于机器学习的分支——集成学习方法。当测试样本待分类时,随机森林最终的分类结构由每个子决策树分类结果进行简单投票决定,简单示意图见图5,这是简单的Bagging 思想。它包含多个由Bagging 集成学习技术训练得到的决策树,当输入待分类的样本时,最终的分类结果由单个决策树的输出结果投票决定。随机森林克服了决策树过拟合问题,对噪声和异常值有较好的容忍性,对高维数据分类问题具有良好的可扩展性和并行性。

其在经济金融中的应用十分广泛,随机森林算法可被用于很多不同的领域。在银行领域,它通常被用来检测那些比普通人更高频率使用银行服务的客户,及时偿还他们的债务,同时被用来检测那些想诈骗银行的客户。具体举例说,企业债券是我国资本市场的重要组成部分,而信用评级是企业债券市场快速发展的基石,有效的企业信用评级可以提高投资资金的回笼,规避投资风险。由于企业债券信用评级具有小样本、非线性、高维数等问题,传统的评级方法并不能很好地适用。

C. 支持向量机(Support Vector Machine,SVM)。SVM 是SVM 是建立在统计学习理论的VC 维理论和结构风险最小原理基础上的一种机器学习方法,是一种经典的判别式模型,统计学习领域的研究中应用最为广泛的机器学习模型,常用于分类事件所属类别。公司财务评估,风险评估,资产预估、金融风险欺诈等领域ab,也可以用于企业财务状况分析,舆情分析。

通俗来讲,它是一种二类分类模型,其基本模型定义为特征空间上的间隔最大的线性分类器,其学习策略便是间隔最大化,最终可转化为一个凸二次规划问题的求解。

D. 神经网络(Neural Network,NN)。深度学习是多层神经网络系统,已经成为从机器学习中独立出来的重要研究领域,有许多已经落地的成熟应用,如计算机视觉,语音识别,自然语言处理智能文本分析等,并且正在开启其在智能金融,智能医疗,智慧城市等领域的应用。在金融领域内,智能客服,用于代替人工客服,优化用户体验并提高客服效率。

神经网络学习过程是通过训练数据调整神经元之间的权值(神经细胞的突触)与每个神经元的阈值,通过最后优化训练得到的值来反映原始数据与输出数据之间的关系映射结构。由于学到的“东西”和结果解释都是蕴藏在连接值和阈值中,因此神经网络的弱解释性使其常被成“黑箱模型”。

神经网络理论知识较为晦涩难懂,但是其具有许多传统机器学习不具备的优势,例如对高维数据和海量数据的处理能力,无需人工干预地自动提取数据特征,非线性拟合能力强,更强的模拟现实场景,并模拟复杂的人工思维方式。因此深度学习在图像处理、语音识别、预测分析方面取得傲人成绩,预测证券和有价债券有效挂单报价、金融资产价格变动预测、市场指标数值波动性、优化投资组合等。具体举例来说,金融风险的预测和预警需要定量分析和定性分析相结合,它依赖于专业的金融知识,有效的金融因子选择,即依赖于金融理论和计量技术对历史数据进行分析,又依赖于及时获取并量化动态变化的金融形势和挖掘金融多方面量化后数据之间的潜在数据结构关系对未来进行判断和预测,神经网络作为实时预测的参考方法之一,其若干层网络隐含层可以有效挖掘数据潜在结构,并具有较好的前后时序关联分析能力,因此受到金融市场的热捧和研究。

(2)技术的解决方案阐述。对于金融业务来说,风险管理、风险定价是不变的核心。而建立强大的风险管理体系,绝不仅仅是做数据的搬运工,而是要将技术应用落地,进而提升金融服务效率。以平安信托为例,人工智能技术已逐渐开始在房地产投前阶段有所应用,充分构建多样化的风险因子,利用平安集团独有的广泛的数据来源,通过机器学习模型与业务规则经验的结合,实现智能行研、挖掘实际控制人相关信息、进行财务报表再造、完善风险画像和评估抵押物价值等方面的智能化。

①开展智能行研。利用大数据、人工智能和AI 模型,可广泛应用与宏观经济、房地产区域尊如研究等领域,以增加研究的广度并提高研究的效率。

宏观经济研究方面,可选取经济基本面、货币与流动性、财政等经济指标,并结合中央重要会议精神、货币和财政政策方向以及监管政策走向等其他影响因子进行综合分析,通过构建AI 智能分析模型并进行不断迭代和机器学习,自动生成宏观经济总体运行趋势、关键指标预测和政策影响等研究分析报告,最终应用于辅助公司投资策略修订等。

在房地产区域准入选择上,以目前区域可得数据为基础,依据专家经验、AI 模型等判定某年行业的4 个类别归属(优先开展,适度支持,审慎合作与全力退出)。随着样本数量的增加,行业数据分布趋于稳定,样本能提供给更多的信息供AI 模型学习,模型性能会进一步提升。

在具体房地产行业研究方面,AI 模型中可选取各城市的人口、经济总量、产业结构、收入水平等城市发展类指标和拿地、库存、投资、市场供需状况等房地产行业数据,并结合调控政策严厉程度、城市能级及区位等其他重要影响因素,最终输出各城市的市场特征、风险状况和可能的展业方式,最终应用于辅助判断该城市是否投资准入和具体项目投前决策分析之中。

②挖掘房地产企业隐形负债、实际控制人相关情况等信息数据。房地产行业属典型的资本密集型和高负债行业,企业财务杠杆相对较高,充分了解企业隐形债务情况、实际控制人品行和风格对于房地产投资决策具有重要意义。传统风控做法往往是通过长期沟通和接触客户逐步建立主观意识和判断,一定程度上缺乏客观数据的支撑,评估结果受到少数业务人员的影响较大。以大数据和AI 技术为基础的智能信贷技术,可以全方位捕捉到网上交易信息、运营商数据、社交信息等弱金融数据,通过大数据交叉验证,让客户画像更精准立体,从而助力房地产业务的投前尽调、企业画像形成和反欺诈鉴别。

例如,Facebook 的一项统计表明,一个人在互联网上点赞的数量超过60 次,人工智能系统对这个人品性的评判准确度就可以高达86%。引入AI 技术后,可以通过大数据引擎、数据清洗等方法,查询借款人(实际控制人)人民银行征信、全国工商信息网、全国法院被执行网、土地资源局网站、交通出行记录、网上消费记录、电信记录、社交记录等多维信息(可以通过网签授权解决合法性问题),并对大量历史行为形成的信息进行量化比对评判,从而对实际控制人的财务状况和品行等作出相对较为客观的评估。另外,通过文本挖掘、语音和图像识别等技术,还可以从房地产企业历史信息快照、外部数据中深入挖掘相关企业信息,为后续全面深入的信用分析提供充实且关键的数据。

③利用人工智能技术进行财务报表再造。财务报表反映了企业财务状况和经营成果,是投资者作出合理投资决策的重要前提。但企业会计人员在进行账务处理时,往往会基于各种原因对一些会计数据进行人为判断、调整及选择性披露,一旦处理不当就会在很大程度上导致财务信息失真。另外,会计处理需要根据国家会计政策、法规制度进行,但由于某些业务的特殊性,会计估计、判断与计量也会变得不是很可靠。利用决策树,神经网络和随机森林机器学习算法对企业财务报告进行再造,可以通过报表项目的勾稽关系发现可能存在虚假或错误的财务数据,也可以按照模型的设置条件将财务报表进行适当的调整和处理,为投资决策提供有效依据。

例如,可以结合现有EXCEL报表解析、PDF或纸质报表OCR技术解析,完成报表模板间转换和入库,在入库的同时针对报表逻辑关系进行自动校验,各因子指标自动计算,并给出修改建议,以实现数据结构标准化,提升财务数据质量。

对报表自动计算出的因子,按资产质量、盈利能力、偿债能力等规则进行分别归类。针对财务报表中的重点指标及行业特殊性指标,可基于上市公司公开财务数据及企业自身积累数据,结合智能模型分析功能,建立风险权重评估体系,对相关指标及财报整体健康度进行打分评估。

对于关键指标及整体财务健康出现风险预警的,可基于行业标准数据区间,结合预警风险的因子与其他因子及科目间的关联关系,对科目数据进行再造调整,提供给使用者具有可对比参考的反粉饰报表。

此外,还可以采用企业间对标方式,自动对标所在细分行业的龙头企业,并实现对标结果的可视化和数据化。

④构建企业层和项目层AI 评估模型,完善风险画像。对企业及项目进行全面风险评估是房地产项目投前的重点和核心,该环节涉及诸多评估因素和影响因子。传统金融风控的做法,需要前中后台密切配合提供大量风险评估素材,也需要评审人员的大量经验积累,但在客观上也存在各评审人员审批标准不统一的问题。如今,可通过构架AI 评估模型评判企业层和项目层存在的风险,从而进一步完善风险画像。

在企业层面,可选择资产规模、总收入、净利润、流动比率、毛利率等主要财务指标,通过机器学习等算法构建AI 模型,对金融企业主要交易对手进行风险画像并实行排序。

在项目层面,利用Logistic 回归、随机森林、人工神经网络、遗传算法等智能技术构建企业及项目评估模型,并通过不断迭代对模型进行优化,最终描绘出投资项目的风险画像。当企业提出融资需求申请时,系统将自动与该客户的行为画像进行特征比对,得出项目综合风险、项目自偿性、项目预评估结论和项目的退出预警情况,从而大大提升投前决策的效率和精准风控的水平。

⑤科学高效评估抵押物价值。对于房地产投资而言,抵押物价值评估既是投前的重要决策依据,也是投后监测的重要内容。采用市场比较法、成本分析法等科学的评估方法对抵押土地及在建工程进行及时、动态、合理、客观、公允地评估,成为金融机构加强风险管理的重要环节。

人工智能应用方面,可利用朴素贝叶斯等多种机器学习算法建立并持续优化抵押物价值评估模型,并结合估价师经验映射表,形成抵押物价值、流动性和瑕疵等全方位评估报告,从而实现对抵押物价值的科学高效估值。

(3)技术服务提供商的介绍。投前的风险评估使用的智能技术是公开的模型技术,核心是数据的质量,因此提供数据提供商供参考。


作者:中国信托业协会
摘自:《2018年信托业专题研究报告》

留下评论