如何建立智能投顾和大数据信用评价机器学习方法:请看《金融科技大数据风控方法介绍》

2023-08-13 06:22:38 来源:科学出版社 分享到:

金融, 通俗地讲, 就是为有钱人理财, 为缺钱人融资, 也就是投资和融资. 在第四次工业革命的背景下, 智能投顾和大数据信用评价分别是金融科技对投资和融资的赋能, 通过技术、数据和场景实现投融资能力的提升和效率的提升.

与智能投顾相比, 传统的投资顾问 (investment advisor) 是介于普通投资者与专业投资者之间的角色, 负责为缺乏专业投资能力的普通投资者提供投资建议. 随着财富的不断增长, 大众对投资顾问的需求越来越迫切, 然而个人的精力是有限的, 一位投资顾问仅能为有限的少数投资者提供咨询服务. 不同投资顾问水平也存在较大的差异. 另外, 由于利益的驱动, 即使有从业道德与法规约束, 也难以保证投资顾问的个人利益与其客户的利益不发生冲突.


(资料图片)

智能投顾 (robo advisor) 的出现就比较好地解决了上述问题. 一方面, 通过计算机模型构建的虚拟投资顾问, 能够以较低的成本为大众提供服务, 而且还可以根据每位投资者自身的特点为其提供个性化的投资建议; 另一方面, 计算机模型能够不带感情地为所有人工作, 避免了投资顾问与客户之间的利益冲突. 智能投顾率先在美国兴起, 近年来出现的领先平台包括 Wealthfront、Betterment、FutureAdvisor 等. 随着互联网金融在中国的迅猛发展, 国内的智能投顾也如雨后春笋般崛起, 典型的有嘉实基金的嘉贝智投、招商银行的摩羯智投、京东金融的京东智 投等.

金融的根本是信用, 信用 (风险) 建设是一切金融产品定价、风险管理和投资管理的基础. 传统的金融征信在辅助金融授信决策、防范信用风险和提升金融获得性等方面发挥着关键作用, 但是传统信用评价方式基于大量结构化的信贷历史数据, 对于大部分小微企业、个人消费以及农村金融等国民经济主战场相关的征信主体, 由于缺乏供信用评价的历史数据, 无法覆盖, 因此无法对其提供相应的金融服务.

数字技术的发展为解决这一难题提供了方案, 大数据信用评价是指通过对海量的、多样化的、实时的数据进行分析和挖掘, 并运用机器学习算法重新设计征信 评价模型, 多维度对信用主体的 (全部信息) “画像” (简记为 “Hologram”), 呈现信用主体的违约率和信用状况的征信方式. 大数据征信具备覆盖人群广泛、信息维度多元、应用场景丰富和信用评估全面四个创新特点. 金融机构可以利用机器学习的方法, 以行为大数据替代抵押资产, 进行信用风险评估和防控. 大数据风控已在全球范围内被金融机构广泛关注, 正在引发金融领域的一场革命 (参见姚前等, 2020; Yuan et al., 2019; 袁先智, 2022 等文献).

随着大数据和人工智能的发展, 金融风险建模方法, 正在从传统的统计方法到被数据驱动的机器学习方法代替. 与统计模型相比, 机器学习模型不过于关注模型的结构, 而更多地聚焦于如何通过多维度数据提高预测精度.

虽然机器学习算法如支持向量机、神经网络等在金融风险建模中已有不少研究, 但这些算法都属于弱学习算法. Kearns 和 Valian (1989) 提出了将多个简单的弱学习算法 “提升” 为 强学习算法的集成学习方法. 同时, 集成梯度提升树 (gradient boosting decision tree, GBDT) 算法的原始想法由 Friedman (2001) 提出, 是一种基于梯度提升的集成决策树算法, 因其泛化能力和在特征选择方面的优势得到广泛应用. Chen 和 Guestrin (2016) 对 GBDT 进行了进一步提升和优化, 提出了基于极度梯度提升的集成学习算法 (XGBoost). 目前, XGBoost 算法因其更高效的学习能力一出现就备受业界青睐, 成为机器学习研究的热点. 与深度学习相比, XGBoost 算法对样本量和特征数据类型要求没那么苛刻, 尤其适用于金融风险建模.

然而复杂机器学习模型带来了较高的预测精度, 但是越复杂的模型, 可解释性就越差, 这让模型的实际应用价值大打折扣. 为了解释复杂的机器学习模型, Štrumbelj 和 Kononenko(2014) 运用灵敏度分析方法解释模型中各变量之间的交互和冗余. Datta 等 (2016) 采用定量输入影响测量方法分析输入的各个变量对输出结果的影响程度. Ribeiro 等 (2016) 提出了一种在局部学习可解释模型的技术 LIME, 该技术可用于解释任何分类器的预测结果. Lundberg 和 Lee (2017) 阐述 了 SHAP 框架的解释性原理, 证明了 SHAP 评估框架具有稳定性、一致性和合理 性的优点; 同时他们进一步对比了深度学习场景中其他的诸如 DeepLIFT、LIME、 Layer-Wise Relevance Propagation 等算法和 SHAP 值的效果, 发现 SHAP 值更符合人们的理解和判断.

《金融科技大数据风控方法介绍——解释性、隐私保护与数据安全》聚焦于逻辑回归模型这个金融行业的风险建模标准方法和作为机器学习 在金融行业前沿应用的集成学习模型, 通过对比和讨论建立智能投顾和大数据信用评价的机器学习方法与金融科技学科相关的部分核心内容.

对智能投顾和大数据信用评价的机器学习方法感兴趣的读者,具体情况可以参见李华、袁先智、赵建彬编写的《金融科技大数据风控方法介绍——解释性、隐私保护与数据安全》一书.

本文选自《金融科技大数据风控方法介绍——解释性、隐私保护与数据安全》(科学出版社,2023.6)绪论.

好书

内容简介

本书是在大数据框架下, 全面介绍金融科技在处理真实场景金融问题时 需要掌握的最重要的几类机器学习方法, 并将重点放在实施过程中需要用到的特征提取、可解释性、隐私保护与数据安全共享等相关内容的讨论上.

本书内容分三部分: 第一部分由 1~ 6 章组成, 主要讲常规情况下, 机器学习在金融场景特别是大数据风控中的建模应用; 第二部分由第 7 章和第 8 章组成, 主要讲在数据隐私保护和安全要求下, 机器学习如何进行大数据风控建模; 第三部分由 9~16 章组成, 主要讲如何基于吉布斯抽样算法建立特征提取的理论 和标准框架及其在包含投资和融资等 7 个不同金融场景中的应用.

本书具有五个特点:一是面向应用需求, 介绍机器学习在金融场景特别是大数据风控中的建模应用; 二是紧扣应用, 聚焦智能投顾和大数据信用评价两大领域; 三是针对算法, 重点讲逻辑回归和集成学习建模; 四是针对数据安全和隐私保护问题, 建立密文机器学习模型, 实现数据共享; 五是针对特征工程, 基于吉布斯抽样算法, 建立支持非线性特征提取的理论和标准框架.

读者对象

本书既可作为高等院校金融科技相关课程的通用专业基础教材, 也可作 为金融科技培训用书, 还可作为广大金融科技爱好者和金融科技软件开发人员自学金融科技的用书以及金融科技监管部门的专业参考资料.

目 录

向下滑动查看所有内容

正文抢先看

向下滑动查看所有内容

科学出版社数学教育

一起阅读科学!

科学出版社│微信ID:sciencepress-cspm

专业品质 学术价值

原创好读 科学品味

科学出版社视频号

硬核有料 视听科学

标签:

如何建立智能投顾和大数据信用评价机器学习方法:请看《金融科技大数据风控方法介绍》

来源:科学出版社 2023-08-13 06:22:38

乌军被杀得差不多了,俄军开始收地了:美国承认乌方正迎来困难期

来源:互联网 2023-08-13 04:30:30

小米MIX Fold 3:影像革命!

来源:绿头怪科技 2023-08-13 01:19:45

广东省1459万亩晚稻栽插约9成 新品种新技术广泛使用

来源:央视网 2023-08-12 22:30:43

百天宝宝礼物指南如何优雅送出心意令人惊艳的选择

来源:礼物网 2023-08-12 21:57:26

丽水:“邻域救”让急救效率再升级

来源:杭州网 2023-08-12 20:42:30

二氯异氢尿酸钠商品报价动态(2023-08-12)

来源:生意社 2023-08-12 19:28:55

社保滞纳金怎么计算

来源:网友分享 2023-08-12 18:31:01

莲花楼:原来,这才是李莲花折断少师剑,跳下山崖的真相!

来源:腾讯网 2023-08-12 17:35:28

2023惠州技校排名前十名单 惠州口碑最好的技校

来源:初三网 2023-08-12 16:34:58

氢碘酸商品报价动态(2023-08-12)

来源:生意社 2023-08-12 16:04:10

8.12:7月重磅数据出炉,不及预期,A股调整目标位解析

来源:老船长118 2023-08-12 15:10:15

邓亚萍辟谣!

来源:中国新闻网 2023-08-12 14:04:08

暴跌91%!昔日3000亿独角兽崩了,日本首富孙正义血亏

来源:腾讯网 2023-08-12 12:43:10

美国白宫:伊朗已将5名在押美国公民转移出狱

来源:华夏经纬网 2023-08-12 11:24:29

浓烟滚滚!院内汽车着火猛烈燃烧 烧得只剩空架……

来源:光明网 2023-08-12 10:58:52

山东章丘高官寨:“小甜瓜”富了产业“甜”了日子

来源:央广网 2023-08-12 10:15:59

趣味科普进社区,多彩活动点燃孩子们对科学的热情

来源:腾讯网 2023-08-12 09:24:38

武汉大学新疆录取分数线 武汉大学新疆招生人数多少

来源:中国招生网 2023-08-12 08:22:22

深圳首店经济“加速跑” 上半年新开121家品牌店

来源:南方日报 2023-08-12 08:15:52

会场家怎么合作 会场家

来源:互联网 2023-08-12 07:06:00

“前海港企贷”正式落地 已有3家前海港企成功办理

来源:深圳商报 2023-08-12 06:05:15

富可视X3C(关于富可视X3C介绍)

来源:互联网 2023-08-12 03:15:48

中国体育彩票7星彩游戏开始派奖啦

来源:三秦都市报 2023-08-12 01:04:57

常德市第一中医医院产科:以“卓越”赋能 当母婴健康的“守护神”

来源:红网 2023-08-11 22:47:47

定州市安家庄村“积分超市”正式启动

来源:冀云客户端 2023-08-11 21:57:14

述评:“Z世代”台青为何青睐“登陆”实习?

来源:中国新闻网 2023-08-11 21:09:18

双胞胎女孩子小名可爱洋气的(双胞胎女孩子)

来源:互联网 2023-08-11 20:28:45

房贷5.8转3.8怎么转?一文简单分析

来源:希财网 2023-08-11 19:36:52

地产客户计提减值5.7亿后蒙娜丽莎再"踩雷”,称对碧桂园业务将加强风险管控

来源:搜狐财经 2023-08-11 19:03:30

Copyright   2015-2022 时代知识产权网 版权所有  备案号:   联系邮箱: 514 676 113@qq.com