信贷风控技术十分钟精通2(信贷大数据)
作者:mmseoamin日期:2024-03-04

信贷风控技术十分钟精通2(信贷大数据),第1张

目录

数据概述

金融大数据分类

银行内部大数据

银行外部大数据


对于零售信贷场景,传统数据主要指银行信贷业务办理过程中正常收集的业务数据,包括客户信息、贷款申请信息、产品信息、合同信息、借据信息以及放款后的提款信息、还款信息、逾期信息等,通常传统数据由实际的业务系统进行采集和存储。

大数据概述

除了传统数据,金融大数据应用越来越普遍,金融大数据即非传统数据,大数据与小数据的比较如下所示:

小数据大数据
收集目的小数据是为特定的、明确的分析目标,制订规划并进行收集、整理、分析的数据,数据与分析目标之间有强逻辑业务关系,小数据亦称强关联数据大数据不一定有明确的分析目标,收集数据范围更广,与业务的关联性弱,大数据亦称弱关联数据
数据结构来自不同行业领域,种类复杂,标准和格式种类单一、结构统一,一般是结构化数据一般以非结构化数据、半结构化数据为主
生命周期比较短,几乎只有几年时间,待相关问题解决之后,生命周期结束生命周期可以很长,甚至会永久保存
分析方法一般采用统计方法进行分析,更关注因果关系数据量大、结构复杂,一般通过分布式方法进行分析,并不严格追求因果关系
分析重点一般以个体为分析对象,对个体数据信息进行全方位分析,更关注信息的深度一般以群体为分析对象,处理、分析大范围、大规模的数据,更关注信息的广度

金融大数据分类

大数据分类

  • 按产生实体
    • 个体活动
    • 业务流程
    • 传感器采集数据
  • 按数据结构
    • 结构化数据
    • 半结构化数据
    • 非结构化数据
  • 按数据获取和处理方式
    • 批处理
    • 流计算

    银行内部大数据

    内部大数据是银行内部可以自行采集的大数据,

    类别说明
    内部整合整合行内多系统,形成客户的全行统一视图
    埋点采集通过APP 或网上银行埋点,进行日志采集,特别是行为数据采集
    外部爬取通过爬虫技术,对外部公开、合法的数据源进行收集,包括但不限于新闻、舆情等
    场景收集一般以群体为分析对象,处理、分析大范围、大规模的数据,更关注信息的广度

    银行内部采集大数据,需要考虑如下原则。

    • 1)须确保所采集的数据有使用价值和分析价值,对业务决策和运营有价值。要有针对性地采集,最好有较明确的应用场景,不能为了采集而采集,导致采集到的数据不能发挥作用。
    • 2)须具有一定的前瞻性,做好数据战略规划。例如,有些数据当前受限于分析条件和分析能力,暂时不能使用,需要提前进行规划和布局。
    • 3)所有大数据收集都应遵守合规性要求,确保信息安全和隐私保护。
    • 4)应具备配套的数据体系、数据治理、数据分析能力。

      银行外部大数据

      除了内部采集,通过采购或合作方式可以更直接和快速地获得外部数据

      类别说明
      金融信用信息基础数据库人行征信、百行征信、朴道征信等合法征信机构
      政府信用信息数据库

      主要包括:

      1)政府各部门的信用信息,包括司法、质检、药监、环保、税务等

      2)国家企业信用信息公示系统,如信用中国

      3)地方政府的征信信息

      随着国家建立“大数据局”,越来越多的政府数据被统一汇总并对社会有条件开放

      第三方平台数据信息主要包括电商、电信、银联、社交网络、网络行为、外部风险评分产品以及其他数据

      需要特别注意的是,对于个人征信数据,因为其特殊性,只有政府机构和合法的持牌的个人征信机构才可以采集、存储并提供对外服务。