如何成为一个数据分析师?需要具备哪些技能,恒丰银行案例:基于大数据技术的信用风险预警系统

dsjza3a4

时间 2025年2月20日 预览 31

专业大数据挖掘分析——助力小微企业发现价值

电话+V: 152079-09430 ,欢迎咨询恒丰银行大数据技术岗怎么样知乎招聘,[大数据挖掘与分析],[大数据应用场景建设],[大数据接口共享],[大数据去除冗余],[大数据精准推送],[大数据广告价值],[助力小微企业成长更上台阶]

一、如何成为一个数据分析师?需要具备哪些技能

数据分析师的职位要求:

  1、计算机、统计学、数学等相关专业本科及以上学历;

  2、具有深厚的统计学、数据挖掘知识,熟悉数据仓库和数据挖掘的相关技术,能够熟练地使用SQL;

  3、三年以上具有海量数据挖掘、分析相关项目实施的工作经验,参与过较完整的数据采集、整理、分析和建模工作;

  4、对商业和业务逻辑敏感,熟悉传统行业数据挖掘背景、了解市场特点及用户需求,有互联网相关行业背景,有网站用户行为研究和文本挖掘经验尤佳;

  5、具备良好的逻辑分析能力、组织沟通能力和团队精神;

  6、富有创新精神,充满激情,乐于接受挑战。

  1、态度严谨负责

  严谨负责是数据分析师的必备素质之一,只有本着严谨负责的态度,才能保证数据的客观、准确。在企业里,数据分析师可以说是企业的医生,他们通过对企业运营数据的分析,为企业寻找症结及问题。一名合格的数据分析师,应具有严谨、负责的态度,保持中立立场,客观评价企业发展过程中存在的问题,为决策层提供有效的参考依据;不应受其他因素影响而更改数据,隐瞒企业存在的问题,这样做对企业发展是非常不利的,甚至会造成严重的后果。而且,对数据分析师自身来说,也是前途尽毁,从此以后所做的数据分析结果都将受到质疑,因为你已经不再是可信赖的人,在同事、领导、客户面前已经失去了信任。所以,作为一名数据分析师就必须持有严谨负责的态度,这也是最基本的职业道德。

  2、好奇心强烈

  好奇心人皆有之,但是作为数据分析师,这份好奇心就应该更强烈,要积极主动地发现和挖掘隐藏在数据内部的真相。在数据分析师的脑子里,应该充满着无数个“为什么”,为什么是这样的结果,为什么不是那样的结果,导致这个结果的原因是什么,为什么结果不是预期的那样等等。这一系列问题都要在进行数据分析时提出来,并且通过数据分析,给自己一个满意的答案。越是优秀的数据分析师,好奇心也越不容易满足,回答了一个问题,又会抛出一个新的问题,继续研究下去。只有拥有了这样一种刨根问底的精神,才会对数据和结论保持敏感,继而顺藤摸瓜,找出数据背后的真相。

  3、逻辑思维清晰

  除了一颗探索真相的好奇心,数据分析师还需要具备缜密的思维和清晰的逻辑推理能力。我记得有位大师说过:结构为王。何谓结构,结构就是我们常说的逻辑,不论说话还是写文章,都要有条理,有目的,不可眉毛胡子一把抓,不分主次。

  通常从事数据分析时所面对的商业问题都是较为复杂的,我们要考虑错综复杂的成因,分析所面对的各种复杂的环境因素,并在若干发展可能性中选择一个最优的方向。这就需要我们对事实有足够的了解,同时也需要我们能真正理清问题的整体以及局部的结构,在深度思考后,理清结构中相互的逻辑关系,只有这样才能真正客观地、科学地找到商业问题的答案。

  4、擅长模仿

  在做数据分析时,有自己的想法固然重要,但是“前车之鉴”也是非常有必要学习的,它能帮助数据分析师迅速地成长,因此,模仿是快速提高学习成果的有效方法。这里说的模仿主要是参考他人优秀的分析思路和方法,而并不是说直接“照搬”。成功的模仿需要领会他人方法精髓,理解其分析原理,透过表面达到实质。万变不离其宗,要善于将这些精华转化为自己的知识,否则,只能是“一直在模仿,从未超越过”。

  5、勇于创新

  通过模仿可以借鉴他人的成功经验,但模仿的时间不宜太长,并且建议每次模仿后都要进行总结,提出可以改进的地方,甚至要有所创新。创新是一个优秀数据分析师应具备的精神,只有不断的创新,才能提高自己的分析水平,使自己站在更高的角度来分析问题,为整个研究领域乃至社会带来更多的价值。现在的分析方法和研究课题千变万化,墨守成规是无法很好地解决所面临的新问题的。

技能要求:

1、懂业务。

从事数据分析工作的前提就会需要懂业务,即熟悉行业知识、公司业务及流程,最好有自己独到的见解,若脱离行业认知和公司业务背景,分析的结果只会是脱了线的风筝,没有太大的使用价值。

2、懂管理。

一方面是搭建数据分析框架的要求,比如确定分析思路就需要用到营销、管理等理论知识来指导,如果不熟悉管理理论,就很难搭建数据分析的框架,后续的数据分析也很难进行。另一方面的作用是针对数据分析结论提出有指导意义的分析建议。

3、懂分析。

指掌握数据分析基本原理与一些有效的数据分析方法,并能灵活运用到实践工作中,以便有效的开展数据分析。基本的分析方法有:对比分析法、分组分析法、交叉分析法、结构分析法、漏斗图分析法、综合评价分析法、因素分析法、矩阵关联分析法等。高级的分析方法有:相关分析法、回归分析法、聚类分析法、判别分析法、主成分分析法、因子分析法、对应分析法、时间序列等。

4、懂工具。

指掌握数据分析相关的常用工具。数据分析方法是理论,而数据分析工具就是实现数据分析方法理论的工具,面对越来越庞大的数据,我们不能依靠计算器进行分析,必须依靠强大的数据分析工具帮我们完成数据分析工作。

5、懂设计。

二、恒丰银行在大数据应用下的银行客户管理与传统客户管理方式有什么_百...

您问的是:恒丰银行在大数据应用下的银行客户管理与传统客户管理方式有什么不同,二者的数据化决策、实时反馈、自动化运营不同。

1、数据化决策:恒丰银行通过基于大数据的数据分析和数据挖掘技术,实现了数据化决策。在客户管理中,恒丰银行利用大数据分析客户的行为、兴趣、需求、偏好等信息,通过客户画像、分群等方式精细化运营客户,制定个性化的销售策略,提升客户体验。

2、实时反馈:恒丰银行在大数据应用下,通过实时跟踪客户行为和反馈,及时了解客户的需求和反馈,对客户提供更快捷、更个性化的服务,以及更准确的销售建议。

恒丰银行案例:基于大数据技术的信用风险预警系统

原创2017-06-2612:57·数据猿

本篇案例为数据猿推出的大型“金融大数据主题策划”活动(查看详情)第一部分的系列案例/征文;感谢恒丰银行的投递

作为整体活动的第二部分,2017年6月29日,由数据猿主办,上海金融行业信息协会、互联网普惠金融研究院联合主办,中国信息通信研究院、大数据发展促进委员会、上海大数据联盟、首席数据官联盟、中国大数据技术与应用联盟协办的《「数据猿·超声波」之金融科技·商业价值探索高峰论坛》还将在上海隆重举办【论坛详情丨上届回顾】

在论坛现场,也将颁发“技术创新奖”、“应用创新奖”、“最佳实践奖”、“优秀案例奖”四大类案例奖


来源:数据猿丨投递:恒丰银行

恒丰银行近年来陆续推出了信贷工厂、消费金融、供应链金融等一系列网贷、平台贷业务,为不同行业、不同规模的客户提供了丰富的信贷类产品。业务规模快速发展的同时,如何快速、全面识别、监测、防范客户信用风险,成为了全行风险管理领域最为重要的工作之一。对此,恒丰银行积极筹划,在制度层面制定全面风险管理体系,明确各条线、各部门的风控职责,筑牢风险管理的三道防线之外,提出通过运用大数据技术构建信用风险预警系统,加强风险信息归集、监测、审查的准确性、及时性,强化风险预测能力。

本案例将分享恒丰银行在风险控制过程中如何利用大数据技术构建信用风险预警系统解决风控与成本约束、处理效率和用户体验间的矛盾,以及在系统建设过程中遇到的挑战、积累的经验及未来的规划。

周期/节奏

2015年9月,启动基于大数据技术的信用风险预警系统建设;

2016年5月,企贷风险防控体系初步建成,支撑恒信快贷业务开展;

2016年8月,个贷风险防控体系初步建成,支撑现金贷业务开展;

2016年11月,基于担保圈的客户违约预测模型投产上线,将贷后风险预警、防控前移;

2017年1月,在完善已接入的内外部数据基础上,进一步接入统计局数据、海关进出口数据、金融市场数据及企业资质、评级、税务,个人学历、车辆等外部数据,通过引入知识图谱、机器学习、自然语言处理等技术及专业化决策引擎工具构建丰富的风控模型,并打通与信贷系统、贷后系统、押品系统等的联动,构建完整的大数据风险防控体系。

客户名称/所属分类

恒丰银行/风控

任务/目标

针对恒丰银行的线上线下业务协同发展战略,风控部门提出通过大数据技术优先支持新发展的线上业务,待线上业务风控成熟后逐步应用于传统信贷业务;同时同步研究利用大数据技术做好风险分类研究、风险实时监测及风险预测等工作。

对于恒丰银行的线上业务风控,包括网贷和平台贷等,业务部门提出:

一、系统能够快速整合客户信息,全面、准确识别客户及所提供担保的风险,以快速响应提升用户体验;

二、客户风险全流程监测,包括贷前风险提示、贷中贷后风险监测及预警,拦截高风险客户,及时触发风险缓释工具的启用;

三、监测各主流新闻媒体、论坛、自媒体,运用文本分析技术监测、识别涉及我行客户负面舆情,及时、主动化解风险,促进业务良性发展;

四、支持风险防控体系的快速更新、快速部署,适应当前客户风险显现的多样性、易变性、复杂性;

五、支持风控模型的回测、验证,满足对历史风控模型的评价、新模型的验证及潜在客户风险批量评估、筛选。

挑战

大数据时代,风控被认为是大数据技术在银行业最有前景的应用场景之一。同大多数商业银行一样,恒丰银行也希望通过大数据技术加强信贷业务,尤其是线上信贷业务的风险防控,以满足平台贷等业务规模骤升过程中的自动化风险检测与审批需求。然而在具体实施过程中也依然遇到一系列的困难和挑战,包括观念的转变、资源的短缺等。

(一)业务模式的转变,新的风控理念尚未成熟

数字化银行业务是典型的适应互联网金融环境诞生的金融产品,其业务模式与传统业务有较大不同,且仍处于快速变化的状态,对应的内外部相关监管规则亦处于逐步完善之中。如何在快速推进新业务与严格遵守传统监管要求之间求得平衡,是业务经营方、监管方主要考虑的问题;大数据风控技术是逐步替代传统风控手段还只是作为增强手段,各方的风控理念尚未完全达成一致。业务模式的不确定、监管规则的不明晰,大数据风控的深入应用仍处于探索过程中。

(二)认知的偏见,大数据风控正名尚需时日

在银行传统风控人员的认知中,现有线下信贷业务风控手段相对比较成熟,业务使用广泛,已能够满足内外部监管的要求,只要严格遵守则基本无需承担风控不力的责任;而使用大数据技术风控,现有数据的完备性、准确性存在一定的不足,风控模型效力仍有待时间验证,亦存在风险遗漏的情况,缺乏传统风控手段的“可靠性”,对大数据风控技术的使用持有一定的怀疑态度。

而事实上不管是传统风控手段,还是大数据风控技术都只能最大限度地降低风险而非杜绝风险,风控的效果指的是概率上的优劣。现如今互联网金融模式的快速发展,需要我们不断创新风控思路,在不断试错、不断改进过程中完善风控体系,而不能抱残守缺、墨守传统风控理念,停滞不前。此外,客户信息的完备性、准确性永远是一个相对概念,没有绝对完整、准确的客户数据,只能是多方位完善、选择性取舍。

(三)数据极度缺乏,数据接入困难超预期

当前金融产品日益多样化,客户准入门槛逐步下沉,商业银行对优质客户的争夺愈演愈烈;而另一面,客户对商业银行产品越来越挑剔,对授信金额、审批速度的要求也越来越高。为了能够在这场争夺战中占得先机,必须通过加强对客户行内外信息的整合,全面、快速、准确识别客户风险,迅速做出授信决策。客户行内数据在大数据平台构建过程中得到解决,而外部数据在接入过程中则遇到较大困难:

首先,外部数据质量参差不齐、数据效用较难评估,需要较长时间进行沟通、分析、确认;

其次,对于线上常见的平台贷等业务,由于银行不直接面对客户,传统的埋点等风控数据采集方法难以施行。

(四)案例库的缺少,大数据风控模型优势难以快速体现

对于很多中小型银行,因业务规模及信息系统建设滞后等原因,不良授信的案例库要么缺失、要么案例较少,尤其是对于线上的互金等新生业务,不良案例库更是少之又少。由于案例库的缺少,目前风头正劲的机器学习等新的风控技术难有用武之地,大数据风控技术、模型的效果难以得到充分的验证,目前基本只能通过对传统业务客户的历史逾欠情况进行分析,以此来评价风控模型效果。

实施过程/解决方案

恒丰银行信用风险预警系统主要分为基础数据层、基础技术服务层和应用层,其总体架构如图一所示。

恒丰银行大数据技术岗怎么样知乎招聘

(一)基础数据层:风控系统数据引入

基础数据层主要负责行内行外数据接入、存储,通过自建爬虫体系、购买外部服务数据API或文件批量推送服务实现各类数据的接入,形成风控专用的风险数据集市,如图二所示。根据获取权限不同,风控数据可分为四类:

第一类为行内数据,主要包括企业和个人的基础信息、授用信信息、还款信息、账户信息及各类黑、灰名单等,均为结构化数据,可直接从行内的大数据平台接入,数据准确、权威,但覆盖面相对较少;

第二类为用户授权数据,包括企信征信、个人征信、个人学历、个人车辆、电商交易记录等数据,主要通过第三方提供的API接口接入;

第三类为第三方公司数据,包括工商、司法、手机验真等,这部分数据主要以API接口获取为主,以文本文件推送为辅;

第四类是来自于互联网的各类免费数据,包括企业的评级、资质、招聘、投融资、市场价格、新闻、突发等数据,个人的设备指纹、微博等数据,这类数据主要通过爬虫获取为主,文本文件推送、接口接入为辅。

图二外部数据接入方式

在数据接入节奏方面,对于行内数据,主要以“数据驱动为主、业务驱动为辅”的方式,提前将可能用到的数据全部接入进来;对于行外数据,则在充分评估数据效用、接入周期、接入技术难度、更新频率等各种因素后,以“业务驱动为主、数据驱动为辅;急用先行、分步接入”的方式逐步接入。

(二)基础技术服务层:风控系统数据处理

基础技术服务层主要对基础数据层接入的数据进行深加工,而在基础数据层接入的数据以结构化数据为主,如授用信信息、工商信息等;以非结构化数据为辅,如财经新闻数据、微博数据等。

对于接入的这些数据,需要进行三个层次的整合加工,如图三所示:

一是将非结构化数据结构化并进行ETL处理,通过文本解析、正则表达式、语义网等技术抽取关注的要素信息,如互联网上政府、行业协会公示的企业资质信息,评级公司公开的企业评级信息等;

二是根据应用需要对文本信息进行分词、实体抽取、自动摘要、关键词提取、重复检测、正负面极性判断、语义分析、文本分类等标记及基础指标加工等处理,这是数据处理过程中最核心部分;

三是基于结构化、标记后文本及基础指标,借助文本挖掘、MIDAS、R等技术或工具构建形成客户统一风险视图,如客户授用信指标、还款情况、涉诉情况、经营情况、舆情信息,并通过关系图谱、投资图谱等各种数据的进一步关系强化,进而形成完整的企业/个人知识图谱等。

图三数据处理流程

(三)应用服务层:风控系统价值展现

借助大数据平台接入及经过技术服务层深加工之后的各类数据,将通过应用服务层直接或与其他关联系统交互的方式发挥风险控制作用。

一是单笔业务的风险防控,涵盖授信业务的贷前、贷中、贷后全生命周期,主要由用户发起,属于被动式风控方式。

贷前阶段,在获取客户基本信息之后,风控平台将从基础数据及基础技术服务层获取客户的各类信息,包括各类黑名单命中情况、工商信息、财务信息、舆情信息、股东信息、投资情况等各类关系图谱、投资图谱等信息,形成一份完整的客户统一风险视图及风险扫描报告,客户经理可基于此进行贷前分析及报告撰写。图四为客户风险一键扫描视图。

贷中阶段,在获取客户授权以后,风控平台将接入征信、学历、车辆等各类数据,并结合基于大数据征信形成的A卡由决策引擎给定客户审批建议、核算建议授信额度等。

贷后阶段,根据贷后风控策略定期监测已授信客户风险信号,包括客户履约情况、担保情况、偿债能力变化情况等,协同贷后系统、风险缓释平台进行风险处置。

在单笔业务场景下,基于大数据技术的决策引擎,其规则的生成和配置与传统依据统计分析生成有所不同,在此背景下,组成规则的指标可引入机器学习等算法,通过特征工程选择关联性强的特征,同时考虑到风控面临的监管的严肃性、审慎性,一般选取解释性较好的特征加入风控规则。另外,基于大数据的风控体系,在授信的全生命周期均能审查客户的各类风险信息,能较好得规避因客户经理隐瞒客户不良信息的道德风险。

图四客户风险综合视

二是批量业务的风险防控,主要应用于贷前调查和贷后风险监测、风险缓释。当银行研发一款新产品时,通常需要确定目标群体并评估该群体状况、市场规模及业务前景,此时可通过风控系统对目标客群进行批量风险扫描,快速评估目标客户风险状况,预测新业务发展前景,及时对新业务规划、目标进行相应调整;贷后阶段主要结合客户授信偿还情况、担保情况及其他风险因素变动情况触发贷后进行风险处置及押品系统、风险缓释系统进行担保物的核查、处置。

三是风险的监测、追踪、预警、预测,主要通过构建行业发展景气指数,并从行业、地域维度分析风险暴发情况,辅助业务规划及相关有权部门调整高风险行业和地域的贷款投向;通过持续追踪国家产业政策的变化,各部门、各地方政府相应细则的落实,协助分支机构紧盯国家、中央层面动向,合理安排信贷投向,如图五所示;通过监测各类突发事件,应用文本挖掘及知识图谱技术快速识别风险类别、风险主体、发生地域等,通知相关部门及时评估事发客户及下游客户风险,启动资产保全措施,及时挽回损失。在该类应用过程中,将对各类风险进行分类、分级,并根据应用系统及不同用户进行差异化消息推送服务,推送方式包括系统消息、邮件及短信等。

图五重大/突发事件追踪

同时,基于海量文本舆情数据的全行客户负面舆情监测功能,更是为各级经营主体及风险管理部门主动应对突发事件,及时采取风险化解措施提供了有力的管理工具,本功能通过Kafka/Akka技术实现信息的推送和分发,如图六所示。

图六实时舆情监测架构

结果/效果总结

恒丰银行信用风险预警系统自投产上线以来,经过模型的不断扩充完善、技术的不断升级、系统性能的不断优化,并经过多个平台贷、网贷业务系统近一年时间的检验,风控能力逐步提升,在客户风险识别效率、准确率、成本控制等方面较传统风控手段有了大幅提高。

(一)新增信贷资产质量大幅提升。以某平台贷为例,自风控系统启用以来,其新增授信业务逾欠率控制在1%以内,且呈逐渐降低态势,不良率更是大幅低于全行同类业务,效果十分显著;

(二)新增的网贷、平台贷授信业务发放效率显著提升。传统贷款类授信业务发放周期为数天至数周甚至更长时间,而在不降低风险防控水平的情况下,基于大数据风控技术的航信票贷、恒信快贷等业务产品却实现了24小时、8小时放款,即将投放市场的另一款零售产品将实现准实时放款,授信审批效率和客户体验同步大幅提升;

(三)新增业务的客户贷前调查成本大幅降低。在以往的风控模式下,客户经理逐一收集客户各类信息,逐一审核并编制调查报告,成本巨大,这也是众多银行开展传统小额贷款不积极、不主动的原因之一;而在大数据技术风控模式之下,新增信贷业务采取预先收集意向客户简要信息,经风控系统的黑名单及各类风险的排查后(不含需客户授权的人行征信等风控过滤),初步确立可进一步发展的客户名单。经对某平台贷的数据统计,风险预审过程可综合节约近80%的人力成本,同时基于该统计数据调整的业务发展规划更为科学、符合实际。

企业介绍:

恒丰银行股份有限公司是12家全国性股份制商业银行之一,注册地烟台。

近年来,恒丰银行稳健快速发展。截至2016年末,恒丰银行资产规模已突破1.2万亿元,是2013年末的1.6倍;各项存款余额7682亿元,各项贷款余额4252亿元,均比2013年末翻了一番。2014年至2016年累计利润总额312.17亿元,这三年的累计利润总额为以往26年的累计利润总额;服务组织架构不断完善,分支机构数306家,是2013年末的两倍。

近年来,恒丰银行屡获荣誉。在英国《银行家》杂志发布的“2016全球银行1000强”榜单中排名第143位;在香港中文大学发布的《亚洲银行竞争力研究报告》中位列亚洲银行业第5位;在中国银行业协会发布的“商业银行稳健发展能力‘陀螺(GYROSCOPE)评价体系’”中,综合能力排名位列全国性商业银行第7位,全国性股份制商业银行前三;荣获“2016老百姓最喜欢的股份制商业银行”第二名、“2016年互联网金融创新银行奖”、“2016年最佳网上银行安全奖”、“2016年度创新中国特别奖”等多项荣誉。

作为一家肇始于孔孟之乡山东的全国性股份制商业银行,恒丰银行秉承“恒必成德致丰”的核心价值观,践行“1112·5556”工程,即:一个愿景(打造“精品银行、全能银行、百年银行”)、一个文化(打造“开放、创新、竞争、协同、守规、执行”的“狼兔文化”)、一个目标(五年目标是以客户为中心,以创新为驱动,高效协同,弯道超车,五年内进入全国性股份制商业银行第二方阵;十年目标是要打造一个国际金融控股集团)、两个策略(“植根鲁苏,深耕成渝,拓展中部六省和海西,进军京沪广深”的区域策略和“四轮驱动、两翼齐飞”的经营策略)、“五化”强行战略(国际化、信息化、精细化、科技化、人才化)、“五力”工作方针(忠诚力、执行力、目标力、风险经营力、恒久发展力)、五个引领(人才引领、科技引领、创新引领、效率引领、效益引领)、六大综合能力(价值分析能力、风险鉴别能力、定价能力、创新能力、调研能力、学习能力);大力实施“12345”行动纲领,即:“1”是做金融综合解决方案的提供商,“2”是金融云平台和大数据平台,“3”是数字银行、交易银行、银行的银行,“4”是龙头金融、平台金融、家庭金融、O2O金融等四大金融创新业务模式,“5”是投行、资管、平台、人才盘点和以“OneBank”为核心的绩效评价体系等五大战略落地工具,致力于做“知识和科技的传播者、渠道和平台的建设者、金融综合解决方案的提供者”,力求打造令人瞩目、受人尊敬的商业银行,为客户和社会提供效率最高、体验最佳的综合金融服务。


欢迎更多大数据企业、大数据爱好者投稿数据猿,来稿请直接投递至:tougao@datayuan.cn

【GSFAI BANK FINANCING】尊享直接对接老板

电话+V: 152079-09430

专注于为大数据运营推广及打包交易配套流程服务方案。为企业及个人客户提供高性价比的数据确权、数交所交易及应用场景内外共享解决方案,解决小微企业难题

恒丰银行大数据技术岗怎么样知乎招聘
相关新闻相关新闻
相关广告相关广告
广告图
Copyright2025未知推广科技
拨打电话拨打电话
Copyright2025未知推广科技