什么样的人适合做数据分析师?——数据分析师
更新时间: 2019-10-09

  【摘要】在《我眼里的数据分析师》一文中,笔者曾提出过这样一个等式去表征数据分析师应具备的三种核心能力:数据分析师=数据(处理)+分析(问题)+(分享沟通)师那么,这三种核心能力的具体表现是什么呢?或者说数据分析师的入门条件是什么呢?又或者说什么样的人适合做数据分析师?

  若是想要成为一名合格的数据分析师,首先你应该具备的是“不屈不挠探究真理”的精神。作为数据分析工作的源动力,它能推动你不断地攻克遇到的难题,逐渐地接近问题的真相。

  在实际工作中,由于各种原因,你需要面对的数据往往并不会像你在学习时所采用的标准数据集那样。以UCI机器学习库鸢尾花数据集为例(访问地址为,标准数据集一般会维护有良好的文档,对于数据集的信息背景、数据质量、属性意义、数据类型等分析时需要解决的关键问题都有清楚地说明。而你所遇到的却很可能是业务方同事无法准确描述待解决的问题、没有可用的数据、数据的质量糟糕无比等等情况。不要抱怨,解决这些难题正是数据分析师对于企业的价值所在!

  很难想象,如果你不具备“不屈不挠探究真理”的精神,你怎么可能借助所有可以调动的资源,去打破“业务墙”、“部门墙”、“数据墙”等阻碍;再通过确认业务方的真实需求、并为之收集各种来源的数据、绞尽脑汁地清洗数据、用尽浑身解数探索数据间的关系、将所得的结论以最容易理解的方式反馈给业务方,最终完成数据分析工作。

  若是想要成为一名合格的数据分析师,其次你应该具备的是“数据思维”。数据思维是什么呢?对于数据分析师而言,数据思维好比是文人骚客的才气、马良手中的神笔,能给予诗篇思想、赋予画作灵性。具备优秀数据思维的人,能够在数据分析工作中事半功倍、游刃有余。

  所谓数据思维,是一种尊重数据事实、用数据做推理演化的思考能力。其过程一般是先将“业务问题”转化为“数据问题”,将不明确的事物量化,再基于数据去分析、论证、解决“数据问题”,得到“数据解答”,最后再将“数据解答”还原成“业务对策”。数据思维并不是仅仅取决于个人天赋,更多地是靠在业务实践中不断地积累经验、不断地总结锤炼而出的能力。数据思维在生活中随处可见,只是未被仔细发现。下面用一个虚构故事《呆呆创业路》来说明数据思维在业务分析中的作用。公元9102年,呆呆从计院(计算机科学与技术学院)毕业了。这一年,恰逢全球金融大危机,互联网公司成片地倒闭,呆呆之前拿到offer的公司为了节省开支,纷纷取消招聘名额、大规模地裁员。刚毕业就失业,看不到前方的路,呆呆很绝望!显然,他遭遇了史上最难就业季。

  可是,怎能轻易地被生活击败!呆呆永不放弃!于是,呆呆开始琢磨起创业的事情来。呆呆决定从人们的刚需入手,他要卖手抓饼!作为一名卖手抓饼的商贩,呆呆在思考,怎样可以赚钱更多一点?他知道,在售价一定的情况,销量越多,赚得越多;在销量一定的情况下,售价越高,赚得越多。但是由于市场竞争者的存在,很难同时将销量和售价都无限制地提升,这两者存在着某种互相抑制的关系,为了市场能够良性发展,他与竞争者的价格会逐渐趋同,形成稳定的市场价格。因此,赚的多少主要取决于销量!此时的盈利公式为:盈利 = (售价-成本价)×销量呆呆继续思考,怎样使销量增加来增加盈利?分析后他认为,要使销量增加,一方面,需要增加与潜在顾客的接触量,另一方面,需要提高售卖的成交率。呆呆选择的售卖地点是生活区地铁口附近,这里拥有极大的人流量,尤其是在早晚高峰期间,人流潮汐效应会带来可观的顾客接触量。为了尽可能满足顾客挑剔的口味,提高成交率,呆呆准备了丰富多样的食材:鸡蛋、火腿、培根、肉松。此时的盈利公式为:盈利 = (售价-成本价)×接触量×成交率经过一段时间的经营,呆呆发现,由于早晚高峰的人流量实在太大了,仅凭一己之力,虽然忙个不停,但是他根本无法在限定时间内满足所有顾客,有很多顾客因为等待时间过长而离开,近些日子的成交率始终没有突破。“这是损失啊!”呆呆痛心疾首。

  他思考着,怎样能够提高成交率来增加盈利?分析后发现,现在的经营模式下,他需要在早晚高峰期间提升单位时间的服务量。借鉴以前解决信息系统吞吐量瓶颈的思路,他决心优化现有手抓饼的制作流程(预处理部分食材、流水线式标准化制作、优化制作流程顺序),并且去扩大经营规模(雇佣同样就业难的好朋友笨笨当助手来增加销售窗口),另外还此时的盈利公式为:盈利 = (售价-成本价)×接触量×(有效服务量÷等待量)终于,精明的呆呆靠着在地铁口卖手抓饼月入三万,实现了自己的创业梦!数据思维已经渗透进企业运营的各个阶段、各线业务、各个流程之中,是企业降本增效的不二法宝。下面用另一个虚构故事《呆呆购房记》来简单说明房产行业的数据分析师是以何种数据思维来评估房屋售价的。

  靠着卖手抓饼赚得盆满钵满的呆呆,准备结婚了。(没有猜错,就是笨笨!)为了小俩口有个温暖的家,他需要尽快购买一套二手房。因为不了解房产市场,所以他打算向在房产行业担任数据分析师的朋友Data咨询,怎样判断一套二手房的售价是否合理?Data从最简单的情形开始讲起如何去预测房屋售价。先考虑房屋售价只和面积有关系。通过收集数据,发现在某一区间内,房屋的售价随着其面积的增大而增加,并且近似地呈现出一条曲线的形状。于是,Data准备用一种简单的数学模型回归分析来拟合这些数据。Data选用了一元线性回归模型,用P表示房屋的售价,用A表示房屋的面积。为使模型预测的房屋售价与真实的房屋售价最接近,使用最小二乘法或者梯度下降算法,Data得到看起来像这样的一个模型:P = 0 + 1A + 2A2+ + nAn

  Data说:“呆呆,你可以将备选的二手房的面积带入到这个模型,得到预测的市场售价,把它与房屋的现有售价进行比较,通过观察现有售价是否符合市场价格趋势,再结合是否超出你的心理价格阈值来判断售价合理性。”呆呆点头称是,并开始按Data说的做。看到模型预测的结果后,呆呆不免有些失望,心仪房屋的售价超出预测的市场价格不少。Data解释道:“当然,决定房屋售价的可不仅仅只有面积一个因素,而事实上,房屋所处的地理位置可能才是对房屋售价影响最大的因素。”为了提高预测的准确性,Data向又引入了房屋的归属片区、套型、房龄、装修情况等因子,重新设计模型。之后又细分了历史出售、现在挂牌阶段的房屋,往新模型中引入了时间因子。Data不断地调整模型,使得模型预测出的房屋售价与真实的房屋售价误差越来越小,直到满足预定的允许误差范围内。呆呆把心仪房屋的各项参数带入模型,发现其实心仪房屋的售价既符合市场行情,也未超出他的购房预算。于是火速出手,购入了这一套心仪的二手房,香港马报综合资料模棱两可是何意?出自于哪?。顺利地跟笨笨求婚。能买到合适的二手房,呆呆衷心感谢Data慷慨的、专业的帮助。

  若是想要成为一名合格的数据分析师,你还需要具备的是“善于学习”的能力。既能零散地学习,也能系统地学习。零散地学习指的是快速地接受、理解和应用信息,系统地学习指的是联系知识、构建框架、梳理和体系化信息。零散地学习在工作中普遍存在,追求的是速度。做分析前,你需要先了解业务的某些关键细节,因为这对于更好地理解数据很重要;做分析中,你可能会遇到从未处理过的棘手情况,需要针对性地学习新的数据处理方法;做分析后,你在帮助业务方应用分析结论去解决业务问题时,可能又会有新的数据发现。系统地学习则常常要在工作之外进行(毕竟很少会有公司愿意组织员工参与职业专业培训),重视的是深度。由于专业背景的不同,数据分析师们在某些方面很擅长,可能在某些方面却有短板。为了弥补能力短板以及强化能力优势,提升在职场上的核心竞争力,数据分析师应坚持在工作之余将自身的知识框架化、能力体系化、经验全面化。

  知识框架化是通过将零散的知识点联系起来,串联成线,连线成面,面积成体,形成立体的知识树,而不是散乱的知识树叶。唯有这样,应对数据分析工作时才能信手拈来,而不是东挪西凑。能力体系化是打通岗位壁垒,不仅在专业领域要深耕,相关岗位的能力也要有基本的掌握。作为一名数据分析师,与销售部门协作时需要懂一点营销理论,与客户服务部门协作时需要懂一点用户心理学,与制造部门协作时需要懂一点供应链知识,与IT部门协作时需要懂一点信息架构,与运营管理部门协作时需要懂一点管理学。只有站在业务方的角度去思索过业务,才能做出深刻的分析,才能给到业务方有意义的优化建议。经验全面化是将所参与的项目经验进行整理分析,抽离出通用的技巧,形成普适性的理论。只有由术入道,数据分析工作才不会拘泥于具体的项目形式“头痛医头脚疼医脚”,方能全面深入地刻画和调整业务“调和五气”。

  若是想要成为一名合格的数据分析师,你也需要具备的是充足的“专业知识” 储备。数据分析师的专业知识主要是三大板块:统计学、计算机、数学。

  统计学允许你从不确定的、聚合的视角去理解数据,这样大大简化了分析数据的难度。计算机允许你规模化地、快速地加工数据,这样大大减小了处理数据的阻力。数学允许你量化地、理论化地去研究数量、结构、变化、空间等数据(信息),这样大大规避了数据建模偏差的可能。此外,通过不断实践积累起来的业务经验也是十分宝贵的,它能大大降低数据分析工作用于理解业务数据的时间成本。

  所以,什么样的人适合做数据分析师?我认为应该是“不忘初心,方得始终”。数据分析师的入门条件只是第一步,保持开放的心态,保持空杯的心态,高中化学怎么学?,保持进取的心态,才能在数据分析师这条道路上走得更长远,走得更精彩!

  大数据分析师LEVEL ll 复习大纲篇 第二章 Hadoop 理论(二)

  大数据分析师LEVEL ll 复习大纲篇 第一章 大数据基础理论(一)

  大数据分析师LEVEL ll 复习大纲篇 第三章 大数据分析之数据库理论及工具(一)

  大数据分析师LEVEL ll 复习大纲篇 第一章 大数据基础理论(二)

  大数据分析师LEVEL ll 复习大纲篇 第二章 Hadoop 理论(一)

  大数据分析师LEVEL ll 复习大纲篇 第五章 大数据分析之 Spark 工具及实战(一)

  大数据分析师LEVEL ll 复习大纲篇 第三章 大数据分析之数据库理论及工具(一)