我们在做数据分析之时,经常会遇到一个问题?(看到最后有下载)
老板没有设主题的让我做一份数据分析,没思路怎么办?
(对了,老板已经设主题让你呈现数据的时候,这叫取数,不叫数据分析)
那我们必须做一些探索性的分析了,这跟挖矿一样,挖了几百次都是石头,仅有一次是金子。
包括我自己,出一份数据分析报告的时候,做过N次失败的假设,这个老板是不会知道的。
接下来我就写个简单的探索性分析(简单的意义是,你看完你也能做出来)
假如我的公司是一个类似于阿里1688的平台,各个小微物流公司可以在我的平台上互相交易。
那么我想看看每个客户往来交易的特征关系,但是我没有任何分析思路,我总结不出特征。
我也不会机器学习,也不会调用python的任何库。
别担心,我们来开始探索
看到这张图时,我觉得很有趣,我也想把各个用户的交易或者社交用线画出来
那么我先在数据库里取一份有涉及相关字段的数据源。
做出是这样子的?你逗我?
用户代表每个点,密密麻麻,看不出任何关系,就好像我们面临一堆数据,晕了。
我设了几个维度做探索分析,
同一个路由下 用户之间的交易关系
同一个地区/分公司 用户之间的交易关系
如果你是社交分析(你可以从同一个地区、同一个时间点、共同用户、同一个话题做关系分析)
一、我们先来看路由维度下的探索(关键点,数据分析需要不断尝试细节)
我们从条形图看到AKI公司的连接数量最多
就从这里开始,我查了下它是经营合肥-苏州这条路由
发现这条路由,他一家企业连接各个公司,95%都跟他是单点交易,会不会觉得很奇怪?
做个比方:在某市,A跟这个地区的人都有在微信聊天,95%的人除了认识他以外,谁也不认识。
下面的红线代表交易最频繁的。
我们设想下,如果这家AKI公司退出了平台,那这条路由是不是就废了,因为没法交易了呀。
那我们再看看其他路由是不是也都这样?
发现大部分都是上图这样的,每个路由下都是相对稳固、错综交互的网络。
所以我们掌握了一个特征:找出存在单点隐患的各个路由,然后提出业务建议,
a.帮扶同个路由下的其他公司成长,不能让这家AKI一家独大。
b.可以跟AKI类型的公司签订战略协议,稳稳抓住这些大鱼。
数据一定是要配合着做业务决策才有价值。
二、我们先来看分公司/同个地区维度下的探索(关键点:数据分析遇到盲点时,最有效的方式是问业务人员,了解实际状况)
我们设想下每个地区,肯定有关联密切的那么几个人,就好像做生意一样,都会抱团。
或者拿知乎的数据话题板块下,一定是回答前面的这几个人有互相联系。
所以我把从地区的维度分析,发现这七家排在前面的公司,都有相互往来交易
为了确定这事实,我实地打电话给了西安的相关业务人员,查明是否这个原因。
发现还真的是和我做数据的推理结论是一样的。
我刚好有一个业务,是推荐平台的公司做贷款,也就是向我们平台借钱,做生意嘛,总要需求贷款,
发现这七家里面,空白白白白物流和云舒物流都有贷款记录
贷款的要么是想做大,要么是资金周转困难。
那这些关系密切的上下游客户肯定也遇到这种状况
还是一样道理,找到这个特征之后,就在不同地区试一遍,
那么我可以建议业务人员按照这种特征把贷款推荐给类似这五家的公司。
如果业务人员认可,我整理好公司名称给到业务人员
这就是一个入门版的探索分析的过程,不用机器学习,也能寻找特征。
分析的过程肯定要不断的尝试,并且多跟业务人员沟通,保证你的分析准确可执行。
最后,链接:https://pan.baidu.com/s/1qXW8AFa 密码:dg1n 分享出来,只需要十分钟就能掌握,关键还是思路。
对了吐槽一句,写的有关数据分析的回答现在都几十个赞,爆个照写个情感问题能上千。
这样怎么支撑我继续写下去?
欢迎大家关注我微信公众号:空白女侠 曾经是名互联网数据分析师目前在伦敦从事数据及顾问工作,想通过写一些自己的心得给大家呈现不一样的职场感受。