百科问答小站 logo
百科问答小站 font logo



如何在业余时学数据分析? 第1页

  

user avatar   sgai 网友的相关建议: 
      

以下方法仅适用开发出身或有语言基础的同学。


我的情况跟题主是一样的,软件工程出身,在之前一直在做Java/Python开发,无意之中接触到了爬虫,接触了一堆一堆的数据,之后慢慢开始对数据感兴趣,开始学习一些数据分析的技能:凭着爬虫以及数据分析的技能我找到了理想中的数据分析岗位。所以我对自己的评价一直是:科班出身的软件工程师、野路子的数据分析师。


从Java/Python开发到Python爬虫到数据分析,有很多人是看着我一步一步走过来的,我想在这里根据我自己这段野路子的学习经历说一说非科班如何利用业余时间学数据分析,当然只是数据分析,不是数据挖掘。


数据分析师的能力分为:分析能力和业务能力, @邹昕 大神说:分析能力决定一个数据分析师的下限,业务能力决定一个数据分析师的上限。


因为是开发出身,我的方法与其他人的不同,

我把数据分析的学习分为两个大的阶段,:


我把我学习数据分析的经验总结成了一本电子书,这本电子书帮助了不少人成功转行了数据分析,你要是感兴趣的话可以点下方链接获取到这本电子书。



学习的第一阶段:这一阶段是为了培养自己做分析的能力

第一阶段的基础是要有数据

分析能力相对来说是死板的,通常你需要学会掌握下面这些技能:

  • 数据分析常用哪些算法?
  • 需要用哪些库?
  • 如何进行计算?
  • 进行可视化,每一种图表的用途是什么?


为了解决上面抛出的问题,你可以仔细学习阅读下面的书籍:

1. 利用Python进行数据分析 (豆瓣)

2. SciPy and NumPy (豆瓣)


当然,如果你不想用Pyhton用R去搞这么复杂的计算,那你也可以直接把清理好的数据扔在一些做计算和可视化的工具里,我比较熟悉的就是:Tableau,以及据说不错的Power BI.当然最后你发现还是学习Python或者R的数据分析库来的实在,因为他们更加灵活。


在第一阶段用工具结合Python我留下了一些文章,可以作为参考,这些都是在爬虫抓了很多数据之后,先有数据后结合教程书籍分析学习产生的内容。

1. 链家网的租房数据做些有意思的事情?

2. 豆瓣读书分析报告

3. 爬取6.6w+豆瓣电影之后的分析故事


学习的第二阶段:这一阶段是为了培养自己做业务的能力

在第一阶段的学习你已经学会了:

  • 对数据的整体感知
  • 知道什么时候该用什么图表
  • 掌握了一些基本的算法和分析库


这一阶段,技术不再是你的障碍,重点是要有IDEA

这一阶段数据分析的步骤通常为:

  • 我想要做什么?分析什么?
  • 是否有数据能提供支持?把你想做的抽象成数据。
  • 数据获取/数据清洗
  • 开始进行分析(语言、工具)


我们能看到这四个步骤后两个步骤是在第一阶段学习的内容,所以我们只要把精力聚焦在前两个步骤就可以了,那么怎样培养自己数据分析的IDEA,我的方法是:多学多看多做。


多看:看一些实战IDEA较多的书籍

1. 数据之美 (豆瓣)

2. 啤酒与尿布 (豆瓣)

3. 深入浅出数据分析 (豆瓣)


多做:

网络上有很多数据分析的案例,很简单易懂,在深层的技术点也不难,你完全可以按照他的思路重新做一遍,就变成了你的思路了。

数据冰山的数据分析文章:

1. 生活中的数据犀利哥之一:开篇及选车

2. 生活中的数据犀利哥之二:排队

3. 生活中的数据犀利哥之三:找座

4. 生活中的数据犀利哥之四:看趋势

5. 生活中的数据犀利哥之五:找错因果关系

6. 生活中的数据犀利哥之六:快递员送货

7. 北上广深哪里过得更潇洒

8. 沧海横流,看行业起伏(2015年)

9. 和颐事件之后: 怎么定酒店更有安全感?

10. 老鹿玩数据——不光是求婚神器(一)

11. 老鹿玩数据——不光是求婚神器(二)

12. 《春节自救指南》之数据分析


还有我曾经写的几篇文章:

1. 如何判断一场知乎live的质量?

2. 豆瓣5.6分的《西游伏妖篇》有水军吗?


团支书的一些回答和文章:

1. 怎样才能以最少的钱租个靠近地铁的房子?

2. 「上海富了周围,北京坑了周围」? - 知乎

3. 如何不吹牛地形容北京有多大? - 知乎


等等几位的文章都可以用来学习参考。


我把我学习数据分析的经验总结成了一本电子书,这本电子书帮助了不少人成功转行了数据分析,你要是感兴趣的话可以点下方链接获取到这本电子书。


通过以上数据分析算是入门了,至于如何进阶,我也在摸索中,希望有机会我可以更新到这篇回答里,也欢迎在学习数据分析的同学一起交流。


user avatar   alvin969 网友的相关建议: 
      

大家都谈了很多机器学习、统计模型等高端大气上档次的知识,我来补充一些接地气的入门书:

以上书都偏分析而非挖掘,都是没啥难度的基础书籍,容易被鄙视,也容易找工作。

关注点都在高端知识上,就容易陷入拿着锤子找钉子的境地,缺乏对背景知识的关注。而现实总不会跟理论那么贴合,一个很一般但是可以解释的模型,要好过效果很好但无法解释的模型。对于互联网这种快速前进日新月异的公司,往往快速也比精准更好。




  

相关话题

  面板数据如何做topsis模型分析? 
  机器学习中的 Bias(偏差)、Error(误差)、Variance(方差)有什么区别和联系? 
  网游的掉宝率真的是随机的吗? 
  新手如何入门pytorch? 
  常用的机器学习算法比较? 
  简单解释一下sparse autoencoder, sparse coding和restricted boltzmann machine的关系? 
  为什么Python不能出一个类似V8的编译器? 
  医疗大数据的分析和挖掘发展现状如何?未来会有什么样的应用前景? 
  很多人都说 C# 语法怎么优雅,仅仅是因为 C# 的关键字多吗? 
  中美之间的军事力量差距究竟有多大? 

前一个讨论
有哪些事情「看起来简单,做起来难」?
下一个讨论
农民是否希望消费者浪费粮食?而消费者节约粮食是否有利于农民?





© 2025-01-18 - tinynew.org. All Rights Reserved.
© 2025-01-18 - tinynew.org. 保留所有权利