2016年4月15号更新:增加了如何做中国数据地图,以及几个平时做行业研究时常用的数据源。我从国外角度参与下讨论。政治经济文化类数据与研究方法基于读博经历(经济学),金融类基于工作经历(某欧洲大行)。
补充更新:对答案里中国数据地图感兴趣的朋友可以移步:
excel上怎么做数据地图? - 钱粮胡同的回答或
用Excel做出强大的数据地图 - 钱粮胡同28号更新1:银行对于行业分析的方法和框架可以参看
初入金融行业,如何进行实用行业研究与行业分析,比如风投和券商是怎么分析行业的? - 钱粮胡同的回答或
如何分析商业银行年报? - 钱粮胡同的回答更新2:宏观金融和经济分析方法或思路可以参看
区位因素是否是江苏省省内贫富差距的主要原因? - 钱粮胡同的回答或
欧洲债务危机的根源是什么? - 钱粮胡同的回答正文:读博期间主要做经济类研究,数据来源主要分一手和二手数据,三手的没碰过,也不敢碰,但是亲眼见识过 (/sigh)。
######宏观经济类######
补充1:使用前两点提到的数据做了些研究,比如中国区域收入差距不平衡(省内收入差距和省间收入差距,GEM指标),收入极化现象 (polarization) 等,截取部分分析结论,见下图(红色代表中国省份之间的收入不平衡占整个国家不平衡的比例,蓝色代表省内不平衡(同省地市间不平衡度)占整个国家的比例,可以看出省内不平衡远超省间不平衡,这种角度采用Gini系数等是无法计算的)。
补充2:用同样的经济数据和一些基础设施数据,采用最近流行的机器学习(可以参考:
机器学习(machine learning)在经济学领域是否有应用前景? - 钱粮胡同的回答),可以做很多有意思的启发性研究,比如对中国的城市群做集群分类(方法:SOM (自组织地图),人工神经网络的一种,unsupervised learning),具体方法可以参考
AlphaGo 的数据算法,能否用来分析银行信贷企业的各项数据,然后得出关键指标和权重? - 钱粮胡同的回答,截图(蓝绿色代表较低收入城市群,红色代表中等收入,黄色代表高收入,之后的工作就是看每个群的属性然后从经济,社会发展等角度尝试解释):
######文化类######
结合上边儿宏观经济类和人文类,使用的分析方法和得出的结果请参看发表的拙作:
Economic integration in China: Politics and culture文字不够性感,截取一点拙作中的图片,根据方言系统重构的其中一种中国方言地图。然后采用空间计量的方法,分析经济溢出与文化的关系(其中方言作为文化的一种proxy)。
这篇文章具体的分析和截图请移步:文化对经济有着怎样的影响? - 钱粮胡同的回答
######政治类######
对的,政治类也行,再招一个爱好生活喜欢被虐但是仍然对学术有向往的助研(和之前不是同一个人,否则估计已经躺医院了 - 是我躺医院,不是助研),收集了所有地级市层面大部分官员近20年的简历(简历好找,人民网,百度百科,地方政府网站,看不了的直接上Google Cache,甚至爬虫),放入设计好的数据库,量化做文章。
没有性感图片,但是咱有感性的文章,分析方法和结果等请参看发表的文章:
Career Backgrounds of Municipal Party Secretaries in China补充一张上述政经文章比较有意思的统计图:样本中市委书记出生,上大学或之前工作省份与他当市委书记的时候不是同一个省的比例:
其他常用的宏观经济数据源:
经济类分析工具:用的最多的是Stata, R, excel & VBA,偶尔用过一些专门的软件,比如做神经网络的,后来有了R,其他就弃用了。其实Stata和R有很多package,足够了,更重要的是了解package背后的模型和方法。
上边的研究味儿太浓,谈钱的请看下面金融类:
######金融类######
国内的用的不多,只知道高大上的有wind(万得资讯),通联,开源的有TuShare等,自己玩得话用用Yahoo Finance或者Google Finance也挺好,R或Python里都有对应的包, Mac上也有一些软件可以直接下载这些数据到excel里。
平时工作上最常用的:
企业与金融机构的财务数据:这方面因为工作需要,所以基本都是银行自己的分析师填入系统的企业数据。这类数据一般来源有:
补充:感谢评论里 @
一扬的补充,这里加上两个学术圈常用的金融数据源:
平时休闲自己常用的:
平时工作用的分析软件很少,大部分时间VBA和R足够了,其他的都是公司内部软件(SAS等,但是不喜欢)或平台。
补充两个iOS上看市场数据/ 画曲线图的app:
2. http://Investing.com,之前提到了,这个是手机上的,看大部分证券信息,同时还可以跟踪每天的财经热点和指标,基本每天一读
######One more thing######
现在很多分析师或研究员张嘴全是模型,但我觉得,不论是宏观经济研究,行研或是企业层面的分析,软件或模型只是工具,最重要的是阅历的积累,对研究对象本质的体会与把握,而不是拿过来一堆数据,扔进个模型里看结果。
目前先想到这些,如果还有其他的,再来更新。
我的专栏:
钱粮胡同28号从事金融搬砖工作的金融民工,大部分时候不需要分析经济走势。
获取数据资源,最主要的就是谷歌,百度,必应。还有国家统计局等等政府官方数据来源。
如果想找上市公司的文件抠数,就是SEC Edgar,HKEXnews,各上市公司的投资者关系部门等等。
高级一点,肯花一点钱,有Wind,Bloomberg,CapitalIQ,FactSet等等数据库可以抠数。
如果机构稍微大一点,有卖方跪舔,就可以看卖方的研究报告。虽然很多时候观点都不太敢恭维,但是数字收集得都挺好的,还有很多是直接从公司那边拿来的详细运营数字,或者是自己大胆假设,没去求证过的宏观数字,引用起来很方便。
再肯多花一点钱,就可以找咨询公司,甚至MBB这样的很高大上的咨询公司,根据你的需求来帮你做(拍)调(数)研(字)。这种研究很多时候是定制的,不管什么数据、信息都能给你找出来,如果实在没有编也会给你编出来。当然,过程是很科学的。结果嘛,哎呀,都有数字可以用了,还问那么多干什么。
如果针对特定公司或者项目,就可以做尽调。一般这种会比较严谨一些,毕竟是针对特定公司,如果后续除了问题,是会被找麻烦的。
总之,我们是很认真的!
还打造啥“国际金融中心”。主流的国际金融网站,没有一个可以通过合法途径上去。最多打造一个“关起门来金融中心”。