陈先生的思想倒是很有意思。
在经济学中搞计量玩数据绝不是什么高大上的事情,干这件事的人都自嘲为“回归猴子”。
经过计量经济学多年的发展,回归的套路已经基本形成定式,搞计量实证很多时候就约等于灌水,跑数据这件事情大家都爱做,数据实证已经形成了基本要求,但是大家并不过分推崇这个东西。而且与统计学,机器学习不同的是,计量经济学追求的不是goodness of fit,而是identification。即拟合优度R方是不被看重的,estimation bias才是最要紧的。
一个回归模型,只要排除了内生性,它就是R方只有0.1都无所谓。产生这种思想的根本原因是影响经济变量的因素太多,而且有些很难用数据量化,因此,找寻全部的或是绝大多数的影响因变量的解释变量是不可能的事情,因此只要找寻到部分对因变量有确切影响的解释变量就够了。
即最重要的是知道“政策A对经济增速的影响是好是坏,有多大影响”,而不是“找到能够影响经济增速的全部政策”。只要确信一个政策对经济是好的,那么搞这个政策就行了,尽管可能有无穷多个政策对经济发展是好的,但找到无穷多个政策是不可能的事情。
如果一个模型的R方能达到100%,而且就算加入新的数据也不影响fitness,即没有过度拟合。那么显然这是个完美模型,不可能存在估计偏差。但实际上R方能到50%的模型都是少见的了,在这种情况下这时你有两种思想,第一种思想就是继续提高R方,比如加入更多变量和变量的高阶项,但这之中加入更多新变量的效果往往并不明显,而加入更高阶项的做法并不科学,因为只要你高阶项加得够多,你总可以让拟和曲线通过全部的样本点,但结果就是overfitting,没有预测能力,一旦有新样本加入就跪。
第二种思想就是放弃那种绝对精准的拟合,退而求其次,把已知变量的系数的偏差缩小,尽可能地准确,这就是计量经济学最在意的问题,即identification。我的目的是确信某个因素对被解释变量有没有正面效果以及由大概多大正面效果,从而判断该不该对这个因素采取手段,而不是要去找到能影响被解释变量的全部因素,这就是计量经济学暂被称为“经济学”而不是“统计学”的缘由。
哲学家们用不同的方式理解世界,但最重要的是改变世界,经济学者的目标不是做到100%的理解,而是看看能做些什么,确信做什么有是正确的,从而去做这些事情。
在这思想之上计量经济学最在乎的问题就是内生性,即包含在随机扰动中的未知因素会不会影响参数估计,比如,许多城市搞了一个政策A,发现政策A对经济发展有正面作用,但是实际上这个政策只对搞了政策B的城市有用。甲市没搞过政策B,但是分析政策A效果时遗漏了政策B,市长一看别的城市政策A搞了之后效果好,于是也搞政策A,结果反而搞差了,这就是遗漏变量B所导致的内生性所导致的问题。
经济学者为了解决这样的问题,设计出了许多方案,诚然,添加更多的控制变量也是解决内生性的一种办法,但事实上面对n多的变量,哪些控制变量是重要的,要怎么选取是依赖于经济理论的,毕竟你不可能把所有变量都塞进去,塞了这些东西后能不能解决内生性还是得靠经济理论来判断。此外,这种方法也不一定能解决内生性问题,在此之上经济学家们开发了更多方法,包括面板数据的固定效应,工具变量,自然实验等等。
计量经济学的例子已经说明了统计学不是万用的,在不同地方要对统计学加以不同的开发和改进,以针对不同学科的问题,尽管今日计量经济学的这些办法已经被各个社科所熟知,但必须要注意的是这些办法背后都根植于经济学思想中,经济学的数据实证方法不仅不能取代经济学理论的分析,而且都依赖于经济学的思想理论才得以进步和运用,我想社会学也应当差不多。陈先生把社会学的实证分析与社会学的理论对立起来,未免还是太过片面了,当然,陈先生也指出了社会学中可能存在的理论太多自相矛盾,而实证又做得太少的问题,这只是说明了社会学的理论和实证水平都还有待发展,也并不能说明机器学习大数据会降维打击社会学。
陈先生所言,社会学者竟然有研究“韦伯学”的学者,而自然科学中绝不可能有“牛顿学”,“伽利略”学学者,此话不假,确实揭露了社会学科中的一部分玄学性质,但是大数据分析就能够把社会学科变为科学吗?我看未必,经济学已经被回归攻占了至少五十年,机器学习进入经济学也有些年头了,可是“芝加哥学”,“凯恩斯学”,“马克思学”等学派对立的现象不但没有被统一而消失,反而更加兴盛起来,各个学派,可能除了奥地利学,人人都会跑回归,再过几年,可能人人都学会机器学习了,届时各学派沿袭百年前的古人的主张和范式的现象难道会消失?我看未必,今天他们拿着各自的跑回归结果撕逼,明天他们还会用机器学习撕逼。
唯一能够使得学派统一,研究古人的这种现象消失的还是要靠学术语言的统一,这之中最关键的部分还是在于数学语言的使用(这里说的数学不是统计学的那种应用数学),可能确实如同陈先生所言,社会学中存在着大量自相矛盾,没有实践基础的“纸糊理论”,但是以为用数据实证就能消灭这些纸糊理论只是一种妄想,一个简单的逻辑学命题告诉我们,两个相互矛盾的命题与其他真命题可以推导出任意真命题。只要社会学的理论不是自洽的,那么它就不可能被证伪,一门学科要首先用数学语言把学者的思想阐述出来,保证逻辑体系的自洽,之后才可以进行实证,要消灭纸糊理论,还是要靠数学语言而不是统计。我们看到,在萨缪尔森之后,新古典学派和凯恩斯学派的语言上已经逐渐共通了,但是通了语言,主张就是能得到同一吗?就能得到确切的知识吗?这也未见得,要统一主张,还是得靠实验,注意是实验而不仅仅是实证。
17世纪天文学家便可以借助望远镜仰望苍穹,但仰望苍穹只是对天文学家足够,毕竟人类目前的力量不可能改变苍穹,所以只需要知道苍穹运动的周期即可。但人类可以改变社会,而且随时都有人在做这件事,17世纪的显微镜已经发明了,已经能够看到细菌,但17世纪人类能够找到多少治病的药?因为治病的药还是要靠动物实验,大规模双盲实验等一整套实验体系来找寻,而不是靠显微镜就足够的。而今天把大数据运用进社会科学,也不过是在显微镜水平,离真正能改造世界的科学还差得远,从2019年的诺贝尔奖来看,经济学不仅仅满足于数据库里的大数据,不仅仅满足于数据拟合,而是对随机实验或者自然实验的数据高度推崇。大数据玩得再好,也只能说明相关性不能直接说明因果,对数据对因果推断还是要靠已经存在的学科理论。但研究者控制的实验数据则可以直接说明因果,可以创造社科理论。
一言以蔽之,社会学可能确实存在陈先生所说的这些问题,但实证分析和理论分析并不矛盾。解决这些问题,还是得靠数学语言和实验,而不是光靠大数据分析就能解决的。
谢 @Kevin 邀请,作为当事人,其实我没有想和 @陈健坤 进行论战,攻击和互相说服。
我觉得我有必要澄清下
我写着这个文章的目的,只是想针对以下几个点,进行吐槽。
1.社会科学Methodology和其哲学基础究竟该何去何从?
2.定性vs定量
3.学科鄙视链
4.社会科学内部学科之间的边界模糊化,经济学帝国主义
牛津大学无社会学本科
UCL的BA in social science,将来会不会出一个Phd in social science?
LSE的social data science
爱丁保的Q-step Centre
5.论文发表至上主义,唯sci论
6.社会科学的theory和method之间的关系
7.勃勃、曹曹、党党是不是目前知乎最有影响力的社会学家,他们的theory是否在知识分子中也有广泛认可和影响力
为什么我的social theory的概念库在枯竭,我们的科学解释,和社会现象的理论解释在平民化和统一化
8.学术界多么难找教职,为什么这么难
9.高等教育是不是为了学一门手艺,将来用来吃饭?
10.如果一个社会学的phd告诉我自己梦想成为哈贝马斯、布尔迪厄、AA、蒂利这样的社会学家,我一定会建议他去读哲学,因为就目前的环境来看谢宇、陈志武才是他们的榜样...
现在社会学需要的是朱迪亚·珀尔的《为什么》,而不是Charles Tilly的《为什么》,你和我讲现实的建构,我就和你讲贝叶斯网络、反事实和潜在因果。
你问我为什么?你发一发论文就知道为什么
这个问题怎么看,诸位观众朋友自己心里自有判断。
其实这位知乎用户的观点可以分为两大类:
A. 从学术圈的现实状况上来说:1)中国社会学研究严重落后;2)社会学专业毕业生就业难。
B. 从学术理论上来说:定性社会学被量化的系统科学等“降维打击”。
我大体上支持他A部分的观点,但是并不同意他B部分的观点,更不认同他在文章中暗含的假设:A必然推出B.
简单地提几点反对B部分的理由:
最后总结一下。我所提出的这些点,其实都只是商榷的内容,其中不乏逻辑上不完整的地方。实际上,指出不足并加以进步,就是学术研究最根本的范式之一。在柏林《俄国思想家》的序言中,序者提到了“广场焦虑症”和“幽闭焦虑症”的对比。前者指人在空荡荡的广场上害怕无依无靠,所以想要选择一个强有力的依靠,进而认为自己的依靠是唯一正确的,陷入一种一元主义。在我看来,陈同学多少就有点这种“广场焦虑症”了。而这种症状的诱因可能是计算社会学的美好承诺,又或者最初见到中外社会学研究差距时的惊慌失措。在这里,不妨看一看在一个有着悠久社会学理论传统的国家中,人们是怎么看待定性定量之争的:
坦率地说,目前的经济学科不惜牺牲历史研究,牺牲与其他社会科学相结合的研究方法,而盲目地追求数学模型,追求纯理论的、高度理想化的推测。这种幼稚的做法应该被摒弃了。经济学家们往往沉浸于琐碎的、只有自己感兴趣的数学问题中。这种对数学的痴迷是获取科学性表象的一个捷径,因为这样不需要回答我们所生活的世界中那些更复杂的问题。在法国做一个理论经济学家有个很大的优势:在这里,经济学家并没有受到学术界以及政界、金融界精英的高度重视,因此他们必须撇开对其他学科的轻视以及对于科学合理性的荒谬要求,尽管事实是他们对任何事情几乎都一无所知。无论如何,这正是这一门学科和所有社会科学的魅力所在:从零开始更有希望获得重大进步。我认为,在法国,经济学家略微更感兴趣的是如何让历史学家、社会学家以及非学术圈的人们相信,他们在做的事情很有趣(尽管他们并不总是成功的)。我在波士顿教书时的梦想是到法国社会科学高等研究院教书,那里的教员里有好些重要人物,如吕西安·费夫尔、费尔南·布劳岱尔、克劳德·列维-施特劳斯、皮埃尔·布尔迪厄、弗朗索瓦丝·和瑞提尔、莫里斯·古德利尔。我敢冒着被认为有些盲目爱国的风险,承认这一点吗?自20世纪70年代起,社会科学已经对财富分配和社会阶级问题丧失了绝大部分兴趣,尽管我对此深感遗憾,但比起罗伯特·索洛,甚至是西蒙·库兹涅茨,我也许更加钦佩上述学者。
——托马斯·皮凯蒂,《21世纪资本论·导论》
当然,定量研究在今天的社会科学研究中处于扩张的趋势,并且也正在想办法解决自身的各种问题。但是这个过程,是在尊重别人研究成果的基础上,脚踏实地地实现的,而不是通过耸人听闻的夸张表述甚至是哗众取宠的暴论。定性研究也依然有着它不可取代的作用,给我们带来宝贵的精神财富。
1) 谁能从这个学科里收益
首先毋庸置疑,当代学术系统也是一种剥削与被剥削的结构。那么就要问了,在剥削完底层搬砖工以后,谁能收益?如果只有企业主/学科大佬能发达,那就是坏的;如果学科的研究能给予更多人(尤其是大众,觉得搞科研不用吹对大众益处的请po出自己要钱的proposal和文章里吹b重要性和未来展望的conclusion,在这方面还无辜的可以拿石头砸死我)帮助,那就是相对善了一点(但对底层搬砖工的剥削惨烈依然无济于事)。
收益也是两方面,一种是学术层面——要承认同样是研究同样是学术问题,不同问题之间就是有大/小问题之分,一个问题如果除了满足部分(e.g. 顶层)的个人志趣外不能起更进一步的作用(e.g. 促进别的area乃至别的学科的发展,最典型的例子就是物理和数学的相互促进),那显然就是相对的小问题,一个area如果成天研究小问题,那就相对的dead
另一方面是对从业人员的惠及,尤其是兜底。cs了不行可以转码,有些phd经常能业界发财这是事实,要承认。不能因为科研不是面向就业(不面向个p,做学术找ap也是面向就业,有几个program去全面培养candidate怎么成为有竞争力的科研人员的)就逃避这个问题——当然这个也和刚才的问题联系上了,如果你的研究可以(potentially)普惠更多人那你相对的就好转业,也好糊口。
2)学科的供需平衡问题
如果说学术的剥削是一种必要而无奈,那至少控制博士/工作(教职or业界)的供需比算是难得的慈悲心了。作为招生的顶层大佬们如果连这点慈悲心都没有,天天就想着招奴隶厚实金字塔基(广义上,不是具体到某个dpt某个program某个人,而是对整个系统的认知————毕竟实际招人的多数还是把candidate当彩票来买,而不是奴隶),就是真的坏透了。可惜的是除了商法医基本看不到
这个长篇大论输出情绪逻辑混乱的回答不值得评价,较起真来你会发现根本不知道他在批评什么。还不如该回答下面一个高赞评论来得简单明了:
一般来说,社会学系的学生培养方案与培养方法,会要求学生们接受基本的统计学的训练,会被要求阅读大量的文献,并且会在老师带队下进行田野调查,进行网络问卷调查,并攥写研究报告。
曾经带着我的那位老师原来是台湾大学经济学系的学生,后来转入了台大的哲学系,在Cornell就读最终来到了中山执教,这便是我所熟知的,他的经历,也是大多数社会学系老师的知识背景。他对于中华传统文化的熟悉程度不亚于我见过的多数大陆学生,甚至能够在课堂上背起《赤壁赋》,他也是一个安那其主义者,也是推崇个人自由的一位正派的学者。然而,他在FB上发表的一些内容无论从论述方法还是背后所隐含的内容来看,都难以让人信服,我们也会时常讨论彼此的分歧,尽管最后回归的元价值不尽相同,而且就我所知,他们内部的分歧似乎也并不小。
这是一个人文学,或者人类学,又或者哲学专业的训练方法。当然,我最后还是回归到了数量金融方向,从事着清洗数据,分析数据,回归模型之类的无趣的生意。复杂系统也只不过是一个爱好者而已。对于我们而言,数据本身就是一座等待开采的金矿,而我们所接受的训练便是如何在当前的业务逻辑上,开拓出新兴数据的应用用途,从而形成决策依据或者对于当前商业模式的洞察。而这,也便是金融从业者面对数据时的直觉。作为一个量化金融的初学者,我分几点来介绍数据革命在金融行业的情况:
当然,金融作为应用型较强的一门学科,在很早的时候就经历了数据时代的浪潮冲击,直至现在,金融业界、学术界、政界的需求推动者Fintech等研究领域的发展,但是我们的高等教育,至少是本科生的金融教育却并没有落实到这些痛点上,恰恰相反,我国的许多高校的金融专业实质上仍然是去教育化的(De-educated), @黑猫Q形态 在金融行业劝退, @弗兰克扬 等人也在不懈地劝退生化环材等学科,剑指当下高等教育与实际学界、业界需求的脱节,以及这些学生毕业之后所要面临的人生问题。当然,这里仅以我所熟悉的学科来举例,不做过多的拓展。
最后聊一点个人的感受吧,我是一个社会学的门外汉,从门外看社会学是热闹非凡,学者们对先贤的思想信手拈来,其厚重的知识量也让我敬佩,不过一方面很难说清楚这些“无用之用”是说辞还是现状,另一方面,我也很少感受到来自社会学者对于社会的洞察,敏锐的判断。这些往往是我们这些搞数据的人最为渴望的东西,但是缺少系统性的来自社会学者的引进,而我们所做的一些东西也很难融入到社会学的框架里面。社会学的调查问卷也是定量研究,社会关系网络也会涉及建模的知识,定量与定性之争,或许也没有那么复杂。
陈建坤之所以会有这种想法,因为他同意经济学被debunk无数次的assumption,就是人类是完全raitonal的。(补充评论的讨论,陈建坤的问题还在于方法崇拜,方法越复杂越牛逼,看得懂的人越少越牛逼,炫技越多越牛逼,而不是在于回答问题,这是典型的做题家逻辑,也是陈建坤为什么在做题家群体里有受众)
现在Data Science的核心就是要处理和分析数据,处理和分析数据需要的skills不仅是会使用Python等工具,更需要社会学的意识和想象力来解释数据所展现的社会现象啊。最终解释社会学的现象我们要知道的是某个群体究竟是怎么behave的,他们在想什么,他们的行为产生了什么其他的影响。这些社会学的视域是非常重要的,人文包括经济最终是对人类的学习,而人类并不都是rational的。现在学经济的都在融入人类学心理学社会学等理论来解释数据,因为光会处理数据是不行的,对business的理解也是非常重要的。如今,国外社会学的博士课程都在教数据处理分析技巧,这是各学科正在融合彼此的标志。
陈建坤以一人之力倒退学科融合的trend,体现了其做题家没得啥文化素养的本质。从他的回应,可以看出来此人极其自恋和自以为是。以哗众取宠来积攒学术名誉,没什么可持续性。
我猜测,作者没有学过一门课叫做Philosophical and Methodological Foundations of Social Research。
作者分不太明白研究方法不是研究目的,你觉得这些方法好,就借用来研究呗,按照你的逻辑,整个社会科学都应该取消。”
我没有学过哲学,没看过那本书。你最后一句话有些莫名其妙。我说那句话的背景是在同一个研究领域上(社会计算)社会学出身的陈云松等人显著不如系统科学,数学等理科专业出身的学者。我从头到尾都没提及过社会学以外的社科专业。我只对我知道的学科做评价
“目的是目的,手段是手段,手段不是目的
更何况实证研究不是社会科学研究的唯一手段,社会科学自然主义和非自然主义还没争论明白呢。”
社会理论,社会哲学不属于科学范畴,属于人文学科。做量化,计算的人根本上不认同你们哲学出身的这些人的这个观点
“建议全文背诵这一段话
Statistical techniques by themselves do not make sociology. They become sociology only when they are sociologically interpreted and then placed within a theoretical frame of reference that is sociological.
At the same time it is quite true that some sociologists, especially in America, have become so preoccupied with methodological questions that they have ceased to be interested in society at all. As a result, they have found out nothing of significance about any aspect of social life, since in science as in love a concentration on technique is quite likely to lead to impotence.
这个话题争论已久,涉及太多个人价值观和立场问题,争论下去没有意义。简单来讲就是我认为21世纪的社会科学不同于19世纪的社会科学,应该严格区分开社会科学和人文学科,不能混为一谈。社会学应该是实证学科。理论建议在大数据实证基础上。
你真的想那么想做一个程序员,为什么读社会学博士?”
社会学博士在业界没有对口岗位一个很大的原因就是这个专业没有核心技能。被你说的还理直气壮的。而且学者需要跟业界保持紧密联系以获得新的,更多的数据来做研究
我原回答就业差分成两部分探讨,学界出路差(芝加哥造假),“博士大量失业”,教职岗位极其有限等等。你没有提及这部分的话我默认你赞同了?
我列举的那几个大佬也发过很多社会学顶刊,但他们自己觉得效率太慢加上与自己研究方向脱节越来越主攻自然科学期刊了。但我没说过除了NS都是野鸡。社会计算里顶刊是NS
“那我随便找一些没发过science、nature的野鸡社会学家
1.Andrew Abbott
2.Pierre Bourdieu”
在21世纪,拥有大数据和计算能力的时代还在做以前的常规研究并且发在普通期刊上(社会学现状),甚至分不清科学和哲学,没有意义。milgram也没发过自然科学顶刊,我的回答里也花了几百字提到他对社会科学的贡献
Annual Review of Sociology,American Sociological Review,American Journal of Sociology.......这些反正都是野鸡杂志?
我提到SSCI因为国内社会学顶尖学校(北大,人大,南大,清华)大量教授都不具备发与国际接轨的英文期刊的能力。这个领域教授自己不行不是你给别人扣帽子叫做题家的借口
且不说社会学,现在这年头,哪个专业好找教职?”
社会学是我知道的唯一一个顶尖大学会博士出路造假的。但是你们都对如此不堪入目的事情避而不谈。这是学者都该具有的basic integrity 。出路造假,欺骗学生,是彻底的不负责以及挑战诚信底线的行为
“是谁发明的“降维打击”这个词,天天都幻想啥呢?幻想着降维打击别人吗?学逻辑也是为了降维打击别人,学计量也是降维打击别人........天天搞学科鄙视链,想着打击别人.....这么做有什么意义?
我不知道你这段到底啥意思,故无法反驳
@Retsuki Uchu 的反驳
“感觉这种立场先行的回答没什么好评价的,首先他盲目崇拜量化研究和Nature,Science,其次就业前景差和内卷,对任何一个不以就业为目的的专业都是成立的,根本就不是社会学本身的问题”
我的回复:
我欢迎你自己去看看人大,北大,南大的社会学教授啥样子。不需要对社会学有了解你都能看出来大把的教授在同一个话题下重复灌水中文期刊。我提到SSCI都发不了的意思是都不具备和国际接轨的能力,严重封闭。还有关于你指责我nature science崇拜,我的观点是社科到了发展的临界点,现在可以用大数据+计算力量达到前所未几的发展,所以列举了前沿做的好的几个教授发过大量SCI一区。碰巧他们还有在劝退。
关于你说的就业和内卷不是社会学本身的问题。我就来问问你,你见过MIT Caltech 物理博士placement造假吗?你见过有物理教授内卷到成为“牛顿专家”,专门研究牛顿当年的理论和历史吗?
所有学科都有内卷和就业的问题。社会学已经到了令人发指的程度
然后还有这种纯粹污蔑的,把我塑造成傲慢无礼的高华,跟汉奸李归农是一类人。我打算读完博士回国,我没有美国绿卡或国籍。上来就对我无根据的污蔑
事实上留学生社会学专业的人经常背后给我安的一个罪名是我“粉红”。甚至连名校社会学专业的人也从这个角度攻击我。
最后那段我阵亡了就不反驳了。他也证实了我回答里提到的社会学的很多人根本拿不出有效反驳我的观点
https://www. zhihu.com/question/4247 35448/answer/1514028925
之前应该隐隐有类似的疑问,但一直没想清楚该如何发问。受此答文启发,终于知道该怎么问了:
所以说,政治学、哲学、法学、经济学、管理学、公共管理学、人类学、心理学、“女性学”、“XX文化研究学”......等学科的研究范畴之并集,在合理的一个全集下的补集,和狭义的社会学之间的关系,到底是什么?
或者换个问法,通常有哪些具体的社会相关的问题,是典型的 “社会学问题”,而很难被认定为是 “政治学问题”、“哲学问题”、“法学问题”、“经济学问题”、“公共管理学问题”、“人类学问题”、“心理学问题”、“社会心理学问题”、“文化研究学问题”......
还是说,今天的狭义 “社会学”,其实是以上这些学科问题和方法论在学科交叉大背景下的一个代称?
好奇问一句。我很确定“自然科学”分类下并不存在“自然学”,“人文科学”分类下也从未听说有“人文学”,那为啥“社会科学”分类下会存在“社会学”专业?难道社科的研究对象与方法并不能被诸如“经济”、“法律”、“政治”、“民俗”等子学科瓜分干净?“社会学”专业的研究对象与方法到底与其他社科专业有啥不同?以及一些回答到底答的是社科还是“社会学”?