百科问答小站 logo
百科问答小站 font logo



科学研究的最终目标和目的是什么? 第1页

  

user avatar   ItsMrLin 网友的相关建议: 
      

今天不来讨论人类的命运和存在的理由这些终极问题,我想说说我自己的故事。

一个关于已故日本统计学家和我产生奇妙联结的小故事。

2017年四月末的一个晚上,博士研究生第一年的我正在学校实验室里面哼哧哼哧地写着代码,准备这一周与老师开会的汇报文档。

当时科研课题中亟待解决的一个问题是:对于一个APP的用户,我们应该怎样给他们不同的行为聚类并且分组,从而能归纳出不同的用户类型的不同行为模式。在来来回回试了一些常用方法却没有得到理想结果好几天之后,急切地想要给老师留下深刻印象的我猛拍脑瓜,又把目光投向了高斯混合模型 (Gaussian Mixture Model, GMM)。

大学毕业还不到一年的我其实并没有什么令人信服地理由来说服我自己为什么GMM在这个情境下是一个好的模型,而单纯地只是因为我听说过这个模型,觉得它有可能能适用于这个场景。但更多的原因是,我需要体现出来我做了足够多的工作来为周二的课题例行会议交差。

在由k个子分布组成的GMM模型里面,一个需要使用者提前确定的参数就是这个k的值到底是多少。诚然,我可以随意选择一个正整数来作为k的取值。但是作为一个拥有自我要求的正经学校的博士研究生,我自然是不能乱选。于是,离开会仅仅只有两天的我又一头钻进了模型选择方法的黑洞当中:我想知道到底有什么“科学”的办法来帮助我选择这个合适的k值。

有过在半夜无聊网上瞎搜经验的同学就知道,这样的黑洞一旦打开了可能就收不住了。在各种科普文章、论文、教科书中来回横跳的我,不知不觉中就划水划过了几个小时。我早就忘记了时间,不过大概率是已经过了半夜十二点了。

这个时候并不是什么论文会议的截稿日期附近,所以计算机系的大楼空无一人。实验室里面明晃晃的LED灯管发出的轻微的电流声照得我直发怵。

网上的论文翻着翻着,看到了一个似乎在某节不知是数理统计还是信息论的课上听过的一个名词:AIC。我大腿一拍:”这我懂啊!"

于是我顺手打开AIC的维基百科,里面写到:

赤池信息量准则(英语:Akaike information criterion,简称AIC)是评估统计模型的复杂度和衡量统计模型“拟合”资料之优良性(英语:Goodness of Fit,白话:合身的程度)的一种标准,是由日本统计学家赤池弘次创立和发展的。赤池信息量准则建立在信息熵的概念基础上。

可能是已经破罐子破摔的我,这个时候完全忘记了一天半以后要开会的内容还不知道在哪里,开始了在英特网的无底深渊里的畅游。五分钟以后,我不出意外地翻到了一篇名为《信息论以及对最大似然原理的一种拓展》(Information Theory and an Extension of the Maximum Likelihood Principle)来自1973年的论文,作者名叫赤池弘次 Akaike Hirotsugu。AIC里面的A就来自于他的姓氏Akaike的英文首字母。

作为学术界惯例,看见不明觉厉的大佬当然应该去翻一翻谷歌学术和个人主页。看看这两年这人都在干些啥,有什么学术八卦。然而打开谷歌搜索”赤池弘次“的第一页就赫然写着赤池弘次博士已于2009年8月4日于日本茨城县逝世。

与往常翻阅当代的学术明星们的个人主页,膜拜他们闪闪发光的履历不同。”逝世“这两个大字着实让我看的有些懵逼。继续翻阅下去发现他曾任日本统计数理研究所的所长,创立了日本综合研究大学院大学的统计科学部门,也曾经作为访问学者造访过包括普林斯顿、斯坦福在内的一众大学。当然他最出名的工作自然是统计学和信息科学中赫赫有名的赤池信息量准则AIC。谷歌也曾在赤池博士90岁诞辰的时候创作了放在其首页的谷歌涂鸦。

然而尽管赤池博士的鼎鼎大名,倘若我不是在那个手忙脚乱的夜晚在谷歌学术上瞎转悠,我可能永远也不会记得他的名字和他背后一生的故事。在我第一次知道他的全名的时候,他已经离开这个世界快八年了。赤池博士跟我来自于两个不同的年代,有着完全不一样的人生轨迹和生活经历。甚至当他逝世的时候,我还只是个十来岁的中二少年。但就是这样一位在地球的另一端已经故去八年的统计学者,依然通过他在70年代写下的意气风发的文章,告诉了2017年的我关于他的工作和一生的故事。

实验室的LED灯管还是在嗡嗡作响。

故事的结尾,我最终也没有在我的论文里面用到GMM或者AIC,我也不记得我那天我在实验室里坐到了几点,更加不记得那一周与老师开会最后是怎么交的差。

但是我会记得在1973年的日本,除了村上春树的弹子球,还有赤池弘次和他的AIC。

2017年后来还发生了很多事。但在加州帕罗奥图市四月末的一个微凉的夜晚,有一位与我素未谋面的老先生,用一篇44年前的文章,安抚了一个不知所措的后辈学生的慌张。

所以,你要问我科学研究的目的是什么,我诚然是有一些关于星辰大海的答案。但是,时常我又只有一个小小的期待:希望我也能在哪一天成为照亮某个素不相识的人的寂寞夜晚的一颗星星吧。


user avatar   tian-xuan-32-63 网友的相关建议: 
      

世界卫生组织(WHO)根据智商将精神发育迟滞分为以下四个等级:

1.轻度

智商在50~69之间,成年后可达到9~12岁的心理年龄,幼儿期即可表现出智能发育同龄儿童迟缓,小学以后表现为学习困难。能进行日常的语言交流,但是对语言的理解和使用能力差。通过职业训练能从事简单非技术性工作,有谋生和家务劳动能力。

2.中度

智商在35~49之间,成年以后可达到6~9岁的心理年龄,从幼年开始,患者智力和运动发育都较正常儿童明显迟缓,不能适应普通小学的就读。能够完成简单劳动,但效率低、质量差。通过相应的指导和帮助,可学会自理简单生活。

3.重度

智商在20~34之间,成年以后可达到3~6岁的心理年龄,患者出生后即表现出明显的发育延迟,经过训练只能学会简单语句,但不能进行有效语言交流,不能学习,不会计数,不会劳动,生活常需他人照料,无社会行为的能力。可伴随运动功能损害或脑部损害。

4.极重度

智力在20以下,成年以后可达到3岁以下的心理年龄,完全没有语言能力,不会躲避危险,不认识亲人及周围环境,以原始性的情绪表达需求。生活不能自理,尿便失禁。常合并严重脑部损害、躯体畸形。


user avatar   viaxke-yan-jia-su-qi 网友的相关建议: 
      

我理解里,因为中国发展太快了。

这说起来你们可能觉得离谱,但是事实就是这样。大量引入外资和外来技术开始后经济发展太快,在这种高速发展下做技术导向企业就是不可能的,你做技术带来的增长率远远赶不上加了外资杠杆的竞争对手的增长率。

哪怕企业真的技术强壁垒高能活过竞争,企业里的员工也必然要被大量挖角,因为员工在这种环境下理性选择也是赚快钱。2000年赚了1000万的和2000-2020每年100万收入的在2021比资产时前者几乎无悬念完胜的背景下,没人会有心思在一家公司搞什么技术的,必然都是想着快,抄,上,做出影响力,跳槽,收入翻几倍,下一轮。

等中国也一年增长两三个点,利率接近0,普通搞技术的可以30混到60的时候,这种公司反而会更容易生成。


user avatar   wang-ruo-feng-90 网友的相关建议: 
      

这是我看到的最准确的总结。

总的来说,就是中国的高考相对公平,所以性价比极高,所以其他活动都可以适当让步。




  

相关话题

  中国现在有哪些不那么值得骄傲的的方面? 
  2020-2021年NLP有什么核心技术的更迭吗?或者有什么推动领域发展的paper吗? 
  毛细管内液体临近沸腾时凹液面是否变平? 
  在中国,知识贫穷不适合搞科研吗?知识贫穷很难做出学术成就吗? 
  2021「搞笑诺贝尔奖」有哪些看点?这些「科研成果」有多大价值? 
  为什么中国的高校不能普遍实现教书老师的专职教书,科研老师的专职科研? 
  请问有没有这样的一种股票股市买卖新模式:自愿将个人的买卖股票的信息公开,以此提供胜率来服务股民? 
  2021 年,你的科研工作进展如何?有什么心得体会想和大家分享? 
  高斯到底干了什么?为什么这么多算法里有他? 
  为什么大多数人都对自己的硬知识 100% 相信(比如,太空相关硬知识)? 

前一个讨论
遇到问题,有哪些有效的分析方法?
下一个讨论
什么叫做运维服务器?





© 2024-11-08 - tinynew.org. All Rights Reserved.
© 2024-11-08 - tinynew.org. 保留所有权利