百科问答小站 logo
百科问答小站 font logo



如何看待开源语音识别系统 kaldi 的开发者 Dan Povey 被 JHU 解雇? 第1页

  

user avatar    网友的相关建议: 
      

我们搞一个公开petition,希望大家如果支持我们的话过来支持一下。

savedanpovey.github.io/

================================================

抗议学生公布了当天部分视频:

facebook.com/watch/?

我上传了onedrive,国内应该能看到吧?

1drv.ms/v/s!Ah1akAHUL7d

我并不完全认同视频穿插的大量文字;不过看来,确实Dan请的人打了抗议学生一拳;另外视频似乎剪辑十分严重,而且中间Dan“非常暴力”的时候他们居然没有录到,这个真是巧合。然后视频第一段将要黑屏的时候,看起来就是Dan要被打的瞬间。估计恰好那个时候手机没电了吧?

================================================

今天(8.9)得到了更多的信息,在这里补充一下。主要信息来源是Dan的研究组的人,故我无法说这些是unbiased的信息。

  1. 学校解雇Dan主要原因是,他带领了一帮校外人员进入Garland;虽然Dan反复强调他之前要求这帮人如果被攻击了绝对不能还手,在调查的时候,调查人员问Dan,“你是否能够100%保证这些人不会还手?”,Dan作为精通概率论的科学家,深知100%的概率是不可能的,于是怂了肩膀;这个在调查人员看来,是Dan明知自己的行为可能对抗议学生带来*潜在*的伤害,而这个是学校不可以接受的。当然,我们的一直分析认为,这个调查的目的就是为了定罪Dan。如果这个问题,Dan保证他们不会还手,他们依然会问其他各种问题,直到找出把柄。
  2. Dan是否花钱雇佣了街上的无家可归者。我们了解到,Dan日常并不喜欢在实验室工作,而是喜欢去St Paul街的Starbucks,那里常年有无家可归者出没。我们从好几个渠道得知,Dan其实和这些人是挺好的朋友关系,多次被人见到坐在一起聊天,当然Dan也经常给他们钱。结合官方的说法,我觉得大概率事件是Dan估计是确实给他们钱了,但是并不是那种纯雇佣的关系,而是以朋友帮忙的身份;给钱也是像平时那样给他们钱(Dan的慷慨在其他的回答里都有提到)。也是因为他们是朋友关系,在调查过程中,Dan一直不愿意交出这几个人的名字,因为这个就是背叛朋友的信任。
  3. 在最开始的时候,我们都不知道Dan和学院对机房的问题有过很多很多的讨论,然后我们有好几十T的数据都处在十分危险的处境中,而且其实现在得知我们其实确实也丢失了一些数据,只是因为后来Garland终于解封,只丢失了几百个G的数据而没有恶化。这个最坏的结果可能是灾难性的——每个人设想一下现在把你眼前的电脑的硬盘完全删掉会怎样?我们服务器硬盘坏掉的影响显然远大于一个个人的计算机。



=====================================================

先放个丹自己的声明的链接。有时间我公布一些细节。

=====================================================

这个事情从一开始到现在都感觉很滑稽。最开始的导火索就是学校学生的抗议活动。抗议的内容是,因为Baltimore的犯罪率,为了保证学生的安全,JHU要有自己的警察力量。这些抗议学生觉得,Baltimore已经有严重的种族问题,JHU如果有自己的警察,则会不可避免的加剧种族矛盾。抗议的地点是JHU的Garland Hall,相当于是行政楼。最开始他们还算是和平抗议,但是后来越来越变味,比如会阻挠去行政楼办事的学生,后来甚至这帮人就把自己用铁链锁在门上,使得人无法进出这栋楼。

Dan所隶属的语言和语音处理中心(Center for Language and Speech Processing, CLSP)的机房恰好就在Garland的地下室里。我们有数十台机器的grid。由于机器数量众多,时不时会出现问题,而分布式系统的设计会导致,如果一个机器出问题不处理的话,可能会导致其他机器都会出问题。在学生抗议的时间,我们的有些机器需要重启,但是无法进入Garland Hall。

Dan是CLSP的研究科学家,但是因为他对linux 系统及其熟练,非正式的也充当了我们系统管理员的角色。而且最近我们的正式系统管理员Carl请了病假,所有保障机器正常运转的职责都给了Dan。Dan应该是用尽方法,但是无法通过远程让机器恢复正常。5月6号晚上,Dan给大家发了群发邮件,

I haven't heard an update about Garland access; I'm making inquiries.

We have had two machines go down so far that I'm aware of, that have exports (a08 and b19) and they can't be brought back without physical access. I'm reminded an email that was sent out at IBM when the power was shut off one weekend, that the heating was shut off so the building temperature would "ultimately reflect exterior conditions". Which in our case means everything being down. If anyone knows the student protesters and can let them know how much they are inconveniencing everyone, it might help.

Dan

CLSP的学生各有各的政治立场。在这封邮件下,开始了小范围的辩论,然后同时Dan也发表了自己对学生抗议活动的看法。其实Dan是一个很liberal的人,16年还为希拉里捐了钱,但是因为是英国公民,不能投票。但是Dan对当前lefists(liberal和leftist是不同的)的各种激进还是很反对的。第二天5月7号中午,Dan得知这些学生把自己锁在了Garland的门上,非常气愤,在邮件中称这些人为“little shits”,然后骄傲的post了自己counter-protest的照片。

Dan的这番言论估计是严重冒犯了学院的几个左派学生。后来得知,这些学生各种向学院施压,导致后来Dan被迫为这些言论道歉,然后院里的领导号召大家要和气不要太激动,也不要继续讨论。

这个事情本以为就这样就过去了。可是,谁都没想到7号晚上,Dan又组织了活动。8号晚上,Dan给大家又发了群邮件,说到,

Everyone,

You are probably going to hear this sooner or later through other channels, so I might as well get out in front of the news. (And to close friends: sorry not to tell you in person, I was super tired).

Last night around midnight I led a small group of counterprotesters at Garland hall, armed with bolt cutters and attempting to retake control of the building. We were met with more violence than we anticipated. The protesters have claimed that this was a group of "white supremacists", but this is far from the case; two of the group were black and one Latino. They have extensive video of the incident but they are not likely to release it because it makes them look like idiots.

As you know, the protesters had a list of demands. Well I had a demand too, and my demand was: "Get the f*** away from my server room."

Dan

正如Dan在邮件里所说,他的行为被这帮抗议学生描述成“一个白人至上主义的JHU教授带领着一帮人去攻击抗议的学生”。Dan事后告诉我们他们根本没动手,而抗议学生们很暴力,而且他们自己有好多人都录下了事情的经过;但是同时他们早已经把Garland hall的监控摄像头挡上,所以也只有他们自己有这段事情的视频,所以学校并没有直接的证据证明Dan没有攻击学生。

事情发生后,Dan就被学校带薪停职,官方给的原因是:由于有学生声称Dan攻击了学生,不管是否属实,学校必须严肃对待这个指控。这个我觉得也合理。但是同时,学校要求在停职期间,Dan不能跟任何学生有任何形式的交流,包括不能跟自己的学生进行学术的指导。这一点非常不合理,因为Dan带了差不多20个学生,很多都需要他的指导。我们学生也多次去工程院里反应,可是他们只是给我们很礼貌的答复:我很理解你们的需求,但是这个是学校的规定,我们也无能为力。但当时,我们得到的消息都是,这些指控都只是一场闹剧,很快Dan就能恢复原职。

后来我们慢慢知道了更多的内情。比如想找Dan麻烦的是学校的一个叫做Office of Institutional Equity(OIE)的机构,他们那里都是极左派的人,自然对Dan充满了敌意。然后CLSP内部,我们搞过一个匿名的讨论,发现不支持Dan的往往都是美国人(有一位公开了姓名Sebastian的并不是美国人,但是是德国来的白人),而在国际学生那里,Dan有着极高的支持度;据说在faculty那里也是这样,非美国的faculty都表示对Dan的支持,但是很少有美国的faculty支持Dan,唯一的例外似乎是David Yarowsky。然后在其他学院,据说文科学院的一帮教授,一个个都根本不认识Dan,但是清一色的要求Dan被解雇。如果faculty能够团结一致挺Dan的话,Dan估计也不至于被开除。但是这个情况,就很难留下Dan。当然Dan其实也被人留下了把柄。有传言说,当时他是在街上找了几个homeless people,给他们钱来加入自己的,不过这个没有得到证实;另外据说其实当时他们在被学生攻击的时候,其实有一位还是还手了一拳。这些虽然都合情合理,但的确对他不利。

=====================================================

这个事情肯定会对JHU有很大的影响。学校行政和OIE这帮人不会理解Kaldi在业界的重要性;校长也只是为了自己能够保住自己的位置。但是这个事情对kaldi的发展并不会有太大的影响。Dan对此在kaldi forum上有一些说明,groups.google.com/forum Dan这个级别的工程师,是随便什么公司想去都可以去的,然后他专门提到,他现在加入Facebook是因为相比于其他公司,Facebook对自己员工开发开源软件的限制是最少的;另外Dan本来就有意向提高Kaldi和pytorch的融合度,对此Facebook也是最好的去处。

=====================================================

其实这几年美国的政治氛围完全如同文革。一帮啥事不懂的大学生被政客忽悠,凡是不同意他们观点的人都被冠以种族主义/性别歧视/...的帽子,关键自己也说不清楚自己到底支持什么。Dan之前也多次对此现象批评,多次感慨美国的精英阶级已经完全脱离群众。就在今天,我们系群邮件又发生了激烈的争论,一位极度左派的白人女生,在被Dan的一位少数族裔男性学生怼了之后,直接高呼这是性别歧视。没想到在研究生院也有这种脑子极其不清楚的人存在。。。

Dan被解雇的事实应该很难改变了。而且似乎Dan也被终生禁止踏入JHU校园,所以以后也不可能邀请到Dan来学校举行讲座。我们很多人在组织让学校能把调查的细节公布——毕竟当时有无数手机拍下了这一段画面,而目前没有一个视频被公开。Dan的说法是,“他们不太可能会公开这些视,因为如果公开,人们就能看到这些学生各个都如同白痴”。不知道调查方是否获取了部分视频,如果有的话,希望可以公开。

=====================================================

大家可以给下面几个邮件发信抱怨,

JHU校长,Ronald Daniels, president@jhu.edu

OIE:oie@jhu.edu

工程院负责人 Christine Kavanagh,christinekavanagh@jhu.edu


现在知道的就这么多。以后如果有新的内容,我会在这里补充其他细节。


user avatar   guoguo-chen-34 网友的相关建议: 
      

没有正儿八经在知乎写过回答,这一次因为涉及到导师的问题,决定认真写一下,不匿名了。

利益相关:我是Dan的第一个Ph.D.毕业生。

关于事情的经过,匿名高票答案已经介绍得非常详细,和我获取到的信息也是一致的,我在这里不再赘述。我想写一写Dan的为人。每个人的心中都有一杆秤,我相信了解了Dan的为人以后,大家对于事情的经过,孰是孰非,自有公论。同时,也缅怀一下曾经的Ph.D.生活。


【工作狂人】

接触过Kaldi的人,相信或多或少都知道Dan是一个工作狂人。Dan的家在西海岸,但是为了有一个自由的开发Kaldi的工作环境,Dan在并不是特别美好的巴尔的摩一呆就是7年(我到现在才意识到原来已经7年了)。除了睡觉和吃饭,Dan的其他时间基本上都在开发Kaldi,当然他偶尔会弹个琴,唱个小曲。我相信Dan每天的工作时间,应该在14小时以上(对的,Dan对于睡眠时间也是有比较高的要求的...)。

我和Dan第一次见面,Dan和我说(大意):Send me emails whenever you have questions, I'm almost always online。说实话我一开始是不相信的,有谁会一直在线呢。但是很快就被事实打脸了。发给Dan的绝大部分邮件,都是在5分钟以内回复的,在我的整一个Ph.D.期间,基本都是这样,不论是工作日还是双休日。对于Kaldi论坛上的邮件也一样,只要Dan起床了以后,对于每一个问题基本上都会回复。我到现在都非常佩服Dan可以这么高效地回复这么多邮件。我自己后来也开发了开源软件,但是完全没有办法回复所有问题。

Dan工作的时候,除了回复邮件,就是在写代码。刚刚去看了一下,Dan在Kaldi上的代码贡献已经上百万了,这还不包括很多写了但是没有提交的代码。有的时候任务紧迫,或者是对某一个想法非常期待的时候,会被叫到Dan的办公室和Dan一起写代码。有一次和Dan一起写代码的时候,正好Dan的女儿打了视频电话过来,要给Dan看看最新画的画,Dan简单评论了几句以后,说爸爸需要工作了,关了视频又开始疯狂写代码了。。。

当然作为工作狂人,Dan不仅仅只有勤奋而已。Dan是非常有天赋的。和Dan工作的时候,经常出现的情况是,Dan给了一个乍看起来不太靠谱的想法,但是实现完了以后却很有效果的情况。有时候常常觉得,他就是为这个领域而量身定制的人。


【纯粹】

工作狂人一般都是有自己的理想的,Dan也不例外。一般和Dan聊起来他最终想做到什么程度的时候,Dan可能会说降低WER(语音识别词错率)。但是如果和Sanjeev,和Dan一起喝几杯酒以后,Dan就会说他要”干掉“Nuance(一家早期非常有名的语音识别公司),给大家提供免费的语音识别工具。

有的时候真的觉得Dan有一种”共产主义“情节。每当有新的数据,新的算法的时候,Dan总是第一时间将其开源,让大家可以免费试用起来。其实Dan如果想的话,他可以很容易地商业化其中的一些东西,或者找一份薪酬高Hopkins好几倍的工作。但是Dan选择了留在并不是特别美好的巴尔的摩,继续他的语音识别开源工作。

他是真的喜欢语音识别这个领域,并且乐于见到人们可以免费得试用语音识别这个技术。


【热心】

用热心来评价Dan,我相信很多人会感到意外。乍一接触,Dan总是给人一种冷冷的,只关心自己的感觉,但是其实接触了以后,会发现Dan其实真是挺热心的。

曾经有一个朋友和我说过,在Kaldi开发的早期,大家跑到捷克开研讨会,这个朋友也去了,但是没有经费。Dan主动和这个朋友共享了一个房间,并且把他的餐费也承担了下来。Dan当时其实自己也没有特别丰厚的收入。

再例如,CLSP(语言语音处理中心)一直希望做一个硕士生项目,一方面提高研究中心的收入,另一方面提高研究中心的业界知名度。CLSP内部一直是雷声大雨点小,大家都说好,但是没有谁实际去推动。是Dan主动站了出来,从制定课程,推动审批,甚至到拍摄宣传片,一应承担了下来,最后促成了这个项目。

还有,CLSP的服务器,原本是有一个管理员叫做Carl的。但是随着服务器越来越多,问题也越来越多(比如过热重启等),Carl一个人处理不过来,Dan又主动兼任了服务器管理员的角色,帮助大家解决服务器的稳定性问题。只要服务器出了问题,不管白天还是晚上,Dan都会来到学校,重启服务器。当然,非常遗憾,这最后也成了这次事件的导火索。我相信在这次事件中,Dan自始至终关心的也只有CLSP的服务器和数据,而并不在乎抗议者背后的政治主张。


【正直】

和Dan接触的这几年让我有理由相信Dan是一个正直的人,他不会说谎。我们有一个天赋非常不错的小师弟,很聪明,干活也很快,但是比较懒。我当时和小师弟工作的时候,需要连哄带骗才能让小师弟好好工作。我和Dan都很喜欢这个小师弟。小师弟毕业找工作的时候,让Dan写推荐信,Dan爽快地同意了,但是也坦言会如实写推荐信,可能会有风险。Dan在推荐信里面如实写了小师弟的天赋,但是也重点写了小师弟的懒,差点把小师弟的工作给搅黄了。最后还是Sanjeev再次补充写了推荐信以后,小师弟才顺利拿到了工作。

Dan不是一个会说谎的人,所以如果他说了他没有打人,我相信他确实没有打人。


【原则】

我想每个人都会有自己的原则,Dan对于自己认定的原则会誓死捍卫。这么些年和Dan接触下来,感觉有两个点是不能触碰的,一个是时间,一个是服务器。

Dan非常不能接受自己(写代码)的时间被浪费。如有可能,Dan会推掉一切可能的社交时间,让自己呆在办公室里工作。有一次,实验室去DC附近开一个Babel的项目会,会议结束的时候,是下午三点多,马上就要开始下班高峰期。Dan非常担心自己会被堵在路上,于是怂恿我和他一起先撤退。出发的时候,因为我倒车速度比较慢,Dan主动要求驾驶,漂移倒车,然后一路飞奔往学校开,直到到了办公室才松了口气,开心地开始工作了。

Dan还有一个不能接受的便是服务器的不稳定。Dan在很多事情上都比较宽容,但是如果谁乱用了服务器的资源,会收到Dan非常严厉的警告。Dan觉得数据和计算资源,对整个CLSP来说,都是非常非常重要的资产,需要随时保证CLSP的每一个人都可以使用到。我相信这也是为什么Dan在这次事件中,会试图夺回服务器,避免数据和及其资源的损失。


【后话】

Dan在业界的能力众所周知,我相信这次事件不会对Dan的职业生涯造成太大的影响,对Kaldi的开发应该也不会有太大的影响(以我对Dan将要去的公司以及汇报经理的了解,我相信他们是支持开源的)。但是,对Hopkins,对CLSP的语音识别领域,在未来几年中会有非常可怕的冲击。对于这次事件造成的后果,我感到非常遗憾。真心希望学校能够给出一个公正透明的调查结果,同时也希望学校,CLSP可以度过这次难关。附一封今天写给实验室同学的邮件。


最后的最后,wish Dan all the best!


user avatar   ChaselLand 网友的相关建议: 
      

女王:求求题主放过我,我可不敢有什么政绩。。。




  

相关话题

  去约翰霍普金斯商学院真的很失败吗? 
  开源与共产主义的本质区别是什么? 
  为什么互联网公司要提供框架、UI库或者接口给广大开发者使用?只是为了展现公司实力吗? 
  为什么很多美国IT公司愿意开源自己的某些代码? 
  给自己在公司的项目用自己的开源软件可行吗? 
  Windows 为什么不开源? 
  如何看待 Daniel Povey 离开 JHU 后加入小米? 
  如何评价Linux发布新的CoC (Code of Conduct) 后引发的部分开源社区的不满? 
  为什么程序员们愿意在GitHub上开源自己的成果给别人免费使用和学习? 
  怎样阅读 Chromium 源码? 

前一个讨论
鸿蒙 OS 的多端自动适配功能,是不是夸张了?
下一个讨论
老公愚孝,该不该离婚?





© 2024-09-19 - tinynew.org. All Rights Reserved.
© 2024-09-19 - tinynew.org. 保留所有权利