百科问答小站 logo
百科问答小站 font logo



如何看待 19 岁少年想做出在目前 Intel 同等计算性能下降低 80% 功耗的全新电路系统芯片? 第1页

  

user avatar   sean-64-30 网友的相关建议: 
      

如需转载请私信联系。

--------------------------------------------------------------------

我去!居然有这个问题!必须我来答!!!!

因为机缘巧合,我和新闻中这个少年的创业公司一起工作了两周,对他们的思路也算有一定了解。

事情是这样的,这个少年在某学术会议上发言,由于思路和我导师比较相近,就被引荐给了我导师。由于我导师对memory方面很在行,而他们的长处在于微处理器架构,于是就导师把他们邀请到我们课题组工作了两周,双方取长补短。新闻中的这个Thomas和他的CTO Paul两个人过来的。他们昨天的飞机刚飞回加州,这两周有不少有意思的事儿,暂且不表。先认真答题。

首先他们的Target是High Performance Computing(高性能计算,以下简称HPC,主要应用于超算),而不是我们日常用的General Purpose Computing(通用计算)。而HPC这个领域做芯片的一大优势,就是很少用考虑向前的兼容性(对比于x86),而且可以针对大多数HPC应用的特点对架构进行特别的优化。夸张点说,就是根据软件的行为设计硬件,砍掉一切不需要的部件,从而达到效率最大化。另外他们所说的指标,应该是从系统层面来比较的,而非单个芯片进行比较

下面根据他们公开过的资料说一下他们一些独特的思路。

  • 采用VLIW (Very Long Instruction Word)架构。简单来说就是几条并行的流水线,可以同时执行多条指令。由于超算应用中有大量的并行运算(矩阵向量运算等),因此非常适合并行化,采用VLIW流水线利用率比较高。相比于multi-issue,out of order的通用芯片,硬件逻辑可以更简单。很多DSP芯片都是采用VLIW架构,可以达到很高的(浮点)性能功耗比,已经完爆现在的Intel产品了,但要让他们跑Windows什么的一样抓瞎。。所以题主在这里用Intel的芯片和VLIW架构比较是不太恰当的,毕竟设计目的不一样,就好像比较超跑和拖拉机哪个更好一样。。耕地当然用拖拉机了~~
  • 完全摆脱虚拟内存!这个听起来好像疯了,但其实在超算领域反而make sense,因为超算一般一次只跑一个程序,或者很少的程序,很少需要context switching。因此一个地址空间够用了。而传统的通用芯片因为支持虚拟内存,不知要做多少无用功。去掉虚拟内存和paging,硬件上就不用TLB了,系统层面也不用再不停维护page table了。这是很大的开销,尤其是超算集群,相互访问内存是很麻烦的。
  • 砍掉Cache,采用软件管理Scratchpad Memory。这个听起来也是疯了。。传统的芯片都是有Cache的,cache miss和coherence是架构设计者永远的痛。而超算领域,写超算应用的人一般都是知道自己在干嘛(know what they're doing)。于是他们的芯片里会有一部分访问速度会很快的Scratchpad Memory代替cache,但只不过是由程序员手动管理而非交给硬件管理的。这样也可以砍掉相当多的硬件电路,效率也更高。
  • 采用2D-Mesh,static routed网络。这一点是他们的初始思路,但讨论过后发现可能会有问题,所以他们现在其实也还不是很确定以后会不会这么做。所以这点也不展开了。

如果以上几点能做到的话,比现在采用Intel CPU+Nvdia GPU的超算超算省电真心不是一点半点。当然他们的思路比较激进,不知道后面会遇到怎么样的问题,不过现在看来还是很可行的。

最后默默感叹一下,虽然这两位少年都很谦虚且平易近人,但是那种智商和能力上的碾压让我真正体会到了人和狗的差距T T

---------------------------------------

感觉大家对八卦都更感兴趣么=。= 那补充一点好了

CEO是一个19岁的娃,高中都没读完就辍学了,然而因为太耀眼还是被MIT相中去!做!科!研了!!注意,不是被MIT录取读本科读PhD,是直接去MIT做!科!研!了!在MIT工作了大概两三年以后辞职创业,现在才19岁!!!

我们第一次见他的时候并不知道他才19,只是看他满脸青春痘应该还是挺年轻的。。有一天工作之余大家开始讨论《权利的游戏》(别说我们工作不认真啊),后来说唉第一本书是哪年出的啊?谷歌了一下,《冰与火之歌》第一卷出版于96年,然后这位少年嘀咕了一句“That's older than me”。。我们其他人就。。。。

说他是天才,智商是一方面,关键是19岁就有如此强大的知识储备和洞察力。平时工作的时候,我们这些研究新生只能和他讨论一些技术层面的细节问题,但一旦他提起一个什么idea,多半还是得和我们导师或者组里的大师兄才能聊得来。。他对Computer Architecture这方面的历史了解的非常多,经常能讲出一些他出生以前就发生的事儿。。

后来有一次聊天得知他家就在硅谷当年DEC的工厂附近(现在很多人都没听说过DEC了吧),周围住的基本都是工程师,父母是做什么的我没有问不过十有八九也是做IT的。我觉得他年纪这么小就有如此强大的积累和敏锐的直觉,和他的家庭成长环境是分不开的。

CTO Paul没有CEO那么耀眼,不过也是很聪明,从小就是代码小神童的感觉。大学只上了两年就辍学加入Thomas的创业公司,但在此之前他就已经是Linux Kernel Contributor了。。CEO对他的评价就是"he learned Linux before he was born"。我们工作的这两周他说话比较少,就是埋头写代码,专注程度让我羡慕。但我们一旦有点能请教他的技术问题,打断他一下分分钟就给我们解决。。

两个娃人都很nice,完全没有恃才傲物的感觉。能跟他们合作也是很开心~

-----------------

关于一些热点问题以及其他答案的解答:

1. 他们官方网站中对性能指标的宣传,我在评论中也说了,当然是给投资人和媒体看的。但作为一个初创公司,你不把目标定的远大一点,市场前景描述的广阔的一点,谁给你投资啊=。=

2. 虽说是为了拉投资,但这两位创始人绝对是在非常认真地做事儿,不是像某些人想的那样拉来钱玩一玩(这么说的人我也只能恶意揣测一下你们的境界也就如此了)。在我们实验室工作期间他们两位一般都是最后离开的,而且每天工作餐都是在楼上自动贩卖机买一点零食回来边工作边吃了,周末还开车8个小时去见投资人而不是买飞机票去。

3. 最后不管他们最后成功也好失败也罢,我都很佩服不到19岁就敢到巨头垄断的行业去分一杯羹的少年。


user avatar   lxhfirenking 网友的相关建议: 
      

貌似这是我第一次在知乎上回答我投入时间最多的专业的相关问题。

----------------------------------------------------------------------------------------------

首先说明一点,“同等计算性能”这个概念基本是没法衡量的,除非所有standard benchmark全部跑出同等,这两位天才所要做的其实是个适用范围非常非常窄的高性能芯片,而不是Intel主流芯片那样的商业产品。每年各个大学的computer architecture research team都会有非常多的新的点子,往各方面探索各类新颖的micro architecture甚至architecture方案,如果论某方面性能,或者功耗,这些research team出的玩意常常都能爆掉主流芯片很多,不然还发个毛线的paper啊。

但是,重要的事情说三遍:

高性能/低功耗的研究芯片和好的商业芯片是两个概念。

高性能/低功耗的研究芯片和好的商业芯片是两个概念。

高性能/低功耗的研究芯片和好的商业芯片是两个概念。

高票回答里已经把这个团队做的创新点都说的非常清楚了,而且这些创新的方式都能在不同程度上对于芯片的功耗和性能有很大的提升,但同时却把芯片的适用性范围一缩再缩。下面我就一个一个分析一下。

  • 采用VLIW (Very Long Instruction Word)架构。VLIW芯片只有在处理大量可并行的,有较少data dependency,很少出现branch或者jump的指令(比如DSP里的那些大量ALU指令)才能发挥出其完爆如今多线程OOO架构的能力。但这样做的太假会使compiler优化的工作量大量的增加,如果跑的是普通的work load的话,binary code size也会bloat很多。但这个不是最致命,VLIW适用性最大的限制在于为了能尽可能的利用这种架构的性能,架构设计师常常不得不把很多micro architecture相关的内容,比如rotating register,比如ALAT暴露给用户,这使在未来进一步的发展中micro architecture designer受到的限制会变的很多。没错Intel IA-64我说的就是你。当年Intel几乎是赌上公司的workstation市场的命运,而且在占据不小的市场的情况下力推VLIW Itanium,结果仍然以失败告终,其原因无非是VLIW这种看着很漂亮的架构会带来实在太多的compatibility issue,而大多数用户们可不想把自己的所有代码全部重新编译,重新优化,他们当时想要的只是个能完全兼容老代码的64位的x86芯片罢了。而Rex芯片也完全不能避免这种问题。
  • 完全摆脱虚拟内存。这个的确能省掉很多的事情,架构也一下子变得简单很多。但别忘了,最早的芯片也都是没有TLB等虚拟内存系统的支持的。之所以有了这些东西,无非是大家认为人的时间比机器的时间(和电费)值钱,与其让码农话用那么多时间调配内存地址,还不如在效率上稍微compromise一点。还有说超算里不需要很多的context switching这话对也不对。理论上只要你的physical core够多,当然可以给每个core只分一个process。但这样自然会降低core的利用率。比如跑个标准的map reduce task,map task快结束的时候会有大量的storage write发生,如果没有很好的context switching能力的话那么负责这个task的core现在就只能挂在那里等DMA把活干完,而不能switch到另一个task里。
  • 砍掉Cache,采用软件管理Scratchpad Memory。这其实和上一个一样的问题。human hour vs machine hour。scratchpad memory就是把本来电路做的事情交给人去做了。作为架构师能省掉multi level cache coherence这种好事我自然是觉得喜大普奔的。快吗?快!难用不?难用。码农们不要打我们就是了。还有一点就是写超算底层应用的人可能真的know what the are doing,但在big data如此盛行的阶段,很多想让自己的应用在超大型cluster上跑的人可能根本就不是超算出身的。更不用说像Hadoop-YARN这种连resource management都是用java写的玩意该怎么适应这种新的架构了。
  • 采用2D-Mesh,static routed网络。恰巧我跟班参与的research team(教授是原来的Tilera的cofounder之一)做的research chip (硬广告:请搜索Princeton Piton Processor)也用了类似的架构来达到非常好的multi-core scalability,我能说的只是如果Rex准备往many core方向走的话,这个是个不错的选择。

总结一下,如果作为一个architecture research team,Rex团队真的有很多新颖而实用的想法,两位天才若真的加入MIT的research team,相信也必然能非常的有所作为。但很不幸的是,如果是为了制造出一款被大规模cluster广泛采用的芯片,这些为了性能而舍弃compatibility和易用性的设计选择可能反而会背道而驰,因为他们不只是在开发一款芯片,而是在创建一个新的Architecture,一个没有任何人帮着开发和优化compiler,没有任何人用过的architecture。我不止从一个教授那里听到这句话:Micro proccessor design is all about compromise。那种想打破当前使用者的惰性,彻底革新micro proccessor architecture的事情,相信每一个CompArcher都想做,但Intel做过,Sun做过,结果大家也都看到了。x86这种被几十年骂成狗的玩意现在还在活蹦乱跳不是没有原因的。

祝两位天才好运。

------------------------------

话说125万的投资可能只够在IBM或者TSMC用32nm流片一两次吧?希望MIT至少能为两位在财力上给够支持。


user avatar   dongguage 网友的相关建议: 
      

我个人并不是很看好。

html5,js以及类似的技术替代原生大家喊了很久了,就是大热的react native目前看来也依然很不完善。微信的应用应该都是运行在腾讯浏览器的X5内核里,这东西怎么样大家心里也都有数。我感觉还是只能做一些低交互的应用,大概也就是比网页快捷方式高一级别,要利用os的炫酷特性,原生还是跑不掉,而且目前原生开发很成熟了,框架库很多,门槛也很低。

对于不用下app省空间我不是很理解,只不过是把app浪费的空间挪动到微信里而已。

微信所倡导的用完即走的理念也只有腾讯有资本装b才会这么说,其它公司无论如果始终还是会想办法更多的占用用户的时间。

腾讯现在原本就掌握了渠道,现在连app的审核等生杀大权也都掌握,你说苹果恶心,但他起码还勉强算公平,而腾讯可以随便打着为了用户(和你妈说为了你好)进行系统抖动,非腾讯系全都会抖,想怎么搞你怎么搞你。


结局都是类似的,中小型公司都很激动,以为有了小应用他们就有了腾讯爸爸的几亿用户,这种幻觉很美好,但他们可能会面临更加惨烈的竞争,变成临时解决用户欲望的千斤顶,以及腾讯渠道那可怕的推广分成费用。大公司肯定都很不情愿的跟进,又没办法,估计会简单开发一些应用,然而尽可能的往自己原生的app上导入,心态很微妙,不过短期内肯定会先爆发一波星座血型算命起名你的前世今生颜值计算能活多少岁等一些QQ空间喜闻乐见的低质量辣鸡应用,目前也不知道腾讯审核时是否会做一些限制。

微信也许已经不是聊天软件了,我朋友偶尔用了一下QQ,惊叹的说,QQ真好用呀,聊天记录都能自动存下来! 微信当初也许吸引大家的是我们只想要一个广聊天的QQ,现在已经要变成微信os了,是不是以后也要走和当年QQ一样的路?整个腾讯系全压在这款app中? 我不知道,在集团利益,业绩增长的车轮下,什么张小龙王小龙,什么鬼的用户体验,什么产品经理说不的坚持,有多少碾碎多少。

仅是个人一点感悟和粗浅看法,不太对请见谅




  

相关话题

  如何看待 8 月 24 日台积电公开的 7、5、4、3nm 工艺细节?有什么值得关注的信息? 
  PCIE通道,CPU/GPU缓存,内存,硬盘将来哪个环节有可能取消? 
  现在高端笔记本电脑的CPU真的性能过剩吗? 
  如何看待 AMD 2020.10.8(当地时间)发布的 Zen3 处理器?有哪些亮点和不足? 
  CPU 在流片之前怎么评估其性能? 
  如何看待英特尔 12 代酷睿 i9-12900HK 跑分曝光,超越苹果 M1 Max? 
  如何评价 AMD 6 月 1 日发布的 3D Chiplets (3D V-Cache)技术? 
  为什么 ARM 和 MIPS 那么多寄存器,x86 那么少? 
  既然单个CPU性能提升有困难,为什么不把主板设计成双CPU的呢? 
  有哪些芯片流片失败的故事? 

前一个讨论
2015 年 7 月 23 日,NASA 宣布发现 Kepler-452b 意味着什么?
下一个讨论
互联网公司要不要请明星代言人?





© 2024-11-08 - tinynew.org. All Rights Reserved.
© 2024-11-08 - tinynew.org. 保留所有权利