这个东西,宣传通稿没有把重点写出来……
倚天710是最新的ARM中核(有X系列以前的大核),加上最新的内存控制器,加强足够多的PCIE通道,加阿里自己的加速器。
即使没有阿里自己的加速模块,128个中核加上DDR5控制器也不是谁都能攒出来的。
华为在鲲鹏920之前,也是攒的ARM大核。920才有自己的微架构。和ARM同时代公版半斤八两。
阿里做这个比较靠谱,在于阿里不用忽悠别人用,而是自己需要。
ARM服务器,你让客户用,客户是有转移成本的。以前的东西转移谁花钱?
但是,自己用是另外一回事。
为什么不买?
一是英特尔在服务器上利润很高,算力很贵。nvidia更贵。
二是有些需求,英特尔不伺候你。你的需求通用处理器效率低,英特尔不会给你单独开发。
华为搞这个要卖给客户。
阿里搞这个,可以先自己用,降低自己的计算成本。
去台积电流片最新工艺,买ARM授权,自己雇人开发,也比买便宜。
而是自己的应用,自己的芯片,可以定制加速模块,有更高的效率。
类似于视频用硬件解码比CPU硬算快。
亚马逊也是从自己需求一步步开始搞云计算,自己搞芯片的。
阿里的业务,是自己写的程序。
移植到ARM服务器上,给加速模块优化,阿里自己可以完成。
对阿里来说,可以降低算力成本。提升效率。
但是,你要知道,阿里是有云业务的。
客户买阿里的云服务,阿里也可以用自研的ARM芯片提供算力。
阿里为了自己需求开发的操作系统,应用软件,中间层。是可以根据客户需求利用的。
客户可能只有明确的业务需求。
我需要一个系统,管理全市的终端业务数据,全市几千人只是登录一个网页操作业务。
但是开发公司就可以用阿里云,把这个程序跑到阿里的软硬件环境上。通过阿里开发的ARM处理器完成需求。
阿里云收租金,卖算力。
这样,阿里自己搞好以后,中国各个公司,部门的数据后台业务,就都跑在阿里的ARM处理器上面了。
阿里去台积电流片,自己做硬件服务器,自己提供软件环境,卖算力。这是不需要政府强制,或者补贴就能循环起来的产业链。
这个不用打自主牌,强制用。
客户自己算算更便宜,自己就用了。
至于信息安全可控。
不是芯片设计能解决的问题,用芯片设计说安全是空中楼阁。
以光刻机为代表的生产设备,各种原材料自主,才有信息安全可控。
说自主芯片设计,就一定安全可控的是骗子。
利益相关:一年前因为研究项目需要,我开始接触到当时还处在严格保密状态下的倚天710芯片。在云栖大会正式发布的此刻,我在不涉密的情况下,稍微和大家聊聊我眼中的倚天710芯片,以及阿里-平头哥的雄心。
通用型CPU及片上系统(SoC)芯片,是整个半导体行业的皇冠明珠,这一个方向占据2020年全行业20%的市场空间,是整个半导体行业最大的单一品类。这个20%也是整个硬科技行业的核心,因为几乎所有硬科技产品都围绕它构建,包括现在我们的新型数字经济背后依赖的各种服务器和数据中心基础设施。
Amazon,微软,阿里这些头部云厂商都有着超过百万台服务器量级的超大规模数据中心,每年的芯片采购费用都是一个天文数字。以100万台服务器的体量计算,CPU芯片成本就要花上十亿到几十亿美元。另一面,Intel和AMD等传统芯片巨头的产品虽然已经树立了很高的标杆,但是各家的业务需求并不一致,使得泛用型的设计很难同时满足各个场景的需要。
因此,在云厂商内部,自研开始成为共同趋势,其中Amazon做的Graviton起步最早,已经发布两代。
而中国企业选择自研,还有另外一重特殊的形势,这个无需多言。
在国内众多互联网巨头中,阿里是最早注意到这一方向的。早在2018年4月,阿里就宣布将进军芯片研发,打造自己的硬科技实力。这话并没有仅停留在嘴上。2018年 9月,平头哥半导体正式成立,并逐渐聚拢了一支阵容耀眼的芯片设计团队。
倚天的设计工作是一边招人扩充团队,一边持续推进的。饶是如此,也只花了2-3年就站到了全球第一梯队里。从一开始,这个项目的立意就定在力求登峰造极。从制造工艺上来说,团队没有选择当时已进入量产、各方面较为成熟的台积电7nm工艺,而是直接选择了不确定性较大、产能排期也很紧张的5nm工艺,用最先进工艺打造倚天710;另一面,平头哥从ARM拿到了当时尚未正式发布、也还不够成熟的新核心,并与ARM一起携手克服了不成熟核心带来的各种技术困难,才成就了全球首个基于ARMv9指令集架构的倚天710。
128核心,3.2GHz主频,96通道PCIE5.0,以及领先业界一年的8通道DDR5 内存子系统,无死角的次世代服务器芯片规格,这是平头哥的倚天项目组在高性能服务器CPU自研道路上交出的第一份答卷。
倚天710今年7月回片时,我在平头哥研发中心亲眼看到了已连续72小时加班加点的工程团队成员们,和他们身后满地的夜宵外卖、饮料包装袋。芯片最后顺利点亮,宣告了流片一次性成功。实测结果,单核性能完全看齐业界当前一代设计,以SPECint17 Rate衡量的全芯片吞吐量得分440,领先业界其他设计20%左右,成为全球ARM服务器芯片新的顶峰。
十年前,阿里决心构建自研的飞天操作系统、盘古存储系统,并依此在随后十年里支撑起了10倍于国际VISA信用卡支付系统流量、专属于国人的“双十一”购物狂欢。而十年后的今天,阿里将芯片设计加入版图,有着一项比“双十一”更为宏大的愿景。
这十年里,阿里随着中国新型数字化经济一起经历了飞跃式发展,成为了一家涵盖电子支付、日常购物、餐饮,出行、物流等众多数字化经济业务场景的互联网科技企业,是全球服务器市场的前五大头部买主之一,服务着十亿以上的活跃用户,用户体量三倍于美国本土人口。
因此平头哥从成立之初,就带着一个使命,那就是为中国新数字经济的运营需求量身打造一款通用高性能芯片,在所有互联网科技企业中,率先将自身承载的中国新数字经济业务,与自己设计的芯片,进行垂直整合。
超大规模数据中心的高性能服务器芯片,面临着许多独特的设计挑战,这是一项超级工程。
这些都是在面向十亿用户的超大规模新数字经济业务运营中暴露出的硬骨头问题。
倚天710是专门为此打造的云原生芯片,所谓云原生的硬件含义就在于,这是业界最先进的服务器芯片架构与工艺,和面向超大用户基数的云上业务的互相融合。倚天710芯片内已经部署了针对阿里集团业务设计的第一代专用加速电路,以此强化硬件与软件的连接,更好地服务阿里集团的电商,存储、搜索、推荐等众多核心业务以及阿里云上的各种外部客户,也包括正在使用支付宝、淘宝、菜鸟物流、高德地图、饿了么、优酷的大家,倚天系列芯片将成为驱动中国新型数字化经济背后的核动力。
最后,大家肯定有一个问题想问,既然决心要高度定制化,那什么时候能看到阿里的自研CPU核心呢?
杨伟院士有一句话说的很好: 大家想要的,最后都会成真。
而阿里与平头哥想要的,还远不止一个自研CPU核。
最近有不少朋友问及我对这颗芯片的看法,以及进一步的问题是:“怕不怕啊?”
╮(﹀_﹀)╭ ……怕? ……不怕? ……
要想说什么的话,先用一句诗来描述吧:
等闲识得春风面,万紫千红总是春。
这颗CPU厉害吗? 当然厉害!
我是看不懂这知乎的键盘侠们到底是凭什么在DISS,u can you up啊,不要老是讲什么公版、制造,你要是能做到同级别的水平,阿里P10+的薪水你拿着不香吗? 还是说你这都看不上吗?
440分,这个分数是人类有史以来处理器性能的最高分! 重复一遍,有史以来。前无古人,虽然……后有来者。
N2的CPU,也是当今世上能买到的能效比最高的ARM core了,倚天的速度也是让我万万没想到(预估N1来的),基本上这是项目经理拿着乌兹冲锋枪顶在N2的coder背后,押着写完代码然后打包上车的画面感。
天下事有难易乎?为之,则难者亦易矣;不为,则易者亦难矣。走出第一步!远比假想和空谈伟大的多得多,因为,只要坚持、坚信,那第二步、第三步,在路上。
再看看周边的评价,先不说知乎刷屏一般的软文控评(注意没有被禁止哦)。人民日报!参考消息!环球时报! 不要认为你比国家官方的视角更加真英明神武,看看新闻,马爸爸都去西班牙开心玩耍啦,那叫一个体面。怎么算这块CPU都是个加分项。
我觉得吧,其实阿里是把难题提给了投芯片的VC同学们。
AI投了一波、DPU投了一波、GPU也投了一波,CPU作为皇冠上最大的明珠,IC界最高revenue的单品,一直没人敢搞。
看看阿里,是不是也没那么难啊? 按照知乎网友的描述,买ARM的设计,找台积电投片就行。两年时间就能刷新人类有史以来的成绩,人民日报给你撑场子这PE该怎么算? GPU能做到吗? 是不是觉得错过了什么?
好吧,我真的就讲一讲阿里的倚天710。
下面是我猜测的倚天架构图,你可以从google得到这张图。我后续的信息都从这个假设开始,当然也可能我的猜测是错误的(ಡωಡ) 不可尽信,不可尽信。
每颗芯片内部有两个DIE,每个DIE内部有64个CPU,每两个CPU为一个cluster,共32个cluster(图上可数一数),即最终128核CPU。
~~~~~
要问这个架构强大在什么地方? 在于扩展性。
它基于CMN700互联,支持64-256核每个DIE的集成能力。
没错,如果只看参数,阿里只实现了这个架构的丐版……
再看一下这个新闻,无巧不成书,它就出现在倚天发布的第二天。
嗯,160核600分,虽说是下一个史上最强。但还是有点保守啊,下一位同学报多少? 192还是256? 给一点想象空间嘛。
我跟你港,我不是个乱讲话的人。google一下,ARM N1 core的尺寸你可以在AWS graviton的公开材料中获得,N2相比N1的尺寸变化在ARM的公开材料也可以获得,扣除销售吹牛逼的部分,N2的核大致在1.5mm上下,64个core也就96mm。倚天710的面积在发布会上给的信息是314mm per die(核占比可算),而TSMC最大可以做尺寸是830 per die,怎么算这成长空间都相当大。嗯,我小学数学学得蛮好的ヾ ^_^♪
~~~~~
那么这个架构的缺点是什么?
如果你认真看看图,能看到大量关于CCIX和PCIE的描述…… Die2die和chip2chip都是这玩意儿。
这玩意儿对吗?
我们回顾一下阿里发布会上的信息。5nm工艺,628mm面积,600亿晶体管。再看看恰好这周发布的apple M1 max,5nm工艺,432mm面积,570亿晶体管。
如果有人报错了数字给领导要下课,那不是我的问题。但假设两组数字是没错的话,两者的单位面积晶体管数量差别这么大的答案其实也不难猜,Die2die和chip2chip的CCIX和PCIE的模拟电路大幅降低了5nm工艺的密度。
当然,其实这里是两个问题:
一个是模拟电路放在5nm做是非常不划算的,因为16nm的模拟电路并不会比5nm的模拟电路大多少,所以这是一个chiplet的划分问题,正确的分DIE姿势在鲲鹏920的论文中有描述。
二个是CCIX这个东西吧,无论做die2die还是chip2chip都是不合适的。当然这是我一家之言,我曾三次反对在CCIX引入对称一致性,否则不仅仅会坑死CCIX,还会…………无果………… 后来有人问我,难道这么多大神都不懂吗? 答案是复杂的,如果要我现在来说,要完美解决这个问题,得凑齐七颗龙珠才能许愿拯救世界,也许他们都知道,只是龙珠凑不齐吧。
ps:我甚至发现身边这些年一起走过来的兄弟,也都逐渐忘记了七个龙珠都在什么地方。嗨,吹一波逼,还好我这个人有一个奇妙的特长,过去几年发生过的,有逻辑关联的事情,都能够历历在目,以前我以为所有人都如此,长大了才发现好像并不是→_→。
~~~~~
扯了这么多废话,也不知道算不算回答了这个问题……
如果你还是要问我“怎么看”、“怕不怕” 这个问题,想起一首诗……
风雨送春归,飞雪迎春到。已是悬崖百丈冰,犹有花枝俏。俏也不争春,只把春来报。待到山花烂漫时,她在丛中笑。
哈哈,如果一定要嚣张一点的话,也可以是另一首:待到秋来九月八,我花开后百花杀。冲天香阵透长安,满城尽带黄金甲。你又怕不怕? (ಡωಡ)
其实,人生就是一条路,前进之路,有同行者打一架,不孤单啊。
阿里这两年负面报道很多,但是无论如何在做芯片这件事儿阿里是认真的,投入是巨大的,成果在不断的产出,「倚天710」就是个很好的例子,这是值得尊敬的。先不说「倚天710」这颗芯片如何,单就阿里平头哥能够发布这样一颗芯片来说就已经是一个亮点了,阿里平头哥成为继华为之后中国大陆第二家具有研发较高端芯片能力的厂商。
硬科技还是数字说话,我们先看看倚天710这颗芯片:
5nm工艺,集成了600亿晶体管,基于arm V9架构,单芯片集成128核,集成8通道DDR5,支持PCIe5.0,SPECInt2017达到440分,能效比提升50%。
阿里平头哥的这颗芯片大致处于什么位置呢?不管是arm处理器还是服务器处理器,阿里平头哥都是第一次,这个行业早有先行者,最著名的就是亚马逊和华为。
比起华为和亚马逊,阿里平头哥是个后来者,虽然有时间差等因素但是即便如此能发布一个明显超越前辈的处理器依然是值得赞赏的,这是一份令人满意的的答卷。
研发这样一款芯片很难吗?数码圈曾经很多人说IP核是arm的,从arm买了授权组装一下不就可以了吗?然而并非如此,如果这么简单为什么过去几年国内只有华为取得了成功?国内不缺芯片公司但是缺做高端商用芯片并实际使用的企业,以前华为算一个,现在还要加上阿里,更何况无论从哪个角度看倚天710这颗芯片规格都是业界领先的。从设计方面来说,这颗芯片有两大难处,一个是首发arm V9的挑战性,另一个就是单芯片128核的挑战。
以往首发arm最新架构的都是手机芯片,这次变成了阿里平头哥,平头哥第一次做arm芯片就选择了首发最新架构,只能说勇气可嘉。arm V9架构是今年3月31日推出的新架构,从芯片设计的角度来看,倚天710这样一款芯片从着手设计到发布要1年甚至更久的时间,当时新架构属于未发布的不完整状态,阿里平头哥需要与arm一起趟坑。这在芯片设计方面是一个很大的挑战,所以通常首发arm最新架构的都是有钱又有实力的老牌IC企业,阿里平头哥首发arm V9估计很多人都没想到。这也从一个侧面说明了阿里平头哥的研发实力不可小觑。
首发arm V9是挑战,更大的挑战是单芯片128核的设计,手机、PC上的芯片多数都是六核、八核的,服务器上华为、亚马逊的产品增加到了64核,但是单芯片128核的从来没有,因为在单芯片下集成128个核心会面临很多的问题,比如多die下die间通信对性能带来很大冲击,而且面临带宽瓶颈,这一直是业界的难题。这么说你可能不太理解,我们举一个例子,比如快递公司有一个停车场,里面停着64辆运输车,当遇到双十一之类的大购物节很可能因为业务繁忙,很多车进进出出在停车场都会发生堵塞,如果这个停车场有128辆车呢?仅仅是杜塞问题吗?显然不是,还以快递公司为例,可能有的人一次寄送了很多东西,一辆运输车装不下,这就需要两辆甚至多辆运输车,他们还要做好标记是一个快递单,卸货的时候放在一起送给客户。这就是多核的同步一致性问题,核少的时候不难,到了128核会变的异常复杂。这就是单芯片128核面临的带宽瓶颈问题和一致性问题,平头哥对于片上互联作出特殊优化,采用新的流控算法,降低系统反压,有效提升了系统效率和扩展性。此外,通过新的系统地址到DRAM地址的转换机制,支持安全、非安全隔离、多NUMA、异常通道隔离多种特性,同时DRAM读写效率大幅度提升;在后端物理实现方面,灵活调度多达30种不同EDA软件、深度定制时钟网络和定制IP技术,此外平头哥还采用了先进的多芯片堆叠技术,最后成功确保了芯片性能、功耗的优化。
做芯片难不难?做一个芯片不难,做一个高端芯片并实际商用很难,雷军说做芯片是九死一生,10亿元投入起步,10年出结果。雷军的话未必准确,但是可以看出来做芯片确实不容易,而平头哥从成立到现在仅仅几年时间可以说硕果累累。
目前阿里平头哥已经拥有全栈芯片产品家族,面向终端场景,拥有丰富的玄铁系列处理器IP,面向云端场景,已推出AI芯片、通用服务器芯片等,既有RISC-V架构又有arm架构,芯片版图已经逐渐清晰。
可以看到阿里平头哥这两年走的很稳,如果仔细观察会发现阿里平头哥与华为海思的路子是如此的相似。投入巨资研发,做芯片哪有不花钱的,雷军说的10亿元投入是很少的,比如倚天710这颗芯片采用的5nm工艺制造,不说研发费用光一次流片(Tape Out)都需要花费巨资,门槛非常的高,所以能持续投入研发的都是华为、阿里这样的大企业。有芯片只是第一步,还需要具体的应用场景落地使用,然后持续的迭代更新,没有应用的芯片是没有价值的,两年前问世的阿里第一颗芯片含光800已实现规模化应用,通过阿里云服务了搜索推荐、视频直播等行业客户。
是不是有了倚天710,有了含光800,阿里云就可以不用intel的处理器了?这不可能,因为生态等原因,云服务市场主流还是intel处理器,但是这些自己研发定制的处理器可以更加高效的处理一些特定场景应用,也更有竞争力。目前阿里云全面兼容x86、ARM及RISC-V等架构,依然会与Intel也将持续保持合作,平头哥基于ARM架构芯片在并逐步部署到阿里云数据中心后为云上企业会有新的算力选择,这是三赢的事情。
阿里是一家庞大的公司,涉及的业务也非常的多,这两年受到的争议也很多,但是不管怎么说阿里平头哥都是绝对值得尊敬的。坚持投入研发,以先进的科技产品改进自由业务,降低成本,掌握核心竞争力,这是华为走过的路,也是阿里在走的路,希望更多的企业走上这条路。
也许多年以后谈起阿里人们的印象不再是卖货的,而是让人肃然起敬的科技公司。
阿里平头哥团队在很短的时间做出这么大一颗基于公版ARM V9的CPU,是很值得尊敬的。
但设计出这么大的系统,包括构建了这么多核心,成本方面还是需要细算,毕竟CPU不像GPU是板卡,涉及的因素太多;一次投片成本还好,但后续几个版本的迭代,长期向后/向前兼容的考虑,会是更大的成本项。
谈谈产品定位和应用适配:
按照这个配置,应该是整机外销不了的,定位只会是搭配阿里巴巴自用的专属机架:可逐步替代阿里自有的电商、搜索、存储、推荐系统等等;以及在公有云/混合云toB的“去A领域”可以搏投标;以及在阿里所探索的端云应用协同方向,如云手机/云游戏等,都是可能大范围替代X86体系的。
当然,这同样面临OS和应用适配的问题,虽然对于最终客户感知不到,因为云的虚拟化技术已经隔离了这种兼容壁垒,但是云本身的OS、Stack和各类组件、runtime与API以及编译器,都需要重写兼容性或是增加二进制转译的开销。虽然公版V9已经在向后兼容、甚至向x86应用兼容方面做了不少工作,但软件依然要适配,哪怕是单点微小工作量的适配,放在云大系统上,也会是系统级工作量;并且最重要的是,哪怕是微小的适配,也需要生出一个“独立版本”,开发团队必须在一朵云上同时维护着两套软件栈版本。随着下一代硬件和软件设计思想的更新,这两个版本需要开发团队同步迭代,要么彻底替换全部X86机型,但这是不可能的,阿里自身的应用也许能100%替换,但云计算租户(公/混)仍然需要X86应用环境。
目前的倚天系统,一定是针对阿里自身应用特点、workload、能效经济性,甚至机型、物理机架的构型、配电和空间利用率做过极致优化的。毕竟倚天不像是华为鲲鹏那种为了商用外销、板载合作伙伴、供应链和渠道而做出通俗性妥协定位的设计,而是会成为AWS Graviton那样的云原生机型。因此可能面临短期商业转化低、压低产能的问题,不会生产太多,因此单颗成本会极其昂贵。
再推测其5nm的制程,全球仅有TSMC和Samsung可以承接商用流片,相信会是TSMC了;那么倘若投产微小的产量,就换不来TSMC的优先产能,换不来原本会有的量产折扣;同时在板级系统的生态里,也很难在惯例成本线上换来(OCP)主板厂商的极致定制化的支持。(另外TSMC子公司GUC的design service同样昂贵)
谈谈商业化方向:
最后,倚天系统的初期商业转化,可能围绕着阿里自身应用中的某个系统,逐渐完善兼容性并替换一部分X86机型。以及,由于如今ARM Server已然算是我国政企、信创的主场了,由政府项目主导的OS和应用适配工作如火如荼,因此公有云/混合云的交付需求不会被忽视,阿里云显然会推出新的倚天机型,以更高的性价比及其兼容性吸引这些需求,当然前提是先去兼容UOS/麒麟等信创版OS。
BTW:听闻字节跳动也在研发ARM服务器产品,加之百度、AWS的在场,那么相信ARM Server的未来会成为云原生和互联网自用机型的主场,并且将在OCP等生态项目中占据重要位置。
挺搞笑的提问啊……
斯诺登都过去这么久了,
不会还有人不知道拉登塔利班什么的一开始都是美国资助的吧?
恐怖组织?
美国不管它们,它们发展的起来吗?
大部分恐怖组织不就是美国为了搞俄罗斯或者其他人搞出来的代理人吗?
====================
嗯,对了,不懂的可以去看这个,
这个问题我替瓜答了
“我来这里的目的是带领曼城取得好成绩,并将曼城塑造成一支豪门球队”
“我知道应该怎么带领球队取得好成绩,也知道如何塑造一支豪门”
“所以我用我的方式管理球队,这不仅仅是对曼城负责,也是对我自己负责”
“我所做的一切事都是为了以上的目的,就这么简单。”
对于竞技体育的从业人员来说,自身的唯一价值就是在比赛中取得胜利。在竞技体育俱乐部里谈政治阴谋太可笑了。对于教练来说,只要不违反法律法规,一切手段争胜的手段都是正当的,当然包括弃用不合自己要求的老将。教练就应该用一切手段争取胜利,这是对俱乐部负责,也是对自己负责,因为不赢,教练就什么都不是。
假如你是个羽毛球运动员,你的老球拍用了10年,突然发现有了更好的新球拍卖。那你就应该毫不犹豫的放弃老球拍,去买新球拍。
在现实社会中换人比换球拍更复杂一些。但道理是一样的。
从2020年开始,数码相机的销量急剧下滑,价格迅速飙升,现在5500元已经买不到什么正经好用的微单相机了。只能从卡片机中选择。
Canon G7X markIII这个产品,虽然没有旗舰手机的超广角,但是操控非常方便,抓拍扫街都毫无问题。
优势体积小,操控比手机好,揣进衬衣口袋或者沙滩裤口袋,不至于把沙滩裤拽下来。可以拍摄RAW格式,在曝光不准确、大光比环境和夜景、昏暗地方后期处理空间很大,而且还有各种SCN场景模式帮你拍到很多有趣的照片。
具备竖拍视频功能。
Canon G7X markII我曾经用来拍过很多有趣的抓拍照片。因为相机内置ND8灰镜,白天也可以 拍摄比较慢的快门,在人文摄影中比较方便实用
拍风景照片也不错