从H20到H200,国产算力差在哪儿?

liukang20245小时前吃瓜知乎372

图片来历@视觉我国

从H20到H200,国产算力差在哪儿?的照片

文 | 董辅导聊科技,作者 | 董辅导

英伟达最近动作不少。先是11月上旬,向咱们国内出口了特(yan)供(ge)版的H20芯片,接着一周后就又发布了面向海外的H200芯片。

看得出,这次芯片命名,老黄仍是花了点心思的。特供和美版,肉眼可见的十倍距离,应该会令想制裁我国的登哥十分满意。

H200的确很强,H20听说也很受欢迎,那么,国内GPU就真的不行吗?距离到底在哪里?

众所周知的一个距离是在“算力”方面,也便是单位时刻能处理的信息。这个距离的补偿主要靠“规划和制作”。芯片制作只能步步追逐,需求设备、资料、工艺等等的归纳进步;而规划方面,需求靠堆集,但也现已没那么差了。

比方从算力视点来看,国产一款910的产品和H20比照的话,半精度算力还比H20高呢。那差在哪里?

在显性算力的背面,隐性的距离,其实是在“网络”和“存储”,或许一致而言是“带宽”。

假如以厨师煮饭来做比方的话,高算力就相当于手工精深的大厨,能做好菜、能高效做好菜;但做菜还需求运送,比方把菜从商场买回来、以及,把菜洗好传给大厨。假如买菜很慢、或许传菜很慢,那么大厨再牛也难为无米之炊。

网络和存储,便是买菜和传菜;它们便是其时约束我国算力大厨的隐性关卡。为什么会这样?又该怎么破解呢?

01 省掉一步,更快速度

特斯拉有一个超算中心Dojo,作为其智能驾驭的火力支撑。但是,特斯拉FSD V12版别的练习,却并不是依托Dojo,而仍然是英伟达。

马斯克对此称,“现在遇到的最大技能困难,是需求像InfiniBand那样的高速网络衔接来并行更大的算力。”

说到网络衔接,就得先从美国施乐说起,也便是养活了微柔和苹果的那位大哥。在核算机初期,网络衔接有各种规范,不简单相互通讯。后来,施乐在公司内部使用了一种衔接规范,便是以太网的雏形。1982年发布了以太网规范。

以太网规范下,服务器之间的交互流程是应用程序的数据,先到中心内存,再送到网卡,然后经过网卡,送到另一台服务器上。一切的信息对接,都要经过内存转化,增加了CPU的担负,也增加了传输的时延。

这就比方咱们打车。乘客打电话给出租车公司,公司再打电话给司机;司机到了之后,也不联络乘客,而是打电话给公司,公司再打电话给乘客。优点是牢靠、便于管理。但缺陷也很显着,流程太长了,信息来回传递也不便利。

业务量少的时分,没有问题。但一旦数据量太多、需求许多,那么,功率就会有扣头。这关于AI而言,就十分显着了。

大模型便是经过很多数据的很多核算,然后发生了出现。数据传输快一点,才能也就会更强一点。假如数据都传得很慢,怎么或许很多核算呢。

细腻的从H20到H200,国产算力差在哪儿?的插图

所以,InfiniBand锋芒毕露。

1999年,InfiniBand交易协会建立,意图便是为了“干掉”传统以太网。方针很大,敌人也很强壮,抵挡很困难。以至于2002年的时分,英特尔就从这个协会里退出了,随后微软也退出了。

但建立于1999年的Mellanox还在坚持,2001年还推出了首款产品。InfiniBand的特点是,数据,不经过中心内存而是直接经过网卡衔接。

这个形式关于数据中心而言,作用十分好用。由于数据中心的场景很固定,也没有各种需求。所以,Mellanox很快就成为了数据中心网络衔接的老迈,市占率一度高达80%。2013年,Mellanox还收买了硅光技能公司,让数据传输进一步加速。

Mellanox的高速开展,也招引了巨子们的重视。GPU的高速并行运算,合作高速数据传输,关于英伟达而言,可谓是:

周董看到了优乐美。

所以,2019年,英伟达(Nvidia)公司豪掷69亿美元,打败对手英特尔和微软(别离出价60亿和55亿美元),把Mellanox捧到了手心里。英伟达也拿到了InfiniBand这个利器,令世人看不惯又干不掉。

但随着英伟达在AI范畴的位置越来越明显,“抵挡”也随之而来。

超以太网联盟(Ultra Ethernet Consortium)在本年建立,期望用新的协议来抵挡。UEC 集结了AMD、Arista、博通、思科等设备商,以及Meta、微软等云厂商。而协议的规范也比较清晰,“打不过就抄过来”。

明显,在网络衔接端吃亏的,也不只是咱们的算力公司,马斯克不也诉苦了么。谁让英伟达眼光好呢,只能等超以太网干活了。

02 先进封装,黄金万两

传菜为什么也受限了呢?说起这个,就不得不提冯·诺依曼,一位奠定了现代核算机架构的大师,一位让很多学子重考的大师。在冯·诺依曼架构中,有“运算”、“存储”、和“输入输出”等三大类设备,也便是炒菜、存菜、传菜。

冯·诺依曼架构

这种架构下,存储和CPU频频的交流数据,一会儿就进步了存储的位置,也让这个架构里存在了“内存墙”。那么怎么翻开一扇窗呢?

这便是H200/H100的另一个中心力,HBM(High Bandwidth Memory,高带宽内存)存储芯片。

HBM是2014年由AMD、SK海力士一起发布的,便是用TSV硅通孔技能,把多个DRAM存储芯片堆叠起来,并与GPU、CPU或许ASIC封装在一起,然后进步容量,以及更快的并行数据处理速度。

快是有必定道理的,首要,存储便是逻辑层上方,从近邻楼到上下楼,打个招呼就行,天然便利多了,功耗也下降不少。别的,一致封装,互联上的延时也更低。作用也很明显。

优雅的从H20到H200,国产算力差在哪儿?的图像

HBM 的根本结构:左边五颜六色的 5 层结构为 HBM 封装

比方一组数据显现,HBM3的带宽能够到达819 GB/s,而GDDR6的带宽最高只要96GB/s,CPU常用DDR4,带宽也只要HBM的1/10。因而,英伟达、AMD都挑选了HBM技能来合作。英伟达的H200更是挑选了HBM3的升级版HBM3e。

HBM成各家独爱

HBM产品商场份额,现在是海外独享。海力士占比50%,三星占比40%,美光占比10%。我国企业现在仍在DRAM产品范畴追逐。

最简略的工作,却往往最难。比方说,炒股挣钱,最简略的办法便是“低买、高卖”,但挣钱的人缺乏10%。HBM也是如此,尽管看图片,如同挺简略的,但完成起来,则是困难重重。

首要是规划,人才是稀缺的。其次是出产。HBM芯片的出产,干流的道路是台积电的CoWoS(chip-on-wafer-on-substrate)先进封装,也是2.5D封装。先把芯片集成在一起,再封装到基板上。哪一步都不简单。

好音讯是华为国产GPU也能够用HBM产品,不太好的音讯是最高阶的产品,咱们仍是拿不到。所以,面对随时或许的断供,存储芯片仍然需求继续发力。

03 礼尚往来,讲点义气

无论是算力、仍是网络、或许高带宽内存,其实都有一个中心要素是:用起来。

比方台积电的CoWoS技能开发前期,也遭遇过“冷眼”。公司期望价格是7美分/平方毫米,但客户高通却只乐意付出1美分/平方毫米。巨大的差异,导致公司不得不开发个平替产品。幸亏其时自研芯片的苹果,给了台积电时机,所以有了CoWoS工艺的老练、遍及,以及再研制。

提起英伟达,一个公认的护城河便是CUDA生态。生态,意味着参与者搬迁本钱很高,比方开发者现已了解了英伟达的开发套件,再去了解其他公司是有难度的。就跟用惯了微信,就很难再换其他聊天工具相同。

要打破生态的壁垒,中心也是要让一批人在新的环境里用起来。

最近互联网圈也爆出了不小的新闻,美团、网易、阿里、字节等等公司,都发动或完成了和鸿蒙体系的适配。只要越来越多的企业支撑,体系才有生存空间。

当然,新生态,特别在后起步的芯片范畴,许多环节会不如老练生态好用。但即使是英伟达,前期建立CUDA也花费了数十年心力,顶着不小的质疑。因而,关于国产芯片的支撑,不免需求一些情怀,用爱发点电。

不过,关于被支撑的企业,要记住礼尚往来。

尽管现在我国的算力,仍然和海外有不小的距离。但幸亏的是,社会现已逐步形成了一致:

1美分/平方毫米,也便是7万元/平方米的芯片,比7万元/平方米的房子,更能发生耐久的出产力。

告发/反应

相关文章

赌博输光百万家产,女子欺诈亲朋200万余元被批捕

新民晚报讯(记者 李一能 通讯员 孙晓光)女子宁某赌博成性,不只输光了自己的辛苦打拼攒下的家产,还动起了身边人的脑筋。日前,宁某因欺诈200余万元被奉贤区检察院批捕。家住奉贤的叶女士由于腰欠好,素日常...

新东方16岁少女被同学奸杀,杀人者因未成年判无期,不服判定上诉

据汹涌新闻此前报导,2016年5月19日,16岁少女姚某在昌平新东方外国语校园的教室里,被同学王某强奸并杀戮。9月24日,据"新东方教室奸杀案"受害人的母亲李洁表明,这起案子的民事诉讼会在9月27日在...

船只制作职业动态:造船三大目标全面增加,职业智能化发展趋势显着

内容概要:作为战略性支柱工业,我国船只工业展开在方针指引下不断提速。进入21世纪后,船只工业的战略地位进一步提高,并且在强力的工业方针支持下进行自主化和工业转型晋级。近年来,跟着我国航运业的稳步展开,...

17吃瓜网网友科普:解密古代趣闻中的杖臀全刑

17吃瓜网网友科普:解密古代趣闻中的杖臀全刑

17吃瓜网网友科普:解密古代趣闻中的杖臀全刑在古代社会,法律和惩罚的形式多种多样,其中以杖臀全刑为代表的一些刑罚手段,不仅让人感到新奇,也引发了现代人对历史文化的思考。17吃瓜网网友科普正是基于这种对...

谎报在校研究生,假造德国留学行程!一女子在结交网站假装布景,婚后欺诈老公15万

近来,吉林省集安市揭露的一则起诉书显现,一名女子经过在结交网站假装布景,成婚后欺诈老公15万,已被检察院提起公诉。  据悉,2020年5月,家住吉林省长春市的肖某某在某交际软件上结识田某甲,一年后与其...

每经15点丨南京楼市新规:市场化租借住宅建成后不得切割转让;哈萨克斯坦总统新闻联播秀中文,普通话冷艳网友;美国港口外倾覆的韩国货船上悉数船员成功获救

每经修改:王鑫1丨指数震动收绿,北向资金接连9日净流入9月10日(周二),三大指数平开低走,午后震动上升,但仍然收绿。盘面上,种植业与林业、中药和农业服务等板块涨幅居前,大豆、玉米、工业大麻等种植业概...

友情链接: