86

英伟达首席科学家:5nm实验芯片用INT4达到INT8的精度,每瓦运算速

a_632022-12-11 14:09:56   来源:IT之家  阅读量:8028   

32位和16位格式的混合精度训练是目前深度学习的主流。

英伟达首席科学家:5nm实验芯片用INT4达到INT8的精度,每瓦运算速

最新的NVIDIA核弹GPU H100刚刚增加了对8位浮点格式FP8的支持。

NVIDIA首席科学家Bill Dally现在表示,他们还有一个秘密武器:

在IEEE计算机计算研讨会上,他介绍了一种实验性的5nm芯片,可以混合8位和4位格式,在4位上获得近似8位的精度。

目前这款芯片还在研发中,主要用于INT4和INT8格式的深度学习推理如何在训练中应用也在研究中

相关论文已在2022年IEEE超大规模集成电路技术研讨会上发表。

新的量化技术

数字格式的减少而精度没有显著损失是由于矢量缩放量化技术。

具体来说,一个INT4数只能准确表示从—8到7的16个整数。

其他数字会四舍五入到这16个值,中间的精度损失称为量化噪声。

传统的量化方法为每个矩阵增加一个比例因子以降低噪声,而VSQ为每个矢量增加一个比例因子以进一步降低噪声。

关键点是比例因子的值应该与实际需要在神经网络中表示的数值范围相匹配。

Nvidia的研究人员发现,为每64个数字分配一组独立调整的比例因子可以最小化量化误差。

计算比例因子的成本可以忽略不计,当比例因子从INT8降低到INT4时,能效提高一倍。

Bill Dally认为,通过结合INT4计算,VSQ技术和其他优化方法,新芯片可以实现10倍于Hopper架构的每瓦计算速度。

还有哪些减少计算量的努力。

除了Nvidia,业界还有更多降低计算量的努力,也在本次IEEE研讨会上提出。

马德里康普顿斯大学的一组研究人员设计了一种基于Posits格式的处理器内核,与浮点数相比,精度提高了多达4个数量级。

与Float相比,Posits增加了一个可变长度的Regime区域,用来表示索引的索引。

对于0附近的较小数字,只需要两个比特,这些数字广泛用于神经网络中。

基于FPGA开发了适用于Posits格式的新硬件研究人员发现,可以在不增加计算时间的情况下,利用芯片的面积和功耗来提高精度

苏黎世联邦理工学院一个团队的研究是基于RISC—V的,他们把两种混合精度的积和融运算放在一起并行计算。

这可以防止两次计算之间的精度损失,并提高内存利用率。

FMA是指D = A * B+C的运算,一般输入中的A和B会使用较低的精度,而输出中的C和D会使用较高的精度。

研究人员模拟发现,新方法可以将计算时间减少几乎一半,并提高输出精度,特别是对于大向量的计算。

相应的硬件实现正在开发中。

巴塞罗纳超级计算中心和英特尔团队的研究也与FMA有关,完全可以使用BF16格式完成神经网络的训练。

BF16格式已经在Dalle2等大型网络训练中得到应用,但仍需要与精度更高的FP32结合,并在两者之间来回转换。

这是因为在神经网络训练中只有一部分计算不会由于BF16而降低精度。

最新的解决方案是开发一种扩展格式BF16—N,它将几个BF16数组合起来表示一个数,可以在不显著牺牲精度的情况下使FMA计算更加高效。

关键是FMA计算单元的面积只受尾数位的影响。

比如FP32有23个尾数位,需要576个单位的面积,而BF16—2只需要192位,减少了2/3。

另外,这篇论文的题目也很有意思,BF16就是你需要的全部。

参考链接:

声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多企业信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。投资有风险,需谨慎。

推荐阅读
哪吒U换名而来?颜值内饰双提升,还要对标埃安Y
头条

十多万元的预算想买纯电SUV,可选择性其实有很多,哪吒U便是一款,不过这款车相对在产品本身还是有些小的诟病。而哪吒汽车也认识到了这一点,所以在最近上市了哪吒U的...

2023-12-05

华安基金:降息预期提前至明年3月,黄金突破历史新高
头条

美联储降息预期升温,黄金价格突破历史新高。上周海外黄金上涨,伦敦现货黄金收于2071.7美元/盎司(周环比3.49%),周一开盘即创下2146.8美元的历史新高...

2023-12-05

莱克洗地吸尘器,宝爸宝妈的全屋清洁利器
头条

迎接新生命的到来,是每个家庭最值得开心的温馨时刻。时至今日,我们对宝宝的照顾已经不是停留在关心他们是否吃饱、穿暖的阶段了,而是对他们的生活附加了更多品质的要求,...

2023-12-05

“疯狂降价!20万合资SUV一跳降6.7万,国产车震荡!”
头条

别克昂科威:优惠力度大,产品力如何?当前国际经济环境持续疲软,消费者的消费水平不断下降,甚至出现了“反向消费”的现象,这种情况下,整个车市的销量都面临着巨大的压...

2023-12-05

跨境支付公司PayerMax支付助力中国游戏厂商攻克海外支
头条

在日韩、欧美等传统成熟游戏市场趋于疲软的情况下,中国游戏企业对出海中东的热情却日益高涨。要知道中东互联网普及比例达80%,其中GDP的60%集中在人口占14%的...

2023-12-05

相比奥迪A4L,凯迪拉克CT5被种草了,颜值动力都领先!
头条

随着技术的飞速发展,人们的出行方式将变得多样化,特别以轿车为主的年轻消费群体,购车行为更不局限于代步。所以,什么样的车,才能吸引到这些年轻人?凯迪拉克CT5与奥...

2023-12-05

出海的不止有琳琅满目商品 还有文化出海的网络文学
头条

从文本出海、IP出海、模式出海到文化出海,经过多年发展,网络文学出海之势渐成规模、传播半径不断延伸、覆盖范围持续扩展,中国网络文学已经成为中国文化走出去最具活力...

2023-12-05

需求大政策好 尚需创新支撑 香料香精市场前景广阔
头条

我国是世界上最大的天然香精香料生产国。自古以来,香精香料就是丝绸之路贸易的重要组成部分,目前已成为与“一带一路”共建国家开展文化交流、贸易往来及经济合作的重要桥...

2023-12-05

又一款“X”开卖!12.68万起售,8155芯片也上车了
头条

哪吒U系列升级款” 作者|王磊? 紧凑纯电SUV市场又添一“卷王”。 哪吒汽车旗下全新纯电SUV哪吒X,昨晚刚刚上市,共推出4款车型,官方指导价12.68...

2023-12-05

秦PLUS限时8.98万元起引领中国品牌决战合资燃油
头条

11月24日,比亚迪第600万辆新能源汽车下线,以雷霆之势再创产销新纪录,这不仅是比亚迪的又一佳绩,更是中国新能源汽车发展的里程碑。 秦,车如其名,一路向前,...

2023-12-05

拉货载人露营都行!江铃福特全顺T8售15.38万起
头条

10月15日,江铃福特官方宣布,江铃福特新全顺T8正式上市,新车售价区间为15.38-59.8万元,全系共推出9款配置车型,提供燃油和纯电2种动力。作为换代产品...

2023-12-05

智己LS6未来智舱:引领新时代智舱新征程
头条

智能座舱已经成为当今汽车行业的热门话题。数年前,特斯拉以其引领者的姿态进入智能座舱时代,但随着智能汽车的快速发展,传统的座舱设计已经变得过时。然而,新时代的后来...

2023-12-05

2023款艾瑞泽5上市,定位A级入门精品家轿还抗打吗?
头条

车评观察《车评社》 10月20日,2024款艾瑞泽5上市,共推出1.5L-MT、1.5L-CVT三款车型,售价区间为5.99万元-7.59万元。作为奇瑞年轻化...

2023-12-05

设计贴近家族风格!哪吒X正式上市售12.68万起
头条

10月18日,哪吒汽车品牌旗下全新纯电动紧凑型SUV哪吒X正式上市,此次共推出4款配置车型,官方指导价格区间为12.68-14.68万元。该车是现款哪吒U-II...

2023-12-05

英菲尼迪电动化转型迟缓?时隔五年概念车亮相
头条

在如今汽车电动化转型的浪潮之下,各家车企纷纷积极转型,但也有不少车企好似对于电动化转型漫不经心,至今都没有一台属于自己的量产纯电动汽车产品。作为日产的高端品牌,...

2023-12-05

阳光人寿宁波中支工会组织开展春季踏青活动

时值仲春、阳和初起,正是春游踏青的好时光。为丰富员工业余生活,营造和谐融洽、团结向上的工作氛围,3月23日,阳...

找到黑匣子之后,下一步做什么?专家解读

找到黑匣子之后,下一步做什么?邱超奕对于空难调查而言,黑匣子在找到后,才意味着具体工作的开始。那么,它被送往了...

这所城乡接合部的新学校,为招生曾挂过三块牌子

#8203;“上级对我提的要求,就是让寒门子弟接受更好的教育,让普通孩子上好学。”一所城乡接合部的新学校,为招...

东航坠机现场:救援人员获得飞机残骸定位信息

新京报讯据中国民用航空局消息,3月21日,东航一架波音737客机在执行昆明--广州航班任务时,于梧州上空失联。...

调研指今年就业形势基本稳定实体产业人才吸引力增加

专业人力资源机构中智公司21日发布的最新调研结果显示,2022年中国就业形势基本稳定,实体产业对人才吸引力增加...