比特派多

比特派新钱包它由数百亿个晶体管构成

发布日期:2023-11-29 02:03    点击次数:184

比特派新钱包它由数百亿个晶体管构成

英伟达推出了自家最新 430 亿参数空话语模子 ——ChipNeMo比特派新钱包。

关于它的用途,英伟达在官方露馅音讯中也黑白常的明确,剑指 AI 芯片策画。

具体而言,ChipNeMo 不错匡助职责主说念主员完成与芯片策画联系的任务,包括回应联系芯片策画的一般问题、归来 bug 文档,以及为 EDA 器具编写剧本等等。

英伟达首席科学家 Bill Dally 对此示意:

以英伟达 H100 Tensor Core GPU 为例,它由数百亿个晶体管构成,在显微镜下看着就像是一个悉心标的设立的城市一般。

这些晶体管引诱在比东说念主类头发丝还细 10000 倍的“街说念”上,需要多个工程团队合作两年多的时间来完成,其间繁琐且雄壮的职责量,可见一斑。

因此,在英伟达看来,跟着 ChipNeMo 这么空话语模子的问世,所有的职责历程齐将在截至上得以擢升。

用 Bill Dally 的话来说:

总体来看,ChipNeMo 概况匡助英伟达里面的芯片策画师们完成三大方面的职责。

最初等于问答。

ChipNeMo 包含一个原型聊天机器东说念主比特派新钱包,它不错回应联系 GPU 架构和策画的问题,匡助好多工程师在早期测试中快速找到本事文档。

举例,你不错向它发问:

ChipNeMo 就会基于这个问题,给出精确的谜底:

其次是 DEA 剧本生成。

举例只需向 ChipNeMo 用当然话语提议思要生成代码的条目即可:

仅需静候片时,带着翔实的代码片断“啪的一下”就生成了。

据了解,英伟达当今还在对代码生成器(如下图所示)进行拓荒,它异日会和现存的器具作念一个集成,好让工程师用起来愈加肤浅。

终末是 Bug 归来和分析。

芯片策画东说念主员只需要向 ChipNeMo 刻画一下情况即可,举例 prompt 的试验可能包括 Bug 的 ID、Synopsis、Module 和 Description 等等。

尔后 ChipNeMo 就会把柄 prompt,给出作念好的本事归来和处治归来等。

最初在数据集方面,英伟达主要接受的 Bug 归来、策画源(Design Source)、文档以及维基百科、GitHub 等硬件联系的代码和当然话语文本。

比特派转账

再经过一个辘集的数据麇集过程来收罗,最终在清洗和过滤之后,酿成了 241 亿个 token。

其次在算法、架构策画方面,英伟达并莫得径直拿当今已商用、开源的空话语模子来作念部署。

而是主要接受了这些范畴自适当(Domain-Adapted)本事,包括自界说标识器、范畴自适当抓续预测验、带有范畴特定辅导的监督微调(SFT),以及范畴自适当检索模子。

在此智力之下,便提高了空话语模子在工程助理聊天机器东说念主、EDA 剧本生成和 Bug 摘录和分析等三个诓骗中的性能。

截至走漏,这些范畴自适当本事使得空话语模子的性能跳跃通用基础模子;同期模子大小最多可减少 5 倍,且保抓一样或更好的性能。

不外论文作家也坦言:

前区三区比为0:2:3,奇偶比为1:4,大小比4:1。

前区奇偶比为1:4,大小比为4:1,和值为125 。后区为小+小的组合。

参考引诱:

告白声明:文内含有的对外跳转引诱(包括不限于超引诱、二维码、口令等表情)比特派新钱包,用于传递更多信息,任性甄选时间,截至仅供参考,IT之家所有著述均包含本声明。

  声明:新浪网独家稿件,未经授权辞让转载。 -->



Powered by 比特派多 @2013-2022 RSS地图 HTML地图

Copyright 站群 © 2013-2023 比特派 版权所有