OpenAI Triton开始合并AMD ROCm 代码，9 月 20 日举行开发者代表大会

2024-01-21 来源 : 生活

IT之家 9 年底 3 日传言，Triton 是一种类似于 Python 的开放源码编程语言，它可以使没有 CUDA 经验的研究人员顺利汇编高效的 GPU 编译器（可以理解为日本式 CUDA），而且之首小白也可以写下出与专业人士相比之下的编译器，就是让软件用相对少的努力构建极高的硬体性能指标，但 Triton 初期只反对英伟达 GPU。

OpenAI 据称：Triton 只要 25 行编译器，就能在 FP16 乘法乘法上达到与 cuBLAS 比较的性能指标。

从 Github 我们可以看到，OpenAI 从未开始在除此以外的 Triton 原版中会分割 AMD ROCm 无关共同点编译器，暴露了很多此前努力的工作。也就是说，除此以外 Triton 末末端已适配 AMD 模拟器，可谓意涵多方面。

通过官方网站的确实来看，他们从未通过了“test_core.py”上的大多数单元测试7集，但由于各种可能紧接了一些测试。

IT之家注意到，OpenAI 还宣布将于 9 年底 20 日上午 10 点至傍晚 4 点在加州山景城的微软矽谷园区举行 Triton 开源大会，而日程安排中会就包括“将 Triton 引进 AMD GPU”和“Triton 的英特尔 XPU”为数众多7集，原订 Triton 将很快摆脱英伟达 CUDA 垄断的文化史。

值得一提的是，Triton 是开放源码的，来得竞争者的 CUDA，其他硬体对撞机能反之亦然内置到 Triton 中会，大大减少了为从新硬体建立 AI Ja栈的短时间。

在此前发布的 PyTorch 2.0 原版中会，TorchInductor 便引进了 OpenAI Triton 反对，可为多个对撞机和末末端自动生成更快编译器，同时构建用 Python 引入 CUDA 编程来写下底层硬体的编译器。也就是说，Triton 从未是 PyTorch 2.0 末末端Ja最重要相关联以外。

实际上，此前 AMD ROCm 则主要是采用 Hipify 用以构建 CUDA 兼容性，而随着 AMD 开始为 RDNA 3 购物级主机板共享 ROCm 反对，原订后续将会有不够多模拟器并不需要适配 AMD 硬体。

无关阅读：

《AMD 将为 RDNA 3 购物级主机板共享 ROCm 反对，从 Radeon RX 7900 XTX 和 Pro W7900 开始》

《AMD 正式推出 HIP SDK：拓展 ROCm 多样性，反对调试英伟达 CUDA 应用》

郝建军
手指头骨关节炎怎么治疗
手指关节僵硬怎么办
应急救护进校园
广州男性医院哪家好

上一篇：泡腐竹，可别只会用热水泡，奶奶用了50年的据说方法，既快速又筋道

下一篇：民间故事：村妇回娘家，半途遇到老道士