英伟达近期放出重磅消息, CUDA 13.1正式亮相 ,黄仁勋直言这是该平台二十年最大升级。按官方说法,如今用十五行Python代码,就能完成过去两百行C++才能搞定的工作,连数据科学家都能轻松编写 GPU内核 。
CUDA Tile和cuTile Python打通了这个瓶颈。英伟达在开发者博客中提到,一个15行的Python内核性能可以媲美200行手动优化的CUDA C++代码。
很少有人像他一样,在 通用CPU、移动SoC、车载SoC、AI加速器 上都做过一线设计和架构决策。近几年他频繁在TSMC、三星等论坛谈未来工艺与架构,被称为「半导体设计传奇」。
NVIDIA CUDA Tile introduces 'tile-based parallel programming' and it's being described as a major update to the CUDA platform, which powers a lot of AI.
当前正在显示可能无法访问的结果。
隐藏无法访问的结果