传华为计划重新设计AI芯片:ASIC转向GPGPU 正面硬罡NVIDIA
据The Information最新发布的一份报告称,中国科技巨头华为正在寻求改变其人工智能芯片设计策略,从 ASIC (专用集成电路)转向GPGPU(通用图形处理器)芯片,以便从NVIDIA手中夺取更多的市场份额。
尽管美国对中国实施半导体出口制裁,阻止NVIDIA在中国大陆销售其先进的 AI 芯片,但NVIDIA的产品仍然是中国大陆需求最广泛的AI芯片。
主要是得益于NVIDIAGPGPU架构及强大的CUDA生态。
众所周知,GPU本身是设计来支持图形计算的,但其强大的并行计算能力使得它能够处理各种计算任务。
随后,NVIDIA就针对AI应用推出了有很强的编程灵活性和适应性的GPGPU,结合自己的CUDA软件编程框架,可以处理不同类型的负载,比如图形渲染、科学计算、深度学习等。
华为的昇腾AI芯片则是为AI计算优化的ASIC,它主要针对深度学习推理和训练进行特化。
这种定制化使得它在特定任务上有更高的性能和能效,但对于图形渲染、并行计算、科学计算等通用计算任务上的效率和灵活性就不如GPGPU。
比如,目前许多AI应用(尤其是深度学习)主要使用单精度(FP32)和低精度(如INT8或FP16)浮点运算,因为这些操作能够提供足够的精度,并且能在较低的计算资源下完成。
昇腾AI芯片这种AISC架构可以优化这类AI计算的效率,但是却无法支持双精度浮点(FP64)计算。
相比之下,NVIDIA的H100/H20这类加速器,不仅支持单精度和半精度浮点计算,还能有效支持双精度浮点计算,这也让它们可以用于更广泛的科学计算、工程模拟等任务。
此外,在软件生态上,NVIDIACUDA平台拥有成熟的开发生态和大量优化好的库(如cuDNN、TensorRT),可以为广泛的应用场景提供支持。开发者可以利用这些工具和库大大简化开发工作。
华为昇腾AI芯片则采用的是自研的CANN(神经网络计算架构)软件平台来实现算力调度与执行。
虽然华为也推出了MindSpore等深度学习框架,但它的生态系统和开发者支持,相比NVIDIA的CUDA生态还是要差很多。
总的来说,昇腾AI芯片作为ASIC的优势在于AI计算的高效能和低功耗,但在计算任务的灵活性、双精度浮点支持以及开发生态方面,与NVIDIA以及部分国产GPGPU厂商仍有一定的差距。目前其他的国产GPGPU厂商在发展自有生态的同时都有兼容CUDA生态。
The Information的报告指出,华为想要提升其AI芯片在中国大陆市场的份额正面临的一个主要瓶颈,即华为AI芯片采用的是CANN(神经网络计算架构)软件平台来实现算力调度与执行。但是,CANN并未得到行业的广泛的支持,远不及NVIDIA的CUDA。
据悉,华为的新的AI芯片在转向GPGPU后将配备新的软件,允许用户通过中间件以兼容NVIDIA的 CUDA 编程语言,该软件也可以将CUDA的指令转换为适用于华为AI芯片的语言。
消息人士补充说,华为也有兴趣采用NVIDIA和AMD使用的芯片功能模型。
报告称,虽然目前华为的AI芯片是ASIC,但该公司有兴趣扩展其通用计算产品。
这一转变将使得华为的AI芯片能够被更广泛地使用,并可能有助于华为增加其在中国AI芯片市场的份额。