清华大学团队发布中国AI光芯片“太极”
发表于 : 13 4月 2024 03:18
随着各类大型模型和深度神经网络的涌现,如何设计满足人工智能发展需要、具备大算力和高能效的下一代AI芯片已成为国际前沿的研究热点。清华大学电子工程系方璐副教授课题组、自动化系戴琼海院士课题组摒弃了传统的电子深度计算范式,首创了分布式广度智能光计算架构,研制出了全球首款大规模干涉衍射异构集成芯片太极(Taichi),实现了160 TOPS/W的通用智能计算。这一研究成果于北京时间4月12日凌晨以《大规模光芯片“太极”赋能160 TOPS/W通用人工智能》为题发表在最新一期的《科学》(Science)杂志上。
光计算即将计算载体从电信号转换为光信号,利用光在芯片中的传播进行计算。由于其超高的并行度和速度,光计算被认为是未来颠覆性计算架构的最有力竞争方案之一。光芯片具有高速高并行计算的优势,有望用于支撑大型模型等先进人工智能应用。智能光计算作为新兴计算模式,在后摩尔时代展现出有望超越硅基电子计算的潜力。然而,其计算任务目前仍局限于简单的字符分类、基本的图像处理等领域。其痛点在于光计算的优势被局限在了不适合的电子架构中,计算规模受到限制,无法支撑亟需高算力与高能效的复杂大模型智能计算。与电子神经网络依赖网络深度以实现复杂计算和功能的方式不同,“太极”光芯片架构源于光计算独特的全连接和高并行属性,将深度计算转化为分布式广度计算,为实现规模易扩展、计算高并行、系统强鲁棒的通用智能光计算探索了新路径。
人工通用智能(AGI)的追求不断需要更高的计算性能。尽管集成光子电路具有卓越的处理速度和效率,但由于不可避免的错误限制了其容量和可扩展性,因此只能实现简单任务和浅层模型。为了支持现代AGI,我们设计了太极——基于集成衍射-干涉混合设计和通用分布式计算架构的大规模光芯片,具有百万级神经元能力,能实现每瓦160兆次操作的能效。太极在芯片上实现了1000个类别水平的分类(在1623个类别的Omniglot数据集上测试准确率达到91.89%),并以高效率实现了高保真度的人工智能生成内容,效率提高了两个数量级。太极为大规模光计算和高级任务铺平了道路,进一步开发了光子学在现代AGI中的灵活性和潜力。
对原始数据集进行修改后的预处理数据集。 调整/裁剪了图像的尺寸,并重新组织了原始数据集中的训练-测试分割,以满足光学计算硬件 Taichi 小芯片的数据要求。
技术文档下载
光计算即将计算载体从电信号转换为光信号,利用光在芯片中的传播进行计算。由于其超高的并行度和速度,光计算被认为是未来颠覆性计算架构的最有力竞争方案之一。光芯片具有高速高并行计算的优势,有望用于支撑大型模型等先进人工智能应用。智能光计算作为新兴计算模式,在后摩尔时代展现出有望超越硅基电子计算的潜力。然而,其计算任务目前仍局限于简单的字符分类、基本的图像处理等领域。其痛点在于光计算的优势被局限在了不适合的电子架构中,计算规模受到限制,无法支撑亟需高算力与高能效的复杂大模型智能计算。与电子神经网络依赖网络深度以实现复杂计算和功能的方式不同,“太极”光芯片架构源于光计算独特的全连接和高并行属性,将深度计算转化为分布式广度计算,为实现规模易扩展、计算高并行、系统强鲁棒的通用智能光计算探索了新路径。
人工通用智能(AGI)的追求不断需要更高的计算性能。尽管集成光子电路具有卓越的处理速度和效率,但由于不可避免的错误限制了其容量和可扩展性,因此只能实现简单任务和浅层模型。为了支持现代AGI,我们设计了太极——基于集成衍射-干涉混合设计和通用分布式计算架构的大规模光芯片,具有百万级神经元能力,能实现每瓦160兆次操作的能效。太极在芯片上实现了1000个类别水平的分类(在1623个类别的Omniglot数据集上测试准确率达到91.89%),并以高效率实现了高保真度的人工智能生成内容,效率提高了两个数量级。太极为大规模光计算和高级任务铺平了道路,进一步开发了光子学在现代AGI中的灵活性和潜力。
对原始数据集进行修改后的预处理数据集。 调整/裁剪了图像的尺寸,并重新组织了原始数据集中的训练-测试分割,以满足光学计算硬件 Taichi 小芯片的数据要求。
技术文档下载
Name | Size | |
---|---|---|
Dataset1_CIFAR10.zip | 463.9 MB | Download |
Dataset2_MiniImageNet.z01 | 4.7 GB | Download |
Dataset2_MiniImageNet.z02 | 4.7 GB | Download |
Dataset2_MiniImageNet.zip | 4.7 GB | Download |
Dataset3_Omniglot.zip | 15.4 MB | Download |
Dataset4_BachChorales.zip | 2.1 MB | Download |
README.md | 3.9 kB | Download |