中国科学家成功构建并开源深度脉冲神经网络学习框架“惊蜇”

发布时间:2024-12-31 06:33:23 来源: sp20241231

   中新网 北京10月11日电 (记者 孙自法)中国科学院自动化研究所10月11日发布消息说,该所李国齐研究员与北京大学计算机学院田永鸿教授团队合作,成功构建并开源了深度脉冲神经网络学习框架(SpikingJelly),其英文名直译中文为“尖峰海蜇”,科研团队遂以与中国传统二十四节气之一“惊蛰”同音、近义、形似的“惊蜇”命名中文名称。

  “惊蜇”框架可提供全栈式的脉冲深度学习解决方案,支持神经形态数据处理、深度脉冲神经网络构建、替代梯度训练、人工神经网络转换脉冲神经网络、权重量化和神经形态芯片部署等功能,并具有简单易用、扩展性强、超高性能等优势。

“惊蜇”(SpikingJelly)框架的整体结构、示例代码、仿真速度、生态位以及典型应用。中国科学院自动化所 供图

  由中国科学家完成的这项深度脉冲神经网络学习框架研究重要成果论文,近日在国际著名学术期刊《科学》旗下《科学进展》(Science Advances)在线发表。

  论文共同通讯作者李国齐研究员介绍说,脉冲神经网络被誉为第三代神经网络,其使用更低层次的生物神经系统的抽象,既是神经科学中研究大脑原理的基本工具,又因其稀疏计算、事件驱动、超低功耗的特性而备受计算科学的关注。随着深度学习方法的引入,脉冲神经网络的性能得到大幅度提升,脉冲深度学习成为新兴的研究热点。

“惊蜇”(SpikingJelly)框架中的典型模块。中国科学院自动化所 供图

  传统脉冲神经网络框架更多关注生物可解释性,致力于构建精细脉冲神经元并仿真真实生物神经系统,并不支持自动微分,无法充分利用图形处理器(GPU)的大规模并行计算能力,也缺乏对神经形态传感器和计算芯片的支持。为解决这一问题,中国科学院自动化所与北京大学团队通过合作研究,构建并开源了深度脉冲神经网络学习框架“惊蜇”。

  在超高性能优势方面,“惊蜇”充分利用脉冲神经网络的特性,通过计算图遍历顺序优化、即时编译、半自动统一计算设备架构代码生成等技术来加速脉冲神经网络仿真,与其他框架相比可达11倍的训练加速。第三方独立社区组织对“惊蜇”和美国、德国、瑞典等多个脉冲神经网络框架进行精细的速度基准测试,结果显示,“惊蜇”具有最快的仿真速度,比其他框架快10倍以上。

“惊蜇”(SpikingJelly)框架的典型应用。中国科学院自动化所 供图

  李国齐表示,“惊蜇”框架自2019年冬季一经推出就受到科研同行的关注和广泛使用,基于“惊蜇”的研究工作成果也大量出版,目前已有超过95篇公开论文使用“惊蜇”框架进行实验。同时,脉冲神经网络的应用从简单的数据集分类扩展到人类水平的图像分类、网络部署、事件相机数据处理等实际应用。这些应用和研究表明,“惊蜇”框架开源,已极大促进脉冲深度学习领域发展。(完)

【编辑:唐炜妮】