ICC訊 8 月 8 日消息,據清華大學(xué)官方消息,清華大學(xué)電子工程系方璐教授課題組、自動(dòng)化系戴瓊海院士課題組另辟蹊徑,首創(chuàng )了全前向智能光計算訓練架構,研制了“太極-II”光訓練芯片,實(shí)現了光計算系統大規模神經(jīng)網(wǎng)絡(luò )的高效精準訓練。
該研究成果以“光神經(jīng)網(wǎng)絡(luò )全前向訓練”為題,于北京時(shí)間 8 月 7 日晚在線(xiàn)發(fā)表于《自然》期刊。
清華大學(xué)電子系為論文第一單位,方璐教授、戴瓊海教授為論文的通訊作者,清華大學(xué)電子系博士生薛智威、博士后周天貺為共同一作,電子系博士生徐智昊、之江實(shí)驗室虞紹良博士參與了該項工作。該課題受到國家科技部、國家自然科學(xué)基金委、北京信息科學(xué)與技術(shù)國家研究中心、清華大學(xué)-之江實(shí)驗室聯(lián)合研究中心的支持。
Nature 審稿人在審稿評述中指出“本文中提出的想法非常新穎,此類(lèi)光學(xué)神經(jīng)網(wǎng)絡(luò )(ONN)的訓練過(guò)程是前所未有的。所提出的方法不僅有效,而且容易實(shí)現。因此,它有望成為訓練光學(xué)神經(jīng)網(wǎng)絡(luò )和其他光學(xué)計算系統的廣泛采用的工具?!?
據清華大學(xué)官方介紹,近年間,具有高算力低功耗特性的智能光計算逐步登上了算力發(fā)展的舞臺。通用智能光計算芯片“太極”首次將光計算從原理驗證推向了大規模實(shí)驗應用,擁有 160TOPS / W 的系統級能效,但現有的光神經(jīng)網(wǎng)絡(luò )訓練嚴重依賴(lài) GPU 進(jìn)行離線(xiàn)建模并且要求物理系統精準對齊。
據論文第一作者、電子系博士生薛智威介紹,在太極-II 架構下,梯度下降中的反向傳播化為了光學(xué)系統的前向傳播,光學(xué)神經(jīng)網(wǎng)絡(luò )的訓練利用數據-誤差兩次前向傳播即可實(shí)現。兩次前向傳播具備天然的對齊特性,保障了物理梯度的精確計算。由于不需要進(jìn)行反向傳播,太極-II 架構不再依賴(lài)電計算進(jìn)行離線(xiàn)的建模與訓練,大規模神經(jīng)網(wǎng)絡(luò )的精準高效光訓練終于得以實(shí)現。
論文研究表明,太極-II 能夠對多種不同光學(xué)系統進(jìn)行訓練,并在各種任務(wù)下均表現出了卓越的性能:
大規模學(xué)習領(lǐng)域:突破了計算精度與效率的矛盾,將數百萬(wàn)參數的光網(wǎng)絡(luò )訓練速度提升了 1 個(gè)數量級,代表性智能分類(lèi)任務(wù)的準確率提升 40%。
復雜場(chǎng)景智能成像:弱光環(huán)境下(每像素光強度僅為亞光子)實(shí)現了能量效率為 5.40×10^6 TOPS / W 的全光處理,系統級能效提升 6 個(gè)數量級。在非視域場(chǎng)景下實(shí)現了千赫茲幀率的智能成像,效率提升 2 個(gè)數量級。
拓撲光子學(xué)領(lǐng)域:在不依賴(lài)任何模型先驗下可自動(dòng)搜索非厄米奇異點(diǎn),為高效精準解析復雜拓撲系統提供了新思路。