科學家構建基于光學的圖像生成模型美國加州大學洛杉磯分校工程學院研究團隊開發(fā)出一項有望推動生成式人工智能(AI)走向綠色未來的新技術。他們構建了一種基于光學的圖像生成模型,利用光子而非傳統(tǒng)的電子進行計算,從而大幅降低能耗,為高效、可持續(xù)的人工智能提供了全新路徑。該成果發(fā)表于新一期《自然》雜志。 當前流行的聊天機器人和圖像生成器雖然在技術上取得了顯著突破,但其巨大的能源消耗和環(huán)境代價也引發(fā)了廣泛關注。這些生成式AI系統(tǒng)不僅需要大量電力來運行,還因數(shù)據(jù)中心冷卻需求而消耗巨量水資源,對自然資源構成壓力。同時,支撐這些模型的龐大計算基礎設施也讓人們對其長期可持續(xù)性產(chǎn)生擔憂。 新研究展示了一種創(chuàng)新計算范式:通過光學方式直接執(zhí)行圖像生成過程,充分發(fā)揮光速傳播和并行處理的優(yōu)勢,僅需一次通過即可完成圖像輸出。與現(xiàn)有生成模型依賴數(shù)百乃至數(shù)千次迭代計算不同,該系統(tǒng)將數(shù)字編碼與光學解碼相結合,在訓練階段協(xié)同優(yōu)化兩個模塊,而在推理階段只需一次數(shù)字編碼后,便可通過光學硬件“快照式”生成圖像,無需反復迭代。這不僅極大提升了效率,也顯著減輕了計算負擔。 這項技術證明了光學系統(tǒng)有能力在大規(guī)模場景下執(zhí)行復雜的生成式AI任務。通過繞開傳統(tǒng)數(shù)字計算中繁重的重復運算,有望催生出更快速、更節(jié)能的AI系統(tǒng),并深度融入日常設備中。 為驗證其性能,團隊已在多個數(shù)據(jù)集上進行了測試,成功生成了手寫數(shù)字、服飾、蝴蝶及人臉等圖像。結果表明,光學模型僅用單步操作、每個波長一次照射便生成了視覺效果相當?shù)乃囆g圖像,且每張圖像的能耗僅為傳統(tǒng)方法的一小部分。 該系統(tǒng)還具備獨特的安全與隱私優(yōu)勢,同時,由于其體積小、功耗低,可被集成到智能眼鏡、增強現(xiàn)實或虛擬現(xiàn)實頭顯以及移動終端中,實現(xiàn)本地化實時內容生成,減少對云端計算的依賴,這也有助于推動邊緣計算的發(fā)展。 |





