西安光機所在計算機視覺領(lǐng)域取得新進展近日,中科院西安光機所光譜成像技術(shù)實驗室王荃研究員團隊在計算機視覺領(lǐng)域的半監(jiān)督醫(yī)學(xué)圖像語義分割方向取得新進展,相關(guān)成果被國際計算機視覺與模式識別大會(CVPR)接收。 半監(jiān)督學(xué)習(xí)中協(xié)同訓(xùn)練的核心思想是利用多個模型之間的協(xié)作和互補信息,通過迭代的方式利用未標記數(shù)據(jù)來提高模型的性能。模型間趨向相似決策邊界引發(fā)的同質(zhì)化問題是當前協(xié)同訓(xùn)練的主要挑戰(zhàn)之一。理想情況下,參與協(xié)同訓(xùn)練的不同模型應(yīng)具有一定的差異性,才能從不同角度挖掘未標記數(shù)據(jù)的信息,促進彼此之間的知識互補。而實際操作中,因模型架構(gòu)、訓(xùn)練數(shù)據(jù)及優(yōu)化算法等方面的相似性,減弱了各模型逐漸收斂到類似的決策邊界的互補性,最終限制了協(xié)同訓(xùn)練方法效能的進一步發(fā)揮。 圖.β-FFT方法整體流程 圖.β-FFT方法與同類分割算法對比 對此,研究團隊提出了一種創(chuàng)新算法——β-FFT。在數(shù)據(jù)處理方面,該算法采用基于快速傅里葉變換(FFT)的非線性插值方法,通過交換不同增強處理的圖像間低頻成分生成多樣化樣本,增強模型泛化能力并維持協(xié)同訓(xùn)練的穩(wěn)定性。在訓(xùn)練結(jié)構(gòu)方面,團隊設(shè)計了一種差異化訓(xùn)練策略,在協(xié)同訓(xùn)練框架中對一個模型使用帶標簽數(shù)據(jù)進行額外訓(xùn)練,并對未標記數(shù)據(jù)采用Beta(β)分布的線性插值作為正則化項。該方法高效利用有限的帶標簽數(shù)據(jù),大幅提升了模型在未標記數(shù)據(jù)上的性能與系統(tǒng)整體分割精度,在多個公開醫(yī)學(xué)圖像數(shù)據(jù)集上的性能處于領(lǐng)先水平。該項成果有望應(yīng)用于醫(yī)學(xué)影像診斷領(lǐng)域,助力提高疾病診斷的準確性。 關(guān)鍵詞: 計算機視覺
|




