近日, 中科院合肥研究院智能所先進制造研究中心王紅強研究員團隊與中啟人工智能聯合實驗室提出利用有效視野域理論強化表征AI學習模型,并證實該模型能夠顯著提高目標檢測性能。該工作已被人工智能領域著名期刊NEUROCOMPUTING接收發表。
深度學習是當前人工智能的核心。在基于DCNN的深度學習模型中網絡視野域發揮重要作用,但一直以來鮮有對其深入研究應用。團隊研究人員提出一種有效感受野(eRF)強化思路,并設計了有效視野域強化表征學習模塊, 通過應用于現有的目標檢測器,證實該模型顯著提高了目標檢測性能,尤其是在小目標識別方面。
對于傳統的目標檢測器而言,在訓練過程中存在難以收斂和訓練不充分不平衡等問題,科研人員注意到,在人類視覺系統中,物體只有落在視野范圍內才可見,且當眼睛注意到某物時,視野中會出現同心對抗現象:激發中心區域但抑制外圍區域。鑒于此,科研人員提出模仿人眼有效感受野區域來增強表征學習。研究過程中,研究人員發現目標檢測器的骨干網絡卷積層深度是有效感受野重要影響因素之一。通過卷積層的深度擬合目標的有效感受野半徑,并將中心點落在有效感受野區域內的錨框中,所提出的模型提高了目標檢測細微特征的強化學習能力。
該工作先期已申請國家發明專利,并發表了一系列學術論文,包括指導博士生在Neurocomputing、Computers and Electronics in Agriculture等期刊發表多個論文。尤其是,團隊構建的Pest24大規模小樣本深度學習Benchmark,填補了當前大規模農業害蟲小目標機器學習數據集缺失空白,被同行認為有很大潛力成為深度學習的標準數據。下一步工作,團隊將繼續深入開展eRF理論與模型方法研究,并在醫療健康、安防、農業蟲害監測等領域進行產業化應用。
上述研究工作得到了國家自然科學基金項目和安徽省重點研究與開發計劃的支持。
文章鏈接:https://elsevier.proofcentral.com/en-us/landing-page.html?token=c328b06ea2ece0bbaa023d437993de

網絡有效視野域變化數值模擬圖