近日,在2023年世界互聯(lián)網(wǎng)領先科技成果獎頒獎典禮上亮相的15項領先科技成果中,入選基礎研究組獎項的是由北京交通大學、南開大學合作完成的“視覺媒體的層次化內(nèi)容感知”成果,頗為引人注目。
“對于視覺媒體的層次化內(nèi)容感知這項研究,簡單來講,就是賦予計算機由粗到細地識別圖像或視頻的能力。這里的由粗到細主要體現(xiàn)在從圖像級到像素級的粒度變化。”北京交通大學信息與科學研究所所長趙耀教授表示。
針對層次化感知的幾個關鍵問題,課題組著重研究了圖像級多物體感知、物體級位置感知、像素級粗粒度感知和像素級細粒度感知,有效促進了視覺感知研究技術的發(fā)展。
據(jù)介紹,該成果系統(tǒng)深入研究了視覺內(nèi)容層次化感知的相關理論和方法,形成從圖像級、物體級到像素級粗粒度及細粒度的遞進感知理論和解決方案,回答了“圖像有何物體,物體有何像素,像素是何類別,類別如何細分”的系列問題。所涉及的研究內(nèi)容包括圖像級多物體感知、物體級位置感知、像素級粗粒度感知、像素級細粒度感知等。
趙耀介紹,該成果所產(chǎn)出的相關論文大多為各自研究方向的早期開拓性研究成果,并對相關方向的后續(xù)發(fā)展具有重要引領作用。論文得到了圖靈獎獲得者及100多位IEEE會士的引用和關注。
最后,趙耀表示:“目前這些成果已經(jīng)成為歷史,未來大模型和生成式人工智能將會給我們的研究帶來更多的機遇和挑戰(zhàn)。今后,團隊一方面將在基礎研究領域進行深入探索,另一方面也將和工業(yè)界展開廣泛的合作,力爭將成果轉(zhuǎn)化為經(jīng)濟效益,并最終服務于社會大眾。”
(北京交通大學供圖)
中國-博士人才網(wǎng)發(fā)布
聲明提示:凡本網(wǎng)注明“來源:XXX”的文/圖等稿件,本網(wǎng)轉(zhuǎn)載出于傳遞更多信息及方便產(chǎn)業(yè)探討之目的,并不意味著本站贊同其觀點或證實其內(nèi)容的真實性,文章內(nèi)容僅供參考。