有很多讀者紛紛留言想得到計(jì)算機(jī)視覺領(lǐng)域的圖書推薦。今天我們就滿足大家的愿望,邀請(qǐng)微軟亞洲研究院計(jì)算機(jī)視覺組資深研究員王井東博士為大家推薦計(jì)算機(jī)視覺領(lǐng)域的經(jīng)典書目,他還貼心地為大家劃分了綜合篇、幾何篇、機(jī)器學(xué)習(xí)篇和經(jīng)典讀物四大類。 計(jì)算機(jī)視覺是從圖像和視頻中提出數(shù)值或符號(hào)信息的計(jì)算系統(tǒng),更形象一點(diǎn)說(shuō),計(jì)算機(jī)視覺是讓計(jì)算機(jī)具備像人類一樣的眼睛,看到圖像,并理解圖像。加州大學(xué)洛杉磯分校統(tǒng)計(jì)學(xué)和計(jì)算機(jī)科學(xué)教授教授朱松純?cè)硎尽叭说拇竽X皮層的活動(dòng)大約70%是在處理視覺相關(guān)信息。視覺就相當(dāng)于人腦的大門。如果不能處理視覺信息的話,整個(gè)人工智能系統(tǒng)是個(gè)空架子,只能做符號(hào)推理,沒(méi)法研究真實(shí)世界的人工智能! 一起來(lái)看看這些計(jì)算機(jī)視覺領(lǐng)域的修煉秘笈吧!下一個(gè)計(jì)算機(jī)視覺高手也許就是你哦! 一、綜合篇 1. Computer Vision: A Modern Approach
作者:David A. Forsyth, Jean Ponce 出版時(shí)間:2003(第一版),2011(第二版) 適合人群:初級(jí)到中級(jí)學(xué)者 推薦指數(shù):★★★★★ 主要內(nèi)容:本書包含了計(jì)算機(jī)視覺領(lǐng)域眾多問(wèn)題:成像、面向單張圖像的早期視覺、面向多張圖像的早期視覺、中層視覺問(wèn)題、高層視覺問(wèn)題,也包括了相關(guān)的視覺應(yīng)用,如基于圖像的建模與繪制、以人為中心的視覺問(wèn)題、圖像搜索,最后,作者也簡(jiǎn)要講述了視覺算法相關(guān)的優(yōu)化技術(shù)。 推薦理由:本書既有對(duì)計(jì)算機(jī)視覺問(wèn)題的系統(tǒng)的講解,又有對(duì)相關(guān)問(wèn)題的詳細(xì)的講述。通過(guò)本書,讀者能夠?qū)崿F(xiàn)計(jì)算機(jī)視覺應(yīng)用。本教材成書較早(第一版:2003,第二版:2011),但內(nèi)容全面廣泛,可作為高年級(jí)本科生或研究生的教材或參考書,也可作為計(jì)算機(jī)視覺工程人員的參考書。本書也適合作為計(jì)算機(jī)視覺相關(guān)領(lǐng)域,包括多媒體搜索、計(jì)算機(jī)圖像學(xué)、機(jī)器人、圖像處理、以及成像等領(lǐng)域的研究人員參考書。 2. Computer Vision: Algorithms and Applications
作者:Richard Hartley, Andrew Zisserman 出版時(shí)間:2000 (第一版),2004(第二版) 適合人群:初級(jí)到中級(jí)學(xué)者 推薦指數(shù):★★★★★ 本書內(nèi)容:理解真實(shí)世界的三維結(jié)構(gòu)是計(jì)算機(jī)視覺領(lǐng)域的一個(gè)基本問(wèn)題。本書內(nèi)容包括三維幾何與重建所需要的計(jì)算相關(guān)的幾何原則及物體的代數(shù)表達(dá)。本書以統(tǒng)一框架的形式給出了場(chǎng)景重建的理論與實(shí)現(xiàn)細(xì)節(jié)。同時(shí)作者也提供了詳盡的背景知識(shí)、應(yīng)用和實(shí)現(xiàn)算法的解釋。 推薦理由:本教材系統(tǒng)是多視角幾何經(jīng)典教材,既包含經(jīng)典的方法,又包括現(xiàn)代的方法。本書寫作清晰明了,又不失連貫性。本書可作為計(jì)算機(jī)視覺和計(jì)算機(jī)圖形學(xué)等課程高年級(jí)本科生和研究生教材,對(duì)于自動(dòng)駕駛、機(jī)器人、AR/VR、無(wú)人機(jī)、地理測(cè)繪等領(lǐng)域研究人員和技術(shù)人員是重要的參考書。 2. An Invitation to 3-D Vision: From Images to Geometric Models
作者:Yi Ma, Stefano Soatto, Jana Kosecká, S. Shankar Sastry 出版時(shí)間:2005 適合人群:初級(jí)到中級(jí)學(xué)者 推薦指數(shù):★★★★★ 主要內(nèi)容:本書著重講述了計(jì)算機(jī)視覺中的重要問(wèn)題:利用線性代數(shù)和矩陣?yán)碚搹囊幌盗卸S圖像中重建三維結(jié)構(gòu)和運(yùn)動(dòng)。本書的特點(diǎn)是一套基于多幅圖像的研究幾何和重建幾何模型的統(tǒng)一框架,也包括了圖像形成、基本的圖像處理方法以及特征提取等內(nèi)容,同時(shí)也給出實(shí)現(xiàn)視覺算法及系統(tǒng)的操作指南。 推薦理由:本書適合于計(jì)算機(jī)視覺、應(yīng)用數(shù)學(xué)、計(jì)算機(jī)圖形學(xué),及機(jī)器人等方向的高年級(jí)本科生、研究生以及研究人員。同時(shí)作者也提供了算法實(shí)現(xiàn)的程序,對(duì)于自動(dòng)駕駛、機(jī)器人、AR/VR、無(wú)人機(jī)、地理測(cè)繪等領(lǐng)域研究人員和技術(shù)人員是重要的參考書。 3. 計(jì)算機(jī)視覺: 計(jì)算理論與算法基礎(chǔ)
作者:Simon J.D. Prince 出版時(shí)間:2012 適合人群:初級(jí)到中級(jí)學(xué)者 推薦指數(shù):★★★★★ 主要內(nèi)容:本書介紹了解決計(jì)算機(jī)視覺問(wèn)題的概率模型學(xué)習(xí)與推理的方法,講述了如何利用訓(xùn)練數(shù)據(jù)建立觀察圖像和要估計(jì)的內(nèi)容的聯(lián)系,例如估計(jì)三維結(jié)構(gòu)。本書包括概率基礎(chǔ)知識(shí)、概率圖模型、圖分割方法、多視覺幾何、相機(jī)標(biāo)定、人臉識(shí)別、目標(biāo)跟蹤等等。書中共介紹了70多種算法。 推薦理由:本書可以看成計(jì)算機(jī)視覺與機(jī)器學(xué)習(xí)結(jié)合的果實(shí),提供了應(yīng)用于計(jì)算機(jī)視覺研究的機(jī)器學(xué)習(xí)(深度學(xué)習(xí)除外)基本知識(shí),描述簡(jiǎn)明直觀。本教材可作為高年級(jí)本科生以及研究生計(jì)算機(jī)視覺教材,也適合于計(jì)算機(jī)視覺從業(yè)人員。 2. Pattern Recognition and Machine Learning
作者:Christopher Bishop 出版時(shí)間:2006 適合人群:初級(jí)到中級(jí)學(xué)者 推薦指數(shù):★★★★★ 主要內(nèi)容:本書是第一本從貝葉斯的角度講述模式識(shí)別,用圖模型的方式描述離散概率分布的書籍。內(nèi)容包括:線性回歸模型、線性分類模型、神經(jīng)網(wǎng)絡(luò)、核方法、稀疏核方法、圖模型、混合模型與期望最大化算法、近似推理、采樣方法、連續(xù)隱變量模型等。 推薦理由:本書主要講述應(yīng)用于模式識(shí)別問(wèn)題的機(jī)器學(xué)習(xí)方法,也包括視覺識(shí)別問(wèn)題,適合作為高年級(jí)本科生及研究生的教材,也是計(jì)算機(jī)視覺領(lǐng)域研究人員及從業(yè)人員學(xué)習(xí)機(jī)器學(xué)習(xí)的參考書。 3. Deep Learning
作者:Ian Goodfellow and Yoshua Bengio and Aaron Courville 出版時(shí)間:2016 適合人群:初級(jí)、中級(jí)到高級(jí)學(xué)者 推薦指數(shù):★★★★☆ 主要內(nèi)容:本書包括三大部分,第一部分介紹了基本的數(shù)學(xué)工具和機(jī)器學(xué)習(xí)概念,第二部分描述了最著名的深度學(xué)習(xí)算法,第三部分列舉了深度學(xué)習(xí)研究前沿的想法及問(wèn)題。 推薦理由:本書不是專門為計(jì)算機(jī)視覺而寫的深度學(xué)習(xí)教材,但是包含了成書之前計(jì)算機(jī)視覺領(lǐng)域發(fā)明的深度學(xué)習(xí)技術(shù),可作為計(jì)算機(jī)視覺領(lǐng)域的高年級(jí)本科生及研究生的教材,也可作為計(jì)算機(jī)視覺研究人員和從業(yè)人員參考書。 4. Generalized Principal Component Analysis
作者:RenéVidal, Yi Ma, Shankar Sastry 出版時(shí)間:2016 適合人群:中級(jí)到高級(jí)學(xué)者 推薦指數(shù):★★★★★ 主要內(nèi)容:本書介紹了關(guān)于從一個(gè)或多個(gè)子空間或流形產(chǎn)生出來(lái)的,可能含有噪聲、大誤差或者異常的高維數(shù)據(jù)建模的數(shù)學(xué)理論和計(jì)算工作的最新進(jìn)展,涵蓋了用于子空間估計(jì)和分割的最新的代數(shù)的、幾何的、統(tǒng)計(jì)的計(jì)算方法,并且給出了若干在圖像處理、圖像視頻分割、人臉識(shí)別與聚類等問(wèn)題的有趣應(yīng)用。 推薦理由:本教材可做為計(jì)算機(jī)視覺以及圖像和信號(hào)處理、數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)、系統(tǒng)理論等領(lǐng)域的研究生和起步的研究者。本書包含了大量的圖解說(shuō)明、例子、以及練習(xí)習(xí)題,同時(shí)涵蓋了本教材涉及到的統(tǒng)計(jì)、優(yōu)化、代數(shù)幾何等方面的基本概念和原理。 四、經(jīng)典讀物篇 Vision: A Computational Investigation into the Human Representation and Processing of Visual Information