作品介紹

計(jì)算機(jī)視覺的修煉秘笈


作者:著名作家     整理日期:2022-07-17 07:45:28


  有很多讀者紛紛留言想得到計(jì)算機(jī)視覺領(lǐng)域的圖書推薦。今天我們就滿足大家的愿望,邀請(qǐng)微軟亞洲研究院計(jì)算機(jī)視覺組資深研究員王井東博士為大家推薦計(jì)算機(jī)視覺領(lǐng)域的經(jīng)典書目,他還貼心地為大家劃分了綜合篇、幾何篇、機(jī)器學(xué)習(xí)篇和經(jīng)典讀物四大類。
  計(jì)算機(jī)視覺是從圖像和視頻中提出數(shù)值或符號(hào)信息的計(jì)算系統(tǒng),更形象一點(diǎn)說(shuō),計(jì)算機(jī)視覺是讓計(jì)算機(jī)具備像人類一樣的眼睛,看到圖像,并理解圖像。加州大學(xué)洛杉磯分校統(tǒng)計(jì)學(xué)和計(jì)算機(jī)科學(xué)教授教授朱松純?cè)硎尽叭说拇竽X皮層的活動(dòng)大約70%是在處理視覺相關(guān)信息。視覺就相當(dāng)于人腦的大門。如果不能處理視覺信息的話,整個(gè)人工智能系統(tǒng)是個(gè)空架子,只能做符號(hào)推理,沒(méi)法研究真實(shí)世界的人工智能!
  一起來(lái)看看這些計(jì)算機(jī)視覺領(lǐng)域的修煉秘笈吧!下一個(gè)計(jì)算機(jī)視覺高手也許就是你哦!
  一、綜合篇
  1. Computer Vision: A Modern Approach
  計(jì)算機(jī)視覺的修煉秘笈
  作者:David A. Forsyth,‎ Jean Ponce
  出版時(shí)間:2003(第一版),2011(第二版)
  適合人群:初級(jí)到中級(jí)學(xué)者
  推薦指數(shù):★★★★★
  主要內(nèi)容:本書包含了計(jì)算機(jī)視覺領(lǐng)域眾多問(wèn)題:成像、面向單張圖像的早期視覺、面向多張圖像的早期視覺、中層視覺問(wèn)題、高層視覺問(wèn)題,也包括了相關(guān)的視覺應(yīng)用,如基于圖像的建模與繪制、以人為中心的視覺問(wèn)題、圖像搜索,最后,作者也簡(jiǎn)要講述了視覺算法相關(guān)的優(yōu)化技術(shù)。
  推薦理由:本書既有對(duì)計(jì)算機(jī)視覺問(wèn)題的系統(tǒng)的講解,又有對(duì)相關(guān)問(wèn)題的詳細(xì)的講述。通過(guò)本書,讀者能夠?qū)崿F(xiàn)計(jì)算機(jī)視覺應(yīng)用。本教材成書較早(第一版:2003,第二版:2011),但內(nèi)容全面廣泛,可作為高年級(jí)本科生或研究生的教材或參考書,也可作為計(jì)算機(jī)視覺工程人員的參考書。本書也適合作為計(jì)算機(jī)視覺相關(guān)領(lǐng)域,包括多媒體搜索、計(jì)算機(jī)圖像學(xué)、機(jī)器人、圖像處理、以及成像等領(lǐng)域的研究人員參考書。
  2. Computer Vision: Algorithms and Applications
  計(jì)算機(jī)視覺的修煉秘笈
  作者:Richard Szeliski
  出版時(shí)間:2010
  適合人群:初級(jí)到中級(jí)學(xué)者
  推薦指數(shù):★★★★★
  本書內(nèi)容:本教材包含用于分析理解圖像的各種各樣的技術(shù),同時(shí)也講述了具有挑戰(zhàn)性的現(xiàn)實(shí)世界的視覺問(wèn)題,比如醫(yī)學(xué)圖像,以及適合于個(gè)人相冊(cè)的圖像編輯技術(shù)等。具體課題包括:成像,圖像處理,特征檢測(cè)、匹配與分割,基于特征的對(duì)齊,基于運(yùn)動(dòng)的結(jié)構(gòu)重建,圖像粘貼,計(jì)算攝影學(xué),立體對(duì)齊,三維重建,基于圖像的繪制和識(shí)別等等。作者也提供了計(jì)算機(jī)視覺算法涉及到的線性代數(shù)、數(shù)值優(yōu)化技術(shù)、貝葉斯建模與推理。
  推薦理由:本書是作者多年從事計(jì)算機(jī)視覺教學(xué)與研究的成果,按照課程項(xiàng)目的方式組織?晒└吣昙(jí)本科生和研究生計(jì)算機(jī)視覺課程的教材。
  二、幾何篇
  1. Multiple View Geometry in Computer Vision
  計(jì)算機(jī)視覺的修煉秘笈
  作者:Richard Hartley, Andrew Zisserman
  出版時(shí)間:2000 (第一版),2004(第二版)
  適合人群:初級(jí)到中級(jí)學(xué)者
  推薦指數(shù):★★★★★
  本書內(nèi)容:理解真實(shí)世界的三維結(jié)構(gòu)是計(jì)算機(jī)視覺領(lǐng)域的一個(gè)基本問(wèn)題。本書內(nèi)容包括三維幾何與重建所需要的計(jì)算相關(guān)的幾何原則及物體的代數(shù)表達(dá)。本書以統(tǒng)一框架的形式給出了場(chǎng)景重建的理論與實(shí)現(xiàn)細(xì)節(jié)。同時(shí)作者也提供了詳盡的背景知識(shí)、應(yīng)用和實(shí)現(xiàn)算法的解釋。
  推薦理由:本教材系統(tǒng)是多視角幾何經(jīng)典教材,既包含經(jīng)典的方法,又包括現(xiàn)代的方法。本書寫作清晰明了,又不失連貫性。本書可作為計(jì)算機(jī)視覺和計(jì)算機(jī)圖形學(xué)等課程高年級(jí)本科生和研究生教材,對(duì)于自動(dòng)駕駛、機(jī)器人、AR/VR、無(wú)人機(jī)、地理測(cè)繪等領(lǐng)域研究人員和技術(shù)人員是重要的參考書。
  2. An Invitation to 3-D Vision: From Images to Geometric Models
  計(jì)算機(jī)視覺的修煉秘笈
  作者:Yi Ma, Stefano Soatto,‎ Jana Kosecká,‎ S. Shankar Sastry
  出版時(shí)間:2005
  適合人群:初級(jí)到中級(jí)學(xué)者
  推薦指數(shù):★★★★★
  主要內(nèi)容:本書著重講述了計(jì)算機(jī)視覺中的重要問(wèn)題:利用線性代數(shù)和矩陣?yán)碚搹囊幌盗卸S圖像中重建三維結(jié)構(gòu)和運(yùn)動(dòng)。本書的特點(diǎn)是一套基于多幅圖像的研究幾何和重建幾何模型的統(tǒng)一框架,也包括了圖像形成、基本的圖像處理方法以及特征提取等內(nèi)容,同時(shí)也給出實(shí)現(xiàn)視覺算法及系統(tǒng)的操作指南。
  推薦理由:本書適合于計(jì)算機(jī)視覺、應(yīng)用數(shù)學(xué)、計(jì)算機(jī)圖形學(xué),及機(jī)器人等方向的高年級(jí)本科生、研究生以及研究人員。同時(shí)作者也提供了算法實(shí)現(xiàn)的程序,對(duì)于自動(dòng)駕駛、機(jī)器人、AR/VR、無(wú)人機(jī)、地理測(cè)繪等領(lǐng)域研究人員和技術(shù)人員是重要的參考書。
  3. 計(jì)算機(jī)視覺: 計(jì)算理論與算法基礎(chǔ)
  計(jì)算機(jī)視覺的修煉秘笈
  作者:馬頌德,張正友
  出版時(shí)間:1998 (第一版),2003(第二版)
  適合人群:初級(jí)到中級(jí)
  推薦指數(shù):★★★★★
  主要內(nèi)容:計(jì)算機(jī)視覺從信息處理的層次研究視覺信息的認(rèn)知過(guò)程,以及視覺信息處理的計(jì)算理論、表達(dá)與計(jì)算方法。本書系統(tǒng)地介紹了計(jì)算機(jī)視覺的重要理論與算法,包括圖像特征提取、攝像機(jī)定標(biāo)、立體視覺、運(yùn)動(dòng)視覺(或稱序列圖像分析)、由圖像灰度恢復(fù)三維物體形狀的方法、物體建模與識(shí)別方法以及距離圖像分析方法等。
  推薦理由:本書主要涵蓋了計(jì)算機(jī)視覺領(lǐng)域早期視覺的問(wèn)題,對(duì)相關(guān)問(wèn)題的研究背景和實(shí)現(xiàn)方法做了詳細(xì)闡述?勺鳛楦吣昙(jí)本科生或研究生的教材或參考書,也可供自動(dòng)駕駛,AR/VR,無(wú)人機(jī),地理測(cè)繪等領(lǐng)域研究人員和技術(shù)人員參考。
  三、機(jī)器學(xué)習(xí)篇
  1. Computer Vision: Models, Learning, and Inference
  計(jì)算機(jī)視覺的修煉秘笈
  作者:Simon J.D. Prince
  出版時(shí)間:2012
  適合人群:初級(jí)到中級(jí)學(xué)者
  推薦指數(shù):★★★★★
  主要內(nèi)容:本書介紹了解決計(jì)算機(jī)視覺問(wèn)題的概率模型學(xué)習(xí)與推理的方法,講述了如何利用訓(xùn)練數(shù)據(jù)建立觀察圖像和要估計(jì)的內(nèi)容的聯(lián)系,例如估計(jì)三維結(jié)構(gòu)。本書包括概率基礎(chǔ)知識(shí)、概率圖模型、圖分割方法、多視覺幾何、相機(jī)標(biāo)定、人臉識(shí)別、目標(biāo)跟蹤等等。書中共介紹了70多種算法。
  推薦理由:本書可以看成計(jì)算機(jī)視覺與機(jī)器學(xué)習(xí)結(jié)合的果實(shí),提供了應(yīng)用于計(jì)算機(jī)視覺研究的機(jī)器學(xué)習(xí)(深度學(xué)習(xí)除外)基本知識(shí),描述簡(jiǎn)明直觀。本教材可作為高年級(jí)本科生以及研究生計(jì)算機(jī)視覺教材,也適合于計(jì)算機(jī)視覺從業(yè)人員。
  2. Pattern Recognition and Machine Learning
  計(jì)算機(jī)視覺的修煉秘笈
  作者:Christopher Bishop
  出版時(shí)間:2006
  適合人群:初級(jí)到中級(jí)學(xué)者
  推薦指數(shù):★★★★★
  主要內(nèi)容:本書是第一本從貝葉斯的角度講述模式識(shí)別,用圖模型的方式描述離散概率分布的書籍。內(nèi)容包括:線性回歸模型、線性分類模型、神經(jīng)網(wǎng)絡(luò)、核方法、稀疏核方法、圖模型、混合模型與期望最大化算法、近似推理、采樣方法、連續(xù)隱變量模型等。
  推薦理由:本書主要講述應(yīng)用于模式識(shí)別問(wèn)題的機(jī)器學(xué)習(xí)方法,也包括視覺識(shí)別問(wèn)題,適合作為高年級(jí)本科生及研究生的教材,也是計(jì)算機(jī)視覺領(lǐng)域研究人員及從業(yè)人員學(xué)習(xí)機(jī)器學(xué)習(xí)的參考書。
  3. Deep Learning
  計(jì)算機(jī)視覺的修煉秘笈
  作者:Ian Goodfellow and Yoshua Bengio and Aaron Courville
  出版時(shí)間:2016
  適合人群:初級(jí)、中級(jí)到高級(jí)學(xué)者
  推薦指數(shù):★★★★☆
  主要內(nèi)容:本書包括三大部分,第一部分介紹了基本的數(shù)學(xué)工具和機(jī)器學(xué)習(xí)概念,第二部分描述了最著名的深度學(xué)習(xí)算法,第三部分列舉了深度學(xué)習(xí)研究前沿的想法及問(wèn)題。
  推薦理由:本書不是專門為計(jì)算機(jī)視覺而寫的深度學(xué)習(xí)教材,但是包含了成書之前計(jì)算機(jī)視覺領(lǐng)域發(fā)明的深度學(xué)習(xí)技術(shù),可作為計(jì)算機(jī)視覺領(lǐng)域的高年級(jí)本科生及研究生的教材,也可作為計(jì)算機(jī)視覺研究人員和從業(yè)人員參考書。
  4. Generalized Principal Component Analysis
  計(jì)算機(jī)視覺的修煉秘笈
  作者:RenéVidal,‎ Yi Ma,‎ Shankar Sastry
  出版時(shí)間:2016
  適合人群:中級(jí)到高級(jí)學(xué)者
  推薦指數(shù):★★★★★
  主要內(nèi)容:本書介紹了關(guān)于從一個(gè)或多個(gè)子空間或流形產(chǎn)生出來(lái)的,可能含有噪聲、大誤差或者異常的高維數(shù)據(jù)建模的數(shù)學(xué)理論和計(jì)算工作的最新進(jìn)展,涵蓋了用于子空間估計(jì)和分割的最新的代數(shù)的、幾何的、統(tǒng)計(jì)的計(jì)算方法,并且給出了若干在圖像處理、圖像視頻分割、人臉識(shí)別與聚類等問(wèn)題的有趣應(yīng)用。
  推薦理由:本教材可做為計(jì)算機(jī)視覺以及圖像和信號(hào)處理、數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)、系統(tǒng)理論等領(lǐng)域的研究生和起步的研究者。本書包含了大量的圖解說(shuō)明、例子、以及練習(xí)習(xí)題,同時(shí)涵蓋了本教材涉及到的統(tǒng)計(jì)、優(yōu)化、代數(shù)幾何等方面的基本概念和原理。
  四、經(jīng)典讀物篇
  Vision: A Computational Investigation into the Human Representation and Processing of Visual Information
  計(jì)算機(jī)視覺的修煉秘笈
  作者:David Marr
  出版時(shí)間:1982
  適合人群:中級(jí)及高級(jí)學(xué)者
  推薦指數(shù):★★★★★
  主要內(nèi)容:本書提供了理解視覺感知的框架,也涉及了大量研究和理解大腦及其功能的問(wèn)題。在Marr的框架里,視覺過(guò)程建立了一套表達(dá)方法:開始于圖像描述,終結(jié)于在周圍環(huán)境中的三維物體描述。他提出了在神經(jīng)科學(xué)和認(rèn)知科學(xué)領(lǐng)域具有重大影響力的多層次分析方法論:計(jì)算層次、算法層次、硬件算法層次。
  推薦理由:本書系統(tǒng)的描述了Marr的對(duì)于視覺感知的理解的框架。本書自出版以來(lái),影響一代大腦及認(rèn)知科學(xué)家。時(shí)至今日,這本書依然是致力于大腦和認(rèn)知科學(xué)、計(jì)算機(jī)視覺領(lǐng)域特別是視覺感知的研究人員的參考書。

怎么樣,找到適合自己的書了嗎?2018年不妨先給自己定個(gè)小計(jì)劃:讀完3本計(jì)算機(jī)視覺的經(jīng)典書目!

你還有哪些喜歡的計(jì)算機(jī)視覺領(lǐng)域的書呢?






上一本:什么是藝術(shù)?這七本書,帶你走進(jìn)藝術(shù)的世界 下一本:政治舞臺(tái)上的風(fēng)云人物

作家文集

下載說(shuō)明
計(jì)算機(jī)視覺的修煉秘笈的作者是著名作家,全書語(yǔ)言優(yōu)美,行文流暢,內(nèi)容豐富生動(dòng)引人入勝。為表示對(duì)作者的支持,建議在閱讀電子書的同時(shí),購(gòu)買紙質(zhì)書。

更多好書