在機器學習上,首先要推薦的是兩部國內作者的著作:李航博士所著的《統(tǒng)計學習方法》和周志華教授的《機器學習》。 《統(tǒng)計學習方法》采用“總 - 分 - 總”的結構,在梳理了統(tǒng)計學習的基本概念后,系統(tǒng)而全面地介紹了統(tǒng)計學習中的 10 種主要方法,最后對這些算法做了總結與比較。這本書以數(shù)學公式為主,介紹每種方法時都給出了詳盡的數(shù)學推導,幾乎不含任何廢話,因而對讀者的數(shù)學背景也提出了較高的要求。 相比之下,《機器學習》覆蓋的范圍更廣,具有更強的導論性質,有助于了解機器學習的全景。書中涵蓋了機器學習中幾乎所有算法類別的基本思想、適用范圍、優(yōu)缺點與主要實現(xiàn)方式,并穿插了大量通俗易懂的實例。 如果說《統(tǒng)計學習方法》勝在深度,那么《機器學習》就勝在廣度。在具備廣度的前提下,可以根據《機器學習》中提供的豐富參考文獻繼續(xù)深挖。 讀完以上兩本書,就可以閱讀一些經典著作了。經典著作首推Tom Mitchell所著的Machine Learning,中譯本名為《機器學習》。本書成書于 1997 年,雖然難以覆蓋機器學習中的最新進展,但對于基本理論和核心算法的論述依然鞭辟入里,畢竟經典理論經得起時間的考驗。這本書的側重點也在于廣度,并不涉及大量復雜的數(shù)學推導,是比較理想的入門書籍。作者曾在自己的主頁上說本書要出新版,并補充了一些章節(jié)的內容,也許近兩年可以期待新版本的出現(xiàn)。 另一本經典著作是Trevor Hastie等人所著的Elements of Statistical Learning,于 2016 年出版了第二版。這本書沒有中譯,只有影印本。高手的書都不會用大量復雜的數(shù)學公式來嚇唬人(專于算法推導的書除外),這一本也不例外。它強調的是各種學習方法的內涵和外延,相比于具體的推演,通過方法的來龍去脈來理解其應用場景和發(fā)展方向恐怕更加重要。 壓軸登場的非Christopher Bishop所著的Pattern Recognition and Machine Learning莫屬了。本書出版于 2007 年,沒有中譯本,也許原因在于將這樣一本煌煌巨著翻譯出來不知要花費多少挑燈夜戰(zhàn)的夜晚。這本書的特點在于將機器學習看成一個整體,不管于基于頻率的方法還是貝葉斯方法,不管是回歸模型還是分類模型,都只是一個問題的不同側面。作者能夠開啟上帝視角,將機器學習的林林總總都納入一張巨網之中,遺憾的是,大多數(shù)讀者跟不上他高屋建瓴的思路(也包括我自己)。 最后推薦的是David J C MacKay所著的Information Theory, Inference and Learning Algorithms,成書于 2003 年,中譯本名為《信息論,推理與學習算法》。本書作者是一位全才型的科學家,這本書也并非機器學習的專著,而是將多個相關學科熔于一爐,內容涉獵相當廣泛。相比于前面板著臉的教科書,閱讀本書的感覺就像在和作者聊天,他會在談笑間拋出各種各樣的問題讓你思考。廣泛的主題使本書的閱讀體驗并不輕松,但可以作為擴展視野的一個調節(jié)。
|