如今,這樣的橋段在人工智能領(lǐng)域真實上演。它,就是深度學習。
“左右互搏術(shù)”與深度學習中的一種對抗訓(xùn)練原理相仿,即有兩個角色——生成器和判別器。生成器類似于左手,扮演攻方;判別器類似于右手,扮演守方。
判別器的目的是正確區(qū)分真實數(shù)據(jù)和生成數(shù)據(jù),從而最大化判別準確率;生成器則是盡可能逼近真實數(shù)據(jù)的潛在分布。二者需要不斷提高各自的判別能力和生成能力來取勝,從而實現(xiàn)目標優(yōu)化。
今天,讓我們打開這個“神秘魔盒”。
深度學習的概念,最早是由杰弗里·辛頓在2006年提出的。這是一門用于學習和利用“深度”人工神經(jīng)網(wǎng)絡(luò)的機器學習技術(shù)。作為人工智能領(lǐng)域中最熱的研究方向,深度學習迅速受到學術(shù)界和工業(yè)界的關(guān)注。
目前,深度學習已得到廣泛應(yīng)用。如在博弈領(lǐng)域,AlphaGo通過深度學習,以4∶1的比分戰(zhàn)勝韓國棋手李世石,成為第一個擊敗人類職業(yè)圍棋選手的電腦程序;在醫(yī)學影像識別中,以深度學習為核心技術(shù)的X光、核磁、CT、超聲等醫(yī)療影像多模態(tài)大數(shù)據(jù)的分析技術(shù),可提取二維或三維醫(yī)療影像中隱含的疾病特征;在圖像處理中,最成功的領(lǐng)域是計算機視覺,如圖像風格遷移、圖像修復(fù)、圖像上色、人臉圖像編輯以及視頻生成等。
一種特殊的機器學習方法
今天的人工智能,其實是把現(xiàn)實生活中的問題量化成了可計算的問題,然后用計算機算出來。數(shù)學模型則架起了中間的橋梁。
現(xiàn)實生活中,很多問題都可以通過建模解決。比如計算遠程火炮彈道問題,計算日食、月食出現(xiàn)的時間和地點等。我們只要把相應(yīng)公式用計算機語言寫一遍,再代入?yún)?shù),就能計算出來。
然而,更多問題的解決方法是不確定的。即使我們找到了相應(yīng)的數(shù)學模型,也不知道應(yīng)該代入什么參數(shù)。比如語音識別、人臉識別和機器翻譯等。因此,我們需要讓計算機通過自主學習,從大量數(shù)據(jù)中得到相應(yīng)參數(shù)。這個過程,就是機器學習。
機器學習旨在發(fā)現(xiàn)數(shù)據(jù)存在和利用的模式,并用它們進行學習及做出預(yù)測。機器學習的過程,就是用計算機算法不斷地優(yōu)化模型,讓它越來越接近真實情況的過程。它與人類學習的道理如出一轍。
考察人的學習通常方式是考試,如果分數(shù)不及格,就需要進一步學習。機器學習也要這樣來衡量,它的目標用專業(yè)術(shù)語來說,就是“期望值最大化”。
機器學習的效果取決于兩個方面:一方面是學習的深度。機器學習并不能“一口吃成個胖子”,它的訓(xùn)練算法需要迭代執(zhí)行。這如同人在學習時要通過復(fù)習來“溫故而知新”一樣。機器學習迭代的次數(shù)越多,即學習得越深入,得到的數(shù)學模型效果越好。另一方面是數(shù)據(jù)的質(zhì)與量。正如我們做大量優(yōu)質(zhì)習題,成績就會提高。機器學習也是如此,訓(xùn)練數(shù)據(jù)量越大,學習效果就會越好。
根據(jù)數(shù)學模型的特點,機器學習有兩種方法:一種是利用已知模型進行訓(xùn)練;另一種是在模型未知的情況下,設(shè)計一些簡單通用的模型結(jié)構(gòu),然后使用大量的數(shù)據(jù)進行訓(xùn)練,訓(xùn)練成什么樣就是什么樣。這便是我們常聽到的人工智能“黑箱”問題,即使訓(xùn)練有效,也不清楚里面是什么。
深度學習就是后一種機器學習的方法。人工智能涵蓋的領(lǐng)域十分廣泛,深度學習只是其中的一個分支,屬于機器學習的范疇。人工智能需要有“獨立思考”能力與機器學習技術(shù)的支持,深度學習便是幫助機器實現(xiàn)“獨立思考”的一種方式。
深度學習迎來革命性突破
人工神經(jīng)網(wǎng)絡(luò),簡稱神經(jīng)網(wǎng)絡(luò),是一種模仿動物中樞神經(jīng)系統(tǒng)結(jié)構(gòu)和功能的數(shù)學模型,是用大量簡單處理單元經(jīng)廣泛連接而組成的人工網(wǎng)絡(luò)。它其實是一個特殊的分類器,用于對函數(shù)進行估計等。
神經(jīng)網(wǎng)絡(luò)為許多問題的研究提供了新思路,特別是迅速發(fā)展的深度學習,能發(fā)現(xiàn)高維數(shù)據(jù)中的復(fù)雜結(jié)構(gòu),取得比傳統(tǒng)機器學習更好的效果。
20世紀50年代,人類第一次設(shè)計出計算機能運行的神經(jīng)網(wǎng)絡(luò)算法。此時的神經(jīng)網(wǎng)絡(luò),雖然給了人們很多遐想空間,卻解決不了實際問題,因此被打入“冷宮”。
到了20世紀80年代末期,人們提出反向傳播算法,可讓一個神經(jīng)網(wǎng)絡(luò)模型從大量樣本中學習統(tǒng)計規(guī)律,從而對未知事件做出預(yù)測。隨后,支持向量機等各種各樣的機器學習方法被相繼提出。不過,這些模型的結(jié)構(gòu)均為淺層學習方法,處理復(fù)雜問題的能力受到一定制約。因此,神經(jīng)網(wǎng)絡(luò)再進“冷宮”。
2006年,加拿大教授辛頓和他的學生提出深度學習神經(jīng)網(wǎng)絡(luò)的“快速學習”算法,使深度學習迎來了革命性突破。深度學習通過學習一種深層非線性網(wǎng)絡(luò)結(jié)構(gòu),展現(xiàn)出了從少數(shù)樣本中集中學習數(shù)據(jù)及本質(zhì)特征的強大能力。
從此,神經(jīng)網(wǎng)絡(luò)學會了反復(fù)分類以及識別物體的方法,并展現(xiàn)出乎意料的精準度。
計算能力成為推動深度學習的利器
人工神經(jīng)網(wǎng)絡(luò)在被提出的50年間,都沒能很好地解決智能問題。究其原因,除了算法本身不完善外,還在于計算機絕對速度不夠快,而且單位計算能力的能耗太高,無法通過大量服務(wù)器搭建并行計算系統(tǒng),來達成深度人工神經(jīng)網(wǎng)絡(luò)。
那么,靠什么加以突破?答案就是摩爾定律。
摩爾定律是英特爾聯(lián)合創(chuàng)始人戈登·摩爾在1965年提出的一項觀察結(jié)論,即計算機的總體處理能力大約每2年就會翻一番。經(jīng)歷近50年的歷史檢驗,摩爾定律展現(xiàn)出驚人的準確性。摩爾定律帶來的結(jié)果是,在過去的半個多世紀里,計算機處理器性能增長了上億倍,耗電量卻降到了百分之一。
從能量角度看,摩爾定律反映出了人類在單位能耗下,所能完成信息處理能力的大幅提升。而這正是實現(xiàn)人工智能的基礎(chǔ)所在。
從某種意義上說,不僅是深度學習技術(shù),今天的人工智能都是靠算力成就的。
人工智能的崛起,有3個技術(shù)要素:一是它解決了可計算問題,即在算法上的突破;二是它積累了大量數(shù)據(jù),形成了可學習的原材料;三是摩爾定律所推測的,處理能力得到持續(xù)提高。
算力是推動深度學習的利器。計算能力越強,同樣時間內(nèi)積累的經(jīng)驗就越多、迭代速度也越快,深度學習的性能也就越高。
不斷進化的深度學習之道
1997年,“深藍”在國際象棋比賽中戰(zhàn)勝加里·卡斯帕羅夫;2016年,AlphaGo在圍棋比賽中戰(zhàn)勝李世石。
雖然這兩種人工智能系統(tǒng)都學會了下棋,但教授它們的方式以及它們?nèi)绾伪荣悾瑒t大相徑庭。
“深藍”的核心評估函數(shù)對給定盤面進行數(shù)字“排序”,而且函數(shù)是手工設(shè)計的。這種比賽風格,實際上是一種“蠻力”!吧钏{”將其評估函數(shù)應(yīng)用到許多備選的未來狀態(tài),對每個棋手預(yù)先搜索七八步,以2億次/秒的速度進行局面評估。
AlphaGo的學習方法則迥然不同。它通過一種雙管齊下的深度學習方法“學習”,用“價值網(wǎng)絡(luò)”評估局面,用“策略網(wǎng)絡(luò)”選擇走棋。
深度學習神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,一部分通過使用人類高手對弈數(shù)據(jù)集的監(jiān)督學習進行(總出棋數(shù)約為3000萬步),另一部分通過對自我對弈非監(jiān)督強化學習進行(模擬成千上萬場隨機比賽)。它不使用預(yù)測搜索,走棋是單個“圍棋局面”整體評估的結(jié)果。
2017年5月,在中國烏鎮(zhèn)圍棋峰會上,AlphaGo的升級版AlphaGo Zero,與世界排名第一的圍棋冠軍柯潔對戰(zhàn),結(jié)果以3∶0的總比分完勝。
令人震驚的是,AlphaGo Zero一開始并沒接觸過人類棋譜。它使用了新的強化學習方法,從單一神經(jīng)網(wǎng)絡(luò)開始,通過神經(jīng)網(wǎng)絡(luò)強大的搜索算法,進行自我對弈訓(xùn)練。隨著自我對弈次數(shù)的增加,神經(jīng)網(wǎng)絡(luò)逐漸調(diào)整,提升預(yù)測下一步的能力,最終成為具備超強棋力的“選手”。更為厲害的是,隨著訓(xùn)練的深入,AlphaGo Zero還獨立發(fā)現(xiàn)了游戲規(guī)則,走出了新策略,為圍棋這項古老游戲帶來了新見解。
目前,深度學習在許多領(lǐng)域取得了技術(shù)性突破,并展示了極佳效果。然而,它仍存在一些局限:理論研究缺乏、無監(jiān)督學習能力弱、缺少邏輯推理和記憶能力等。
深度學習對未來社會發(fā)展具有重要意義,需要不斷深入研究,從多方向多角度更全面地開發(fā)深度學習的潛在價值。面對復(fù)雜的戰(zhàn)場,以深度學習為代表的人工智能技術(shù)也已逐步滲透到軍事領(lǐng)域,深刻影響著人類戰(zhàn)爭。
可以推斷,未來作為“左右互搏術(shù)”的深度學習,必將繼續(xù)升級演化,開啟更高深的境界。
(來源:中國青年報)