人工智能中的良多焦點問題起首需要一個得當的哲學解,然后是把這個哲學不雅點切確化的數學解,最后是把這個數學模子操作化的程序解。這三者缺一不成。
好比“機械進修發生成見”就源于練習數據的代表性,這其實是休謨問題的表示形式之一。注重到休謨問題會讓您發現,概率統計到底能不克不及用不是很輕易能斷定的。
撰文 | 王培(美國天普大學計較機與信息科學系)
歸納有理嗎?
所謂“歸納”,指的是從個體事例到遍及歸納綜合的推理過程,好比從對諸多烏鴉的不雅察中得出“全國烏鴉一般黑”的結論。與其相反的“演繹”推理則是從一般陳述到具體事例。在汗青上,對這些推理的研究是在兩個層面長進行的。一個是個別層面,存眷一小我如何進行這些推理來獲得常識。這是熟悉論、認貼心理學、邏輯學的焦點問題之一,盡管這些學科的思緒各有分歧。另一個是在群體層面,存眷在科學理論的構建和利用中如何進行這些推理。這是科學哲學、科學史等范疇研究的問題。盡管有各類細節上的不同,在這兩個條理上的歸納及其與演繹的關系仍有底子上的同質性,所以下面我會一路會商。
因為經驗科學往往是從不雅察到的具表現象出發,逐漸歸納綜合、抽象到一般性理論,這一過程很天然地會被算作是個歸納過程。培根(Francis Bacon,1561-1626)、穆勒(John Stuart Mill,1806-1873)等哲學家就曾試圖清算出一套 “歸納邏輯” 或 “科學歸納法”,認為經由過程系統地收集和清算不雅察材料,然后對假說進行評價和篩選,就可以獲得靠得住的科學理論。其實至今大部門科學家根基上仍是遵循近似的方式,盡管他們往往將其看作不移至理,不需要專門拿出來會商的。
粉碎了這一派承平氣象的是休謨(David Hume,1711-1776)。他指出既然歸納是從已知事例中歸納綜合出一般結論,那就是一種“擴大常識的推理”,因為結論也包羅了將來事例,所以超出了曩昔已知的規模。除非將來和曩昔是一樣的,這種結論就不克不及包管準確。但怎么證實將來和曩昔一樣呢?歸納證實會導致輪回論證,更不必說有人會認為將來和曩昔原本就不會完全一樣。休謨認為歸納只是一種心理習慣,就是說我們簡直都這么想,但這種思維體例并沒有理性根本,是以不這么想也不克不及算錯。
休謨的論證總讓我想起魯迅《狂人日志》里的詰責:“從來如斯,便對么?” 當然狂人的“對”說的是倫理,而休謨說的是邏輯,但二人的問題和獲得的反映都差不多。學者們感覺休謨的論證難以辯駁,但又毫不能接管,因為這樣一來常識和科學理論的合理性就都朝了。給他貼一個“不成知論者”的標簽和叫一小我“瘋子”的啟事近似吧。科學取得的當作就有目共睹,這時辰說其焦點法則沒有事理可言只是習慣罷了,這不是腦子有弊端嗎?
既然歸納的合理性難以論證,天然有人會為科學另找依據。波普爾(Karl Popper,1902-1994)寫了一本《科學發現的邏輯》,其本家兒要結論倒是科學假說的發現不合適任何邏輯,而邏輯的感化只是對假說進行證偽。所謂的“科學理論”只不外是尚未被證偽的假說罷了。這個結論影響很大,在挑戰良多自稱“科學”的學說時堪稱利器,但良多人感覺把歸納完全掃地出門似乎過度了。歸納被稱為“科學的名譽,哲學的丑聞”就是這個緣故:明明是個好工具,就是說不清事理安在。
黑烏鴉和黑綿羊的疑案
我猜讀到此處,有些讀者已經在心里念叨了:哲學家就是沒事謀事。好用就行了唄,刨根問底干什么!我這里就呼喚兩只黑色的神獸,用它們的力量來申明歸納里面的麻煩遠不是把哲學家們都封口就完事了。
作為對休謨和波普爾的回應,良多人指出歸納結論的準確性不應被算作絕對的真或偽,而是個水平問題。歸納就是按照證據增添或削減對一個陳述的相信水平。好比說對“烏鴉是黑的”這個陳述,每當我們看到一只黑烏鴉,我們對這個陳述的相信水平會上升,而若是看到一只白烏鴉,相信水平會下降。這就是說,對“是A就是B”這種陳述而言,每當我們看到A的一個實例,若是它也是B,它就是陳述的正例,不然就是反例,而相信水平會響應被調整。
到此為止似乎沒弊端,但亨普爾(Carl Gustav Hempel,1905-1997)發現了一個問題:按照經典邏輯,陳述“是A就是B“ 和它的逆否陳述“不是B就不是A”等價,即說的是一回事。那就是說這兩個陳述的正、反例是一樣的。一個紅蘋果既不是黑的也不是烏鴉,所以它就是“不是黑的就不是烏鴉”的正例,是以也就是“烏鴉是黑的”的正例。這就是說每當您看見一個紅蘋果,您對“烏鴉是黑的”的相信水平就應該增添。這就是有名的“亨普爾悖論”,又稱“烏鴉悖論”。您若是感覺這還不敷怪,那您必然是個哲學家,因為亨普爾本人就建議我們接管這個聽起來怪怪的成果,不然的話我們就要挑戰邏輯等價性尺度,那后果就更嚴重了。但即使我們硬著頭皮認可紅蘋果簡直應該使我們加倍相信“烏鴉是黑的”,那怪事也沒有完,因為按照同樣的來由,我們同時應該加倍相信“烏鴉是白的”,“烏鴉是金子做的”,“天是藍的”,等等。奇奧吧?
若是黑烏鴉帶來的霉氣還幾多可以賴到哲學家頭上,那下面的黑綿羊就完全沒法讓他們背鍋了。一個出處不詳的笑話說一位天文學家、一位物理學家和一位數學家坐火車進入蘇格蘭后,在窗外見到一只黑色的綿羊。天文學家說:“蘇格蘭的綿羊是黑的!” 物理學家改正說:“應該說有一些蘇格蘭綿羊是黑的。”這時數學家說:“您們都錯了。準確的說法是:在蘇格蘭,至少有一只綿羊,且這只綿羊至少有一面看起來是黑的。” 這個笑話八當作是物理學家們編出來嘲諷天文學家的不嚴謹和數學家的過度嚴謹,但它同時展示了歸納的另一個麻煩:即使是對統一個不雅察成果來說,也存在多種歸納綜合的可能性。
好比說對上面的場景,歸納結論“蘇格蘭的綿羊是黑的”“歐洲的綿羊是黑的”和 “蘇格蘭的動物是黑的”與不雅察的邏輯關系是一樣的,都是在“對象a是范圍A的一個實例”的前提下將 “a是B” 推廣到“A是B”。當一個對象同時屬于多個群體時,選擇哪個做歸納綜合就是個問題了。這個選擇顯然不是肆意的,但又沒有一個尺度謎底。好比說在描寫或人做了某事(可能是功德也可能是壞事)時,把這小我稱號當作某省人、某校結業生、某公司雇員、某行業從業者都是可以的,但在讀者心目中造當作的結果會幾多有所分歧,恰是因為這個標簽會指導標的目的特定偏向的歸納。
上面兩個例子已經不僅僅是抽象的哲學問題了。若是我們設計了一小我工智能系統,那它在見到上述黑烏鴉、黑綿羊,以至于紅蘋果時,應該發生什么樣的結論?當然一個保險的方案是不進行任何歸納或歸納綜合,但這種系統的“智能” 就半斤八兩有限了。我們都知道以偏概滿是不合錯誤的,但又都感覺能見微知著的才是伶俐人。
統計進修也躲不開這些麻煩
一旦歸納結論的真假被看作水平問題,一個顯然的選擇就是將其暗示當作概率,而統計推理的根基功能恰是經由過程對現有樣本的闡發來展望將來事務的發生可能性,是以也是歸納的一種形式。
這樣說來,休謨的問題在這里也存在:怎么包管已知樣本和將來事例順從同樣的統計紀律呢?從底子上來說這是沒法子包管的。但在概率統計的理論模子中,這個問題可以操縱根基假設往返避失落。好比說一個常見的假設就是所有樣本,包羅已經收集到的和將來會碰到的,都是從統一個樣本空間中按照某種確定的概率分布獲得的。常見的實例是擲骰子。盡管頻頻擲一個骰子時獲得各個數字的機遇可能是分歧的,但只如果骰子和拋擲情況不變,這些機遇就不變。盡管我們起頭時不知道這些機遇的巨細,用曩昔的呈現頻率來展望將來的數字仍是合理的。這里能包管的不是每次都猜對,而是對各個數字呈現的統計紀律的描述可以越來越精確。
但這不申明概率統計解決了休謨問題,而是相反:只有在有來由認為休謨問題不呈現或不嚴重的情境下,才能利用概率統計。并不是所有應用情境都知足這個前提的。好比說把某只股票的股價看作一個隨機變量就紛歧定是合理的,因為其取值未必遵循一個不變的概率分布。這應該算是常識,但往往被有意無意地忽略,其成果就是即使所有計較都合適概率統計的要求,結論也不具有規范性,因為在這個問題上用這個模子的正當性自己就有問題。
邇來引起越來越多存眷的“機械進修發生成見”的現象就直接源于練習數據的代表性,這其實也是休謨問題的表示形式之一。所謂“成見”往往相對練習數據集而言是“正見”,只是把它用于一個新的數據集時才看出“偏”來。在新的數據達到之前,一個統計結論是否屬于成見其實是無從判定的。這就是嚴酷按照概率統計模子作出的展望仍可能掉敗的本家兒要原因之一。這種問題和由小概率事務、數據不足、數據中的噪聲等等所造當作的問題分歧,是不克不及用概率統計所供給的手段來解決的,因為這些手段的有用性自己就是成立在休謨問題不會呈現的前提之下的。
面臨一個具體應用問題,概率統計到底能不克不及用不是很輕易就能斷定的。常見的對策是先用用嘗嘗,好就接著用,但以前的當作功其實不克不及包管今后的當作功,即使是那些號稱“已被大量事實充實證實”的結論也是如斯。在情況不竭轉變的環境下,無論是如何的大數據,也只申明曩昔,而無法精確展望將來,即使在概率意義下(如“包管95%的準確率”)也做不到。前一段時候,八百多科學家聯名要求遏制利用“統計顯著性”,也和這個問題有關。所謂統計顯著性就是成立一個尺度以確定在什么環境下可以把一個統計假說算作是“真的”。這些科學家認為不確定身分老是存在的,所以沒有一個同一的尺度可以把統計結論轉換當作非真即假的二值結論。
除了休謨問題之外,前面提到的其它和歸納有關的問題也有其在概率統計中的響應形式。好比說對于歸納結論不惟一的問題,在機械進修中的一般處置體例是預先設定某種“歸納偏好”,以達到限制和選擇結論的目標。若是太切近具體數據,即歸納綜合水平太低,會造當作 “過擬合”,不大可能有用地推廣到尚未不雅察到的對象。當一個待判定對象同時屬于多個參照集(別離遵照春秋、性別、籍貫、職業等等劃分)時,按照哪一個數據集之上的統計來得出判定(好比這小我有多大可能患某種病)也不是個簡單的問題。
納思怎么辦
我設計的通用人工智能系統 “納思” 在前面幾篇里面介紹過了,這里只會商和歸納直接相關的部門。從一起頭,我就把智能看作某種一般理性原則,而非解決某些具體問題的方式。這樣一來就直接撞上了休謨問題:若是認可將來經驗和曩昔經驗可能是紛歧樣的,那么從曩昔經驗中總結出的紀律(非論是用歸納仍是此外法子)在將來就沒法包管必然準確。在這種環境下,怎么做才算“理性“?舉例說來,即使已知的烏鴉都是黑的,那也不克不及包管未來碰不上白的。這是否申明展望下一次碰著的烏鴉是黑的或是白的同樣 “合理”,因為二者都有可能對?當然,任何正常人都認為在這時猜“黑“ 是顯然準確的,但這是為什么?只是因為“從來如斯”?
傳統的理性模子都是基于經典邏輯或者概率論的,其結論的 “真” 是以其正義的(成立在商定根本上的)真和推理法則的 “保真性” 為前提的。天不變,道亦不變,而一旦 “得道”,其邏輯結論天然也就不成能錯。照此行事,天然就是合乎理性的了。這簡直很圓滿,但一旦天道有變,亦或無法鑒定所得的是否真的是“道”(按休謨的論證,這種鑒定不成能獲得),那就無計可施了。
當然還有另一種顯然的選擇,就是接管休謨的結論:歸納就是一種心理習慣,沒事理可講。人工智能當然也可以這么做,就是用“人腦就是這么干的” 作為所有本家兒要設計的依據。這種做法天然有其價值,但不是我想做的。我們簡直應該領會人腦在心理和心理層面的工作道理,并在人工智能設計中加以借鑒,但我總想多問一句:我們在計較機里面也非得這么干才“對”嗎?
我的選擇是接管休謨的論證,但不止步于他的結論。在實際情況中,按照曩昔的經驗是不成能嚴酷、切確地展望將來,并包管所有結論的準確性的。人腦簡直是在進行這種展望(以歸納為本家兒要形式之一),但這不僅僅是一種習慣,更是一種理性。和傳統的理解分歧的是,在這種環境下理性不包管展望當作功,而是一種順應性行為。簡單說來,“順應性行為”就是按照曩昔的經驗展望將來,盡管這些展望經常會錯。“盡力順應情況”和“包管順應當作功”不是一回事,前者是可以做到的,爾后者紛歧定。
我們可以把一個系統的外部情況粗略分當作三種:若是情況絕對不變且遵循系統可熟悉的紀律,傳統的理性模子和依此設計的“正義化系統”會是最當作功的,因為只要正義和法則搞對了,系統就毫不會犯錯。若是情況可變但相對不變,那么順應性系統及響應的“非正義化系統” 會是最有但愿的,因為這時正義化系統就太僵化了,完全無法應對料想之外的環境,而非正義化系統盡管不克不及包管不犯錯,但起碼有展望準確的可能。若是情況的轉變極其敏捷或無跡可尋,那任誰也是力所不及了。所以,照我看來,智能也好,科學也好,都不是以 “包管當作功” 為其理性尺度的,而是表現了一種“盡人事,聽天命”的立場,是不以當作敗論英雄的。
我上面的結論不僅僅是一個哲學立場,而是有直接的具體后果的。如《證實、證偽、證實、證據:何故為“證”?》中介紹的,納思和其它推理系統的一個底子分歧點,就是此中一個陳述(如 “烏鴉是黑的“)的真值不是描繪其與客不雅事實的合適水平,而是和系統相關經驗的合適水平,是以會跟著經驗而轉變。系統中的推理法則(包羅演繹、歸納等等)也都是在這個意義下 “保真”,就是包管不無中生有,但不包管百步穿楊。若是讓納思見到那只綿羊,它的表示會是那個天文學家和物理學家的綜合:它的結論可能是 “蘇格蘭的綿羊是黑的”, 而其真值對應于現有證據的量(所以見過一只、兩只或一千只時成果是分歧的)。
對于歸納結論不惟一的環境,納思是由當前的注重力規模決議哪個結論會被生當作的,而不是靠一個固定的歸納偏好。具體說來,統一個不雅察成果也可能被歸納綜合為“歐洲的綿羊是黑的” 和 “蘇格蘭的動物是黑的”,取決于當前系統中響應概念的活躍水平。當然,這些結論看起來很荒謬,但那是因為我們心中大量其它信念(尤其是已知反例)的影響。小孩子完全可能那么想,并且不克不及算是想錯了,這和結論的對錯是兩碼事。
至于烏鴉悖論,在納思中是不會呈現的,因為在那邊“烏鴉是黑的”和“不是黑的就不是烏鴉”有分歧的真值和語義。這兩個陳述有不異的反例(“不黑的烏鴉”),但有分歧的正例(別離是“黑烏鴉”和“不黑的非烏鴉”,爾后者包羅紅蘋果)。是以,納思在看到已知紅蘋果時不會影響它對 “烏鴉是黑的” 的相信水平。這兩個陳述在經典邏輯中等價,因為在那邊“真”就是“沒有反例”的意思,而與正例無關,但這個等價原則不克不及推廣到正反例都影響真值的邏輯系統(如納思)之中。
我相信納思對歸納的處置比其他理論更天然、合理,盡管這個方案和今朝本家兒流的基于經典邏輯和概率統計的方案有底子不同。我不期望靠這篇短文說服良多人,有樂趣的讀者可以去讀我的學術文章。我只是想提醒大師注重某些經常被習慣性忽略的問題。
本文的另一個目標就是以歸納為例申明我的一個根基信念:人工智能中的良多焦點問題起首需要一個得當的哲學解,然后是把這個哲學不雅點切確化的數學解,最后是把這個數學模子操作化的程序解。這三者缺一不成。
參考文獻
1. Pei Wang, Formalization of evidence: a comparative study, Journal of Artificial General Intelligence, Vol. 1, Pages 25-53, 2009
2. Brian Skyrms, Choice and Chance: An Introduction to Inductive Logic, 4th edition, Belmont, CA: Wadsworth, Inc. 2000
特 別 提 示
版權聲明:本文由《返樸》原創,接待小我轉發,嚴禁任何形式的媒體未經授權轉載和摘編。
《返樸》,致力好科普。國際聞名物理學家文小剛與生物學家顏寧聯袂擔任總編,與幾十位學者構成的編委會一路,與您配合求索。二次轉載或合作請聯系fanpu2019@outlook.com。
0 篇文章
如果覺得我的文章對您有用,請隨意打賞。你的支持將鼓勵我繼續創作!