文/蕭瑟寡人
人工智慧產業,隨著近年科技業的炒作而成了媒體新寵兒。然而,當技術名詞變成了行銷名詞,詞意上難免生變。
就如同「雲端計算(Cloud Computing)」成為噱頭詞時,雲端從原本平台(Platform)和架構(Infrastructure)資源共用與分租的概念,變成包山包海、只要是需要上網的應用程式都被冠上了「雲端」二字。就連單純的伺服器平台商、電子商務平台、內容平台等早在「Web1.0」年代就司空見慣的產品與商業模式,也新瓶裝老酒、被冠上「雲端」二字再度行銷。
如今,人工智慧產業也有相同情況。因此在選擇如何投資和參與人工智慧產業之前,容許我們先抽絲剝繭,深入了解人工智慧產業的各種虛實面向。
人工智慧簡史
現代的人工智慧理論要從二十世紀初期的計算學開始,代表人物包含哥德爾(Kurt Gödel)與圖靈(Alan Turing)。但有一點值得注意的就是當時計算學家所設計出的「智慧」理論,實際上是用於量化系統化工作。
以圖靈設計的圖靈機器(Turing Machine,自動化機器的一種)為例,其理論靈感來自於工業生產線,並且以在捆紙帶上打洞進行自動化計算工作。對於二十世紀初的計算學家而言,「人工智慧」只是一種能夠將計算工作自動化的理論,並沒有跟人類的各種智慧面向作深度的理論連結。在1960年代以前,業界討論的人工智慧只是今日的資訊科學(Computer Science)。
而在1960年代,學術界發生了很重要的變革,那就是認知科學革命(Cognitive Revolution)。簡單而言,認知科學革命認為人與動物的行為背後有更深層的感官、知識、專注力等認知層面,因此不能純粹從行為資料上去形容智慧。這個變革使得資訊科學、心理學、哲學、統計學等學術領域開始合併,產生現代人工智慧的基礎。
1970年代開始,一些學者與業界人士開始利用認知心理學的知識模型與邏輯學來設計專家系統(Expert Systems),這類系統講究資料之間與概念之間的關係,讓機器(電腦)可以進行人類一般的深層語義推理。打個比方,人類知道大象有四隻腳,而若一隻大象跛了腳,那這隻大象必定行動不便。在九零年代以前,人工智慧理論多注重於設計這類擁有深度語義知識的系統。
在學術界,若提到「人工智慧(Artificial Intelligence)」,大家聯想到的就是1970年代主流的「傳統人工智慧」。
到了1990年代,許多人工智慧學者和業界人士發現傳統人工智慧的系統太過於複雜且古板(無法容許誤差),無法用來設計實用的大型商用系統。因此,往後越來越多學者與業界人士開始投入利用統計學模型模擬人類決策的機器學習(Machine Learning)。
接續20多年,由於電腦計算能力大增、電腦硬體價格低廉,彈性且能容許誤差的機器學習方法幾乎全盤取代傳統人工智慧,成為今天的技術主流。
人工智慧今天與未來面向
傳統人工智慧方法講究探討人類的知識、推理以及感官結構, 目的在於創造人類一般的「通用人工智慧(Artificial General Intelligence)」,可以透過知識彙整和推理學習全新的知識、語言,甚至推理方式。
今日人稱「人工智慧」的機器學習,跟傳統人工智慧方法有幾種根本性差異:首先,機器學習方法需要大量的資料;第二,這些資料的採集、篩選及處理都仰賴良好的變數選擇(Variable Selection);第三,機器學習方法的輸入及輸出結果之間的關係是建立於統計關係,而非邏輯與語義關係;第四,機器學習方法結果的意義來自於設計者賦予的意義,而非模型結構本身。
打個比方,現在業界常常炒作的「深度學習(Deep Learning)」,就是很典型的機器學習方法。簡單而言,深度學習的理論基礎很單純,就是「人工神經網路」,用許多可以處理輸入的資訊處理單位(學術上稱神經元Perceptron)來組成一網路,然後再用多層網路來做出理想的統計分布,因此深度學習需要的資料量可能是目前所有機器學習方法最大的;第二,在進行深度學習之間,設計者必須先定義和選擇合適的變數學習;第三,神經元、網路輸出結果的標準在於統計分布符合設計者的期許,並沒有天生的邏輯或與語言上的意義;第四,深度學習的方法本身並非專注於教育、自然語言、機器人、工業4.0等領域,意義是由設計者定義的。
事實而言,最近十年來人工智慧產業的突破都要歸功於機器學習。但是,許多關於人工智慧可能將發展成擁有自由意識終結者的輿論,基本上都不會成真。因為不單單是現今機器學習方法與人類智慧的純理論研究漸行漸遠,關於自由意識、情感、自我等觀念,仍停留在哲學與心理學的純理論階段。
突飛猛進的人工智慧產業別
自然語言處理
長久以來,人類的語言處理對電腦來說是一大難題。資訊工業早期仍使用以標準文法(Regular grammar)、上下文無關文法(Context-free grammar)等計算機理論來處理自然語言,而事實顯示,人類的語言比處理電腦字元複雜許多。
經過數十年的研究演進,自然語言相關技術可粗略分為幾大類:詞法學(Morphology)探討單字的詞性與其他變化、句法分析(Syntactic Parsing)探討文法結構、語義學(Semantics)探討句中的各類隱性意涵,及篇章分析(Discourse Analysis)探討整篇文章的大意以及整體意涵。若是自動化對話系統,還有所謂的對話管理(Dialogue Management)。
透過各類機器學習方法,自然語言的各類領域都有長足的進步。最明顯的例子就是現代主流搜尋引擎(Google、Bing)能夠相當精準地從問句中判斷使用者所需資訊,從維基百科簡介、到世界銀行上的統計資料,都可以在不點選任何搜尋結果的情況下取得。
目前自然語言技術仍以詞法學與句法分析為基礎,並涉及小部分的語義學。在未來相信自然語言處理在語義、篇章分析及情緒分析等領域會有更明顯的進步。
電腦視覺
電腦視覺就是從任何影像資料中找到有意義的抽象知識。近幾年拜雲端計算帶來的巨大運算能力提升,越來越多電腦視覺應用得以利用深度學習去從做更精準的多層次辨識。所謂多層次辨識是從像素中先去找小的特徵(Feature),然後再從小的特徵集合中尋找更大的特徵,用多層次的特徵辨識得到更精準的輸出結果。打個比方,早期的機器學習方法可能會將人的一張臉歸類為一特徵進行辨識,但隨著現今資料量和運算能力提升,利用多層次辨識,透過先從像素中尋找眼睛、鼻子、嘴巴、毛髮等特徵,再從這些特徵組合去辨識圖像中是否有人臉、狗或是其他動物。
工業最佳化
過去各類工業最佳化受限於資料採集,因此從原物料、製造、物流、人事管理、零售等各類變數去進行最佳化時,無法快速因應情況變化進行調整,更難以進行預測防止問題發生。
如今拜工業物聯網所賜,小至單節點之溫度、電壓、濕氣等偵測器,大至單廠房製造量、生產鏈之日產量的掃描驗收,都可以快速取得並進行處理彙整。過去要掌握如此多變數,並彙整每秒、每分、每時、每日、每月的資料所需要的人力太大,成本上難以達成。
今天由於資料採集與彙整成本低廉,工業用人工智慧除了過去的線性最佳化模型以外,更可以利用機器學習進行時間性的變數預測,讓許多工業可以在各類大小變數變化時進行預測性的生產鏈調整(比如天然氣能源公司可以透過天氣預測和天然氣產量預測未來一個禮拜的精煉、物流和儲存計畫)。
過去時間序列(Time Series)相關機器學習方法所需的資料量與計算時間過大,今天這些障礙都已慢慢解決。因此,工業用相關人工智慧可望在未來幾年內如虎添翼。
人工智慧產業應預防的泡沫
至此我們也能了解當「人工智慧」成了噱頭詞以後,有多少簡單、過時的電子化產品,被假冒成人工智慧產品來販賣。
第一,已過熱的就是許多以「能感受人類情感」的伴隨機器人。許多此類產品包括看護機器人Pepper、Nao機器人及互動玩具Cozmo,都利用「了解情感」作為行銷台詞,但事實上,這些機器人所謂的「情感」只不過是先設定好的一些程式反應。反觀人類與動物的情感,是建立於某種自我與客觀的互動上。真正的情感不但能夠喚起記憶、改變知識存取方式,甚至能夠改變一人對於自我和客觀事物的認知。不管從哲學、科學還是工程的角度看來,這些產品完全沒有「情感」的理論基礎,其制式化的互動模式連人工智慧都稱不上。
第二,有過熱傾向的就是現在被稱作「聊天機器人(Chat bot)」的潮流。當像x.ai這類的聊天機器人新創公司成功籌資後,有許多新創團隊也跟風一頭栽了進去,連Facebook、Slack等平台都開放聊天機器人整合。事實上,絕大多數的聊天機器人完全沒有稱得上人工智慧的技術基礎。若從自然語言技術的對話管理系統來看,目前多數的聊天機器人(包括亞馬遜Alexa以及Google在內),其實只是很單純的關鍵字比對並執行對應程序,並沒有進行任何有深度的對話管理。
最後一過熱的人工智慧產業別恐怕要屬智慧家電與智慧城市。當然,智慧家電與智慧城市本身有非常重要的人工智慧應用,比如可以利用廣大的家用和公共設備能耗、壽命資料來進行機器學習,幫助家庭和城市汰換舊設備並調校新設備組合。但是,智慧家電與智慧城市發展至今,已經有太多過氣的網路監視器、網路麥克風,甚至電子票券系統商都跳出來講自己在研發智慧家電和智慧城市應用。所謂智慧家電與智慧城市的原意,讓基本的硬體與網路連結喧賓奪主,未來創業家與投資人應適度調整角度,將資本與資源重新導入家用與公共建設相關的機器學習方法應用。
其實產品並不一定要有人工智慧才實用,但是當太多沒有人工智慧成分的產品假冒人工智慧籌資、曝光,最後可能造成原本應該投資人工智慧技術的資本和資源被導入過氣產業,最後導致產業泡沫化,讓往後的人工智慧公司籌資、雇員徒增煩擾。因此在探討「人工智慧新創」的產品與技術之同時,不得不謹慎,一定要做好基本的學術和產業研究後再進入。