首頁 商業分析
專訪數據科學家尹相志 數據分析是商業分析的一大重要環節
2020/6/1 作家:專案經理雜誌
7028
文/吳怡銘,PMP

當鋼鐵人對著AI管家Jarvis天南地北的尬聊,那股虛幻與現實的神對答場景是不是令你印象深刻!好萊塢的電影情節讓全球企業對於AI和大數據趨之若鶩,以為一機在手可以解決所有的商業問題,進而帶來高獲利。然而,美夢真的是這樣嗎?答案是可以,商機的背後得付出相對應的條件與代價。

相信大多數的人都會對AI抱有憧憬,覺得很科學、很玄奇,以為他就跟人類一樣能思考並且對答如流。對此,數據決策公司數據科學家尹相志開門見山的說,「很多對AI的想像都是受到好萊塢電影的影響,得記住一個原則,電影裡能做到的真實世界通通能做到,但是直到現在還沒有任何一台機器可以自行思考。」

「是不是有種美夢被戳破的感覺」尹相志點出,「AI到底是在做些什麼?簡單來說,目前大概99%以上稱之為『監督式學習』,你要餵給AI一個Input,他就會吐一個Output給你。」

數據分析是懂得與人溝通的科學
也就是說,要教導AI,必須不斷地丟進輸入(Input),AI方可回應輸出(Output),其中輸出如果跟答案有落差,就繼續給Input,一來一往,經過幾千次、幾萬次,甚至幾百萬次、幾千萬次,把落差越修越小後,「此時,再給予Input,Output就會離你要的答案越來越貼近。」

「第一,要有明確的Input和Output;第二,Input要有數據;第三則是Output通常是人類的答案。」尹相志認為一個好的AI必須要有這三個要件,「不只要有數據還要有答案,該答案雖然藉由AI傳遞出來,也應是模仿人的行為。以蘋果手機的Siri來說,語音識別就是輸入你的聲音,輸出則是你想要的文字,光是這兩句話的字面意思就是一個學習,『我怎麼知道這個字是什麼意思』、『我怎麼知道這個聲音是什麼意思』,都是得先人為寫出來,必須要有人的答案。現在大家看到都是後端光鮮亮麗的一面,前端的運作幾乎都忽略,而此往往才是最重要的。」

尹相志表示,現在很多數據科學家會有一個通病,所以在區分是初學者還是有經驗的人變得重要。一旦問題出來,會講出一堆決策樹(Decision Tree)、卷積神經網路(CNN)的演算法專有名詞出來,這類鐵定是菜鳥,他的眼界只放在算法上。「數據科學是要用數據解決問題的科學,必須要懂得問題的困難點在哪裡?該處理的地方在哪邊?不是一直拘泥於算法。」

問對問題有利商業分析結果
他舉例常見的電信產業顧客流失分析來說,常見的合約落在24個月,如果將商業分析的問題放在「顧客期滿24個月會不會解約」,準確率通常都很高,因為根本就問錯問題,到底目標是預測誰會走?還是想辦法把那些會走的人留住?

「理解本質的問題,最有效的做法是,為期24個月的合約,我們要在的幾個月預測他會不會走。此際,數據科學家應盡到與業主溝通的責任,經沙盤推演後發現第18個月最適合,也就是合約到期的前半年,原因是足夠做三輪的活動去挽留舊顧客。」尹相志說。

「數據科學家要懂得與業主溝通」他再度重申,「就會發現目標不會是全體顧客,而是未來半年合約要滿24個月的那群人,分析取樣的母體不同,結果截然不同。這就是對商業問題的理解,算錯一步就會步步錯。」

又好比電信催收,可以利用數據分析來釐清顧客沒有在期限內繳費的原因,如果是惡意可很快的直接進入斷話環節,非惡意則可利用停話來等待顧客繳納,這都是大量數據帶來的回應,能有效降低企業耗損的人力和資源。

幫企業「賺錢」及「省錢」
當問及企業應該如何看待數據分析時,尹相志有感而發地表示,現在很多企業不曉得數據科學的用途,僅是為了AI而AI,BI而BI,這只會製造出更大的問題。

「數據科學是用來解決未來問題的科學,絕非製造問題的科學,數據要如何發揮它的作用或是發揮它的功能,甚至是要拿數據來為企業做決策,開宗明義要搞清楚一件事情—哪一些決策過程如果有數據支援,可以為公司帶來很大的獲利,或是減少很大的損失—事實上,數據的效用只有兩件事:第一,如何幫公司賺到更多的錢;第二,如何幫公司節省更多的錢。」他說。

從上述這兩個地方著眼的話,可以找出企業中賺錢或是賠錢的商業環節,或評估若多了哪個分析情報可以解決這些商業環節的問題,「把這些點項先找出來,再從中去規劃,發展企業內部的數據分析平台,而不是先找一堆廠商來比價,先買一堆軟體,但是要做什麼卻一無所知。」

人機協作,善用80/20法則
大家對於AI觀念多數源自好萊塢,這些錯誤的觀念會讓人們有錯誤的期待,如果將錯誤的期待拿來推行,方向會完全走偏。以信用卡中心的客戶服務人員來舉例,如果我們心裡想的是好萊塢的那套,是不是機器客服就可以全數取代人力客服。

問題是,全世界最先進的自然語言—英文,AI也只能做到將近70%至80%,沒有辦法理解並回答很複雜的問題,遑論是更複雜的中文。「即使是逼死廠商也做不出來,所以大家只能做假,這就是世界上有那麼多假AI的原因,很多都是好萊塢迷。」他說。

換句話說,如果對AI有正確的理解,除了知道它不能解決全部的事情外,人機協作才是對企業最有利的正軌,尹相志說,「往最基本的80/20法則思考,80%的顧客打電話來都是重複問哪些20%的問題,就可以把重複且大量的數據撥給AI來執行,AI解決不了的問題則交還人力負責。」

尹相志解析,要懂得人類的神經、人類的大腦是怎麼運作的,特別是把抽象的東西變換成具體,得靠一些經驗以及對問題的理解的程度才行。「千萬別以為AI在科學數據的加持下可以取代人力,無法在短時間內快速、有效的回應顧客,可是會激怒顧客,反倒得不償失。」

避免及防患「過擬合」風險
對於企業來說,莫過於最希望能從數據中找到有利於決策的問題,「我不這麼認為,應該反過來思考清楚正確的問題為何?再基於這個問法去找答案,畢竟數據很龐大,如果沒有想法就去數據裡頭撈一撈、碰碰運氣,很難找到問題的癥結。一定要有明確的目標,再從數據中做確認與驗證。」尹相志認為。

值得一提的是,現在數據科學最怕遇到「過擬合」(Overfitting),屬於數據分析中的風險。以股票交易為例,現在的神經網絡建模能力都很強,AI可以輕而易舉將每個交易日發生的數據背起來,畢竟從股票成立到今日也才十幾萬筆資料,要促使回測得到滿分絕對不難,但要預測明天股票是漲還是跌,不一定可以料事如神,這點要特別小心。

「在AI的時代,任何的落地驗證,除了要小心『假AI』,也要小心Overfitting。必須在真實的場景,用真實的數據,才能夠保障答案是正確的,對企業才有價值。」尹相志強調。

充分溝通,化困難為策略
「現在最大的困難是,分析的人懂算法,但不懂商業思維;更可怕的是,企業做決策的人也不一定懂得商業思維,就變成大家都在瞎忙,做一些不合用的事情。」尹相志看到國內外企業普遍的通病憂心地說。

經常發現業主極欲問AI:「今年該怎麼做才能讓業績提高」,只是很抱歉,AI連「Errr……」的聲音也發不出來,但如果先用人工把問題轉換成明確的輸入與輸出,例如:執行A方案成效會有什麼樣的變化?答案較可能呼之欲出。

尹相志指出,數據分析有三大關卡要突破:第一關,使用的單位不知道該問什麼問題;第二關,分析的人不懂得將使用者的問題轉化成機器的算法;第三關,如何取得高品質的數據。

舉例說,近來在AI領域盛行的機器視覺,很多光學製造業都想要做AOI(瑕疵檢測),卻因為工程浩大,沒人要把清楚的瑕疵數據標示出來,「大家都想要AI,卻沒人要準備數據,產生嚴重的鴻溝。曾經遇到業主直接了當地告訴我,希望把做好的模組移轉,一樣愛莫能助,因為AI沒學過就無法正確判斷,遑論跨公司、跨業態。」他說。

文末,熱愛數據科學的尹相志,深感這個行業就像是福爾摩斯,必須要從一堆數據中抽絲剝繭找出蛛絲馬跡,除了觀察力和敏銳度要高之外,還要善於與人溝通,「這個工作有趣的地方是,會一直遇到新的行業,理解他們新的問題,提出新的解決方案,非常有成就感,非常享受其中。」

商業分析 解決企業問題與痛點

這幾年,隨著ABIC四大科技快速增長,商業分析成為世界趨勢。根據市場預測,到2020年,全球大數據和商業分析的收入將從2016年的1...
商業分析 解決企業問題與痛點
專案經理雜誌
《專案經理》雜誌是華人最有影響力專案管理雜誌,宗旨為擴大專案管理應用傳播。
邀您一同為深耕專案管理努力,您的參與,相信能為您的產品/服務,擴展商機, 無形中,也為專案經理雜誌的永續經營注入契機。
您可能也喜歡這些文章