跳到主要內容區

《TEEN講座》演講紀錄 : 以人為本的人工智慧

TEEN講座-以人為本的人工智慧
2020/12/23

劉先鳳副會長:

讓我們歡迎永遠的學妹 - 陳佩君,以前大學經濟系輔系180畢業學分,學妹修了200學分畢業,賺了不少錢,修了四學位,物理電機外語數學畢業。

講者:

很高興今天回到家的感覺,今天比較像是座談會,跟大家聊聊,講得比較科普,順便分享我career的歷程,想問問的就舉手,都是一家人,我是修208個學分,主修物理,電機輔系,數學外語學程,CMUCV,第一份工作在加州Nvidia architect,它們的第一個video processor是我做的,那時候AI還沒起飛,我很懷念做研究,從產品公司跑到intel去做研究,OpenCV是我帶的一個團隊,如果大家有在做CV可能是我以前團員開發的,矽谷的人有創業的夢,所以創業,然後就倒了,然後我就被錄選為Y Combinator的裡面的一個公司,但partner沒有廣告的專長,接著加入另一個新創,在矽谷待了15年,回台灣之後,花蓮陪媽媽買菜,有朋友邀請在英業達想做AI,英業達是科技製造業,這是一個很新的嘗試,但也不想搬離花蓮,所以坐飛機上班,兩年後因為covid飛機不飛了,所以搬到台北,大家如果對美國台灣工作、research/product、開公司,我都可以回答。

好,回到母校,今天早上收到試卷,有15題,我暫時不會回答,先聽過talk再回答。

今天的標題是,人本的AI,分成幾個部分,第一個是AI改變了甚麼?AI有甚麼突破性的創新?第二個部分,人類可能會有一些risk,第三部分回到本題,想要解決risk,要怎麼讓AI以人為本,才不會偏離為人類服務的這件事情,最後會conclusion 也介紹一些我現在在的AI研究中心。

AI改變了甚麼?第一件事就是AI automation,主要有取代人類,第二個是優化,最後就是能夠自我學習,這三個是AI帶來的突破性的創新。

先講automation,舉例已經上產線的東西,英業達做伺服器、雲端、筆電、穿戴裝置、、智慧音箱等,以筆電為例,筆電組裝好後會有表面瑕疵,目前都是先用人看組裝完會拿起來看12秒,作業員可能3個月後就要換眼鏡,可能會有漏抓、inconsistent的問題,良率就會比較低,若自動化後,小於10秒就能看完,也可以有非常如實的報告,這是我們上產線的機器,進輸送帶後分成兩層,第一層是照筆電的上面,第二層是照四個側面,照完後就進AI來判斷有沒有刮痕、撞擊。稍微講一點點演算法,分成supervised有資料有標記,舉例來說,貓跟狗的照片,標記貓跟狗,有classifier;以機器來說,告訴有無瑕疵,但是筆電常常在更新新的機型,不可能知道所有刮痕或筆電的種類,你們有看到地毯中的戒指在哪嗎?故事告訴我們地毯就像筆電表面,戒指就像瑕疵,可能完全不一樣,但目的只有找出戒指,以剛剛的貓狗來說,貓跟狗要知道所有貓狗長相,你才知道狗長怎樣;但當你瑕疵百百種的話,因為製造良率很高的話所以瑕疵資料很少,是沒辦法蒐集所有資料,因此又用人類的辦法,人類只要覺得不是正常就是異常,是autoencoderbased on normal image 學出來常模,reconstruct常模,當testing image 和常模差太多就是異常。

1

很多事情都已經可以自動化,但最終目的是優化,舉一個可怕的例子,我們在做伺服器,伺服器散熱是很大的問題,微軟把伺服器沉到海裡去想要散熱,其實水冷、電風扇都可以讓伺服器冷一點,但也不可能四面都裝電風扇或知道甚麼時候開關電風扇,所以通常就是開多一點,就是過冷問題,會花很 power。這是一個跟清大合作的案子,預估PCB的熱源分布,根據經驗法則建出模型,在不用sensor的狀況下就可以布置電風扇,以google某個資料中心來說,如果把這個資料中心的servers都佈建這個model,可以省162億多度電,這是什麼意思呢?台灣一年花多少電?公布答案,兩千五百億多,一個資料中心可以省台灣一年十五分之一的用電量,所以AI其實默默地做很多不是很直覺可以想到的事,不一定是face recognition,這個比較有趣一點。再來一個,想到AI當然會想到,Alpha GoOpen AI,越來越厲害,比人類厲害,今年上的paper,是拿motion capturedata學小狗應該要怎麼走,不可能叫小狗做跳火圈的動作,所以利用reinforce learning,就是Alpha Go的方法,周伯通,現在沒人再看金庸了吧,我們又加上GAN,可以長出非真實資料,右邊長出像狗的動作,左邊去攻擊他說這是狗或不是狗的動作,用一樣的技術讓小狗不只可以自我學習走起來像真的狗, 該快的時候不會是小碎步,上禮拜台北馬如果用小碎步不太efficientreinforce learning還有一個優點,就是可以克服現實當中所有突發狀況,所以GAN加上Reinforcement Learning就是自我學習,那自我學習之後貌似就甚麼都不用教甚至可以不用label data,現在來講more challenging的問題,Hawking, Musk都講過,人類到後來可能就不需要了,例如AI醫療,判斷有沒有癌細胞,發現人才是毒瘤,就毀滅,所以會有一些很可怕的應用。

1

實際一點,自駕車,時不時就會有UberTesla accident,最後都會以似是而非的原因解釋為何會fail,例如Uber沒看過腳踏車會有黑色塑膠袋,Tesla因為太亮所以看不到是車,這些因為不曉得腳踏車和塑膠袋一起可能有人在裡面,或是有同學問到biased data造成garbage in garbage out產生一些問題。例如:有一個研究是Amazon如何篩選履歷表,HR就會說名校畢業、白人20幾歲資訊畢業就比較qualified,結果就會是biasedbiased input biased outcome,性別年齡要送到engine做判斷嗎,歧視問題,所以Amazon這個系統上線一個禮拜就被shut down。或是,常常看paper就會看到AI 好棒,肺癌檢測98%正確率等等,但不是每個matrix都是正確的,舉例來說3000人測試乳癌其中4人有患病,detection engine detect3個但是漏掉一個,accuracy讚,很棒的engineprecision就是我抓出來的人確實有乳癌是0.8 percentprecision很低是不是會有不必要的處置。再來,trust的問題,AI除了可以detect東西也可以generate東西,左邊是去溫泉照的東西,右邊看起來很像的,永遠不會停止的瀑布,他其實都是學出來的不是真的,就像這個女生拉小提琴永遠都不會停,也是同樣是生成的video,當然如果聽聲音就會漏餡。所以呢,我剛剛提到林林總總的問題,trust/取代人類/privacy的問題等等,但問題的源頭哪?其實問題的源頭不是新的,每當有新科技出來例如當時原子彈發明的時候就會有新的debate,英國有名的小說家兼科學家C.P. Snow說,人類的問題在於人文跟科技分開了,古希臘哲學家又是科學家、畫家甚至哲學家,例如米開朗基羅、達文西,都會認為他們是天才,但他說this is the way you should be,解答可能在Isaac Asimov。大家家裡有沒有Roomba,公司是iRobotI, Robot其實是Isaac Asimov的科幻小說,他寫小說的foundation,如果robot要幫助人類有三個原則,1. 無論如何robot不能傷害人2. 不傷害人類的前提下要聽人類的話3. 不傷害人類及聽話的準則下,保護自己。其實這些都可以被推翻,只要可以被寫出來的rule就可以被推翻,例如不要去推人,如果有天你站在書架上有花瓶要掉下來,他只能推你才能救你,這樣要怎麼辦?

又回到最根本的問題就是現在AI在哪,這是一個人類perceptionpyramid,最下面是raw data - 路燈,再來是information - 路燈在路上,再來是knowledge – 開車要開右邊,最後才是wisdom – 如果有邊有阿嬤就要繞過他。另一個例子,AmazonCEO,小時候數學就很好,阿嬤阿公在玉米田趴趴走,以前沒有公衛的概念,所以阿嬤想吸菸,他就觀察每天看阿嬤吸幾根,也看到報導說吸一根菸會少12分鐘壽命,如果用AI來說就是motion detection發現阿嬤舉起菸開始抽,再來就是context吸一根菸會少12分鐘壽命,算一算發現總共會少了9年壽命,在車子上叫阿嬤可以不要再吸菸,以為阿嬤會拍拍手覺得他很會算,但阿公就把車停下來把他帶出去,阿嬤在流眼淚。聰明是天賦善良是選擇,這個故事就是說AI 還是在非常下面的,看到人不要去撞他,有一點點context(知道他在路的中間),但沒有story,無法連接古今中外的文化,要怎麼樣才能有真正判斷的智慧,這就是以人為本的中心。

總結一下,以人為本的AI就是AwarenessHuman valueAwareness就是我們已經慢慢習慣要學科學,舉個例子農夫需要知道化學式才能施肥嗎?不用,他只要知道怎麼用。如同AI不用知道NN就可以直接使用,例如美圖,不需要知道原理。再來,Human value,剛剛看的pyramid,就是說最上層wisdom,舉個例子computer vision,有做刮痕檢測增加良率,同樣道理也可以用在醫學Brain MRI,幫助醫生檢測腦瘤流程,從幾小時變幾秒鐘;另一個例子,工廠、全聯不能訂太多鮮奶不然會壞掉,也不能太少就賺不到錢,工廠太多訂CPU會浪費,太少會無法出貨,這個叫做demand forecast,這技術已經用在我們工廠,同樣技術也用在非洲象牙海岸避孕藥的預測,配送避孕藥,有家庭計畫的話婦女小孩可以受到教育,有援外單位辦了比賽,每個醫院衛生所會需要多少避孕藥,無心插柳,上個月收到結果,我們是80幾個model的第一名,這是AI for Good,一刀兩刃要用在甚麼地方完全就是wisdom,你想要用在幫助industry,幫助國家人的健康,都是可以以你的心去調整。所以,兩件事情awareness,要知道tool做怎麼用的,是用在時間序列不是影像呢;第二個,value,這個東西要用在哪,以佛家來說,佛家來說最高就是智慧,科技始終來自人性,以後要不要做基因轉植?那偵測坦克車都不要做?應該是做技術的時候是neutral的,用的時候要value,這才是你的wisdom

1  2

AI有很多的應用,AIfoundation分軟體、硬體,硬體就是ai chip ai computation,軟體就是演算法。應用有智慧製造、瑕疵檢測、智慧醫療、科技和醫療,robotics、其中smart health是幫醫院開發的app,傷口檢測,如果受傷去醫院的話可能會感染,判斷是否惡化或褥瘡,另外也有做心血管疾病穿戴裝置,連續性血壓,ECGPPG電子訊號去計算血壓是多少,跟醫院合作,只要30ECG就能夠預測半年一兩甚至十年心臟衰竭的機率,準確率將近90;另外,一開始robotcomputer graphics,現在要port到真實的機器狗,這是類似Boston Dynamics的機器人,他的機器狗要跟一台Tesla一樣貴,加上自駕車的辨別能力,讓他有perceptual AI。支撐起AI的是演算法和硬體,高速電腦可以train model,另一個是inference,現在在開發這個AI加速器,AI是非常廣的researchAI中心三年前就開始布局很多東西,台灣AIIP申請最多的公司。

同學演講前提問:

  1. Q:請問往這個領域走需要修什麼先備的課嗎

A:往這個領域走,要修208學分開玩笑^^,這個其實有點真,我們研究員有一半是基礎科學的人,物理、統計、數學,他們進來前完全不懂AI,但看那些equation就馬上可以懂;另一個就是domain knowledge,要對那個領域很有感覺,才能把應用題寫出來,小明去雜貨店買水果,買三顆橘子兩顆蘋果,請問他買了幾個水果,他要先知道橘子蘋果都是水果才能回答。domain加上sciencesolid數學,languageacquire knowledge的方式,學問無貴賤,不論是打電動還是陪家人,只要是你有passion的東西就好好去了解去做。

  1. Q:想了解在AI模型出來的過程,可能像設標籤,或選擇相關演算法,要如何跟人產生連結,以及未來,會有怎樣的跨領域是有機會做到的。以人為本的AI,現在實際的層面,或對人實際影響的報告或實證數據

A:Domain有關

  1. Q: 3.過去,如果上Google Scholar Geoffrey Hinton, Yan Lecun, Yoshua Bengio的論文引用次數,可以看到一個很漂亮的指數型成長曲線。今年的論文引用次數雖然比去年多,但感覺已經有趨緩的感覺了,請問這是因為疫情的關係?還是AI現在在研究上遇到一些瓶頸?

A:紅不紅是上上下下的,小時候沒人要念AI,尤其是NNcomputation太多,結果很爛,不要管紅不紅,做你想做的事,抓住基本的東西以後再去變,可能暫時很無聊,例如以前CVPR很少人現在超多人。

  1. Q:電機可以跨AI?

A:AI大家都可以做。

  1. Q: 現在發展AI的過程是否遇到什麼困難?
    困難就是以實際的操作來說你要跟domain來結合,沒有connection,世界上沒有百分之百的準確率,false negative0,要去connect with your domain expert

A:應該很難,尤其是wisdom

  1. Q: AI有可能完全變成以人類的方式思考嗎?

A: 應該很難,尤其是wisdom

自學AI,一是科學基礎功,再來就是tool,例如TensorFlow,很多open source,比較危險的是你不知道為何要用這個,要先domain knowledge,再設計演算法

  1. Q:自學AI課程從何入手

A: 自學AI,一是科學基礎功,再來就是tool,例如TensorFlow,很多open source,比較危險的是你不知道為何要用這個,要先Domain knowledge,再設計演算法

  1. Q: 現在會用Scikit-LearnTensorFlow的人到處都是,是不是代表AI的就業市場已經飽和了?我如果有志成為AI工程師,要如何在這些人中殺出重圍?

A: 要知道data 特性,要有domain knowledge

9.10.11.12前面提過,不再贅述。

  1. Q: AI 進展的速度大略預測極可能遭遇到技術困難?(例如:何時可能可以看到等級5的自駕車,除了倫理問題外,想問在技術上(例如辨識上可能遭遇什麼問題)、真的有辦法藉由AI辨識出族群的不同嗎?(例如:台灣人、中國人、維吾爾人))

A:困難在判斷,因地制宜。舉個例子,在加州美國人很兇,只要左轉太慢就狂按喇八,很黑很白很清楚的,再來記得阿富汗女孩嗎,前幾年,看到報章雜誌訪問長長大的阿富汗女孩,從神學寺被救出來,現在已經當小孩的媽媽,問她覺得救出來這件事對她人生有甚麼改變?他覺得更糟,以前生活還有規矩,雖然規矩不完美,現在被拉出框架,找不到工作更糟。今天主題是Human Centered AI,我不會講AI Ethics,在台灣,有人擋在紅線,我以前很生氣,但現在發現是有文化因素的,美國的商店前面會有loading area可以進貨,所以要因地制宜,台灣一般地方沒有loading area,只好暫停紅線,要有flexibility

  1. Q:在這個高科技進步神速的時代,AI可能會取代人的工作,我們應該俱備什麼特質或能力來面對這個挑戰??

A:要結合domain

  1. Q:請問您認為有什麼產業是無法使用AI,必需要人類監督或發揮的。

A:監督會有上對下的關係,exception有時候會有災難性的結果

我應該把題目答完了,工作、技術細節,其他會後再談還有問題嗎?

同學現場提問1

AI model為什麼可以做出這樣的預測,還是只是歸納?

講者回答:

ECG data module,歸納或是預測,醫學AI不一樣的地方是要有可解釋性,為什麼血壓高可能因為BMI比較高或抽菸,AI不追求高accuracy,會利用table data(最高心率)等indicator,波型,等兩個feature,算出結果,然後mark重點區域,波形也做研究,這是可解釋性

同學現場提問2

Supervisedlearning會吃到data bias,現在比較大的趨勢是?

講者回答:

如果有讀過這個領域,如果資料混到不正常的東西就會學壞,meta learning,如何濾掉髒的資料,現在大部分AI都是data based,以後會是rule based,會混在一起。

同學現場提問3

創業的必要條件?

講者回答:

Naïve(笑),講一些比較personal的,我自己公司25000鎂瞬間就燒完了。事情都是opportunity costpassion,我的value是好玩passion.

 

1  2

瀏覽數: