機器學習 標準答案談翻轉教育
本篇從 機器學習 切入 教育體制,看看人類在訓練機器的過程,進而反思我們的教育。
以前死記硬背、一次到位的學習,設想著未來遇到也可以用過往的經驗解決。孩子最常問父母的就是「可以嗎?」「不可以嗎?」若總是以二分法來看世界,就很難找到第三條路:創意。
面對變化快速、未知領域及不確定的未來,現在各國狂推''翻轉教育'',正在慢慢挑戰世人的容忍度,經驗不再是王道,孩子的創意也不再被抹煞。只會背誦正確答案的孩子,到了沒有正確答案的世界會感到混亂。擺脫二分法的思維,當下次孩子問「可不可以」時,不妨回答「雖然可以,但如果...就不行」或「如果你答應...的話就可以」,提出選擇讓孩子自己做判斷。
很有幸的是我活在一個標準化與自我發展的過渡期。這些年老師倡導引導代替給予標準答案,再教著大人們的法律及社會的規定,帶領學生去思考以及學舉一反三的能力,如此下來進20年的教育將不再是培育一批批的機器人或魁儡,而是滿腹思想有想法的人。
同心圓:最大的是AI人工智慧>機器學習>深度學習
一、人工智慧1950-1970,70年前
1950年代電腦發明的時候人類就寄望、能出現比人類運算能力更強、更聰明的機器出現,稱為人工智慧。在 1950 年代以數理邏輯的為主要研究方向。
弱人工智慧 alphago 電腦西洋棋、類似語音腔調作相對動作、機器看起來像人
二、機器學習,1980-2006
填鴨式教育 將大量資料送進電腦 根據答案去學習 看準確度
不經過刻意導引,讓機器具備自我學習的能力
持續接觸不斷統計預測 找到變動模式,讓電腦有自我進化的能力
簡單方便的管理方式,消磨了舉一反三 主動偵測的技能
給數據(資料) 跟標籤 (答案) 讓機器自己學習分辨
訓練過程分為監督式學習和非監督式學習
1.監督式學習
所有的演算法、輸入、輸出以及場景都是人類提供標準答案
1000張狗貓(標籤)的照片(資料)各式動作 全部叫貓 讓機器心領神會,之後給你一張問你是狗還貓看輪廓 看臉 尾巴
透過過往資料 培養看法、認知(模型),找出資料間的關聯性,對未來做出判斷
一樣的資料 給你我他(不同的演算法) 判斷訓練出來會不同
將問題分成兩類:分類問題、迴歸問題
1.分類:二元/多元
二分類,是否/對錯/開關,垃圾郵件
多元分類,哪一個
2.回歸:二手車估價 飲料銷售量
預測性分析:過往數據研判 預測量多少 未來漲價跌價
營業額預測、房價預、測下周天氣 下周日賣多少產品
而當我們的資料越龐大時,我們所耗費在「給標準答案」的心力、時間就會越多、越麻煩。
- 現在要面對的教育議題
透過交流 不是你講我聽,而是傾聽你講出什麼答案
2.非監督
從「教會機器去做什麼」發展到讓機器「自己學會去做什麼」。
只有資料不知道答案 或是明知道但不給答案,讓電腦自己找規則、找相似資料該如何分類,對資訊沒有對錯、正確不正確的判別,能發現一些用其他方法無法見到的模式和信息,避免了某些盲點以及先入為主之觀念所造成的問題。
分群(集群)是一種演算法,用到的例子像是:
哪些觀眾喜歡同一類型的電影 、哪個型號的手機有類似故障 、哪些消費者 對水果有相似喜好,並為用戶推薦合適的
3.半監督式學習(不是真的一半)
利用少量標籤資料 做分割線剩下給機器學習,可大幅改善正確度,降低標籤成本
例如google相簿 標示照片姓名
4.增強學習
邊做邊學 根據環境結果給的回饋,藉由每次結果調整改變作法、修正策略
例如投籃落空、「你最有興趣的商品好友」、網站的A/B Test
三、深度學習2006-
模仿人類思維而創建的人工神經網絡,啟發式教育 自行分類出邏輯框架
從眾多資料發現 可能跟一般認知不同,通過獎勵函數來幫助系統改進模型、改善表現,誤差要越小越好
例如自動檢測癌細胞、照片通過自動標記您的朋友、研判誰是可疑份子、模擬人類開車
結語
每個演算法沒有哪個比較好,根據不同的場景需要的不同,通常需要嘗試之後才知道效果。
學習機器人的思考方式,跳脫認知框架,不是大家都這樣做,就覺得這一定是最佳方法。