youtube.com/watch?si=HqhBa6-0eaLehKds&fbclid=IwY2xjawOiAT5leHRuA2FlbQIxMABicmlkETFvSHQ5Uk1xWVpIQ1o1VTVYc3J0YwZhcHBfaWQQMjIyMDM5MTc4ODIwMDg5MgABHr4FUU5yjY1GsYIOPOcWrD7siwiIjOTUVIykvEqdtDGgAksi9SSga5I_1Fr7_aem_i-oNBvS-HiM_J8CPl3nS2Q&v=d95J8yzvjbQ&feature=youtu.be
【17歲拒絕百萬英鎊合約,48歲獲諾貝爾獎】
——從紀錄片《The Thinking Game》,看 DeepMind 創辦人 Demis Hassabis 如何破解上帝的密碼
這幾天終於看完了 Google DeepMind 創辦人 Demis Hassabis 的紀錄片《The Thinking Game》。這部片記錄了他如何從一個西洋棋神童,變成 AlphaGo 之父,最後用 AI 解決生物學 50 年難題的過程。
我印象最深刻的是 Demis 在多段自白的片段中,所提到的個人成長還有他是怎麼思考的部分。
正片一個多小時,我筆記寫了快 20 頁 A4 XD
以下是我整理的心得筆記,分享給大家。
(紀錄片連結我放在留言處,推薦大家看看!)
▋DeepMind 是什麼?一家曾被懷疑是「詐騙集團」的公司
大家對 DeepMind 最熟的,肯定是 2017 年 AlphaGo 對決中國棋王柯潔,那一戰被視為 AI 的「史普尼克時刻(Sputnik moment)」,徹底開啟了全球 AI 軍備競賽。
這家公司在 2014 年以 4 億英鎊被 Google 收購。到了 2024 年,Demis Hassabis 與團隊夥伴 John Jumper 更因為開發 AlphaFold,共同榮獲諾貝爾化學獎。
但你可能不知道,這家公司成立初期極度神秘,甚至被懷疑是詐騙集團。
他們沒有官網、辦公室地點保密。早期面試員工時,甚至有應徵者怕被綁架,或者以為這是一場詐騙,面試前還得先傳訊息跟老婆報備行蹤。
之所以這麼神秘,是因為 Demis 定義的使命太瘋狂:
⇨ 破解智慧:打造世界上第一部通用學習機器。
⇨ 用它來解決萬物難題:例如癌症、阿茲海默症、氣候變遷。
▋天才的覺醒之路
Demis 的成長軌跡,完美詮釋了什麼叫「天賦的正確使用方式」。
他從小就對大腦充滿好奇,他在受訪時說:「我從小就在想:我的大腦是怎麼做到的?它到底在做什麼?所以我總是在思考『思考』這件事。」
他 4 歲時,第一次展現西洋棋天賦,6 歲成為倫敦 8 歲以下棋手冠軍。
但在 12 歲那年,他在列支敦斯登的一場大賽中,與丹麥前冠軍鏖戰 10 小時。他在最後關頭因為太疲累,誤以為自己輸了而投降,卻被對手嘲笑「其實是和局」。
那一刻他感到一陣噁心,不是因為輸棋,而是他突然意識到:「我們這是在浪費心智嗎? 如果把現場這 300 個頂尖大腦連結起來去解決癌症,世界會變成怎樣?」
這成為他日後離開職業棋壇,轉向科學的種子。
Demis 8 歲時,用他下棋贏來的獎金買了第一台電腦,開始自學寫程式。
16 歲時,他加入傳奇遊戲公司牛蛙(Bullfrog)實習。當時還因為年紀太小不符合勞動法規,公司無法正式聘僱他,只能用「牛皮紙袋裝現金」付他薪水。
(PS: 牛蛙製作公司是當時歐洲公認最頂尖的遊戲開發公司之一。)
Demis 當時已經錄取劍橋大學,但學校說他太年輕,必須至少滿 17 歲才能入學。因此他當時就決定要在牛蛙先工作一年。
在牛蛙時,他開發了一款經典遊戲《Theme Park》。這是一款玩家可以自己蓋一座主題樂園的單機遊戲,在這個虛擬世界裡,玩家可以看到自己做的決定的後果。
他設計了具備反應能力的 NPC:如果你把薯條攤放在雲霄飛車旁,剛吃飽的遊客玩完就會嘔吐,其他人看到嘔吐物也會跟著產生連鎖反應一起吐。你必須趕快派清潔工去掃,否則場面會失控。
Demis 說,他當時在做的事情是:試著模仿有趣的人類行為,讓模擬世界能對玩家的決策做出有趣的回應。
這也是他們第一次見識到 AI 如何改變遊戲的互動體驗。
老闆 Peter Molyneux 說:Demis 做的那些細微的模仿動作是從來沒有人做過的。
這款遊戲最後獲得了難以想像的成功,銷量排名當時全球前十。
當時 Peter 開價 100 萬英鎊(在 90 年代是天文數字,換算當時台幣大概是 4000 萬左右)要他放棄讀大學留下來,但他拒絕了。因為他的目標很明確:他要去劍橋,去了解大腦與電腦如何連結。
▋對 Deep Blue 的失望:為什麼 AI 需要「通用性」?
在劍橋大學唸書時,Demis 遇到了一生的夥伴(後來 AlphaGo 的首席研究員)David Silver,有趣的是,他們小時候其實就在西洋棋比賽中遇過。
1997 年,IBM 的 Deep Blue 擊敗了棋王 Kasparov。全世界都在歡呼,但 Demis 卻表示他其實不怎麼喜歡 Deep Blue。
他認為 Kasparov 雖然輸了但仍展現了人類全方位的智慧,而 Deep Blue 它卻只會下棋。
這奠定了 DeepMind 強調智慧必須具備「通用性」與「學習能力」的想法。
▋核心策略:遊戲是 AI 的「訓練場」,不是終點
很多人好奇為什麼 DeepMind 總是在玩遊戲(Atari、圍棋、星海爭霸)?
Demis 的核心邏輯是:「遊戲是演算法的實驗場,最終目標是要解決真實世界的挑戰。」
⇨ 像孩子一樣學習:
DeepMind 的做法不只是「教」電腦玩遊戲,而是讓它「學」會玩。團隊甚至模擬了一個適合兒童的環境,讓 Agent 在裡面「玩耍」與生存。
這就像小孩子透過撕東西、丟食物,觀察父母的反應來學習一樣;AI 也是透過「嘗試」與「回饋」來成長。
你做得好,就得到正面獎勵 (Reward),這就是所謂的強化學習。
團隊成員 Raia Hadsell 形容:「當我們學會行走時,我們不會從地圖開始,而是直接在公園裡探險,沒有父母在身邊。」
DeepMind 的目標就是建立這種 Agent:把它們丟進環境裡,它們一無所知,卻能盡情測試,最終自己想出解決問題的方法。這才足以應付現實世界中複雜的圖像、同時操控數千個物體、或是處理遺漏資訊的挑戰。
⇨ 經典案例:打磚塊與挖隧道
在訓練 AI 玩《打磚塊》時,團隊只給它看螢幕畫面(Raw Pixels),並給它唯一的指令:「將分數最大化」。
- 100 場後:它還很笨拙,經常接不到球。
- 300 場後:它已經能像人類高手一樣精準接球。
- 500 場後:它竟然發現了人類沒教過的最佳策略——「挖隧道」。
它會先把邊角的磚塊打穿,讓球在牆壁後方瘋狂反彈得分。這證明了 AI 不是在死記硬背,而是真的理解了環境規則。
⇨ 擺脫人類經驗的束縛:
從 AlphaGo 到 AlphaZero,是一個巨大的飛躍。
AlphaGo 是看人類棋譜訓練的,但 AlphaZero 完全「沒有給予人類知識」,而是由系統從零開始自我對弈,AI 成為自己的老師。
結果證明,人類千年的定式有時反而是種偏見。AlphaZero 可以在一天之內就成為史上最強的西洋棋選手。
▋終極應用:AlphaFold 與生物學的聖杯
DeepMind 最大的成就,不是贏了柯潔,而是 AlphaFold。
生物學界有一個困擾 50 年的難題:「蛋白質摺疊」。蛋白質是生命的機器,如果能預測其結構,就能加速新藥開發、分解塑膠。
蛋白質結構預測競賽就像是這個領域的「奧運會」。
在這個領域,失敗是常態。諾貝爾獎得主 Paul Nurse 曾形容自己像是「業餘精神科醫師」,因為在生物學的實驗室裡,80-90% 的時間都在失敗,他得負責開導崩潰的同事。
為了解決這個難題,Demis 指派了 John Jumper 帶領一隻「突擊隊」,將這個科學問題轉化為「遊戲」,讓 AI 去預測結構。
歷經 4 年,AlphaFold 最後公開了 2 億個蛋白質結構。
這就是 Demis 說的:「解決疾病可能是我們能帶來最重大的影響。」
▋AI 的風險與科技的道德倫理
當然,影片中也談到了科技倫理與使用 AI 的風險。
⇨ 警惕「曼哈頓計畫」時刻:
在被 Google 收購時,Demis 就堅持寫入協議:技術不能用於軍事與監視。
當外界將 DeepMind 的崛起比喻為當代的「曼哈頓計畫」時,Demis 卻將其視為警世故事。他認為奧本海默當年太沈浸於技術突破的興奮,卻太晚思考道德問題。
⇨ 不要 "Move fast and break things":
矽谷的座右銘是「快速行動,打破常規」,但 Demis 認為這不適用於 AGI。他說:「你無法承受破壞東西之後還要修復它們的代價。」
雖然 Demis 向外界解釋了他對 AI 風險的重視,但 AI 強大的能力與未知,還是給世人留下許多值得繼續探討的議題。
我對加州大學柏克萊分校電腦科學教授 Stuart Russell 說的這句話,尤為印象深刻:「你如何永遠保持權力來掌控比你更強大的東西?」
史蒂芬·霍金更是示警:「我們應該在一開始就把事情做好,因為這可能是我們唯一的機會。」
▋寫在最後
其實這部影片,反覆看了至少有三遍,一方面是為了做筆記,一方面我也試圖在從不同角度理解這個類自傳或是商業電影。
我自己的幾個 Takeaway 是:
1. 其實訓練 AI 的方式,跟培養一個全才的人類一樣。給環境、給試錯空間、在過程中給回饋、讓人在試錯過程中累積經驗並且從中學習。
2. 人類需要多元的思維模型。DeepMind 聯合創辦人 Shane Legg 認為人類智慧的關鍵是「通識」與「學習」。
這正呼應了影片中 Demis 提到他認為劍橋很棒的原因——在那裡他可以和不同學習領域的人混在一起,有科學家、哲學家、藝術家、生物學家等,每個人每天會談論各式各樣的議題。這種跨領域的激盪,驗證了「通識」與「學習」正是打造通用 AI 的關鍵。
3. 觀察人性與人類行為,永遠是商業洞察的最佳方式:Demis 在 17 歲製作《Theme Park》時證明了這一點。
4. 關於思考:我對 Demis 所說的 「It’s just a good thinking game」 很好奇。像是他認為什麼是「好的遊戲」,什麼是「思考」以及「It」是指什麼?
以下是我跟 Gemini 討論後的結論:
⇨ 遊戲的本質是「可解性」:
這是一個極具顛覆性的世界觀。在常人眼裡,癌症是詛咒、氣候變遷是災難、蛋白質摺疊是神的密碼。但在 Demis 眼裡,只要這個宇宙有物理法則,它就是一場有規則的「遊戲」。
這意味著這世界上沒有「無解」的難題,只有「還沒找到最優解」的賽局。他把對自然的敬畏,轉化為對規則的解析。既然是遊戲,就一定有通關的方法。
⇨ 好的遊戲的本質是「現實影響力」:
這解釋了為什麼他在 12 歲時,會覺得下西洋棋是在「浪費心智」。因為西洋棋雖然好玩,但贏了只是一個虛擬的分數,無法改變世界。
對 Demis 而言,一個「好」的遊戲,必須具備「現實意義的可轉化性」。這場遊戲的通關獎勵,不該只是獎盃,而是全人類的福祉(如治癒疾病、解決能源危機)。這才是值得他投入一生去玩的遊戲。
⇨ 思考的本質是「壓縮」:
他常說「思考思考(Thinking about thinking)」,其實是在尋找一把萬能鑰匙。
真正的思考,不是去記憶海量的棋譜或生物數據,而是去找到這些數據背後的生成法則。這就是「壓縮」——把無限複雜的現實世界,壓縮成幾條簡潔的公式或演算法。AlphaGo 沒背棋譜卻贏了,是因為它掌握了圍棋的「壓縮規律」。
⇨ 「It」是指什麼?
指的是「用智力破解宇宙奧秘的過程」。這句話是他對自己一生的總結。
從 4 歲坐在棋盤前,到 48 歲獲得諾貝爾獎,他其實從未改變。他一直在玩同一個遊戲,只是他把這個遊戲的層級,從「打敗對手」,升級到了「破解生命的底層邏輯」。
這不僅是一部科技紀錄片,更是一個關於人類如何突破極限的故事。如果你也想一窺這場『思考遊戲』的全貌,這部紀錄片非常值得一看。連結我放在留言處。
-
p.s. 我最近做的小實驗《塔報》,已經來到第19期啦!
這是一份專門為創作者打造的策展筆記,每週一次,幫你挖掘最值得參考的觀點和工具。
希望讓大家不用追一堆資訊,也能在五分鐘內拿到一個能立刻實踐的方法。
除了三個固定單元(社群新知、創作者觀點、創作工具),我還會在最後加上一些自己的反思和這週的觀察。
如果你覺得這篇內容對你有啟發,應該也會喜歡《塔報》,
免費閱讀連結我放在底下留言處。
就這樣,我們創作的路上見!
文章標籤
全站熱搜
