新華社斯德哥爾摩10月8日電(記者郭爽)瑞典皇家科學院8日宣布,將2024年諾貝爾物理學獎授予美國科學家約翰·霍普菲爾德和英國裔加拿大科學家杰弗里·欣頓,以表彰他們在使用人工神經網絡的機器學習方面的基礎性發現和發明。
10月8日,在瑞典斯德哥爾摩舉行的2024年諾貝爾物理學獎公布現場,屏幕顯示獎項得主美國普林斯頓大學的約翰·霍普菲爾德和加拿大多倫多大學的杰弗里·欣頓。新華社記者 彭子洋 攝
瑞典皇家科學院當天發表公報說,今年的兩位諾貝爾物理學獎得主使用物理學工具,為當今強大的機器學習技術奠定了基礎。約翰·霍普菲爾德創建了一種聯想記憶方法,可以存儲和重構圖像或其他類型的數據模式。杰弗里·欣頓發明了一種可以自動發現數據中屬性的方法,可用于識別圖片中的特定元素等任務。
諾貝爾物理學委員會主席埃倫·穆恩斯在當天的新聞發布會上表示,兩名獲獎者利用統計物理的基本概念設計了人工神經網絡,構建了機器學習的基礎。相關技術已被用于推動多個領域的研究,包括粒子物理、材料科學和天體物理等,也已用于日常生活中的人臉識別和語言翻譯等。她同時警告說,機器學習的快速發展也引發了人們對未來的擔憂,人類有責任以安全且道德的方式使用這項新技術。
10月8日,在瑞典斯德哥爾摩舉行的2024年諾貝爾物理學獎公布現場,屏幕顯示獎項得主美國普林斯頓大學的約翰·霍普菲爾德和加拿大多倫多大學的杰弗里·欣頓。新華社記者 彭子洋 攝
約翰·霍普菲爾德1933年出生于美國芝加哥,1958年獲得美國康奈爾大學博士學位,現任美國普林斯頓大學教授。
杰弗里·欣頓1947年出生于英國倫敦,1978年獲得英國愛丁堡大學博士學位,現任加拿大多倫多大學教授。
欣頓當天在接受電話連線時表示,獲得諾獎對他來說“完全沒想到”。他指出,相關技術將對社會產生巨大影響,但也必須警惕技術可能造成的威脅。
對于今年的諾貝爾物理學獎結果,不少人認為有些出乎意料。諾貝爾物理學委員會秘書烏爾夫·丹尼爾松當天在接受新華社記者采訪時表示,物理學獎可以授予理論上、實驗上或者觀測上的發現,也可以授予發明,今年的獲獎成果從某種意義上講也是一種發明,一種可以多種方式應用的發明。
今年的獲獎者使用物理學工具構建了為當今強大的機器學習奠定基礎的方法。約翰·霍普菲爾德(John Hopfield)創建了一種可以存儲和重建信息的結構。Geoffrey Hinton發明了一種可以獨立發現數據屬性的方法,這對于現在使用的大型人工神經網絡來說已經變得很重要。
© Johan Jarnestad/瑞典皇家科學院
許多人都體驗過計算機如何在語言之間進行翻譯、解釋圖像甚至進行合理的對話。也許不太為人所知的是,這種技術長期以來對研究很重要,包括對大量數據的排序和分析。機器學習的發展在過去十五到二十年中呈爆炸式增長,并利用了一種稱為人工神經網絡的結構。如今,當我們談論人工智能時,我們通常指的是這種技術。
盡管計算機無法思考,但機器現在可以模仿記憶和學習等功能。今年的物理學獎得主幫助實現了這一目標。他們利用物理學的基本概念和方法,開發了利用網絡結構來處理信息的技術。
機器學習與傳統軟件不同,傳統軟件的工作原理就像一種菜譜。該軟件接收數據,根據清晰的描述進行處理并產生結果,就像有人收集原料并按照食譜進行處理以生產蛋糕一樣。相反,在機器學習中,計算機通過示例進行學習,使其能夠解決過于模糊和復雜而無法通過逐步指令進行管理的問題。一個例子是解釋一張圖片以識別其中的對象。
人工神經網絡使用整個網絡結構來處理信息。靈感最初來自于了解大腦如何運作的愿望。 20 世紀 40 年代,研究人員開始圍繞大腦神經元和突觸網絡背后的數學進行推理。另一個難題來自心理學,這要歸功于神經科學家唐納德·赫布(Donald Hebb)的假設,即學習是如何發生的,因為當神經元一起工作時,它們之間的聯系會得到加強。
后來,這些想法被嘗試通過構建人工神經網絡作為計算機模擬來重建大腦網絡的功能。在這些模型中,大腦的神經元被賦予不同值的節點所模仿,而突觸則由節點之間的連接來表示,這些連接可以變得更強或更弱。唐納德·赫布的假設仍然被用作通過稱為訓練的過程更新人工網絡的基本規則之一。
© Johan Jarnestad/瑞典皇家科學院20 世紀 60 年代末,一些令人沮喪的理論結果導致許多研究人員懷疑這些神經網絡永遠不會有任何實際用途。然而,人們對人工神經網絡的興趣在 20 世紀 80 年代重新被喚醒,當時幾個重要的想法產生了影響,其中包括今年獲獎者的工作。
想象一下,您正在嘗試記住一個您很少使用的相當不尋常的單詞,例如用于電影院和演講廳中常見的傾斜地板的單詞。你搜索你的記憶。有點像斜坡……也許是徑向……徑向?不,不是那樣。耙子,就是這樣!
這種搜索相似單詞以找到正確單詞的過程讓人想起物理學家約翰·霍普菲爾德 (John Hopfield) 在 1982 年發現的聯想記憶。Hopfield網絡可以存儲模式,并有一種重新創建它們的方法。當給網絡一個不完整或輕微扭曲的模式時,該方法可以找到最相似的存儲模式。
霍普菲爾德此前曾利用他的物理學背景來探索分子生物學的理論問題。當他受邀參加一個有關神經科學的會議時,他遇到了有關大腦結構的研究。他對所學到的東西很著迷,并開始思考簡單神經網絡的動力學。當神經元一起行動時,它們可以產生新的、強大的特征,而這些特征對于只關注網絡獨立組件的人來說是不明顯的。
1980 年,霍普菲爾德離開了他在普林斯頓大學的職位,他的研究興趣使他離開了物理學同事們工作的領域,并搬到了整個非洲大陸。他接受了南加州帕薩迪納市加州理工學院化學和生物學教授職位的邀請。在那里,他可以使用計算機資源進行免費實驗并發展他關于神經網絡的想法。
然而,他并沒有放棄自己的物理學基礎,在那里他找到了靈感,理解了具有許多小組件協同工作的系統如何產生新的有趣的現象。他特別受益于了解磁性材料,這些材料由于原子自旋而具有特殊特性,這種特性使每個原子都成為微小的磁鐵。相鄰原子的自旋相互影響;這可以允許形成具有相同方向自旋的域。他能夠利用物理學描述材料在自旋相互影響時如何發展,從而建立一個具有節點和連接的模型網絡。
霍普菲爾德構建的網絡具有通過不同強度的連接連接在一起的節點。每個節點都可以存儲一個單獨的值——在 Hopfield 的第一個作品中,這個值可以是 0 也可以是 1,就像黑白圖片中的像素一樣。
霍普菲爾德描述了網絡的整體狀態,其屬性相當于物理學中自旋系統中的能量;能量是使用一個公式計算的,該公式使用節點的所有值以及它們之間的所有連接強度。 Hopfield 網絡通過饋送到節點的圖像進行編程,節點被賦予黑色 (0) 或白色 (1) 值。然后使用能量公式調整網絡的連接,以便保存的圖像獲得低能量。當另一種模式被輸入網絡時,有一個規則會逐個遍歷節點,并檢查如果該節點的值發生變化,網絡是否具有較低的能量。如果事實證明,如果黑色像素變成白色,能量就會減少,它就會改變顏色。這個過程一直持續到不可能找到任何進一步的改進為止。當達到這一點時,網絡通常會再現其訓練時所用的原始圖像。
如果您只保存一種模式,這可能不會顯得那么引人注目。也許您想知道為什么不直接保存圖像本身并將其與正在測試的另一張圖像進行比較,但 Hopfield 的方法很特殊,因為可以同時保存多張圖片,并且網絡通常可以區分它們。
霍普菲爾德將在網絡中搜索已保存的狀態比作在山峰和山谷中滾動一個球,摩擦力會減慢其運動速度。如果球掉落在特定位置,它會滾入最近的山谷并停在那里。如果給網絡一個接近已保存模式之一的模式,它將以同樣的方式繼續前進,直到到達能量景觀中的山谷底部,從而找到其記憶中最接近的模式。
Hopfield 網絡可用于重新創建包含噪聲或已部分擦除的數據。
© Johan Jarnestad/瑞典皇家科學院Hopfield 和其他人繼續開發 Hopfield 網絡功能的細節,包括可以存儲任何值的節點,而不僅僅是零或一。如果您將節點視為圖片中的像素,那么它們可以具有不同的顏色,而不僅僅是黑色或白色。改進的方法使得保存更多圖片成為可能,并且即使它們非常相似也能夠區分它們。識別或重建任何信息都是可能的,只要它是由許多數據點構建的。
記住圖像是一回事,但解釋它所描繪的內容則需要更多。
即使很小的孩子也可以指著不同的動物并自信地說出它是狗、貓還是松鼠。他們偶爾可能會出錯,但很快他們幾乎總是正確的。即使沒有看到任何圖表或物種或哺乳動物等概念的解釋,孩子也可以學到這一點。在遇到每種動物的一些例子后,不同的類別就會在孩子的頭腦中就位。人們通過體驗周圍的環境來學習識別一只貓,或者理解一個單詞,或者進入一個房間并注意到某些東西發生了變化。
當霍普菲爾德發表有關聯想記憶的文章時,杰弗里·辛頓正在美國匹茲堡的卡內基梅隆大學工作。他之前曾在英格蘭和蘇格蘭研究過實驗心理學和人工智能,并且想知道機器是否可以學習以與人類類似的方式處理模式,找到自己的類別來排序和解釋信息。 Hinton 與他的同事 Terrence Sejnowski 一起從 Hopfield 網絡開始,并利用統計物理學的思想將其擴展以構建新的東西。
統計物理學描述由許多相似元素組成的系統,例如氣體中的分子。追蹤氣體中的所有單獨分子是困難或不可能的,但可以將它們集中考慮以確定氣體的總體特性,例如壓力或溫度。氣體分子有許多潛在的方式以各自的速度在其體積中擴散,但仍然產生相同的集體特性。
可以使用統計物理學來分析各個組件可以共同存在的狀態,并計算它們發生的概率。有些狀態比其他狀態更有可能發生;這取決于可用能量的大小,十九世紀物理學家路德維希·玻爾茲曼用方程描述了這一點。 Hinton 的網絡利用了該方程,該方法于 1985 年以引人注目的玻爾茲曼機名稱發布。
玻爾茲曼機通常與兩種不同類型的節點一起使用。信息被饋送到一組,稱為可見節點。其他節點形成隱藏層。隱藏節點的值和連接也為整個網絡的能量做出了貢獻。
該機器通過應用一種規則來運行,一次更新一個節點的值。最終,機器將進入一種狀態,其中節點的模式可以改變,但整個網絡的屬性保持不變。然后,每種可能的模式都將具有特定的概率,該概率由網絡能量根據玻爾茲曼方程確定。當機器停止時,它會創建一個新的模式,這使得玻爾茲曼機成為生成模型的早期例子。
© Johan Jarnestad/瑞典皇家科學院玻爾茲曼機可以學習——不是從指令中學習,而是從給出的例子中學習。它通過更新網絡連接中的值來進行訓練,以便在訓練時饋送到可見節點的示例模式在機器運行時具有最高的可能出現概率。如果在訓練過程中多次重復相同的模式,則出現該模式的概率會更高。訓練還會影響輸出與機器訓練示例類似的新模式的概率。
經過訓練的玻爾茲曼機可以識別以前從未見過的信息中的熟悉特征。想象一下,見到一個朋友的兄弟姐妹,你立刻就能看出他們一定有親戚關系。以類似的方式,玻爾茲曼機可以識別一個全新的例子,如果它屬于訓練材料中找到的類別,并將其與不相似的材料區分開來。
在其原始形式中,玻爾茲曼機效率相當低,并且需要很長時間才能找到解決方案。當事物以多種方式發展時,它會變得更加有趣,這是 Hinton 不斷探索的。后來的版本已被精簡,因為某些單元之間的連接已被刪除。事實證明,這可能會使機器更加高效。
During the 1990s, many researchers lost interest in artificial neural networks, but Hinton was one of those who continued to work in the field. He also helped start the new explosion of exciting results; in 2006 he and his colleagues Simon Osindero, Yee Whye Teh and Ruslan Salakhutdinov developed a method for pretraining a network with a series of Boltzmann machines in layers, one on top of the other. This pretraining gave the connections in the network a better starting point, which optimised its training to recognise elements in pictures.
The Boltzmann machine is often used as part of a larger network. For example, it can be used to recommend films or television series based on the viewer’s preferences.
憑借 20 世紀 80 年代及以后的工作,John Hopfield 和 Geoffrey Hinton 為 2010 年左右開始的機器學習革命奠定了基礎。
我們現在所見證的發展是通過訪問可用于訓練網絡的大量數據以及通過計算能力的巨大增長而實現的。當今的人工神經網絡通常非常龐大并且由許多層構成。這些被稱為深度神經網絡,它們的訓練方式被稱為深度學習。
快速瀏覽一下 Hopfield 1982 年關于聯想記憶的文章,可以對這一發展提供一些視角。在其中,他使用了一個有 30 個節點的網絡。如果所有節點都相互連接,則有 435 個連接。節點有其值,連接有不同的強度,總共需要跟蹤的參數不到 500 個。他還嘗試了一個有 100 個節點的網絡,但考慮到他當時使用的計算機,這太復雜了。我們可以將其與當今的大型語言模型進行比較,這些模型被構建為可以包含超過一萬億個參數(一百萬個)的網絡。
許多研究人員現在正在開發機器學習的應用領域。哪一個最可行還有待觀察,同時圍繞這項技術的開發和使用的道德問題也存在廣泛的討論。
由于物理學為機器學習的發展提供了工具,因此觀察物理學作為一個研究領域如何從人工神經網絡中受益是很有趣的。機器學習早已應用于我們之前諾貝爾物理學獎所熟悉的領域。其中包括使用機器學習來篩選和處理發現希格斯粒子所需的大量數據。其他應用包括減少黑洞碰撞引力波測量中的噪音,或尋找系外行星。
近年來,這項技術也開始用于計算和預測分子和材料的特性,例如計算蛋白質分子的結構,這決定了它們的功能,或者計算出材料的哪些新版本可能具有最佳特性用于更高效的太陽能電池。
有關今年獎項的更多信息,包括英語科學背景,請訪問瑞典皇家科學院網站www.kva.se和www.nobelprize.org,您可以在其中觀看新聞發布會的視頻、諾貝爾講座等等。有關諾貝爾獎和經濟科學獎相關展覽和活動的信息,請訪問www.nobelprizemuseum.se。
約翰·J·霍普菲爾德 (JOHN J. HOPFIELD)
1933 年出生于美國伊利諾伊州芝加哥。 1958 年獲得美國紐約州伊薩卡康奈爾大學博士學位。美國新澤西州普林斯頓大學教授。
GEOFFREY E. HINTON
1947 年出生于英國倫敦。 1978年獲英國愛丁堡大學博士學位。加拿大多倫多大學教授。
“通過人工神經網絡實現機器學習的基礎發現和發明”
科學編輯:Ulf Danielsson、Olle Eriksson、Anders Irb?ck 和 Ellen Moons,諾貝爾物理學獎
文本:Anna Davour
譯者:Clare Barnes
插圖:Johan Jarnestad
編輯:Sara Gustavsson
© 瑞典皇家科學院
2024 年 10 月 8 日
瑞典皇家科學院決定將2024年諾貝爾物理學獎授予
約翰·霍普菲爾德
普林斯頓大學,新澤西州,美國
杰弗里·辛頓 (Geoffrey E. Hinton)
加拿大多倫多大學
“通過人工神經網絡實現機器學習的基礎發現和發明”
今年的兩位諾貝爾物理學獎獲得者使用物理學工具開發了為當今強大的機器學習奠定基礎的方法。約翰·霍普菲爾德(John Hopfield)創建了一種聯想存儲器,可以存儲和重建圖像以及數據中其他類型的模式。 Geoffrey Hinton 發明了一種方法,可以自動查找數據中的屬性,從而執行識別圖片中特定元素等任務。
當我們談論人工智能時,我們通常指的是使用人工神經網絡的機器學習。這項技術最初的靈感來自于大腦的結構。在人工神經網絡中,大腦的神經元由具有不同值的節點表示。這些節點通過類似于突觸的連接相互影響,并且可以變得更強或更弱。例如,通過在同時具有高值的節點之間建立更強的連接來訓練網絡。今年的獲獎者從 20 世紀 80 年代起就在人工神經網絡方面開展了重要工作。
約翰·霍普菲爾德發明了一種網絡,該網絡使用一種保存和重新創建模式的方法。我們可以將節點想象為像素。Hopfield 網絡利用物理學來描述材料因原子自旋而產生的特性,這種特性使每個原子都成為微小的磁鐵。整個網絡以相當于物理學中自旋系統能量的方式進行描述,并通過查找節點之間的連接值進行訓練,以便保存的圖像具有低能量。當 Hopfield 網絡輸入扭曲或不完整的圖像時,它會系統地通過節點工作并更新它們的值,從而使網絡的能量下降。因此,網絡逐步工作,找到最接近其輸入的不完美圖像的已保存圖像。
Geoffrey Hinton使用 Hopfield 網絡作為使用不同方法的新網絡的基礎:玻爾茲曼機。這可以學習識別給定類型數據中的特征元素。 Hinton 使用了統計物理學中的工具,統計物理學是由許多相似組件構建的系統科學。通過向機器提供運行時很可能出現的示例來訓練機器。玻爾茲曼機可用于對圖像進行分類或創建其所訓練的模式類型的新示例。 Hinton 在這項工作的基礎上,幫助啟動了當前機器學習的爆炸性發展。
“獲獎者的工作已經帶來了最大的效益。在物理學中,我們在廣泛的領域中使用人工神經網絡,例如開發具有特定屬性的新材料。”諾貝爾物理學委員會主席 Ellen Moons 說道。
這些插圖可免費用于非商業目的。屬性“©Johan Jarnestad/瑞典皇家科學院”。
插圖:2024 年諾貝爾物理學獎 (pdf)
插圖:自然和人工神經元 (pdf)
插圖:記憶存儲在風景中 (pdf)
插圖:不同類型的網絡 (pdf)
科普背景:他們利用物理學來尋找信息模式 (pdf)
科學背景:“通過人工神經網絡實現機器學習的基礎發現和發明”(pdf)
約翰·J·霍普菲爾德 (John J. Hopfield ) 1933 年出生于美國伊利諾伊州芝加哥。 1958 年獲得美國紐約州伊薩卡康奈爾大學博士學位。美國新澤西州普林斯頓大學教授。
Geoffrey E. Hinton,1947 年出生于英國倫敦。 1978年獲英國愛丁堡大學博士學位。加拿大多倫多大學教授。
獎金金額:1100萬瑞典克朗,由獲獎者平分。
更多信息:www.kva.se 和 www.nobelprize.org
媒體聯系人:Eva Nevelius,新聞秘書,+46 70 878 67 63,eva.nevelius@kva.se
專家:Olle Eriksson,+46 18 471 36 25,olle .eriksson@physicals.uu.se和 Anders Irb?ck,+46 46 222 34 93,anders.irback@cec.lu.se ,諾貝爾物理學委員會成員。
瑞典皇家科學院成立于 1739 年,是一個獨立組織,其總體目標是促進科學發展并加強科學在社會中的影響力。該學院對自然科學和數學負有特殊責任,但致力于促進各學科之間的思想交流。
Nobel Prize® 是諾貝爾基金會的注冊商標。
引用本節
MLA 風格:新聞稿。 NobelPrize.org。諾貝爾獎外展 AB 2024。 周二。 2024 年 10 月 8 日。