作者:王中葉(工信部網絡空間公共安全研究中心特約研究員)
當下,人工智能的火熱讓人們對其有了深刻的體會。盡管許多人并不完全了解人工智能的工作原理,但一提起人工智能,自動駕駛汽車、智能交互機器人、機器狗、無人機等已廣為人知的應用便浮現在人們腦海中。
當人工智能深度融入科學研究,究竟會帶來怎樣的范式變革,又會開啟哪些新的探索空間?首先需要明確“科研范式”的含義。科研范式指的是科學研究群體共同遵循的世界觀和研究方式,是保證科研活動高效、有序開展的一種通行準則。人類的科研范式曾經歷過四次重要演變,分別是經驗范式、理論范式、模擬仿真范式和數據驅動范式。在科學發展的不同階段,通常由某種范式主導。同時,在當前范式逐漸顯露出難以解釋新發現的局限時,新范式的出現便成為必然。
現今科學研究中,尤其是材料科學、合成生物學、化學、天文學和地球科學等領域,科學數據呈現出爆炸式增長。為了從這些海量數據中挖掘出知識規律,傳統方法(如計算機仿真和手動實驗)常顯得力不從心。例如,在2005至2015年間,基因組學的序列數據幾乎每7個月就要翻一番。而在天文學中,自1990年起運行的哈勃太空望遠鏡每周能傳回約20GB的原始數據。
這正是科研人員長期以來面臨的難題:一是科研成果在實際應用中的挑戰;二是數據收集、處理與分析效率較低;三是大部分科研團隊依舊采取“作坊式”工作模式,而平臺化合作較為稀少;四是在材料研發等領域依賴經驗和試錯的方式進行突破。這些龐大的數據需要進行分類、回歸、聚類、關聯分析、時間序列分析以及異常檢測等處理。只有在完成這些步驟后,隱藏的模式和未知的相關性才會浮現,否則只是無效冗余。同時,現代科學已進入復雜體系時代,傳統的計算方法難以應對越來越多變量和計算復雜度所帶來的瓶頸。
在此背景下,人工智能的核心技術——深度學習展現出獨特的優勢。深度學習的設計本就源自對大數據的需求,數據處理不僅是它的強項,也是其生存和發展的基礎。深度學習能在大量數據中找出規律,減輕數據爆炸帶來的挑戰。例如,人工實驗員一天難以完成的重復實驗,通過自動化平臺在一天內便可高效完成上百次,大幅提高實驗數據的準確性和一致性,而高質量的實驗數據正是模擬和訓練的基礎。
人工智能技術的發展使科學家開始超越傳統的四大科研范式,依托先進的計算技術,推動了第五代科研范式——利用人工智能技術對自然現象進行學習、模擬、預測和優化,從而推動科學發現和技術創新。相比于傳統的科研方法,這種科研范式不僅顯著提升了科學問題的解決效率,還為科研人員提供了新的研究角度與方向,開辟了探索未知的全新路徑。
一個典型的例子是,2024年度諾貝爾物理學獎與化學獎均與人工智能研究相關。這一方面肯定了人工智能在促進基礎科學進展中的關鍵作用,另一方面也預示著物理、化學等傳統學科將變得更加開放,科學家們不再局限于傳統的“可解釋性”研究模式,而是通過實驗校準不斷完善模型,從而獲得更全面的理解。
盡管人工智能帶來了諸多益處,其應用仍需保持謹慎。例如在生物學研究中,作為研究對象的人類個體信息和醫學特征信息都包含了較多的隱私內容。在數據挖掘和分析過程中,如果數據隱私得不到有效保護,在一定程度上會影響生物學的發展以及科學研究的可信度。雖然已有部分專家學者提出了一些創新技術手段,在保證數據安全的情況下進行數據共享交換以及模型的搭建訓練,但這一問題仍需進一步探索與解決。
(項目團隊:光明日報記者 崔興毅、張亞雄、陳海波)
《光明日報》(2025年01月03日 07版)