44444免费观看高清电视剧直播-444444在线观看免费高清电视剧-444444影院免费播放电视剧大全下载-4444444444免费观看电视剧

網(wǎng)站首頁 | 網(wǎng)站地圖

每日推薦
首頁 > 理論 > 正文

人工智能在世界史研究中的應(yīng)用與反思

【光明青年論壇】 

編者按

在當(dāng)今時代,人工智能已經(jīng)滲透到人類生活的方方面面,深刻改變了人們認識世界和改造世界的方式。對學(xué)術(shù)研究而言,人工智能技術(shù)一方面以其高效的文本處理能力以及突出的內(nèi)容挖掘、算法篩選能力等,為研究帶來便利;另一方面也存在價值偏見等內(nèi)在局限與倫理規(guī)范等潛在風(fēng)險,由此成為各學(xué)科探討的一大熱點。就世界史研究而言,歷史學(xué)家們?nèi)绾芜\用人工智能技術(shù)處理和分析海量的史料、構(gòu)建語義關(guān)系網(wǎng)絡(luò),進而得出相應(yīng)的結(jié)論?人工智能技術(shù)的應(yīng)用,是否拓寬了已有的研究邊界?存在哪些難以突破的瓶頸?青年一代的世界史學(xué)者應(yīng)該如何與人工智能共處呢?圍繞上述問題,本版邀請三位從事不同國別研究的青年學(xué)者進行討論,并邀請資深專家予以點評,以期為數(shù)字時代的歷史研究提供有益參照。

  與談人

  王思婕 同濟大學(xué)德國問題研究所助理教授

  姚念達 廈門大學(xué)歷史與文化遺產(chǎn)學(xué)院副教授

  易晉銘 復(fù)旦大學(xué)歷史學(xué)系博士后

  主持人

  本報記者 周曉菲

1.人工智能如何推動世界史研究

主持人:近年來人工智能技術(shù)飛速發(fā)展,各學(xué)科的學(xué)者們紛紛探索其在自身研究領(lǐng)域的應(yīng)用潛力,世界史研究也不例外。請各位結(jié)合自己所從事研究領(lǐng)域,談?wù)勅斯ぶ悄茉诰唧w研究中是如何發(fā)揮作用的?

王思婕:就我所從事的德國史研究而言,中外德國史學(xué)界對人工智能的應(yīng)用,目前主要集中于歷史手稿、檔案的光學(xué)字符識別與轉(zhuǎn)寫,以及借助主題建模、文本重用檢測等技術(shù)開展文本內(nèi)容挖掘。同時,人工智能也顯著推動了既有數(shù)字史學(xué)工作的深化,例如在社會網(wǎng)絡(luò)分析中識別檔案中隱含的人物關(guān)系與中介節(jié)點,通過推理彌補地理信息的缺失等。盡管數(shù)字史學(xué)研究者很早就借助編程語言,通過詞頻統(tǒng)計、詞項共現(xiàn)等,識別潛在主題,初步實現(xiàn)了對大規(guī)模歷史語料的內(nèi)容挖掘。然而,此類方法多局限于詞項層面的統(tǒng)計關(guān)聯(lián),難以有效捕捉語義演化、修辭差異等深層次的歷史表征。尤其在長時段比較中,術(shù)語使用的代際更替常引發(fā)主題追蹤的中斷。近年來,基于深度學(xué)習(xí)的預(yù)訓(xùn)練語言模型,可將文本轉(zhuǎn)化為能反映上下文語境的向量結(jié)構(gòu),從而識別出不同表述下的同一歷史主題,同時通過與大語言模型進行集成,語義嵌入也更加精細,并能直接生成解釋性摘要或標(biāo)簽。

姚念達:在國際美國史學(xué)界,人工智能的應(yīng)用不局限于大語言模型,而是涵蓋以自然語言處理和機器學(xué)習(xí)為核心的一整套計算分析方法。該路徑通過將報紙、政府文件乃至影音材料等多樣化史料轉(zhuǎn)化為可量化分析的對象,運用主題建模、文本嵌入和語義分析等手段,在宏觀層面揭示語言、觀念與政治話語的長期變化,為歷史解釋提供新的問題線索與證據(jù)基礎(chǔ)。相關(guān)研究多以計算語言變化為切入點。斯坦福大學(xué)尼基爾·加爾加團隊將20世紀(jì)大規(guī)模語料轉(zhuǎn)化為詞向量,量化分析了語言中性別與族群刻板印象的變遷,并將其與社會結(jié)構(gòu)的轉(zhuǎn)型相聯(lián)系。另有美國學(xué)者梅麗莎·李分析了19世紀(jì)報紙與國會辯論語料,利用自然語言處理工具追蹤“合眾國”一詞從復(fù)數(shù)用法向單數(shù)用法的轉(zhuǎn)變。研究指出,這一表述在南北戰(zhàn)爭前常被理解為由各州組成的聯(lián)合體,而戰(zhàn)后則逐漸被視為一個統(tǒng)一國家,由此反映了美國人對國家主權(quán)理解的變化。這類研究并不等同于單純的“遠讀”,也不是對傳統(tǒng)方法的替代,而是強調(diào)計算分析與文本細讀的結(jié)合。

易晉銘:近年來,中世紀(jì)歐洲史與人工智能的結(jié)合主要集中在利用人工智能技術(shù)對中世紀(jì)史料進行自動轉(zhuǎn)寫、補全和結(jié)構(gòu)化分析,從而提高古文獻的可讀性、可檢索性和可分析能力。首先,通過手寫文本識別、版面分析等計算機視覺方法,將中世紀(jì)手稿和檔案影像自動轉(zhuǎn)寫為可檢索文本。其中,Transkribus是目前歐洲學(xué)界中最常用的手寫文本識別工具之一。其次,通過知識圖譜和語義網(wǎng)技術(shù),把分散在特許狀、賬簿、書信等史料中的人物、地點與制度關(guān)系結(jié)構(gòu)化為可查詢的數(shù)據(jù)網(wǎng)絡(luò)。2025年,多位西班牙學(xué)者組成的研究團隊提出建立一個關(guān)于中世紀(jì)特許狀的知識圖譜,通過結(jié)合專家標(biāo)注、社區(qū)貢獻與溯源機制,將分散的特許狀數(shù)據(jù)結(jié)構(gòu)化為可查詢的知識網(wǎng)絡(luò),從而支持對中世紀(jì)社會、法律與經(jīng)濟關(guān)系的系統(tǒng)化分析。最后,大語言模型也被用于拉丁銘文的文本補全。例如,Aeneas是一款基于約20萬條拉丁銘文訓(xùn)練的專用大型語言模型,可通過分析殘缺文本或圖像來補全古代和早期中世紀(jì)的銘文內(nèi)容,并推測其年代、地點及相關(guān)信息,從而幫助學(xué)者更有效地解讀受損或缺失的歷史銘文。

主持人:歷史學(xué)者們借助人工智能強大的數(shù)據(jù)處理能力,能夠快速梳理海量的檔案文獻等史料,挖掘出難以發(fā)現(xiàn)的歷史信息與關(guān)聯(lián)。這是否意味著,人工智能技術(shù)拓展了已有的研究邊界,或者“重塑”傳統(tǒng)研究領(lǐng)域?

王思婕:人工智能雖然在方法論層面為德國史研究提供了新的分析工具,但尚未實質(zhì)性拓展研究邊界,因為它既缺乏問題意識,也高度依賴研究者的前期工作與解釋性判斷。愛沙尼亞學(xué)者卡雷爾·西克以14世紀(jì)末德意志地區(qū)針對瓦爾登派信徒的異端審判為研究對象,將數(shù)百份供詞中涉及人物關(guān)系、地點與時間的信息進行數(shù)據(jù)化處理,進而揭示出審判官的調(diào)查策略,也呈現(xiàn)了宗教審判從信息收集到裁決的運行機制。原本散落于零碎供詞中的細節(jié),被納入一個動態(tài)的信息處理過程之中,這顯然突破了傳統(tǒng)研究的敘事模式。然而,整個研究始終離不開歷史學(xué)常規(guī)的前置工作:哪些供詞應(yīng)被納入分析、日期如何校定、隱含地點信息如何推斷、缺失材料在何種程度上影響結(jié)論,這些關(guān)鍵問題都必須由研究者判斷。事實上,西克也明確承認,現(xiàn)有算法在處理中世紀(jì)語境中的信息歧義時仍有局限,同時歷史事件本身的偶然性也會干擾算法的推理過程。

姚念達:從現(xiàn)有研究來看,人工智能對美國史研究的影響并非顛覆性的,也沒有形成范式革命。但在若干關(guān)鍵層面上,它確實拓展了既有研究邊界,并在一定程度上影響了研究的實踐方式。世界史研究以增進跨區(qū)域、跨文化理解為目標(biāo),但長期受研究者掌握的材料規(guī)模、語言能力與時間成本限制。人工智能的引入,使研究者得以在可控成本下處理大規(guī)模多語種史料,從而在實踐層面拓展研究的廣度與精度。其在概念史研究中的潛力尤為突出:借助文本嵌入模型和計算分析,研究者可以在全球尺度上追蹤重要概念的跨時空與跨語境傳播,而不再局限于少數(shù)經(jīng)典文本。例如,美國學(xué)者艾瑪·羅德曼的研究利用詞向量模型分析美國政治語料,通過比較不同時期政治概念的語義和語義關(guān)聯(lián),從而追蹤其在歷史語境中的含義變化,這為概念史研究提供了新的路徑。

易晉銘:關(guān)于中世紀(jì)歐洲史,人工智能對傳統(tǒng)研究領(lǐng)域的影響更為突出。在中世紀(jì)歐洲,契約是數(shù)量最多、連續(xù)性最強的書面記錄類型。它們通常是法律行為的書面見證,例如土地贈予、買賣契約和城市自治特許等。在數(shù)字化時代之前,這類研究基本圍繞單份或單組文書,常常以特定王朝、地區(qū)或機構(gòu)為研究單位,社會網(wǎng)絡(luò)重建主要依賴人工比對。數(shù)據(jù)庫與文本檢索技術(shù)的出現(xiàn),為大規(guī)模結(jié)構(gòu)分析提供了重要前提。但是,數(shù)據(jù)庫通常預(yù)先定義字段(日期、地點、人物),無法適應(yīng)多樣化研究的需求。人工智能可以幫助研究者訓(xùn)練符合自己研究所需的語義抽取模型,從而使研究從“預(yù)設(shè)字段的統(tǒng)計分析”轉(zhuǎn)向“模式發(fā)現(xiàn)與結(jié)構(gòu)建模”。2022年,多位歐洲大陸學(xué)者合作開發(fā)了一款自動識別中世紀(jì)拉丁語契約結(jié)構(gòu)(如前言、正文和結(jié)尾)的模型。該模型不僅推動了中世紀(jì)歐洲契約的自動化索引與信息檢索,也為文本結(jié)構(gòu)化分析提供了有效工具。

2.人工智能在世界史研究中的局限性

主持人:人工智能技術(shù)在顯著提升學(xué)術(shù)研究效率的同時,也存在不容忽視的局限。請三位談?wù)勀壳叭斯ぶ悄芗夹g(shù)面臨哪些難以突破的瓶頸?原因何在?這些局限又是如何影響史學(xué)研究的開展或者歷史敘事的建構(gòu)呢?

姚念達:在歷史研究中應(yīng)用人工智能,仍然存在若干難以突破的瓶頸。這些瓶頸并不只是因為技術(shù)尚未成熟,而是更深層地反映了當(dāng)下人工智能技術(shù)與歷史研究之間的結(jié)構(gòu)性不匹配。首先,人工智能難以與人類社會形成真正的情感共鳴。克羅齊曾指出,一切歷史都是當(dāng)代史。一個有生命力的歷史研究選題,往往能夠回應(yīng)當(dāng)下的社會問題,并在現(xiàn)實生活中引發(fā)讀者的情感共鳴。因此,歷史研究的重要一步,在于判斷哪些歷史問題在當(dāng)下具有意義,為什么值得被提出和反復(fù)討論。這種判斷高度依賴研究者對現(xiàn)實社會的感知、對公共議題的敏感度以及對人類經(jīng)驗的共情能力。人工智能雖然可以總結(jié)既有討論,卻不足以真正理解某一歷史議題與人類生活實踐之間的情感聯(lián)結(jié),也無法判斷其現(xiàn)實價值所在。

其次,人工智能在分析歷史文本時,面臨難以回避的語義漂移問題。當(dāng)前多數(shù)語言模型主要基于當(dāng)代語料訓(xùn)練,若直接用于歷史文本分析,容易以當(dāng)代語義和語言習(xí)慣誤讀過去的語言實踐。即便如蘇黎世大學(xué)團隊嘗試使用歷史語料訓(xùn)練模型,其效果仍然受到現(xiàn)存歷史文本不完整和不均衡的限制,其數(shù)據(jù)質(zhì)量和覆蓋范圍難以與當(dāng)代語料相比。

與此同時,人工智能的價值判斷也并非中立,而是不可避免地受到訓(xùn)練語料中主流規(guī)范與當(dāng)代價值觀的影響。當(dāng)這些模型被用于歷史研究時,可能在無意中以當(dāng)代標(biāo)準(zhǔn)衡量過去,從而弱化歷史語境。這些因素疊加在一起,或許會在歷史敘事層面推動一種并非出于研究者本意的當(dāng)代化傾向。

最后,一個尤為關(guān)鍵的瓶頸在于人工智能的“黑箱性”。在許多情況下,人文學(xué)者難以清楚解釋人工智能是如何得出某一結(jié)論的。對于以可解釋性、可討論性為基本規(guī)范的人文學(xué)科而言,如果研究者無法說明分析過程,也就難以為研究結(jié)論承擔(dān)必要的學(xué)術(shù)責(zé)任。

易晉銘:在文本分析方面,人工智能目前主要被應(yīng)用于那些保存數(shù)量較多且已實現(xiàn)數(shù)字化的史料類型,比如契約和通信,而在其他史料領(lǐng)域的應(yīng)用仍然相對有限。這一局限主要源于兩方面原因。其一,人工智能模型的訓(xùn)練高度依賴大規(guī)模的、可讀性較強的語料數(shù)據(jù),例如2024年瑞士伯爾尼大學(xué)法比奧·加蒂團隊針對佛羅倫薩商人銀行通信網(wǎng)絡(luò)的研究調(diào)用了超過6000封信件,然而,中世紀(jì)許多史料尚未形成如此規(guī)模和質(zhì)量。其二,中世紀(jì)文獻普遍存在字跡復(fù)雜、縮寫繁多和保存狀況不佳等問題,增加了文本識讀與轉(zhuǎn)寫成本。盡管Transkribus等手寫文本識別平臺在一定程度上提升了大規(guī)模識讀的可能性,但其訓(xùn)練和校對仍需投入人力與時間,因此研究者往往更傾向于直接利用已經(jīng)整理完成的史料數(shù)據(jù)庫開展研究。目前,中世紀(jì)史領(lǐng)域中數(shù)字化程度最高、數(shù)據(jù)庫建設(shè)最完善的正是契約類文獻,例如早期英格蘭文獻數(shù)據(jù)集(包含約4.4萬份契約)和中世紀(jì)勃艮第文獻集(包含約2.9萬份契約),這也進一步強化了人工智能研究在此類史料上的集中趨勢。

王思婕:如上所述,語料不均衡會影響人工智能的使用范圍。另一個類似的問題在于通用大語言模型的訓(xùn)練數(shù)據(jù)主要來自英語世界,這使得人工智能在歷史敘事中常沿用西方主流視角。人工智能在小語種史料的語義識別、長句及復(fù)合句理解方面,仍存在明顯不足。此外,英美檔案的數(shù)字化和開放獲取優(yōu)勢明顯,有些數(shù)據(jù)庫直接提供應(yīng)用程序編程接口(API),方便歷史研究者進行自動化批量抓取與深度加工。上述“數(shù)字鴻溝”在跨國史研究中尤為突出,研究者往往傾向于使用易獲取且結(jié)構(gòu)化程度高的英美史料,從而影響了對歷史事件全貌的還原。

訓(xùn)練數(shù)據(jù)的地區(qū)不平衡,導(dǎo)致大語言模型敘事的歐美中心化。全球南方的文本在現(xiàn)有數(shù)字化語料庫中的占比極低,其歷史經(jīng)驗在通用模型中被系統(tǒng)性地邊緣化。由于模型依賴概率預(yù)測來生成文本,缺乏特定語境數(shù)據(jù)時,會傾向于用它所熟悉的西方概念框架去“填補”空白,產(chǎn)生所謂的“幻覺”或刻板印象。例如在探究有關(guān)冷戰(zhàn)時期地區(qū)沖突的問題時,模型會套用美英官方敘事邏輯,將復(fù)雜的地區(qū)沖突簡化為美蘇對抗的注腳,從而強化了西方中心主義的知識再生產(chǎn)。

  3.史學(xué)工作者如何與人工智能共處

主持人:如上所述,人工智能在應(yīng)用過程中仍存在語料不均衡、價值判斷不中立等局限,在各位看來,有哪些方法可以加以應(yīng)對呢?

姚念達面對上述諸多局限,最根本的解決辦法還是期待通過技術(shù)進步徹底消除這些問題。不過,對于人文學(xué)者而言,更為現(xiàn)實且可行的路徑是借助方法設(shè)計與研究規(guī)范對這些局限加以緩解,從而確保人工智能始終處于可控、可驗證的地位。首先,應(yīng)當(dāng)明確堅持人類研究者在問題設(shè)置階段的主導(dǎo)地位。歷史研究中哪些問題值得被提出、為何具有研究意義,這類判斷必須源于研究者對現(xiàn)實社會與史學(xué)傳統(tǒng)的理解,而不應(yīng)由模型生成。其次,使用人工智能分析歷史文本時,在研究方法的設(shè)計中必須充分區(qū)分當(dāng)代語言模型與歷史語言之間的差異,并盡可能還原史料所處的歷史語境。再次,面對人工智能的“黑箱性”,歷史學(xué)者有必要強化研究過程的透明度與責(zé)任意識。即便算法本身難以完全解釋,研究者仍應(yīng)清楚說明所使用的模型類型、語料范圍與分析步驟,使研究路徑保持可追溯性,從而確保結(jié)論能夠接受學(xué)術(shù)討論與檢驗。

王思婕:可以嘗試構(gòu)建特定領(lǐng)域的垂類模型,如服務(wù)于美國早期史、德國史學(xué)史研究的專用智能體。專用智能體可以利用“檢索增強生成技術(shù)”(RAG),通過本地結(jié)構(gòu)化知識庫進行材料檢索,實現(xiàn)語境錨定,在保障生成質(zhì)量的同時提升可控性。專用智能體有獨立的記憶與參數(shù),配合微調(diào)技術(shù),也能對特定語種與歷史背景進行深度訓(xùn)練。更重要的是,本地知識庫包含多元視角的歷史敘事,研究者也可以在提示詞中加入一些本土歷史學(xué)者的洞見,以對沖模型可能存在的地緣政治偏差。

易晉銘:將人工智能作為“假設(shè)生成工具”,而非“結(jié)論驗證工具”。要避免人工智能淪為既有史學(xué)命題的效率工具,關(guān)鍵在于重新界定其方法論角色。與其將模型用于驗證早已形成的經(jīng)濟趨勢或制度判斷,不如將其定位為一種假設(shè)生成機制,通過監(jiān)督學(xué)習(xí)、聚類分析或語義向量建模等方法,主動識別尚未被理論框架充分解釋的歷史問題。例如,算法可以揭示跨地區(qū)低頻人物的隱性網(wǎng)絡(luò)或識別非常規(guī)契約條款的語義組合。這些輸出并非直接構(gòu)成歷史結(jié)論,而是為歷史學(xué)者提供新的問題線索與研究方向。隨后由研究者結(jié)合檔案語境與制度背景進行解釋與驗證。

主持人:在人工智能深刻影響學(xué)術(shù)研究范式的背景下,作為青年世界史研究者,應(yīng)當(dāng)如何在堅守史學(xué)傳統(tǒng)與擁抱技術(shù)變革之間尋求平衡,實現(xiàn)良性共處呢?

易晉銘:在人工智能逐漸進入史學(xué)研究實踐的背景下,史學(xué)訓(xùn)練的重要性不僅沒有削弱,反而更加凸顯。首先,問題意識的形成依賴長期史學(xué)訓(xùn)練,而非對技術(shù)的掌握。真正具有創(chuàng)新性的研究,往往源于對既有解釋的懷疑與重構(gòu)。這種懷疑能力來自對史學(xué)傳統(tǒng)、理論譜系與方法論爭論的熟悉。沒有對史學(xué)發(fā)展史的理解,就難以判斷一個人工智能生成的模式究竟是“新發(fā)現(xiàn)”還是“舊問題的重復(fù)”。其次,史學(xué)訓(xùn)練還培養(yǎng)了一種敏銳的覺察能力。人工智能依賴可見數(shù)據(jù),但是歷史研究也常常關(guān)注缺席者、邊緣群體與未被記錄的聲音。只有經(jīng)過長期史學(xué)訓(xùn)練的學(xué)者,才會意識到哪些群體在契約或行政文書中系統(tǒng)性缺席,并據(jù)此設(shè)計補充路徑。最后,史料批判能力是不可替代的基礎(chǔ)。無論模型識別出多少文本模式,研究者必須判斷這些模式是否源于檔案生成機制或保存偏差。因而,史學(xué)工作者在積極運用人工智能技術(shù)的同時,仍然需要將傳統(tǒng)的史學(xué)訓(xùn)練放在首位。

王思婕:年輕學(xué)者應(yīng)讓人工智能去承擔(dān)檔案初篩、文本識別與文獻翻譯等初階任務(wù),將自己的主要精力投入更具創(chuàng)造性的解釋環(huán)節(jié)。隨著檔案資料的持續(xù)公開與數(shù)字化,從職業(yè)生涯早期開始,年輕學(xué)者可逐步搭建由結(jié)構(gòu)化史料與多元視角學(xué)術(shù)成果組成的個人知識庫,從檔案的閱讀者轉(zhuǎn)向數(shù)據(jù)的管理者。在RAG技術(shù)的支持下,個人知識庫能通過關(guān)鍵詞,在多語種語料中檢索、識別語義關(guān)聯(lián)與整合研究觀點,大大提升工作效率。此外,年輕學(xué)者也應(yīng)積極探索歷史學(xué)潛在的人工智能應(yīng)用場景。例如,基于歷史人物的信件、日記與著作,借助生成式建模技術(shù),實現(xiàn)與歷史人物的對話;利用歷史推演,模擬關(guān)鍵的戰(zhàn)爭決策或外交談判過程。上述應(yīng)用不僅可以輔助歷史教學(xué),也有助于激發(fā)研究者的學(xué)術(shù)靈感。

姚念達:在我看來,世界史學(xué)者與人工智能的關(guān)系,不應(yīng)被理解為對立或替代,而是一種有邊界、有自覺的共處關(guān)系。首先要明確的是,在人文研究中強調(diào)人的重要性,并不意味著否定技術(shù)。歷史學(xué)者之所以難以被機器取代,并不只是因為技術(shù)尚未成熟,而是因為其核心價值始終來自研究者的問題意識以及對歷史意義的賦予。正因如此,人文學(xué)者并不需要通過拒絕使用人工智能來證明自身的不可替代性。與此同時,也需要警惕另一種極端傾向,即人工智能帶來的高效率或許會讓研究者不自覺地削弱自身主體性。如果研究者只是機械地依賴模型生成結(jié)論、摘要或分析路徑,研究本身可能會退化為對模型輸出的整理與復(fù)述。學(xué)者與人工智能共處的關(guān)鍵,在于清楚區(qū)分提升勞動效率與替代人類思考之間的界限。人工智能適合承擔(dān)重復(fù)性、高強度的工作,為研究者釋放時間與精力。而真正的學(xué)術(shù)價值,仍然來自人的創(chuàng)造力、批判性與解釋能力。

■專家點評

南京大學(xué)歷史專家點評學(xué)院教授王濤:歷史學(xué)科在研究方法上的變革比較緩慢,但其本身并不排斥方法論的更新,甚至主動引入了跨學(xué)科的思維方式,否則就不會有“新史學(xué)”的出現(xiàn),乃至年鑒學(xué)派等諸多史學(xué)流派的輪番登場。司馬遷若能穿越到當(dāng)下,看到年輕一代的歷史學(xué)者在大談人工智能時代的史學(xué)研究,應(yīng)該會有一種熟悉的陌生感。

陌生的是那些聽起來高端的技術(shù)新名詞,讓人應(yīng)接不暇。從計量史學(xué)開始,就不斷涌現(xiàn)數(shù)字人文、大數(shù)據(jù)、空間分析、文本挖掘等方法論,最近在人工智能的沖擊下,又制造出大語言模型、數(shù)智史學(xué)等表述,史學(xué)研究的技術(shù)轉(zhuǎn)向應(yīng)該被證實了。當(dāng)然,史學(xué)家并不是為了技術(shù)本身,而是希望煩瑣的研究工作能夠在技術(shù)的加持下得到效率的提升。無論是從海量文本中捕捉語義,還是轉(zhuǎn)錄手稿,都是大語言模型能夠發(fā)揮所長的領(lǐng)域。處于事業(yè)成長期的年輕學(xué)人天然地對這個討論更加敏感,甚至滿懷憧憬,因為按照傳統(tǒng)的學(xué)術(shù)發(fā)展路徑,年輕一代需要多快好省地發(fā)表論文,盡快讓高質(zhì)量論文變成自己的名片。在人工智能的協(xié)助下,論文生成的流程無疑得到優(yōu)化,這是極大的誘惑。大家都不想在未來的史學(xué)界,變成那個最后使用人工智能工具進行歷史研究的后進分子。

假若司馬遷闖入人工智能的時代,或許無法理解三位年輕后輩提到的技術(shù)概念,但他一定能夠敏銳地發(fā)現(xiàn),在技術(shù)光環(huán)之下,他們依然在討論史學(xué)的可理解性、可討論性,史學(xué)的意義以及評價。這是他還算熟悉的話題,甚至可以加入到三個年輕人的熱烈討論中,再添上一筆“太史公曰”。因此,令人欣慰的是,年輕學(xué)者雖然密切跟蹤最時髦、最前沿的方法論,但他們始終能夠做到以歷史學(xué)的內(nèi)核為導(dǎo)向和審判的依規(guī),來定義或者評判人工智能的有效與有限。他們強調(diào),在人工智能進入史學(xué)研究的語境下,史學(xué)基本功的訓(xùn)練不可荒廢,這是尤其重要的提示。唯有如此,史學(xué)研究才能對抗人工智能帶來的幻覺、加劇的“數(shù)字鴻溝”,突破技術(shù)的“黑箱性”。實際上,在破除各種高端的修辭濾鏡之后,人工智能所主導(dǎo)的史學(xué)研究,本質(zhì)上只是完成了一種歷史書寫的可能性,對此保持審慎地質(zhì)疑,是一個專業(yè)史學(xué)工作者的本分,是需要時刻保持的清醒與定力。

即便如此,傳統(tǒng)史學(xué)的方法論與發(fā)展慣性已經(jīng)難以為繼。毫無疑問,對于綜述性研究方法論而言,歷史學(xué)可能不存在了。因為完成全面性的、總結(jié)性質(zhì)的學(xué)術(shù)梳理,人工智能毫無爭議地領(lǐng)先人類。未來的發(fā)展路徑如何,技術(shù)上如何可控,比如青年學(xué)者提到的檢索增強生成技術(shù)在世界史研究中的運用,是需要更多史學(xué)工作者在實踐中不斷嘗試才能加以推進的事業(yè)。他們還提到史學(xué)家的主體性,強調(diào)史學(xué)研究的價值來自人的創(chuàng)造。這個認知極為重要。雖然有學(xué)者討論過人寫的歷史未必是人的歷史,但是我們應(yīng)該堅持人的歷史必須要由人類來書寫。書寫歷史是為了抵達對歷史人物的同情之理解,與他們共情。如果人工智能參與一切歷史研究的全流程,作為人類讀者,為什么要讀一個“人類之外”的物種書寫的人類歷史呢?僅僅因為“Ta”寫得更通順,更有趣嗎?在優(yōu)雅的文字表達之下,人工智能很難理解奧本海默為什么會糾結(jié)于使用原子彈的合理性。但是,作為人類的一份子,我們可以。

中國人民大學(xué)歷史學(xué)院教授趙秀榮:人工智能的核心價值在于其處理和分析大規(guī)模數(shù)據(jù)的能力,其設(shè)計初衷是為了處理歷史學(xué)家所珍視的原始資料。這包括但不限于三位年輕學(xué)者提到的自然語言處理、主題建模、社會網(wǎng)絡(luò)分析以及地理信息系統(tǒng)。

三位年輕學(xué)者都從自己的研究視角肯定了歷史學(xué)家可以借助人工智能提升研究效率。的確,目前大量史料被數(shù)字化,被轉(zhuǎn)化為可全文檢索的語料庫——包括報紙、期刊、日記,甚至手稿檔案,其構(gòu)建的各類數(shù)據(jù)庫已經(jīng)超越了人類的認知能力,無法運用傳統(tǒng)的細讀方法閱讀和分析這些資料。例如,“托馬森小冊子”是一個由17世紀(jì)倫敦書商喬治·托馬森收集的文獻集,包含1640年至1661年間出版的22,255份小冊子、傳單、手稿、書籍和新聞紙。這批藏品被視為大英圖書館的瑰寶之一,是研究英國內(nèi)戰(zhàn)時期歷史的無價之寶,目前已經(jīng)被收入早期英文圖書在線數(shù)據(jù)庫之中。顯然,閱讀和整理這些史料超出任何一位歷史學(xué)家的能力范圍,正如法國歷史學(xué)家克里斯蒂安·亨里奧特寫道,除非歷史學(xué)家掌握駕馭這片復(fù)雜且未知領(lǐng)域的必要技能,否則這個“信息豐富的世界”將始終遙不可及。

三位年輕學(xué)者也都意識到人工智能存在的局限。一是人工智能帶來的算法中的偏見,這與檔案中的偏見類似。人工智能不僅會反映甚至放大檔案中已有的偏見(如種族、性別和殖民主義偏見),這就是為何歷史學(xué)家的作用至關(guān)重要。二是人工智能的“黑箱”問題。許多人工智能系統(tǒng)是不可審查的,意味著其內(nèi)部決策過程即使對設(shè)計者來說也是不透明的。這對依賴可驗證的歷史研究構(gòu)成根本性的挑戰(zhàn)。目前一些人工智能系統(tǒng)已經(jīng)意識到這個問題,開始設(shè)置由人參與驗證和糾錯的機制。

因此,歷史學(xué)家不僅不是人工智能的被動消費者,獨特的學(xué)科訓(xùn)練反而使其能夠識別人工智能帶來的問題。例如,人工智能根據(jù)現(xiàn)代語言訓(xùn)練導(dǎo)致的偏差和偏見問題,這對歷史學(xué)家來說并不陌生。因為即使是檔案資料也隱藏著偏見,如在維多利亞時代之前的社會史研究中就很難找到女性的、兒童的、下層民眾書寫的史料。至于“黑箱”問題,歷史學(xué)寫作方法的訓(xùn)練可以有效克服這一問題,自19世紀(jì)蘭克學(xué)派以來,專業(yè)史學(xué)寫作就建立在通過腳注來展示所用史料的原則之上。對使用人工智能標(biāo)注的呼吁,正是腳注原則在21世紀(jì)的延伸。

人工智能可以發(fā)現(xiàn)模式,但無法解釋為何這些模式是重要的,也無法書寫引人入勝且有意義的歷史敘事。人工智能可以生成模型,但不能進行語境解讀,無法進行史料批判,更無法評估史料中隱藏的偏見。這就意味著,使用人工智能伴隨著重大的責(zé)任。利用人工智能進行輔助研究,必須采納一個全新的、更嚴(yán)謹?shù)呐锌蚣?。歷史學(xué)家的傳統(tǒng)技能非但沒有過時,反而在人工智能時代變得比以往任何時候都更加重要。歷史學(xué)悠久而深刻的批判傳統(tǒng),為應(yīng)對人工智能最棘手的挑戰(zhàn)提供了堅實的思想基礎(chǔ)。

人工智能是一種變革性技術(shù),正在改變歷史學(xué)家使用的工具,拓寬歷史學(xué)家的研究視野。人工智能在歷史研究中的最終價值在于增強歷史學(xué)家的技藝,使我們能夠探索更宏觀的歷史,并撰寫出比以往任何時代都更豐富、數(shù)據(jù)更充分、更細致入微的歷史。但必須銘記的是,人工智能不能像歷史學(xué)家那樣思考,也不會提問,更無從判斷哪個題目具有研究價值。因此,在人工智能時代,歷史學(xué)家的人文素養(yǎng)愈發(fā)彌足珍貴。

[責(zé)任編輯:周艷]