【重磅研究】如何測量國家實力:中國真的趕超美國了嗎?丨國政學人
2019-10-22 10:38:24 作者:本網整理 來源:國政學人 分享至:

作品簡介


【作者】邁克爾·貝克利(Michael Beckley),塔夫茨大學政治系助理教授,哈佛大學肯尼迪政府學院貝爾弗科學與國際事務中心研究員。

【編譯】李雯琿(國政學人編譯員,南開大學周恩來政府管理學院)

【校對】蘭星辰;裘谷城

【審核】丁偉航

【排版】賀奕

【來源】Beckley, M. (2018). The Power of Nations: Measuring What Matters. International Security, 43(2), 7-44.

 

期刊介紹

 

1.png

 

《國際安全》(International Security)是國際和國家安全領域的同行評議頂級學術期刊。它成立于1976年,由哈佛大學貝爾弗科學與國際事務中心(Belfer Center for Science and International Affairs at Harvard University)編輯,麻省理工學院出版社(MIT Press)每年出版四次。2018年影響力因子為4.500,在“國際關系”類別的85種期刊中排名第二位。

 

如何測量國家實力:中國真的趕超美國了嗎? 

The Power of Nations: Measuring What Matters

 

2.png

邁克爾·貝克利(Michael Beckley)


內容提要

 

編者按

 

國家實力的測量和對比是國際政治領域非常重要的議題。目前學界通常采用GDP或CINC(國家能力綜合指數)來測量國家實力,但是這些指數都在一定程度上夸大了人口大國(如中國)的實力水平,而忽略了國家的成本和效率問題。作者提出的GDP×人均GDP指標,囊括了國家的資源占有量和利用效率兩個維度,可以更加準確地測量國家實力。這一成果既是學術研究上的一大進步,更可以幫助我們更加清晰地認識中美實力差距,做出更加明智的戰略選擇。

 

在國際關系的研究與實踐當中,最重要的問題莫過于:是什么讓有些國家比其他國家更加強大?由于均勢在國際政治中的重要作用,為了實現均勢,學者需要一種完善的方法來測量國家實力(power);政策制定者更需要預估國家間相對實力來決定國家戰略。但是,實力是難以被觀測的,且因時而變因地而殊。通常,實力被定義為國家根據自己的利益塑造世界政治的能力(ability),但是系統地測量這一能力需要剖析每個國家的利益和影響力,以及無數個國際事件,這很顯然是不可能的。而且,對于政策制定者而言,基于事件結果評估出來的國家實力用處不大,因為這必須等待某一事件結束,而且結論只針對該事件,并不具有普遍性。


為了克服這一問題,大部分學者根據國家擁有的資源來測量國家實力,特別是財富和軍事資產,因為擁有更多財富和軍事資產的國家與其他國家相比更有可能實現其目標。但是,在測量資源的時候,很多學者錯誤地采用了總指標(grossindicators),如國內生產總值(GDP)、軍事支出和國家能力綜合指標(Composite Indicator of National Capability, CINC)等。由于這些指標沒有扣除國家用于安保、國防和社會福利部分的支出,因此在貧窮卻人口稠密的國家,國家實力通常會被夸大。事實上,人口稠密的國家雖然能夠擁有巨大產出,供養一支龐大的軍隊,但它同樣要承擔巨額的福利和安全開支,從而消耗了財富,牽制了軍隊,失去了可用于海外拓展的資源。


作者認為,使用資源占有量測量國家實力是可行的,但是不應采用總指標,而應該采用凈指標(net indicators)。計算凈指標類似于給每個國家創建資產負債表(a balance sheet),資產歸為一類,負債歸為另一類,計算凈資源就是用總資產減去總負債。作者提出了在定性定量研究中使用凈指標的具體方法,并通過對過去200年間大國的興衰和戰爭進行實證檢驗,證明實力是由凈資源決定的(power is a function of net resources)。


這些發現具有兩個重要影響。一方面,由于過去大部分學者都錯誤地使用總指標測量國家實力,因此學者需要使用新的方法重新進行這些研究。另一方面,關于“中國崛起”的言論被大肆宣傳,以至于美國的朝野上下儼然深信不疑、嚴陣以待。但是,如果用總指標減去國家需要付出的成本,美國的經濟和軍事實力仍然大大領先中國。


本文分為八個部分。第一部分解釋為什么學者要用資源測量國力;第二部分論述了學者要用凈指標而非總指標測量資源;第三部分作者給出了具體的總資源和凈資源的計算方法;第四到七部分作者通過案例和大數據檢驗了各指數的有效性;最后討論了這些研究的意義。

 

文章導讀

 

一、測量國家實力:基于資源而非結果

 

測量國家實力有兩種主要的方法,最常見的是測量國家財富和軍事資產的總和。這是因為一方面,國家可以利用財富,通過國際援助、投資、舉辦世博會和運動會等方式增強國家影響力和軟實力;另一方面,國家利用軍事資源打擊敵人、建立同盟。與此同時,一些學者拒絕采用“資源-實力”(power-as-resources approach)的方法,而是基于事件結果測量國家實力(power-as-outcomes approach)。他們認為,實力就是國家在爭端、談判中獲勝的能力,因此,可以通過觀察國際事件(如戰爭和外交談判)的結果來測量國家實力。


“結果-實力”的方法具有一些優點。如這種方法可以明確在特定事件中國家的收益;在一些以弱勝強的案例中,這種方法可以解釋非物質因素對事件結果的影響。但是,它的缺點也是顯而易見的。第一,學者通常需要評估國家總體實力,即這種實力關系需要基于大量事件,但是“結果-實力”方法只關注特定事件。第二,“結果-實力”方法只適用于分析已經發生的事件,而不能認識當下和預測未來。第三,“結果-實力”方法有時會產生荒謬的結論。如越南戰爭中美國戰敗,但顯然不能說明北越比美國強。實力并不是決定結果的唯一因素,結果還受到一些非物質因素的影響(比如意志、運氣和智慧),“結果-實力”方法把它們混為一談,但“資源-實力”方法將實力和非物質因素進行了明確區分。


因此,作者采用“資源-結果”的方法測量國家實力,同時用事件結果數據檢驗不同資源指標的合理性。更確切來說,作者想要知道,哪一種資源指標更加準確地勾勒出大國的興衰、更加準確地預測國際沖突的贏家。

 

二、測量國家資源:使用凈指標而非總指標

 

許多學者采用總指標測量國家的資源,但是這會夸大人口豐富國家的實力,因為總指標只計算了人口多的好處,卻忽略了人口多的代價。大量人口在創造財富的同時,也在消耗財富。國家要想位居世界前列,就必須以低成本獲得高產出。國家的實力是減去成本之后的凈資源。這里的成本可以分為三類:生產成本、福利成本和安全成本。生產成本指國家為了獲得經濟和軍事產出必須投入的資源,經濟上包括消耗的原材料和產生的污染等,軍事上指為了訓練士兵和研發先進軍事技術而付出的成本。福利成本指國家用于維持人們生活的成本,如食物、醫療、社會保障和教育。安全成本指政府為了維護政權、打擊犯罪和對外防御而支付的成本。顯然,社會生產、福利和安全都消耗了各國大量資源,衡量國家實力必須去掉這些成本,因此,應該使用凈指標。

 

三、實力指標

 

作者認為,當前廣泛使用的一些測量經濟和軍事資源的指標都忽視了生產、福利和安全成本。其中最常用的指標是國內生產總值,即GDP,它紀錄了在特定時間里一個國家所生產的商品和服務的總價值。很多人認為GDP可以置換(fungible)成軍事、經濟和政治的資源,是“旗艦指標”。但很少人認識到,GDP并沒有完全去除掉成本。在生產成本方面,GDP忽視了生產效率和環境污染問題,即使是無用的支出也可以增加GDP。在福利成本方面,在GDP評價體系里,基本的食物支出和高科技產業利潤沒有區別。即使一個國家陷入馬爾薩斯陷阱,人民的生存消耗了大部分產出,它的GDP也可以很高。最后,GDP將安全支出算在經濟產出里面,而沒有減去由于國內動蕩和國際沖突產生的經濟成本。除此之外,還有“戰爭潛力”(war potential)、國家能力綜合指標(CINC)等都有類似的問題。總之,所有的總指標都是一維的(one-dimensional),它們只能測量國家擁有的資源規模,而忽視了資源利用效率問題。

為了彌補上述指標的缺點,最理想的方法是減掉成本,直接計算經濟和軍事資源的凈存量。如國家為了建造辦公園區而砍掉一片森林,那么森林的價值就應該被記在國家收支表中的損失部分。但是該方法最大的問題是,要為每個國家編制這樣的負債表將是一項龐大的工程。歷史學家保羅·貝洛赫(Paul Bairoch)曾指出:“可以將人均GDP和GDP總量結合起來估計國家實力。”隨后的研究證實,GDP總量可以體現國家經濟和軍事產出總規模,而人均GDP則反映了經濟和軍事的效率,將二者綜合起來便可以囊括凈資源的規模和利用效率這兩個重要維度。由此,作者提出,用GDP乘以人均GDP來測量國家實力。

 

四、研究設計

 

作者通過三種方法對比國際政治中總資源和凈資源的區別。


第一,作者對大國競爭案例進行檢驗。選取案例的標準是兩個大國長期競爭,且一國在總資源上占優勢,另一國在凈資源上占優勢。


第二,作者使用大量數據來評估上述指標(GDP、CINC、GDP×人均GDP)在預測國際沖突和戰爭結果時的準確性。


第三,作者用三種衡量指標復制了部分現有的國際關系模型,分別測算三種指標的樣本內適合度(In-sample goodness-of-fit)。作者認為,指標的適合度越高,就能容納更大的數據方差,因此學者應采用適合度更高的指標。

 

五、案例研究

 

根據作者的標準,自1816年以來,共有14組大國競爭持續了25年以上。作者對此進一步篩選出總資源和凈資源對比差異最大的幾組。作者通過計算每組競爭對手中一國GDP和CINC占兩國總和的比例來衡量兩國總資源的對比情況:

 

3.png

 

通過計算該國的GDP×人均GDP在兩國之和中的占比來衡量凈資源的對比情況:

 

4.png

 

上面兩個式子相減取絕對值,就可以得到某年某一競爭對手的總資源占比和凈資源占比的差額:

 

5.png

 

根據上面得到的數值對14組競爭大國進行降序排序得到下表:

 

6.png

 

由于空間限制,作者選擇了差值在20以上的幾組;又由于19世紀后半期到20世紀初,中英競爭為主導,中法競爭為從屬,冷戰期間英蘇競爭也是從屬于美蘇競爭,因此作者將這兩個時期的中法競爭組和英蘇競爭組排除掉,剩下四組作為案例研究對象。


值得注意的是,總資源和凈資源相差最大的前九組案例中,都有中國和俄羅斯(沙俄/蘇聯)的身影。這并不奇怪,因為只有中俄在過去兩百年中總資源領先世界但凈資源落后于其他大國。中俄和其他規模雖小但水平更先進的國家相互競爭的經歷,更能印證作者“凈資源決定實力”的主張。

 

(1)英國vs中國,1839-1911


從傳統指標來看,中國似乎是19世界和20世紀初的超級大國,直到19世界90年代,中國都是世界上GDP和軍隊規模第一位的國家,而第二名的位置也保持到了20世界30年代。然而在此期間,中國卻遭受到“世紀之恥”,失去許多重要領土和大部分主權。其中最重要的兩場戰爭是和英國的兩次鴉片戰爭。第一次鴉片戰爭的導火索是中國的禁煙運動,最終以中國戰敗、中英于1842年簽訂《南京條約》告終。隨后,英國不滿于既得利益,1856年,第二次鴉片戰爭爆發。中國節節敗退,先后與英法簽訂《天津條約》和《北京條約》。


顯然,在這兩次鴉片戰爭中,英國要比中國更加強大。如果從總指標來看,中國的GDP和國防預算都是英國的兩倍,中國軍隊有八十萬人,而英國只派了七千人遠征中國。但是,只有把成本計算進去,才能發現中國的軟肋。從下圖可以看出,雖然中國的GDP總量遠高于英國,但是中國有巨大的生產、福利和安全成本,這使其只能將較少的資源投入到各種糾紛和戰爭中。按照作者方法(GDP×人均GDP)比較兩國凈資源,可以看出中國遠遠落后于英國。

 

7.png

 

中國的成本具體包括以下三個方面。第一,中國的生產效率遠低于英國。與中國工人相比,英國的工人更加健康且受教育程度更高,再輔以英國先進的生產技術,他們的生產效率遠高于中國工人。第二,中國龐大的人口規模(是英國人口的13倍)造成了大量的福利成本。第三,國內動蕩大大增加了中國的安全成本。一邊是頻繁的起義和高昂的軍費,另一方面清政府又要以低稅收安撫地方長官,這使清政府陷入嚴重的財政危機。


中國看似擁有龐大的軍事資源,但生產、福利和安全成本使之幾近枯竭。中國軍隊裝備嚴重落后,戰斗力低下,而且鎮壓國內叛亂和邊防的需要消耗了大量軍事資源,這些使得中國注定失敗。

 

(2)日本-中國,1874-1945


在19世紀下半葉,日本奮發圖強,立志擺脫隔壁大清的命運,并開始向東亞大陸擴張。1894年通過《馬關條約》攫取遼東半島、臺灣和澎湖列島,以及朝鮮的宗主權,迫使中國予其通商權利,以及巨額賠款(注:共計2.3億兩白銀);隨后,日本在一戰中站在協約國一方,攫取了德國控制的山東青島,并得寸進尺,向北洋政府提出“二十一條”,雖經美國干涉,但仍然獲得其中四條,攫取了重大利益;1932年扶植偽滿洲國;1933年控制河北、熱河;1934年宣布東亞為其勢力范圍,列強不得單方面保護中國;1937年全面侵華,旋即占領大片疆土;在偷襲美國后,兵鋒受挫,最終于1945年徹底失敗。


顯然,在19世紀晚期和20世紀早期,日本比中國更加強大。但是,從傳統的標準指標上看,中國比日本擁有更多的資源,其人口,GDP和軍隊都強于日本數倍。但日本比中國更加有效率,其人口成本、福利成本和安全成本都低于中國,因此,其所能動員的凈資產遠高于中國。

 

8.png

 

中國落后于日本是多方面的。


首先,日本的工業實力,無論是勞動生產率,鋼鐵產量還是絲綢市場占有率,均遠高于中國。


其次,日本的福利成本更低。彼時的中國幾乎不能養活其人口。而日本的經濟發展速度高于人口增長率,不僅能夠養活人口,而且還有足夠余量來支撐起現代化投資。同時,中國的農業人口遠遠多于日本,而日本則有更多的產業人口。


最后,安全成本大不相同。中國的軍費開支連同支付給列強的賠款嚴重消耗了政府財政,而日本政府卻不受軍費所累,還能從中國攫取巨額賠款,足夠補償戰爭開支。同時,中國軍隊給養奇缺,裝備低劣,訓練不足,指揮無方,而日軍則是給養充足,裝備精良,訓練有素,經略有方。再者,中國軍隊需要應對動蕩不安的國內局勢,部署分散,不能全力抗擊日軍。

 

(3)德國-沙俄,1891-1917


此二者的比較有如中日比較,請看下圖:

 

9.png

 

(4)美國-蘇聯,1946-1991


二戰中蘇聯損失慘重,但是隨著軸心國崩潰,蘇聯吞并大量領土,實力得到增強。到1945年蘇聯已經是歐洲最強大的國家;50年代蘇聯被視為與美國比肩的超級大國;70年代,蘇聯在CINC、軍隊規模和核武器等多方面都領先世界。1977年,美國中央情報局蘇聯問題首席專家雷·克萊因(Ray Cline)認為蘇聯的實力是美國的兩倍,且仍在增長。


但是,從20世紀70年代到1991年,蘇聯遭受了一系列重大挫折,包括從阿富汗潰退、接受嚴苛的軍控條約、經濟被迫部分開放、失去歐洲所有加盟國和二百萬平方英里的領土,直至1991年蘇聯解體,世上僅留美國一個超級大國。

 

10.png

 

從上圖中可以看出,盡管蘇聯體量龐大,但是缺乏效率,被繁重的生產、福利和安全成本拖累。第一,上世紀七、八十年代,蘇聯經濟的表現在世界上居于末流:生產力增長為負,單位產出率持續下降,甚至是世界上第一個在和平年代預期壽命下降、嬰兒死亡率上升的工業化國家。同時期美國的高科技產業突飛猛進,蘇聯卻止步不前。第二,蘇聯社會福利成本高昂,社會救濟支出占財政收入的一半,而美國只有10%。第三,在安全成本方面,蘇聯的國防支出占據預算的40%、GDP的15%到20%,至少是美國的四倍。此外,蘇聯還要花費GDP的2%到4%來支援盟國,而美國的對外援助只占GDP的0.3%。第四,由于高昂的生產、福利和安全成本,蘇聯軍隊技術落后、管理體制僵化、士兵訓練不足、武器裝備嚴重落后,這些大大削弱了其戰斗力。最后,或許也是最重要的一點,蘇聯面臨嚴重的外部安全威脅。20世紀80年代,美國的盟友是蘇聯的六倍,人口和總資源是蘇聯陣營的三倍。蘇聯耗費大量資源來防御外敵和阻止內部分裂,而美國在這方面顯然擁有更大的余地來配置軍事能力

 

六、1816-2010年間的戰爭和爭端結果


上述的分析只包括世界上少數幾個大國,為了增強研究的可信度,作者又考察了1816-2010期間發生的所有爭端和戰爭,這些分析進一步證明實力根源于凈資源而非總資源。

在戰爭方面,為了便于確定參戰方的實力,作者把COW國際戰爭數據庫(Correlates of War’s Interstate Wars dataset)中的聯盟戰爭排除在外,只考慮純粹的雙邊戰爭。在沖突方面,作者利用COW國際軍事沖突數據庫(Correlates of War’s Militarized Interstate Dispute dataset)。由于一些沖突并沒有明確的勝負之分,作者只選取了結果明確的雙邊沖突。在收集到數據后,作者分別用GDP、CINC和GDP×人均GDP三種方法計算沖突和戰爭雙方的實力,來檢驗哪種方法對結果有更強的預測能力。


表2展示了每種指數的成功率(即在國際爭端和戰爭中,GDP、CINC或GDP×人均GDP更大的一方獲勝的概率)。結果顯示,不論是戰爭還是沖突,計算凈資源的準確率都比計算總資源的準確率要高。作者還關注到,3種指數預測戰爭結果的準確率都高于各自預測國際爭端的準確率,他認為這可能是因為爭端的規模一般比較小,不會像戰爭那樣純粹是實力的較量。

 

11.png

 

七、復制分析

 

為了驗證自己的測量國家實力的方法適用于國際關系研究的多個領域而不僅局限于沖突和戰爭,作者進行了復制分析。作者選取了2012年1月至2017年4月發表在七份政治學頂級期刊上的文章,其中24項研究為國家相對實力設置了控制變量,且數據已經公開。這些研究涉及核擴散、恐怖主義、貿易等多個領域。作者分別用CINC、GDP和GDP×人均GDP計算出相對實力作為變量,對每項研究里的主要模型進行了重復分析,并用赤池信息量準則Akaike Information Criterion (AIC)檢驗模型的適合度。AIC常用于模型選擇,其值越低,適合度便越高。檢驗出來的數據詳見本文的在線附錄。


結果顯示,24項研究中有17項,使用GDP乘以人均GDP作為指標測算出來的適合度,比使用CINC作為指標更高。在這17項當中,平均AIC差值(兩種指標測算結果的差值)是6。這意味著使用CINC的模型減少信息損失的平均概率是使用GDP乘以人均GDP的模型的0.05倍。一般來說,平均AIC差值大于2,意味著統計意義上有較為顯著的證據表明,某一模型比另一模型更加出色。根據這一標準,17項中有11項使用GDP乘以人均GDP的模型較為顯著。3項顯示兩種模型同等顯著。剩余四項顯示,使用CINC的模型更為顯著。


此外,24項研究中有11項表明,使用GDP乘以人均GDP的模型比單純使用GDP的模型更加適合。其中有8項的平均AIC差值大于或等于2。有7項表明兩種模型同等適合。另外有6項表明單純使用GDP的模型更加適合。


結果顯示,與傳統總指標相比,使用作者的凈指標可以在一系列新近的國關研究中增強模型的適合度。由于樣本較小,這還并不足以證明凈資源就能決定實力(power is a function of net rather than gross resources)。但是,本文的樣本研究結果起碼和作者提出的命題大體一致,同時還與范圍更窄的一個命題相符:和GDP或CINC相比,GDP乘以人均GDP是一個能夠更加出色地衡量相對實力的單一變量指標。

 

八、結 論

 

作者認為,測量國家實力,應該根據該國的凈資源,而不是總資源。作者提供了一種粗略但有效的指標來測量國家實力,并證明這一指標比廣泛使用的總指標更為準確。作者的這一研究結果具有兩個重要意義。


一方面,以往的大量國際關系研究都是基于有缺陷的實力概念。比如,有的研究采用CINC作為測量實力的指標,但根據這一指標,以色列將會是中東最弱小的國家。這是很荒謬的結論。如果用新的更準確的方法重新進行測量,這些研究的結論也許會發生重大變化。


另外,權力轉移理論也值得重新審視。自上世紀90年代,特別是2008年金融危機以來,“中國崛起論”就備受推崇。許多人認為,美國的實力優勢正在被削弱,中國的崛起將推動世界變成多極格局。但是,這一觀點的缺陷在于,它是基于中美兩國總資源的對比。19世紀中葉,中國的經濟和軍事規模都領先世界,但是,也就在這一時期,中國遭受了世紀之恥。如今的中國雖然得到了很大的發展,但是其要成為超級大國仍然還有很長的路要走。中國的國際負債位居世界前列,此外,中國還受到資源消耗、環境污染、產能過剩、學術造假、巨大的國內外安全壓力等問題的困擾。中國的經濟投入產出比只有美國的七分之一,而且中國周邊的19個國家里,大多對其持敵視態度。


如下圖所示,如果只看GDP或CINC,中國似乎已經是世界上最強大的國家;但是如果根據作者或聯合國、世界銀行的測量凈資源的指標,中國仍遠遠落后于美國,而且在可預見的一段時間內仍將保持如此。


12.jpg

 

最后,作者指出,大量的研究聚焦于實力的效果,卻對實力的測算著墨甚少,以至于測算不準。實力是國際政治領域的核心變量,學者們卻仍然缺少測算實力的可靠指標。補足這個缺漏刻不容緩。

 

免責聲明:本網站所轉載的文字、圖片與視頻資料版權歸原創作者所有,如果涉及侵權,請第一時間聯系本網刪除。

相關文章
無相關信息
买彩票怎么选号