首頁>資訊 >
最新消息:錯誤鏈?zhǔn)椒磻?yīng):你看到的權(quán)威理論,可能沒有那么可靠 2022-09-14 05:39:12  來源:36氪

1

前段時間,學(xué)術(shù)界爆出一個大丑聞,《發(fā)現(xiàn)》雜志經(jīng)過調(diào)查,認(rèn)定一篇由著名神經(jīng)科學(xué)家Karen Ashe為通訊作者、于2006年發(fā)表在Nature上的文章,使用了多張經(jīng)過篡改的圖像。而這篇文章曾被引超過2300次,是阿爾茨海默癥“淀粉樣蛋白”假說領(lǐng)域的奠基性工作,全球各大公司一半的研發(fā)費用都放在這個方向上。

后果有多嚴(yán)重,還有爭議,這不是本文要討論的重點。我想說的是,在結(jié)論相對明確的自然科學(xué)界,又這么重要的奠基性文章都有問題,可想而知,在社會科學(xué)領(lǐng)域,有更多的我們深信不疑的理論,問題可能更嚴(yán)重。


(資料圖片)

特別是在心理學(xué)、經(jīng)濟(jì)學(xué)之類可以用統(tǒng)計數(shù)據(jù)和數(shù)學(xué)公式偽裝成自然科學(xué)的領(lǐng)域,那些理論、假說,常常用于營銷、服務(wù)等有經(jīng)濟(jì)利益的活動,更是值得我們警惕。

2

行為經(jīng)濟(jì)學(xué)的經(jīng)典著作《思考,快與慢》一書中,曾經(jīng)用“大數(shù)效應(yīng)”為理論依據(jù),批評很多研究成果樣本數(shù)不足,但立刻就有人指出,本書中大量引用的社會心理學(xué)的“啟發(fā)效應(yīng)”,其實驗同樣存在樣本數(shù)不足的問題。

“啟發(fā)效應(yīng)”可能是營銷學(xué)家和大眾媒體最喜歡引用的心理學(xué)研究,比如紐約大學(xué)心理學(xué)家約翰·巴赫的“熱咖啡效應(yīng)”,實驗結(jié)果宣稱,一個手里捧著一杯熱咖啡的人,會增加別人對他的信任度。

果然,“啟發(fā)效應(yīng)”的大部分實驗,最后都無法重復(fù)結(jié)果,讓全世界的銷售員浪費了大量咖啡。

甚至有很多大家耳熟能詳?shù)睦碚?,根本就不是實驗的結(jié)果,比如“啤酒與尿布”理論,說超市喜歡把啤酒放在尿布邊上,方便下班回家的年輕爸爸在買尿布時,給自己帶上一罐啤酒,超市因此可以增加啤酒的銷量。

這個理論如此之有名,很多超市都做過這種嘗試,但我們幾乎看不到哪一個超市是這么陳列商品的,只能說明效果得不到銷售數(shù)據(jù)的驗證。

事實上,最早提出這個理論的人,根本就是營銷專家,在某個課程中提到了自己曾經(jīng)看到某超市這么做,這個效應(yīng)聽上去頭頭是道,卻完全經(jīng)不起任何實驗的檢驗。

樣本數(shù)效力不夠是社會學(xué)實驗的通病,這是因為,自然科學(xué)的要素之間的獨立性比較強(qiáng),只要符合統(tǒng)計要求的樣本數(shù)就行了;但社會領(lǐng)域大部分事情之間,啤酒與尿布之間,咖啡與客戶成交之間,必然存在忽高忽低的聯(lián)系,小樣本數(shù)下,任何結(jié)論都有可能得出。

一個可靠的社會學(xué)理論,需要非常大的樣本數(shù)才有足夠效力。

比如心理學(xué)上最著名的“旁觀者效應(yīng)”,即遇到緊急情況救助時,身邊的人越多,得到救助的概率反而更小。為了證明這個效應(yīng),達(dá)利和拉丹這兩位心理學(xué)家,前后十幾年時間里,設(shè)計了各種各樣的實驗,單次試驗的樣本數(shù)也非常大,其中的電梯實驗中,助手搭乘電梯的過程中故意丟下一些硬幣或是鉛筆,計算被對方撿起來的概率,研究團(tuán)隊安排了145名助手搭乘了1497次電梯,前后共有4813個人與他們共乘一部電梯。最后才得到結(jié)論:

當(dāng)他們只與一個人搭乘電梯時,別人幫他撿起掉下的硬幣與鉛筆的概率是40%,而當(dāng)他與多個人一起搭乘電梯的時候,被幫助的概率只有20%。

即使這樣大的樣本數(shù),后來仍然有多個“旁觀者效應(yīng)”實驗宣稱得到相反的結(jié)論,所以“旁觀者效應(yīng)”的有效性也沒有那么強(qiáng)。

說到這兒,還有一個問題,包括開頭的“淀粉樣蛋白”,這些都是非常著名的實驗,事關(guān)全球幾千萬患者的健康,為什么這么低劣的造假手段,在長達(dá)16年的時間,沒有被揭露呢?

這就是學(xué)術(shù)論文的“錯誤鏈?zhǔn)椒磻?yīng)”。

3

有一天,某個學(xué)者(通常是社會科學(xué)領(lǐng)域)忽然產(chǎn)生了一個見識獨到、似乎很有道理的想法。

于是他設(shè)計了一個實驗去驗證,但因為經(jīng)費有限,或者說,社會科學(xué)領(lǐng)域太容易出想法了,平攤下來實驗經(jīng)費就有限了,他不得不縮減整個實驗的時間,并虛報實驗對象的樣本數(shù)。

非常幸運的是,他得到了驚人的顯著性統(tǒng)計效果,論文發(fā)表后,成為當(dāng)年該領(lǐng)域的重大成果——事實上,這個想法早有人嘗試,只是因為實驗效果不明顯而被擱置。

更多的研究者開始跟進(jìn)研究,但不是重復(fù)這個實驗,為了讓自己的研究更有創(chuàng)新性,他們會改進(jìn)這個實驗的某些條件,以得到進(jìn)一步的研究成果。

非常不幸的是,跟進(jìn)的研究者大部分無法重復(fù)這個結(jié)果,他們怎么辦呢?

如果實驗結(jié)果完全無效,這些研究者會將之束之高閣,趕快進(jìn)行下一項研究,而不是發(fā)表文章質(zhì)疑這個結(jié)果;

如果實驗結(jié)果有效但不明顯,很多人會懷疑是自己設(shè)計或操作上的問題,要么修改結(jié)果,要么剔除一部分他認(rèn)為不正確的結(jié)果,以增加顯著性。

于是,越來越多的新實驗,“證實”了這個假說,它也從學(xué)術(shù)領(lǐng)域進(jìn)入大眾視野。

直到有一天,某個認(rèn)死理的研究者,為了搞清楚自己實驗失敗的原因,完全重復(fù)了數(shù)遍最初的實驗……

4

總結(jié)這個“鏈?zhǔn)椒磻?yīng)”,導(dǎo)致錯誤不能被及時糾正的三個原因出自人性的弱點:

1、學(xué)者發(fā)論文壓力大,實驗必須要成功

2、習(xí)慣于修辭數(shù)據(jù),以讓結(jié)果看起來更有說服力

3、質(zhì)疑權(quán)威的風(fēng)險大,延續(xù)權(quán)威結(jié)論的收益更穩(wěn)定

所以,不能因為一個理論聽上去很有道理,有一堆數(shù)據(jù)和專家背書,就認(rèn)為它不可能出錯。

曾經(jīng)有讀者批評我寫文章,不給列出引用的參考文獻(xiàn)。

我曾經(jīng)一度也這么做過,可這讓它看起來更像是一篇學(xué)術(shù)文章,暗示結(jié)論的科學(xué)性,但我本人并不確定這一點,我沒有能力去重復(fù)那些實驗的結(jié)果,它們只是看起來有道理,所以我希望它們以某一方面的觀點而不是證據(jù)的形式呈現(xiàn)。

自媒體的文章不具有學(xué)術(shù)性,無論它的形式多么像一篇論文,它們的目的只是為了完成一篇文章,而不是一項研究。雖然有追求的作者總是盡量選擇可靠的觀點,但文章就是文章,追求的是閱讀率、傳播效果、而不是研究結(jié)果的可靠性。

所以,謹(jǐn)慎地對待你看到的任何權(quán)威文章,特別是那些看起來對你很有利的,引起你極度舒適的,并讓你產(chǎn)生共鳴的觀點。

關(guān)鍵詞: 鏈?zhǔn)椒磻?yīng) 旁觀者效應(yīng) 社會科學(xué)

相關(guān)閱讀:
熱點
圖片 圖片