宏觀破局
發表迴響

破解IQ Test的歷史,打破智力測驗的迷思

 

1. 引言

「智力測驗IQ Test」是一個用單一及等量單位去測量人們有多聰明的工具。任何工具都是思想的產物, 而思想則是時代精神和意識形態的產物。 「智力測驗」作為思想工具也不例外,它對智力的定義和使用目的,彰顯著時代的意識形態,其測量出的所謂「客觀數據」也是建基於某些主觀預設的。這些背後的想法及預設是沒法從理論的內部了解的,它們是歷史性的。本文使用歷史的縱深去了解 「智力測驗」的產生過程, 用闊廣的視野去批判謬誤的習見。 從而了解到它如何誤導了人們對智力的理解,及限制了人們潛能的拓展。

photo 2-2

維多利亞時代是一個受工業革命和演化論影響的年代

2. 時代精神

最早的智力測驗開始於維多利亞時代, 那是一個受工業革命和演化論影響的年代。 歷史學家Edward J. Larson描述:「那時代的人包括達爾文在內,他們的觀念來自一個受效用主義、個人主義、帝國主義與自由資本主義影響的世界觀..…把個人競爭描繪為經濟進步的動力。」社會達爾文主義者 史賓塞更提出「適者生存survival of the fittest」的說法,整個西方世界正在努力掙扎著擺脫農業社會的貧窮,鑑別何人為「適者」變成了當務之急。

3. 量度狂爵士Francis Galton

最早嘗試去量度智力的人是Sir Francis Galton,他是 達爾文的堂弟。他一直深信自己的家族遺傳了高智力的血統,在《物種始原》出版後十年,他寫了一本名為《遺傳天才Hereditary Genius》的書。 《物種始原》一直再版至今,但《遺傳天才》卻早已默默無聞。

他是一個量度狂,「只要可能,便用數字」是他常掛在口邊的説話。 他創造了「心理計量學psychometrics」這一語詞及學科。 他也是「優生學eugenics」的始祖,他測量智力的目標就是要將人按智力分等級。 其實在進行測量之前,他已經對人的等級有了劃分,央格魯撒克遜人名列最前,其他有色人種排其後,黑人排最後;測量只是去證明他的既有的成見而已。

Sir Francis Galton 及他的筆記本手稿

Sir Francis Galton 及他的筆記本手稿

Galton為有關人類未來繁殖的策略學說創造了一個新字「優生學」Eugenics(來自希臘文字根Well和Born)。 他認為「智力」是天生的,只有很少數人擁有這種高品質的遺傳,例如他自己和表兄達爾文,因此他深信教育和慈善事業是一種浪費。 他更推論殘病和貧窮是智力偏低所致的,他們的繁衍會「沖淡」人類中優質的遺傳,以至危害整個人類物種。為了挽救這場「危機」,他建議英國政府鼓勵優良男女結婚生育,制約智力低於標準者的生育機會。 而不願放棄生育的「劣質人」應被視作「國家的敵人」。

為了訂立進行「公眾測驗的執行和原則」,他制作了「人體測量實驗室」去量度人們身體的各部分,例如拳擊速度、呼吸力量、聽力和視覺等,因為他認為智力高的人的感觀會比一般人敏銳。

Francis Galton的人體測量實驗室及著作-遺傳天才

Francis Galton的人體測量實驗室及著作-遺傳天才

他也發明了 「相關系數Correlation coefficient」,作為找出各種數據與智力的相互關係的統計方法。 可是諷刺地,他所發明的統計工具卻證明了他所採集的數據彼此亳不相干,不能衡量人的智力。其後雖然他的得意門生 James Cattell也做了很多相關的心理測試,但最終也被研究生Clark Wissler證明該等心理測驗結果與學業表現完全沒有關係。

4. 第一個智力測驗「Binet-Simon Test」

雖然英國人在智力測驗方面失敗了,但海峽的另一邊,法國人Alfred Binet卻造出了第一個智力測驗,但他的出發點與Galton等人截然不同。 他對智力測驗的興趣源於察覺兩個女兒擁很不同的學習模式。 他也曾採用過很多Galton及Cattell的人體感官測驗模式。但發現兒童比成人的感官還要敏銳,這違反了成人智力高於兒童的想法,因此放棄了Galton的學說。***

Alfred Binet對於智力研究的出發點和用處,與Francis Galton截然不同

Alfred Binet對於智力研究的出發點和用處,與Francis Galton截然不同

與英國人不同,在 「平等、博愛、自由」 的法國大革命理想感召下,法國政府於1890年宣佈所有兒童均須上學。為了照顧當中有特殊需要的智障兒童,法國政府組成了一個研究兒童智力的委員會,Binet成為該會的主席。用了十五年研發時間,他與研究員Theodore Simon共同製作了現代第一篇智力測驗試題,稱為「Binet-Simon Test」。

研發中期,他們發現在兩組分別為「正常」和所謂「不正常」的孩子的表現當中,似有重疊現象,有時候甚至是「不正常」的孩子表現還要好。 因此他們轉移了焦點,企圖在測驗中發現孩子在什麼年齡能答復什麼樣的問題。***

測試的問題包括有視覺專注力、分辨物件、命名身體部位、重複敘述別人話語及描述事物的差異性等等。 他們認為人有一個「生理年齡Chronicle Age」及一個「心智年齡Mental Age」,正常情況下兩者是配合的。****

研究發表後,一些相關術語也同時產生,如idiots、imbeciles、morons等。但Binet認為這種量化測驗Quantitative Test相對於人類多樣性的智力有很大的限制***, 他反對用這測驗去論斷一個人的智力,他認為還需要以「質性研究Qualitative Research」去進行了解。

以下直接引用Alfred Binet對他所製作的智力測驗的想法:

“[The scale] does not permit the measure of the intelligence, because intellectual qualities are not superposable, and therefore cannot be measured as linear surfaces are measured.”

“Some recent thinkers have affirmed that an individual’s intelligence is a fixed quantity, a quantity that cannot be increased. We must protest and react against this brutal pessimism; we must try to demonstrate that it is founded on nothing.”

5. 一般智力理論「g-factor」

有關智力理論則由同時間的英國人Charles Spearman提出了「一般智力理論」General Intelligence Theory。 他師從現代心理學之父 馮特Wilhelm Wundt,同時也受到Francis Galton的啟發,採用了很多統計學的方法去研究智力。他發明了Factor Analysis作為研究不同能力相關性的工具,這些統計方法迄今也一直應用在心理計量學psychometrics之上。(筆者也曾為這科目讀到嘔泡)。

Charles Spearman, 1939

Charles Spearman, 1939

在一間鄉村小學的樣本中,他發現學生不同學科的表現當中有相關性。在測驗中需要較多思維訴求的項目如古典文學等,更能預測學生運用思想的能力,因此古典文學成績影響了法文、英文的成績。 由此推論,他相信人的心靈中有一種叫「g-factor」的東西主宰人的智力,而其下則有「特殊智力」Specific intelligence影響人的特定能力。雖然他發展的智力理論並沒有針對性的具體測量方法,但一直影響著其後的智力測驗建構直至今天。

Spearman也是一位信奉優生學的人,他說過:「我們可以…..設想從這些最低g-factor指數所構成的了解中,篩取國會議員,決定誰可以有權孕育後代。」藉著他的理論,優生論者便可以聲稱透過量度g-factor這主宰智力的因子,去實行優生計劃了。但事實上g-factor只是一個假說,並無可直接觀察到的證據可以證明它的存在。

6. 智力測驗在美國

雖然智力測驗在法國萌生了,但真正將它發揚光大的卻是大西洋彼岸的美國。將Binet-Simon Test帶回美國的,是心理學家Henry Herbert Goddard。 他最初是一位寂寂無名的學者,在美國新澤西州彎藍Vineland一所弱智兒童的訓練所任教。他曾經嘗試發展一套智力測驗,可是由於學校的設施太簡陋而沒有成功。於是他遠渡法國求教,並讀到Binet的智力測驗,他高興地把它譯成英語並帶回美國在校內測試。

經過一年的研究,他向美國醫生單位提出報告,並在American Association for Feeble-minded的會議中發表。最後,醫學組織承認了他的報告,心理學成功把心智測量的工作從醫生手上接來,他的測驗也成了學界的共通語言和測量標準。

Goddard也是一位優生學者,他在1912年出版了一本名為《卡里卡家庭:弱智遺傳研究》的書,宣揚「弱智威脅論」。他搜尋卡里卡家族六代人員的資料,發現家族產生了141名弱智患者,只有46人完全正常,其餘291也並非良民,因此他斷然認為弱智會遺傳,並成為社會的威脅。

9781440434501_p0_v1_s260x420

Henry Herbert Goddard出版《卡里卡家庭:弱智遺傳研究》宣揚「弱智威脅論」

 

他成功說服學校採用他的智力測驗去找出弱智的學童。*** 1911年新澤西政府更立法要求學校開設特別班給與智力落後的學童。 智力測驗開始盛行全國,1914年104個都市中有80個採用了這種測驗。讀者如果對歷史熟悉,便會知1914年正直第一次花世界大戰。當時的美國來了有很多非英語系的歐洲新移民,一些被當地美國人認為「不太聰明的人」極有可能因為是語言障礙而被誤會,加上貧困的環境令歧視的情況更嚴重。

7. 智力測驗的高峯

1916年史丹福大學心理學家Lewis Terman改良了Alfred Binet的智力測驗,出版了Standford-Binet Intelligence Scale。 它最大的不同之處就是在於引用了德國心理學家William Stern的「智商」概念,將心智年齡除以生理年齡再乘以一百就是他的「智力商數」(Intelligence Quotient)。***

Screen Shot 2014-12-03 at 4.45.17 pm

「IQ」一詞作為更容易被人理解的方式,開始被全面推廣起來。這個做法為智力測驗帶來空前的市場成功,人們總是喜歡接受簡單明了的東西,即使它以徧概全。Standford-Binet Intelligence Scale一直不斷被改良,至今已經是第五版了。它的應用度十分廣泛,第一次世界大戰期間,它被用來進行選取入伍軍人的測驗。 前此檢測新兵經由一對一面試,效率很低,集體智力測驗的好處就在於進行一次過大量篩選。

Lewis Terman

Lewis Terman

它也被應用到教育方面,Terman更揚言:「一個孩子的『可教度』(the limits of a child’s educability)可以從他入學第一年的智力測驗中見到端倪。」很多學校把智力測驗作為篩選分班的標準。

有了測量智力的所謂「客觀標準」,優生學者更以為可以知道人們的遺傳智力,於是智力測驗把優生學的執行推至高峰。 1924年一件名為Buck v. Bell的案件,令美國多個州依據此案例通過了 “優生絕育法”***,有紀錄可稽考的就有六萬多人因為被界定為弱智而強制絕育。 這段歷史成為了美國人揮之不去的污點。

這個紀念牌記載了Buck VS Bell一案,提醒美國人不要再犯如此不人道的錯誤

這個紀念牌記載了Buck VS Bell一案,提醒美國人不要再犯如此不人道的錯誤

8. 智力測驗再改良

雖然Terman所制作的智力測驗在市場上很成功,但還是有行家認為它有很多技術上的問題。 1939年,David Wechsler跟據Standford-Binet Intelligence Test在統計方法上作了改良。 他不再用心智年齡的概念,而是先設定100分為平均值,然後在每一點平均值以上或以下的標準差standard deviation加減15分。標準差位於平均值兩點以上為之「資優gifted」,以下為「智障retarted」。他開發的智力測驗中文版稱為「韋氏智力測驗」,英文是WAIS(Wechsler Adult Intelligence Scale),兒童版是WISC(Wechsler Intelligence Scale for Children)。現時最新的是第五版,香港心理學會也是採用這個測驗。

韋氏智力測驗另一個不同的地方是把智商分作兩種類型:語言智商Verbal IQ及操作智商Performance IQ。他對智商持一個比較開放的態度,他認為只代表一些思維能力,而並非優生學者所認為的「唯一重要或至高無上的因素」。他主張還有其他non-intellective的因素影響一個人的能力,他也嘗試測量這些其他因素,只是沒有成功而已。

現時WAIS IV已經更精細,它分為10個副測驗subtest,分別歸類為4個指數:Verbal Comprehension Index (VCI)、Perceptual Reasoning Index (PRI)、Working Memory Index (WMI)、Processing Speed Index (PSI);4個指數又整合為一個Full scale IQ。此外還有另外5個副測驗,專門用以識別一些學習障礙的問題。

韋氏智力測驗第四版的10個副測驗subtest及所分屬的4個歸類指數

韋氏智力測驗第四版的10個副測驗subtest及所分屬的4個歸類指數

9. 對智力測驗的批評

A) 智力的定義問題

智力測驗也一直受到很多批評,其中一個重要批評是:心理學家們其實沒有一個清晰和共通的智力概念。面對這些批評,Terman卻反駁道:「咬定在測量智力之前必須交代什麼是智力,完全沒有必要。…..我們能測量電流,遠早於我們了解什麼是電流。」他雖然沒有說錯,但基於智力理論上的「假說」而執行及推廣的社會政策,卻經已危害到基本人權。而且他們把智力測驗置於一個「至高無上」的地位,作為分辨善惡的標準,早已忘記它只是一個建基於主觀的假說而已,它的應用已超過科學的範疇。

美國心理學會主席Robert J. Sternberg在《智力簡史》一書中用「瞎子摸象」的譬喻指出:「人們探索智力的本質,但不能看到智力的具體,所以他們只好運用隱喻去把智力行為概念化。」 因此心理學家所謂的「測量」與一般的測量大有區別,而人們卻誤以為兩者的客觀性是一致的,這做成了極大的危險。

B) 學習因素

另外一個批評是,智力測驗不能夠準確地找出它所聲稱能測量到的天生遺傳的智力。 在美國《Atkins v. Virginia》案件中,辯方律師以被告有智力障礙為由,引用法案中保護智力低於70者可以免去死刑的權利。

當時心理學家用韋氏三版來測驗被告的智力,測驗結果為59分,本來被告可免死刑。但案件不停地多次上訴,其間再做智力測驗,第二次是64分,最後一次為76分,高於智力障礙的標準。對於這17分的增長有很多不同的解釋,有人認為那是由於多年審訊令被告獲得「學習」,提升了語言及理解能力;也有人認為是重複測驗令被告熟識了題目。不論什麼原因,這事件也反映出,就算天生遺傳的智力是不變的,智力測驗並無法排除學習因素***,進而找出所謂「天生的智力」。

C) “Flynn Effect” — 為何孫兒分數比爺高?

最致命一擊的批評是由紐西蘭政治科學家James Flynn提出的〝Flynn Effect〞, 他作了一個不同世代的智力分數研究, 採用了一個名為Raven’s Progressive Matrics的非文字智力測驗。 這測驗當中的60條問題是不用文字作答的,因此它被相信為能夠測量最純粹的智力g-factor。 但是研究發現,人們的智商每年都在上升,其中一個例子是三十年來荷蘭士兵的智商平均上升了二十點。此外,Stanford-Binet Intelligence Scale在全球表現中也出現每一世代上升九至十八分的現象。由於遺傳差異不可能全球地、一致地、短期地出現如此大的變化,我們可以相信智力測驗的分數並不能代人們天生遺傳的智力。

James Flynn指出:「 心理學家們不應再說IQ Test測量了人的智力。他們應改口說,測量的是『抽象解決問題的能力』(abstract problem-solving ability)。這個術語指出的正好是我們的無知:在IQ測驗中我們要人解決的,都是與生活脫節的問題,或者過分抽象以致不再屬於現實的世界。 解決這種問題的能力也脫離了真正解決生活問題的能力,我們通常稱之為『智慧』intelligence。除此之外,我們所知不多。」

James Flynn在TED上發表關於智力測驗的研究

James Flynn在TED上發表關於智力測驗的研究

10. 總結:客觀與數字

生物學家古爾德Stephen Jay Gould一直反對使用智力測驗作為標準檢測, 針對當時一本鼓吹優生學的書《The Bell Curve》,他寫了一本名為《The Mismeasure of Man》的著作進行反駁。 他認為科學家很多時候使用數字以表客觀,但對數字所作的詮釋卻是主觀的。人們很容易誤以為使用數字就必然代表客觀事實,有些科學家往往忘記了理論所夾雜的主觀假設可能是徧見,智力測驗的失敗正好說明了這點。

原文精闢,以下直接引用作為對智力測驗的歷史總結:

“Science is rooted in creative interpretation. Numbers suggest, constrain, and refute; they do not, by themselves, specify the content of scientific theories. Theories are built upon the interpretation of numbers, and interpreters are often trapped by their own rhetoric. They believe in their own objectivity, and fail to discern the prejudice that leads them to one interpretation among many consistent with their numbers.”

參考書目:

《智力測驗的歷史 IQ A smart history of a failed idea》- Stephen Murdoch

《了不起的演化論 Evolution: The remarkable history of a scientific theory》 – Edward J. Larson

《Intelligence a brief history》-  Anna T. Cianciolo and Robert J. Sternberg

《The Mismeasure of Man》- Stephen Jay Gould

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com 標誌

您的留言將使用 WordPress.com 帳號。 登出 /  變更 )

Google+ photo

您的留言將使用 Google+ 帳號。 登出 /  變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 /  變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 /  變更 )

連結到 %s