芮可企管顧問(股)公司

Expert opinion

專家觀點

2019-07-11
你弄懂心理測驗了嗎？

你弄懂心理測驗了嗎？

作者董曉光
芮可企管顧問股份有限公司總經理

心理測驗( Psychological Test )，也稱為測驗或是測評。

在HR的工作上一直扮演著重要的角色，尤其是人員的甄選與分類!

透過測驗協助HR進行招聘，調職，外派以及升遷等工作，
近幾十年來測驗更廣泛的被應用在人員的教育訓練上，協助人員自我提升與學習。

因此，心理測驗幾乎是人力資源工作當中最基本的應用工具，
但也因為許多HR仍然對測驗一知半解，造成測驗的濫用或是誤用，實為憾事。

首先我們先簡單回顧一下心理學的發展

其實科學心理學的發展至今不到150 年，初期在研究人類行為的一般性原則，企圖找出某些規律與法則，
因此研究重點在於行為的一致性，個體的差異性是被忽略的。

直到1879 年馮德 ( Wundt, Wilhelm ) 在德國萊比錫大學成立了全世界第一個心理實驗室後，
才開啟了人類個別差異的研究，而實驗心理學也影響了心理測驗的發展，尤其是實驗強調的情境控制。

我在大學時候幫學姊做的人類價值觀本性研究博士論文，
控制組就是一般民眾，實驗組就是特定對象，如僧侶，教師，警察等，企圖找出不同群體間的價值觀差異。

補充一下 :
馮德 ( Wundt, Wilhelm ) 被稱為現代心理學 (或實驗心理學) 之父。

而到了十九世紀末英國生物學家高爾頓 ( Galton, Francis ) 為了瞭解遺傳對於行為的影響，開辦了一系列的測驗活動，
包括了生理與心理的測量，開啟起了差異心理學的大門，也是用科學方法研究個別差異的第一人，更是將心理學研究量化的開始，使得心理特質能夠以量化表示，這一點其實就啟蒙了心理測驗。

接著，高爾頓 ( Galton, Francis ) 在1890年發表的「心智測驗」( Mental test ) 是心理學文獻中第一次被使用，這也可以說是心理測驗這個名詞正式誕生了。

而後接棒的卡特爾 ( Cattel, James Mckeen ) 將測驗用統計分析的方法來研究個別差異，
最終，在 1905 年由比奈 ( Binet, Afred ) 和西蒙 ( T, Simon ) 編製了世界上第一個智力測驗，
就是著名的比西量表( Binet-Simon Scale ) ，這也是全世界公認最具權威的測量智力的工具。

自此心理測驗如雨後春筍般的快速發展，測驗的內容與形式擴及到:
☑團體測驗 (如美國陸軍A式量表)
☑性向測驗 (如多元性向測驗)
☑人格測驗 (如明尼蘇達多相人格測驗)
☑標準化成就測驗 (如史丹佛成就測驗)

當然其中最與HR相關以及大家耳熟能詳的就是人格測驗 ( Personality Test ) 了!

其實我們小時候唸書做的智力測驗都是屬於團體測驗 ，大家坐在教室裡一起填寫測驗，再由輔導老師收回去進行評分。
因為像比西量表這樣的測驗是需要專業的心理學家或是教育學家來進行施測，而團體測驗是可以由一般教師進行施測的。
大家若還有印象，這些測驗的內容有填詞、語句、關聯等屬於文字測驗，也有數字、圖像、幾何等非文字測驗。

而在臨床心理上作為診斷用的，最常見的就是魏氏智力測驗 ( Wechsler Intelligence Scale, WIS )，
這也是當今世界上最具權威的智力測驗，我在醫院工作時就是使用這套測驗，
它分為兒童版與成人版，執行它必須受過相當的訓練，測驗結果的判讀也是。

如果你的智商分數是落在90~110 之間那就屬於一般人的水準，
130 以上就被定義為天才了( 天才的英文很有趣，叫Gifted，頗有上帝給你的天賦的意思)，
目前文獻裡可以查到的紀錄是228 ，一位美國女性，至於分數低於80 的在臨床上就被定義為邊緣智能不足了。

認識了心理測驗與智力測驗的起源以後，我們來看看 人格測驗 ( Personality Test ) 又是如何發展的!

心理學家將人類行為分為「智能面」與「情感面」，
認為智能不足以代表個體的全部，還有屬於情感面的人格，
當然也有心理學家認為人格應該包含智力，但在測驗術語中，
「人格測驗」所測量的就是情緒、人際關係、價值觀、態度、動機等等特質。

人格測驗 最早可以追溯到 Kraepelin 使用 自由聯想法 來測試精神病患，這是為了瞭解病患的症狀，
透過第一時間的直覺反應來分析他們的心理狀態，但也為後來的人格測驗發展奠定了基礎。

較正式的人格測驗當屬 Woodworth ，在一次世界大戰中幫美國軍方編製的 自陳式問卷 ( Self-Report Inventory )，
用來篩選不適合從軍的人，之後不論是在計分與設計上不斷的改良，
由心理學家 S. Hathaway 和 精神醫學家 J. Mckinley 二人編製了著名的 明尼蘇達多項人格量表 ( MMPI )，
自此，自陳式人格量表成為人格測驗的主流，現在我們常見的人格測驗，尤其是HR會接觸到的，全部是屬於這個取向。

另外二種人格測驗的技術取向則分別是 情境測驗( Situational Test ) 以及 投射技術( Projective Techniques ) ，

情境測驗 是安排一些任務與作業讓受測者完成，模擬一些日常生活或工作會發生的事情，藉此觀察受測者的反應，
進而描繪他的特定心理狀態，這個測驗需要一定的設備與受過訓練的人來執行，所以一般人不容易接觸到，但這項技術也引發了另一個工具 --
評量中心法 ( Assessment Centre Method ) 的研究，這也稱為 評鑑中心 或是 評價中心。

最著名的案例就是二次世界大戰德國運用在軍官的遴選上。如今 AC 是企業界普遍採用的人才甄選與發展的工具，許多HR應當都認識這項工具，
而 AC 也是我現在工作研究的重心之一，十多年來成功地協助了許許多多的企業導入評量中心的技術，使得他們在接班計劃與人才發展上有卓越的表現，這項技術以後我會再和大家來分享。

投射技術 最有名的就是 羅夏墨漬測驗 ( Rorschach Ink-Blot Test )，這是根據心理學的投射理論所設計的一種人格測驗，
讓受測者看一些模糊且對稱的墨水圖片，其中有黑白也有彩色的，以自由聯想的方式來反應這些刺激，進而投射出人格的全貌，
這項技術最困難，也只有受過訓練的臨床心理學家能夠執行，作為精神診斷之用，在精神分裂症與人格疾病的診斷上特別準確，通常都在醫院使用這項工具。

當年我在醫院工作的時候只有英文版，不知道現在是否有中文版了。我曾經遇過許多病人在施測的時候看到卡片上飛出了許多的動物或昆蟲，也遇過看完所有的卡片只有一個聯想，還遇過施測到一半想要撕掉我卡片的。

其實人格測驗的成就雖然遠遠不及智力測驗，但是自陳式量表的人格測驗卻是使用最多也最廣泛的工具，因為智力的研究已經相當成熟，而人格的研究仍然持續演進，不同的學派也對人格的理論有不同的建構，也因此人格測驗的種類也是五花八門，不同的測驗有不同的理論研究，也有不同的用途，沒有一定誰好誰壞，重要的是要懂得運用測驗的結果。

評估一個測驗大家最常問到的就是信度 ( Reliability ) 和效度 ( Validity ) 了
我的職業生涯中應該被問到這個問題超過1,000個HR了，今天我們也來聊聊這二個專有名詞!

其實信度 ( Reliability ) 就是可靠性的意思 ，指的是測驗結果的一致性與穩定性，
透過一個係數來表示，係數愈小代表測驗誤差愈大，係數愈大代表誤差愈小。

我的經驗裡面多數的人格測驗信度落在0.4~0.6，這是可以接受的範圍，當然也要看它的計算是採用複本信度，
折半信度或是庫李信度來計算，只要經過一定的統計分析，一個測驗的信度就可以信賴。
無論如何，測驗一定會有誤差，我們只要盡可能的控制好造成分數變異的因素 (例如施測方式，時間，對象，目的...等)，
就能使得個別差異增大，測驗的結果就可以適當的運用了。

效度 ( Validity ) 就是正確性的意思 ，指的是一個測驗的代表性與真確性，它也是透過一個係數來表示，
效度的分數往往要比信度低上許多，多數的人格測驗係數在0.2~0.4之間，乍看之下大家會訝異怎麼這麼低，
主要是因為效度的研究在現實上比較困難，但理解它的計算方式以後就會明白這樣已經很不錯了。

首先 效度 ( Validity ) 代表能正確的測量出我們想要測量的特質，
因此你必須有一定的理論基礎與測驗設計原則，
然後在統計上進行係數計算，考驗效度一般有三種方式:
☑內容效度
☑效標關聯效度
☑建構效度

其中 內容效度 比較像是檢查一個測驗是否具備代表性，題目設計是否有邏輯，取樣是否有代表，不是一個實徵資料。

而 建構效度 指的是測驗的編製依據某個理論基礎，結果可以代表某個心理特質，來驗證一個測驗是否可以反應出理論的假設，一般常見的測驗都會註明是基於某個理論而具備建構效度，也經常用分測驗 (一個測驗往往是由數個分測驗所組成) 效度來表示。

最後， 效標關聯效度 就需要與其他相似的測驗或是真實的行為結果進行比較與分析了，一般分為同時效度和預測效度，這一點在智力測驗容易做到但是人格測驗很難，因為編製者往往無法針對特定樣本進行長時間的研究，也無法獲得沒有被汙染的參照資料 (參照資料自己本身的效度就可能有問題)，而智力測驗很容易進行測驗結果與學業成績或是特殊才能的關聯研究，因此通常有效標關聯效度的人格測驗多為學術研究的測驗，一般坊間的測驗不容易看到。

看到這裏我們大概可以知道 信度 ( Reliability ) 和 效度 ( Validity ) 的基本原理了，用白話來說， 信度 ( Reliability ) 就是測驗是否穩定可靠， 效度 ( Validity ) 就是測驗是否有效準確。因為信度較易衡鑑，而效度不容易，因此多數的測驗對於效度的描述就會避重就輕，而這也無可厚非，實是人格測驗在研究上的複雜與侷限。

當然有一些商業目的的測驗，測驗的編製不具備嚴謹的理論基礎與統計過程，測驗結果都是一些模糊而泛泛的描述，讓每個受測者都感覺測驗結果符合自己，這種虛假的測驗被稱為 巴納姆效應 ( Barnum Effect ) ，我上課的時候常會設計這種小遊戲來整大家，每個拿到報告的人都表示很準。

接下來我們談一下比較少人關注的議題，就是測驗結果的解釋與應用 !

智力測驗傳統上以一個分數代表結果，表示出智力的高與低，當然像 魏氏智力測驗 這類臨床心理上會用到的就不是這麼單純了，它還涉及到各項分測驗與觀察紀錄的評估。

今天我想把重點放在人格測驗上，因為每個人格測驗的編製都是基於一定的理論基礎，也因此在結果解釋上也會有不同，應用上也如是。

就拿企業界常接觸的測驗來說，有 MBTI，DISC，Colors，Big5，PDP 等數十種測驗，
其基本的理論基礎都是人格的類型會影響到個體對外在的知覺與反應，因而發展出來的自我認知與人際互動，
而這些是與我們的生活與工作息息相關，因此測驗被廣泛的應用在自我成長，主管培訓與團體動力上。

測驗結果會將受測者區為為數個性格類型，透過分數的高低來反映性格類型的強弱，部分測驗會有分測驗 (組成類型的指標)，得到更細節的特質分數，進一步幫助受測者認識自己，因為測驗的理論基礎不同，因此需要接受不同的專業訓練才能夠解釋與應用這些測驗，許多的HR都受過這方面的訓練，而不同的測驗需要受不同的訓練，否則對於分數與指標對應間的關聯解釋是無法理解的，更遑論在後續應用上的正確了。

上述這些測驗我幾乎都做過了，感覺也都不錯，但很難說在工作上有甚麼真正的幫助，後面我會提到工作績效與勝任力的關係。

然而這類型的測驗需要較高的費用，較長的時間，較專業的施測者，且需要進一步的提供反饋與指導給受測者，對於人數較少的主管培訓與領導力工作坊來說是很適當的，而且成效普遍來說都不錯。

我曾經協助許多企業導入了人格測驗的工作坊，提升基層與中階主管對於自我特質的認知，對於那些不曾探索過自我內在的主管來說，有一定的啟發作用，但相對於人數較多的招募甄選來說就顯得不太適合了。

1929年 斯特朗 編製了一份職業興趣調查表，開啟了興趣與職業的研究，可說是全世界第一份與招募有關的測驗，
而最有影響力的當屬1959年提出職業興趣理論的 霍蘭德，1953年 John Holland 編製了一份職業偏好量表，
不斷的研究後更提出了「人格特質與工作環境相匹配」的理論，認為人格的類型與興趣和職業有密切的相關。

開啟了後續大量因應招募與甄選需求的人格測驗研究與開發，而這類測驗多數以霍蘭德的理論為主要基礎，
再加上其他新興理論的支持進行編製，大部分的人格理論脫不出以下大師 :

馬斯洛 ( Maslow) 的需求層次論，佛洛伊德 ( Freud) 的人格結構理論，榮格 ( Jung) 的人格意識論，
羅傑斯 ( Rogers)的自我理論，佛洛姆 ( Fromm)的社會性格論，艾瑞克森 ( Erikson)的心理社會發展論等等。

其間不乏許多學者提出了自己對於性格與職涯的理論，人格與工作績效的理論，風格與領導關係的理論等。
例如，施恩 ( Schein ) 的職業錨定測驗 ( Career Anchor )，加州人格量表 ( CPI )，霍根 ( Hogan ) 測評，
哈里森 ( Harrison ) 測評等等，數量達數百種通用於全世界的測驗。

招聘與甄選的測驗由於簡單易讀，施測快速方便，現在多採線上施測，因此大部分的HR都可以輕鬆的使用這些工具，
但是由於每個測驗的計量方式或是理論基礎都不太一樣，在使用上還是需要經過專業人員的培訓與指導，才能真正的理解測驗報告中各項指標與分數的意涵，透過不同指標的強弱組合，分布與對比，來進行受測者的人格類型與工作的匹配。

所有的測驗都有一項共通的原理，就是不是所有的指標分數愈高愈好 ，
而是某個職務應該有的特定人格組合，這一點也是許多HR的迷思。

而自陳式量表最大的詬病就是受測者容易偽裝或是亂填，
因此多數測驗都會在設計上安排社會期許的測謊題，或是反向題，
來避免這些現象，其實只要HR對於測驗的解讀是專業的，再輔以面試的技巧，就可以克服這個問題了。

當人格測驗已經普遍應用在企業界的實務後，尤其是招聘目的的測驗，相關衍生的問題與疑慮也隨之產生，
因為雖然人格特質與職務屬性具有正相關，但更多的研究顯示工作的績效表現是與勝任力 ( Competence ) 有關的。

人格的描述多為某種內在特質，且多數為二個一組的相對詞。
例如積極與消極，群體與自我，親和與冷漠，開創與守舊等等，且一群特質會組成一個類型，
例如D型或老虎型，再用這些類型去對應可能相關的職務，這樣的推演是從人格類型評估工作適合度。

而1973年哈佛大學心理學教授 David McCelland 發表了一篇「測量才能而非智力」的文章，
認為才能 ( Competence ) 才是影響工作績效的關鍵，而他所謂的才能也就是我們現在熟悉的勝任力。
他為美國政府建立的外交人員才能模型中有三種核心勝任力 : 跨文化的人際敏感性、對他人的積極期望、快速進入當地政治網絡。

這三項都不屬於人格特質的範疇，因此開展了勝任力與工作績效的研究，
其中最著名的當屬芝加哥大學心理學博士 Lyle M. Spencer 發表的績效考核 ( Competence at work ) 的書，
強調了「勝任力」就是一種潛在的個人特質，而這些特質與工作績效具有高度的因果關係，這也是著名的勝任力冰山理論。

自此，企業開始大量的採用勝任力的概念進行人才的選育用留，
而因應招聘所需的勝任力測驗也就出現了，這種測驗的編製與人格測驗剛好相反，
勝任力測驗是先進行職務的工作分析，每個測驗的編製者會事先進行他們認為重要的職務或是工作屬性的研究，
建立工作績效與勝任力的關聯性，找出具有代表性的勝任力，例如我們研究團隊開發的16項職場上最重要的勝任力，
如執行力，團隊協作，溝通，客戶導向，成就導向，創造力等等。

再依據這些不同的勝任力特性進行職務屬性歸納，因而產生某些工作相匹配的勝任力類型，
例如拓荒者，外交官，總教練，變革家等等，透過不同勝任力的強弱分布，來評估受測者是否匹配某個職務。

現在愈來愈多的企業採用勝任力測驗進行招聘，HR也多熟悉勝任力的概念，因此在測驗報表的閱讀與解釋上較能得心應手，也有更多的企業在大量使用勝任力測驗後進行自己企業內部常模的建置，透過不斷資料的擴大與後續績效的的關聯研究，描繪出高績效主管的勝任力樣貌，使得招聘與培訓的效能提高，是為人才發展的一項好工具。

我曾經協助一些企業針對培訓的成效進行評鑑，我們找出了勝任力與課程的關聯性，編製了培訓前後勝任力測驗，
一方面訓前測驗的結果用來評估各項勝任力的課程安排與設計，透過團體分數與個人分數的分析，安排適合的學習計畫，
二方面訓後的測驗結果結合實際工作表現的觀察，來考驗培訓是否有具體提升勝任力。

我也曾經協助企業建立標竿常模，透過勝任力測驗的結果蒐集，建構某個特定主管職務的常模統計，
作為將來甄選該職務的統計對照，一般我們稱之為 Talent Profiling，對於主管甄選有不錯的效果，
這種企業內特定職務的常模建立已經慢慢成為一種趨勢，許多人力資源的 AI 研究也正往這個方進行。

看到這裡相信大家都已經對心理測驗的演進與應用有了認識，每個測驗因應編製的目的不同而有不同的用途，
只要是遵循測驗編製的理論與統計要求，每個測驗都有一定的價值，而使用者弄清楚他們的使用目的更是重要，

好的測驗用在不對的地方就無法凸顯結果的意義，
而使用者不清楚測驗的原理更是會誤導了測驗的結果，
所以提醒每個從事HR工作的人，找對測驗，用對方向，看懂結果，就能充分發揮測驗的功能了。

返回上頁

Home / 關於我們 / 服務項目 / 最新消息 / 專家觀點 / 服務優勢 / 服務經驗 / 聯絡我們

評量中心 ‧ 職能卡片 ‧ 職能案例教學 ‧ 模擬情境面試 ‧ 線上管理職能評鑑 ‧ 360D⁺回饋問卷

Expert opinion 專家觀點

Expert opinion

專家觀點