如何提高判斷數據的能力?
Q:公司計劃在今年推出新產品。過去,行銷團隊在預估新產品銷售量時,會習慣性地上網搜尋市場趨勢,參考產業相關產品的銷售情況,以及公司產品過去的銷售成績。
但是過去,公司曾經因為蒐集了錯誤資訊,高估市場需求,造成過多的庫存量。為了避免再出現同樣的錯誤,公司應該如何提高判斷數據的能力?
A:作家馬克吐溫(Mark Twain)曾說:「謊言有三種:謊言、該死的謊言、統計數字。」他並非否定統計學的價值,而是要提醒大眾,解讀數據的態度必須很謹慎,要常自問:「支持這個結論的數據,有符合邏輯嗎?」來降低誤判數據的風險,以及公司可能產生的損失。
在判斷數據時最基本的認知就是,沒有所謂「正確」的數據,只有經過個人合理判斷而接受的數據。例如統計學,數值只要在誤差範圍內,都能被接受。但很多人習慣追求準確數據,然後再忠誠地相信數據。
此外,一般能蒐集到的次級資料,通常都是經由他人再整理的資料,往往隱含特別的立場,因此,當你面對大量數據時,不應反射式地思考,這些數據正確與否,你真正需要判斷的,是哪些資料對公司有使用價值,且最符合目前決策的需求。
小心落入數據的陷阱
以下是一般人判斷數據時,經常會落入的陷阱:
╳樣本數量過少,出現抽樣偏差
基本上,普查是最佳方法,但是數據蒐集往往因受限於成本與時效,沒辦法做到普查。雖然不論樣本數多寡,都能運用統計方法驗證推論信效度,但是仍不能忽略樣本數這個課題。
接著,如何看待抽樣數據就很關鍵了。譬如,馬克吐溫曾感嘆自己的文字創作量遞減,從每天寫三千字,下降到每天寫一千四百字。不過,他發現兩次統計的單位不相同,被統計單位(每日VS.每小時)誤導了。年輕時,他每天能寫八到九個小時,年紀漸長,寫作時間就下降到每天四到五個小時。儘管數據顯示,總體生產力減半,但他的單位生產力卻差不多。
另外,有時抽樣調查會落入「抽樣偏差」的陷阱,也就是一直去看既有樣本的特色。過於分析現有的資料庫,有時就忘記,還有些樣本遺漏在公司的資料庫外。例如,公司想分析十年以來市場有什麼需求,但可能只會分析既有的顧客資料。這麼一來,可能無法了解新產生的需求,因為沒有分析到非公司顧客的資料。
此時,可暫時排除既有顧客的資料,觀察還沒成為公司顧客的消費群需求,就可能用新點子和新產品吸引新顧客。
╳將數據的相關性誤認為因果關係
許多事情有相關,但不一定代表前後有因果關係。最典型的例子是,抽煙可能致癌(有相關性),但抽煙的人並不一定會得肺癌(沒有因果關係)。
數據也是如此。數據間的相關性,並不代表有因果關係。即使數據的可信度高達九九%,也不能代表這是個「準確」的數字,只能說有很大的相關性。譬如,若想了解薪資和員工的認同度是否有關,統計問卷調查的結果後發現,可信度有九九%,提升薪資和拉高員工對工作的認同度,有很顯著的關連性。但這卻不代表提高薪資,就能提升員工對工作的認同度。
╳被過去經驗誤導,產生「捷思偏差」
由「捷思法」(heuristics)產生的「捷思偏差」是指,人類大腦會根據過去的經驗產生思考捷徑,覺得哪些數據就是對的,就去相信它,但事實不一定是如此。例如,人們看到售價較貴的紅酒,往往會認定那瓶酒的品質比較高;開車的人,總是會覺得旁邊的車道比較順暢。
這種思考方式,會讓人們覺得做決策很有效率,但卻可能會判斷錯誤。因此,在判斷數據時,要避免單憑過去的經驗法則,直接判定哪些數據是「正確」的。
找出對你有用的數據
面對數據需謹慎的另一個原因是,數據還能以「選擇性表述」呈現,也就是人們會根據數據的用途,而選擇如何解釋。
舉例來說,眼前有一筆資料,記載著某家咖啡廳業者的顧客數量,其中包括:上午九點到十一點,有兩個人;中午十二點到下午一點,有五十五個人。你可以說,這家咖啡店生意很好,因為中午都客滿;但你也可以說,這家咖啡店生意很不好。這兩種說法都沒有錯。因此,拿到數據後,要盡量避免直接評斷,要再三確認,它們是在什麼背景下推導出的結論。
本文未完,全文請見EMBA雜誌413期