~亞馬遜4.4星好評,統計小白也大推的入門書~
從冰淇淋的消費情形,秒懂統計的Keyword!
大學生小愛是冰淇淋連鎖店的工讀生,並且被分配到一家即將開幕的店。
店長想趁著新開幕的氣勢衝高業績,可是卻面臨了兩個難題,那就是──
到底會有多少客人來光顧?需要請多少位工讀生呢?
小愛受店長所託,打算利用規模差不多的分店銷售統計,利用「日期」與「顧客人數」的關係,預測顧客人數大概落在200~700。
可是,這麼粗略的估計數字,讓店長忍不住抱怨一點意義都沒有。
「天氣一熱,應該就有很多人想吃冰淇淋吧!不能從最高氣溫來推測嗎!」
那麼,要如何從「最高氣溫」與「顧客人數」的關係,來預測新店的人數呢?
◆◆提升數據分析力,掌握統計觀念是關鍵◆◆
現代社會充斥大量的資料,小自學生報告、大至市場競爭力分析,我們經常需要藉由問卷調查、實驗等方式收集數據資料,接著展開分析,根據分析結果做出結論。
可以說,無論身處學校或職場、不分學生與上班族,統計學已然是現代人必備的常識。
然而,對不諳數學的人來說,有什麼管道能夠無痛學習統計學?
本書正是專為所有頭痛不已的初學者而編著,透過沉浸式的學習,懂得以統計觀念解開日常情境的難題。
Part 1高度相關,還是低度相關?
統計關鍵字►散佈圖、相關係數、離群值、無相關檢定
幸虧有最高氣溫和顧客人數的散佈圖,才能順利預測開幕當天的顧客人數。不過從散佈圖來看,感覺每筆資料分布得有點「零散」?這樣之前從最高氣溫來判斷顧客人數的做法,到底是預測準確,還是剛好瞎猜到的呢?
Part 2希望從最高與最低氣溫預測人數!
統計關鍵字►偏相關、迴歸係數、複迴歸
除了最高氣溫,店長也想知道最低氣溫會不會影響業績。小愛試著對最低氣溫與顧客人數的關係做調查,發現兩者之間「幾乎不具相關性」。可是,店長卻提問:「既然手上有最高氣溫與最低氣溫的資料,難道不能同時運用兩種資料,精準預測人數嗎?」
Part 3冰淇淋的喜好有相關性嗎?
統計關鍵字►相關矩陣、因素分析
新店開幕後,平安無事地迎來一週年,店長想趁這機會重新審視菜單,希望推出更新更有創意的口味。透過問卷調查,希望能將冰淇淋的口味偏好依「性別」、「年齡」、「家中排行」、「對草莓口味的好惡」、「對香草口為的好惡」等等,找出「獨生子女偏好牛奶口味」這類規律。可是要處理龐大的變數,又該如何運用統計方法來歸納呢?
本書為「輕鬆學超有趣的統計學」系列的下篇。
上篇介紹透過哪些統計方法,分析資料之間是否存在「顯著差異」。
下篇則聚焦統計學的另一分支,介紹「調查關係」的統計方法,找出資料之間究竟存在何種關係。
期待所有讀者,能靈活運用統計工具,提高資料判讀、找出重要資訊,培養現代人不可缺少的資訊素養能力。
本書特色
◎8則情境小劇場,融入統計學的基本用語,跟著主人翁一步步熟悉如何統計和分析。
◎完整示範Excel軟體的介面,不只掌握觀念,更懂得操作最強統計工具。
◎每個單元都有POINT重點整理與測驗練習,專欄深度講解概念,學習更有系統。
作者
向後千春
1958年出生於東京都。早稻田大學人文科學學術院教授。1989年早稻田大學文學研究科博士後期課程(心理學專業)學分取得退學,取得東京學藝大學教育學博士。專業為以心理學為基礎的教學設計(教學系統設計,Instructional Design)。
冨永敦子
1961年出生於長崎市。公立函館未來大學元學習中心教授/技術作家。2012年早稻田大學研究所人文科學研究科博士後期課程結業,取得早稻田人類科學博士學位。專業為寫作。
譯者簡介
趙鴻龍
畢業於輔仁大學統計資訊系,對日本歷史文化情有獨鍾。譯有《極簡貝氏統計學》、《圖解會計思維 商業戰略、分析必備武器》、《誰都看得懂的統計學超圖解》、《懶人最需要的高效率「極簡整理術」》等書。
目錄
▌第1章 想瞭解最高氣溫和顧客人數的關係——散佈圖與相關
1-1 調查最高氣溫與顧客人數
・有多少客人上門光顧?
・把資料輸入Excel
1-2 製作散佈圖
・雖說是粗略的圖表⋯⋯
・利用Excel製作散佈圖
1-3 散佈圖的模式
・從散佈圖觀察到的事實
・散佈圖的模式
・仔細檢視散佈圖
❖column 浴池溫度和舒適感具相關性嗎?
◉確認測驗
▌第2章 想瞭解相關的強度——相關係數
2-1 調查相關的強度
・高度相關?低度相關?
2-2 計算相關係數
・希望用數值來判斷相關性!
・計算相關係數
2-3 相關的強度
・強度的標準是什麼?
2-4 思考相關係數的意義
・相關係數介於-1到+1之間
・偏差積之和具有什麼意義?
・為什麼要用偏差積的平均除以標準差?
❖column 注意離群值!
◉確認測驗
▌第3章 那個相關係數有意義嗎?——無相關檢定
3-1 調查樣本的相關係數
・居然得分析500份問卷⋯⋯
・母體和樣本
3-2 無相關檢定
・可以認為存在相關性嗎?
・無相關檢定
・為什麼要建立虛無假設?
3-3 根據樣本數得到的臨界值
・樣本數未必總是相同
・從臨界值表格中注意到的事
❖column 顯著水準是由誰決定?
◉確認測驗
▌第4章 希望利用最高氣溫預測顧客人數——迴歸線
4-1 在散佈圖上畫線
・迅速預測上門的顧客人數
4-2 迴歸線的原理
・煩惱不已時的迴歸大作戰
・迴歸線的原理
4-3 計算迴歸線
・如何計算出這條直線
・迴歸線的計算公式
❖column 相關關係和因果關係
◉確認測驗
▌第5章 想瞭解最低氣溫和顧客人數的關係——偏相關
5-1 另一種相關
・和最低氣溫相關嗎?
5-2 偏相關
・什麼是偏的相關?
・計算偏相關係數
・偏相關係數的解釋
5-3 另一種偏相關係數
・假若排除最低氣溫的影響?
5-4 回頭檢視偏相關
・再一次從其他角度確認偏相關
❖column 透過偏相關,準確掌握相關關係
◉確認測驗
▌第6章 希望從最高和最低氣溫來預測顧客人數——複迴歸
6-1 偏迴歸係數
・不能根據兩種資料來預測顧客人數嗎?
・偏迴歸係數
6-2 用兩個變數預測的簡單線性迴歸模型
・希望只用兩個變數來預測!
・複迴歸模型的計算方式
6-3 利用複迴歸模型來計算顧客人數
・預測的顧客人數有多少?
6-4 複相關係數
・信賴度有多少?
・複迴歸模型的總結
❖column 對複迴歸分析的擴展
◉確認測驗
▌第7章 和冰淇淋的喜好有相關性嗎?——相關矩陣
7-1 整理多變量資料
・獨生子女偏好牛奶口味?
・多變量資料
7-2 整理變數
・有沒有分類的好辦法?
7-3 計算相關矩陣
・什麼是相關矩陣?
・使用函數計算相關係數
▌第8章 冰淇淋的喜好該如何分類?——因素分析
8-1 因素分析的觀念
・把冰淇淋的喜好描繪成地圖
・因素分析的觀念
8-2 特徵值
・必須使用專業軟體進行因素分析
8-3 因素負荷
・觀察影響的程度有多大
8-4 旋轉
・是什麼的共同因素?
・試著以13種冰淇淋的資料進行因素分析
8-5 簡單結構
・如何變成簡單的模式?
8-6 因素分數
・計算分數
❖column 什麼是因素分析的軸?
◉確認測驗解答範例
◎索引
序/導讀
前言
本書為《薯條每包有幾條?從漢堡店輕鬆學超有趣的統計學!》的續篇,這次的舞台將從漢堡店搬到冰淇淋店。在以漢堡店為例的前作中,我們曾介紹如何瞭解資料之間是否存在「顯著差異」的統計方法,而本書將向大家介紹資料之間究竟存在何種「關係」的統計方法。
面對艱澀難懂的統計學專業書籍,有些人總會不禁搖頭嘆息,而這本書就是為了讓這些人勇敢地跨出第一步所撰寫的入門書。如果手上握有資料,我們該如何對它進行分析,才能得出有意義的結論呢?本書的撰寫方式,就是以具體的故事來加以解說。書中針對Excel的計算過程有著詳細的描述,所以在實際計算的同時,應該也能加深理解。希望藉由這種方式,為讀者帶來助益。
本系列分別以「漢堡店」和「冰淇淋店」這兩大主題所組成,兩本書都是以網路上公開的自學教材為基礎。這套網路教材是向後千春在富山大學任職時,在研討會的學生幫助下才得以完成。其中要特別感謝松崎紀子小姐、伊豆原久美子小姐、石井成郎先生等人。另外,也要感謝為漢堡教材描繪插畫的KEN先生,以及為冰淇淋教材描繪插畫的藤森香織小姐。最後,我想對使用網路教材並給予反饋的各位讀者表達最誠摯的謝意。
2008年12月 向後千春 冨永敦子