統計學教授審訂、Excel 生手實測操作,保證一定看得懂、做得到 Excel 資料分析!
數據科學家尹相志:基於數據驅動的決策,本書不是跟你談概念,而是用 Excel 帶著你落地實現。
「資料科學家的工作日常」版主張維元:想進入商業分析但不知從何下手嗎?跟著這本書六個步驟,掌握 Excel 分析力!
機器學習、人工智慧、數位轉型這些詞彙充斥在生活中,許多企業也真正感受到資料分析的重要性跟必要性。新冠肺炎(COVID-19)疫情大流行的影響,也加速企業對於 IT 化、數位轉型的推動。身處如此時代浪潮中,想必不少讀者深感自身對於業務上資料分析的認知與操作略顯不足吧。
然而,資料分析一定要學新的程式語言?每天上班都這麼忙碌了,哪來時間?有沒有一本書輕鬆切入資料分析,又能馬上在職場商業應用派上用場呢?
這本書要告訴你:只要手邊的 Excel,你也可以用資料分析做出商業決策。即使是統計學當中較難的假設檢定,也只需要 6 個步驟,即可完成。不僅如此, Excel 還可以做到迴歸分析、數學最佳化更高段的資料分析,讓你可以在競爭分析、定價策略、營運管理、效益評估等脫穎而出。
此外,我們還要告訴讀者更根本的問題:究竟為什麼一定要作資料分析,以及該怎麼配合目標進行資料分析比較好。大數據分析當道,感覺好像很多資料就能解決問題。然而事實上,資料再多都是死的,你要會的是用資料分析講出最具吸引力的故事、拿出最有說服力的提案。
現在,是你用 Excel 活用資料分析技術,學統計用大數據說故事,擺脫複雜程式,開創薪實力。
本書特色
● 國立政治大學統計學系助理教授 周珮婷 審訂
● 適用 Excel 2021 以及 Excel 2019
● 直擊統計基本思維,拒絕滿滿數學理論,你一定看得懂
● 生手實測全書 Excel 操作步驟,你一定做得出來
● 全彩圖解資料分析,資料科學小白、沒修過統計、不曾寫過程式,你也能成為資料科學家
● 範例資料集改編自實際商業問題,免費下載,讓你資料分析很有感
● 底線標示重要觀念,粗體標示重要名詞,讓你不會迷失在資料分析的名詞大海中
● 施威銘研究室監修,小編適時提供額外補充資料,讓你的資料分析技術可以更上一層樓
好評推薦(依姓名筆劃順序排列)
數據科學家 尹相志 推薦
「資料科學家的工作日常」版主 張維元 推薦
作者
三好大悟(Miyoshi・Daigo)
畢業於慶應義塾大學理工學部。畢業後以資料科學家的身份進入到株式會社 DataMix,為客戶提供以運用統計學跟機器學習進行資料分析、開發演算法為主軸的相關顧問服務。2020 年 7 月開始於株式會社 7&I 控股執行需求預測、提升最後一哩運送(Last One Mile)效率等相關 AI 專案。除此之外,也擔任資料科學講師與相關諮詢服務。
堅田洋資(Katada・Yousuke) /監修
畢業於一橋大學商學部。2013 年 7 月前往美國舊金山大學分析學碩士課程留學。隨後於國際會計師事務所德勤擔任分析顧問,於 Shiroyagi Corporation 擔任推薦演算法開發/諮詢顧問/資料科學企業培訓/資料科學課程企劃營運。2017 年創立株式會社 DataMix,以 CEO 的身份持續帶領公司推廣培育資料科學人才為主的服務。
株式會社 DataMix
株式會社 DataMix 是以「資料科學人才培育課程」服務為主軸,廣泛涉獵商務進修、顧問諮詢服務的企業。透過運用統計學與人工智慧、機器學習等方法做到資料分析,培育更多的商業戰略設計人才。公司創立以來,已經提供了資料科學相關教學服務給大約 1,500 名以上的學員。期望藉由與資料科學領域產生連結的服務,持續為更多的企業提供強化競爭力的解決方案。
公司網址:datamix.co.jp/。
目錄
前言
第 1 章 資料分析的基本概念
1.1 先學習提問
1.2 資料分析的流程
1.3 5 種不同層級的資料應用方式
14 運用 Excel 作資料分析的案例
1.5 使用 Excel 進行資料分析的準備工作
第 2 章 透過敘述統計掌握公司基本資訊
2.1 敘述統計
2.2 正確了解「平均數」
2.3 不易受到離群值(Outlier)影響的「中位數」
2.4 使用「變異數」來表示資料距離平均數多遠
2.5 使用「標準差」來掌握資料分散程度
2.6 使用「最大值」與「最小值」來看資料範圍
2.7 一次算出所有基本敘述統計
2.8 使用樞紐分析表來觀察更細微的資料特徵
第 3 章 使用資料視覺化了解營運趨勢
3.1 為什麼要做資料視覺化
3.2 製作長條圖
3.3 製作直條圖
3.4 製作熱力圖
3.5 製作散佈圖來看 2 個變數之間的相關性
3.6 計算相關係數
3.7 計算相關矩陣
第 4 章 進行假設檢定確認差異是否顯著
41 假設檢定可以幫助我們回答更多問題
4.2 假設檢定是什麼
4.3 假設檢定中的 2 個假設
4.4 機率分佈
4.5 中央極限定理(Central Limit Theorem, CLT)
4.6 設定顯著水準(Significant Level)
4.7 計算 t 值與 p 值
4.8 運用 Excel 進行假設檢定
4.9 運用分析工具箱進行兩組獨立樣本 t 檢定
4.10 確定現象之間的相關性
第 5 章 藉由資料預處理增進資料分析效率
5.1 處理缺失值
5.2 處理標註不一致
5.3 離群值(Outlier)跟異常值的應對方式
5.4 運用虛擬變數(Dummy Variable)來處理類別變數
第 6 章 靈活運用線性迴歸模型,為公司帶來更亮眼的收益
6.1 用迴歸分析了解會影響銷售數量的因素
6.2 運用線性迴歸分析建構模型
6.3 執行迴歸分析
6.4 多元線性迴歸模型
6.5 處理離群值(Outlier)與多元共線性(Multicollinearity)
第 7 章 運用數學最佳化找最合適的營運策略
7.1 調整參數使目標最大化
7.2 運用規劃求解增益集來最佳化「商品單價」
7.3 條件受限時的最佳化
結語