【大數據時代必備的資料擷取與分析技能!】
在資訊爆炸的時代,網路就是一個龐大的資源庫,不論是「想找出最便宜的商品價格」、「想知道競爭者的商品資訊」、「分析時下流行的趨勢」、「想了解歷史股價」、「分析球員的打擊率、得分率」、「分析點閱率最高的影片做為行銷決策」、…等等,都可以輕易取得各種數據。
雖然數據來源不是問題,但要抓取、整理、分析龐大的資料,就需要一些工具及方法才能有效率地完成。本書實際教您使用 Python 的 Beautiful Soup、Pandas、Selenium 及 Scrapy 來建立爬蟲程式,並依不同的網頁型態使用對應的工具來抓取資料。在取得和儲存資料後,教您利用 Python的Matplotlib、Pandas、SeaBorn、Bokeh,將資料以視覺化的方式呈現,讓決策者能快速理解資料的【模式】、【趨勢】和【關聯性】。
◎從網路爬蟲→資料清理→資料視覺化,有效率地完成資料的探索及呈現。
◎清楚解說 Python 各套件的使用時機
●【擷取靜態網頁資料】-CSS 選擇器+Beautiful Soup 及 lxml
●【擷取 Javascript 動態網頁資料】-Selenium
●【擷取整個網站資料】-Scrapy 框架
●【資料視覺化】-Matplotlib、Pandas、Seaborn、Bokeh
◎列舉多項實例,讓您應用所學,實際擷取資料
●用 Beautiful Soup 爬取股價、電影、圖書等資訊
●用 Selenium 爬取旅館、食譜資訊
●用 Scrapy 爬取 Tutsplus 教學文件及 PTT 看板資訊
Python:網路爬蟲與資料視覺化應用實務
- 出版社 旗標出版股份有限公司
- ISBN 9789863125624
- 分類數碼科技
- 庫存 0 件 (總店)
- 庫存 (更新中) (理工分店)
MOP $217.0