本書結合計算機相關專業大數據采集與分析方向課程體系、企業大數據采集與分析崗位能力模型和相關課程標準,以實踐能力培養為導向,遵循企業軟件工程標準和技術,針對Anaconda+PyCharm開發環境、requests庫、re模塊、lxml庫、BeautifulSoup庫、Selenium、Scrapy框架、文件和MySQL數據庫存儲等重要大數據的采集與分析知識,結合實際案例和應用環境進行分析和設計,并對每個重要知識單元進行詳細的實現,使讀者能夠真正掌握這些知識在實際場景中的應用。本書共有7個項目,項目1至項目6采用項目案例進行知識單元訓練,項目7用一個求職招聘網站項目貫穿大數據采集與分析核心知識,完整訓練核心知識單元在企業真實項目中的應用。本書涉及的示例和項目代碼均在Anaconda和PyCharm開發環境中運行通過。
本書適合作為“大數據采集與分析”課程的教材,也可作為對大數據采集與分析感興趣的學習者的指導用書。