本課程是 Python 爬蟲(chóng)和數(shù)據(jù)分析項(xiàng)目實(shí)戰(zhàn)課程,主要分 3 部分:

第 1 部分是 Python 爬蟲(chóng),主要使用 Urllib 3 和 BeautifulSoup 抓取天貓商城和京東商城胸罩銷(xiāo)售數(shù)據(jù),并保存到 SQLite 數(shù)據(jù)庫(kù)中;

第 2 部分是對(duì)抓取的胸罩銷(xiāo)售數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗,主要是去除空數(shù)據(jù),讓數(shù)據(jù)格式更規(guī)范;

第 3 半部分利用 Pandas 對(duì)數(shù)據(jù)進(jìn)行分析,以及使用 Matplotlib 對(duì)分析后的數(shù)據(jù)進(jìn)行可視化。

通過(guò)一系列分析,可以得到中國(guó)女性胸部尺寸(胸圍)的標(biāo)準(zhǔn)大小,想知道中國(guó)女性最標(biāo)準(zhǔn)的胸圍是多少嗎?想知道什么顏色的胸罩最暢銷(xiāo)嗎?想知道 C 罩杯以上的女性喜歡到天貓還是京東購(gòu)買(mǎi)胸罩嗎?答案盡在本課程中。

其一是Python 基礎(chǔ)入門(mén),包括環(huán)境配置、基本操作、數(shù)據(jù)類(lèi)型、語(yǔ)句和函數(shù);其二是Python 爬蟲(chóng)的構(gòu)建,包括網(wǎng)頁(yè)結(jié)構(gòu)解析、爬蟲(chóng)流程設(shè)計(jì)、代碼優(yōu)化、效率優(yōu)化、容錯(cuò)處理、反防爬蟲(chóng)、表單交互和模擬頁(yè)面點(diǎn)擊;其三是Python 數(shù)據(jù)庫(kù)應(yīng)用,包括MongoDB、MySQL 在Python中的連接與應(yīng)用;其四是數(shù)據(jù)清洗和組織,包括NumPy 數(shù)組知識(shí)、pandas 數(shù)據(jù)的讀寫(xiě)、分組變形、缺失值異常值處理、時(shí)序數(shù)據(jù)處理和正則表達(dá)式的使用;其五是綜合應(yīng)用案例,幫助讀者貫穿爬蟲(chóng)、數(shù)據(jù)清洗與組織的過(guò)程;最后是數(shù)據(jù)可視化,包括Matplotlib 和Pyecharts 兩個(gè)庫(kù)的使用,涉及餅圖、柱形圖、線(xiàn)圖、詞云圖、地圖等圖形,幫助讀者進(jìn)入可視化的殿堂。

郵箱
huangbenjincv@163.com

报价| 肥城市| 晴隆县| 龙南县| 平度市| 嘉祥县| 盐城市| 新营市| 莱阳市| 乐山市| 永登县| 娱乐| 沧源| 临西县| 福清市| 莒南县| 英山县| 凤庆县| 定边县| 丰台区| 黎城县| 乌兰察布市| 大荔县| 噶尔县| 锦屏县| 梅河口市| 郁南县| 梓潼县| 开平市| 大竹县| 金堂县| 临湘市| 大余县| 平凉市| 平武县| 灵石县| 肥乡县| 玉溪市| 西平县| 定襄县| 嵩明县|