考核目的
1.了解詞云的制作過(guò)程和方法。
2.熟悉過(guò)程中用到的 pandas 操作方法。
考核內(nèi)容
本實(shí)驗(yàn)需要對(duì)電影評(píng)論數(shù)據(jù)進(jìn)行分析,這是一類(lèi)文本型數(shù)據(jù),與之前見(jiàn)到的數(shù)值型數(shù)據(jù) 有很大區(qū)別。中文分詞是中文文本處理的一個(gè)基礎(chǔ)步驟,也是中文人機(jī)自然語(yǔ)言交互的基礎(chǔ) 模塊,在進(jìn)行中文自然語(yǔ)言處理時(shí),通常需要先進(jìn)行分詞。本文選擇使用 Python 中的 jieba 模塊進(jìn)行分詞,然后導(dǎo)入停用詞表,去除停用詞(停用詞及語(yǔ)句中無(wú)意義的詞,如”的”,”了” 等)。本實(shí)驗(yàn)在接下來(lái)的步驟中進(jìn)行了詞頻統(tǒng)計(jì),然后利用詞云這一直接的方式進(jìn)行了展現(xiàn)。
考核要求
1.準(zhǔn)備格式化數(shù)據(jù)。
2.通過(guò)案例掌握 Pandas 進(jìn)行文本數(shù)據(jù)處理以及詞云的可視化展現(xiàn)方法。
實(shí)驗(yàn)報(bào)告要求
1.實(shí)驗(yàn)報(bào)告由實(shí)驗(yàn)?zāi)繕?biāo)、實(shí)驗(yàn)環(huán)境、實(shí)驗(yàn)內(nèi)容、實(shí)驗(yàn)結(jié)果、實(shí)驗(yàn)體會(huì)五個(gè)方面構(gòu)成。實(shí)驗(yàn)結(jié)果為實(shí)現(xiàn)代碼和生成的頁(yè)面截圖。
2.實(shí)驗(yàn)報(bào)告以平臺(tái)允許的格式上傳。
3.實(shí)驗(yàn)報(bào)告由輔導(dǎo)教師評(píng)閱。
奧鵬,國(guó)開(kāi),廣開(kāi),電大在線,各省平臺(tái),新疆一體化等平臺(tái)學(xué)習(xí)
詳情請(qǐng)咨詢(xún)QQ : 3230981406或微信:aopopenfd777