國(guó)開(kāi)(北京開(kāi)放大學(xué))23春《Python程序設(shè)計(jì)》形考任務(wù)6【資料答案】

可做奧鵬全部院校在線離線作業(yè)畢業(yè)論文QQ:3230981406 微信:aopopenfd777

發(fā)布時(shí)間:2023-01-28 21:52:34來(lái)源:admin瀏覽: 0 次

考核目的

1.了解詞云的制作過(guò)程和方法。

2.熟悉過(guò)程中用到的 pandas 操作方法。

考核內(nèi)容

本實(shí)驗(yàn)需要對(duì)電影評(píng)論數(shù)據(jù)進(jìn)行分析,這是一類(lèi)文本型數(shù)據(jù),與之前見(jiàn)到的數(shù)值型數(shù)據(jù) 有很大區(qū)別。中文分詞是中文文本處理的一個(gè)基礎(chǔ)步驟,也是中文人機(jī)自然語(yǔ)言交互的基礎(chǔ) 模塊,在進(jìn)行中文自然語(yǔ)言處理時(shí),通常需要先進(jìn)行分詞。本文選擇使用 Python 中的 jieba 模塊進(jìn)行分詞,然后導(dǎo)入停用詞表,去除停用詞(停用詞及語(yǔ)句中無(wú)意義的詞,如”的”,”了” 等)。本實(shí)驗(yàn)在接下來(lái)的步驟中進(jìn)行了詞頻統(tǒng)計(jì),然后利用詞云這一直接的方式進(jìn)行了展現(xiàn)。


考核要求

1.準(zhǔn)備格式化數(shù)據(jù)。

2.通過(guò)案例掌握 Pandas 進(jìn)行文本數(shù)據(jù)處理以及詞云的可視化展現(xiàn)方法。

實(shí)驗(yàn)報(bào)告要求 

1.實(shí)驗(yàn)報(bào)告由實(shí)驗(yàn)?zāi)繕?biāo)、實(shí)驗(yàn)環(huán)境、實(shí)驗(yàn)內(nèi)容、實(shí)驗(yàn)結(jié)果、實(shí)驗(yàn)體會(huì)五個(gè)方面構(gòu)成。實(shí)驗(yàn)結(jié)果為實(shí)現(xiàn)代碼和生成的頁(yè)面截圖。

2.實(shí)驗(yàn)報(bào)告以平臺(tái)允許的格式上傳。

3.實(shí)驗(yàn)報(bào)告由輔導(dǎo)教師評(píng)閱。




奧鵬,國(guó)開(kāi),廣開(kāi),電大在線,各省平臺(tái),新疆一體化等平臺(tái)學(xué)習(xí)
詳情請(qǐng)咨詢(xún)QQ : 3230981406或微信:aopopenfd777

作業(yè)咨詢(xún) 論文咨詢(xún)
微信客服掃一掃

回到頂部