網(wǎng)絡(luò)教育學(xué)院
《數(shù)據(jù)挖掘》課 程 大 作 業(yè)
題 目:
姓 名:
學(xué)習(xí)中心:
第一大題:講述自己在完成大作業(yè)過程中遇到的困難,解決問題的思路,以及相關(guān)感想,或者對這個(gè)項(xiàng)目的認(rèn)識(shí),或者對Python與數(shù)據(jù)挖掘的認(rèn)識(shí)等等,300-500字。
第二大題:完成下面一項(xiàng)大作業(yè)題目。
2022秋《數(shù)據(jù)挖掘》課程大作業(yè)
注意:從以下5個(gè)題目中任選其一作答。
題目一:Knn算法原理以及python實(shí)現(xiàn)
要 求:文檔用使用word撰寫即可。
主要內(nèi)容必須包括:
(1)算法介紹。
(2)算法流程。
(3)python實(shí)現(xiàn)算法以及預(yù)測。
(4)整個(gè)word文件名為 [姓名 奧鵬卡號(hào) 學(xué)習(xí)中心](如戴衛(wèi)東101410013979浙江臺(tái)州奧鵬學(xué)習(xí)中心[1]VIP )
作業(yè)提交:
大作業(yè)上交時(shí)文件名寫法為:[姓名 奧鵬卡號(hào) 學(xué)習(xí)中心](如:戴衛(wèi)東101410013979浙江臺(tái)州奧鵬學(xué)習(xí)中心[1]VIP)
以附件形式上交離線作業(yè)(附件的大小限制在10M以內(nèi)),選擇已完成的作業(yè)(注意命名),點(diǎn)提交即可。如下圖所示。
。
注意事項(xiàng):
獨(dú)立完成作業(yè),不準(zhǔn)抄襲其他人或者請人代做,如有雷同作業(yè),成績以零分計(jì)!
題目二:樸素貝葉斯算法原理以及python實(shí)現(xiàn)
要 求:文檔用使用word撰寫即可。
主要內(nèi)容必須包括:
(1)算法介紹。
(2)算法流程。
(3)python實(shí)現(xiàn)算法以及預(yù)測。
(4)整個(gè)word文件名為 [姓名 奧鵬卡號(hào) 學(xué)習(xí)中心](如戴衛(wèi)東101410013979浙江臺(tái)州奧鵬學(xué)習(xí)中心[1]VIP )
作業(yè)提交:
大作業(yè)上交時(shí)文件名寫法為:[姓名 奧鵬卡號(hào) 學(xué)習(xí)中心](如:戴衛(wèi)東101410013979浙江臺(tái)州奧鵬學(xué)習(xí)中心[1]VIP)
以附件形式上交離線作業(yè)(附件的大小限制在10M以內(nèi)),選擇已完成的作業(yè)(注意命名),點(diǎn)提交即可。如下圖所示。
。
注意事項(xiàng):
獨(dú)立完成作業(yè),不準(zhǔn)抄襲其他人或者請人代做,如有雷同作業(yè),成績以零分計(jì)!
題目三:SVM算法原理以及python實(shí)現(xiàn)
要 求:文檔用使用word撰寫即可。
主要內(nèi)容必須包括:
(1)算法介紹。
(2)算法流程。
(3)python實(shí)現(xiàn)算法以及預(yù)測。
(4)整個(gè)word文件名為 [姓名 奧鵬卡號(hào) 學(xué)習(xí)中心](如戴衛(wèi)東101410013979浙江臺(tái)州奧鵬學(xué)習(xí)中心[1]VIP )
作業(yè)提交:
大作業(yè)上交時(shí)文件名寫法為:[姓名 奧鵬卡號(hào) 學(xué)習(xí)中心](如:戴衛(wèi)東101410013979浙江臺(tái)州奧鵬學(xué)習(xí)中心[1]VIP)
以附件形式上交離線作業(yè)(附件的大小限制在10M以內(nèi)),選擇已完成的作業(yè)(注意命名),點(diǎn)提交即可。如下圖所示。
。
注意事項(xiàng):
獨(dú)立完成作業(yè),不準(zhǔn)抄襲其他人或者請人代做,如有雷同作業(yè),成績以零分計(jì)!
題目四:中華古詩詞分析
要 求:編寫程序爬取中華古詩詞網(wǎng)站
https://so.gushiwen.org/authors/上詩人的詩詞信息,至少500首詩詞,抽取詩詞信息的詩人名字、朝代、詩詞標(biāo)題、詩詞內(nèi)容存儲(chǔ)在json文件中,自選某一角度完成對詩詞的處理分析。如:
(1)杜甫、李白的詩詞用字、用詞的對比分析;
(2)唐宋代表性詩詞的用詞對比分析;
(3)使用sklearn對不同詩人的詩詞進(jìn)行訓(xùn)練,訓(xùn)練得到的模型能用于對詩詞的作者的判別。對比不同算法判別的準(zhǔn)確率。
(4)整個(gè)word文件名為 [姓名 奧鵬卡號(hào) 學(xué)習(xí)中心](如戴衛(wèi)東101410013979浙江臺(tái)州奧鵬學(xué)習(xí)中心[1]VIP )
作業(yè)提交:
大作業(yè)上交時(shí)文件名寫法為:[姓名 奧鵬卡號(hào) 學(xué)習(xí)中心](如:戴衛(wèi)東101410013979浙江臺(tái)州奧鵬學(xué)習(xí)中心[1]VIP)
以附件形式上交離線作業(yè)(附件的大小限制在10M以內(nèi)),選擇已完成的作業(yè)(注意命名),點(diǎn)提交即可。如下圖所示。
注意事項(xiàng):
獨(dú)立完成作業(yè),不準(zhǔn)抄襲其他人或者請人代做,如有雷同作業(yè),成績以零分計(jì)!
題目五:歌詞分析
要 求:自選有音樂歌詞的網(wǎng)站,編寫爬蟲程序下載不同類型的歌曲歌詞,至少3種以上類型,每種類型至少100首歌曲,抽取其中的歌曲名稱、歌曲類型、歌詞信息存儲(chǔ)在json文件中,自選某一角度對歌詞進(jìn)行處理分析。如:
(1)不同類型的歌曲用詞分析,如下圖所示(自行學(xué)習(xí)使用jieba庫和wordcloud庫的使用)。
(2)使用sklearn庫對不同類型的歌詞進(jìn)行訓(xùn)練,訓(xùn)練得到的模型能用于對歌詞類型的判別。對比不同算法判別的準(zhǔn)確率。
(3)整個(gè)word文件名為 [姓名 奧鵬卡號(hào) 學(xué)習(xí)中心](如戴衛(wèi)東101410013979浙江臺(tái)州奧鵬學(xué)習(xí)中心[1]VIP )
作業(yè)提交:
大作業(yè)上交時(shí)文件名寫法為:[姓名 奧鵬卡號(hào) 學(xué)習(xí)中心](如:戴衛(wèi)東101410013979浙江臺(tái)州奧鵬學(xué)習(xí)中心[1]VIP)
以附件形式上交離線作業(yè)(附件的大小限制在10M以內(nèi)),選擇已完成的作業(yè)(注意命名),點(diǎn)提交即可。如下圖所示。
注意事項(xiàng):
獨(dú)立完成作業(yè),不準(zhǔn)抄襲其他人或者請人代做,如有雷同作業(yè),成績以零分計(jì)!
奧鵬,國開,廣開,電大在線,各省平臺(tái),新疆一體化等平臺(tái)學(xué)習(xí)
詳情請咨詢QQ : 3230981406或微信:aopopenfd777