東財(cái)《數(shù)據(jù)分析與決策》單元作業(yè)二
試卷總分:100 得分:100
一、單選題 (共 4 道試題,共 20 分)
1.兩步聚類(lèi)算法是一種( )算法。
A.分層聚類(lèi)
B.K均值聚類(lèi)
C.凝聚聚類(lèi)
D.Kohonen network
2.CARMA算法只需要對(duì)數(shù)據(jù)進(jìn)行( )次掃描就可以獲得比Apriori算法更低的支持度的結(jié)果。
A.一
B.兩
C.三
D.四
3.通常,我們期望聚類(lèi)的數(shù)量不能( )。
A.太多
B.太少
C.固定
D.太隨機(jī)
4.對(duì)于簡(jiǎn)單指數(shù)平滑法的模型,當(dāng)( )時(shí),表示模型更具有惰性。
A.α=0
B.α=1
C.α>0
D.α<0
二、多選題 (共 8 道試題,共 40 分)
5.衡量關(guān)聯(lián)規(guī)則強(qiáng)弱的指標(biāo)主要有( )。
A.支持度
B.置信度
C.相似度
D.提升度
6.決定選擇何種時(shí)間序列分析法的原則包括( )。
A.要解決的問(wèn)題
B.目的
C.時(shí)間
D.時(shí)間序列數(shù)據(jù)的特點(diǎn)
7.時(shí)間序列的特征主要有( )。
A.趨勢(shì)
B.季節(jié)性周期性變化
C.連續(xù)值
D.離群值
8.K均值聚類(lèi)算法的基本思想包括( )。
A.首先,隨機(jī)選擇K個(gè)對(duì)象,每個(gè)對(duì)象初始的代表了一個(gè)簇的均值
B.對(duì)剩余的每個(gè)對(duì)象,根據(jù)其與各個(gè)簇中心的距離,將它賦給最近的簇
C.然后重新計(jì)算每個(gè)簇的平均值
D.這個(gè)過(guò)程不斷重復(fù),直到準(zhǔn)則函數(shù)收斂
9.K均值聚類(lèi)算法的輸入包括( )。
A.聚類(lèi)個(gè)數(shù)K
B.初始中心
C.n個(gè)數(shù)據(jù)對(duì)象
D.方差
10.發(fā)現(xiàn)關(guān)聯(lián)規(guī)則的步驟是( )。
A.預(yù)選指定一個(gè)最小支持度計(jì)數(shù)閾值
B.找到所有超過(guò)這個(gè)值的項(xiàng)目集
C.從頻繁項(xiàng)目集中產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)則
D.從頻繁項(xiàng)目集中產(chǎn)生弱關(guān)聯(lián)規(guī)則
11.分層聚類(lèi)可細(xì)分為( )。
A.凝聚聚類(lèi)
B.兩步聚類(lèi)
C.分裂聚類(lèi)
D.K均值聚類(lèi)
12.考察聚類(lèi)內(nèi)的特征主要有( )。
A.標(biāo)準(zhǔn)差
B.聚類(lèi)半徑
C.SSE
D.SSB
三、判斷題 (共 8 道試題,共 40 分)
13.從數(shù)據(jù)中發(fā)現(xiàn)關(guān)聯(lián)規(guī)則的問(wèn)題可以轉(zhuǎn)變?yōu)榘l(fā)現(xiàn)頻繁項(xiàng)目集。( )
14.分層聚類(lèi)是嘗試建立分層以達(dá)到聚類(lèi)的一類(lèi)算法。( )
15.當(dāng)提升度小于1時(shí)表明其中一個(gè)項(xiàng)集的出現(xiàn)降低了另一個(gè)項(xiàng)集出現(xiàn)的可能性。( )
16.移動(dòng)平均模型描述的是自回歸部分的誤差累計(jì)。( )
17.計(jì)算聚類(lèi)內(nèi)的每個(gè)點(diǎn)至聚類(lèi)中心點(diǎn)的距離平均值,如果聚類(lèi)平均值過(guò)小,則說(shuō)明這個(gè)聚類(lèi)需要進(jìn)一步分割。( )
18.如果當(dāng)前時(shí)間點(diǎn)的值需要通過(guò)前兩個(gè)時(shí)間點(diǎn)值的回歸加上隨機(jī)誤差來(lái)計(jì)算,則稱(chēng)之為二階自回歸AR(2)。( )
19.時(shí)間序列中帶有趨勢(shì)和季節(jié)性因素都會(huì)給時(shí)間序列的分析和預(yù)測(cè)帶來(lái)麻煩。( )
20.Apriori算法使用標(biāo)準(zhǔn)的發(fā)現(xiàn)關(guān)聯(lián)規(guī)則的步驟,先發(fā)現(xiàn)數(shù)據(jù)中的頻繁項(xiàng)目集,然后從中產(chǎn)生關(guān)聯(lián)規(guī)則。( )