23春學(xué)期(高起本:1709-2103、專升本/高起專:1903-2103)《大數(shù)據(jù)導(dǎo)論》在線作業(yè)-00002
試卷總分:100 得分:100
一、單選題 (共 15 道試題,共 30 分)
1.DAS代表的意思是()
A.兩個(gè)異步存儲(chǔ)
B.數(shù)據(jù)歸檔軟件
C.連接一個(gè)可選的存儲(chǔ)
D.直連存儲(chǔ)
2.下列不屬于Google云計(jì)算平臺(tái)技術(shù)架構(gòu)的是()
A.并行數(shù)據(jù)處理MapReduce
B.分布式鎖Chubby
C.結(jié)構(gòu)化數(shù)據(jù)表BigTable
D.彈性云計(jì)算EC2
3.大數(shù)據(jù)的特點(diǎn)不包含
A.數(shù)據(jù)體量大
B.價(jià)值密度高
C.處理速度快
D.數(shù)據(jù)不統(tǒng)一
4.購(gòu)物籃問(wèn)題是##的典型案例
A.數(shù)據(jù)變換
B.關(guān)聯(lián)規(guī)則挖掘
C.數(shù)據(jù)分類
5.GFS中的文件切分成()的塊進(jìn)行存儲(chǔ)
A.32MB
B.64MB
C.128MB
D.1G
6.數(shù)據(jù)產(chǎn)生方式變革中數(shù)據(jù)產(chǎn)生方式是主動(dòng)的主要是來(lái)自哪個(gè)階段( )。
A.運(yùn)營(yíng)式系統(tǒng)階段
B.用戶原創(chuàng)內(nèi)容階段
C.感知式系統(tǒng)階段
7.下列不屬于商業(yè)大數(shù)據(jù)類型的是
A.傳統(tǒng)企業(yè)數(shù)據(jù)
B.機(jī)器和傳感器數(shù)據(jù)
C.社交數(shù)據(jù)
D.電子商務(wù)數(shù)據(jù)
8.數(shù)據(jù)倉(cāng)庫(kù)是隨著時(shí)間變化的,下列不正確的是()
A.數(shù)據(jù)倉(cāng)庫(kù)隨時(shí)間變化不斷增加新內(nèi)容
B.捕捉到的新數(shù)據(jù)會(huì)覆蓋原來(lái)的快照
C.數(shù)據(jù)倉(cāng)庫(kù)隨事件變化不斷刪去舊的數(shù)據(jù)內(nèi)容
D.數(shù)據(jù)倉(cāng)庫(kù)中包含大量的綜合數(shù)據(jù),這些綜合數(shù)據(jù)會(huì)隨時(shí)間的變化不斷進(jìn)行重新綜合
9.用于描述數(shù)據(jù)分散情況的是()
A.分布圖
B.箱式圖
C.餅圖
D.折線圖
10.哪個(gè)選項(xiàng)不屬于大數(shù)據(jù)4V特點(diǎn)?
A.Volume
B.Valid
C.Variety
D.Value
11.MapReduce中的Map和Reduce函數(shù)使用()進(jìn)行輸入輸出
A.key/value對(duì)
B.隨機(jī)數(shù)值
C.其他計(jì)算結(jié)果
12.數(shù)據(jù)產(chǎn)生方式變革中數(shù)據(jù)產(chǎn)生方式是被動(dòng)的主要是來(lái)自哪個(gè)階段( )。
A.運(yùn)營(yíng)式系統(tǒng)階段
B.用戶原創(chuàng)內(nèi)容階段
C.感知式系統(tǒng)階段
13.下列哪個(gè)工具常用來(lái)開發(fā)移動(dòng)友好地交互地圖()
A.Leaflet
B.Visual.ly
C.BPizza Pie Charts
D.Gephi
14.下列哪個(gè)R語(yǔ)言擴(kuò)展包可以創(chuàng)建帶有點(diǎn)和邊的網(wǎng)絡(luò)圖()
A.ggplot2
B.network
C.ggmaps
D.animation
15.SAN是一種()
A.存儲(chǔ)設(shè)備
B.專為數(shù)據(jù)存儲(chǔ)而設(shè)計(jì)構(gòu)建的網(wǎng)絡(luò)
C.光纖交換機(jī)
D.HBA
二、多選題 (共 15 道試題,共 30 分)
16.開放云()
A.價(jià)值呈現(xiàn):大數(shù)據(jù)應(yīng)用價(jià)值呈現(xiàn)和創(chuàng)新不足
B.應(yīng)用建設(shè):周期長(zhǎng)、門檻高、多冗余、體驗(yàn)差
C.組織流程:應(yīng)用跨部門,缺乏流程貫串和使能業(yè)務(wù)生產(chǎn)
D.生態(tài)建設(shè):無(wú)法有效構(gòu)建和融入新的數(shù)字生態(tài)圈
17.互連網(wǎng)上出現(xiàn)的海量信息可以劃分為三種,分別為( )
A.結(jié)構(gòu)化信息
B.非結(jié)構(gòu)化信息
C.半結(jié)構(gòu)化信息
D.特殊化信息
18.下列正確的是()
A.D3是數(shù)據(jù)驅(qū)動(dòng)文件的縮寫,是最流行的可視化庫(kù)之一,它被很多其他的表格插件所使用
B.D3也可以通過(guò)一些自定義模塊來(lái)根據(jù)需求增添需要的(非DOM)特性,并在WebWorker上運(yùn)行
C.D3采用的是Selectors API的第一級(jí)標(biāo)準(zhǔn)
D.基礎(chǔ)R已經(jīng)包含支撐包括協(xié)同圖(Coplot)、拼接圖(Mosaic Plot)和雙標(biāo)圖等多類圖形的功能。
19.大數(shù)據(jù)在教育中的應(yīng)用
A.網(wǎng)上公開課
B.慕課
C.智慧校園
D.翻轉(zhuǎn)課堂
20.大數(shù)據(jù)時(shí)代預(yù)測(cè)人類移動(dòng)行為的數(shù)據(jù)來(lái)源有
A.志愿者定位數(shù)據(jù)
B.裝有導(dǎo)航設(shè)備的出租車軌跡數(shù)據(jù)
C.手機(jī)終端定位于通訊記錄
D.社會(huì)網(wǎng)絡(luò)簽到數(shù)據(jù)
21.下列屬于傳統(tǒng)統(tǒng)計(jì)學(xué)展示方法的是()
A.柱狀圖
B.餅狀圖
C.曲線圖
D.網(wǎng)絡(luò)圖
22.##和##,它們把原數(shù)據(jù)變換或投影到較小的空間。
A.小波變換
B.中心化變換
C.主成分分析
D.對(duì)數(shù)變換
23.大數(shù)據(jù)四大特征包括( )
A.數(shù)據(jù)量大
B.數(shù)據(jù)類型繁多
C.數(shù)據(jù)價(jià)值密度相對(duì)較低
D.處理速度快,時(shí)效性要求高
24.按照數(shù)據(jù)量的大小,可將數(shù)據(jù)分析分為()
A.內(nèi)存級(jí)數(shù)據(jù)分析
B.Bl級(jí)數(shù)據(jù)分析
C.海量級(jí)數(shù)據(jù)分析
D.巨量級(jí)數(shù)據(jù)分析
25.主流分布式計(jì)算平臺(tái)有()
A.google
B.IBM
C.baidu
D.Amazon
26.KNIME(Konstanz Information Miner)是一個(gè)對(duì)用戶友好的、智能、開源的平臺(tái)。該平臺(tái)包括了##、##、##、##。
A.數(shù)據(jù)集成
B.數(shù)據(jù)處理
C.數(shù)據(jù)分析
D.數(shù)據(jù)挖掘
27.離群點(diǎn)檢測(cè)的應(yīng)用包括()等。
A.欺詐檢測(cè)
B.入侵檢測(cè)
C.故障檢測(cè)
D.疾病的不尋常模式
28.數(shù)據(jù)變換的常用方法有##,##,##,##
A.中心化變換
B.極差規(guī)格化變換
C.標(biāo)準(zhǔn)化變換
D.對(duì)數(shù)變換
29.大數(shù)據(jù)時(shí)代預(yù)測(cè)人類移動(dòng)行為的數(shù)據(jù)特點(diǎn)是
A.多樣化
B.數(shù)據(jù)量大
C.維數(shù)高
D.變化快
30.大數(shù)據(jù)帶來(lái)的挑戰(zhàn)有哪些( )。
A.會(huì)導(dǎo)致數(shù)據(jù)盲點(diǎn)
B.危及個(gè)人隱私
C.造成群體歧視
D.產(chǎn)生龐大能耗
三、判斷題 (共 20 道試題,共 40 分)
31.箱式圖用于描述數(shù)據(jù)的分散情況,主要數(shù)據(jù)節(jié)點(diǎn)包括:均值、中值、等中心值的度 量,標(biāo)準(zhǔn)偏差、方差等可變性度量。
32.交通數(shù)據(jù)涉及到交通車輛或者道路兩旁安裝的傳感器生成和手機(jī)的數(shù)據(jù)集。
33.關(guān)聯(lián)分析是從有噪聲的、模糊的、隨機(jī)的海量數(shù)據(jù)中,挖掘出隱藏的、事先不知道、但是有潛在關(guān)聯(lián)的信息或知識(shí)的過(guò)程。
34.NAS代表的意思是網(wǎng)絡(luò)附加存儲(chǔ)
35.數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)面向主題的(subject oriented)、集成的(integrate),相對(duì)穩(wěn)定的(non-volatile)、反映歷史變化(time variant)的數(shù)據(jù)集合,以用于支持管理決策過(guò)程。
36.Spark的亮點(diǎn)是充分利用內(nèi)存承載工作集,而且能保證容錯(cuò)。
37.寧家駿委員指出,大數(shù)據(jù)要與“互聯(lián)網(wǎng)+”醫(yī)療健康緊密結(jié)合起來(lái),國(guó)家明確支持“互聯(lián)網(wǎng)+”醫(yī)療、“互聯(lián)網(wǎng)+”健康。
38.利用虛擬化方法減少物理存儲(chǔ)空間的分配,最大限度提升存儲(chǔ)空間利用率。
39.內(nèi)存分析數(shù)據(jù)量比BI分析數(shù)據(jù)量大
40.數(shù)據(jù)可視化。將大型數(shù)據(jù)集中的數(shù)據(jù)通過(guò)圖形圖像方式表示,并利用數(shù)據(jù)分析和開發(fā)工具發(fā)現(xiàn)其中未知信息。
41.交通數(shù)據(jù)的來(lái)源包括車輛GPS數(shù)據(jù),人類移動(dòng)的GPS位置信息或者單位站點(diǎn)記錄,和監(jiān)視設(shè)備的視頻圖像技術(shù)記錄。
42.線性回歸涉及找出擬合兩個(gè)屬性(或變量)的“最佳”直線,使一個(gè)屬性可以用來(lái)預(yù)測(cè)另一個(gè)。
43.聚類分析(Cluster analysis)簡(jiǎn)稱聚類(Clustering),是把數(shù)據(jù)對(duì)象劃分成子集(類)的過(guò)程,每個(gè)子集稱為一個(gè)簇(Cluster)
44.用戶可以感知不同屬性之間的相關(guān)性,過(guò)濾掉噪聲和不相關(guān)的軌跡,用于進(jìn)一步調(diào)查有趣的案例。分析人員可以交互式地逐步優(yōu)化設(shè)置以改進(jìn)結(jié)果。
45.大數(shù)據(jù)技術(shù)也能幫助政府進(jìn)行支出管理,透明合理的財(cái)政支出將有利于提高公信力和監(jiān)督財(cái)政支出。
46.累加器只有驅(qū)動(dòng)程序才能讀取
47.數(shù)據(jù)挖掘方法側(cè)重于從數(shù)據(jù)驅(qū)動(dòng)的角度出發(fā)獲取模式或規(guī)律。因此,針對(duì)海量人類移動(dòng)數(shù)據(jù),數(shù)據(jù)挖掘方法可以發(fā)揮其挖掘模式或規(guī)律的長(zhǎng)處。
48.基于QQ用戶位置變化軌跡,建立模型測(cè)算遷徙規(guī)模,分析人口遷徙方向及其影響因素。
49.利用云存儲(chǔ)中的多租戶技術(shù),滿足了海量信息爆炸式增長(zhǎng)趨勢(shì),一定程度上節(jié)約企業(yè)存儲(chǔ)成本,提高效率。
50.不同類型的大數(shù)據(jù)可以揭示一個(gè)區(qū)域或城市的活動(dòng)以及人口分布狀態(tài)( )
奧鵬,國(guó)開,廣開,電大在線,各省平臺(tái),新疆一體化等平臺(tái)學(xué)習(xí)
詳情請(qǐng)咨詢QQ : 3230981406或微信:aopopenfd777