可做奧鵬院校所有作業(yè),畢業(yè)論文,咨詢請(qǐng)?zhí)砑観Q:3230981406 微信:aopopenfd777
《大數(shù)據(jù)導(dǎo)論》20春期末考核-00001
試卷總分:100 得分:100
一、單選題 (共 10 道試題,共 20 分)
1.大數(shù)據(jù)的特點(diǎn)不包含
A.數(shù)據(jù)體量大
B.價(jià)值密度高
C.處理速度快
D.數(shù)據(jù)不統(tǒng)一
答案:D
2.PaaS是()的簡(jiǎn)稱
A.軟件即服務(wù)
B.平臺(tái)即服務(wù)
C.基礎(chǔ)設(shè)施即服務(wù)
D.硬件即服務(wù)
答案:B
3.IaaS是()的簡(jiǎn)稱
A.軟件即服務(wù)
B.平臺(tái)即服務(wù)
C.基礎(chǔ)設(shè)施即服務(wù)
D.硬件即服務(wù)
答案:C
4.購(gòu)物籃問(wèn)題是##的典型案例
A.數(shù)據(jù)變換
B.關(guān)聯(lián)規(guī)則挖掘
C.數(shù)據(jù)分類
5.基礎(chǔ)設(shè)施即服務(wù)的英文簡(jiǎn)稱是
A.IaaS
B.PaaS
C.SaaS
6.數(shù)據(jù)清洗的方法不包括
A.缺失值處理
B.噪聲數(shù)據(jù)清除
C.一致性檢查
D.重復(fù)數(shù)據(jù)記錄處理
7.以下哪項(xiàng)不是數(shù)據(jù)可視化工具的特性()
A.實(shí)時(shí)性
B.簡(jiǎn)單操作
C.更豐富的展現(xiàn)
D.僅需一種數(shù)據(jù)支持方式即可
8.下列哪個(gè)工具常用來(lái)開發(fā)移動(dòng)友好地交互地圖()
A.Leaflet
B.Visual.ly
C.BPizza Pie Charts
D.Gephi
9.SAN是一種()
A.存儲(chǔ)設(shè)備
B.專為數(shù)據(jù)存儲(chǔ)而設(shè)計(jì)構(gòu)建的網(wǎng)絡(luò)
C.光纖交換機(jī)
D.HBA
10.GFS中的文件切分成()的塊進(jìn)行存儲(chǔ)
A.32MB
B.64MB
C.128MB
D.1G
二、多選題 (共 10 道試題,共 20 分)
11.數(shù)據(jù)預(yù)處理的過(guò)程主要是
A.數(shù)據(jù)清洗
B.數(shù)據(jù)集成
C.數(shù)據(jù)變換
D.數(shù)據(jù)規(guī)約
12.大數(shù)據(jù)時(shí)代預(yù)測(cè)人類移動(dòng)行為的數(shù)據(jù)特點(diǎn)是
A.多樣化
B.數(shù)據(jù)量大
C.維數(shù)高
D.變化快
13.下列屬于傳統(tǒng)統(tǒng)計(jì)學(xué)展示方法的是()
A.柱狀圖
B.餅狀圖
C.曲線圖
D.網(wǎng)絡(luò)圖
14.百度大數(shù)據(jù)引擎主要包含三大組件()
A.開放云
B.數(shù)據(jù)工廠
C.百度大腦。
15.去除噪聲使得數(shù)據(jù)光滑的技術(shù)主要有:
A.分箱
B.回歸
C.離群點(diǎn)分析
16.大數(shù)據(jù)存儲(chǔ)的特點(diǎn)與挑戰(zhàn)有()
A.容量問(wèn)題
B.延遲問(wèn)題
C.安全問(wèn)題
D.成本問(wèn)題
17.大數(shù)據(jù)在醫(yī)療中的應(yīng)用有()
A.流行性疾病預(yù)防
B.慢性病健康管理
C.臨床決策支持
D.醫(yī)療器械研發(fā)
18.醫(yī)療大數(shù)據(jù)的來(lái)源主要包括()
A.制藥企業(yè)/生命科學(xué)
B.臨床醫(yī)療/實(shí)驗(yàn)室數(shù)據(jù)
C.費(fèi)用報(bào)銷/利用率
D.健康管理/社交網(wǎng)絡(luò)
19.數(shù)據(jù)分析的類型根據(jù)數(shù)據(jù)分析深度可以分為()
A.描述性分析
B.預(yù)測(cè)性分析s
C.規(guī)則性分析
20.數(shù)據(jù)處理的兩種方法是##,##
A.批處理
B.流處理
C.單個(gè)處理
D.交叉處理
三、判斷題 (共 15 道試題,共 30 分)
21.所有關(guān)系型數(shù)據(jù)中的數(shù)據(jù)全部為結(jié)構(gòu)化數(shù)據(jù)。半結(jié)構(gòu)化數(shù)據(jù)就是介于完全結(jié)構(gòu)化數(shù)據(jù)和完全無(wú)結(jié)構(gòu)化的數(shù)據(jù)之間的數(shù)據(jù)。
22.關(guān)聯(lián)分析是從有噪聲的、模糊的、隨機(jī)的海量數(shù)據(jù)中,挖掘出隱藏的、事先不知道、但是有潛在關(guān)聯(lián)的信息或知識(shí)的過(guò)程。
23.數(shù)據(jù)的大量聚集,使得黑客一次成功的攻擊能夠獲得更多的數(shù)據(jù),無(wú)形中降低了黑客的進(jìn)攻成本,增加了“收益率“。
24.數(shù)據(jù)隱私和安全是大數(shù)據(jù)發(fā)展面臨的挑戰(zhàn)
25.用戶可以感知不同屬性之間的相關(guān)性,過(guò)濾掉噪聲和不相關(guān)的軌跡,用于進(jìn)一步調(diào)查有趣的案例。分析人員可以交互式地逐步優(yōu)化設(shè)置以改進(jìn)結(jié)果。
26.在未來(lái)掘金社交數(shù)據(jù)的道路上,一方面要為用戶提供更加精準(zhǔn)便捷的良好服務(wù),另一方面也要注重對(duì)用戶隱私的保護(hù)。只有符合用戶需求和用戶安全的商業(yè)利益,才能成為可持續(xù)的商業(yè)利益。
27.頻繁項(xiàng)集的子集是頻繁項(xiàng)集,非頻繁項(xiàng)集的超集是非頻繁項(xiàng)集。
28.Twitter作為主流社交網(wǎng)絡(luò)平臺(tái),不僅僅是一個(gè)海量公共數(shù)據(jù)集,它還是一個(gè)帶有時(shí)間刻度的海量公共數(shù)據(jù)集——用于捕捉特定時(shí)間中(在一些情況下,也是在特定空間中)數(shù)百萬(wàn)人關(guān)于所有主題事項(xiàng)的想法。
29.Spark的亮點(diǎn)是充分利用內(nèi)存承載工作集,而且能保證容錯(cuò)。
30.Apriori算法掃描數(shù)據(jù)庫(kù)的次數(shù)等于最大頻繁項(xiàng)集的項(xiàng)數(shù)。
31.高質(zhì)量的數(shù)據(jù)是能夠滿足應(yīng)用需求的數(shù)據(jù)。
32.離群點(diǎn)檢測(cè)的任務(wù)是識(shí)別特征顯著不同于其他數(shù)據(jù)的觀測(cè)值
33.數(shù)據(jù)分析是大數(shù)據(jù)發(fā)展面臨的挑戰(zhàn)
34.百度地圖春節(jié)人口迂徙大數(shù)據(jù).在業(yè)界首次實(shí)現(xiàn)了全程、動(dòng)態(tài)、即時(shí)直觀地展現(xiàn)中國(guó)春節(jié)前后人口大遷徙的軌跡與特征。
35.用一個(gè)函數(shù)擬合數(shù)據(jù)來(lái)光滑數(shù)據(jù)稱為回歸。
四、簡(jiǎn)答題 (共 2 道試題,共 12 分)
36.簡(jiǎn)述云計(jì)算的體系架構(gòu)分層及每層的含義。
37.簡(jiǎn)述數(shù)據(jù)可視化的流程和步驟。
五、名詞解釋 (共 3 道試題,共 18 分)
38.聚類分析
39.云存儲(chǔ)
40.NoSQL