【南開】《大數(shù)據(jù)導(dǎo)論》20春期末考核(標準答案)

可做奧鵬全部院校在線離線作業(yè)畢業(yè)論文QQ:3230981406 微信:aopopenfd777

發(fā)布時間:2020-09-03 11:09:06來源:admin瀏覽: 49 次

《大數(shù)據(jù)導(dǎo)論》20春期末考核-00001

試卷總分:100  得分:100

一、單選題 (共 10 道試題,共 20 分)

1.大數(shù)據(jù)的特點不包含

A.數(shù)據(jù)體量大

B.價值密度高

C.處理速度快

D.數(shù)據(jù)不統(tǒng)一

答案:D

 

2.PaaS是()的簡稱

A.軟件即服務(wù)

B.平臺即服務(wù)

C.基礎(chǔ)設(shè)施即服務(wù)

D.硬件即服務(wù)

答案:B

3.IaaS是()的簡稱

A.軟件即服務(wù)

B.平臺即服務(wù)

C.基礎(chǔ)設(shè)施即服務(wù)

D.硬件即服務(wù)

答案:C

 

4.購物籃問題是##的典型案例

A.數(shù)據(jù)變換

B.關(guān)聯(lián)規(guī)則挖掘

C.數(shù)據(jù)分類

 

5.基礎(chǔ)設(shè)施即服務(wù)的英文簡稱是

A.IaaS

B.PaaS

C.SaaS

 

6.數(shù)據(jù)清洗的方法不包括

A.缺失值處理

B.噪聲數(shù)據(jù)清除

C.一致性檢查

D.重復(fù)數(shù)據(jù)記錄處理

 

7.以下哪項不是數(shù)據(jù)可視化工具的特性()

A.實時性

B.簡單操作

C.更豐富的展現(xiàn)

D.僅需一種數(shù)據(jù)支持方式即可

 

8.下列哪個工具常用來開發(fā)移動友好地交互地圖()

A.Leaflet

B.Visual.ly

C.BPizza Pie Charts

D.Gephi

 

9.SAN是一種()

A.存儲設(shè)備

B.專為數(shù)據(jù)存儲而設(shè)計構(gòu)建的網(wǎng)絡(luò)

C.光纖交換機

D.HBA

 

10.GFS中的文件切分成()的塊進行存儲

A.32MB

B.64MB

C.128MB

D.1G

 

二、多選題 (共 10 道試題,共 20 分)

11.數(shù)據(jù)預(yù)處理的過程主要是

A.數(shù)據(jù)清洗

B.數(shù)據(jù)集成

C.數(shù)據(jù)變換

D.數(shù)據(jù)規(guī)約

 

12.大數(shù)據(jù)時代預(yù)測人類移動行為的數(shù)據(jù)特點是

A.多樣化

B.數(shù)據(jù)量大

C.維數(shù)高

D.變化快

 

13.下列屬于傳統(tǒng)統(tǒng)計學(xué)展示方法的是()

A.柱狀圖

B.餅狀圖

C.曲線圖

D.網(wǎng)絡(luò)圖

 

14.百度大數(shù)據(jù)引擎主要包含三大組件()

A.開放云

B.數(shù)據(jù)工廠

C.百度大腦。

 

15.去除噪聲使得數(shù)據(jù)光滑的技術(shù)主要有:

A.分箱

B.回歸

C.離群點分析

 

16.大數(shù)據(jù)存儲的特點與挑戰(zhàn)有()

A.容量問題

B.延遲問題

C.安全問題

D.成本問題

 

17.大數(shù)據(jù)在醫(yī)療中的應(yīng)用有()

A.流行性疾病預(yù)防

B.慢性病健康管理

C.臨床決策支持

D.醫(yī)療器械研發(fā)

 

18.醫(yī)療大數(shù)據(jù)的來源主要包括()

A.制藥企業(yè)/生命科學(xué)

B.臨床醫(yī)療/實驗室數(shù)據(jù)

C.費用報銷/利用率

D.健康管理/社交網(wǎng)絡(luò)

 

19.數(shù)據(jù)分析的類型根據(jù)數(shù)據(jù)分析深度可以分為()

A.描述性分析

B.預(yù)測性分析s

C.規(guī)則性分析

 

20.數(shù)據(jù)處理的兩種方法是##,##

A.批處理

B.流處理

C.單個處理

D.交叉處理

 

三、判斷題 (共 15 道試題,共 30 分)

21.所有關(guān)系型數(shù)據(jù)中的數(shù)據(jù)全部為結(jié)構(gòu)化數(shù)據(jù)。半結(jié)構(gòu)化數(shù)據(jù)就是介于完全結(jié)構(gòu)化數(shù)據(jù)和完全無結(jié)構(gòu)化的數(shù)據(jù)之間的數(shù)據(jù)。

 

22.關(guān)聯(lián)分析是從有噪聲的、模糊的、隨機的海量數(shù)據(jù)中,挖掘出隱藏的、事先不知道、但是有潛在關(guān)聯(lián)的信息或知識的過程。

 

23.數(shù)據(jù)的大量聚集,使得黑客一次成功的攻擊能夠獲得更多的數(shù)據(jù),無形中降低了黑客的進攻成本,增加了“收益率“。

 

24.數(shù)據(jù)隱私和安全是大數(shù)據(jù)發(fā)展面臨的挑戰(zhàn)

 

25.用戶可以感知不同屬性之間的相關(guān)性,過濾掉噪聲和不相關(guān)的軌跡,用于進一步調(diào)查有趣的案例。分析人員可以交互式地逐步優(yōu)化設(shè)置以改進結(jié)果。

 

26.在未來掘金社交數(shù)據(jù)的道路上,一方面要為用戶提供更加精準便捷的良好服務(wù),另一方面也要注重對用戶隱私的保護。只有符合用戶需求和用戶安全的商業(yè)利益,才能成為可持續(xù)的商業(yè)利益。

 

27.頻繁項集的子集是頻繁項集,非頻繁項集的超集是非頻繁項集。

 

28.Twitter作為主流社交網(wǎng)絡(luò)平臺,不僅僅是一個海量公共數(shù)據(jù)集,它還是一個帶有時間刻度的海量公共數(shù)據(jù)集——用于捕捉特定時間中(在一些情況下,也是在特定空間中)數(shù)百萬人關(guān)于所有主題事項的想法。

 

29.Spark的亮點是充分利用內(nèi)存承載工作集,而且能保證容錯。

 

30.Apriori算法掃描數(shù)據(jù)庫的次數(shù)等于最大頻繁項集的項數(shù)。

 

31.高質(zhì)量的數(shù)據(jù)是能夠滿足應(yīng)用需求的數(shù)據(jù)。

 

32.離群點檢測的任務(wù)是識別特征顯著不同于其他數(shù)據(jù)的觀測值

 

33.數(shù)據(jù)分析是大數(shù)據(jù)發(fā)展面臨的挑戰(zhàn)

 

34.百度地圖春節(jié)人口迂徙大數(shù)據(jù).在業(yè)界首次實現(xiàn)了全程、動態(tài)、即時直觀地展現(xiàn)中國春節(jié)前后人口大遷徙的軌跡與特征。

 

35.用一個函數(shù)擬合數(shù)據(jù)來光滑數(shù)據(jù)稱為回歸。

 

四、簡答題 (共 2 道試題,共 12 分)

36.簡述云計算的體系架構(gòu)分層及每層的含義。

 

37.簡述數(shù)據(jù)可視化的流程和步驟。

 

五、名詞解釋 (共 3 道試題,共 18 分)

38.聚類分析

 

39.云存儲

 

40.NoSQL

 


作業(yè)咨詢 論文咨詢
微信客服掃一掃

回到頂部