需要答案請加QQ:3230981406 微信:aopopenfd777
可做奧鵬全部院校在線作業(yè)、離線作業(yè)、畢業(yè)論文
21秋學(xué)期(1709、1803、1809、1903、1909、2003、2009、2103、2109)《并行程序設(shè)計》在線作業(yè)
試卷總分:100 得分:100
一、單選題 (共 50 道試題,共 100 分)
1.兩個矩陣相乘,若矩陣規(guī)模大于cache大小,則優(yōu)化訪存的可行方法是____。
A.先將兩個矩陣讀入cache再進(jìn)行乘法
B.先轉(zhuǎn)置第一個矩陣再進(jìn)行乘法
C.先轉(zhuǎn)置第二個矩陣再進(jìn)行乘法
D.以上皆錯
答案:C
2.若SIMD并行化時遇到對齊問題,下列說法正確的是____。
A.只能使用不對齊訪存指令
B.不能進(jìn)行SIMD并行化
C.對齊開銷可能完全抵消SIMD并行收益
D.以上皆錯
答案:C
3.OpenMP不能實現(xiàn)的是____。
A.負(fù)責(zé)創(chuàng)建和管理線程
B.隱藏棧管理
C.提供同步機制
D.自動并行化
答案:D
4.MPI_Send和MPI_recv是通過____區(qū)分消息。
A.端口號
B.消息名
C.消息標(biāo)簽
D.消息哈希
答案:C
5.為了充分利用CPU內(nèi)的多條流水線,程序應(yīng)滿足____。
A.相鄰指令無依賴性
B.相鄰指令相互依賴
C.整段程序中指令無依賴性
D.整段程序中指令相互依賴
答案:A
6.使用____無法直接實現(xiàn)“主線程等待4個從線程完成任務(wù)”。
A.1個信號量
B.障礙
C.1個互斥量
D.4個互斥量
7.主線程創(chuàng)建了4個從線程,對它們執(zhí)行pthread_join,然后打印一條信息,從線程打印各自的線程號,未使用任何同步,則主線程打印的消息和從線程打印的線程號的相對順序____。
A.必然主線程前、從線程后
B.必然從線程前、主線程后
C.必然相互交織
D.各種順序皆有可能
8.對下面程序,說法正確的是 # pragma omp parallel for num_threads(thread_count) \ reduction(+:sum) for (k = 1; k <= n; k++) { sum += factor/(2*k-1); factor = -factor; }
A.破壞了數(shù)據(jù)依賴
B.未破壞數(shù)據(jù)依賴
C.取決于變量聲明
D.比臨界區(qū)方式性能差
9.以下超級計算機中,____不是SIMD架構(gòu)。
A.CDCSTAR-100
B.757
C.銀河
D.天河1號
10.在使用互斥量之前必須對其進(jìn)行____。
A.初始化
B.加鎖
C.解鎖
D.銷毀
11.一個Neon寄存器最多存放____個短整型數(shù)。
A.2
B.4
C.8
D.16
12.在使用信號量之后必須對其進(jìn)行____。
A.初始化
B.解鎖
C.減1
D.銷毀
13.n個數(shù)求和的串行程序,通過一個循環(huán)將每個數(shù)累加到全局變量sum中,其多線程版本簡單將循環(huán)范圍改變?yōu)槊總€線程負(fù)載的范圍,存在的問題是____。
A.負(fù)載不均
B.通信開銷大
C.CPU空閑等待嚴(yán)重
D.sum累加產(chǎn)生競爭條件,導(dǎo)致結(jié)果錯誤
14.用pthread_barrier_init初始化障礙,應(yīng)提供的參數(shù)不包括____。
A.障礙對象
B.障礙初值
C.障礙屬性
D.參與的線程數(shù)
15.Flynn分類法中,下面哪種體系結(jié)構(gòu)非常適合向量/矩陣計算的并行化?
A.SISD
B.SIMD
C.MISD
D.MIMD
16.SSE intrinsics _mm_add_ps命令的功能是____。
A.寄存器間單精度浮點數(shù)向量加法
B.寄存器間雙精度浮點數(shù)向量加法
C.寄存器內(nèi)單精度浮點數(shù)加法
D.寄存器內(nèi)雙精度浮點數(shù)加法
17.采用搜索分解設(shè)計15數(shù)碼問題的并行算法,不包含下面哪個步驟____。
A.串行生成一定規(guī)模的搜索樹
B.當(dāng)前每個葉結(jié)點為根的子樹搜索分配給一個處理器
C.發(fā)現(xiàn)解的處理器通知其他處理器
D.將所有處理器的結(jié)果組合成最終解
18.在用pthread_mutex_lock對互斥量進(jìn)行加鎖時,若其已上鎖,則線程進(jìn)入____狀態(tài)。
A.初始化
B.阻塞
C.繼續(xù)執(zhí)行
D.銷毀
19.對于多線程各自進(jìn)行本地運算,然后由主線程匯總結(jié)果的模式,下面說法正確的是____。
A.在同構(gòu)核心上,線程運行速度一樣,主線程無需等待,直接匯總結(jié)果即可
B.線程運行速度可能不一致,必須采用同步保證主線程匯總正確結(jié)果
C.太多本地運算,不能體現(xiàn)并行效果,不是好的模式
D.主線程匯總結(jié)果在性能上必然不如多線程并行匯總結(jié)果
20.SSE intrinsics _mm_hadd_ps命令的功能是____。
A.寄存器間單精度浮點數(shù)向量加法
B.寄存器間雙精度浮點數(shù)向量加法
C.寄存器內(nèi)單精度浮點數(shù)加法
D.寄存器內(nèi)雙精度浮點數(shù)加法
21.OpenMP程序和Pthread程序中線程獲得自身編號的方式分別是____。
A.兩者均為創(chuàng)建線程時傳遞參數(shù)
B.兩者均通過特定API
C.前者創(chuàng)建線程時傳遞參數(shù),后者通過特定API
D.前者通過特定API,后者創(chuàng)建線程時傳遞參數(shù)
22.對單精度浮點數(shù)矩陣乘法程序進(jìn)行SSE并行化,預(yù)期加速比為____。
A.等于8
B.4到8之間
C.等于4
D.小于4
23.對單精度浮點計算,MMX最高實現(xiàn)____路并行。
A.2
B.4
C.8
D.16
24.OpenMP編譯指示的作用范圍是____。
A.其后一個語句
B.其后連續(xù)語句
C.其后直到函數(shù)結(jié)束
D.整個函數(shù)
25.SIMD并行化相對于串行執(zhí)行的額外開銷不包括____。
A.數(shù)據(jù)打包/解包
B.數(shù)據(jù)傳輸
C.數(shù)據(jù)對齊
D.控制流
26.pthread_rwlock_rdlock是對讀寫鎖進(jìn)行____操作。
A.加鎖
B.解鎖
C.加讀瑣
D.加寫鎖
27.使用一個信號量實現(xiàn)“主線程等待4個從線程完成任務(wù)”,信號量初始值應(yīng)設(shè)置為____。
A.0
B.1
C.2
D.4
28.數(shù)據(jù)依賴是指必須保持兩個內(nèi)存操作的____才能保證程序結(jié)果正確。
A.大小
B.時序
C.時長
D.cache局部性
29.在條件成立時使用pthread_cond_signal____。
A.喚醒等待線程
B.解鎖互斥量
C.加鎖互斥量
D.喚醒等待線程,該線程重新加鎖互斥量
30.主線程要求從線程退出應(yīng)采用____。
A.pthread_create
B.pthread_exit
C.pthread_quit
D.pthread_cancel
31.如果運算結(jié)果要保存到獨立無關(guān)的變量,則在向量運算之后需要進(jìn)行的一個操作是____。
A.對齊
B.打包
C.解包
D.以上皆錯
32.當(dāng)前CPU性能提升已從依賴時鐘頻率提升轉(zhuǎn)為更多依賴____。
A.多核和眾核技術(shù)
B.突破物理局限
C.改善散熱
D.采用新材料
33.在使用條件變量之前必須對其進(jìn)行____。
A.初始化
B.加鎖
C.解鎖
D.銷毀
34.在SSE intrinsics程序中單精度浮點數(shù)數(shù)據(jù)類型是____。
A.__m128
B.__m128f
C.__m128d
D.__m128i
35.將t個線程的局部結(jié)果匯總,可采用遞歸分解并行進(jìn)行,即,兩兩匯總,中間結(jié)果繼續(xù)兩兩匯總,直到剩下唯一的最終結(jié)果,其時間復(fù)雜度為____。
A.Θ(1)
B.Θ(logt)
C.Θ(t)
D.Θ(tlogt)
36.對劃分輸入數(shù)據(jù)的策略,下面說法錯誤的是____。
A.當(dāng)輸出數(shù)據(jù)很少時,需劃分輸入數(shù)據(jù)
B.當(dāng)輸出數(shù)據(jù)存在依賴時,需劃分輸入數(shù)據(jù)
C.通常最后需要匯總結(jié)果
D.由于不是直接劃分輸出數(shù)據(jù),性能會很差
37.推動GPU應(yīng)用于通用高性能計算爆發(fā)式增長的開發(fā)工具是____。
A.OpenGL
B.OpenCL
C.DirectX
D.CUDA
38.兩個矩陣相乘前將第二個矩陣轉(zhuǎn)置,是使用利用數(shù)據(jù)訪問的_____達(dá)到更高的cache命中率。
A.時間局部性
B.空間局部性
C.計算局部性
D.混合局部性
39.如果運算對象是獨立無關(guān)的變量,則在向量運算之前需____。
A.將變量拷貝到連續(xù)區(qū)域
B.將變量地址拷貝到連續(xù)區(qū)域
C.將變量逐個傳輸?shù)较蛄考拇嫫?/p>
D.以上皆錯
40.對同一個問題的兩個任務(wù)依賴圖G1和G2,以下哪個條件不能表明G1優(yōu)于G2____。
A.G1頂點權(quán)重之和小于G2
B.G1平均并發(fā)度大于G2
C.G1關(guān)鍵路徑長度小于G2
D.G1頂點權(quán)重之和除以關(guān)鍵路徑長度大于G2
41.OpenMP編譯指示是以____開頭的。
A."#include"
B."#ifdef"
C."#pragam"
D."#else"
42.除了用于解決競爭條件外,互斥量還可用于____。
A.解決共享資源競爭的問題
B.解決并發(fā)度低的問題
C.解決通信開銷大的問題
D.解決負(fù)載不均的問題
43.SSE的shuffle指令的8位二進(jìn)制整數(shù)參數(shù)被劃分為4個2位二進(jìn)制整數(shù)imm8[0:3],若imm8[2]=j則表示___。
A.將第一個源寄存器的第j個元素放在目標(biāo)寄存器位置2
B.將第二個源寄存器的第j個元素放在目標(biāo)寄存器位置2
C.將第一個源寄存器的第2個元素放在目標(biāo)寄存器位置2
D.將第二個源寄存器的第2個元素放在目標(biāo)寄存器位置2
44.任務(wù)依賴圖中頂點權(quán)重之和表示____。
A.任務(wù)數(shù)
B.任務(wù)難度
C.串行執(zhí)行時間
D.并行執(zhí)行時間
45.指定線程間劃分循環(huán)策略的OpenMP子句是____。
A.shared
B.reduction
C.schedule
D.nowait
46.超立方中相鄰節(jié)點二進(jìn)制編號____。
A.至少差1位
B.至多差1位
C.恰好差1位
D.差異不固定
47.對矩陣乘法進(jìn)行多線程并行化,對矩陣采用____。
A.簡單均勻塊劃分即可保證負(fù)載均衡
B.循環(huán)劃分才能實現(xiàn)負(fù)載均衡
C.動態(tài)劃分才能實現(xiàn)負(fù)載均衡
D.隨機劃分才能實現(xiàn)負(fù)載均衡
48.下面哪種架構(gòu)最適合數(shù)據(jù)并行____。
A.SISD
B.SIMD
C.MISD
D.MIMD
49.對于搜索分解,下面哪個說法是錯誤的_____。
A.所有子樹搜索任務(wù)都必須全部完成
B.工作量可能大于串行計算
C.工作量可能小于串行計算
D.可能產(chǎn)生超線性加速比
50.靜態(tài)任務(wù)劃分相對于動態(tài)任務(wù)劃分的缺點是____。
A.可能導(dǎo)致負(fù)載不均
B.通信開銷高
C.計算復(fù)復(fù)雜度高
D.任務(wù)粒度粗