|
资料来源:谋学网(www.mouxue.com)-[南开大学(本部)]21春学期(1709、1803、1809、1903、1909、2003、2009、2103)《并行程序设计》在线作业
* P1 k/ F( V7 L" }5 T试卷总分:100 得分:100- K8 T& C9 V# `
第1题,利用cache line一次读取多个数据字的机制优化程序访存性能,其机理是____。7 p% b" e- I" g% L+ y
A、降低了访存延迟8 v7 R9 C% H6 H2 a
B、隐藏了访存延迟- ?* ~3 G. {) l4 ]0 z2 V* R0 ]- E0 ?
C、利用了cache空间局部性
! s2 w6 ?3 x; x$ }; w; B! RD、利用了cache时间局部性$ t, {. |6 ]3 |$ [/ X- T$ Y
正确资料:
2 b! ` S+ ~' y: A4 u' @
8 r0 D* W) M! l$ Q5 k5 V) z7 k% d- ~$ R9 S
第2题,for (i=2; i10; i++) A[i] = A[i-2]+1; 此循环____数据依赖。
% f1 `2 U5 k, n; jA、存在
+ Y, L6 I* ~# A, x9 }( ]B、不存在# v9 P0 ?' k! P' @3 f
C、不确定7 | p8 ~% B" I$ R) g0 ~, R y( p
D、以上皆错4 ~- L4 F4 @' T. o% [" q" q
正确资料:8 {8 X1 G! @$ k
1 ]/ [# o- L/ `
, B: e; A6 ?9 M; K# _8 P
第3题,记并行时间为T,串行时间为T',处理器数量为p,则额外开销应如何计算?/ |' \* g) Y2 z, H/ X2 i/ b0 \; A! E5 h
A、T'-T, e( g) R+ [9 M X! z
B、T-T'
# [& R4 i o3 c6 M! gC、pT H1 P) D* Q; |9 q4 U1 [2 p
D、pT-T'- F0 ?1 r* h$ W3 V: S
正确资料:
( n. n! | p: {6 V5 [4 z' e
/ K7 W2 n. K/ {9 z2 ]' ^. `0 P
0 D: e& @' b6 i/ X m! D; k第4题,OpenMP的优点不包括____。
! w- q% W% [8 b) N. OA、从头编写并行程序很自然
0 r# |5 x* v$ g: Q0 nB、串行程序并行化简单0 |9 E; S! r* |" S) l
C、不必关心低层细节
- e6 U2 \: {% d7 F5 h, R3 cD、可移植、可扩展/ q" H. N( \; V! \- p# U7 h# T3 a9 J
正确资料:
5 P* v4 `6 Z6 v l$ j
C5 x4 U% B% c, c; N
, j. e, G0 \$ f# `2 e2 h资料来源:谋学网(www.mouxue.com),编写矩阵乘法的Neon程序,若矩阵元素为双精度浮点数,则应对矩阵乘-加计算的循环进行____路循环展开。$ w: N) h6 ?. B, ^
A、2. H/ z: A+ o/ W* V
B、4) p$ C( x0 P; d4 _
C、8
2 m) W6 d& J$ N6 n' |; t) T: bD、16
J; @9 @5 `8 I, E& Q正确资料:
6 u0 u: X. C6 N2 s
3 C, r1 j% i0 E' g' V. t& A# a7 x/ _* R9 n$ k: g9 S
第6题,两个矩阵相乘,若矩阵总规模小于cache大小,则优化访存的最佳方法是____。
/ O# t" m) d+ qA、先将两个矩阵读入cache再进行乘法8 I2 | Y4 u7 E0 Y5 |: F
B、先转置第一个矩阵再进行乘法
- A! M! Q9 N4 u" A- x1 u) y2 \, mC、先转置第二个矩阵再进行乘法
; P& u. q# E% k) v8 u* a) ND、以上皆错
/ R# ?( ]8 g" V8 {! A& S正确资料:
6 Z. u/ D& _7 g9 k' G {' w
+ N4 a- V$ p% q' @% U, g2 A
6 V: P2 d# s% c/ C4 J% l第7题,MPI不包括的通信类别是____。
, K0 y; w ^3 c$ V5 nA、点对点通信' z9 C- s. [) w* b; f7 X
B、数据传输组通信
! E J8 q' ]8 y o8 v0 LC、计算和数据传输组通信0 o5 ?9 u' j+ F1 [
D、加锁解锁通信0 ^% |9 M1 b) o9 A
正确资料:
) q* n) {( k1 i2 x n5 p$ @6 ^/ E; J
7 b& { G% ~3 ^& Z
第8题,加速比计算中串行时间应该取求解同一问题的哪个串行算法的时间____。
1 a% w, O- E x* i- q1 ]A、任意一个串行算法0 m* B n5 R0 Y y4 u# o; E
B、作为并行算法基础的那个串行算法
% k+ m# y5 V/ U; i! P$ H( qC、已知最优的串行算法
" e1 n4 k; w+ p; n6 ]7 w6 ~( qD、所有串行算法的平均时间
3 y" w/ t* I% s! N d1 J; _7 D3 P z正确资料:4 a, C( K! u. D i9 f, @% o
- G2 w4 w8 {% U# v" o; _6 s7 p. K9 c1 N% G$ u
第9题,在128位的SIMD寄存器中,我们不能保存____。, B6 A& ?- _8 T; T2 U) s2 G
A、16个8位整数% r+ L. Z4 v0 P
B、8个16位短整型
. s1 I6 s) a9 w& W6 C wC、4个32位整型
1 ~8 F' R7 I! n( F& bD、16个字符的字符串
* `( Q9 A1 F+ s9 F$ r正确资料:
% D/ P2 N! @ w3 l/ K- F* M% r0 n+ F' p, g8 v1 g9 u# {! |9 L9 h
: [. e4 s3 M2 u3 Z8 I资料来源:谋学网(www.mouxue.com),在使用互斥量之前必须对其进行____。% N3 f8 U5 c6 o( M* Z
A、初始化% s8 i3 q* g v& M% l+ C {: d! r
B、加锁
& z* Z, p1 F/ P% L- ^C、解锁
. d n# M( ^- y$ l8 Q0 }. `3 rD、销毁
# [4 w0 Y( Z- v正确资料:4 ^/ V& _8 p! h
5 F- D3 t4 M- r! o( H
9 h' {+ ?* ?9 U7 Z* n第11题,对于效率E,下面描述错误的是____。
+ y6 x4 T+ K1 [A、理想并行E=1% d K- V w# |! |- L
B、总是在0~1之间
9 M5 N' Y% p, x& |C、可能13 s8 u- s7 S' {) C7 G* P
D、可能随着处理器数量增大趋向于0
6 t! f7 t4 K. L8 I" m正确资料:
# w- m% G, x& T$ M& V: r' j
6 Q* x) Q( G: L J% W- F
0 _5 R9 P9 p D# R; A# ^资料来源:谋学网(www.mouxue.com),n个节点的线性阵列中,节点最远通信距离为____。; e9 Y: H; R+ L; Y7 n
A、1
3 ^* t1 f. X' o j+ S$ r* HB、O(logn)/ T6 e4 O. y, o @9 h) U D& @/ O
C、O(sqrt(n))
; E: B& u) D; t* |) ~D、O(n)# g' O$ \# C$ F5 R& Y
正确资料:; j* Y' ?5 u1 L9 Q' n
/ y, _2 F. T$ s( y- a
$ Q/ n x$ ~5 D5 i8 ?第13题,对矩阵每行排序的程序进行多线程并行化,对矩阵采用____。& |6 h/ ~" j3 U" J9 U! E3 C m
A、简单均匀块划分即可保证负载均衡7 `6 k8 r; h8 C5 S4 N. u1 c
B、循环划分才能实现负载均衡
# S, P0 r8 k: D) j' ? M! F- YC、动态划分才能实现负载均衡
% J/ Z% |3 O' U* u7 [- c; e" _2 \D、随机划分才能实现负载均衡8 c2 M- L# a! w, `$ \
正确资料:/ Q0 `8 P, G- i( g8 r3 w# q0 x
) h8 O* F8 @; a1 n7 K1 G) H8 o* O! r% o* Y3 {0 C% R2 }
第14题,如果运算对象是独立无关的变量,则在向量运算之前需____。6 J6 p% I& e! ^
A、将变量拷贝到连续区域
# \; T( v& n( T& ^B、将变量地址拷贝到连续区域1 E# i0 b) V. u6 A: P0 j
C、将变量逐个传输到向量寄存器$ O# B8 j. C) r! `" Z y
D、以上皆错# X# k% y9 M. {) Z7 [0 @) G9 F
正确资料:: }- e' D0 B+ ^; d( _
: ?8 M4 W0 |4 {+ W, u- l6 p
7 Z, `' B0 y. p8 Y, F资料来源:谋学网(www.mouxue.com),我国最近一次夺得全球超级计算机计算能力冠军的是____。8 W: N7 e+ d+ j+ L
A、天河1号* a+ T0 h6 |- `" G- o: y+ E3 Q
B、天河1A* W% B1 v3 ^& P1 K
C、天河2号3 V( i1 b, w# p8 |# Q7 O
D、神威.太湖之光
4 K5 D/ V- @, }正确资料:
+ g' I$ p! b) i5 W
; _1 z ~- }3 g4 t6 s |* L) S: z* A9 H
第16题,OpenMP能实现的是____。
) V/ O! Z$ Q3 _/ }# G/ c3 pA、避免数据竞争
2 y* f! E: L) ^# u: ZB、提供任务划分策略$ \ G6 n* X" | h. P# _4 n- Y/ R' m
C、确保加速
4 R/ }0 i9 a0 K$ u$ T1 S1 R7 pD、确保降低通信开销: f9 K5 R9 Y( Q* e# v' S
正确资料:
, g0 h, z! |1 c! C7 v
+ a! M9 x7 G0 i; w; c+ ~
0 P) I' z3 Y. Z1 }第17题,SIMD并行模式是将多个____运算打包并发执行。
y& `: H- ?5 @- @$ xA、不同
/ y* ^2 y5 \+ {4 ~B、相同, B+ X$ k" a/ l+ m+ d! J
C、混合
$ D; T5 m9 X! N8 T. d* TD、依赖
- K7 V* }2 D7 L/ ?6 ?" S正确资料:2 v2 \% v4 ?& `' W& l! a
5 p% `: u0 w4 l, n/ p9 s- z! {/ ?( m
7 A9 F; W g1 p2 Y) f第18题,pthread_create函数中设置一个参数为"线程函数参数"的原因是____。
x4 i3 L8 g0 {* x0 [, `6 ?A、它调用线程函数时可直接传递,性能更优
1 C. S+ }9 r" ^/ o8 V2 `4 }) n# @B、它需要预处理之后传递给线程函数+ U0 F4 _. X. V$ H! ?' m7 ~+ m- O
C、线程函数不是用户程序调用,只能采用这种方式由系统代为传递参数0 O8 X# H9 D8 U0 l
D、没有特别用意
# L& c, B" o6 T" Q+ G1 L3 h正确资料:7 C: a- r0 Q! @" U
" J* P& [' N1 ~1 M3 t( u! ]
3 q2 w! U+ Q3 S$ K3 K4 I第19题,SSE有____个专用寄存器。# c- h( [% Z( x( x# h5 }
A、4
7 c9 r# h' Y, q FB、8; L- e6 G$ N+ [2 T& c. S" d
C、16
% ^9 x/ T0 E+ JD、33
; l& A# J* c( D8 T6 q正确资料:, J8 L3 s. D8 [& F0 [1 C7 V
$ ~1 b% l2 S B# ?0 [9 ]8 ]# c. a6 }5 ?$ L
资料来源:谋学网(www.mouxue.com),全球500强超算在操作系统上越来越体现出____一家独大的趋势。6 _% }9 [! H- @ r$ b! }! N
A、Unix
' W5 U# A' _; X+ Q0 ?. H" I$ U, i6 J! IB、Windows
; |% @' @8 o! V$ l4 Y0 QC、Linux
+ U' {* I# k& N' D; iD、ios
6 G, Z/ i- @- k2 W( j: X4 X7 P正确资料:
+ O/ a- H6 h c& y
. v/ |% [3 I! ?, p% ~, v1 R: L
2 D0 r6 a! G4 V; m第21题,条件变量相对于互斥量的优点是____。
3 ~3 N: Q# s3 r% l. I* l7 u HA、是多源状态
& \2 a. g% L, {B、加锁解锁开销低
- L- S g9 R. p' hC、条件不成立时阻塞线程并自动解锁加锁0 a" m; _$ L& O: S% T) W
D、以上皆错# x4 k- J5 a A! K, {* c7 {
正确资料:8 k1 T0 }' P6 a2 i5 s1 A
5 q2 `9 [4 i4 O# k
1 y0 ?" F9 J% i9 K& b
第22题,当条件判断____时,控制流语句SIMD并行化可能达到较好效果。1 c( Y$ Q( Y9 a. w8 @
A、绝大部分结果为真
d: L( V. u" R: lB、绝大部分结果为假3 y7 X: g& n. B
C、全部结果都一样
4 ?" K% C. ~* A! F3 o3 O/ L& cD、绝大部分结果都一样! f) z" i- S7 {5 o& }
正确资料: b* j: i2 f2 Y: L- \+ H
; q& W, v/ B9 f- W: _$ G( i) h! o1 q9 `' J! o) G4 t* I# v
第23题,将寄存器设置为4个给定单精度浮点数的SSE intrinsics指令是____。
) u# J9 a/ l* N! \- g% G7 }# O" UA、_mm_set_ps4 m* [# r' X; R1 d# Q
B、_mm_set1_ss* g+ [+ v" d) m, }& z
C、_mm_setzero_ss8 `& l# c% E6 y5 ]" w) r& P3 D
D、_mm_setzero_ps( p9 o& n \/ k6 z# B
正确资料:
- s( W4 R$ F4 K5 ~* G6 E* {% v: Q G$ ^! ?; G
8 i1 w2 C5 _& e
第24题,OpenMP归约指令采用的是一种____算法。
9 t2 D" N5 Q2 b5 s8 g1 B: mA、分治
- c& m Z7 z4 v$ w$ Z3 k6 U( ^B、贪心' h R: A' ]0 c
C、动态规划* i* K0 | t! p8 P5 G' l
D、排序
/ W5 u! k% D/ s1 S" ]正确资料:( z- ~' G) L) L% P9 y, F0 A
5 r$ O$ M2 y" u
! c7 C7 e2 g) L3 E; O2 t资料来源:谋学网(www.mouxue.com),单精度浮点数矩阵乘法进行AVX并行,期望的加速比为____.+ q7 I( c9 j/ N( g! X
A、等于8
+ o, j7 Q L5 u0 J. G: qB、小于86 j3 B$ I% k1 z, R) t
C、4到8之间
! ~% P' m r* i1 ]2 g* k' h8 Q1 }8 @D、等于4* d6 X0 m9 K, J6 M( ~6 x9 E
正确资料:2 b! q, q$ a; d/ H% g( l" s
$ K$ _- ~! U1 T5 f. H7 J( r
3 X$ M1 t2 q( j! u9 ]
第26题,OpenMP中指定多线程中只有主线程执行代码块的指令是____。4 ~, o. \/ f2 n% O
A、omp single4 p& B6 v9 S* } J3 s2 W
B、omp master/ x |, G: S3 P) [
C、omp slave
! L6 N1 A- c, f7 m$ gD、omp parallel
* o0 K# B" Y8 F/ Z正确资料:& Z$ n( W U. o2 x, e9 \
' x% F3 {, E/ t* s( Z9 W+ T) n+ w6 ]9 H) c1 [
第27题,pthread_join的作用是____。+ S7 ~1 x" x" Q; R7 n9 g* V* q
A、强制终止指定线程
1 N7 E# L. X6 t1 X' K. @B、检测指定线程是否结束, a% @& @- _* b7 l
C、等待指定线程结束才返回
& C! c; z6 K0 w$ ED、向指定线程发送数据3 ]) K! P8 x+ P5 P( o4 A
正确资料:
4 c0 Q: c, g" N/ K; T& j1 O! ?( ?% g: ?/ D3 E8 a4 d
3 d4 R: s Z# h+ O# K/ l第28题,静态线程编程模式的缺点是____。' ~' D! o) V, g" e; i
A、线程管理开销高: p( E* X. d. `. E0 i* g. w: Y
B、系统资源利用率低
2 L& W" O: p3 b( A& jC、线程负载不均% t/ s8 f3 A) g4 g) m" z4 R( d
D、线程通信开销高5 _# v( {7 [; l! l3 ]6 F, A7 `# o
正确资料:( k9 u0 `6 D9 I2 ]6 }
2 o/ w7 b# E1 k3 \0 P8 [
! _1 [! y' ^8 d2 a8 s第29题,用pthread_barrier_init初始化障碍,应提供的参数不包括____。
# F$ x/ v! |- D/ BA、障碍对象. g) p9 O+ r3 i8 C0 m
B、障碍初值
1 J8 M7 O1 o& ]) l" \4 ^C、障碍属性: D) R7 L: g0 o" G5 q) E
D、参与的线程数
2 Q3 j0 N9 ~9 t; @7 _2 D, V正确资料:4 X* @0 d4 {( O3 t+ `
% j8 i4 f) o+ b/ T& j4 u
# ?* n' x6 \3 K- }8 x$ l资料来源:谋学网(www.mouxue.com),SSE指令移动单精度浮点数,不能实现____。) ^ |% y! v+ m4 ? e4 G: D1 H# b
A、将64位数据移动到SSE寄存器高位
- T i j9 F- c. U, M4 t( T8 rB、将64位数据移动到SSE寄存器低位: q% M4 s" L: ] J0 G8 _( c U+ |
C、将32位数据移动到SSE寄存器指定位置
) L$ b9 F8 `0 B. D; i" _D、在两个SSE寄存器高/低64位间移动- h% @0 S/ b; E" F7 A4 J! ?: A
正确资料:' U" E& |+ z! v& A/ e
W$ J$ C0 Y- A8 ~4 p6 L5 S( B
( d3 G6 M+ e- r/ d' ^! d2 G% b
第31题,并行计算的新兴应用领域不包括____。
8 @5 ~3 G! d$ {. h- GA、制药, W+ _* ~0 ~. _. V
B、数字媒体
- m( k8 N. o6 i9 j* SC、国防1 `4 n5 Y( {. J' J1 h& j: n
D、游戏
, K6 D! u- N( k正确资料:
) L7 b; `# L+ [) M2 v& l& H' I* x6 d# w4 P- R: c5 G
( R: F& P6 j/ W- b
第32题,互斥量mutex机制,在任何时刻____进入它保护的区域。
! w& o9 j0 m2 I7 O* ~A、允许任意数量任意类型的线程4 L( N- W1 i$ [; F' m" `
B、允许一个读线程任意个写线程
% C7 ^5 m& A6 S7 |C、允许一个写线程任意个读线程
8 a: ]( W' Z- _7 n% a6 n3 YD、只允许一个线程+ Q8 y0 l5 K: J' T6 k7 z4 Z& h" _
正确资料:
; u9 C: d8 q4 G" i9 g$ ^
+ t6 }+ d9 w+ q* p" x/ C0 G3 c9 ~5 i" N8 @/ G! P0 A
第33题,对于向线程函数传递参数,下列说法错误的是____。
" i! J- D+ z. l$ h+ [A、线程函数并非用户程序调用,因此无法直接传递
7 k7 _! r9 E( s/ K4 X& hB、线程函数必须接受void *参数,因此只能传递大小不超过指针的数据对象
# M- |4 s- g& r9 ]/ rC、线程通常通过此途径获取线程号3 ^# R) r6 t) C5 H. v
D、不同线程间的参数传递相互无关,即使它们具有相同的线程函数
9 O6 {; E& c+ Q2 F; t. u+ e正确资料:. @0 I, W; ~+ |0 V
' c! Q& y' g- V, y
! E- M# T- n' l x& H第34题,OpenMP不会自动地在____位置设置barrier。, N1 L! s4 @+ c+ _6 ^
A、并行结构开始" a3 ^0 c, y; e3 @. D" V
B、并行结构结束6 J" c) o1 h; J0 A: q
C、其他控制结构开始
2 j, X/ ]3 k* d; ?" m5 i. |' xD、其他控制结构结束+ G2 @6 |6 c2 T
正确资料:& r! o' L* A* R6 p
( J* S: f/ z/ A6 h) {% K9 B1 Q
, l @6 S P2 T! R
第35题,SSE的shuffle指令的8位二进制整数参数被划分为4个2位二进制整数imm8[0:3],若imm8[1]=j则表示___。5 Y7 F: A4 d4 M
A、将第一个源寄存器的第j个元素放在目标寄存器位置1
q. `" o! T |& z9 g. vB、将第二个源寄存器的第j个元素放在目标寄存器位置1
1 x( u, L; w" }5 Q% r8 [C、将第一个源寄存器的第1个元素放在目标寄存器位置1
6 M7 M; Z. h! x4 w7 }) ~7 ND、将第二个源寄存器的第1个元素放在目标寄存器位置1) f# h9 `- X \7 k; L
正确资料:
! ]( E5 R/ r# S: d0 C& [$ k
2 o G) A7 }1 W, o6 i9 Z6 r7 p, Z5 v# M3 w- j
第36题,适合进行SIMD并行化的串行程序特点不包括____。
/ i; ]3 e U/ _/ A7 U2 r9 VA、大数据对象
* F t7 k- E- H- ]8 @5 f: OB、数据项连续存储
" Z( [. k7 f' u. y% |$ VC、流式计算9 ?0 I9 m6 A' o( ? r
D、算术计算密集
, e. n$ `: k+ v" X; w# V正确资料:5 [! z$ R: X) U: x
1 i0 j) ]& b: z! F
X; [" Y* i6 t7 i. f) Y6 L第37题,对于加速比S和处理器数量p,下列说法正确的是____。
2 m# @% h0 y' c2 J2 f( IA、有可能Sp! @& c) T% W0 b$ q
B、必然Sp7 I! `$ l6 ]8 f) G5 B. k) Q2 X
C、不可能S=p0 N X+ N, W- o$ M1 d1 i
D、两者无关联
8 l- O. ?" |0 Z正确资料:% i ^- a+ U9 v, c7 I' f
$ ? I$ ?: H" e, T5 g
6 E, K! g- K" T E/ B0 L7 h* [- J
第38题,采用划分子矩阵技术优化矩阵乘法CUDA程序,子矩阵数组变量声明应加___前缀。* Q( E+ {- U0 r: b; Z
A、__global__) s9 m Q3 U5 r* f- e) B9 a* N
B、__device___
( U. y& a# @; @! `$ Y8 j1 }! F4 tC、__shared__/ a+ t9 D7 m7 j0 L1 j- }
D、__private__
' d1 y% o' }8 H! ]3 p8 U/ A正确资料:
' T. B6 x8 L2 s1 b* i
" W' W, r @% Z" P6 t4 ~: a; R: f' e
第39题,在条件不成立时,使用pthread_cond_wait____。
2 Q; k. n& c7 o, _; y. ^3 [5 ~A、令线程阻塞
$ M" d9 }9 Y: [! b3 J! eB、解锁互斥量
9 v8 K: f0 A1 n; E0 p- \) HC、解锁互斥量然后令线程阻塞
# S- ~+ a! O8 X# i; s2 ~( ]' j1 q$ UD、加锁互斥量
* q8 \. j, A6 h1 h正确资料:
( G* i# ]5 o* A
: r. h8 O- `1 I" z% D- m& H6 O1 I
% C3 P; {3 u9 J( [8 p( b" x) ~第40题,关于OpenMP循环并行程序的编写,下列说法中正确的是____。
4 f" z. ~. C9 c) F- h) eA、程序员需要编写线程创建和管理代码
9 `8 q* C$ C- [: bB、程序员需要编写循环划分代码
1 z2 L8 `: M, C+ D: K- uC、程序员需要编写调度策略代码4 i8 ]& L4 ~# e2 {9 q
D、程序员只需指出对哪个循环进行并行,循环划分和调度策略是什么
`9 Q V" Q* z |$ W% H" N; N& e, U正确资料:
: y X( y. m# C! r3 R. d+ P
& e7 w; \: `& o" P
4 [& S) D4 e4 Y1 l5 c$ I第41题,OpenMP主要是通过____来更高层抽象的多线程编程。
5 d* X; I' G. g" sA、设计实现新的语言( Z% S" M O$ l% b
B、为现有语言提供大量库函数 j. N) c2 D# I4 P8 k4 ^
C、为现有语言扩展编译指示
8 _ P5 f* u* w# U9 D- sD、新编译器实现自动并行化
, Y' U* h0 c# P. I$ A" i- _正确资料:
: M0 J! A9 @+ |! W5 k# r; l }% }9 `# f
# V/ h7 }( H( E8 f5 i" O" J
第42题,CPU时钟频率1GHz,每个时钟周期两个计算单元可执行4条指令,内存延迟125ns,进行向量点积运算,无cache情况下,计算能力为' c2 |$ M. Z; _* X& y6 `6 s: p
A、8MFlops
' w. y" P! I: IB、125MFlops4 s$ w7 B$ x$ z+ D2 M
C、1GFlops; |7 q6 z; K) I1 ?2 H: [6 S/ f! I0 ~# m
D、4GFlops! a1 A- k9 @, d7 |
正确资料:1 v1 Q7 E/ I ^* q ~
0 I6 C* m0 W2 \- w8 d
0 [9 M+ {( U; I6 w# ?第43题,CUDA共享内存是由____共享。, Y. o6 o6 A# [& n- a% Q# T! [% e
A、Grid中所有线程
/ O9 v0 f/ t9 U# R; A% |9 _; S: y. \1 nB、一个Block中所有线程5 b" ~% @& S1 }
C、一个Warp中所有线程2 C- f; h* g- M# @. L0 k
D、GPU中所有线程
3 q" W. K% \0 p' ]# X7 D正确资料:
( V. ]+ X$ F( X3 M/ H6 Y
, ]/ S# r9 r9 k' v9 {0 B- F
) G# Y v; C( d% v1 Q2 c: M第44题,1) R=XR*1.3;G=XG*1.8;B=XB*1.1; 2) R=X[0]*1.3;G=X[1]*1.8;B=X[2]*1.1; 这两个程序片段哪个进行向量化效率更高?
) ?7 m% E1 c2 h6 ~: wA、1)
" {3 [! w. f1 IB、2)
" K5 j% N' Y L7 Q% N* d8 AC、不确定
7 F% [# ^' G: j, B6 D2 y) zD、以上皆错9 k% N, o* L$ e8 L- c$ H, E H
正确资料:
* B9 B$ y# a$ k, u/ z: C& z/ V6 P& L1 I7 W4 E
+ c# z3 ?5 O/ w& E3 @6 r4 L第45题,并行计算还主要用于国防、工程研究等领域,这种说法是____。
/ E% O) g, p: p# |4 S1 R- IA、正确的
) |8 g8 [% ^4 S' D+ VB、错误的7 Y0 u* d4 F4 F& t+ l2 a
正确资料:
- r$ M# P+ c( H# y6 W0 ]
4 ^$ _5 W1 C/ |7 ^
% A; k+ Q! p7 W/ {( O) u第46题,当问题规模不变时,随着处理器数量增大,加速比____。
% u! L/ ~# R/ QA、必然增大: d" E8 J3 [( M! D/ u
B、必然减小
: _( y( G: {* K- z. A. e- c6 FC、必然不变
5 N' D l; h- j" w% U& FD、以上皆错7 T/ A8 \+ k: S" E. W- |! D
正确资料:
4 u; m- d1 G- k- {7 C0 x; n0 X9 J8 r( ^. Q! ~. u5 `
# D* J5 q+ T8 s3 ?2 w7 M第47题,pthread_join的第二个参数的作用是____。
0 `$ d; k# b9 U6 ?* h) K) s) gA、设置指定线程属性
8 y; X9 E2 @% J0 e: O1 xB、获取指定线程属性& f. |* y8 E0 c2 e7 M, \( t2 @
C、向指定线程传递参数! \0 [1 J4 o) X4 }0 g
D、获取指定线程函数返回结果
- t: e' K- P( p+ N* S( I正确资料:
~, k. E' o* @. N- u* V! l! k% k; K2 i) q" { C: `
t) \/ m9 ?, i+ g第48题,在使用条件变量时,还需配套使用一个____。9 c6 Y0 }" t" v
A、互斥量" W/ N) N* _2 `
B、信号量
% |% v* D b, y: YC、障碍
2 I- L" e6 ^- u* k& u( u. RD、自旋锁
1 l. B7 f3 v- M# `" C正确资料:
7 l+ }6 c3 A2 b5 z4 u2 n: U T7 i' F- X. S
I. e4 a! b+ L3 c$ [4 Z! W第49题,矩阵每行排序的问题更适合使用MPI的____编程模型。
7 C: X* J B2 Z' ^8 E" W I, O: t* FA、阻塞的3 ^; Q4 _5 `, O1 e4 V
B、非阻塞的( d+ Q# k% c) ]7 ]4 l
C、对等的
7 U7 X$ U1 u4 F: bD、主从的7 ^; P- _* Z, _1 y4 K. e# w
正确资料:
8 R+ j# n- |. o4 i' L7 c) q
9 K8 R9 q, L) M/ T: q& L0 G* s2 y G
资料来源:谋学网(www.mouxue.com),SSE intrinsics _mm_load_ss命令的功能是____。
3 F" L8 V# e6 ?+ b$ B1 X. z9 r |( A* hA、对齐向量读取单精度浮点数: p8 z; Z/ w6 B
B、未对齐向量读取单精度浮点数
9 s- w1 j/ p1 V2 Q+ b% s s( dC、对齐标量读取单精度浮点数
: F3 p, w4 {# y4 `D、未对齐标量读取单精度浮点数$ y! o0 v( ?9 h7 @5 U. y. R4 ?5 P
正确资料:7 i! U8 @% j8 _7 _9 b
) K1 f6 K( Z+ n3 `/ d) W" b
6 m* @ q1 q }8 Z1 W
# S4 p p ]7 L
8 l/ N( k: Q# H# l% `4 |. d4 J1 N1 q/ r
! P! u, \! ]$ {# X0 B: Y. h9 j/ P# F6 f' Y, K0 Y
' ^ ^1 |5 g; M6 o/ ]* R7 r
3 m; J' S2 j+ m! j& P; Q) x1 G3 Y' V5 c
: t* ]( ]9 M! B7 d9 ~) k( m
! F% E, k/ s$ e, P7 G6 ?; d* e9 L
8 v$ t7 }: S, P |
|