|
资料来源:谋学网(www.mouxue.com)-[南开大学(本部)]21春学期(1709、1803、1809、1903、1909、2003、2009、2103)《并行程序设计》在线作业
$ U1 g/ c0 U% W$ D: R1 z试卷总分:100 得分:100
# w7 c' K1 U. X& {- L' b第1题,利用cache line一次读取多个数据字的机制优化程序访存性能,其机理是____。
) G9 R+ Q, r$ b( D# L& @A、降低了访存延迟
) `$ ]) w0 S; E: r& y1 CB、隐藏了访存延迟
, {; C C' l8 _- k D/ k% C. HC、利用了cache空间局部性0 M) g6 Y* O& S1 G: Z& C: H
D、利用了cache时间局部性
0 C* J) D5 Y8 A' C+ K1 r5 n正确资料:- Y+ M! \1 m8 D+ j; ^
. L+ V' K, I, K! Q0 [6 L9 _9 d2 r7 H: Y5 A x; D) b
第2题,for (i=2; i10; i++) A[i] = A[i-2]+1; 此循环____数据依赖。. S6 P- q3 f- y( T+ d; }% [
A、存在4 Q- P6 z6 S. _, `9 z) T
B、不存在: [$ H4 ^6 O! |& ]+ k" b' n
C、不确定
/ K$ K5 M* v/ B7 d% ND、以上皆错/ L0 H1 @ V8 N; m& v( @0 Y
正确资料:
* x' n) w6 f. m9 M- D8 D8 S6 b2 m, g# I) y
' @$ c) I4 L/ p% Y; n0 F% A第3题,记并行时间为T,串行时间为T',处理器数量为p,则额外开销应如何计算?
* ^9 `" b+ K5 \, ?+ A/ c, K9 ZA、T'-T
3 i6 v m; o8 G7 a- U2 PB、T-T'/ h* z) [( G% u) K3 W" G
C、pT
3 m+ n+ z& T0 a$ w- Y# pD、pT-T'
3 S- Q* ]+ i- r, J正确资料:
/ {9 D1 `3 g$ J1 U+ L7 ?
* S* V& ~% D$ G. a [+ U
( o9 |2 N: H% E* L5 {1 I第4题,OpenMP的优点不包括____。/ o4 K3 r" V) A5 ]
A、从头编写并行程序很自然
% O% L/ `5 j8 ?* z% I5 j X$ SB、串行程序并行化简单' F: n* a' e' E6 W6 m: P$ W
C、不必关心低层细节
) X3 a$ C: U2 L+ ^) q9 n$ t3 }) sD、可移植、可扩展
, _, t$ O; q% D/ l2 h" m正确资料:
6 k$ {6 e; D: o/ U4 Q% b
( H2 Y- f$ j% @8 f6 ~2 T! z, Q0 m9 A* {6 O- x+ y
资料来源:谋学网(www.mouxue.com),编写矩阵乘法的Neon程序,若矩阵元素为双精度浮点数,则应对矩阵乘-加计算的循环进行____路循环展开。" O& U l8 R3 K* a
A、2, E. v7 N- ?$ @: U
B、4
. i5 i; I p' o. H$ k7 XC、8! t& T2 o: y6 M8 q# n0 E, N
D、16$ e% s' T3 J$ }' i. I k! ?
正确资料:: x0 f- N/ z- ^
# a. ~: G: W- c# {* t" G
3 r- V V7 y- _1 M; o7 B4 d- |第6题,两个矩阵相乘,若矩阵总规模小于cache大小,则优化访存的最佳方法是____。$ e& x( j/ D; D- h0 |. ^ j4 S
A、先将两个矩阵读入cache再进行乘法# M, F5 _! }% k
B、先转置第一个矩阵再进行乘法
) L; N: L, u- G( IC、先转置第二个矩阵再进行乘法5 J; E, o* d& j9 `
D、以上皆错
( N6 B+ J3 E# @; d正确资料:) l4 e! Y4 [" [$ { e
2 [1 @; F7 ~, F; ^7 ]
1 g. ~# G2 P1 L6 \
第7题,MPI不包括的通信类别是____。9 j ^7 k' ~- U: e% @5 d& z9 G
A、点对点通信- {* Z0 a" k) Y. {
B、数据传输组通信/ v$ }0 Y5 Z, K( B! T+ o, j$ [
C、计算和数据传输组通信# V8 `' k0 i" u/ N) _2 f# e% i
D、加锁解锁通信% u& H2 { @ @( G4 u
正确资料:
! {" z7 B5 t3 p. {0 f+ @. D* X0 O) j
% L8 V O* A( q" y第8题,加速比计算中串行时间应该取求解同一问题的哪个串行算法的时间____。
4 J% h m% p% R' ]( kA、任意一个串行算法0 w% l. V+ H4 F7 x8 h$ U
B、作为并行算法基础的那个串行算法
# ? f) m& g0 H" l2 _8 @C、已知最优的串行算法1 I; j* s3 y" w8 q$ m6 `% Y. r
D、所有串行算法的平均时间1 c" B; |6 a% p- G& K9 d* e1 g3 r
正确资料:5 d9 X# j" B S
7 M! y! w! S* l, v4 T: k1 m
0 E, x d O/ `第9题,在128位的SIMD寄存器中,我们不能保存____。1 h; @7 y4 d5 h1 m6 [5 `. v
A、16个8位整数
B; r! _/ k# H7 g( fB、8个16位短整型' h+ o7 l# D. Y+ o
C、4个32位整型: E" q7 N8 C0 D- l G7 q
D、16个字符的字符串2 V6 X! {, I4 l, ~5 a ~
正确资料:) Q* }- K2 \: O
3 K d0 r/ V& S7 C5 d5 U- J
( F, g; g0 e0 P! X; s: d8 O资料来源:谋学网(www.mouxue.com),在使用互斥量之前必须对其进行____。9 |7 H- f( d0 _: b D# Y' L
A、初始化/ o% b5 ]. Z, y2 }4 S( w. Z
B、加锁1 X1 |/ Q+ e4 q- r9 I7 R3 m" p# p- P
C、解锁6 Q/ {) Z' U2 I6 G9 Y; @' v
D、销毁' O; @3 _ e- g# i+ i
正确资料:! ?1 ^4 W! f3 w0 p" ?1 U6 k& x' C: ]& i
% ~1 N2 U" a* B8 F5 q2 W
) |7 l, m7 y2 p/ C第11题,对于效率E,下面描述错误的是____。
* V, g! {' u7 z1 E: a i" j2 SA、理想并行E=1
& e% [! Q4 p, h5 eB、总是在0~1之间
6 Y- J/ R6 h# `# R! J. @C、可能1 ?2 M" \# [3 m) T1 w0 B: j0 @
D、可能随着处理器数量增大趋向于0, ?; |* C; s; @. N; H' ~
正确资料:& X- l- Q0 t/ P* h) w+ J
2 j5 C/ f" U" S: n! S
6 V& ^. F" y+ i, v8 j
资料来源:谋学网(www.mouxue.com),n个节点的线性阵列中,节点最远通信距离为____。
6 M6 u g7 P# M9 F1 [0 z' S6 d' yA、1
# s" W7 U. [6 QB、O(logn)
% }3 T: n& r2 x' xC、O(sqrt(n))
' K% T* ] \! wD、O(n)
5 z3 B" g3 x% {; N正确资料:+ C2 u7 r% G( Q9 u$ |1 e: U. h
) W- }, P {3 d6 k4 h
1 V( B, p+ a8 o: P, A; J
第13题,对矩阵每行排序的程序进行多线程并行化,对矩阵采用____。
: r0 w! c3 j, I5 ]A、简单均匀块划分即可保证负载均衡9 L) ?5 ] K' p0 P/ i$ ]- }
B、循环划分才能实现负载均衡3 Y/ n v) E5 z5 p( { z" q
C、动态划分才能实现负载均衡# O3 S/ G h1 E( Q) f6 H* U
D、随机划分才能实现负载均衡
; f0 W6 O, Q; M' ~* R正确资料:6 X( \% E% V# ?" p5 A
& J0 G3 w l# q( G ?
, }6 O K8 q. R+ U( w第14题,如果运算对象是独立无关的变量,则在向量运算之前需____。" b. `; ^1 m2 Y( _/ A2 X
A、将变量拷贝到连续区域
: _0 }: j% N0 x3 q+ x' R$ x. Q: }B、将变量地址拷贝到连续区域+ a4 N3 J9 z; u( [: Y. ?
C、将变量逐个传输到向量寄存器
7 |; l% J2 ], OD、以上皆错
2 O- }0 ~5 L$ f/ }正确资料: p( @. E i1 }' I; a; C
8 P' W- X! e, E) U6 M7 V2 m* h# i) L! m( d1 e7 U. n# V2 G& c
资料来源:谋学网(www.mouxue.com),我国最近一次夺得全球超级计算机计算能力冠军的是____。
3 q2 E- {+ q3 gA、天河1号
8 {* N1 O l, r6 J1 cB、天河1A
; o. V; ~+ _9 G* Z1 ?C、天河2号
h: ?. U. S3 O2 e: I1 S6 ?$ `! PD、神威.太湖之光
# x/ q. |* B! D0 a. O正确资料:
3 {8 K+ z+ i- G4 h V1 h1 V3 Q2 }1 n/ E# V- H6 k* [# S
- V3 r3 k k' u: N* [( Y/ Y
第16题,OpenMP能实现的是____。/ x; V$ ?9 E2 u. W; w2 u3 r, y8 P
A、避免数据竞争 g5 j! U' K5 Z9 \
B、提供任务划分策略& P8 s3 Y- M( J
C、确保加速8 H* o4 O Y. g- j; ^. [/ C
D、确保降低通信开销6 l' F# _9 Z1 u: l
正确资料:+ h! c6 D3 y2 W% ^) q
3 \: I( a9 |( |4 z O& s4 a A
6 T+ {$ r% g2 P5 \* }第17题,SIMD并行模式是将多个____运算打包并发执行。
+ y L8 w {2 }+ @, WA、不同
) R3 M; O& U [3 Z9 w, p) R$ zB、相同
& V. l2 ~; ]0 U9 V2 |! zC、混合
9 d4 @( Q @2 nD、依赖0 A; u4 J# H) S) ~- Y, J# f
正确资料:
7 ^# S1 t5 i* l5 S3 H( U, {/ ^, [/ F' j$ }0 q! W
! O n* U3 _( v第18题,pthread_create函数中设置一个参数为"线程函数参数"的原因是____。
2 s, c9 u7 I8 x& Q8 f/ ?A、它调用线程函数时可直接传递,性能更优
0 X1 ~5 I4 J0 b3 _2 U2 @! mB、它需要预处理之后传递给线程函数3 z3 G; ~% y0 B1 L
C、线程函数不是用户程序调用,只能采用这种方式由系统代为传递参数4 {! s, H9 L8 l& A% h4 n, r, i6 ^
D、没有特别用意
9 h0 [# Z+ _' ]/ `正确资料:. X- H- U1 e& O6 i/ k
; Q8 D$ L& i- j: X- e: d
/ _# R3 Z+ k. o. q* K9 N" C
第19题,SSE有____个专用寄存器。
0 z% x. l" W3 \: SA、4
( u1 @6 `% l# gB、8! D! S# ^# I' Z9 q5 Y6 }
C、162 b& v* J" @3 r2 i( i( H
D、33
% ?: ~+ ?1 r: h! r7 B正确资料:
# U: R1 b" W! `3 A- B U8 J3 `' j6 A: j# |
8 d" [$ E( Q5 _, t
资料来源:谋学网(www.mouxue.com),全球500强超算在操作系统上越来越体现出____一家独大的趋势。/ `5 @; a7 G0 |9 q( L8 h5 _" q
A、Unix: r1 n `2 B3 |' Q: F6 [0 H
B、Windows I- c. d- P0 a, }
C、Linux
3 x* h8 Q5 f7 r jD、ios) m/ \6 B( u; j/ F. P- z
正确资料:
3 M, I& E% A! J
( F) y* f+ Y( n e: `% L8 H+ Z! m& J) h) O/ m
第21题,条件变量相对于互斥量的优点是____。
6 R8 | z. f9 `: g+ _" w; qA、是多源状态# k' t2 s6 _0 ?) l% Z
B、加锁解锁开销低" j" ?" @8 V+ L E" z5 j4 B" L
C、条件不成立时阻塞线程并自动解锁加锁
3 g; D; O% s; n& x8 XD、以上皆错
+ m5 g1 g+ O0 q% F正确资料:
# R6 b6 R/ z- b4 O2 @1 Z/ A: d/ `5 o* p& I
/ ? k) b1 \6 g z% U第22题,当条件判断____时,控制流语句SIMD并行化可能达到较好效果。! J! b3 q8 z4 L) m
A、绝大部分结果为真
' A0 E* l7 I" ~B、绝大部分结果为假
: O" |9 k5 @$ PC、全部结果都一样* w& U3 ?0 a" L8 Q: L
D、绝大部分结果都一样8 O5 L7 T" Z: v, v, k
正确资料:( D/ X2 f. F+ C
* e4 s9 e y( T. U5 d
* z4 i( t# @8 O, D
第23题,将寄存器设置为4个给定单精度浮点数的SSE intrinsics指令是____。
) K" s5 H7 z) r }( K9 I! w9 uA、_mm_set_ps
1 f0 y, ]8 F* B/ y& IB、_mm_set1_ss
, }3 h& S* m$ _; [! U/ J# Q! U6 TC、_mm_setzero_ss
7 ]) ]5 c) M. u. }' _- b' xD、_mm_setzero_ps
- C- Z: a" b" J$ J正确资料:
/ r/ c0 x% D) |2 L9 w+ r& \( f; W: Q* g
7 p5 a3 F i& U4 K/ M% T- l4 Q
第24题,OpenMP归约指令采用的是一种____算法。
- J2 j; I4 f K, UA、分治. ?6 P* O5 b4 A( g+ n/ ]+ B
B、贪心1 J6 r5 [8 J0 I3 Z5 J8 \8 x) }
C、动态规划
4 i' C; M: k& G$ D! t1 `4 R0 G# DD、排序; @4 j! u, ^+ o4 W. ?
正确资料:# o- n+ F3 s2 h& }$ ]
% d+ R" b5 Q" ?! J. F9 }. m6 w
( j0 N0 |& h4 @" H
资料来源:谋学网(www.mouxue.com),单精度浮点数矩阵乘法进行AVX并行,期望的加速比为____.) @' ?0 N3 ^4 o
A、等于8
/ k6 f7 s; A5 d+ J- lB、小于8
- m( D% F2 w1 f# w$ [' \5 aC、4到8之间+ d: `2 [5 W" T( L1 h; w x9 t# D
D、等于4/ E. o+ B u! `: o
正确资料:
9 z4 j+ c1 Q& E# Y1 ^* U
. l9 R, `. m: r5 c% \
( c& b! J0 l) }/ M第26题,OpenMP中指定多线程中只有主线程执行代码块的指令是____。
% S' E! l4 J; S% h2 RA、omp single
7 m8 }7 _7 _5 o0 Z7 eB、omp master% W v; Z' k x. L
C、omp slave
|) o* Q& Y) P, {' [6 m" l5 M+ C% `0 rD、omp parallel4 q5 o$ m$ y7 O, L+ L: U8 |
正确资料:" I# c' c4 p" b8 a3 R0 Z1 Q" y% {
% ]2 h& g E$ S7 A% k
) i1 U6 d* i3 B3 @2 u! R) V( O第27题,pthread_join的作用是____。6 T6 F; S, h$ h8 [9 c
A、强制终止指定线程
; D9 r# X/ |; f8 zB、检测指定线程是否结束
- d+ k: V" w4 E4 l# i! [$ D1 YC、等待指定线程结束才返回. R+ f7 ^! B& W$ m$ k
D、向指定线程发送数据
7 Q& s$ \1 w7 C( P1 W% y. T正确资料:
1 |+ w1 {% p8 A% u' O# U) U; d, H Q3 y7 Y; Q
- o# ~7 |" n' e3 n6 u f
第28题,静态线程编程模式的缺点是____。
7 L+ g) V% c7 o5 P! p8 l" aA、线程管理开销高5 V* b L7 r, u% l7 P
B、系统资源利用率低
& \8 U& Y" l; g iC、线程负载不均
0 P# b$ b, V/ @/ zD、线程通信开销高2 u4 S( ^4 K" @2 ~' F5 b* D9 j
正确资料:
2 o1 I4 i3 A, Q) Y# h) S1 T; ~" | C. U# x8 t( m) C
/ u7 m+ j; e L! b' I$ e1 r
第29题,用pthread_barrier_init初始化障碍,应提供的参数不包括____。
. ?2 [) }9 g: o; G9 E( j6 {A、障碍对象. G6 e) D Q' C1 N
B、障碍初值
2 o p) S) Q4 h% ?3 Y9 mC、障碍属性8 |" h, K4 w, h; ~! y
D、参与的线程数
* ~& |5 P' T& t3 O: s; p正确资料:* M* i1 l; R; G8 {
# s# d/ }5 w) T0 L1 M
' q; @* k( y; `- F$ X资料来源:谋学网(www.mouxue.com),SSE指令移动单精度浮点数,不能实现____。
; n# E) E H* @! Z. }A、将64位数据移动到SSE寄存器高位: h+ s( g0 ]+ m% F4 K W! E
B、将64位数据移动到SSE寄存器低位5 {" t: V& {7 w& q- d
C、将32位数据移动到SSE寄存器指定位置
* X2 } P# y: Q" iD、在两个SSE寄存器高/低64位间移动: ~9 Q8 a! ?! U# L
正确资料:$ [6 [5 e* _& O. H" g
' x1 d! k0 A) _ p, M: W. W2 j4 J: [% ]% V7 @4 E3 {0 R
第31题,并行计算的新兴应用领域不包括____。
* c) `* S$ s' ?$ y& K3 \. ]/ d3 GA、制药' D0 `$ g& m7 l: `1 w+ X6 ]% g- i
B、数字媒体& s2 ^0 Z5 E7 S9 W8 Q
C、国防0 h5 t0 i; V# K7 C+ T+ H/ D
D、游戏$ ^1 B: [7 n- T0 d: u4 k( s
正确资料:
`/ ^2 Y$ B! g8 G; c, c
3 Q9 ^3 h6 @; k9 S: \ f: L6 |3 S
第32题,互斥量mutex机制,在任何时刻____进入它保护的区域。1 ~; S7 Z% [7 S8 k ?9 n/ x. z& u5 z
A、允许任意数量任意类型的线程
5 B" d7 q S r, E) N" C3 _B、允许一个读线程任意个写线程' N) ?7 }3 {8 t% I! g
C、允许一个写线程任意个读线程1 w, |( A0 A4 j% }/ B) ? r
D、只允许一个线程
. h1 \. i# g+ t/ n0 G/ ?正确资料:
K3 m8 I3 B+ F6 d$ a
; o8 F( ^0 C5 Y& J6 |( Y$ y2 N N+ V3 f( `2 S' G
第33题,对于向线程函数传递参数,下列说法错误的是____。8 e3 j+ J9 y/ A s' H
A、线程函数并非用户程序调用,因此无法直接传递
! J- s1 H; d. w4 p' q" X/ }$ q9 ?& ^B、线程函数必须接受void *参数,因此只能传递大小不超过指针的数据对象
6 v8 ^. W1 O9 g( ]$ SC、线程通常通过此途径获取线程号
, Y1 Y/ R+ M) n" J1 X5 dD、不同线程间的参数传递相互无关,即使它们具有相同的线程函数# p! b! \, ?: d
正确资料:
( V) v" j$ Q1 c$ b
. `: X+ V! B9 f2 m# C- T6 [- [% z. V( z4 W1 Q, }
第34题,OpenMP不会自动地在____位置设置barrier。
. w o, Q( ?2 T2 ^& AA、并行结构开始1 r+ f5 B9 i! Q3 T& M ?" ~
B、并行结构结束9 F+ l z* H) b* h: Z: f
C、其他控制结构开始7 g$ d V' w+ y) p& z
D、其他控制结构结束
6 r) y& S9 x& r6 s2 h正确资料: B8 c* l4 r/ D4 \7 C
" C1 W7 d* [' F, P+ I2 g* @& Q2 D
+ [5 a) Y% o3 B+ q: h; N
第35题,SSE的shuffle指令的8位二进制整数参数被划分为4个2位二进制整数imm8[0:3],若imm8[1]=j则表示___。4 d' q& A- p P/ ?
A、将第一个源寄存器的第j个元素放在目标寄存器位置1
8 q3 Z; |1 a4 K' [B、将第二个源寄存器的第j个元素放在目标寄存器位置1( Y! N, }3 x: `/ z8 J
C、将第一个源寄存器的第1个元素放在目标寄存器位置1( T& t8 B6 u y2 K I+ |
D、将第二个源寄存器的第1个元素放在目标寄存器位置1
6 z; S0 F3 |1 G+ ]: r9 ?正确资料:
. G* I2 q7 g) x% y6 n+ w" n) ], Q" g4 x( x: a: C
( `+ ~1 R) T3 Y% S6 e第36题,适合进行SIMD并行化的串行程序特点不包括____。- E6 G% j; U7 R( ]
A、大数据对象
; i: B, Y. ?) C$ n2 [( Q5 wB、数据项连续存储
+ c+ X m0 C9 ]C、流式计算5 `3 J" ^% J }' E/ B
D、算术计算密集0 k; s: q; Y: v" |" y
正确资料:6 B. {; Q1 ?! I# `
8 B( B# U) l$ Z8 f2 W% Y% v; y4 F3 Z, P8 Y2 j3 k
第37题,对于加速比S和处理器数量p,下列说法正确的是____。
$ g7 C' [: s7 J9 g9 a5 ?A、有可能Sp1 ]* s, a- S: P( v6 M' e
B、必然Sp1 L4 e- c$ l" | E
C、不可能S=p! ~' W- u# V2 ^/ p, F" B
D、两者无关联4 |" l/ O- [4 T( R* ^3 ]8 a
正确资料:
1 p- H0 x. B2 o% b9 y) \3 n* ]& J1 o" n+ `+ ~" t4 [; u
% e% Z+ L! A5 O" ~+ F第38题,采用划分子矩阵技术优化矩阵乘法CUDA程序,子矩阵数组变量声明应加___前缀。
+ [) H6 E0 u5 }5 H3 ]A、__global__
9 f# O) I e1 h p1 X4 cB、__device___
7 `* L7 e9 o2 G9 u* O1 i& I$ J8 X& x8 uC、__shared__$ A# V3 S, R) K7 ~9 U2 Z
D、__private__, z' D0 Q# O, k, |
正确资料:; C3 V+ U! j& T; w; I- \& R
$ Y7 [$ i/ @: A: e% c! R1 L6 V# R
, O" P5 }" r) l
第39题,在条件不成立时,使用pthread_cond_wait____。
' ]* k: I# o/ W. f, g" \A、令线程阻塞
2 q8 P% Q$ c: fB、解锁互斥量
" H8 A4 b9 j) A7 Q7 _' pC、解锁互斥量然后令线程阻塞, c/ o" j j9 e/ T4 V+ d8 H
D、加锁互斥量# \6 w. v- X( Z) N
正确资料:
+ x: G/ F& e# k/ i4 [) |. i: W1 _+ ]
. p% h/ H) ?/ R. f4 {8 G$ b( M第40题,关于OpenMP循环并行程序的编写,下列说法中正确的是____。
! I, @+ \9 w9 z4 H6 u7 t c/ {2 ~A、程序员需要编写线程创建和管理代码8 H% ] `9 _' c, \$ ^1 [* W
B、程序员需要编写循环划分代码! ~, T: g. X A/ E5 h! D, d
C、程序员需要编写调度策略代码
" C/ A% P! L- c" o* ]0 V' I8 SD、程序员只需指出对哪个循环进行并行,循环划分和调度策略是什么: \8 U% O8 U/ ?/ V7 h. b
正确资料:& }& `% X* a8 B0 X# C
0 T, M9 j3 R6 U$ I2 k( G
" |0 J. W' A* S$ g) C+ S
第41题,OpenMP主要是通过____来更高层抽象的多线程编程。
4 Z& ]# ~3 e s+ { `A、设计实现新的语言5 _ {) ^8 q3 ~) S; ^: H
B、为现有语言提供大量库函数; t( M( T/ S0 U/ Y! _" H
C、为现有语言扩展编译指示' e) b$ F' X: h9 {
D、新编译器实现自动并行化
8 d5 w M' O6 z- B4 ~% Q正确资料:
. G7 [( G. o/ L q% k$ r; d' _0 v" P
2 U' _% j# C9 e! u: D0 c5 v d ?6 a, |, g
第42题,CPU时钟频率1GHz,每个时钟周期两个计算单元可执行4条指令,内存延迟125ns,进行向量点积运算,无cache情况下,计算能力为7 y% n, j/ {! {" q$ u! ^/ P
A、8MFlops/ |( {0 U% P1 m9 S G
B、125MFlops
- T6 s3 }' }9 B( _/ P9 BC、1GFlops
. {! J+ M) S$ O- p; iD、4GFlops ~/ C7 u& y/ ~, W# U; x; n
正确资料:
% t# v5 b8 {# n' ?5 V, y7 r9 J
5 T6 n" z2 N! O6 A3 w
# {, i, a |! c0 d2 Q, {第43题,CUDA共享内存是由____共享。
0 m& `! ^0 ~- }# s9 D5 _& E9 ]A、Grid中所有线程; r9 p6 ?) O# e! c0 l2 _! I
B、一个Block中所有线程 C$ m0 K; S2 w4 A7 \
C、一个Warp中所有线程
' L* L, ?* m% M6 g1 w6 O8 cD、GPU中所有线程
! U( Z' X$ `, ~7 I( ?+ s2 x正确资料:& C% f' B7 H4 m8 }
! `2 h1 h' L' v: y5 R5 k+ r) N
) z0 V% d/ t; ~/ r8 V% e$ |第44题,1) R=XR*1.3;G=XG*1.8;B=XB*1.1; 2) R=X[0]*1.3;G=X[1]*1.8;B=X[2]*1.1; 这两个程序片段哪个进行向量化效率更高?
( P* N, X/ K0 j5 OA、1); T9 Q! e. E, `% D4 [" ^8 W" [% Q3 [8 `
B、2)
$ B: p3 `, w8 J" K% {C、不确定
. s& b% }! f0 o* mD、以上皆错
! Q! ~& u- W/ C1 \正确资料:
4 [7 H( p, N5 v0 V. T2 j x) b/ |/ L, F9 O4 D1 R
6 d( i5 r0 A& j: j
第45题,并行计算还主要用于国防、工程研究等领域,这种说法是____。
6 @- I2 ?5 j, l3 ~# }A、正确的
2 F) E0 X8 s- @: kB、错误的6 R2 Q: I9 B, v- L" u3 ?/ C/ M: Q% t
正确资料:4 y0 x7 E! g. k! F3 k! M3 m0 F7 j
! D& \: D( H [! s4 h
: n' i* R T- n9 o第46题,当问题规模不变时,随着处理器数量增大,加速比____。6 V2 }, @- Y& L; ?
A、必然增大
" T) X+ e8 G, G) w) zB、必然减小2 l' H. S ^$ T G/ s7 P; K
C、必然不变
, R; l+ N6 l1 P1 y' VD、以上皆错' i& O8 X4 Q" h+ L9 [ C: z' {
正确资料:2 |# i" q2 M" z4 Q3 v: ?4 @
* D& `( K! j/ d, M' w6 \) d; m
6 s0 q' }% X5 T# t第47题,pthread_join的第二个参数的作用是____。
" A& l ^* d* N ~, Y1 uA、设置指定线程属性6 T- ?- p. q3 ^
B、获取指定线程属性& d9 m f+ R5 m0 X9 n& D1 Z2 {
C、向指定线程传递参数. b9 T [) X' W( S
D、获取指定线程函数返回结果$ } m7 i3 M: u& |. ~
正确资料:
3 ?8 w8 I* |' j! Y+ q# V7 c5 c" f+ P& m8 F& S
6 u7 O7 V: |5 J$ B2 H9 h) [第48题,在使用条件变量时,还需配套使用一个____。/ `* P! |: a) }* e! J1 i6 q
A、互斥量* I( _( B. B4 N3 Z6 Z4 D
B、信号量. n: ~2 b7 k$ [' H
C、障碍
& F& b" p4 b( q. o: G% AD、自旋锁9 u/ `# l0 [6 n, h
正确资料:9 K5 r6 J9 \9 J2 e5 Z Z. z
) y d7 c# H- P; B$ [
+ f' P4 n% l! B: N; M9 ~5 ~
第49题,矩阵每行排序的问题更适合使用MPI的____编程模型。: Y8 {9 @0 x. K$ p
A、阻塞的, p- P1 s3 L3 k0 l, w, T
B、非阻塞的
9 {: ^* f2 ?6 O% ]9 q7 bC、对等的
8 |2 X4 j7 M: FD、主从的
# p) m. M, i2 ~ ?, v; X正确资料:
; _9 O$ u* x3 ^( r
6 I, g# x; A6 N$ H
# x4 J* G6 K, e6 i u* V1 I2 r资料来源:谋学网(www.mouxue.com),SSE intrinsics _mm_load_ss命令的功能是____。
# @* F2 v1 o; O+ z9 F, h( HA、对齐向量读取单精度浮点数- a7 g& f$ o0 b4 O+ Z5 J
B、未对齐向量读取单精度浮点数/ ]/ A5 a4 p+ z6 @! f
C、对齐标量读取单精度浮点数
. L6 `2 M: P5 I% M; M* D+ fD、未对齐标量读取单精度浮点数# |' p# V5 G- A
正确资料:& _4 M+ q3 ~# E P/ j) {4 n- Z
* ]8 |+ A- ^$ U5 T
( I7 t. T/ t/ w
+ F0 [1 f* f, X; U8 r# v
" V6 i$ F% s( ]) @- l% |" B
v( ^) s! q/ Z6 \* D! J4 P$ c; d5 S+ H3 _+ P9 X
5 C+ }( O0 N: B7 M) ~2 l/ \7 _$ _
4 I3 G: h d( T; v1 N; _- Y2 m7 E7 F+ ^/ ]! J' [. a
% H2 @* F/ G: {/ ^4 d5 t
' q2 j0 z s; X. f! q( G) g7 f. O# K
, M# u& O5 _# ]' {7 F; b4 l/ ]+ w2 v1 I8 Z9 S
|
|