|
资料来源:谋学网(www.mouxue.com)并行程序设计-[南开大学]22春学期(高起本1709、全层次1803-2103)《并行程序设计》在线作业
" X8 l& V' S! f; p/ p; l. ?试卷总分:100 得分:100: d4 F8 M* c; M. Z, a6 a2 i
第1题,对于效率E下面描述错误的是, x4 w2 | ~2 ]3 t$ V
A、理想并行E=14 O1 \" i) h/ N$ B# Q- ^6 c! M7 `
B、总是在0~1之间
+ `4 V6 z V: V" T7 F7 E$ gC、可能1& e. ` I9 [) q; M( n+ o
D、可能随着处理器数量增大趋向于0' S0 M$ N# q- P* Y% f8 e
正确资料:
9 L+ E6 \2 I5 X& i p4 J/ I$ m+ Q/ g
) l; \) O) C: o9 Y4 c第2题,OpenMP相对于Pthread的优点是
( T" a. ?, g% S7 G; m/ d! NA、功能更强大
- p$ C$ W0 |, O5 N5 }, UB、可达更高并发度+ x# F& k V4 p5 A. D) o
C、可降低通信开销
% a! i# w, O8 Z/ `D、由编译器生成线程创建和管理代码,更简单9 T' x8 d! ]! K K
正确资料:) _6 [1 \& `, g& X, P! j4 U' K9 p
9 C2 {: i4 _: w f! }% ]$ y
$ q# Z7 _; R+ s; M% s q. }第3题,pthreadjoin的作用是9 k) @) D9 _: ~7 B8 o
A、强制终止指定线程0 Z. {* P3 \! S6 x# X
B、检测指定线程是否结束2 T" L: j W% }- Z T5 Y7 ~$ |
C、等待指定线程结束才返回! o. a. G, V6 ~' M+ Z
D、向指定线程发送数据
: @: {% ~1 j8 v4 [3 t9 b正确资料:& y6 y. d" |5 B3 A
) T: x- _7 K; p" J
0 k6 ~- K( B) L9 f) H- E9 h- Y- F$ x第4题,在使用条件变量之后必须对其进行7 X1 d4 z- G2 a- k' X
A、初始化( L( U5 G5 }& t' I/ U4 Z
B、加锁
5 r) ?! K" M2 I1 M Q, X1 ?( FC、解锁
* t/ n5 I- E. \- |# K4 sD、销毁
" S! w3 y' V% ?; m正确资料:
3 S2 k$ |/ ^2 I4 q, ?! v' B% |6 {; F0 _1 k3 n0 C' A
2 l1 M: w- `+ r0 y. `/ N
资料来源:谋学网(www.mouxue.com),在SSEintrinsics程序中整数数据类型是
! Y! N" L j0 x) i" AA、__m128. Q _- r2 Z- `
B、__m128f9 B9 o! f0 }# I, n9 ~
C、__m128d, e: s! C0 y" H& Z! Y6 ^" P! W
D、__m128i
3 q$ f; }1 ^ x4 x正确资料:
, A; X" y" T$ R' |$ [& B5 y! B4 Z8 O; M
. z6 S- N2 j8 J
第6题,控制流语句进行SIMD并行化很困难的原因是控制流语句导致8 m* z' S5 V. ^
A、连续数据执行不同指令
- O) _) D! r# N1 B! G2 E- XB、连续数据执行相同指令
( |* Y$ B& J( K3 i; H1 {C、同一数据执行不同指令" W, w; w) Y. _6 n t, o6 y2 p
D、同一数据执行相同指令3 n. N' f" I5 [' f, J, K* x
正确资料:: |0 q1 L$ [, z3 {1 S7 P- l. K+ x( i$ G- s
; {" h+ w( L% u8 t4 a* [- V% M+ T6 C% `0 P# J# H0 H' U* s6 v# r
第7题,CUDA共享内存是由共享( u% D. \+ ]6 a! w9 O+ y7 q
A、Grid中所有线程9 a2 G, {% s8 e. U4 F
B、一个Block中所有线程, B- {2 j; u; `9 ?
C、一个Warp中所有线程4 ~( Z! a! S% O% J: D5 B* U# U. P
D、GPU中所有线程8 R- q) T8 B9 m& Q
正确资料:+ @4 U& S. b: A! A9 ~
( t0 U0 ?+ h# }3 Q2 n4 N
0 S- s6 C0 U* A9 Y9 m3 q( g* H第8题,在使用条件变量之前必须对其进行) U7 u4 \* {2 J/ o+ h; @! c
A、初始化& r6 U. \! s7 `2 V3 _2 w4 T
B、加锁
6 q/ q3 F _" k6 kC、解锁
* E, e6 {" D+ v. n6 vD、销毁! j1 q; o8 l' X8 x) ]
正确资料:
; h& Q6 c$ J; h. q2 j: \+ k! n& |& y" K
; ~4 Y8 ^# i& h( i第9题,在SSEintrinsics程序中单精度浮点数数据类型是
2 z5 b$ O7 A. U% qA、__m128$ k; e6 Q o3 m7 d" C2 D& u
B、__m128f
7 w2 }; j+ N$ t0 rC、__m128d4 C! s1 J6 t5 i) |; g6 d
D、__m128i. \0 z* }( o, ]- I! ]' @
正确资料:& l& I, {; ?1 V5 h! H
( G2 R' a/ X+ L& A% c$ ~
% q/ Z: O9 H" q, P9 O, h资料来源:谋学网(www.mouxue.com),和一对多广播对应的组通信操作是, F3 [; i$ K) j5 s' m: a$ ^
A、多对一收集
# E+ H, C3 g. c( v9 Z3 `% E( ]0 aB、多对多收集
6 I8 T7 B& I g+ Q t. gC、多对一归约
3 s7 `3 X( @* U, ^8 \/ CD、多对多归约# D6 d% x4 y, o P/ [# V
正确资料:
7 ?$ n3 @9 E$ F3 h8 W5 C3 C+ S# `
, t. U1 z; h+ Z& e/ ?8 ^
第11题,竞争条件是指程序执行过程中两个或多个事件的影响执行结果
5 t& N" v( x& l9 W$ ^$ t7 qA、时序5 {' |' n4 k B7 K p0 Z8 \. R% v
B、时长, Z* o8 E# S( u+ J. [" c
C、结果
& }0 f) l2 o5 ~8 j( @" P5 SD、运算对象
3 L# w: ^1 P, y: u" D正确资料:
) g$ X5 t1 G. F3 m) [* T$ g9 K7 c. B9 ?3 A" v
# d) w7 n$ N# q# `
资料来源:谋学网(www.mouxue.com),下面矩阵运算中哪个进行简单的数据并行效果不佳
5 C8 _) d. A) X* `, sA、矩阵求和( H0 A( }# J8 m3 n& [8 |2 Z2 R' i% O* A2 N
B、矩阵相乘
( t( }' B& U+ u" [4 x1 i; M2 XC、矩阵向量相乘; W8 o3 i) M/ B7 ?
D、高斯消去1 S/ q: V8 s: t) X- i
正确资料:$ l* E/ w" ^" p! ^
6 \" y. _! p b- P; C% @# b6 |- w7 y
第13题,CPUcache大小为32KB如希望单精度浮点数矩阵乘法计算过程中所有数据都驻留cache中则矩阵大小最大为
8 p. R2 P. |! @+ v' L TA、16*16# [& T6 b+ }" c2 b: Y+ u! o
B、32*32, R6 e: C5 o0 e
C、64*64' @3 S9 g$ j; C3 \
D、128*128
, i& i; h) D9 m6 H/ o b正确资料:+ p( n. t v8 c$ g& t
8 f6 D' @ r: a- G
; u. T3 @7 L3 z6 o& ` o$ R: u第14题,关于MPIrecv对消息的区分下列说法正确的是
+ A- h' `+ K# b. f' J: }6 {, LA、只能使用消息标签- J+ R$ X$ ?1 a5 _& p, b: q
B、可以使用MPI_ANY_TAG# @) C7 }5 f j; ^3 }# u4 V3 u
C、可以使用消息名- b& q! h( G& ]* v! Y4 q, [5 \' A; O
D、可以使用端口号
+ f) b8 @ X0 b, y; t正确资料:
( F" y, S+ ?7 V: g# N' D; w6 c& t2 H1 X2 H
2 K9 L! s1 X" E9 m& ^0 G! ?
资料来源:谋学网(www.mouxue.com),对两个互斥量a、b线程1执行lockalockb线程2执行lockblocka则两个线程间会发生
8 P/ a7 ~2 W( u1 |4 y: P9 nA、竞争条件1 c3 h# l) r3 x" R% `- i/ Y4 o
B、数据依赖 c9 e# R; g4 n% r4 H
C、资源泄漏
& }/ k! c5 ]! DD、死锁, H! ]4 U4 z6 q0 n+ ^5 y( L" c
正确资料:" X0 u0 v Y) U X
( r5 e- s- f" s8 v
; S* O1 A+ C. ?% ]第16题,fori=0i10i++A=A+1此循环数据依赖' r9 R3 f: P; `4 B* ?. p/ d' r$ I
A、存在
. m1 J2 Q+ a( r4 b. ^& u. O- B! yB、不存在) T& {4 v, _# _
C、不确定0 q# N% k/ a4 a
D、以上皆错4 J& b7 M j% a
正确资料:
. `1 {0 i, Y6 A6 v$ p5 ~
$ k" X: T9 t+ l' L, `6 p! e2 |
8 Z# Q. y+ |, V( N8 ^$ m/ U5 P第17题,对双精度浮点计算AVX最高实现路并行5 \- ?4 w) M* \; `7 L. _" {
A、2. B2 M" B2 Q9 g# z U, h
B、48 Y2 j" L1 o/ X ^7 r! g
C、81 m! ?! F# @; n: C$ u
D、16
7 S2 a* L' s2 e2 k" |* n2 x( }正确资料:
2 K) [$ z, W) Z6 y K/ h1 s9 Y; W4 P r! z( @8 D* t$ `) C/ D
3 E" w/ k0 }- r3 h. V- o4 `8 y6 p2 Z% E
第18题,OpenMP的循环调度策略不会影响算法的
, p! L7 r9 w {* yA、负载均衡
7 s5 G( _* ^! J3 K" oB、调度开销
$ p4 Y2 D- |4 _* q1 s5 L& b: PC、计算总量7 x# z8 N3 X& s
D、数据局部性
8 |" \; y9 K' ]& L2 a正确资料:
& _: s1 j3 k* R) `# B4 ~! ^; _, l) ?$ [+ X* x0 X) @
5 W- U; c6 E; ]+ h- m% H第19题,SIMD架构未见于中6 I/ _7 |! m' ]0 w4 M7 |+ ]3 p! c1 `
A、多媒体扩展* T3 t% O/ z0 a1 w% j$ v( ]
B、图形和游戏处理器
5 g. T E# v% s% S8 a+ e4 pC、计算机集群
+ d# U3 v" J: {# ?( Z, TD、协处理器5 k0 u$ P; Y( G
正确资料:# s! d, c* R! a( `, v0 \& Q
* j/ g! ~- L/ E. e+ q
% K8 r" v% z' r/ q7 L m) T资料来源:谋学网(www.mouxue.com),CUDA线程层次中不包括
: B* h5 N: M/ V; O& H3 sA、Kernel
% Q0 G8 O- O. v5 u# TB、Grid9 _9 Q1 v `8 |* J
C、Block: X4 y7 Y' E' A3 J1 h* n9 w
D、Thread3 q+ Y3 Y9 n) ^5 l: M
正确资料:
9 ^# u9 K( ]7 S: B8 `9 o% b6 D* V) t3 f: s; V+ Q' J
- G1 i9 E! d: C/ \$ J第21题,起泡排序改为奇偶转置排序消除了循环步间的数据依赖的原因是7 k. z3 I* ^# X6 L$ n8 S
A、增大了元素比较距离+ t% ?% r- X3 ]" |! h/ B
B、减小了元素比较距离
4 r, c0 F" z: g6 [8 LC、改为元素两两分组比较7 i7 p8 j' k6 Z0 Q
D、消除了元素比较) G0 X$ }& P3 T, @ g
正确资料:" L' O' }5 F5 R' s- M6 _, V7 K
7 X) U" F! {' p6 u8 j2 a3 M `" Q& I9 Z" ]
第22题,以下超级计算机中不是SIMD架构
$ d/ v( ~8 |# |) j: p6 m+ \A、CDCSTAR-1002 Z' K+ s( T$ _1 o% ]- U
B、7570 _9 R7 H/ f( R" ^
C、银河( h; m @; ^; i# y; f' }9 E7 `
D、天河1号" U3 F d! m4 F& W3 y9 m
正确资料:
6 d7 Y, l2 I9 j! o- _
0 m) l" L3 p7 r7 T2 W* z0 ~- ]. a; o- H- ?
第23题,OpenMP能实现的是4 j% o) P0 U+ |% r; R- Y
A、避免数据竞争$ ?8 ~8 ~- h. E( k7 R# J
B、提供任务划分策略5 v3 `$ n9 l* T2 B
C、确保加速
1 W3 r& X0 C1 p" V4 e" }D、确保降低通信开销
: _& N% T1 W* W; _& k* C! C, b' m正确资料:
( r P. I1 v) }6 Q: L8 y5 ~0 \; r- a# a! J8 w! s
2 |0 C4 |. r. |; S% r3 v1 ]
第24题,OpenMP编译指示中说明共享变量是用子句, N) f* j* r, A) P# E: E4 w+ O6 [
A、private
* |4 |# U& [4 ?$ ^# D# \5 I' vB、shared
7 i- I5 M! E6 Y4 z9 `" QC、schedule
: F5 [9 _; ~( l/ C0 W5 [D、nowait! T; O2 A6 n0 X$ L/ ], P
正确资料:
& |1 k$ |' p u+ h( d. X
f0 g! {/ r7 y9 H: m
. X" u' x4 W6 Y* ^! m* L9 u资料来源:谋学网(www.mouxue.com),在条件不成立时使用pthreadcondwait" [3 k! D2 t+ S* J/ D$ d+ S
A、令线程阻塞
$ {8 v: i+ x! ] F3 J/ ^B、解锁互斥量; M: h! L1 X" ~) G7 N+ z( U
C、解锁互斥量然后令线程阻塞
9 D3 T& R' X( k8 rD、加锁互斥量
1 t9 B, Q0 F5 H' B a4 T- z6 K正确资料:! L5 {+ s+ T" W* ?8 c
5 `0 {. I' Z0 j9 m( _
) h* E! u/ \2 e9 c2 @" a
第26题,静态任务划分相对于动态任务划分的优点是
2 K& v7 Q% u7 R$ \' [8 g5 Z. g$ nA、确保负载均衡+ l- G' U$ N5 P/ o N/ Y
B、任务粒度细
& t0 U8 }4 R9 Y8 O' [" Y" R' f' IC、计算复杂度低
1 r% ]8 K- M5 ^) G( YD、并行效率高' M1 j3 r2 d: p% L. D
正确资料:- r1 E R5 Y4 B' o% F
$ h4 N+ r' N3 S( r+ D' {. {7 Z: N8 ^* V+ l4 K0 B
第27题,两个矩阵相乘若矩阵规模大于cache大小则优化访存的可行方法是
6 F' S( y3 c* y, ^8 b! X9 `" FA、先将两个矩阵读入cache再进行乘法5 I$ y, @* l9 t
B、先转置第一个矩阵再进行乘法 H0 V* E2 a2 i! {$ u
C、先转置第二个矩阵再进行乘法
6 h* I- `) P9 [) M nD、以上皆错, e v) P7 m8 Y$ B- |4 m
正确资料:
5 Y, S( J) a0 [
9 _% I) P' y* |3 d" ?( H; y# K" z1 @( k9 b7 @
第28题,对一个串行程序进行SIMD并行化应重点考虑的程序部分是/ o" E8 t$ c/ B
A、声明语句& S( L) ~5 P* `
B、条件分支语句
6 j4 [3 r0 K& [8 MC、循环语句/ h/ K. E6 t1 g& l
D、输入输出语句
) ^% [2 y. A0 r- |4 Z( p$ O正确资料:3 ]/ C# L6 n1 l
6 [+ G3 ]0 M x6 j
. m0 P. F5 e4 k/ ~: d4 \
第29题,对于条件变量下列说法错误的是, n5 f: i+ K# p k G7 S
A、可以用互斥量实现相同功能1 c" ]) i( S& M8 \: G$ k
B、不能用互斥量实现相同功能
1 L) J9 s4 @& v5 UC、较之互斥量方案节省资源% R; b- z1 i4 w! E' q) K
D、较之互斥量方案代码更简洁+ p+ ]5 f2 R) ?; ?7 _7 j8 s# n
正确资料:( c% b2 s: _8 [9 l( S
' B) s9 S N/ V# H0 W
! i: ]7 V j7 L资料来源:谋学网(www.mouxue.com),MPI不包括的通信类别是
$ j- _5 ?0 W" Q) `A、点对点通信
9 Q. E" n: U K6 _( bB、数据传输组通信! L% f% W5 |7 V2 S
C、计算和数据传输组通信- Q0 O" g/ I8 b: J- l, a$ _$ b
D、加锁解锁通信
- y) [" M5 o: z |正确资料:
# _" O3 c2 H5 v$ f9 h' s7 M% B* V- Y- y4 V
" H2 d) V+ _/ Z- P# [$ e+ r& y第31题,一个函数是"线程安全的"其含义是该函数
$ d% Z% x, z: S% kA、多线程执行能抵御网络攻击. D1 G3 J- B! [) A9 X
B、多线程执行能保护用户隐私数据2 V G! R1 y7 \5 N3 D( p* e
C、多线程执行结果也是正确的
$ \( F1 A6 }6 p" L, KD、以上皆错1 n! K& w! V% \2 G! Q( \' K' w
正确资料:
" d/ i8 {: L' w+ o6 m& _1 J0 ]2 D; `9 n$ A
2 ^# e* }; }# \9 n7 t
第32题,记并行时间为T串行时间为T'处理器数量为p并行效率E的定义是3 K- K5 L9 G6 F
A、T'-T
# i: S8 \* D* g% @% w! tB、T'/T$ o' \7 e5 \7 y- D
C、T'/pT- X8 d/ K8 `7 k* Z: U/ I+ i, b7 n
D、pT-T', A* n |) Y# z( N
正确资料:
2 H0 O' v- @7 `1 x* _' Z
1 T! q7 m: K8 c( u4 Y( m4 |. \
8 w# n+ r& O. M) R" `" U* B1 y第33题,在共享内存架构编程中线程间不能通过进行通信
% D) O9 A2 b' @( g; W- a8 bA、全局变量
& W* Y2 U- A6 |: ~3 h7 @2 v! TB、局部变量7 X6 p, H L; |' Q# Q4 b+ y0 Z5 _
C、静态变量! q, V$ o, u$ m# u$ O ]& A
D、全局堆中变量) A6 _* f& Y- V9 [$ ?2 s
正确资料:
) p* P* @( e' k% @
5 d& l& Y& [0 Q, ?5 `7 d* Q9 \5 u
% C3 O7 E2 L8 C b/ o6 y第34题,SSEintrinsicsmmstoreupd命令的功能是, D* ]5 q# i5 [+ R! W
A、对齐标量存单精度浮点数
2 e. p4 l0 B+ q9 H9 n+ _B、未对齐标量存单精度浮点数+ @8 ]' ?# B( [% s" G
C、对齐向量存双精度浮点数
2 X* A/ ?. I1 P7 ]( p4 sD、未对齐向量存双精度浮点数
M, \. z' `: ] d( ?+ w- J S& \正确资料:5 ^1 @ f! R6 d7 Z$ C2 P' K% M0 Y
/ J" }8 x) M) T" F! u1 m! B7 J
" ^& S* b9 V. d6 i' w第35题,n个节点的线性阵列构造成本为) @7 |: n6 L9 s2 f; _
A、O(logn)$ A- V% U: |- ?% h Y
B、O(sqrt(n))1 \. ?, o( I- H
C、O(n)6 u; E, U3 A3 Q8 x9 j1 I$ {& p- N
D、O(nlogn)
8 Y% C( R& s: Z$ N5 u5 [正确资料:
" k5 I! B3 [! d0 m5 b
$ e3 R- l1 z+ e* o% V
& V: Y& G' Z. Q/ r第36题,为持续提高CPU性能以下说法正确的是$ H; {* N" U( t4 p# E, A% q/ P
A、只需不断增加器件集成密度
# v p7 I# h! h! m2 r fB、只需不断提高频率
: z8 ]% o1 ?/ W8 ~0 e0 `C、必须利用并行技术8 h5 q, f K/ B" @
D、只需提高功耗
6 E5 {* [& z5 D0 o正确资料:
# f; h: K; y7 Z- C" N6 p
) Z! e0 G. U+ P- Z& ?* E, F, d% U. P% Y- k
第37题,Flynn分类法中下面哪种体系结构在实际中几乎没有意义
! S2 H( @0 ?- j7 S! {7 U) ?; FA、SISD& M* r: p+ m8 f O1 u7 f
B、SIMD
3 Y& m {" E0 O. U6 j3 wC、MISD1 K+ R4 ^6 j: f) p3 P
D、MIMD
% N2 N" W/ |1 N正确资料:2 ?; z- ~: s; ^* z; [: I6 K
4 y: d5 o2 ?& s( m5 a& B5 Z
4 G7 V0 H& s& {2 d) Y. f) Q第38题,对于多线程各自进行本地运算然后由主线程汇总结果的模式下面说法正确的是# S) G6 d1 I4 K: {9 D
A、在同构核心上,线程运行速度一样,主线程无需等待,直接汇总结果即可 a! g1 c% g: G$ h- \" e# Q0 i
B、线程运行速度可能不一致,必须采用同步保证主线程汇总正确结果& W7 \3 G5 h/ K# ?
C、太多本地运算,不能体现并行效果,不是好的模式
6 N2 L! C+ p7 w+ e) k( OD、主线程汇总结果在性能上必然不如多线程并行汇总结果; B- E4 `, C" \8 e0 s" u
正确资料:
# X* {9 K" p7 t4 p* i% Z! ?3 @& c: |- m
% T6 h( f1 b/ ?1 Y I- J
第39题,关于ompsingle指令下面说法错误的是% x% t. T4 {7 T, O* E( J E' n
A、线程组中只有一个线程执行代码/ W1 c c, `: ]4 I
B、用于I/O或初始化等任务
6 d- b- i) O e' _' I3 e9 aC、是保持数据依赖所必须的* P) X" Q8 H, b, ~( w3 x f' Y
D、入口或出口无隐式barrier
7 u5 b( ] ~3 ^4 ^0 v) w" U正确资料:
5 r6 m! O8 [ \6 \
, D. r; Y0 \' [; j; A1 W, E2 G8 O1 K9 P
第40题,对划分输入数据的策略下面说法错误的是
/ Q: }2 ]; b' X; f1 g8 A1 UA、当输出数据很少时,需划分输入数据8 |4 m f1 Z* z; N
B、当输出数据存在依赖时,需划分输入数据
/ A0 ?8 l* y; p, f/ j0 tC、通常最后需要汇总结果# f- Q P+ n0 N: a/ _8 ]
D、由于不是直接划分输出数据,性能会很差$ A2 d% {& F9 g" H2 V- N0 i: t9 M+ |
正确资料:
7 ~4 O/ T# r4 Z6 L6 i% L* h7 R
# [+ g) W0 P- U: m5 p6 D5 A4 n3 l o5 f9 B
第41题,下列子句中不是OpenMP的同步指令
6 T7 h7 H" T4 W" V ^5 K7 dA、nowait
# j/ k; ]8 ?7 Q( d7 x% M; q/ `" I1 `B、critical9 N1 V7 [2 _7 w& e. |" d
C、atomic2 Q R* a/ a/ j
D、barrier: B: y. G. k8 H& I+ E7 k
正确资料:
( F( u/ p" a6 [7 Q8 A+ M
, ?8 J& d8 ?# W" T. T
8 _6 D% W$ z+ S) ~4 _9 K第42题,MPI程序中发送和接收消息的两个进程必须. E8 V2 b- u) ]/ l$ S+ B# f1 i
A、在同一个网段中# ?8 O2 d* R% q+ v" k7 w E
B、连接在同一个路由器上
9 J# P7 k7 a0 u, bC、在同一个通信域中
% y8 u. B( C1 b F( WD、以上皆错0 l+ W0 n$ k! ?8 H* Y: a4 I Q
正确资料:
; @1 G8 `4 g- f$ V) y8 L# p6 b7 j8 v# @3 p$ Y0 ]% @
c; \ |. b8 A
第43题,四位助教帮助教授批改300份试卷试卷共16道题每位助教负责批改所有试卷的4道题这是一种任务划分方法
. F, a7 f. S( `! `4 R NA、数据并行
: O/ `9 l/ s- IB、任务并行
9 y- ~6 G" r% s4 [C、搜索并行# h8 `2 A: H( T. u/ G
D、预测并行; m$ w7 h1 x0 i
正确资料:2 h$ @- u2 k$ o8 p1 _9 e
" X0 c+ K8 t% D: S, _
- S* a9 @% X/ u: v第44题,实现任何时刻都只有一个线程进行共享变量更新的OpenMP指令是
3 ]$ x8 X% U: ~- @( Z# f+ H4 HA、omp parallel
2 q$ n( o+ O. ]7 ^; c+ bB、omp barrier
* O+ ~+ A" v% l6 E5 w, P- MC、omp critical
' }9 v9 i& l" z0 _& j: @/ cD、omp reduce7 h& u1 z( U6 g5 K7 Q4 @
正确资料:8 a( f% ~: P5 S. V1 m( \0 z9 E
. a) [( z# P9 Y. h& _, R4 k) s9 z* D; f5 }8 u5 Q
第45题,SSEintrinsicsmmstoreups命令的功能是; u& L2 p; m" ~0 S( L5 u% K5 b
A、对齐标量存单精度浮点数! F+ O" O V. W3 k& f0 a; O2 x" F6 W
B、未对齐向量存单精度浮点数
0 C7 }; F1 U! X8 Q# hC、对齐标量存双精度浮点数
5 h2 L. x& e& t# _% r% CD、未对齐向量存双精度浮点数
4 e7 ^! O4 r4 f/ m正确资料:
6 r$ M) s" T0 A" r
! F: `- F- q8 _* }+ y6 \# S, X% C* m/ [; z" n9 o& M* G' i
第46题,利用cacheline一次读取多个数据字的机制优化程序访存性能其机理是
3 s( o! N+ s$ V3 S. S; mA、降低了访存延迟
- x& q" ]' m5 ^6 y) }. GB、隐藏了访存延迟
. e; `9 j: a. c9 MC、利用了cache空间局部性/ x, ]8 ?% \% Q3 N% C3 K" [
D、利用了cache时间局部性+ ?" l! |5 ^6 `/ h
正确资料:
- y( A$ y7 M) [% H% C( o
" Q4 D: {. w, C6 H0 E: ~/ g* ^- M7 N) x, P
第47题,伸缩性的含义不包括
' m4 G' ^0 g% ^A、硬件能升级扩展: [. S6 F- N- v x p
B、扩大系统规模构造成本增长不快2 e$ x# @% P$ x) C, H
C、程序在新硬件下仍能高效运行' Y0 }! p6 Q' |; l4 [- b0 u
D、程序在更大规模系统下仍能高效运行
+ u/ R4 s4 T" J: I$ ^正确资料:
+ f6 _; E4 e/ H6 \5 F
" E) H( p1 p* e! ~) X$ Z5 E( Z' l% W* m- L7 u2 F; [0 h
第48题,在下面问题中SIMD并行更适合
8 J& ]. U( U9 |1 P' ^A、搜索
5 v* O2 b) x4 W0 I3 {6 H# Z8 b2 }B、排序; ]- B! H) ]1 }+ U3 q/ m: G% ?
C、矩阵乘法# C; ?% `6 H' Z
D、构建二叉排序树
' `, p1 F; p0 U正确资料:
' M" W/ g6 Q$ v' n
8 L6 U( X& `/ W0 H) W
7 f8 j( J& w0 h9 K' Q% [2 g9 E第49题,每个AVX寄存器宽度为位
' u2 d& a; y8 }A、32
: \" M- |: l/ v" K" f" uB、64
& n ~- B+ n- h H$ AC、1288 [& ]* U# d. j4 s4 n7 _
D、2567 Q- Y+ e4 k& {* j
正确资料:
9 A! e) m8 x, f% s' c$ M3 t J8 r
0 Q6 B* c, z4 l% ^$ N资料来源:谋学网(www.mouxue.com),关于OpenMP循环并行程序的编写下列说法中正确的是
8 R4 A: t9 @: u7 M& ^1 R+ DA、程序员需要编写线程创建和管理代码
' u% ?4 m: X$ T1 U7 s+ s- oB、程序员需要编写循环划分代码4 N, ?' F1 K* a9 Q4 d- C
C、程序员需要编写调度策略代码( Y7 ?4 J- K% y; R, c
D、程序员只需指出对哪个循环进行并行,循环划分和调度策略是什么
" D$ U% S5 B1 e3 s( X8 }正确资料:! P0 P9 y! b2 N4 t: t0 j
& U- y2 f! z! d, C) u1 S' s$ k8 |
% j4 l" g, j8 s# i: W5 M
4 j2 G+ U8 p% s1 a' J
' n. D6 _2 A6 s9 M6 W F5 T+ ]$ u! \& W9 u2 E
2 k& V+ P. l: w ~) r+ v' O! Y# V+ w5 x2 Z
# D. o. h1 ~5 j2 F0 b% H' W7 v n, W/ z* g- N. M# `, M4 |5 j5 N
2 l) O& S$ ?2 {: H3 |5 U/ b7 v8 T% b! b" d, X
* G% ?9 A& H- F
. Q- ~" i! s0 p5 K/ t# y
|3 ]3 i4 f/ S& q |
|