|
资料来源:谋学网(www.mouxue.com)并行程序设计-[南开大学]22春学期(高起本1709、全层次1803-2103)《并行程序设计》在线作业6 m7 L7 [8 e* b& b G- O
试卷总分:100 得分:100
* n& K4 s8 o" f& Q, @& G/ t* ^( f' S, C第1题,对单精度浮点计算MMX最高实现路并行
/ M4 u: a0 G6 M2 Q3 yA、2
6 ?* {! ~# j; ]# b, ^- Y7 tB、4" K2 c* q6 {! N! D7 g4 c |* A
C、8
) v8 t6 m! O: ^% h6 e8 u) e8 k8 pD、16
6 N; Z$ M- ^8 W! H正确资料:
4 J) j# }" ? Q u; [0 X0 z* r" s( V7 _3 E; E; T/ C% _% w
! L; i( u/ s; m0 e5 n& e/ J# f! h第2题,从线程检查主线程是否要求它退出应采用
) Z& X- o: R! D6 l" n, n; G5 |A、pthread_join
/ P5 a, {/ S) P1 ?" gB、pthread_cancel1 D' a- q: Y4 u$ Z1 S% H
C、pthread_testcancel
3 c7 g4 [. u( sD、pthread_exit
9 M$ N' f, C* ?1 ]正确资料:
) g, y! e9 `. ~- }2 l9 \, h* g% F+ V7 G$ x3 e6 x6 \' y
9 V/ f% N( ?2 S$ W, @! X1 O
第3题,条件变量相对于互斥量的优点是
W. {- ^0 U: rA、是多源状态3 B; L0 |+ U: y% |# d
B、加锁解锁开销低. d% D4 _- } {8 t$ w
C、条件不成立时阻塞线程并自动解锁加锁
4 \* B0 N# e% [# g0 L* E5 o* LD、以上皆错* E8 H: n: H2 x0 \1 O
正确资料:
; w% [, ? E9 }' I
+ r1 T- p( \- F: G* e, ?" D0 b u8 X, X7 z* J8 X% y4 Y3 e5 ^5 v1 {( h
第4题,编写矩阵乘法的SSE程序若矩阵元素为单精度浮点数则应对矩阵乘加计算的循环进行路循环展开
1 I7 [; v& ^, w% }6 Y! JA、20 W T& X# E/ ]& j8 w/ ~3 s
B、44 ~, ~# {) y. _; C$ [
C、8/ V- j1 f+ g( B2 C4 i' N; S
D、16% F. L, s* Q& \4 K& `
正确资料:
4 ^6 |- h4 m2 v5 `, ]1 f& m& |' D$ s7 S' F7 X8 y' ?+ X; ^
& E5 z, v+ v& G- G5 _! w
资料来源:谋学网(www.mouxue.com),floata[64]fori=0i60i+=4Va=a[i+2i+5]系统向量化访存是按16字节对齐的则此向量化程序每个循环步产生个内存访问操作
& p8 f9 ~6 k5 k+ S( d' NA、13 O$ l6 Z4 l( `2 n6 u0 s7 B
B、29 M8 _# {5 a+ M Z7 r! Y; O7 x% V C
C、3
/ V: b( ] ]6 H! L, O/ lD、4% B4 l z; M& j7 O$ b) R
正确资料:7 C J! ?- V& S& u y
6 `) i! n" r- N
6 I& v( e/ W. E% `第6题,全球500强超算在CPU、网络等硬件上越来越体现出采用的趋势$ S: @2 A% z3 I: b' y4 V
A、特殊硬件# F$ ] P% O; M- M
B、通用硬件
. @9 X2 y5 H* uC、非公开硬件+ p8 B a8 ?; t2 F$ w- F9 Y# n% J) L/ Y
D、廉价硬件
* D( Z: {: j" z0 B0 a. `* w正确资料:
, _$ b& ]+ `: P r: N, s
7 |" W* T4 ?# x) L3 G4 p4 x$ W5 k& F1 I$ F8 N( A
第7题,并行算法设计所做的事情不包括
4 Y- E6 q& D* S- k# {, \A、分解计算工作分配给多个处理器7 ]- I$ ^9 ~+ x) E
B、保持数据依赖保证结果正确
: N* N( P& f% r6 x, y3 zC、确保不能产生重复计算
( L' Y& Z' ]7 \7 Q& N8 |D、尽量降低通信等额外开销; j: w9 M( A M1 h+ s4 E1 d" ^: w! i
正确资料:
7 E3 Y( o- |' h
9 z- C( x1 S4 L f U
8 k9 ^& n: n6 M9 D4 l" ~( n第8题,CPUcache大小为32KB64*64的两个矩阵进行加法计算下面说法正确的是* A+ [9 u. k+ @" _3 ]: H4 e
A、可利用cache时间局部性优化性能
' C! @5 S) D- \9 }4 d" CB、可利用cache空间局部性优化性能" _0 f" ?/ t' E( ?: I8 s
C、可通过矩阵分片优化性能& p5 h7 ]9 X, B" i0 [
D、访存方面无优化可能- t* N, ]0 L4 l+ Z3 v# b5 c
正确资料:
. M4 I5 s4 D- H# d6 G0 F* H: j2 ?0 \5 U0 f9 v9 o
+ c1 A+ e# N: X( Z( i5 J第9题,pthreadjoin的作用是" _3 d; ~6 A1 g: K0 ~6 Q/ q
A、强制终止指定线程
3 r2 b- s# [0 D: }B、检测指定线程是否结束# N/ d% H) z5 C: N$ l. ~) z2 Z
C、等待指定线程结束才返回
% Z& h p- K# E. Z' M# YD、向指定线程发送数据3 Q9 H; j8 \, ?+ j* r2 |
正确资料:
+ b% a T) M9 @' z) O3 S1 w& o! w5 g' h
! b8 t5 v' K8 J$ b F资料来源:谋学网(www.mouxue.com),使用无法直接实现"主线程等待4个从线程完成任务"
+ B L" l b/ m2 `) BA、1个信号量8 U2 z+ ]* f' I' ~% r
B、障碍
' K4 K" z0 f! p% v; K& hC、1个互斥量2 Y3 Q) n; w9 P l6 z8 L! a
D、4个互斥量
; V! O( F0 N+ }正确资料:
- U; m7 n8 I) I4 } r& @( a3 a
7 \5 l5 y* \+ X& [" O' a2 s& P, [
3 \+ V0 z+ D: u; }9 Z8 |- l* y% [第11题,OpenMP并行模型是一种编程模型 H6 z( l. H) D; l6 b8 C
A、静态线程
; n: e/ q; H4 HB、动态线程
8 l( J2 a0 N6 a' t& C+ {9 H; E2 e: kC、混合线程) M- E" r! f* q) X, y7 K
D、众核; j' n2 u: H' F. c% I1 D: a4 [! u
正确资料:
Y6 g4 U3 V# F. B7 T9 v% `/ ~6 k( h! x; F; j* M
1 N) X7 V' f9 p
资料来源:谋学网(www.mouxue.com),关于MPIrecv对消息的区分下列说法正确的是
9 i- J5 M- z% b! E' b) QA、只能使用消息标签3 `0 U" M- Q4 ?! e( Q; M* z
B、可以使用MPI_ANY_TAG
& {: g) G# U+ kC、可以使用消息名0 N+ Y* V7 l: A7 ^
D、可以使用端口号
& k" |5 V4 t. S3 E正确资料:* g5 }6 V- P& s
: _8 _' R2 y+ y( d% B
: U3 Y4 G0 w! C# o2 {- [
第13题,推动GPU应用于通用高性能计算爆发式增长的开发工具是
) s# B8 @- z- p$ K" L4 [: F9 |A、OpenGL
! E2 P: _3 T' X) S* _B、OpenCL+ U8 @* b9 a2 [4 j, J
C、DirectX
2 V- e5 K% @3 H7 v. }/ TD、CUDA
) m6 |: P5 V4 d! {6 l正确资料:$ A/ [7 `* o- ^/ }2 W3 S( K
1 u$ S! d( C% ^! o
$ N5 _( j0 z4 b# C第14题,OpenMP是的一个常见替代
/ e$ l% N) E3 A( J CA、SSE
2 O1 s& j' Y3 _B、MPI
$ Y0 M$ t$ t& T' x0 a+ ZC、Pthread: Z7 L* y! y- q2 e2 {
D、CUDA
0 _( A) y$ E0 E# q# \6 |6 U7 \1 C正确资料:4 K" b: J) ~) l; @! W$ k
( L5 ~: A/ k5 F( ]# F
* `5 B2 c2 ?" I
资料来源:谋学网(www.mouxue.com),一个AVX寄存器最多存放个整型数
' K; C, H6 A" k7 k6 EA、2
q& B6 U) ~6 V* t$ o2 cB、4: `: e$ v. @1 T: X- m
C、8
4 Z- T5 z/ _5 ZD、16
3 X% l7 O. Y6 y7 S正确资料:9 ?: k# `" n" D `- a
2 i" ]/ |( F! I5 `3 l( Q
7 X M3 I# r( y5 n( N第16题,一个Neon寄存器最多存放个整型数
G7 T9 F8 J8 F* PA、2, L# O+ e0 e/ _+ L* Y
B、4! z8 `$ t/ e. L) k( g. V
C、8
8 G8 I6 }9 n4 {0 ~D、16
' }, N3 n- V) M+ {, M正确资料:( C; K6 q! M8 B
! _8 m: E6 u0 F0 W' [ z0 a% B# o/ J) n
第17题,每个AVX寄存器宽度为位
* G) m. T0 S/ G" QA、64
6 n1 \* Q4 q, PB、128! o0 c7 r8 j( O: e$ p5 J
C、256
( A/ L9 Y" f% ^* s g- G6 `D、512
2 k! v. y2 O R7 M# L: }正确资料:
* f% T% r, n" B. \
* e; [! y3 M* F8 O6 d
4 K, o7 m2 V9 Z6 c; L' e# J' ~0 \第18题,以下是MPI基本原语! B5 s2 U6 B, f, M) n
A、MPI_barrier& z5 O, i6 e# {: A4 [: i6 @9 o
B、MPI_Comm_numprocs
/ Z3 A# l+ B( D9 FC、MPI_Comm_rank7 n' d: Q$ f# S# {
D、MPI_Comm_Send. K3 m f7 F9 {0 W9 N
正确资料:
$ v3 u! D+ }0 Z9 h# l9 P% j- }# l3 S( }4 j2 y5 j3 Y
. x( ]- A; C0 m: U, T
第19题,天河1号、天河2号、神威太湖之光总体上都是架构
, X8 P" `; g7 {8 Q( CA、单核
" o5 ^, Z$ c& E; \4 CB、多核3 B5 Q* Y' j, f0 T' Z! J( m
C、众核$ v' t' w! {# X# X
D、集群, x& f! E i. [9 {+ ^0 @
正确资料:" q0 R& ~4 N- w
0 X" g; b2 K, Z- j# s$ @: ]
9 }" _, f( Y2 q \6 w( `0 Y资料来源:谋学网(www.mouxue.com),编写矩阵乘法的Neon程序若矩阵元素为单精度浮点数则应对矩阵乘加计算的循环进行路循环展开
8 l% h: Q- |; r2 Q% [A、2
% T# Q' i' ]- G8 z' W* X% Y; eB、4* l, D$ v! \ Y/ e% e
C、8# j! ]4 b% R9 v- Y9 H2 M% k P2 h
D、16+ D/ s7 e) `% E9 M8 F6 ]4 W
正确资料:# Z, L9 Q5 z1 O6 u H
' i- I# R7 a3 P2 H& Z% A
9 @; C3 P7 u, ]! I# m* ?) U% l9 Y" p' O第21题,执行pthreadrwlockrdlock时的情况下加锁成功% z1 S: K. b3 S* v# k+ N6 p
A、已有一个线程上了写锁) g1 o# Y# s/ ^9 R
B、已有多个线程上了写锁9 X* o @. U: N0 D) `& h
C、已有多个线程上了读锁9 {* B% c8 H' J5 E
D、已有多个线程上了读锁和写锁
a6 ]5 _# X7 H2 \4 B* [正确资料:9 T$ F E$ K9 @3 K; w, p% \7 j* g
( {1 t1 B0 c* k9 B3 p' v- W/ {% @& p, N7 l5 s
第22题,AVX是平台的SIMD架构
/ ]: a/ c; T+ @+ o7 bA、x866 j3 e1 Y9 ^: T O n w4 |
B、POWER4 I+ u" o! I' V& O$ i
C、SPARC
% c9 {& x, x+ B5 j3 M* iD、ARM5 ?6 r* h0 z$ B& Q8 q c/ y- ~
正确资料:" _$ P( j5 Z0 ^; c" v- }
( ]' r4 c9 L1 c
9 y0 B" Q3 {+ _5 p- E& t. y9 U$ q第23题,和一对多广播对应的组通信操作是
4 g7 M& ]: U7 {& a4 `3 X/ KA、多对一收集! t( s3 D% K+ Q+ l# O& _
B、多对多收集/ g, r9 \3 K3 g; B% B: I( ~+ _
C、多对一归约
, D% ^+ A/ {$ @- O" m" p2 E" |D、多对多归约
5 N% W. \! K* f) o- G4 c4 A正确资料:
8 F/ N @/ J2 p5 M3 g3 K) T
5 b' w* _' _7 j8 U* L5 j: h
* C/ X/ u* h7 G* [+ y* p4 `第24题,两个n*n的矩阵相乘将所有n^2个乘法计算划分给不同进程再将对应某行某列的n个乘法结果累加得到结果矩阵对应元素这是一种划分的数据并行
H* N# Q' w5 Y: TA、输入数据( d9 x7 B- B, j" B/ A" X
B、中间结果
$ b2 m# R; q! `) FC、输出数据
( d( a( G3 w* n! eD、临时数据/ y j2 ^/ D( d* p1 |- [8 E
正确资料:
9 T$ M6 g1 @ K4 F3 m/ ^1 K/ f
- q: U+ I* Y& ?" ?4 _0 Q+ p* E# ~8 R5 y0 j) K8 e' |" S2 X
资料来源:谋学网(www.mouxue.com),为防止编译器不支持OpenMP应使用实现OpenMP代码和普通代码的条件编译0 g4 r* B$ y& i$ A* Q
A、"#include "
/ m2 _- n: ?# ]# t' _5 v- vB、"#pragma omp parallel"
5 t1 }0 H2 S$ T: ?C、"#ifdef _OPENMP"
. Q5 J3 L4 c3 x, {' x6 PD、"#define _OPENMP": m( r6 K @0 ]6 U' \
正确资料:# C) c1 E2 m+ q1 B( C' ?" j
6 P+ o* ]" l, j
: R) ?; A8 p/ g ?) Z! ^第26题,对矩阵每行排序的程序进行多线程并行化对矩阵采用
- Y2 c) w3 H4 o* Q; B7 KA、简单均匀块划分即可保证负载均衡- n. f6 N5 V" V9 ?8 B/ y
B、循环划分才能实现负载均衡
5 z8 {5 C4 V0 VC、动态划分才能实现负载均衡
9 @/ G% f$ y4 ^3 \D、随机划分才能实现负载均衡
; s' Z( S4 f/ |: E6 R; o0 o5 m正确资料:
" v5 k2 |1 n! }1 G' `' ]
5 N& c9 g! K) Q2 ?9 \
7 B. `0 R$ h% r" h, H第27题,加速比计算中串行时间应该取求解同一问题的哪个串行算法的时间
, ^8 O8 |8 @5 q1 l, s) |A、任意一个串行算法
* Z" a+ N# {5 W& B& MB、作为并行算法基础的那个串行算法
+ A* B3 z0 N+ n& ?9 A7 H. W! QC、已知最优的串行算法
8 C+ @, N2 P$ _% _D、所有串行算法的平均时间7 e+ f& r. H t3 q; _
正确资料:2 n" f# K+ L, r8 {- {4 T4 `9 Y3 R \
: W4 |5 S/ h5 x" D7 Q( d6 f1 D \% U* e# C: a
第28题,当处理器数量不变时随着问题规模增大效率增大对成立
$ q6 k% q( M+ X/ l. oA、部分并行算法
/ ?* O# Y4 z( b" \) k nB、所有并行算法$ _6 a7 k* Z9 y2 q" J {$ U3 l
C、所有并行算法都不
* Y3 H+ u4 I, o; iD、以上皆错, t. V0 M6 K' {, q# Y4 Z
正确资料:2 s, _9 q G5 x J
$ c. [7 i; x5 J, t f
; y- D8 g% ~- f& O第29题,使用一个信号量实现"主线程等待4个从线程完成任务"信号量初始值应设置为 O2 H7 X- N" `# k$ `
A、0: ~+ H6 d7 S3 P
B、1
) A4 P/ R: l5 d) b6 A, t; }6 B9 YC、2
% Y: P' ^; I. A! A6 r% OD、45 j J, H$ a; j) M) |; |9 D. S
正确资料:4 o# O; U3 i& C0 E. V! N
/ p D' P; E+ q! Y3 C; c1 T1 e/ Y
- f: P: K0 o0 x7 Q/ z
资料来源:谋学网(www.mouxue.com),OpenMP循环划分策略不包括" L& ?2 A8 ?: L, i. B; X8 G) T
A、static& ~) Y9 h" d% Q; s- U# `' {
B、fixed* G+ G& l% p4 V% V& z
C、dynamic9 z/ _6 v0 L: K R+ y P
D、guided
! p* s% H8 j9 X+ q/ g V正确资料:
* k, P1 |" |+ l1 j4 l' \/ T$ l( r& Y
6 o1 D3 P, g7 I
/ N. H7 a" l7 n2 e( t' U第31题,矩阵乘法问题更适合使用MPI的编程模型
2 }* h, a" Q, \" W) `, m& }A、阻塞的 S3 w! t$ `9 m7 b2 @1 x
B、非阻塞的! p, X4 O9 S* H! c7 j5 A6 A1 m, q8 i
C、对等的
" ]# F: Q5 O' I7 h( \$ y' nD、主从的
: L7 ~5 T X! g正确资料:
2 O5 {" g3 c7 K
5 w) M% ^. } u; H- y1 t6 [, n' S% S3 h4 Z
第32题,将寄存器设置为4个给定单精度浮点数的SSEintrinsics指令是& }) z! t+ z- d$ s. E p# M3 m8 A. @+ w- M
A、_mm_set_ps
! a" X, S! b4 \& B1 M7 ~2 X4 uB、_mm_set1_ss
1 C3 c! Z0 b% q1 w. Y6 a3 b# NC、_mm_setzero_ss) ?4 m( J. P% S5 X" R. I
D、_mm_setzero_ps9 ]- C0 ?" q: E. k' ?
正确资料:
; j3 X! A( y1 X; D: a* W8 y j
8 }" c' k/ ~3 N0 U& R4 t U" S* K9 X0 y& D* _
第33题,控制流语句进行SIMD并行化很困难的原因是控制流语句导致
' z4 j* j( w! |+ v# _0 mA、连续数据执行不同指令; b3 R& q& H2 F* [* m
B、连续数据执行相同指令
! m! ?) N0 U U1 _( V. |2 e1 bC、同一数据执行不同指令4 V+ l$ A- R9 ?2 e4 I" ~
D、同一数据执行相同指令
% g2 \8 N) E7 v0 ~4 a1 O正确资料:* w. Q- U+ Q* j% d- L) Z$ K
* T: n6 x/ E% o# w+ E! |
4 z e6 h) F+ V$ r9 a% s- [' \- c第34题,n个节点的超立方构造成本为
2 Q* j& e- V; ^6 H7 iA、O(logn)
/ C3 I5 n( l7 N3 `* p$ L4 EB、O(sqrt(n))
4 P4 B5 }, B) lC、O(n)
1 }5 ]% f& O, A) A$ i; oD、O(nlogn)
% k L+ c* P. ^7 v6 g正确资料:7 @: {9 U5 E3 G* e% E/ }2 r
0 h' O* n3 [( R3 _; L9 R+ o
! k) M2 g$ T" L4 z$ V/ o6 T4 F7 M7 c第35题,MMX有个专用寄存器 ?/ @; |+ ?/ Q' i( g
A、4" F& h2 Q: x, c2 q) _
B、89 K. m/ O" `$ W6 ^7 k( q
C、16
) V1 o6 ~6 V0 S$ RD、32
- r" T" L# S" H! c! x I3 |* {; H正确资料:
5 U1 q4 S2 H% V I, R h$ {' Q" d3 f
$ w7 N7 J" v) O. y3 m, C9 U/ Q0 A
第36题,pthreadrwlockrdlock是对读写锁进行操作
& }- T$ b! \, h# w/ b) |A、加锁2 ~# K" S# ~5 ^
B、解锁9 H! N, l( V3 z9 E; E- a
C、加读琐3 }0 t4 w* p; ]2 e1 S
D、加写锁
, [& B! r. u) W% N正确资料:
* i; f# I7 q* P9 H% T; ~, E( T+ W/ P. B5 ]+ ~
* s6 X3 `/ ^1 _ U
第37题,对下面程序说法正确的是8 k/ a1 v% S) g' {# z% y& z. o# q( Y4 _
pragmaompparallelfornumthreadsthreadcountreduction+sum/ e$ }3 e) s5 k* `
fork=1k=nk++{sum+=factor/2*k1factor=factor4 G1 y$ q; `) `$ r
}
4 y7 _7 K1 @5 H) z. b* G2 g; XA、破坏了数据依赖) }# ?% o0 |3 F# M9 u* I
B、未破坏数据依赖
2 |3 T& J8 R1 R2 cC、取决于变量声明8 Q0 Z5 W2 q; v y7 H, ^
D、比临界区方式性能差
) ^: }3 s+ F. O: O9 ^0 U正确资料:! D+ f6 T2 R+ v0 z
* _ Y h) o( E: F% C8 _: i4 f" a6 c- U/ C0 K3 |! _ `0 P6 v
第38题,以下说法正确的是% P* f0 {" w4 B# W! h' L9 J; W4 c, e
A、多对多广播的高效算法基于一对多广播的高效算法
; U7 }" W7 j" R' v; o7 G* w3 bB、多对多归约的高效算法基于多对一归约的高效算法" ^0 B) P$ D- F* ]# _+ c3 T" ]7 W+ [
C、多对多广播的高效算法基于串行的一对多广播算法
$ X' H* h3 Y/ J5 g: I# X" {+ VD、以上皆错" G3 ~; ^$ |# z% E
正确资料:,C,D
' T. E9 u" L" ^% y, F) ]0 ^6 U, d. t B
' W# [8 o3 _) b1 M" g- A8 p9 d! N+ J6 r& ?第39题,为了实现向量计算SIMD架构还需提供
0 o( m( z$ n6 S xA、更大的内存容量$ D% n1 S$ f$ R+ ?. e" n
B、更快的内存传输
7 ?: ^3 W+ x" w6 b% a- c; |* QC、更宽的寄存器
( j- w ` ^, h- J$ [D、更快的网络传输8 h, ?- _; F+ R' R- B; L7 |6 X
正确资料:
5 b2 b4 W! J4 C& D$ n2 k+ V3 [6 u2 @% [4 S6 o+ V* ?
9 S, |9 T. N- R+ z* ~第40题,Pthread不支持, J9 G4 U% d; ~$ V0 B: _( {/ ?
A、创建并发执行线程7 R2 [+ [+ q/ f5 x" T
B、同步
/ E: e3 n" R. A( W; S; HC、非显式通信! |7 w* h. R6 H u: F- I; K
D、自动并行化
) l9 V* w4 W% [' U# v. C4 N# P正确资料:9 w0 ~5 T( q$ S3 \" n& b7 A; I' J- `' Z2 U
7 k" ]6 X) V- [0 B+ O
- d6 @& I- g: ^6 x7 u& j5 Q第41题,一个AVX寄存器最多存放个单精度浮点数# {% ~$ N6 G! E2 i+ S' O
A、2
) K5 S$ a1 n3 h6 }% c- ZB、4
% B* c6 v! l8 s+ \( w/ E4 fC、8
, Z$ f: o2 P" @- a5 Y3 tD、16
2 k- k/ ^ x- r5 i: n正确资料:
, w8 J' I6 Q# I
7 {. O, G& h9 b5 O0 K6 X, b' e- J/ K9 x; E' O# k' T% I
第42题,SSEintrinsicsmmstoreupd命令的功能是
* s- w' J$ ^5 {4 y* R2 | R1 @$ bA、对齐标量存单精度浮点数& y0 P6 {7 [4 S+ l! q! k2 \; P" ^3 M
B、未对齐标量存单精度浮点数
4 z' X$ p* z% D0 r4 [( }C、对齐向量存双精度浮点数! `7 D! i; m/ M$ }: R4 k
D、未对齐向量存双精度浮点数2 E+ P4 l7 p% Z9 X& P- w
正确资料:
# m; |7 t: S% T. T0 S. }. b: N
0 D4 i6 z! p( F+ o A' |( |, f. F
第43题,一个Neon寄存器最多存放个单精度浮点数
* \$ g- M- H2 D: e8 V% x" }9 zA、2* j5 \% ^ s- x0 w2 Y
B、4
! ]" _4 Q& ?2 M/ DC、82 F3 V4 `- C+ a" P1 a4 _8 L/ S* s2 [
D、16
& F+ a4 m8 M+ X4 f$ x( O( w, T正确资料:
5 I( c% R" j1 f( P# r/ c, X3 r" l/ q2 R/ q, Y4 a
- F5 V) Y7 q5 m; B* p J第44题,在用pthreadmutexlock对互斥量进行加锁时若其已上锁则线程进入状态1 X1 e A; ~( o7 Y# j0 O4 ?
A、初始化
' ?' \% @) v: s6 X; G- \B、阻塞$ [; Q( o. x1 [( H4 H1 F& R
C、继续执行- I1 A% C' S {" O
D、销毁) V- i: d) s4 e& o' f9 ?( _& e
正确资料:
1 Z! s% ^# I# K E$ h% E4 t0 d: i, b( i" b( b) W9 j, l) p
0 t1 Z- c% N+ H( k! N3 _) d
第45题,对单精度浮点计算SSE最高实现路并行. h# L4 f5 c2 d- V
A、2
+ ~ k# h" [4 v4 D. O- eB、4% i' N( T( S' M) J; K" G
C、8: ~- k6 c. B3 I% r; f9 [# V& P9 i
D、16
% V7 W* ?, ]! n正确资料:: ^# U& ~# t$ J. w; t$ M
' e+ ^: Y: p- V5 d6 p. x
) ^+ C: g! s _
第46题,SSEintrinsicsmmhaddps命令的功能是
! g9 }; p8 R1 \A、寄存器间单精度浮点数向量加法
* U2 u7 Z# E% ~' K; cB、寄存器间双精度浮点数向量加法
4 m8 G3 S6 t) L UC、寄存器内单精度浮点数加法
h7 e, G% }& u z+ YD、寄存器内双精度浮点数加法
/ e% g6 R. K3 T9 }2 m正确资料:
" m+ ~2 F, O, A- `# K8 x- z4 \. A+ ~ o0 r; H* [; r
$ O; H! b1 b7 h3 H' ~% K4 \/ `
第47题,有大量分支指令的程序不适合下面哪种体系结构上进行并行化# Y& l7 \# v1 {3 q0 C, F
A、SISD6 z% t! K. Q" b1 X, g0 m
B、SIMD: K% k+ Q; ~, X( ~6 \% h
C、SPMD8 ]# A$ N9 r& R
D、MIMD
$ o" Z+ [% c( V, j) }6 w: X正确资料:
3 n- f- ^% z- W6 S8 W: o, T, z
. f- P8 C9 r8 h) @8 x
) |$ Y# e4 Z9 b+ @% Q- i第48题,对于加速比S和处理器数量p下列说法正确的是
# l' u0 I f5 @, e5 r7 P WA、有可能Sp# X: y# n& C3 S! L
B、必然Sp
% i6 P) U- B7 ~9 k1 W7 y/ ^C、不可能S=p$ V" f) g8 M* H2 k
D、两者无关联# D! N, C' a" ^# N- q7 q
正确资料:
/ |$ ~, r7 N7 p# }7 G. y/ h8 J9 e, v; P. N9 t% S! d
7 q; R7 Y# Z& T8 D- ]0 f$ n第49题,在编写使用n个线程进行n个数求和的OpenMP的程序时采用临界区技术则多线程版本串行版本
4 K6 x- g) e4 _) MA、肯定快于& h0 U7 j# I" r, [7 H- |
B、肯定慢于
% X2 D/ r+ ]1 I& ?" I' L$ |C、可能快于
5 O \- f& w/ H2 dD、以上皆错
$ R2 _: A& T( A正确资料:
5 }0 r" W- ?7 k X, M. |( [! A& [( O
9 q/ b# D& f1 K. a/ ?' R3 Q. H/ D) T1 n6 U0 R$ S
资料来源:谋学网(www.mouxue.com),两个矩阵相乘若矩阵总规模小于cache大小则优化访存的最佳方法是
% \9 U% T. e1 `9 n4 UA、先将两个矩阵读入cache再进行乘法/ \* g |+ s- h
B、先转置第一个矩阵再进行乘法1 C" V' I2 L+ i; |
C、先转置第二个矩阵再进行乘法
, B b. G1 j3 y/ V4 KD、以上皆错: U- w/ d, E! i
正确资料:. ~4 `: X$ l8 q1 {
' G) \; n4 F. h$ ]! n) J
" Z6 C) R1 t4 D+ L6 O3 {/ j2 S1 N8 i1 E7 P
: \& s" B7 y3 R, l" n
+ z9 x# f5 A# b% q5 ~( j
) n3 E$ x' u3 C% K" A/ v, A, n% Z" w" a, b
# O; ?3 ]/ l7 K* v& x6 z
/ T" {, p( J! J' n2 f
4 W+ u& f7 D- Q, `7 T r
: ]: D2 Q1 ^' X. s& E- {- z1 c) V# ^0 x A. R8 x: p+ P
* }( h) n/ C+ W* L5 E% B; e' ]/ i3 o
; P+ t0 p* @# U. d- m% \7 b* N
|
|