奥鹏作业答案-谋学网-专业的奥鹏在线作业答案辅导网【官网】

 找回密码
 会员注册

微信登录,扫一扫

手机号码,快捷登录

VIP会员,3年作业免费下 !奥鹏作业,奥鹏毕业论文检测新手作业下载教程,充值问题没有找到答案,请在此处留言!
2022年5月最新全国统考资料投诉建议,加盟合作!点击这里给我发消息 点击这里给我发消息
奥鹏课程积分软件(2021年最新)
查看: 1663|回复: 0

南开大学22春学期《并行程序设计》在线作业-2

[复制链接]
发表于 2022-5-5 00:51:32 | 显示全部楼层 |阅读模式
谋学网
资料来源:谋学网(www.mouxue.com)并行程序设计-[南开大学]22春学期(高起本1709、全层次1803-2103)《并行程序设计》在线作业. p$ r5 d1 |' r: e8 A
试卷总分:100    得分:100
' V5 [- N, I' C) z, a第1,对单精度浮点计算MMX最高实现路并行
* Y( j1 j. d! z- BA、2
9 S) v0 r8 Z* j/ h6 ?; RB、4
, ]& D3 @# ]6 f% _C、84 J, r5 w7 a  o* x5 P- `# `
D、16
' }/ ]6 D4 X6 O正确资料:
5 |" Q! n% `4 V/ g/ D( T% z1 v" m4 L: {# h. b7 v' ]

1 Q5 O. R2 [0 ?, \/ W) \) n# h第2题,从线程检查主线程是否要求它退出应采用) R; v) M- K( m5 P' W
A、pthread_join
4 j  J% r* p% r( g: C" oB、pthread_cancel5 J7 s3 P7 |0 o
C、pthread_testcancel
& w5 @; \' i  S8 Q, LD、pthread_exit
) f& q9 B3 s" X# p, f2 _正确资料:; X8 Y6 W" {6 i2 @0 o% S

: K0 c3 {: u' Z1 T. h
# u$ B2 E7 p! H% z第3题,条件变量相对于互斥量的优点是
- Y/ _) z/ W+ y& X4 ZA、是多源状态+ U6 s" A/ v1 g  Y  V
B、加锁解锁开销低; p2 F7 R5 z2 R" B2 J8 }
C、条件不成立时阻塞线程并自动解锁加锁; S4 R" c0 B, C" r1 P# f
D、以上皆错
  W- s& ?7 t# M2 r3 |4 y  n正确资料:
9 b; m9 o" {) M( P
, V) W* Q1 y% E/ i" x
7 R+ R: C; S5 s3 M/ P# e2 y第4题,编写矩阵乘法的SSE程序若矩阵元素为单精度浮点数则应对矩阵乘加计算的循环进行路循环展开3 k. I: Q# C9 t
A、2
( t* T8 W6 a7 W$ s/ B8 PB、4
7 M' {3 o" w9 ~C、8
. U9 h1 g$ t+ g% w# c1 ?3 q$ \D、16
1 x% Y5 k: x4 y- h' E; ~正确资料:# Z* C& m6 S6 e0 n* `7 F" k

/ H9 [! K! d4 U. S/ g1 I
& D) a1 T3 Y2 ^/ M- T资料来源:谋学网(www.mouxue.com),floata[64]fori=0i60i+=4Va=a[i+2i+5]系统向量化访存是按16字节对齐的则此向量化程序每个循环步产生个内存访问操作6 F0 d# B5 ]3 N, M. Y- [4 K9 m
A、1
% B  {3 ]6 t& |8 k2 J: sB、2
  Y7 T8 }$ o' G2 \8 YC、3: r0 v5 d& W% r' y0 N% I' V
D、4
' r' b; E$ M/ x4 w* J正确资料:
; D2 g: l# P$ O
$ P% D% |* ]* n+ Y$ N
. M  {) m  W2 H第6题,全球500强超算在CPU、网络等硬件上越来越体现出采用的趋势
6 @% y: D* ^, z* H( H7 ZA、特殊硬件; p4 n* T$ j) C0 S
B、通用硬件8 [7 E: }2 @1 @+ ^
C、非公开硬件1 ]! y- }/ v" j6 r
D、廉价硬件
: m6 z+ c/ @2 q4 l7 P正确资料:
' W) X0 p6 a5 R" h* f! \# R
1 s0 O: T' x2 ~$ c2 k( \& R3 C) y+ K+ V4 h8 z8 I
第7题,并行算法设计所做的事情不包括
0 U5 m- Z; h, k& u8 dA、分解计算工作分配给多个处理器
% D, T  @7 h8 Q; TB、保持数据依赖保证结果正确7 y9 s7 o. V# q2 w+ T1 @
C、确保不能产生重复计算, R/ y8 @, J$ b* t/ C
D、尽量降低通信等额外开销
# C" ^2 }' P) F: a0 X$ ?6 I7 G正确资料:
' O+ P  D# b2 C7 `
. y' K* M$ l  i3 `3 l
: C. Z! l/ L! ]+ R! r第8题,CPUcache大小为32KB64*64的两个矩阵进行加法计算下面说法正确的是, F) P* ^1 a8 f" O- o+ ]- p) P
A、可利用cache时间局部性优化性能
3 Z, Q/ K  Q" W* j5 pB、可利用cache空间局部性优化性能
! t% v  ~5 A! [1 ^7 s4 G3 K( P# q1 HC、可通过矩阵分片优化性能
4 H) i- p2 _! y! g. ZD、访存方面无优化可能
, C% \: d$ Q4 x8 W# `正确资料:
& c. V7 C) G% V  i1 ^1 h
% J) {! `9 T8 c, k6 p+ K: }- ?% H' j( c- H: X/ d
第9题,pthreadjoin的作用是3 `' p4 {  |- d' z  \8 e
A、强制终止指定线程
, I7 {. W/ a- P3 b6 DB、检测指定线程是否结束  n: {/ q$ U5 a
C、等待指定线程结束才返回
  ^# k2 y; V0 t1 h# {$ |D、向指定线程发送数据* y- L) q: W9 D& p
正确资料:8 d# n* x4 s$ c7 o6 V( n
: w# z! h; p! [5 j0 T$ ?, a7 v9 G
3 d6 j* @7 W( W* T
资料来源:谋学网(www.mouxue.com),使用无法直接实现"主线程等待4个从线程完成任务"5 O$ k3 n$ _. W0 \, v
A、1个信号量
4 \  B# ^# Y; R& O. G1 u0 mB、障碍" x# P# }) V" [
C、1个互斥量% d! ~8 E% _& B: C3 v
D、4个互斥量6 G% G8 g0 x" O
正确资料:& v+ k) U! H5 l- w
8 C7 |" Z9 N" G% E
  p7 r: P! J' p0 I
第11题,OpenMP并行模型是一种编程模型
- N& p) J2 z. Z% O; _  [+ zA、静态线程( ?4 d4 r* a' @7 c0 L2 G% v
B、动态线程
- m) |# K; {) Q  Y$ \) X: O& gC、混合线程
. c: E) @% ^0 rD、众核
, p2 ?, V! {) L9 |' E, t正确资料:; v  @+ b6 A* \; V, M' ~0 {

; F3 L6 H/ F. E2 i
) q) b. V; f1 b$ x( g0 P* [资料来源:谋学网(www.mouxue.com),关于MPIrecv对消息的区分下列说法正确的是
9 q7 N4 M- {: N# Y, Y; Q9 ?1 z# vA、只能使用消息标签
( v. v; x3 P8 LB、可以使用MPI_ANY_TAG
0 G5 J5 J+ O# `C、可以使用消息名
( o; s, e) c& V6 L6 |D、可以使用端口号
9 G1 O* v  c4 [  j正确资料:" n$ z2 K% Z. u# o

9 P* L# {( [2 |/ Q( t2 @" g% X6 f% K$ w* o
第13题,推动GPU应用于通用高性能计算爆发式增长的开发工具是8 q+ ~1 Z0 L$ ]2 V6 k9 V4 f- v8 T
A、OpenGL
% m1 [% {: o9 \  W! DB、OpenCL
8 b4 J* A$ ~: C# U5 C5 J: n! t$ XC、DirectX) N* E( F- W% e6 L- x
D、CUDA
1 _$ \- p; ]+ t& O* d正确资料:1 ~- b4 ?7 H- z. o1 J7 R5 w

% R& P: }* `# w7 K8 B# S! r. n# }$ _7 G
第14题,OpenMP是的一个常见替代$ T, F3 d+ u( Z% y  \
A、SSE# z" r; m; J3 }; r$ N! P
B、MPI
+ [( C  d6 A. RC、Pthread
/ D% e+ A9 }* _9 G# ND、CUDA
# A. C1 D6 B1 U/ e& n正确资料:
  i+ V; c- c1 s% i- O1 w/ ]5 j6 A% M
0 W. i$ j9 N3 \) _
资料来源:谋学网(www.mouxue.com),一个AVX寄存器最多存放个整型数
3 K$ z9 \0 t8 T, [. R. \" KA、28 O) Z  o2 Y" C$ H3 g3 w8 o! T  J
B、4
1 N7 z1 g; c1 |C、8
0 l3 y. a2 m( q6 Y7 C7 I/ tD、168 z6 G8 n8 w6 s8 Y. t$ T
正确资料:
) N6 H1 T; T/ |0 s2 z3 a5 t
/ a; \# |- _. q) K3 ]5 f2 U% d$ G8 s0 m9 o8 I4 d8 Z6 X. N
第16题,一个Neon寄存器最多存放个整型数1 n5 H' I, w- M: ]
A、2
) P- r0 i/ m6 h8 |B、4- t* g# {% P* c' c& D6 R- f
C、8- s) M2 C: @8 |; x2 q- p0 M7 Y: q
D、16# ~5 B, T  w+ }% K2 E8 X
正确资料:3 e) W0 i. W$ X

' W8 ^0 t+ m' u& B7 h
0 C9 z. C' B* A! h# L* I+ x1 n5 l第17题,每个AVX寄存器宽度为位
  G% ]8 v! _& t1 H- Y  SA、64$ ?2 }# ]; E  U, t- T# ^1 }0 n0 L
B、128- O7 P  h, o5 F* y" Z
C、256  m# u  G- [1 ~2 Z
D、512' n- U: x& O6 v" H( o
正确资料:4 M4 @8 v: [0 L0 w7 q; G

: v8 [# h1 O' n/ V: E! C5 y+ |1 Y
4 j4 _3 J( A* T  \第18题,以下是MPI基本原语( `& \# @  v% A" L! _  O
A、MPI_barrier
( h# x: z3 u6 z( ^& _" Y3 M% [B、MPI_Comm_numprocs0 L# u/ W7 s5 D9 l2 J
C、MPI_Comm_rank
* B3 Q+ \- y# o7 ND、MPI_Comm_Send' r$ E  D4 |) T) e' {, k
正确资料:
+ a% |$ ?5 y0 m$ a7 o0 B
1 q0 y. w/ s1 P" M2 N0 C: O% m; z/ c9 x0 H8 `5 v$ M& i) Q8 c
第19题,天河1号、天河2号、神威太湖之光总体上都是架构( D- g' b) c3 I. ]- s- W  p* `
A、单核4 f0 m3 _# @" p+ d  v
B、多核
; o) q4 G( m$ f. KC、众核5 ~4 N3 r5 k; C6 i$ s
D、集群
$ H7 {) y# Q8 }8 \/ J: f4 `5 u正确资料:
# T  B: Y9 x, }& e0 Q0 g2 }0 B5 F
3 t8 b; y  E8 r' m7 l9 \" \% S5 G2 x# C2 w, Z
资料来源:谋学网(www.mouxue.com),编写矩阵乘法的Neon程序若矩阵元素为单精度浮点数则应对矩阵乘加计算的循环进行路循环展开: ^. d0 U# s, q8 Y$ X5 f2 G2 ?0 G
A、2
, Y* W- k) |# ]; UB、48 D( a& l5 x' C, T& H: g' P
C、8
5 w0 \! h7 C& O8 I- {D、16
" Z& a6 N  H/ a' [) H4 u' Y+ q正确资料:
- k$ E3 {& |7 \6 ]1 B' S2 m2 e# I! w
, }) M/ b: x2 i! G
第21题,执行pthreadrwlockrdlock时的情况下加锁成功6 s- v  t* e- m, F
A、已有一个线程上了写锁- r# q, n; B2 e. J; o
B、已有多个线程上了写锁, \# p+ F* a0 z* ^! z/ r! v+ N
C、已有多个线程上了读锁- u1 G# H+ ~  C0 H) ~) q- `+ _
D、已有多个线程上了读锁和写锁# n. l4 L; N2 L% _6 i
正确资料:% B# ~4 T  S% ]$ b: I

/ o% v8 B9 O) v! a3 G" j8 \2 G9 [: X# ^" z& E( h% x$ g0 q  ]; }
第22题,AVX是平台的SIMD架构9 `, a8 R4 z/ r3 ?
A、x86  D7 b: X0 |5 r
B、POWER
. z, {0 i5 z* c  mC、SPARC+ J) p( i' h" P% o' f
D、ARM4 p. J, R/ M& g  Z
正确资料:$ u, I: [- D& ]! y* s; V' a! [0 j9 X

; x( h- Y" [. U5 n" U1 _/ P
$ v  U2 u% t$ m- j5 x第23题,和一对多广播对应的组通信操作是4 O8 N( k2 M2 V: k
A、多对一收集5 h7 Z! p( a9 s% T" g( V- r: Z
B、多对多收集* L2 i, R/ M, J; O# M+ O
C、多对一归约
0 K# B2 i3 Z% |% \0 p4 r5 w! nD、多对多归约/ ]1 Q/ G; e" a, r7 F9 k$ N
正确资料:: z+ g0 s: u! O. i! S/ h4 P! ~( n
) l; D4 ]) a* _- [" t
% a# B' ^2 A) X# J9 l2 E) [9 v
第24题,两个n*n的矩阵相乘将所有n^2个乘法计算划分给不同进程再将对应某行某列的n个乘法结果累加得到结果矩阵对应元素这是一种划分的数据并行
& X$ Y# P$ ~/ x5 F+ i+ `* m0 I9 EA、输入数据
* c" M: b7 \% O2 \) O; VB、中间结果7 u9 g& Z  n8 b& I2 k: i
C、输出数据
( k/ Z- ?" G, W% y, x0 VD、临时数据& G: H8 e0 |, H% K. J
正确资料:, ~# b" t4 X7 ]0 |. ]( V4 j
/ p% g! v7 K0 n+ {: K  u

- w6 h0 L& e& s  G资料来源:谋学网(www.mouxue.com),为防止编译器不支持OpenMP应使用实现OpenMP代码和普通代码的条件编译
& h, @- I0 X$ fA、"#include "! U3 g# e. X9 z  ^" s
B、"#pragma omp parallel"" V# P  m5 z7 a5 U( f# w: c6 O0 l
C、"#ifdef _OPENMP"
* r3 u% T$ i1 uD、"#define _OPENMP"
* v$ i1 Z# d( G9 ^正确资料:
( C/ c! H* f0 Z2 _% ~
+ t) w( I: F1 r- Q" B$ x
0 t; D# P) F& X0 \$ ?第26题,对矩阵每行排序的程序进行多线程并行化对矩阵采用: @! o6 L/ N% A* P  J
A、简单均匀块划分即可保证负载均衡( s" Z! n9 b$ }( W/ J- T" s
B、循环划分才能实现负载均衡
6 G! ]( o; `! ^, {5 @7 l7 r- y( xC、动态划分才能实现负载均衡! w" K! _% r# W( Q4 |) l
D、随机划分才能实现负载均衡
8 ~1 \9 E4 W" L1 L% B正确资料:
/ _. C* X" v& T1 t
. [' j' n5 v2 C
7 r+ b: z: t& Y& r- O第27题,加速比计算中串行时间应该取求解同一问题的哪个串行算法的时间* K/ N+ g- f) h" ]" L
A、任意一个串行算法  q0 s9 p/ F) Q$ \0 l% Y
B、作为并行算法基础的那个串行算法+ v  O6 V' y" y5 o) J5 q( u; R- N4 y
C、已知最优的串行算法0 a0 j0 ~& Q1 m' C+ L0 a
D、所有串行算法的平均时间
  b& T% v$ V+ b! D- q% U+ g正确资料:
3 I, h; R) ~/ r: U6 f# E- n2 r, Z7 _; f+ @3 w* W' v

! E8 S' W- \9 h8 h/ M第28题,当处理器数量不变时随着问题规模增大效率增大对成立. i" z0 i9 n1 ~$ [% F4 {2 S3 j% ?
A、部分并行算法
( @' y- u+ S( L2 ?6 c4 [' k0 MB、所有并行算法' x8 A: m* _" `: [- V: U
C、所有并行算法都不
' O& G3 M6 ~1 }4 qD、以上皆错3 q7 k1 S0 _, l
正确资料:! j' U# C1 p% i4 R# M
' U8 i) ~: R7 e& F; N% u

# l/ V$ `5 [4 a& S第29题,使用一个信号量实现"主线程等待4个从线程完成任务"信号量初始值应设置为
$ e" `9 ]2 m- ]$ `$ L) g6 k9 HA、0
2 q& h* j9 q5 Y9 Z* z, eB、1
% v$ G5 i7 X' }0 _# E- \C、24 o' \7 |4 l3 g% g( O
D、4
) o2 n' U$ o* y/ s+ g- P  C正确资料:' E" r/ T& A$ Y( Y$ V

6 ]. S* |* r7 m7 @8 b/ o5 n8 Y* p/ V
资料来源:谋学网(www.mouxue.com),OpenMP循环划分策略不包括
8 [: i& p+ E; Y* P) d5 }A、static/ `' u: n2 c% l
B、fixed5 @$ q$ p  U$ d& Y, S% D+ G
C、dynamic
# k6 {- e0 |2 U, I% U" T4 e: S; cD、guided7 t2 p/ h' K8 D$ A, T; O
正确资料:
- l& }! C3 r: f# T  l* d& N. A+ k- b) [1 M; ?; J: V

: \- A0 ?5 h+ T/ @% t7 n0 r第31题,矩阵乘法问题更适合使用MPI的编程模型
6 t8 a2 k- D/ o) X4 kA、阻塞的
" y: p& n1 c3 lB、非阻塞的
; Y# Q4 U! i9 I: |' B' g0 E4 RC、对等的4 `& `) Q3 i: g) J7 p8 `% K5 R; B
D、主从的5 A* W( {+ `6 {
正确资料:/ E* _! W! r# L* \$ x4 j

& ?1 J5 U# {1 b
; w/ y& M7 O5 d: p, L# ~第32题,将寄存器设置为4个给定单精度浮点数的SSEintrinsics指令是; i. i" a2 p7 K$ J
A、_mm_set_ps# ^" X5 ?' W  R+ K0 d- Y, O; u0 \
B、_mm_set1_ss
7 ~) P2 i- @" yC、_mm_setzero_ss
- w- D% m! [1 `% jD、_mm_setzero_ps: M+ Z7 \+ ^7 x' K8 P& M
正确资料:5 k* I0 i" u/ R, ^1 }) `
9 o* I" ^4 [/ K; q1 M
8 k8 x8 R2 T) U9 V( a
第33题,控制流语句进行SIMD并行化很困难的原因是控制流语句导致
: o$ C$ o& O! v! O. [$ k+ wA、连续数据执行不同指令3 P1 O1 L; A$ g5 B! c$ [1 v* E7 Y
B、连续数据执行相同指令- Q9 W  D) Q! k2 o- O  K
C、同一数据执行不同指令; p7 ~6 n  E4 R- p# a" u
D、同一数据执行相同指令4 d6 h% }, B" }+ b4 x0 y
正确资料:7 ^/ e# [' B0 ^( _3 T1 ^

3 {0 _1 w' @: |+ N9 `* d. z- O* G% k5 I
第34题,n个节点的超立方构造成本为
1 ]: h4 h7 O0 S( v5 q. bA、O(logn)4 t3 `) `, l5 A8 N
B、O(sqrt(n))
: \' D; M& p: y6 P) O" NC、O(n)
9 j! M5 Y2 C) V) d: c) _D、O(nlogn)
0 _' q5 [9 `+ ~! M5 }3 `& ?6 d" u正确资料:) l( y) I) V4 Q2 q2 J

# o. z2 {$ {( J, t1 ?2 O0 A' ~4 b$ h! ~5 k$ V3 c* x
第35题,MMX有个专用寄存器
# a4 K+ T+ c7 @A、43 d5 m8 r- o- n
B、8
" B6 |' k2 Y) ~. s5 E. M" CC、16
. T3 h' Z/ y" H% r% cD、32; x# Y# _# g, W# }4 A) \8 ?; y! h
正确资料:
4 ^. H" g5 J- v- v2 d2 x( p) t. B6 X, t% A$ e, Z/ P8 m
% h0 }% F% v4 ?. s/ e. \% _
第36题,pthreadrwlockrdlock是对读写锁进行操作
  \* J+ V5 t5 B1 `* R1 ]A、加锁  r5 `4 n/ V1 A! ^. {9 L
B、解锁
9 d2 \/ S) }; Z9 V6 {& iC、加读琐
1 f3 V6 X( `; t5 ?- N3 z; T" O5 tD、加写锁9 ~: @$ G7 O! `0 ~& j& ]+ g( Y
正确资料:1 h1 C0 q& k& s8 n4 i# Q. }1 e
0 V! R' M6 d# [6 }6 d

4 J8 d% r+ h" L7 x9 j- I第37题,对下面程序说法正确的是7 C$ b) o2 d; l4 T$ M4 I# g4 e
pragmaompparallelfornumthreadsthreadcountreduction+sum
0 D8 C, \! T/ u& dfork=1k=nk++{sum+=factor/2*k1factor=factor
, i# \5 A$ B( f# x: }}# B9 m4 P/ J7 p* Z. B, T4 |
A、破坏了数据依赖
5 _6 l0 k2 X- ZB、未破坏数据依赖) x4 l$ j2 v  `2 t; ^
C、取决于变量声明- [9 C- M$ |7 K  a+ ^8 k
D、比临界区方式性能差
1 g/ ~8 w5 F- z! s# Z7 a正确资料:
/ v1 F' c# Z' s% v& _* O
: ^* w. D* \6 n+ c1 V- w( w5 J& |. A# _+ i
第38题,以下说法正确的是
( d1 ^/ ~% w* v4 sA、多对多广播的高效算法基于一对多广播的高效算法4 B, l9 X9 I$ d# s
B、多对多归约的高效算法基于多对一归约的高效算法
8 ?1 z8 S8 W+ \C、多对多广播的高效算法基于串行的一对多广播算法
, b5 ~9 l( i' S0 r% o0 O* GD、以上皆错
! |5 q( M3 m4 J: R3 F  c( Y正确资料:,C,D, y4 H8 K& [4 F: e( k9 l

! s# p3 F' \# E6 q! K5 Z; z( v- _& T5 t3 Y3 S
第39题,为了实现向量计算SIMD架构还需提供
% p8 H4 e: Y  ^* L. E" AA、更大的内存容量1 t6 Q) |" [3 Z# K- V
B、更快的内存传输
% b/ r$ v9 X' t% d% u% s, }C、更宽的寄存器
' x3 e8 T1 M6 y( R" N1 LD、更快的网络传输2 R$ q/ I. x; q5 R! K0 U* e
正确资料:
: @! m* R) I5 A1 [- g! Z- u6 Z& ]9 |7 c
/ n/ Z# Q' E$ |5 @9 m! R! b
第40题,Pthread不支持/ E" ^7 A% ?3 r8 E4 g
A、创建并发执行线程8 b1 j, {) l4 }' H/ _1 z
B、同步, @* K* B4 b* a
C、非显式通信
6 t( J- L* ^) M# P( C; RD、自动并行化
6 @* R: P' k, K9 Y9 P; u正确资料:
" A9 |& }, [! U: Y5 |: v; d' r  c, U" S$ S6 ?1 A
" A2 `/ H* b, ^9 Z0 g; C
第41题,一个AVX寄存器最多存放个单精度浮点数
0 Y' W( f) t. LA、2
8 o& U# `; [1 c7 H) A& tB、4
  G9 ^( Z) }8 p1 G& a* x/ D) ~% i) y+ CC、87 O; y0 v- a; H
D、16' o6 A2 c1 f! u( ^+ p( c- D: F
正确资料:
  q  ~7 v; \" p. L3 ]3 H, |# |2 U/ ^7 U  o+ `3 A$ Z  g) a
+ H& Z. S8 g* ]9 m% Q
第42题,SSEintrinsicsmmstoreupd命令的功能是* w' H7 G9 P! W/ i3 L6 k8 i
A、对齐标量存单精度浮点数
( N6 |1 l& O1 p! jB、未对齐标量存单精度浮点数
' N( [5 D8 k7 i1 g# gC、对齐向量存双精度浮点数3 c/ i6 k3 t% L* u( d# I
D、未对齐向量存双精度浮点数& ]) b5 q  \! ^0 C
正确资料:5 N  \9 n5 b& T/ F1 E

7 Z! n* u& Q* N/ |5 o( q* @1 k. Q- Z$ }/ j/ V+ j7 s2 H
第43题,一个Neon寄存器最多存放个单精度浮点数
; o5 X+ f* o  O/ m& h" A; L  bA、2
- v2 ~. k1 \7 o1 y( U" I1 xB、4# @0 \& J  S4 Q/ j8 F$ A0 z8 V
C、8
) x. Z5 Q6 X" c* q2 p* GD、16
( w4 G0 q9 s: F- b4 u4 y6 I) M正确资料:" @9 G0 z8 A! `. @' `
! o3 ~" V: X0 c$ }9 d7 U* G, F9 i9 r
; H( }+ _' f- i
第44题,在用pthreadmutexlock对互斥量进行加锁时若其已上锁则线程进入状态7 v9 |6 ~& s& H9 r* Y
A、初始化
" n! Z, o) j) f- o& IB、阻塞
7 [. {5 i) }8 XC、继续执行; S3 p6 |7 {# m
D、销毁, ^: S9 x+ S( ~5 M9 a! |# M
正确资料:/ |" `/ z/ k/ b0 o3 J

0 ?  ?4 J6 p: \7 s1 n: R9 n  t% E- r. j
第45题,对单精度浮点计算SSE最高实现路并行# s! ~; M& s4 j; Q( j) _
A、2: y& p7 W& [" p
B、4
5 J  E' t+ e. H5 k" N& HC、8
  C9 o5 ?+ g# t- pD、166 |+ }% h# ?5 L8 S7 z+ Y5 T6 c
正确资料:: C8 a- f9 p* b. }$ O

- B) [# M( ]$ K/ z3 {7 N4 I& q3 E% O' _
第46题,SSEintrinsicsmmhaddps命令的功能是
2 p8 `$ {6 `6 CA、寄存器间单精度浮点数向量加法/ L5 A; U) t: I# e+ o+ B
B、寄存器间双精度浮点数向量加法
8 j# G" W5 d, ]' h( ZC、寄存器内单精度浮点数加法7 r. g: k- V. T  P; ^, n
D、寄存器内双精度浮点数加法' p) c: X% u* K3 \6 L
正确资料:
# a) x' s; S/ q# Q/ y  E
3 |4 O. y; R+ f4 g* x
4 Y* G) ~8 R. _2 e第47题,有大量分支指令的程序不适合下面哪种体系结构上进行并行化
" e$ [- q% r6 J1 Y& RA、SISD
2 N9 N8 Z+ C4 g6 JB、SIMD% v) }& H; g% D0 k, Z! ^; y
C、SPMD
) H3 W! H# b4 b8 |D、MIMD
7 j. h) w6 b8 z  P6 d) E正确资料:& m' |" R3 Q6 e5 m8 G

% w: e  V- x1 u1 T" S2 I  Y$ m
# J; g* Q4 D3 ~- Z8 R  K1 F5 A% o( a第48题,对于加速比S和处理器数量p下列说法正确的是
8 V4 B0 }4 i4 H: M; Q5 `A、有可能Sp* Y7 c4 N! t1 z1 k, z( ~$ u
B、必然Sp
! t; C: l" V) o$ p/ k6 yC、不可能S=p
4 W1 a+ Q- D1 G* r  oD、两者无关联
- M8 x3 B7 i; c7 u正确资料:) D* X$ T' s" R. a& t

: B7 s  W) v; `  I: H1 R# Q/ _4 R: S
第49题,在编写使用n个线程进行n个数求和的OpenMP的程序时采用临界区技术则多线程版本串行版本2 I4 J& ]3 l# n) J) r1 O) s
A、肯定快于! ^; i8 N/ ~$ g: ~7 P! B+ J
B、肯定慢于! I$ z! M% W  l. o4 _% {3 z" n
C、可能快于
) W3 A% W6 p& f+ `6 x( T2 o( j% zD、以上皆错
9 \( g5 z$ H2 t" y正确资料:/ R. l+ A; E( o

' n3 E1 ~' b4 T' Z
2 i: B) w- X; T0 b! a资料来源:谋学网(www.mouxue.com),两个矩阵相乘若矩阵总规模小于cache大小则优化访存的最佳方法是" l5 H- }- ?- _( c$ L
A、先将两个矩阵读入cache再进行乘法
  s0 y+ V6 N( qB、先转置第一个矩阵再进行乘法! P. f! Z1 Q" B: j5 J% M
C、先转置第二个矩阵再进行乘法
7 d4 r# Y+ N$ c' {D、以上皆错
5 j: b0 {# U1 h. x# ]0 P7 V* a正确资料:
% A" A% Y6 L% I& X
0 d* }- Z+ z1 T. Q" B9 K2 R0 \7 `

. f, a0 _; `0 u  e
6 U& I) I% i0 w! t: L5 W( n& `% J( _2 Y2 P

1 q& K6 l  i/ n- i8 c! S
" F0 N1 Q# b4 x% i5 k# B) W) ^8 h$ j( ?

/ u$ L# g6 }) B# Y7 X0 p
+ Q, l. ^8 N: a7 k+ U" _% I8 m* ~# T8 L7 `! d) G
; E! Q' |5 H  B  a6 r8 D) a
: a; o$ P% _8 ^4 P0 I& n

# h; a4 Q" d. Z0 B5 b* o9 y7 P

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?会员注册

×
奥鹏作业答案,奥鹏在线作业答案
您需要登录后才可以回帖 登录 | 会员注册

本版积分规则

 
 
客服一
客服二
客服三
客服四
点这里给我发消息
点这里给我发消息
谋学网奥鹏同学群2
微信客服扫一扫

QQ|关于我们|联系方式|网站特点|加入VIP|加盟合作|投诉建议|法律申明|Archiver|小黑屋|奥鹏作业答案-谋学网 ( 湘ICP备2021015247号 )

GMT+8, 2024-12-25 22:08 , Processed in 0.096373 second(s), 16 queries .

Powered by Discuz! X3.5

Copyright © 2001-2023 Tencent Cloud.

快速回复 返回顶部 返回列表