奥鹏作业答案-谋学网-专业的奥鹏在线作业答案辅导网【官网】

 找回密码
 会员注册

微信登录,扫一扫

手机号码,快捷登录

VIP会员,3年作业免费下 !奥鹏作业,奥鹏毕业论文检测新手作业下载教程,充值问题没有找到答案,请在此处留言!
2022年5月最新全国统考资料投诉建议,加盟合作!点击这里给我发消息 点击这里给我发消息
奥鹏课程积分软件(2021年最新)
查看: 2268|回复: 0

22春学期(高起本1709、全层次1803-2103)《并行程序设计》在线作业答卷

[复制链接]
发表于 2022-5-4 23:28:14 | 显示全部楼层 |阅读模式
谋学网
22春学期(高起本1709-1803、全层次1809-2103)《并行程序设计》在线作业-00002
# T& L* f- x5 ?' _: {试卷总分:100  得分:100. P* T9 O# D% q" B# w
一、单选 (共 50 道试题,共 100 分)9 }% K: {( Z! _
1.对单精度浮点计算,MMX最高实现____路并行。  |& X8 g5 O& r  {1 g# w! w
A.2
/ r' s! @' D. K5 }* PB.4
7 B+ _4 Y% G; j4 fC.8+ ?8 R: U) E1 O& M' Z+ M
D.16( t' @! Z+ @. f  y
资料:$ b  B" t) L8 ~9 r3 l
6 o# Y* o( M+ G/ x. `$ u! i  i
2.从线程检查主线程是否要求它退出应采用____。+ K' K  \( d5 M, u1 D7 k0 g/ w' c
A.pthread_join
+ }- ]$ S' u# C* l% f8 ^) zB.pthread_cancel2 F% L3 X  r# S
C.pthread_testcancel5 }- J. t- _, k: O( J4 N9 W- u/ B
D.pthread_exit
) g& s5 y3 a' W& `9 P. X9 ]% p/ m资料:. L  p/ m" |. w0 h

1 N) `, p% ]; t, b$ ^3.条件变量相对于互斥量的优点是____。
' r/ r+ l, G) [A.是多源状态5 V7 {+ u, j* W3 _* a6 w2 G
B.加锁解锁开销低
. a& ?/ w+ T  S, @$ W+ I% sC.条件不成立时阻塞线程并自动解锁加锁
8 K3 t9 f0 u- s" FD.以上皆错; L- k# J+ S7 s' n. ^6 U
资料:
, P: p/ S/ g; ]. U7 ^/ m$ @9 F/ |7 }% m0 v: E9 [
4.编写矩阵乘法的SSE程序,若矩阵元素为单精度浮点数,则应对矩阵乘-加计算的循环进行____路循环展开。
6 i2 D" n1 b/ m( ~A.21 L6 L: b: L) T3 h
B.4
% |: ^. U& {. X* nC.8
) p! i- W% i0 R' X% ], y+ iD.16
8 D$ b7 Z' z' h7 c3 h资料:
- O2 D3 H3 A* j" H7 x( g; _3 A) J% y5 x" D
5.float a[64]; for (i=0; i<60; i+=4) Va = a[i+2:i+5]; 系统向量化访存是按16字节对齐的,则此向量化程序每个循环步产生____个内存访问操作。& h2 ]- s5 J. \4 Q( `
A.10 C# \: r& {* E1 H4 R- W
B.2
; x/ ^& {& z% _' _C.3
8 k% S3 F' _' e% p( \D.4
) K3 m9 [8 n  F资料:! P/ n: d0 Y( U0 C

! y5 M! b- [* O+ }6.全球500强超算在CPU、网络等硬件上越来越体现出采用____的趋势。
8 ?% C5 _* Y* r4 Q4 s% K! u5 M/ n) GA.特殊硬件
& j: `: g$ H( KB.通用硬件+ R5 v4 W) p; B$ z$ b: D
C.非公开硬件
* n& V0 L9 A7 A+ @6 p' tD.廉价硬件( g( G. I4 {" E9 t9 i5 q
资料:. {9 k! B  U: Y7 E# D

  n; @' F' ~4 G8 q! d9 Z4 @7.并行算法设计所做的事情不包括____。
0 L# E) u- W. R8 @5 M1 \7 LA.分解计算工作分配给多个处理器! A; x1 K. p) i4 s& C
B.保持数据依赖保证结果正确
+ j8 D- H( ?" a  h7 PC.确保不能产生重复计算, Y* d% @) X/ d! }6 c
D.尽量降低通信等额外开销9 d( {; d, {9 i$ O$ P1 e6 U3 ^9 g
资料:
' [7 V8 j4 s, |. m+ N6 r0 B$ K& c0 e; d. z
8.CPU cache大小为32KB,64*64的两个矩阵进行加法计算,下面说法正确的是____。
- v' J, I& a' U% vA.可利用cache时间局部性优化性能. W# W% D( @+ G+ e, H
B.可利用cache空间局部性优化性能
# a/ }  t7 \! ^" ^; Y4 VC.可通过矩阵分片优化性能& T) b9 p) f$ b2 ]3 I
D.访存方面无优化可能. J: Z# `0 `5 H. `
资料:
( d! N' I6 N! y7 @; F* O' h. [5 x+ l( I5 y" z: w( j2 F
9.pthread_join的作用是____。) S: |4 j( [' G9 i1 d3 V
A.强制终止指定线程( P( v. |0 H3 X5 t6 B
B.检测指定线程是否结束; Q* C6 c9 e/ [1 P) B% r& U5 I- A: D
C.等待指定线程结束才返回
# K% f( \5 ?* i# s( ^& lD.向指定线程发送数据
. k, n* u0 n) x/ `资料:) }9 T2 c7 ^' n, T: n0 e" i$ ~
5 U  A! }9 s5 m- ~# Y( H7 b
10.使用____无法直接实现"主线程等待4个从线程完成任务"。
* t' y" R- |+ W# O6 z$ AA.1个信号量+ E1 v9 u& u! [. `/ J0 D
B.障碍
8 E0 @* I& X& z+ c# ~C.1个互斥量
' u5 \) M! C+ K2 F' AD.4个互斥量, w2 H+ x# b5 q1 g% O' B
资料:
! j& F9 }( T+ r( [$ h# G! w3 R; k: X* F
3 @* }5 l0 R$ L- x0 q11.OpenMP并行模型是一种____编程模型。
; c2 O: u# ^& O* v- @4 Z# w- M' iA.静态线程  j( S, j% I) C* w& F) F% o; U
B.动态线程
3 m" Q' j$ e6 d. G. P  YC.混合线程) A/ ~. Y, d" x% m. \$ c& F
D.众核  [' A9 p! I  P; Q; J
资料:
# ~  b0 [% y# E% }6 L7 ~0 ]5 {5 i2 \- G- G  m) p- r1 r1 E" Y! P; K
12.关于MPI_recv对消息的区分,下列说法正确的是____。
8 r3 f5 x4 Y$ J! d4 L; ]! eA.只能使用消息标签0 U* e; v' V% G  l. e
B.可以使用MPI_ANY_TAG3 e! I/ Y) W  E$ r
C.可以使用消息名( H% `: x) T4 I( x
D.可以使用端口号
' r( T+ N0 z) n* W+ M资料:
. x, _& {0 c5 ?# s: y4 k: U. f# `* c( h: ~
13.推动GPU应用于通用高性能计算爆发式增长的开发工具是____。
+ K5 z3 x) G9 E0 K' d2 GA.OpenGL
4 z+ H6 U, i0 T% Q  r1 n" v9 yB.OpenCL/ v7 W6 Y6 P/ f7 {7 p2 n. V" k
C.DirectX! y* {9 X4 Q( [0 G' `
D.CUDA
2 f. d2 q- j/ c) Y$ ^资料:
3 n9 j, g8 M% A2 Q
5 G6 i# t; s( i. P4 _  P8 _14.OpenMP是___的一个常见替代。
4 f7 r; z- L1 S# U) C! B9 @& I4 Z4 N& qA.SSE
) i4 D& `( Y& o! k% x7 c/ m, f6 uB.MPI4 z; }1 `1 T+ s9 m  h
C.Pthread4 _. S, b# l5 P! P& Q( Q" f! I) d6 n# M
D.CUDA+ k2 T( |! g( O7 q4 A" z1 g2 ~
资料:
0 M' V6 ]* G" z  G% P# U$ F
! L( S) o' d, `/ B+ G" h9 w15.一个AVX寄存器最多存放____个整型数。
" g. e$ g2 x5 L" J/ {# eA.2# `, b1 V: K$ e+ w3 r2 n' f
B.4
- f4 j2 K) B  x6 D2 q1 b. ]3 v) QC.8
) w7 D! z/ Q4 \" t' yD.162 \/ M9 z0 S- B) v! B% H# c
资料:
& l+ D5 [5 h8 ?9 Q+ s
3 [( [! N* O- f6 b% h4 K16.一个Neon寄存器最多存放____个整型数。! X+ N5 ~' \; `! w9 D
A.2
' x: r) c( t2 B1 S/ ]B.4
5 j- p; n4 m3 ]% e6 fC.8) a1 o/ M( ~0 F7 W& F
D.16
# t# [6 ]/ W9 F- w, E' c: j* i资料:' b5 T" @7 J; e7 K

. E6 A" S) B% Y3 s3 @. ?17.每个AVX寄存器宽度为____位。
" A: P+ k9 A5 N: VA.64
( O! l( y  s, O. K. pB.128( x6 ]5 t+ p- y: a8 O
C.256& p) m  c/ g' {/ j1 P. D
D.512
2 J" D$ ^6 r3 T5 M  E0 w" `资料:
7 s! F$ q1 l: {2 ^, O+ z5 U( }7 @8 G. V9 Q7 O9 t+ V8 [  W+ l
18.以下____是MPI基本原语。3 q8 z8 t/ F9 f: Z
A.MPI_barrier
' t; k3 I0 l) \0 gB.MPI_Comm_numprocs
4 r1 q& v5 y4 R8 IC.MPI_Comm_rank
- X0 M2 d$ b* o% G* }& I2 z8 `D.MPI_Comm_Send
6 z: i  W! b: ?" w资料:
, V( m, D% h  Z" ?# u
& H% y) G- Y+ D  ~) H! i5 h! d% U; |19.天河1号、天河2号、神威.太湖之光总体上都是____架构3 t( h$ q* M; T9 G( B
A.单核( _) G2 Q  b0 H7 R
B.多核
% v/ l5 h  [  O) UC.众核
) x4 j3 {2 Z" d0 YD.集群: T8 f( j) Y$ K4 k( t( {- i) ?- Z
资料:
  O; [6 A3 i' A9 r8 p( C" b4 A
! }  _% B' s+ i. h% K/ G8 b20.编写矩阵乘法的Neon程序,若矩阵元素为单精度浮点数,则应对矩阵乘-加计算的循环进行____路循环展开。$ B) K# T9 L. |; g3 Q9 c
A.2
5 K0 m. J3 D$ DB.4* x* F' w' F" T. k+ m
C.81 j* ?; A, s' b0 x4 a0 z
D.16
! f& X# X) H# L" z* e. k0 O" @! x资料:2 `) e7 L7 {9 v& l3 F0 U
( L9 I; |7 \3 R
21.执行pthread_rwlock_rdlock时,____的情况下加锁成功。
; T/ v2 n9 t0 x9 zA.已有一个线程上了写锁
$ S: Z# ^2 R9 J, p) f6 c; iB.已有多个线程上了写锁8 C) V3 l5 X( U
C.已有多个线程上了读锁
! p0 @/ {- l+ h. |D.已有多个线程上了读锁和写锁+ S0 b: }9 A! @9 d
资料:2 e: ?" k& m5 D& `3 P3 R% V7 }) k

1 E. s+ o+ H- A7 R22.AVX是____平台的SIMD架构。
& [: e3 b" G9 B" iA.x86
  `) \/ o5 A$ \+ q2 j3 S$ P  \B.POWER0 A) D' b! R" @, j8 q* {
C.SPARC
% O: j  A2 k3 W# n& S+ gD.ARM
0 C2 v; d# }; b% l: D' j资料:
8 _* b5 W* J# U0 m, L' A0 K0 e2 T" l
23.和一对多广播对应的组通信操作是____。; {: A0 M! @! Q! D8 ?
A.多对一收集
- J7 @: B3 L# ZB.多对多收集
0 m% i* a. v7 t9 L# E' J1 Y; iC.多对一归约
% ~: ~$ k3 C' S/ n0 r& @D.多对多归约# c  f/ L; B( p* W: Q8 K* Q
资料:" S1 ^$ ^0 Q2 N8 l. m9 I( K

  ^1 g  u) Y7 P  |24.两个n*n的矩阵相乘,将所有n^2个乘法计算划分给不同进程,再将对应某行某列的n个乘法结果累加得到结果矩阵对应元素,这是一种划分____的数据并行。
/ I2 U0 m9 M& X  J& i  i- A: gA.输入数据+ I1 B& \/ d% T7 n! ]; z4 W
B.中间结果( o. x/ v1 a% O+ C: w" ?8 c0 s
C.输出数据) k" w! }# d2 }' M* b4 e$ j
D.临时数据) C& D* i" q: G; p6 o' T0 f
资料:
1 Z- Z7 E" |9 z9 `- L: ]# s" v) F
25.为防止编译器不支持OpenMP,应使用____实现OpenMP代码和普通代码的条件编译。
1 T  r" |) S* T5 K* cA."#include "
: C6 h; k7 u/ U' }) @% DB."#pragma omp parallel"
/ U" d/ r) M8 ^3 f! D8 wC."#ifdef _OPENMP"7 a' X! j& C1 E: d
D."#define _OPENMP"8 u8 x1 Q+ m& b) K% M% D3 l. `9 E
资料:
+ n7 c& X+ ~" m% W; S3 B  M& O' }( V/ V- W
26.对矩阵每行排序的程序进行多线程并行化,对矩阵采用____。
9 T% ^$ [  i& c- |) I/ `3 b# dA.简单均匀块划分即可保证负载均衡
: f9 _" M' E  l. g2 q8 aB.循环划分才能实现负载均衡
2 J4 h  Q( |6 I8 g0 ?C.动态划分才能实现负载均衡
3 V" U. h6 O( f- D6 l! T$ xD.随机划分才能实现负载均衡
, c) ~, {8 L! I: \- D8 j8 O资料:3 o- w) P# `% Z, X
% W: v" j3 S# y) h/ k5 Y* |* A
27.加速比计算中串行时间应该取求解同一问题的哪个串行算法的时间____。
+ t/ N: v( r) TA.任意一个串行算法0 l5 d6 z* ^' _! b. O
B.作为并行算法基础的那个串行算法
4 H; N# C5 k! a% t3 x, h( ]! f& GC.已知最优的串行算法, R4 m8 e0 l- M/ p9 E
D.所有串行算法的平均时间  d; F7 {3 I1 V, D& s: J0 D
资料:% s  T$ h1 d  T% [, [& Z8 g4 ]
6 h1 v0 d, k8 ~+ H7 f+ V8 s
28.当处理器数量不变时,随着问题规模增大,效率增大对____成立。
/ g& U" j1 j( g+ `3 }A.部分并行算法; y% n9 R: X+ O; J2 X1 Q7 E
B.所有并行算法
8 n- b9 x5 }/ J: b+ I( W9 mC.所有并行算法都不$ S# ~" c" M- ~! K( M- U
D.以上皆错7 @; }2 j1 v7 L+ r- L; P  w3 o
资料:
  G8 }$ {0 R8 Q( j8 K; ~& M5 g+ @
3 N2 q8 ~9 K) O0 Z' }29.使用一个信号量实现"主线程等待4个从线程完成任务",信号量初始值应设置为____。
. x) Q$ m8 g' [- \& B: k6 g* TA.0
1 R- D$ D0 C0 @8 m/ y# s% w0 TB.19 z0 g# M) S0 R/ ?/ X' M
C.21 a# b& L" U3 B9 n/ @/ W
D.45 x5 _0 r3 u. K. D* y! W
资料:
: N6 f# e# S  y  {) F! F' I* H$ y/ @. {# S1 R
30.OpenMP循环划分策略不包括____。
5 |( g7 a: ]9 d* KA.static4 J- c8 j; ]- D) [1 E' z5 `3 S9 e
B.fixed
& C3 l1 ^0 P0 K! L% k: W6 xC.dynamic
* z' w# Q: {% V; G7 YD.guided+ m' _) P# y( \+ L, M- F
资料:
3 m- i5 b. ^% H) T& G- [# J( P$ ^$ I4 C$ l/ R
31.矩阵乘法问题更适合使用MPI的____编程模型。
4 x2 V. d8 Z; P! B$ B+ RA.阻塞的2 g% j" ^" ^6 o/ j$ M
B.非阻塞的. X% Q! T  i  X& x8 u. {! L3 r* l
C.对等的
" t& k7 b, ]# J$ F. \D.主从的6 r! S5 t' j8 [  x- Q0 h; H
资料:$ N1 O9 o. z# Q- u4 _" J; _

- ]2 A  R1 E) A" {# i32.将寄存器设置为4个给定单精度浮点数的SSE intrinsics指令是____。& c% t, e3 g* X
A._mm_set_ps3 H2 H% p5 x' z1 b! l) e! e* A" N
B._mm_set1_ss
5 X8 R6 I2 x$ A- `' L( LC._mm_setzero_ss
9 k( q! Q( s" ]' kD._mm_setzero_ps
1 m% U" ?9 p0 K0 O) J资料:! ?0 L( i. k1 g+ |  Y2 O- Z

2 ?) D0 S) S: H33.控制流语句进行SIMD并行化很困难的原因是控制流语句导致____。' y+ z) W, d- g! {$ d$ }7 a7 m  e
A.连续数据执行不同指令
* P5 c2 ]* ~4 h, O* xB.连续数据执行相同指令+ m4 c* R+ W% P
C.同一数据执行不同指令  V" A- t! s/ d+ U% N3 s' h( X
D.同一数据执行相同指令5 S6 b* t- g; c! b6 o3 h' E8 f
资料:
) w) H/ O& _4 ~/ ]' \8 ^- f2 {, o" m3 z, }# _
34.n个节点的超立方构造成本为____。
' O, c, y# v, n$ \( q2 \# \7 o) VA.O(logn)
3 B3 U, n& L  xB.O(sqrt(n))) y: e; f+ H" ?2 `/ P- P6 Q5 L: Z
C.O(n)9 U8 a7 p1 B( q" \& u. f' g- K
D.O(nlogn)
: G+ ~: O; f8 U8 @9 d+ X6 J  {资料:' u4 l) h+ }' g* R

3 a. n  n3 g* o. Q35.MMX有____个专用寄存器。" p$ T- s- b' {. J- c
A.4" F+ O! v' J: l* `$ E3 ^) r
B.8
/ e2 X. B2 ?6 ]C.16
. N# ]8 ^/ q" s. g8 a) B5 bD.32( {# w4 `  x( z0 {
资料:
/ R6 ?. l7 L  [/ w/ h8 F
! Y. o. K$ d2 p36.pthread_rwlock_rdlock是对读写锁进行____操作。6 @9 _" q( ~( ]; Z
A.加锁6 }% C8 Y6 f/ D: T" d  G* n
B.解锁# J7 h* |- E7 T- M1 M7 j4 p4 k4 x
C.加读琐" w9 E# O* J1 b& Y' ~! n! F
D.加写锁
5 h7 q" t7 W4 V3 \( |, a) A! ]资料:% Y3 t. p4 [* i+ o/ l- ^& [

4 r: q1 F- p3 ?* J4 a37.对下面程序,说法正确的是 # pragma omp parallel for num_threads(thread_count) \ reduction(+:sum) for (k = 1; k <= n; k++) { sum += factor/(2*k-1); factor = -factor; }
2 {) T( {9 h! V5 f8 @2 nA.破坏了数据依赖
7 }- N: A6 G0 f9 c' C/ @B.未破坏数据依赖/ Y5 }% @# d# ]: n' H$ R( J$ x7 z  s
C.取决于变量声明
7 [# R; ?, v1 i4 P, QD.比临界区方式性能差7 }+ }2 c* Z2 T! W. g" h5 X
资料:: N! z! ~) ~& x1 Y. J9 F! U( d
4 K- x2 R+ J( k& k: U
38.以下说法正确的是____。
9 p; b( w7 ^$ [  T0 |8 HA.多对多广播的高效算法基于一对多广播的高效算法/ u, p6 s9 M& @& J8 {, k1 o4 V' Y& e
B.多对多归约的高效算法基于多对一归约的高效算法
8 a. ~' S& Z5 N6 k( l( RC.多对多广播的高效算法基于串行的一对多广播算法+ k1 O. B  |$ W4 j
D.以上皆错
8 O9 x; m/ b4 _1 ]4 e; F- v0 b1 E资料:
) n8 |5 \7 T4 E* {8 O" A# l+ \* Z: o; e" K3 D5 P+ g
39.为了实现向量计算,SIMD架构还需提供____。
( I: K5 b: N% ^, ^A.更大的内存容量! V/ o9 I4 S3 t2 }  b  ?% c( c
B.更快的内存传输
6 X) R" M1 H# h5 D6 o& c$ eC.更宽的寄存器( J) O8 R" a& f: l% {
D.更快的网络传输
# x5 v' r  F! u3 D2 J6 f% {" e- z- `) r资料:
) u$ _+ l! Y- p8 g( M
' g$ m. ~( A* G! J4 V" Z3 `) C; C! h40.Pthread不支持____。
' {8 W- M$ ?0 V# NA.创建并发执行线程4 T6 G6 t6 I: J* ^# Y& z& g' P
B.同步  b$ H- ?' Q7 [1 I) Z; [: i$ K9 M
C.非显式通信
- K2 v2 i* u& I9 E6 |; H. nD.自动并行化
0 a; P  S" S, F* X8 M2 o# ?, `( E资料:
6 f! O- o. ~4 R- y/ ]6 V& H" [: k% u1 W. d* i' J
41.一个AVX寄存器最多存放____个单精度浮点数。
; O! p. N7 b5 X, y6 h5 h, G0 `- `A.2
7 {0 D- V1 k' B! {; ]' U2 S; ^B.4
: p. M% U7 V! [1 c2 ~. xC.8! c2 W' p3 ?8 R* k4 f( T( Q# p* p+ @+ ~4 b
D.16; i' v5 j  p/ Q# r8 I6 t
资料:9 W" w( v" a! }3 w3 ~

/ D; `/ b& i0 k0 x! S42.SSE intrinsics _mm_storeu_pd命令的功能是____。
% R. p) `! f( A8 @A.对齐标量存单精度浮点数
7 U" D* z0 S$ j1 x) pB.未对齐标量存单精度浮点数! E2 V; a. M( k7 t3 `- N7 [: w* ?+ `
C.对齐向量存双精度浮点数2 q0 d6 k$ K2 T( A4 }
D.未对齐向量存双精度浮点数
2 E; \8 |! s6 ?& Y7 X" w5 k1 x资料:9 G7 ~& ~7 J3 m# B
5 H5 L7 O- I, Q& Z7 N
43.一个Neon寄存器最多存放____个单精度浮点数。) x* l( s! a* I) z+ T+ C% H
A.2) s( G7 {- W, {  k8 x$ {
B.4# F( D; c2 y) j& _0 b; q
C.84 a. p' R; a" l" _/ c( U
D.16, x# H. i; d# y  J" I- v3 v. e
资料:' h! B# [& i3 J; h# _9 n. i! c
7 [1 A- r; u. p' [' |/ G/ U
44.在用pthread_mutex_lock对互斥量进行加锁时,若其已上锁,则线程进入____状态。1 P& O  w% }" t4 v
A.初始化
4 d- f+ F: C; ]4 Y6 W' X( rB.阻塞/ m+ V; ]( b& i* G. T) J" d3 A% i
C.继续执行
& |% K: a. L2 D6 P5 N6 W/ k, bD.销毁
6 D* W- J/ t! o  U- }% F6 Q资料:; t( n6 o( L! x2 V( P6 d
* K1 {) V$ ]4 I$ N% t
45.对单精度浮点计算,SSE最高实现____路并行。( Q5 r5 _- |+ R! n
A.2
- T4 \$ A' K% B" G, dB.4- O& {) a  h" Y. W. j4 f
C.87 H& n4 ?" ]+ e8 i  {1 N$ J" @
D.16$ T- p- }& L, u
资料:
/ {/ ?  g% u( E. {4 |/ W( h6 I+ I2 j6 H! i4 c1 Z
46.SSE intrinsics _mm_hadd_ps命令的功能是____。
# I$ J! K( t8 {9 G2 u. U/ }A.寄存器间单精度浮点数向量加法
5 B" Y4 r5 I* K1 [( ?% nB.寄存器间双精度浮点数向量加法' t/ Q4 ^) d* s. z3 w( G8 E
C.寄存器内单精度浮点数加法
+ c, @. W9 E9 y% u! i7 |$ lD.寄存器内双精度浮点数加法
" ?7 w, ?4 C7 m1 n; m资料:
. C2 @" @( J7 q( ?
" M, X6 D- `4 o8 K/ D47.有大量分支指令的程序不适合下面哪种体系结构上进行并行化?3 a: u; _' N- n' R
A.SISD  g# u4 m; P9 v
B.SIMD: T3 u9 S4 G- s! K5 I9 M' I; I
C.SPMD! _* W- \2 Z, S. G
D.MIMD
" `7 Q" P+ l! {资料:$ t' Z7 Q" I. X6 C
# m6 s! i$ B+ Q0 ^" r
48.对于加速比S和处理器数量p,下列说法正确的是____。
0 G5 u8 |, ?. O9 xA.有可能S>p6 L/ c( X* `6 t; }5 k& W3 ?' k4 `
B.必然S<p) w2 X' I/ {$ ?- n5 \  l
C.不可能S=p
) V2 ~2 h+ Q4 |D.两者无关联' l7 H; Z1 x. O3 y3 \
资料:3 |8 J9 d. t  _" W1 v
' L: U- Q9 X# n- t$ r
49.在编写使用n个线程进行n个数求和的OpenMP的程序时采用临界区技术,则多线程版本____串行版本。3 F0 h0 v) l3 j. |( T/ x
A.肯定快于
  U5 S$ R: ~: K. e. p4 T7 _* N+ uB.肯定慢于" `' ^, u9 ^6 T+ o! v& w! H5 w5 u
C.可能快于) |' S' w6 [1 g
D.以上皆错
* v& D0 F6 j+ m7 B资料:
/ Q- G1 ~9 j& o3 J+ x, n! u- f
# `! f1 b& p: H% w50.两个矩阵相乘,若矩阵总规模小于cache大小,则优化访存的最佳方法是____。! @$ X8 K3 p4 I7 X; ~7 ~6 g- _
A.先将两个矩阵读入cache再进行乘法* v5 `/ {  J% G3 L
B.先转置第一个矩阵再进行乘法2 D! l7 c0 y$ I5 O) I8 ^+ q
C.先转置第二个矩阵再进行乘法, {- x; B5 M$ D, z& s2 T
D.以上皆错6 k! o' ?! }% \6 H
资料:
# _  ^: N; ^% N# M3 H9 B. R' h9 w' Y* }3 {! P& `4 x
' Q! J( |& V- T7 ]( W
3 S6 \9 ^: h0 H- ]$ X
0 C0 l, Z8 l/ r( p' g6 |- k

1 C8 Z9 O6 Z9 x8 I6 y7 W( K! d1 H7 D. Y/ O; R- g. v! j% T
' A7 J/ A; Z2 g9 G
6 L. V1 |5 a" ]" U0 |" F1 v6 L

7 z! P  M" [- g; `5 g' \, }# O' p5 M7 x0 v. ]0 a# z* _9 T

# _0 M, `$ ]% C( ]  ]9 r
( {+ c& n8 n. p& y. d$ L, [0 L

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?会员注册

×
奥鹏作业答案,奥鹏在线作业答案
您需要登录后才可以回帖 登录 | 会员注册

本版积分规则

 
 
客服一
客服二
客服三
客服四
点这里给我发消息
点这里给我发消息
谋学网奥鹏同学群2
微信客服扫一扫

QQ|关于我们|联系方式|网站特点|加入VIP|加盟合作|投诉建议|法律申明|Archiver|小黑屋|奥鹏作业答案-谋学网 ( 湘ICP备2021015247号 )

GMT+8, 2025-2-24 16:40 , Processed in 0.091668 second(s), 16 queries .

Powered by Discuz! X3.5

Copyright © 2001-2025 Tencent Cloud.

快速回复 返回顶部 返回列表