|
资料来源:谋学网(www.mouxue.com)大数据技术-[东北大学]《大数据技术》在线平时作业2
7 |; E: a, f; b( p+ _. s5 A试卷总分:100 得分:100+ u7 g- m0 l4 j& d- v' L
第1题,数据提取阶段主要是要提取不同的数据,并将其转化为大数据解决方案中可用于( )的格式。需要提取和转化的程度取决于分析的类型和大数据解决方案的能力。
$ c0 Q, z! |. n5 L X1 M7 n( JA、完善数据结构
! N7 G9 Y: ?, I/ jB、建立存储结构; Y3 Z( U2 W9 [3 Y: r
C、整合验证规则
! Y8 A6 y& Y Y7 g# oD、充实合理数据; h6 z( ]9 u4 p3 T: h1 v) K
正确答案:扫码联系微信客服. C8 z7 R, y: l# c! }
! L; W' W# I) `7 ^) ~- C) Q0 `4 s0 C4 g
第2题,下列关于计算机存储容量单位的说法中,错误的是( )
& l* `5 ^. p: C6 [A、数据规模大
6 F* T& R/ I6 o& C/ q; FB、数据类型多样
# a2 r) d6 ?) A8 V9 p: t% O" t. `2 WC、数据处理速度快
}6 A& I! g9 M" k$ W- w( X! U% W. U. [D、数据价值密度高, V6 H2 k0 X; F9 s$ g3 A
正确答案:扫码联系微信客服5 x- j- I$ l0 ?( t5 U
+ V# m. ~2 G9 G! V5 t
8 j: [( s$ O; G' C% |第3题,时间序列图可以分析在固定时间间隔记录的数据,它通常用( )图表示,x轴表示时间,y轴记录数据值。) |. i- u5 P3 w, K" \
A、圆饼- [6 Z4 x. a2 E9 @' S0 X d
B、折线
( n3 _8 d% n, P1 {* E4 vC、热区+ O- K+ g/ R ?% b7 ?$ k
D、直方) g7 b# A1 m1 L# a7 s
正确答案:扫码联系微信客服4 C- u3 d8 w p2 l
( e Z7 l1 R- m4 t8 E4 ]4 u
" ]/ U" T: \7 }) D D$ T- q
第4题,HFile数据格式中的KeyValue数据格式中Value部分是()
) e9 u6 ?* b3 m9 SA、拥有复杂结构的字符串( G. A/ U6 l3 s/ d1 F
B、字符串
* d: P) G N9 R( n# |: i; r4 s5 M0 _0 kC、二进制数据
3 Q1 G6 p2 v- f( r) qD、压缩数据
# M+ m. q8 f; n Y) [6 v正确答案:扫码联系微信客服
, p1 N+ [& q: @! Q; X: j3 l/ f& a* Z3 E1 R
D o- ^# k, j+ Y [资料来源:谋学网(www.mouxue.com),随机森林是一类专门为决策树分类器设计的组合方法,它组合了( )对样本进行训练和预测
( F2 Y, w7 L, [( M8 pA、链接方式8 f& `, [8 W' S- L: r. I
B、计算方法
/ z8 g1 H/ r( o6 S& TC、相似程度
9 o& x0 _5 ]$ h- V* \& MD、亲疏程度) W7 p& ^! e+ ^2 J
正确答案:扫码联系微信客服6 e7 N2 a. A' V7 i% z
( r& P! L" V4 K- b
, S0 x. ?# h, C% y$ W) v) B v第6题,大数据分析结合了( )。
& }! D# L+ |2 i+ zA、原则性分析2 x1 m4 E1 _ F# I
B、容错性分析
, Y ^; W. e2 HC、提炼性分析
* }2 x& p5 }$ w# ]( U/ x8 gD、诊断性分析
1 V9 n. B4 W* D/ R& W3 V1 a2 O正确答案:扫码联系微信客服! g o; v! k) Q [# Q8 C! M
9 T( f8 i( g1 q7 ^/ g4 c
/ Z3 k+ J" b( P/ {6 w* L/ a第7题,解决大数据分析问题的一个重要思路就在于减少数据量。可以通过减少描述数据的属性来达到目的,这就是( )技术。0 e% J' P+ r$ ^
A、降维
# i( g5 Q& C2 Z2 CB、减法7 v: I' A! i) v/ O3 U ~
C、复合
% a @; v& {( U4 ED、审计
0 E$ Q4 k1 y4 [9 {: Q, k0 @/ s9 r正确答案:扫码联系微信客服9 |" R" r Q% S5 H/ c# }
: H0 b5 O6 d1 n: B! G1 X2 ]9 G
. h+ o, g( g+ _2 n0 g
第8题,人们从分析角度为大数据下了一个不同的定义:如果数据满足以下任何一个条件,那么就视其为大数据,但是除下列( )之外。
6 `0 C3 d( v% I+ H+ p5 ^( [A、价值发现
. G2 U) O( }6 KB、数学计算
% [, Z" O6 A1 q6 U3 h' b( ]C、图形处理
* I9 v1 m/ `" f3 OD、数据积累, M; ~; a5 [( S
正确答案:扫码联系微信客服 ]7 Q' k8 G% r* U) `9 z6 e" N
$ r. k6 y3 ~/ J+ Q9 w
, x7 \& F) {$ A M" C; i第9题,Hadoop fs中的-get和-put命令操作对象是( ): J. z5 n, u; f: R+ ~
A、文件" @0 a6 R( b% ]- x
B、目录
, L9 [! W% t" o: Z" tC、两者都是" H1 l. V3 l% s0 `3 G
正确答案:扫码联系微信客服5 P' R, a. j( s: G( \
2 c/ F6 O$ O, |. C; Q0 f4 ~2 [
N; S& l6 S# ], y! ~$ S" ]资料来源:谋学网(www.mouxue.com),文本分析是非结构大数据分析的一个基本问题,是指对文本的表示及其( )的选取
1 L1 y; z* n% v4 k9 {- @) U$ NA、数据库分析: U# V- w/ f. q5 V* c
B、硬盘分析9 m9 l" c0 z- x3 T+ ~5 R# M9 ~
C、内存分析8 `2 j7 s! W5 G/ a! W
D、云计算分析
# ?- |( [$ r: k正确答案:扫码联系微信客服& I+ a" E0 ]& \ M( E. U9 {
2 ]8 r9 E5 N9 i3 D" H
- f( d0 l( S ~+ z) T第11题,下面哪些选项正确描述了HBase的特性?( X- R* h8 s5 M. V9 Y" G( p
A、高可靠性
2 U) E+ ]1 b9 H; b) _: E* FB、高性能, o0 a/ s L" {1 w5 w
C、面向列' `( S! [) p4 t" H, J
D、可伸缩
1 b; y# U% p" k5 h0 t7 `正确答案:扫码联系微信客服,B,C,D- M) T9 F. _9 J' m, @/ z. |
2 J* | Q- a7 D: c2 O) l1 T/ O
* R/ M( d% b/ d7 @# Q1 ~9 Y
资料来源:谋学网(www.mouxue.com),下面对HBase的描述哪些是正确的?, e0 Y5 j# I, t. L: M
A、不是开源的
# y" a" Y+ T4 Y! w. u' u3 uB、是面向列的
0 j2 d0 L& z& H7 g5 h( R3 AC、是分布式的* o2 j( \0 Y7 q4 O [4 k4 l
D、是一种NoSQL数据库, P/ Y* m! { D: n; V' u
正确答案:扫码联系微信客服,C,D
- j9 S, x6 g* Y' ~+ r! e: n
# b/ p; Q% o! y/ P& K4 R7 m' f
) G1 ]% Y1 ~- ~第13题,下列哪项可以作为集群的管理?$ `! _8 y/ k- V' k
A、Puppet
+ ]' ^8 a+ |3 J N+ rB、Pdsh+ j/ B' x# o& A+ T+ \& K2 M2 B
C、Cloudera Manager
" ^0 G8 c6 H0 D) o! KD、Zookeeper
' r; e, K% C+ @1 G2 w6 k; E正确答案:扫码联系微信客服,B,D) C6 l/ K' Q# G: e( O* ^
2 o: M7 ^. M. q9 X0 L- Z& n, ]8 a# Q& l9 w4 d/ ?# W
第14题,HBase官方版本可以安装在什么操作系统上?+ U( S2 K; K7 r# k# N& \
A、CentOS
H1 j% ^7 U8 ~. I: l3 p" WB、Ubuntu
6 p, j+ H( u" b) h' wC、RedHat
' A% r6 t, A, qD、Windows: v9 k9 c9 v- O) d8 ?
正确答案:扫码联系微信客服,B,C% {' ~4 }; y- Q" h6 K \
0 g1 u' n& Z+ p. K7 [" _7 _* ~( t* I+ ?/ T1 o& r1 X
资料来源:谋学网(www.mouxue.com),HBase性能优化包含下面的哪些选项?& R! g( z: n9 J2 ^+ ~9 V) }
A、读优化% \# |0 n+ M/ A" [: X/ A
B、写优化5 S! C& S5 g% P+ n2 ^) y
C、配置优化8 N# q4 x& j! p
D、JVM优化. q5 }, s/ f+ [# w
正确答案:扫码联系微信客服,B,C,D$ k& ? D% t) O! o% }% A9 v
, V. D6 n- y8 F1 h
$ Y5 R# B( d P4 q' Z# Z, b
第16题,如果 NameNode 意外终止,SecondaryNameNode 会接替它使集群继续工作。
8 V/ P9 B R2 K9 f& h6 @T、对
/ x. Y" I9 i& dF、错
9 W( O$ w) t7 @1 t正确答案:F9 s4 z) |) q! T J" X }1 M
. y/ _- |/ f6 e% I, Z+ [0 ]* u# ?! ^: T3 Z
第17题,Mapreduce 的 input split 就是一个 block。, |( \% t1 e1 O% i# U
T、对; [# p( p+ L' {. N
F、错
! Z5 [. C3 Y& Y4 x" N& I" H正确答案:F0 F+ O' Q2 u" U% p4 d
+ S( `- e# c; E6 v
1 [6 d3 i5 D& j
第18题,Hadoop 是 Java 开发的,所以 MapReduce 只支持 Java 语言编写。7 I. s6 M+ A$ [2 ~
T、对; h6 e$ h! {0 H! O
F、错
) E/ H+ H4 U c' I6 E1 d- Q正确答案:F- i. e9 D( I# ?: |3 ?
" E0 a7 v2 Z2 }% h
6 y/ m4 c3 l$ Y/ L3 ^" J
第19题,因为 HDFS 有多个副本,所以 NameNode 是不存在单点问题的。# E$ k5 x8 o# b1 n% I/ w
T、对
2 U8 m0 m X! I% T5 mF、错
* t" S# g2 B( Z! k3 \% W1 j4 ?正确答案:F
, [: `! g2 y/ }- Q0 L6 x" n2 ?1 d% y) J5 r: c+ H' V' W
! J5 s3 X% {3 @& f5 @' @
资料来源:谋学网(www.mouxue.com),集群内每个节点都应该配 RAID,这样避免单磁盘损坏,影响整个节点运行。
5 X7 D" B- [# H% ?T、对
8 i V! u0 o0 S/ u. c7 ZF、错
% Q; C& u9 @1 m, | |% [0 P$ j正确答案:F6 ?2 ^: m3 k. @' K. B5 L
4 n6 @4 ^+ _( D* L2 [
$ `- E% Q# G4 {1 |
, Q" d8 Z; F9 f' G0 S# U) Y3 Y z7 D; e) C4 }2 q2 i
! G- u8 p& z0 J& I
+ D" I$ T7 [; X7 ~$ L D, Z9 S9 s- ]9 @# v4 @; {
3 N9 I2 L& g% ?: ]2 |; \, F% g* K5 U5 h$ W8 @' {, d& z7 B7 @2 H
9 ?4 u, k/ e1 |6 |- R
; w+ P8 W8 O4 v' Z" D9 H0 W9 `( b6 r) e5 J9 }
/ _+ w3 n8 |: K& p1 G1 E0 d9 n' V/ N$ d4 w) V2 v3 n/ K
|
|