|
资料来源:谋学网(www.mouxue.com)大数据技术-[东北大学]《大数据技术》在线平时作业2
3 B# J# t! T* a9 n试卷总分:100 得分:1006 U, X h, Y- @- }5 _
第1题,数据提取阶段主要是要提取不同的数据,并将其转化为大数据解决方案中可用于( )的格式。需要提取和转化的程度取决于分析的类型和大数据解决方案的能力。& S* U3 A9 D/ d: \: i: _
A、完善数据结构
- Q& T& q# q! z5 n; j# X* rB、建立存储结构
* b3 u' }) g& m0 ]# m/ t! F3 BC、整合验证规则 B1 C3 t1 K. l, z6 y) h# I' s: ]) Q
D、充实合理数据8 a5 L/ d: _. ?: N4 D0 |. @$ p5 }" Q
正确答案:扫码联系微信客服4 ^$ H9 A) f! y
* p4 {- ~$ t" u4 F4 m: ]& c$ O& A0 I! p
第2题,下列关于计算机存储容量单位的说法中,错误的是( )
" o$ s9 B7 m, y8 Z: M F. o! _1 z4 JA、数据规模大
* L ^3 E9 W( M" i! M( g% YB、数据类型多样# ^3 v: H# d: V/ a) e8 H
C、数据处理速度快: O5 Y3 d$ m5 J+ w/ x" q6 h
D、数据价值密度高
7 V& K8 |1 h6 V, O4 y( }正确答案:扫码联系微信客服
* _( i. ?3 I% X. z5 L) h- C* ?$ v
! |0 D3 ~/ T% U1 q% o7 a+ Y0 q1 T+ U1 R
第3题,时间序列图可以分析在固定时间间隔记录的数据,它通常用( )图表示,x轴表示时间,y轴记录数据值。+ P8 K: N& f/ h" {, V" Y" h
A、圆饼" V4 P3 i7 w% S+ H1 x2 Q
B、折线
1 G* }1 W% |+ q& v) WC、热区& p1 v& [2 _5 v3 a; D: u4 c2 p/ \
D、直方& @/ U6 S, R: _# B/ H
正确答案:扫码联系微信客服
0 i4 ^8 v4 z( S$ C! }2 l
' z: m0 m- ^! ~" o
) S3 g: q6 ?9 W第4题,HFile数据格式中的KeyValue数据格式中Value部分是()3 Z$ w k1 b9 Z, q8 t
A、拥有复杂结构的字符串: G* P" v# A y$ n
B、字符串
: e% ^! f$ C( `1 w B+ H7 zC、二进制数据
! L) z, G) q9 v) M! `* ]0 o `/ yD、压缩数据
8 d4 x5 K* [" a0 n% n/ o y正确答案:扫码联系微信客服
/ B8 a8 M) Y0 J/ F7 P- ?8 n) u) o) S a# s
5 Y5 s, b3 |1 j- d* v
资料来源:谋学网(www.mouxue.com),随机森林是一类专门为决策树分类器设计的组合方法,它组合了( )对样本进行训练和预测+ S* J1 ?+ j0 c9 W
A、链接方式 Z- \" h1 h4 V( R& h& C$ G1 ^
B、计算方法
! S/ z4 ~: V$ X: w. G; S" \C、相似程度
$ o7 S4 j. |3 N M* g X3 ~D、亲疏程度$ Z. |# Y5 x1 ]: K2 V
正确答案:扫码联系微信客服
# [' [. k a% I/ M, h; u0 O! c6 d% B% {+ V
: u, j! q+ h' n, L第6题,大数据分析结合了( )。( x! H0 _4 p% t- J" m
A、原则性分析
n: k4 g! K- ^( g8 N" sB、容错性分析3 W+ e$ i+ g7 h# S0 {
C、提炼性分析; i+ P, ]% P4 R$ O* O& \
D、诊断性分析
! A3 R" j; S& R' S2 [* d正确答案:扫码联系微信客服3 J& w+ R; Q6 x/ A+ a" y6 R
7 I& A3 t- D9 d m! W( [) W) W S2 R$ b/ H' e: y/ |
第7题,解决大数据分析问题的一个重要思路就在于减少数据量。可以通过减少描述数据的属性来达到目的,这就是( )技术。+ N/ }5 @ h% Q+ O3 e1 R$ D7 ^3 g
A、降维# g% R2 a" B: i2 \1 f7 C X
B、减法/ o+ H$ S7 \( Y0 X @
C、复合
+ Q& j7 P# p+ M: H# z5 gD、审计$ `5 e( D3 O+ X5 e9 I" p* `
正确答案:扫码联系微信客服
' n1 Q7 {( G# g: ~' X Z' Q
, p0 }) ?# m+ o) m5 Q+ b& |
C6 R, y. g- L$ C6 v; x) J第8题,人们从分析角度为大数据下了一个不同的定义:如果数据满足以下任何一个条件,那么就视其为大数据,但是除下列( )之外。
" z1 J% y: z+ k/ I2 N' P& _A、价值发现
/ t y. E# l J1 m b) e# MB、数学计算2 |( N3 c- t k9 [$ k
C、图形处理
! z1 w4 i0 ~& c b0 J1 ^D、数据积累
3 |7 T2 v+ a8 M$ e9 m正确答案:扫码联系微信客服( N* }8 F0 V3 v/ u
. D/ A) R& b; \* q4 o' q+ P
6 c/ B- B2 ]6 A, n
第9题,Hadoop fs中的-get和-put命令操作对象是( )6 B' p9 x3 N( S& `, K* K9 X: k
A、文件! H! E) {9 k$ ^# O+ u/ ~2 [* F, Z& S
B、目录
6 ?2 N* M( z p8 |$ ~/ UC、两者都是
; b- b' Y/ F# ]6 L正确答案:扫码联系微信客服! y( J: {0 e3 t: s. K, d2 v
7 V% `! ~1 [2 r& h+ t
4 L& n' h$ G- U/ f, x; e, `3 E A& b资料来源:谋学网(www.mouxue.com),文本分析是非结构大数据分析的一个基本问题,是指对文本的表示及其( )的选取
4 b) L7 _# e! L# L" T( OA、数据库分析$ w _/ H+ V7 q
B、硬盘分析
) d9 r# \: J0 @( k4 W0 k2 F5 HC、内存分析
. |2 [4 p. s1 y% q3 S) i! e6 }D、云计算分析' Z) u1 [+ p* v2 \
正确答案:扫码联系微信客服$ b4 _: r: n( c' f; ?- Z+ n
5 W# p2 j# @" Q2 X8 m; X' L9 m' g) a7 r5 M) e8 ]! D& r
第11题,下面哪些选项正确描述了HBase的特性?# V" W6 |6 U& I5 f( c3 h% M/ ]
A、高可靠性* f2 K% E% L8 V# P
B、高性能
* [: x3 Q, x9 RC、面向列' f, l1 l0 E" k- J( u
D、可伸缩2 a) e2 m& v0 w2 t7 N
正确答案:扫码联系微信客服,B,C,D
7 w! {3 z- v5 g) Y( m0 J# I1 p0 }2 k3 d
- N' N1 N/ Y) g% y/ C, r! b/ t资料来源:谋学网(www.mouxue.com),下面对HBase的描述哪些是正确的?
" Q9 `* q2 V" m6 z. U: IA、不是开源的/ J' A- x9 d( p' x) B6 l
B、是面向列的
' B! N! x* o5 F* B: q* j& k$ h t; WC、是分布式的
0 g! `6 Q* I: g$ O- J+ ^0 ED、是一种NoSQL数据库
8 N: A, c3 ~) m6 G& S正确答案:扫码联系微信客服,C,D# D3 X; G- M) }; l' b. O
2 ~' b; X; w7 _
* N" t$ s8 E9 ]' D+ {& L
第13题,下列哪项可以作为集群的管理?
3 w7 X t/ |6 u! RA、Puppet1 |/ ^) z9 s: V8 Z1 z1 v
B、Pdsh$ Z, ]- K: a! j) Z3 Y) E
C、Cloudera Manager4 w' I& ^, \* |1 z: N
D、Zookeeper, d4 w# ^, d& U9 Z9 y' q {1 r
正确答案:扫码联系微信客服,B,D7 s) C2 I6 W5 c! T* y1 F
- M' O v- q- r+ t5 ?
. q+ H) s# C5 G3 Q* r4 F* j7 }第14题,HBase官方版本可以安装在什么操作系统上?
1 \: E# R1 }& M5 A# w5 Q+ HA、CentOS
9 i' o" g# t2 s5 P8 d& fB、Ubuntu* |) @, w2 Q3 g( q' b8 |# ]2 p
C、RedHat
; h% e5 J% \, [: ]) w$ ]6 j- iD、Windows
" Q& K6 l, ~- |+ l正确答案:扫码联系微信客服,B,C
- t8 E" w6 R8 s7 Z; i6 s' P# I
% @! V3 t- h* ~* j
. z9 o5 Z0 `- r, G& C+ L资料来源:谋学网(www.mouxue.com),HBase性能优化包含下面的哪些选项?
( F s$ B' y$ X. \, K3 |A、读优化
) u% q( k! k4 {& Y( KB、写优化
8 c: m$ X; g# W# p; `7 XC、配置优化
3 B3 W/ ^0 r" m) t4 D" `9 SD、JVM优化
3 j* Q8 q0 Z7 Q6 G W正确答案:扫码联系微信客服,B,C,D
1 y1 S& G# n9 ?. Z- p4 F' O$ n& [- R+ T7 T$ r$ C/ {: H L) `2 M. `
; v \) B, ~" X0 G第16题,如果 NameNode 意外终止,SecondaryNameNode 会接替它使集群继续工作。5 }0 u' D) B9 d6 l* Y8 v# _
T、对
; b4 u' h5 x4 n( tF、错$ A: t( b" c8 V6 X2 F: i% j% C
正确答案:F( X6 O' V) w9 ^, H1 }
' Z" U" d# m* o* j( K: i( z2 F
% ]3 d2 s/ o4 x" I) ]) N, m' w第17题,Mapreduce 的 input split 就是一个 block。1 Q3 c k, e. I& b- S2 v
T、对5 H* M% z4 ^+ _6 x# C: |4 @
F、错9 N2 d* T; o! a d, ?
正确答案:F0 e# }, v7 [6 Q0 E1 c
8 D$ h; C5 e" n- d) v3 u; W' R0 y; [5 _# e$ ~" c1 |
第18题,Hadoop 是 Java 开发的,所以 MapReduce 只支持 Java 语言编写。
% j+ g. X+ Y4 ~9 cT、对. |) |- h1 v) v% K8 G
F、错& l+ y/ t1 J9 c. w* r7 B
正确答案:F
6 r+ p: b3 [; ^7 K [) ]: \# X" R! l Y* f0 A
5 S. s7 B g& M# ]; ~2 R第19题,因为 HDFS 有多个副本,所以 NameNode 是不存在单点问题的。
/ U. v0 t( \: [+ zT、对( L4 W5 ]: D3 O
F、错. q, C* n" h0 A( L* G
正确答案:F [, \. q6 `" ?! }3 a
9 \/ m$ z4 f5 i4 H3 ~( r& t1 `& f" ~8 m% u
, A G5 T1 E- s2 U6 R6 A) h资料来源:谋学网(www.mouxue.com),集群内每个节点都应该配 RAID,这样避免单磁盘损坏,影响整个节点运行。
$ x2 t/ U4 \, N1 XT、对
4 B5 h( d; K5 \ r" I+ z( EF、错: Q( m# {1 D$ g, z+ [& N6 }' ?
正确答案:F
0 ~/ `: l; Y T7 v2 k1 _; \4 Y3 e
; ~9 t) M; J" G9 f) P4 v1 l( Q7 U2 J( M; X3 |. W4 c. k1 t8 Y# H) o4 U: K
. R( d% O' q6 ~. H0 a- V4 M0 x1 L v7 t' N
5 m6 g0 _% d, R
( B" w7 a: [4 O" _) T8 c* h% h; }5 V2 g; ^/ c
- {" ^% q$ K- G! m F0 J! K" P4 Z! B' U! }
& ]4 \" y* s9 e- ~7 `7 ]% M, T% o
/ J3 l4 j$ g- p. Y
- H7 ?, y2 [" H: ^% |, J6 F. T4 o* v0 r b4 p' \
F. x; K; i+ R) x/ R3 V, H* W
|
|