|
资料来源:谋学网(www.mouxue.com)大数据技术-[东北大学]《大数据技术》在线平时作业2
; U7 N& `4 m( G" Z试卷总分:100 得分:100
" [7 m" u; u# [; }第1题,数据提取阶段主要是要提取不同的数据,并将其转化为大数据解决方案中可用于( )的格式。需要提取和转化的程度取决于分析的类型和大数据解决方案的能力。2 b+ A! g; n" x4 X/ w, ]% [: O
A、完善数据结构: L# p4 E+ a. T! r. u
B、建立存储结构+ |' i( \% X5 R6 N* B" q
C、整合验证规则/ _' m* {4 q# l0 P
D、充实合理数据
# O' ?/ p# J% K* G正确答案:扫码联系微信客服% N) A8 M" F: x5 J6 ]- j
3 B; P5 @; J& D G+ Z r" A2 A9 V8 Q9 I
第2题,下列关于计算机存储容量单位的说法中,错误的是( )
K; r9 U- Q% d8 r4 ]A、数据规模大0 y9 n* U7 Y; y( t+ C9 @5 g5 [
B、数据类型多样
" x1 d3 B) a/ c4 X5 M! l+ t0 zC、数据处理速度快. c. k5 Z# f4 g9 K6 b
D、数据价值密度高
' I9 u: Z) N( D" M正确答案:扫码联系微信客服6 M& s$ A; {6 n( b$ x1 l' `# [ X
/ B4 D5 s' p- r& U
, W0 v x! _! ~& F9 O+ p
第3题,时间序列图可以分析在固定时间间隔记录的数据,它通常用( )图表示,x轴表示时间,y轴记录数据值。0 s0 E+ Z# @# q* n" m& ~
A、圆饼
/ q2 [) o" O; x$ c3 \0 l/ k+ @B、折线/ \1 j3 E( _# E, c+ V1 r
C、热区2 z" G! O: z& c2 V
D、直方
0 q9 z. L& E3 F. E7 ~正确答案:扫码联系微信客服
+ H# o& @, M- Y2 c9 j1 S# `
: m9 o/ U! }- Y" `+ f2 L) b0 X$ W! W. \
第4题,HFile数据格式中的KeyValue数据格式中Value部分是(): ^6 [( K! U" y6 c6 n) z( T/ L( t
A、拥有复杂结构的字符串
6 y4 ^" R! ^1 p0 w1 _, s# HB、字符串, r& @+ ?# i# V3 D( n# y! t7 `
C、二进制数据! m) s7 M8 Q5 m4 t* F( k1 f5 z# Z* I
D、压缩数据& L# [5 @6 v, z7 W1 h7 B$ V
正确答案:扫码联系微信客服
4 ~8 U; W+ H& q7 k O o. h7 q" s P0 g! P2 C
! x2 j5 K& `" H, {) y$ F. n, M3 B2 ]
资料来源:谋学网(www.mouxue.com),随机森林是一类专门为决策树分类器设计的组合方法,它组合了( )对样本进行训练和预测; ?& J, e( Q8 a
A、链接方式3 ?' I! }' G! h4 _( y
B、计算方法
- n h6 Q; b4 o m4 H b- IC、相似程度' Q. t6 h" @+ q- ~* o1 F \
D、亲疏程度
$ ~$ I$ K l' I0 g% Z0 U8 l- f正确答案:扫码联系微信客服
+ m! N1 E% y: }* }& S1 D: M- D$ d
; Y# y6 d1 g9 y8 |/ x/ e8 G5 P- ?) f' F- K! n2 z# k: O
第6题,大数据分析结合了( )。, j# |, r9 c# U! G3 C4 N R
A、原则性分析9 w$ v1 r) B& F9 |
B、容错性分析
! n! ^7 n7 a+ ]7 ?/ r+ iC、提炼性分析% [: `, n9 {0 g" K) v
D、诊断性分析
" t+ @0 a+ C0 s9 ~$ I& @正确答案:扫码联系微信客服- G2 n- O# |- r, V0 w5 U
/ b- a/ \! f5 l& s, X1 v, j! @
0 r, ^: w$ r* L: Z1 Y5 r3 v
第7题,解决大数据分析问题的一个重要思路就在于减少数据量。可以通过减少描述数据的属性来达到目的,这就是( )技术。
+ p0 h+ d; V% B- F# lA、降维/ `: i: H( q- C1 S( i; A
B、减法6 h) d1 G; ~5 o) [6 u
C、复合) a+ ^) ^8 M, l9 Y$ y
D、审计
& F l! b1 s9 C! _5 z9 X正确答案:扫码联系微信客服" @0 [9 E3 i3 L1 q
( [9 z+ [( ^4 L! J
" C1 r/ C6 w* b/ ^第8题,人们从分析角度为大数据下了一个不同的定义:如果数据满足以下任何一个条件,那么就视其为大数据,但是除下列( )之外。
0 c# E/ \- V' N9 Z4 bA、价值发现
/ g! J T5 k. p* D: n$ vB、数学计算$ A/ {- d* |" m# T6 W5 ]: M
C、图形处理' l% h' e' M2 r6 P
D、数据积累' a, Q$ Z& p, ^
正确答案:扫码联系微信客服
5 f- Q9 P. H5 H% s1 C, W) s3 j; A# {3 W+ t
7 m/ d( T K( U第9题,Hadoop fs中的-get和-put命令操作对象是( )
% K" Z- \' E6 O# UA、文件
) B7 w) n8 V9 J( b4 AB、目录
, U7 n3 B8 ^3 V9 o! `) M# gC、两者都是, J. t2 H# z: j) F9 \
正确答案:扫码联系微信客服
- r- g8 m; |( F3 j
- Z/ y$ a+ O1 H% D" P' o0 a1 _2 D# ~- m! G$ u8 U0 c+ H
资料来源:谋学网(www.mouxue.com),文本分析是非结构大数据分析的一个基本问题,是指对文本的表示及其( )的选取
* R) R3 N, a# u" t. ?1 F) U0 wA、数据库分析) f' E1 D4 f9 Y5 z* U- m
B、硬盘分析7 P& E- P. [+ p9 a
C、内存分析. |5 v3 b" B2 i1 c
D、云计算分析9 U9 ?- Y5 T" f9 F! o3 N, H9 P5 z
正确答案:扫码联系微信客服. M& n3 L! }7 I5 ]8 g6 X# j
3 d7 h$ L6 d* `: R' g; L* p( D
' y( f( k7 f& N2 ]第11题,下面哪些选项正确描述了HBase的特性?$ A4 D; f9 A, q; u
A、高可靠性0 X, I- W; R! `- Z
B、高性能
& Y: C B- F3 aC、面向列
" j2 Y5 o0 J7 X4 M% L N7 RD、可伸缩
4 l+ G& [! i& O) K0 n" v4 X0 ~正确答案:扫码联系微信客服,B,C,D
7 r( r5 [% }$ Z* \3 h
g) {0 c3 @5 m U* I4 M; b3 a) A. `* |' F5 m
资料来源:谋学网(www.mouxue.com),下面对HBase的描述哪些是正确的?
& ~/ A) ], z, r( eA、不是开源的
- V* S' C+ }! J9 v+ v0 ^B、是面向列的( p5 N f* w$ h- U2 w
C、是分布式的- U% R$ J- a( l! h
D、是一种NoSQL数据库
, s3 J0 N1 s0 A+ A正确答案:扫码联系微信客服,C,D
* Q6 L$ i6 @4 T% d1 S
" V. _" E& K* r- F" m7 p) B% i6 [0 v0 H9 b
第13题,下列哪项可以作为集群的管理?; i/ Y5 @$ Z) m% ?, ~3 P
A、Puppet
7 w5 K' G: ?% e2 Z, CB、Pdsh
3 q! N3 p7 q/ f7 @& OC、Cloudera Manager5 r/ C! k4 t& e6 F4 _6 ?' d0 W6 F
D、Zookeeper* l# x# l+ j' }8 I
正确答案:扫码联系微信客服,B,D
H# w R% ~* u' f. N" c( x8 f# |. b
; g% Y C( F/ k: `4 r2 {
' H8 E( B4 z* ?) E3 r7 J! S' _第14题,HBase官方版本可以安装在什么操作系统上?6 o. ^6 ^& L' l: j9 L8 n* O0 t
A、CentOS
! ^5 k$ J# m# j7 IB、Ubuntu- |; {- t% a" T3 u0 f/ R2 j
C、RedHat
8 H- L" R$ q/ u, lD、Windows
0 o9 ^/ |$ j* ~1 _! T2 n$ n7 s c# }正确答案:扫码联系微信客服,B,C! _0 m6 ^; r S
) t$ X# \5 k* I+ i9 ]
m' f; ?2 j$ K- z0 f资料来源:谋学网(www.mouxue.com),HBase性能优化包含下面的哪些选项?; }) K- x5 H1 F7 y$ {$ i0 }4 a
A、读优化7 H& e" M$ w: v: y6 x7 T6 c9 A
B、写优化
{) k+ l& m$ B( x0 i: x6 mC、配置优化6 n$ M; C, e8 ]! O H! L
D、JVM优化
- m' T7 L# t% Z! o M$ A正确答案:扫码联系微信客服,B,C,D
: O* v6 _ P) g1 K$ ?! U
: L- y g+ u6 W% W* ? }4 s7 x& R X, O3 y P. v, |& q3 P
第16题,如果 NameNode 意外终止,SecondaryNameNode 会接替它使集群继续工作。
6 Q$ x; M$ R; y6 f0 b8 O/ |2 [T、对- O' Q% P' H: X4 m: W+ h, H
F、错4 K* H4 P4 }9 j; S# p8 R
正确答案:F
# a% F/ Z m& n' y& @* `( e! t9 R1 a/ T0 G; R! R! C
2 m* f r4 t8 x1 H' o- y第17题,Mapreduce 的 input split 就是一个 block。
5 m" {6 ?9 ]& Y oT、对9 w& a& Z q0 K- U6 W; E
F、错+ B( C, D8 Y7 T: `
正确答案:F/ U" p$ X$ O, ^/ T' s4 b6 }
4 [: M3 b( d7 \ M# ?, l
- ]6 E# U* L+ O
第18题,Hadoop 是 Java 开发的,所以 MapReduce 只支持 Java 语言编写。
6 i& U. w4 Z/ a, s, }T、对/ E$ w# o$ l( K2 |# Z2 b( S
F、错
# M- z i% r' p3 m1 ~% F& j正确答案:F
- D2 H; \2 T& g0 {: U. `; ~8 T# q+ s! ?/ L- f* k$ a$ ]0 ]
. n6 y# @) t; ]
第19题,因为 HDFS 有多个副本,所以 NameNode 是不存在单点问题的。/ _( I+ ?/ z2 a$ P+ k. j6 T
T、对! i2 r; c" [- ^1 P/ @
F、错8 c' x0 j" a" b. o8 g/ j2 F+ w' G
正确答案:F
8 k* K5 N n; t$ l8 v6 b
2 m& P) F4 F3 t3 o4 a i) |& Q F0 m$ X! E4 M9 B) |
资料来源:谋学网(www.mouxue.com),集群内每个节点都应该配 RAID,这样避免单磁盘损坏,影响整个节点运行。* K- X7 Z* l: c- W- `( U7 }4 k) w
T、对
# e& [( S, w$ w3 s2 q' N5 xF、错
2 F0 Y, @/ J+ K4 L: Q正确答案:F
5 \! v) ]1 G7 c6 H' i+ e7 ^( n) m( c0 u+ {) u
' H. ?" R/ ]8 o
1 v6 X( O S/ T5 K. |) o% }
/ r5 I; `* L9 \- S5 _& ~& N5 k7 S! a! w" B( S
5 N7 ]2 y4 W* k& r& @! d; l
: C( g+ d/ \+ Q) Y, O k" S% u
8 P/ R- D) b0 L
Z7 }3 F$ d# X) `& e6 ?; t, W. a% b r& n0 a
, ?1 ^$ Z6 @3 [: M. y/ H
1 o& [8 R1 v# h
/ i2 X4 j T" {( c$ K4 Q
6 D% l0 G8 l3 p) [8 M) y |
|