奥鹏作业答案-谋学网-专业的奥鹏在线作业答案辅导网【官网】

 找回密码
 会员注册

微信登录,扫一扫

手机号码,快捷登录

VIP会员,3年作业免费下 !奥鹏作业,奥鹏毕业论文检测新手作业下载教程,充值问题没有找到答案,请在此处留言!
2022年5月最新全国统考资料投诉建议,加盟合作!点击这里给我发消息 点击这里给我发消息
奥鹏课程积分软件(2021年最新)
查看: 3253|回复: 0

22春学期(高起本1709、全层次1803-2103)《网络爬虫与信息提取》在线作业答卷

[复制链接]
发表于 2022-5-4 23:38:09 | 显示全部楼层 |阅读模式
谋学网
22春学期(高起本1709-1803、全层次1809-2103)《网络爬虫与信息提取》在线作业-00001
5 x- j) y3 Z2 |, B- E- ?% c试卷总分:100  得分:100' k0 d2 Z% |" l1 Z& X
一、单选 (共 20 道试题,共 40 分)6 R% n& ?+ ^9 ?+ \% e0 l
1.如果使用Python的数据结构来做类比的话,MongoDB中库相当于一个大字典,大字典里面的每一个键值对都对应了一个集合,Key为(),Value就是一个集合。
5 a, B, ]' M) [" X7 O6 bA.字典
4 Y4 Y5 ^% k  T( [, Z( bB.集合的名字9 M9 S; n6 {% ~8 g4 T
C.集合8 H6 \9 q7 Q, o* g- p* N
D.文档
7 [% a: x5 E( @$ u4 \, {3 T% f- T资料:8 D$ w3 a7 |; d$ S% f

, V- w/ V7 t2 G5 r% h! d2.Redis若要进入交互环境,需要打开终端输入()( U. @7 X* N6 k: V; R( a2 _
A.redis-cli
# e! H2 A6 S) XB.redis! t& T7 F: u8 S8 m, w
C.redis-cmd
) W4 J2 m  B- W  T' `5 T3 H1 m2 bD.redis-start' e* _) d; U6 {6 {! F# J, x3 c
资料:6 M7 M! v  E0 X4 g; @
8 z! J9 I# }( H( ^8 e
3.xpath中extract方法返回值类型是()
- l% W4 y) ?: HA.列表
8 n# @, M7 f! }7 q" X! p9 tB.元组
( H$ v. @  I7 O  r  C& n; kC.字典' W4 g# R% W/ R' m3 C4 l
D.集合; g. j' P/ s/ S! m9 H% F8 T4 q
资料:
  d1 C: |( x! |, P# u" i' A( ?! X4 ^( i/ Z
4.Scrapy自带的待爬队列是()
: M6 v: n( C3 F3 nA.deque
3 ~8 s; {! C) ?; Z( T) t: @4 c8 \B.queue
4 B' w! S2 n5 }9 gC.list
1 L) u' `; T6 y* x8 C0 I# uD.lqueue
* u: p4 B! I. Y资料:8 V% k  S1 F9 N# v7 _! B! _7 N0 l

& S" }, H; e- U2 Y* [. W5.请问按哪个键可以打开Chrome自带的开发者工具(); }* F/ o( e: Q! d
A.F10$ U2 B' }* ?- w4 ?7 n% [
B.F13 j8 \4 l7 c7 |% }
C.F11
9 ?6 W9 {; Y0 {$ `! |; s; XD.F12% b& [1 ]+ r) w$ f: x/ j. w
资料:" B$ l6 d, S$ F* \3 \
4 x4 q! O$ a7 [0 R, Q7 F9 L
6.服务器端记录信息确定用户身份的数据是3 H; a6 F# c; o2 p
A.session
- c5 X5 \2 o3 M: i* p- u) @B.cookies- V( L# Y; r+ v
C.moonpies. D% I. `7 \: \& ^% V+ k: u1 p
D.localstorage
' e) i# Z1 r7 A7 _1 J资料:% K# z3 o! F  L. ~* ]
) G2 t8 r- _: o7 p' X! R
7.以下关于Charles的说法正确的是( )
0 ?3 o' Y7 r" P& f: `; y8 {2 n: CA.Charles是一个跨平台的HTTP抓包工具,可以截取HTTP或者HTTPS请求的数据包3 c! `; m7 [8 N9 q' j9 ?
B.Charles有Windows 32/64版和Linux 64 版,但是目前还没有对Mac OS进行有效的支持。# T4 `3 p9 m% J& L! w
C.Charles上面滚动的数据就是目前计算机发起的数据包。单击工具栏上面的黄色笤帚图标,可以清停止抓包。
) h0 Y: t# X2 ^6 DD.在Charles启动时,系统自带浏览器的部分HTTP流量不会经过Charles。
8 ?+ ~, l& e" G资料:" _8 d4 B) k* V( K
% ?# u6 i: V4 g1 P5 f, D% ^
8.MongoDB中数据存储的形式类似于(): y8 ?+ A% O; f9 t7 n
A.列表' G  p  f1 ?7 o" t! D6 w; i
B.元组
& Q- n! E- u6 @5 u, ^C.字典) n4 p+ |% X% k
D.集合
$ P' C3 i  k$ H2 O; b8 _资料:
) s" z2 G- Q, y# k+ o# ?; Z/ P8 a( ]! a2 ?/ o
9.一般来说在页面传输登录信息都用HTTP()请求类型
5 R' I' I% @6 EA.GET
, w/ g, ~/ C4 M8 L$ w$ \9 uB.POST
6 @9 [$ P( T5 h; i1 f8 JC.PUT5 h  _9 ~" w; ]6 p6 a4 p
D.SEND
6 Z) a! e# |1 ]. O2 W8 s资料:
3 m. s- ]. M! _3 N2 ^) a
7 A5 J! R1 E8 y10.使用了RedisSpider作为爬虫的父类以后,爬虫会直接监控()中的数据,并不读取start_urls中的数据。$ M/ k, k, o8 f1 H5 Z7 K
A.Redis
' W1 i$ A% `: L  v/ eB.RedisSpider5 T$ }3 }' o3 a! m1 _* f
C.Spider
9 f2 R- `, w+ Y9 z5 v/ bD.MongoDB
2 O1 [6 }. ?" H8 K; Z! g资料:
. F+ i9 f3 C" Q7 J% P
/ D2 \# g, v* V: I4 A$ Y- r11.当需要把Python里面的数据发送给网页时,需要先转换成()字符串2 F/ o, M4 i. e( q5 n6 V: Q* Q
A.Python# N7 c! X: u! L2 k/ k' O
B.Json
' J6 F7 t" K; E- \1 {C.正则表达式
$ d& K3 M, K; iD.Ajax
- r( y) C2 n. b3 P资料:
% d; _- {( i: F6 {" B% ]' y, t
" G8 s/ |5 k8 \8 a) n0 w12.lxml库中etree模块的()方法把Selector对象转换为bytes型的源代码数据- m/ c. {. l$ n% y7 {/ h0 A6 i& V$ x
A.etree.tostring
2 g% o5 C" c0 dB.etree.convertBytes
9 g1 }7 o1 |2 J6 m6 BC.etree.toBytes
! f6 }! n+ F( `! [& e) U: |D.etree.convertstring
  v0 _* p, o% B% _6 Z' v! H资料:: M( g- I/ |) ]2 o& f# u

# f. `( t# y5 B/ \0 r, k13.Python中以下哪个容器里的元素不能重复()' Y' S7 M2 R8 s9 N( M
A.列表4 w# h8 u$ @  M+ V, G
B.元组
' p$ V& C. j$ J: R5 nC.字典
! ^4 P  r$ W2 k  M& G! r" C/ L" q/ XD.集合
; R# Z0 s7 t) \  A" k$ `$ f4 U资料:
# ^5 e( ~+ y! ^* i/ s0 `
' m1 s: a, r0 }) z14.通常使用()工具来模拟浏览器进行爬虫请求
$ @4 D4 O# L3 DA.Selenium( t4 @! _: H7 E! f& r
B.Chrome
% s) x0 B/ J  K* W( b9 AC.ChromeDriver
# p( o" p+ B0 @9 h) i% Z; UD.WebDriver
  }, ?1 n7 [; @& [2 x% e$ k7 _资料:4 X2 P" }2 l. N$ Z4 n1 _7 E

# p! O, R/ w5 r+ a15.下面Python代码输出为(): def default_para_trap(para=[], value=0): para.append(value) return para print('第一步:{}'.format(default_para_trap(value=100))) print('第二步:{}'.format(default_para_trap(value=50)))
+ M' ^" p& h* M1 gA.第一步:[100] 第二步:[100,50]+ r4 C( D% `6 d& n# F% G3 Y! E
B.第一步:[100] 第二步:[50]7 u* v5 L! Y" `9 U; t
C.第一步:[100] 第二步:[]
( B3 Y+ G, Z$ a* \D.第一步:[100] 第二步:[100]* f2 T) V/ T* @; E( e7 `! n
资料:/ C3 m! L9 [5 b8 u1 o; M5 r
  N  b( f8 V2 J) R* A
16.Python中若定义object=[1, 2, 3, 4, 5],则print(object[:3])输出()' b9 c, u% ]& q, D/ y
A.12
. y9 h  L1 A- V( Q2 U  Y% vB.123$ A5 d3 \2 Q& Y% B6 U) [, r
C.23& n: r# P2 d& R/ ]
D.2345 y9 H4 n# ?! |1 L/ [2 M
资料:( u0 i/ e4 z/ L

" F6 [& m1 Q/ T3 ]: \+ Z! c17.使用Xpath构造属性值包含相同字符串的路径采用()方法
3 I( A$ \8 U* y% bA.contain3 n4 {7 U9 ]& o1 O8 a7 r0 _% y2 e3 o9 w
B.contains0 o5 ]; F; s2 G& Y: [( _+ \
C.include
, |" }) |( k5 J! pD.includes, M2 O1 E- N7 Q4 S' Z& B
资料:3 E7 U& N' m' w

# T# g2 l* x1 e* P% y, d18.使用UI Automatorr长按点击的操作是得到相应控件后使用命令()
/ d& G: g+ g3 j. S2 c2 N$ oA.longclick7 I  S9 p! e1 ^+ ?" G+ ?& ^
B.long_click, O2 U( o  X) d$ r& y
C.clicklong2 ]5 a* p- T& o6 t5 g4 [
D.click_long# `. i  m( n/ _! I6 n. A$ O
资料:6 x4 C6 I! J) x4 \$ E

$ N3 R0 V5 @$ r1 [. b1 b3 ?19.HTTP常用状态码表明服务器上没有请求的资源的是()
3 M5 U% P: n9 XA.500* D! b6 @) C1 i% b* L  f
B.503, `* `4 y2 s5 j( u; j; z
C.403
' ~. s8 ]& Q8 J9 c; PD.404
7 ?2 s$ ?  x5 V3 n资料:% {7 z. m: }; Q: \

' B, k) K) S8 j$ ~20.Scrapy_redis是Scrapy的"()",它已经封装了使用Scrapy操作Redis的各个方法1 d. p1 C) a" k$ M6 k) T3 ?& k
A.组件8 |8 s3 ^1 g+ d0 l5 w: A
B.模块2 H- j" r* v; }% Q- n
C.控件* D$ \4 o. q2 \2 o6 g
D.单元
! O; X$ s4 a5 I' q, F3 M资料:# N1 _! p  k5 o

+ r- e& V. y+ w* c3 A二、多选题 (共 10 道试题,共 20 分)2 {1 h1 h6 f& |0 S1 }5 m
21.Python中有哪些实现多线程方法()7 i5 ^0 J8 N; @. b' N# s0 J% W
A.multiprocess.dummy0 e- r4 _4 Z* y7 ^) b# v
B.threading.Thread
0 @' _; N; n* S- M- d& c  iC.process& D' R  O4 E' i- s9 L2 z* P
D.PyMongoDB1 [( W! n9 s9 C3 c# J. X" w
资料:B# U; I5 {2 g! n( P/ J; C8 N

! ~* b4 _' o) S% J; r22.最常见的HTTP请求类型有()* r& |7 f6 w: }6 ^2 x  r
A.GET5 m3 g4 U8 P# J$ `2 d& b% n1 X- A6 t
B.POST, Y/ x" G1 \# ]3 @- o
C.SEND
; q9 M0 F, [# w4 SD.RECEIVE
/ e' z  P; T/ s" N/ n资料:B& `4 x& ~  N# J3 e
& s7 g$ ?4 r7 I( n& G
23.Redis中的值可以支持()
! A) r  ?. ?0 N4 U, ~$ x; h6 FA.列表) }7 y0 i5 Y' y( \5 W
B.哈希
, ^  G+ B' L1 Y$ M3 kC.集合
1 W% N1 _8 X# J3 c+ tD.有序集合
' N6 {8 L" w1 }; o资料:BCD+ }7 U7 _* _6 Q
+ Y+ @- h0 N- Z/ a- r
24.常用的会话跟踪技术是
, J: u3 X6 z( \7 _  d/ x. m' ^A.session
. o4 v/ X/ Z: H, v1 f" cB.cookies: O% s# m  D2 [" r' d! }  z) t
C.moonpies; i/ G! s4 Q; U4 y, H1 {! A/ W* l
D.localstorage
3 Q! W" j+ q, K5 z9 A. n资料:B" A/ ]+ F3 z( ^: @

3 H7 R# ^8 J! G! e25.以下哪种方法是MongoDB的查找方法()* s7 T+ G, [; d1 G8 N3 L6 s% ?
A.find% p; T# v- L- Y* j0 X8 w
B.find_one
6 t8 E9 a* _6 G( z4 FC.finds  z9 c$ Q! B4 B0 Z0 M
D.find_all
$ i! f: d0 L6 `; V资料:B
' Q( H- W& J: I3 e! Y
8 r$ J4 B( f8 \$ l  ~2 F% f' }0 R% P4 o26.针对解析源代码的BeautifulSoup对象,构造时BeautifulSoup(网页源代码, '解析器')中的解析器可以为()3 h! m# p1 \4 w9 c. T$ p
A.html/ I; M9 X6 a  t) }8 `! v% U
B.html.parser
" k  H  c8 h$ l; K! }C.lxml9 u# |+ ^, E: I* m( f, T% x
D.xml
; Y& E# Y! b4 E6 Q  I! B8 }/ I资料:2 ]. j8 l9 R2 i0 ~

- w3 Q5 Z" s( V* K6 u27.Python中一个函数可以有()个return语句
; r7 Q, x# _3 P/ y4 a7 z! E& ]A.0
6 @: O) q6 }6 e! X" sB.1
5 P1 s- c2 a/ ^# U; \& sC.多个
8 k0 z1 @3 m' W5 C' N/ YD.29 Q% V  V3 d& t) d# J
资料:BCD3 F$ c1 f0 o; ?1 o' v. M

' g8 b0 I+ x! b( A$ i6 B28.Python中的容器有()
8 @+ l4 T" q/ eA.列表
( p" t7 u9 G- L! uB.元组
! K" P( R2 B+ C/ L* DC.字典
& e* _6 G' ~2 T. MD.集合6 H% S3 @& d$ d3 B' j$ y& I
资料:BCD
' I5 B! e- L% F4 a+ ^# u
* L  {0 V; v% }% E$ K  }  L. ^  K* B29.Python中一个函数没有返回值则可以写()
) k: ]" f7 g" N2 W  k6 @4 g( JA.没有return
8 A' D% F) f" C2 X+ F4 ^B.return
; P8 j1 V* q4 P" `$ HC.return None: W2 B! @1 g7 k5 p$ [( \: k
D.return NULL* C7 J+ }6 s! m! \
资料:BC
+ \! P  V  D* W( N' d4 T5 h4 p) O# ^! j( I  a  y  v0 ?0 z. `
30.下列关于在IOS上配置charles的说法正确的是()' I7 @/ V' V: d' s
A.不同ios设备之间会有比较大的差别,所以配置的时候需要找到对应的安装证书的入口。
2 h! [3 J4 U& uB.手机和电脑需要在同一个局域网下。: L+ w- H9 H- D/ j( x" o9 ^% }+ w0 t
C.HTTP代理可以使用"自动"选项。% H9 {& [$ b& O; H& {+ R6 T0 o
D.安装好证书以后,打开iOS设备上的任何一个App,可以看到Charles中有数据包在流动
& r% r" d5 z3 a( d8 v资料:
* Q7 Y# X0 C! k8 e' e9 R9 s) f  `4 H- g$ M' g
三、资料来源:谋学网(www.mouxue.com) (共 20 道试题,共 40 分)* M* c- D& E0 ?3 R9 z1 n
31.Python中使用下面代码打开文件也需要对文件进行close关闭操作 with open('文件路径', '文件操作方式', encoding='utf-8') as f
) R# `/ o) {0 l5 B- t; U* U6 Z6 X* ~资料:错误
% {0 B  f7 \2 ]* {0 t+ N2 A1 O& K4 E6 F$ S  |; C7 G
32.在charles中使用CTRL+F搜索,JSON里面的中文是可以直接搜索到的。. s6 V9 N$ h$ m" b
资料:错误4 }' A2 p& v! ^- D8 j" U

( \  h  T6 Q9 p3 a! _/ U6 V. U33.Scrapy每一次发起请求之前都会在这里检查网址是否重复。因此如果确实需要再一次爬取数据,在Redis中把这个Key删除即可。& x8 z4 f* [# R8 g) F
资料:正确: K1 a, u$ A5 ^! s! H- I; n

) j4 l% \6 U8 f( b34.插入数据时,MongoDB会自动添加一列"_id",也就是自增ID,每次自动加1
6 E: `2 Z. l1 ]' z' {* ?资料:错误
3 e$ H, ]: ^; W8 S& v- Q1 x8 j9 ^3 T" z( m7 @  o- \
35.Python正则表达式中".*"是贪婪模式,获取最长的满足条件的字符串。
/ H! q& I5 @$ l9 M资料:正确
9 P2 m9 T2 k1 @0 `( A% n
9 g3 a9 G: J% m) \+ a# }: F) k. J36.使用Scrapyd,可以实现一键部署Scrapy爬虫,访问一个网址就启动/停止爬虫
2 Z" ?3 I0 W" g' ?0 l资料:正确/ ?" b6 e: l# V9 x5 c/ z/ D( r

# @  d! l  o* W" H2 }9 Q) i37.Python中元组生成以后还可以往里面继续添加数据,也可以从里面删除数据;) S! m# h- S3 y1 g0 f% }- H. F
资料:错误0 ^$ }9 ?9 l- X3 p
$ S7 C/ u/ _4 D( Z/ p6 |  e; k; \
38.如果目标网站本身就是提供公众查询服务的网站,那么使用爬虫是合法合规的。4 X( h; D* m' O6 f  k- i
资料:正确
  I& p3 K# f) T! a' L* H& V7 i
. m) b+ J) A* L! I39.HTTP状态码302与307完全同义。# E1 x7 c- @. L; t# y
资料:正确
: W) K% k5 Y; w/ A" @
4 a: s) |6 u4 g, J% o! C40.如果元组里面只有整数、浮点数、字符串、一个列表,就既不能添加数据,也不能删除数据,还不能修改里面数据的值。( }. [- `( h, d$ C& L
资料:错误
2 M( p& D- r4 q& ^* \, O7 J* G1 a
4 |/ D3 I# q/ w7 n41.HTTP状态码302表示资源永久重定向。
0 i. c/ ]' Z: q  ]; h  X- ~资料:错误
" f1 g: r. c" A9 j4 d
3 X4 j, l  b9 D2 Q42.使用异步加载技术的网站,被加载的内容可以在源代码中找到
7 n9 }& k1 A, q资料:错误6 B6 [+ y9 J1 W& ]5 H( x
  M& O, C% f" }  T
43.Python中条件语句在使用and连接的多个表达式中,只要有一个表达式不为真,那么后面的表达式就不会执行。
/ g# C0 j% o! B9 \资料:正确
* g) I3 P; B0 I1 @: ~$ x9 s3 Z0 n- a2 H4 F; O
44.当运行爬虫代码后,出现"Forbidden by robots.txt"提示后,说明当前时间段被爬取的网站无法访问。) ^4 N1 P1 g2 Q
资料:错误& L! l5 h6 `6 n" W" f
9 u2 X- g7 c5 m5 [9 J/ p3 y7 Y
45.在请求头中设置User-Agent即可正常请求网站+ G6 s6 C6 q1 B, O! Y& f6 F
资料:错误6 a4 m' f- T4 {  Q+ N2 L) j

5 W5 E. }4 ?. F) Q* I: t46.爬虫中间件的激活需要另外写一个文件来进行. L/ P  H& w5 s8 g7 f& I* N
资料:错误
3 C. ?2 p; f1 @8 h+ _; v0 d( [' ?+ M' {! B
47.在Ubuntu下若要运行Redis可以使用CMD进入解压以后的文件夹并运行命令redis-server.exe redis.windows.conf启动Redis8 b, z6 Z0 E, a0 P! `* O% s
资料:错误
6 U+ m, Q2 j, ?/ S' E+ P8 L6 s7 [" O" r$ L
48.当使用Charles监控iOS设备或者Android设备的数据包以后,打开微信小程序,小程序的数据包不能自动被Charles抓住,需要另作处理。
+ ^" [# L, ^% a% h( E/ S6 Q资料:错误' ]2 g1 V% r! |9 m; D/ M

* K' y& k  z* a8 U49.charles配置中,安装完成证书以后,在设置中打开"关于本机",找到最下面的"证书信任设置",并在里面启动对Charles证书的完全信任。6 A, c( h) }$ A/ g; S
资料:正确. q1 Z/ V  v1 q% [" ]
3 Q8 X9 Q0 |% L" S+ r
50.Python中写CSV文件的writerows方法参数为字典类型
. A2 X  A% ^' \5 |- L' k* ?+ t资料:错误
/ E1 @9 j2 Q  h! F
; q; s2 W/ @; f' `3 m8 b+ e! n5 r' z% b1 Q1 h+ s

2 d5 N% Z( C+ H4 |7 y* c! e0 M
/ a1 G8 S( u; v% u5 Y" f
* p" f' `0 L3 O6 ]4 @0 s% u" U$ B# `% k. C( i
! r, Z. |, j2 @3 u' R) M8 W

3 Q5 X  K7 z7 Q' s& O! o# b$ B* q9 `: l1 V; j* }1 w: G/ S9 E
: k4 g/ k3 {. |: D! Y) S! U) j
' W0 u# g7 i4 R1 e" q

; K4 x* R6 i& d* N% g

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?会员注册

×
奥鹏作业答案,奥鹏在线作业答案
您需要登录后才可以回帖 登录 | 会员注册

本版积分规则

 
 
客服一
客服二
客服三
客服四
点这里给我发消息
点这里给我发消息
谋学网奥鹏同学群2
微信客服扫一扫

QQ|关于我们|联系方式|网站特点|加入VIP|加盟合作|投诉建议|法律申明|Archiver|小黑屋|奥鹏作业答案-谋学网 ( 湘ICP备2021015247号 )

GMT+8, 2025-2-24 13:08 , Processed in 0.093712 second(s), 17 queries .

Powered by Discuz! X3.5

Copyright © 2001-2025 Tencent Cloud.

快速回复 返回顶部 返回列表