奥鹏作业答案-谋学网-专业的奥鹏在线作业答案辅导网【官网】

 找回密码
 会员注册

微信登录,扫一扫

手机号码,快捷登录

VIP会员,3年作业免费下 !奥鹏作业,奥鹏毕业论文检测新手作业下载教程,充值问题没有找到答案,请在此处留言!
2022年5月最新全国统考资料投诉建议,加盟合作!点击这里给我发消息 点击这里给我发消息
奥鹏课程积分软件(2021年最新)
查看: 1509|回复: 3

南开大学23春学期(高起本:1709-2103、专升本高起专:1909-2103)《网络爬虫与信息提取》在线作业答卷

[复制链接]
发表于 2023-8-2 02:13:28 | 显示全部楼层 |阅读模式
谋学网
23春学期(高起本:1709-2103、专升本/高起专:1909-2103)《网络爬虫与信息提取》在线作业-00003
. W% j+ G+ G& `8 ^试卷总分:100  得分:100% t5 U0 e2 P: ]' R$ d
一、单选 (共 20 道试题,共 40 分)
; O% e8 l/ [+ }& T: [1.在Scrapy的目录下,哪个文件负责存放爬虫的各种配置信息?()
& S8 N7 l: X0 m& WA.spiders文件夹
9 k3 }8 o! e6 x3 `. d7 p8 ^, W4 A1 eB.item.py
' m; M) ^- ~5 n% o3 ]C.pipeline.py
: V" x" `" Z3 O8 yD.settings.py
' h8 O: \+ j: a" e, b4 i答案:9 X9 n  ]1 E( D' A+ N% B
7 }( I# O  q: A, @/ Y
2.参数headers=(),把请求头添加到Scrapy请求中,使爬虫的请求看起来像是从浏览器发起的。2 h8 k5 c3 }, T) u4 {% D9 [7 a6 p8 {
A.HEADER
, ]7 _' U; D" S5 Q& kB.HEADERS* ~+ ]4 @! ], H, g) Y' x- r8 h
C.HEAD4 C/ I9 Q- p* C8 u
D.BODY
- k6 V( }, f3 C! s+ l  Q7 A$ A! g0 P) v答案:B
0 P! |* v: A3 i+ N
9 z4 w  e! P" r6 Z& d; b$ L3.可以通过()绕过网站登录。
' Q/ g4 L. ~" W7 c2 N' W' TA.session
3 g3 \/ s9 R( p0 g; |; WB.cookies
. B; ~+ ]: `: y1 w+ u! [: ]9 ^% WC.moonpies
& [& z7 y$ _" P# I9 R% _D.localstorage
: a, b: e0 B/ H$ x答案:B
' Y) q; I% P) |/ c4 i4 J
" o  g! s* N, h4.下面代码一共执行循环多少次(): i=0 while i<10: i+=1; {7 O+ m/ U5 V" B5 ?( j0 a7 [
A.92 |& h  b- ^; Z, Q/ r% s
B.10
$ V- g( o6 I' D+ rC.11#06 r& l! r3 E0 w9 W5 N9 H
答案:B7 w* M2 [; t$ C; }7 G
, ^! b% k  ^* E9 I
5.Python并导入uiautomator来操作设备的语句是from uiautomator import ()# Z; k; {' U. W8 u
A.Device
( a  m; U7 B1 A4 F8 T9 NB.Devices
" X( Z+ u( _. tC.Jobs6 y5 z; U" y) Z5 M/ _! ?( H
D.Job6 E6 I; N" I( s% u) ^
答案:0 n# t( u) E' C8 a
& S& H1 T# N: }/ T) d
6.Python中的()库用于发送网络请求' B3 y/ m: ^9 f% ^  I$ F" K) P
A.web
1 ~8 v7 p5 a/ _1 L4 F" H5 yB.request
3 Z- O1 q( U- Y5 N) AC.requests; A0 h; q  h, T+ v2 b
D.javascript4 ^6 q3 F" D0 ^2 y( o  E- ~1 ^4 \
答案:
( W1 N( ?* Z! e* V2 F7 a! D# @' ~9 p4 l, f- s9 z" Q5 z' E
7.Scrapy中使用Xpath获得的结果调用了.extract方法,结果以()形式生成
: X/ k: z) d: g3 W9 q/ uA.列表
+ ~; T& l$ h/ h0 j4 IB.元组
2 y3 ]  E  ^, h- j( xC.字典6 r8 s; u6 M6 I- ^
D.集合; T6 M5 W, X2 D6 w
答案:) S+ J) b: H* A# ]- @

! r3 R" Q, y' I5 ?8 d0 ^& R8.HTTP常用状态码表明服务器上没有请求的资源的是()9 A# ~: A# S) E6 {; J* ^) D
A.500. P" c0 G" j+ \/ F( f- ^
B.503
- E7 v. L( Q: s. ?; mC.403
( N/ m6 T2 M& b+ yD.404
- p! x+ x! H1 ?3 {/ q答案:) h+ m6 ?& N% C5 i
/ w7 j' L8 P4 T/ }- J3 W  l
9.通常使用()工具来模拟浏览器进行爬虫请求
9 ?3 b, ?! Q* y* T+ j8 qA.Selenium; h7 E% ]! H) k8 y7 ^0 Y
B.Chrome
0 o& W! e. }" U% J/ s8 _# n  f: BC.ChromeDriver
7 b/ D2 d: V! [+ ]/ ID.WebDriver5 t) j2 w7 R; O! d* m+ x
答案:
9 C6 x, e6 q% P7 ~! d8 W- y
% l' _+ H" L3 ~" [3 ]8 c$ c10.PyMongo中查询所有age > 29的记录是()" q) E5 Y7 G: M% a8 Y; q
A.collection.find({'age': {'$gt': 29}})4 v- u0 D4 K$ ?; w& p6 `
B.collection.find({'age'>29})
/ \- c0 W. U) [2 Y/ T* a, eC.collection.find_all({'age': {'$gt': 29}})+ l; ]6 {" }5 H: G
D.collection.find_all({'age'>29})
: e' M* N% J$ W3 |& {答案:
+ ]0 q9 m0 W, z2 ?8 t
/ {) W0 V! ~; K6 R8 d0 v% P11.使用UI Automator获取屏幕上显示的文本内容的操作是得到相应控件后使用命令()/ w3 \* L( w# u' N1 p5 u4 e
A.content0 a2 M; _: y& [
B.text/ }) c  f+ N0 Q  x. u+ K/ D
C.title
$ N8 [8 @( S, K9 Q$ J" A4 U2 t! ^D.body7 B; \" c7 V9 Y
答案:B9 V" Y& B* ]5 _7 e5 n$ t

, k9 ?: r. Z! W* Q12.如果使用Python的数据结构来做类比的话,MongoDB中库相当于一个大字典,大字典里面的每一个键值对都对应了一个集合,Key为(),Value就是一个集合。. b  r" S2 O" |& G9 F0 X
A.字典& w5 n0 s% g! r6 r# q# l- H
B.集合的名字
, x) h7 _+ ^$ `3 P' sC.集合0 s* V4 ]$ ?; i' U
D.文档' b1 l( B2 M) C4 K) C3 }0 q' U6 l
答案:B
4 d) E* S+ K$ e9 w: m- q* _* a2 d; c  x+ U* Q
13.使用UI Automator打开微信的操作是获取相应图标后使用命令()7 x$ S  s' O, W8 F, X
A.touch/ B- D$ u  K2 @0 W/ R9 E  \8 c
B.click8 A9 u  H5 q. \# T
C.push
0 \3 t$ i5 c4 n5 }! i) d7 {& lD.hover# q! d5 Q7 B2 e5 f3 J) `6 C; y
答案:B
0 l: W9 J( x/ a- U, F
1 s) u8 @" c6 q2 N8 p14.Scrapy自带的待爬队列是()5 F  Q+ e5 g: u7 @8 U
A.deque& [" @( \  H3 a3 V+ p! M
B.queue$ M8 t( j& x- b/ B' ?* H
C.list) W9 G# O1 i+ a# H% f6 j
D.lqueue9 u3 ~( G/ \, Z: O
答案:
5 `" h# ]! c, F# R3 i" }" G# A8 W% M) b+ C* Q- R3 h
15.启动MongoDB使用命令mongod --() usr/local/etc/mongod.conf" [' l6 w6 c' b) E) H. {! m0 f) b
A.config
' `' }% ?8 O1 n3 u. R) hB.install# I" b9 {9 \( [8 I4 L1 p
C.start
% v0 [: C% F* x0 S* G9 VD.begin; G/ o& v6 U( U$ I5 M
答案:! N3 z- I. ]1 N  |: V- J! Y; D

( c, q0 N' Q1 y% _/ i/ O# D16.在Scrapy的目录下,哪个文件负责定义需要爬取的数据?()# U4 h( m" j) R, H. H3 Q- c+ e* h
A.spiders文件夹8 f+ _4 I+ q2 P. L6 W, W! y- Q
B.item.py4 h8 _  c' \  P9 I, f+ m
C.pipeline.py
! P: {9 B2 W8 c4 K4 c) M5 xD.settings.py. P$ I1 j! T! o7 A4 Y0 H! G( q
答案:B  W) H6 K, N9 ~% @$ F7 l' \
# ]& {& r- @+ D; J! G8 d8 z
17.如果使用Python的数据结构来做类比的话,MongoDB中库相当于一个大字典,大字典里面的每一个键值对都对应了一个集合,Key为集合的名字,Value就是一个()。
) F$ s) O" M4 F( ^6 e9 IA.字典
) r2 }# G: \) u: z  ]B.集合的名字6 b! C& t1 O2 p
C.集合
7 u9 r$ m1 C0 `D.文档$ l5 g( E3 _. x8 j) @
答案:
/ B& L6 O1 @' e! |: h' s- x2 q
, u$ D7 R. c$ p, V2 {4 B1 P9 t18.Python中哪种容器一旦生成就不能修改& _- u! n0 T6 p8 \' F. X/ J
A.列表! T/ h+ p: h- T; U, T
B.元组* a. ^& l4 [1 y, o+ S
C.字典
6 S5 z* B4 U' _* w/ K. D* v- iD.集合, u; M0 {/ _/ p! N& V. r
答案:B
! @4 T1 d5 }, O1 N  N, _3 t/ x& L! z& y0 Y( F
19.使用xpath方法的返回类型是()" I2 y0 a* @9 E) f- l! H4 M
A.列表. J6 _" h$ V5 o' y
B.元组
% ]9 \3 D4 M! Y9 P# wC.字典
# S9 i6 i4 H2 h- j) dD.集合$ Q6 D- `8 [8 A6 b# A/ p, W
答案:2 ]4 F/ j* m7 [
, f/ R! v* z: e
20.python中可以用来将图片中的文字转换为文本的第三方类库是
; L* ?9 c7 n1 EA.lxml  B6 t# r* i+ L9 T
B.requests  @! P. x1 ~5 t/ Z& z- i
C.beautifulsoup7 ^* r& u* Y* f% z& ?4 A
D.pytesseract9 v. s; U' |4 k0 W# p% {+ R: a/ B
答案:: U$ A3 i+ A  h. Q: U; n9 e
$ a* @+ {9 C  M
二、多选题 (共 10 道试题,共 20 分)
2 v8 f/ p) y8 _- S5 o, q$ f, c! N, L& a21.requests中post请求方法的第二个参数可以为()
2 B" O4 p( _! K' R! dA.字典
4 V1 q+ G# x  o# {* D! a5 ?2 RB.列表, j! [2 C  G$ v
C.json数据. Z6 [2 h# v+ L  E7 O9 I, S+ X
D.字符串! a+ o! i/ K( B% d
答案:6 H* P! W( l* \1 D# o! C( r
' g1 n, `( X4 Q) M; J
22.Redis中的值可以支持()
* w, Z- H& x6 T0 u4 OA.列表' @) F1 a+ O5 p, R8 e) t
B.哈希( I$ w. ?1 D! j- U. h: _
C.集合7 P. b7 ^8 X, T0 z  I) o
D.有序集合
; h. d0 R1 k4 X$ @/ B3 K. o  Z答案:BCD* \8 m7 U( Q" e+ D% g+ w5 Q( x* M

' W, [5 _: @4 F1 Z/ Q! R23.HTTP常用状态码表明表明客户端是发生错误的原因所在的有()
" b/ g) Q( K7 ~) DA.403
2 h4 j2 p, Y, H; Z( tB.404, c: S+ w: d' Q5 }! S7 Y) z
C.500
7 q. y! y$ t$ SD.5030 |# A- M+ j8 Z% l$ u/ U& K
答案:B- ]& ~" `% n; N' o7 [, n8 V$ ^
3 r% x, J$ K7 F" Q' m' t% J
24.下载器中间件的作用有哪些?' y2 P6 x1 v/ I6 i9 R6 H3 f
A.更换代理IP
) w" Q" e; V4 B6 g9 j  a3 B( xB.更换Cookies8 W/ W+ v# O$ m1 C# n1 Q9 h0 q
C.更换User-Agent: o( u  a. z$ B. U1 L. m1 @# s
D.自动重试
7 M6 {8 M7 j! K8 x答案:BCD- y4 A* k+ e" o) y! ~
1 J! X) J  E( C& l$ _, _+ M
25.最常见的HTTP请求类型有()
, y& f0 D+ x1 O) e8 n4 a  ^9 ]) wA.GET
( i1 _, V5 v% I: ^) IB.POST' y/ |# Y/ O. c6 p8 ^% k
C.SEND
" }, T: P6 ^# }* |: Y. iD.RECEIVE" N" e! r) {2 b+ e3 U, r$ U
答案:B
: r* _9 _/ n* r
) ^0 c4 B2 k. W5 u# p26.Python中的容器有()
" W# f5 a0 l3 w7 ^" J& P" P$ G4 y) WA.列表
2 X: |" h: n& s+ k, X3 y6 F/ ZB.元组+ s+ E% f" d# N4 N
C.字典
% o6 j3 r8 w8 P" FD.集合
+ E% e" ^4 @7 J8 s1 ^4 z- ?答案:BCD
% B5 Q: P8 z! t9 T$ W* d( h+ o
4 L; G* z1 k9 Y7 D0 o27.如果爬虫爬取的是商业网站,并且目标网站使用了反爬虫机制,那么强行突破反爬虫机制可能构成()0 R* j' W5 Z8 n! J0 P: P4 b
A.非法侵入计算机系统罪# a$ Z- q" i( O7 x2 {$ ^9 s6 l) I( _
B.非法获取计算机信息系统数据罪
& C  V" Y3 Q$ @$ OC.非法获取计算机数据罪
3 o' E: c& |7 m3 a- [D.非法获取系统罪0 ?) c) [* i, a
答案:B5 d5 t' D% ?6 z) `6 u
1 V' z! }+ I; K/ E. K# O+ V
28.要使用tesseract来进行图像识别,需要安装两个第三方库: Z4 @+ [$ I" ~7 a; p, b9 [- R
A.requests; D9 L  X7 ?4 |+ G1 W6 n
B.beautifulsoup  ?) e$ h& M8 E2 p0 K7 ^
C.Pillow
# K1 x. m4 J4 S$ ]8 p: @D.pytesseract, p) E* Z6 `6 O
答案# h2 G& w, i+ p& M2 p) K+ F

' ?8 P* h5 ^; `# ?8 R" H29.Python中有哪些实现多线程方法()  v, ]- u: Q- h: ?
A.multiprocess.dummy: t+ d0 s. D* I3 s6 o
B.threading.Thread
6 ?8 W7 x, A/ ~C.process% w/ h. G; t/ f
D.PyMongoDB
7 P- L  ]6 X1 d/ h5 D答案:B! e& i" X* N2 `7 U- w; S
+ K1 X* [+ {  ^, g9 I% z
30.在配置ios使用Charles的操作中,正确的有()
3 \2 L4 i  X- c  W  e+ v$ ^9 gA.对于苹果设备,首先要保证计算机和苹果设备联在同一个Wi-Fi上。
; w8 c/ Y' y. I5 F! u3 a, [B.选择"HTTP代理"下面的"手动"选项卡,在"服务器"处输入计算机的IP地址,在"端口"处输入8888
5 |1 D* q' a; @- @  `# s; nC.输入完成代理以后按下苹果设备的Home键,设置就会自动保存。/ Z" i6 W5 @  U" u% u5 E# `
D.安装完成证书以后,在设置中打开"关于本机",找到最下面的"证书信任设置",并在里面启动对Charles证书的完全信任
# x" j( a, L+ a' W7 C  z# S答案:BCD4 q2 @# d9 ?  _0 y) V+ I9 i) N

' o9 z3 q+ {9 H3 J三、答案来源:谋学网(www.mouxue.com) (共 20 道试题,共 40 分)3 }! J2 f# x+ a/ s' N+ {
31.所有的异步加载都会向后台发送请求
  W. \$ V# f/ H答案:错误6 L9 y3 C7 \. |3 K. a- r0 a
. X) q0 l$ M% p$ O+ _+ N2 ~! K: K
32.当运行爬虫代码后,出现"Forbidden by robots.txt"提示后,说明当前时间段被爬取的网站无法访问。
$ V- l" w% D; e" Q答案:错误
& }# X/ V4 x; ]4 q' |' v0 m: ~5 V
: Z& Z1 o9 ]4 O7 k0 f8 Q33.Python中元组生成以后还可以往里面继续添加数据,也可以从里面删除数据;
2 u1 ]  h. b% Q; l, R/ P答案:错误6 K; @. [( z' Q/ c; \; }: ]- ?( R

6 H- X: O& u5 Y% c( @! |& L34.PyMongoDB中排序方法sort第二个参数-1表示升序' P9 Y( P  m2 G
答案:错误
$ p6 j5 ^, R: d! o- Y6 `/ F
% A5 |1 t+ J. @/ ~1 |4 A3 ~  {35.通用网络爬虫通常采用串行工作方式% B" B5 h' C6 I' E1 I/ v
答案:错误
/ y5 X3 F" e2 n. o) o( Q. t7 o: ?3 w9 y* l6 q. i2 g0 p* |& Q
36.Python中写CSV文件的writerows方法参数为字典类型6 A4 r5 N/ U9 c$ A
答案:错误; ?3 H0 [* Y3 _- L4 Q

' W8 E; g1 B! a3 v! w3 ?) B+ o$ Z37.在对XPath返回的对象再次执行XPath的时候,子XPath开头需要添加斜线  c" `4 s0 Z% ]3 F( W
答案:错误8 V' D2 y6 |; o! A. f7 P1 F
1 w; _3 f; a6 F! q) W  e
38.MongoDB URI的格式为: mongodb://服务器IP或域名:端口@用户名:密码
7 q# k. w6 }) y3 \答案:错误
; W% H; ]* a1 K; b0 d* s6 W6 c1 ]: D
: x" a  `3 Y2 |" Y: ^) S8 W  ~39.操作文本难以实现自动化,而操作图形界面可以容易的实现自动化。
3 Q' Z6 r4 m/ ~. ^0 d) p9 s答案:错误3 V9 s% Y  o4 r2 _4 Z

2 ]! u* L+ n; Z2 K+ T' k; c40.如果MongoDB运行在所在的计算机上,MONGODB_HOST应该写成"192.168.0.1"$ J6 h5 \, s2 \! z) e+ }
答案:错误
3 D& W4 u- O$ B# |- T5 |1 c- @. O" b/ a+ Y: {6 A+ R& q& h# L
41.在Ubuntu下若要运行Redis可以使用CMD进入解压以后的文件夹并运行命令redis-server.exe redis.windows.conf启动Redis. e) w$ O& u6 m$ M
答案:错误
) ?" |/ s0 h7 U7 |' W) o/ Q  A' G+ N
42.在发送请求时需要注意requests提交的请求头不能与浏览器的请求头一致,因为这样才能隐藏好自己达到获取数据的目的
! }# v$ P/ X' i1 M5 q  N/ z答案:错误+ [  }5 b: Z( `  e* l
. z( ^: ~& r9 r& W  p; [# _; Z
43.Redis是遵守BSD协议、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库
- F, z6 g2 Z2 e2 L& A( E答案:正确
( t  k+ F  u6 k# C! n
. B% W3 W& g# ^# s9 I44.HTTP只能通过POST请求才能发送数据4 }" ?8 M8 A; R5 J% ]& J2 P
答案:错误
. p- |$ I1 T5 M: [: U& N& N% _7 k) S( v7 O# o! B/ b5 V$ V+ F. G) T
45.如果目标网站本身就是提供公众查询服务的网站,那么使用爬虫是合法合规的。2 j$ X+ O# c- z: C( k
答案:正确
0 U' N1 b( L8 G8 B8 \+ E
6 G8 ~0 |% F# w$ i- Q46.使用AJAX技术,可以在不刷新网页的情况下更新网页数据( L! X3 V1 R5 d
答案:正确
- X7 U: K# ]7 l1 t* U
. ]% [" L- }; X$ f9 q47."curl http://爬虫服务器IP地址:6800/cancel.json -d project=工程名 -d job=爬虫JOBID"该命令的作用是启动爬虫
% d& d' J4 H. h答案:错误6 j! o& K8 v3 r) J* W
' ^% k) @$ |% z7 e9 _5 c5 G
48.如果通过爬虫抓取某公司网站的公开数据,分析以后发现这个公司业绩非常好,于是首先把数据或者分析结果出售给某基金公司,然后自己再买被爬公司的股票。此时,涉嫌内幕交易,属于严重违法行为。4 m+ P- P$ q) q* X  T1 {% V" f
答案:正确/ F) R, h4 C' Y9 t2 Z7 P3 I6 u

9 V' V, `7 q! X49.Redis中查询列表长度命令llen中l代表left,即从左侧开始数
, X0 T4 a+ y/ L# w. i5 G答案:错误
" b7 U+ ]- g5 E2 z/ |( m" a( L. _  o5 U' l, A5 t* p3 r
50.爬虫中间件的作用对象是请求request和返回response) @/ Y/ W0 w' [% L  P
答案:错误
2 m+ p$ I/ q: h9 g* z. S1 A- I0 T0 b1 f1 m
* L6 Z5 H% N+ g+ u, A' \
" R" }5 S5 U" c' e

5 Y. ]/ b3 L, {  ]9 Q* |, @( B/ Q
5 S* U  n( D% f7 L; d
3 }3 ~" E( h2 ?3 q/ j1 x7 s5 A4 H2 W9 X

5 f2 g% j( _. H; J  J
! c' @- V# }7 Z: j5 w
, i' Y: w  e2 {2 Z
5 V! @& P' T5 H. ]1 Q5 _; u' m5 D9 S# s3 {6 F

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?会员注册

×
奥鹏作业答案,奥鹏在线作业答案
发表于 2023-8-2 06:50:32 | 显示全部楼层
奥鹏作业答案,奥鹏在线作业答案
回复

使用道具 举报

发表于 2023-8-2 07:14:45 | 显示全部楼层
奥鹏作业答案,奥鹏在线作业答案
回复

使用道具 举报

发表于 2023-8-2 08:15:23 | 显示全部楼层
奥鹏作业答案,奥鹏在线作业答案
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 会员注册

本版积分规则

 
 
客服一
客服二
客服三
客服四
点这里给我发消息
点这里给我发消息
谋学网奥鹏同学群2
微信客服扫一扫

QQ|关于我们|联系方式|网站特点|加入VIP|加盟合作|投诉建议|法律申明|Archiver|小黑屋|奥鹏作业答案-谋学网 ( 湘ICP备2021015247号 )

GMT+8, 2025-1-23 01:04 , Processed in 0.110504 second(s), 17 queries .

Powered by Discuz! X3.5

Copyright © 2001-2025 Tencent Cloud.

快速回复 返回顶部 返回列表