奥鹏作业答案-谋学网-专业的奥鹏在线作业答案辅导网【官网】

 找回密码
 会员注册

微信登录,扫一扫

手机号码,快捷登录

VIP会员,3年作业免费下 !奥鹏作业,奥鹏毕业论文检测新手作业下载教程,充值问题没有找到答案,请在此处留言!
2022年5月最新全国统考资料投诉建议,加盟合作!点击这里给我发消息 点击这里给我发消息
奥鹏课程积分软件(2021年最新)
查看: 2978|回复: 0

22春学期(高起本1709、全层次1803-2103)《大数据导论》在线作业答卷

[复制链接]
发表于 2022-7-18 19:58:17 | 显示全部楼层 |阅读模式
谋学网
22春学期(高起本1709-1803、全层次1809-2103)《大数据导论》在线作业-00003
试卷总分:100  得分:100
一、单选 (共 15 道试题,共 30 分)
1.医疗健康数据的基本情况不包括以下哪项?
A.诊疗数据
B.个人健康管理数据
C.公共安全数据
D.健康档案数据
资料:

2.哪个选项不属于大数据4V特点?
A.Volume
B.Valid
C.Variety
D.Value
资料:

3.数据产生方式变革中数据产生方式是主动的主要是来自哪个阶段( )。
A.运营式系统阶段
B.用户原创内容阶段
C.感知式系统阶段
资料:

4.数据仓库是随着时间变化的,下列不正确的是()
A.数据仓库随时间变化不断增加新内容
B.捕捉到的新数据会覆盖原来的快照
C.数据仓库随事件变化不断删去旧的数据内容
D.数据仓库中包含大量的综合数据,这些综合数据会随时间的变化不断进行重新综合
资料:

5.用于描述相等时间间隔下连续数据随时间变化趋势的是()
A.折线图
B.散点图
C.条形图
D.饼图
资料:

6.第一个提出大数据概念的公司是( )。
A.麦肯锡公司
B.谷歌公司
C.微软公司
D.脸谱公司
资料:

7.大数据的最显著特征是() 。
A.数据规模大
B.数据类型多样
C.数据处理速度快
D.数据价值密度高
资料:

8.MapReduce中的Map和Reduce函数使用()进行输入输出
A.key/value对
B.随机数值
C.其他计算结果
资料:

9.用于描述数据分散情况的是()
A.分布图
B.箱式图
C.饼图
D.折线图
资料:

10.SAN是一种()
A.存储设备
B.专为数据存储而设计构建的网络
C.光纤交换机
D.HBA
资料:

11.下列哪个工具常用来开发移动友好地交互地图()
A.Leaflet
B.Visual.ly
C.BPizza Pie Charts
D.Gephi
资料:

12.下列不属于商业大数据类型的是
A.传统企业数据
B.机器和传感器数据
C.社交数据
D.电子商务数据
资料:

13.以下不是数据仓库基本特征的是()
A.数据仓库是面向主题的
B.数据仓库是面向事务的
C.数据仓库的数据是相对稳定的
D.数据仓库的数据是反映历史变化的
资料:

14.数据清洗的方法不包括
A.缺失值处理
B.噪声数据清除
C.一致性检查
D.重复数据记录处理
资料:

15.()是Microsoft Office的核心组件
A.SQL
B.WORD
C.PPT
D.EXCEL
资料:

二、多选题 (共 15 道试题,共 30 分)
16.医疗大数据的来源主要包括()
A.制药企业/生命科学
B.临床医疗/实验室数据
C.费用报销/利用率
D.健康管理/社交网络
资料:

17.层次方法可以分为()
A.K均值算法
B.K中心点算法
C.凝聚法
D.分裂法
资料:

18.数据归约(Data Reduction)主要有()
A.维度规约
B.样本规约
C.数据聚集
D.离散化概念分层
资料:

19.KNIME(Konstanz Information Miner)是一个对用户友好的、智能、开源的平台。该平台包括了##、##、##、##。
A.数据集成
B.数据处理
C.数据分析
D.数据挖掘
资料:

20.以下可以用于数据可视化的是()。
A.R语言
B.Excel
C.RapidMiner
D.Weka
资料:

21.网络数据采集常用的是通过##或##等方式从网站上获取数据信息。
A.网络爬虫
B.网站公开API
C.手动获取
资料:

22.大数据时代预测人类移动行为的数据来源有
A.志愿者定位数据
B.装有导航设备的出租车轨迹数据
C.手机终端定位于通讯记录
D.社会网络签到数据
资料:

23.医疗领域如何利用大数据
A.临床决策支持
B.个性化医疗
C.社保资金安全
D.用户行为分析
资料:

24.按照数据量的大小,可将数据分析分为()
A.内存级数据分析
B.Bl级数据分析
C.海量级数据分析
D.巨量级数据分析
资料:

25.数据分析的类型根据数据分析深度可以分为()
A.描述性分析
B.预测性分析s
C.规则性分析
资料:

26.百度大数据引擎主要包含三大组件()
A.开放云
B.数据工厂
C.百度大脑。
资料:

27.交通数据分析可用于:
A.交通流量实时分析
B.合理进行道路规划
C.信号灯智能调度
D.实时路况查询播报
资料:

28.一个HDFS集群由一个##和##构成。此外,还有与这两个角色之间作为沟通桥梁的客户端(Client)。
A.一个名字节点
B.若干个名字节点
C.一个数据节点
D.若干个数据节点
资料:

29.基于大数据的临床决策支持系统的架构包括
A.支撑层
B.大数据分析层
C.网络层
D.应用层
资料:

30.云计算的特点是()
A.大规模
B.高扩展性
C.虚拟化
D.按需分配
资料:

三、资料来源:谋学网(www.mouxue.com) (共 20 道试题,共 40 分)
31.分类是根据在数据中发现的描述对象及其关系的信息,将数据对象分组。 组内相似度高,组间差异性大。
资料:错误

32.移动手机数据相对较低的时空分辨率使其并不适于估测道路上的行车时间,但是他们高渗透率和记录期长的特点使其成为分析OD行为的最佳选择。
资料:正确

33.离群点检测的任务是识别特征显著不同于其他数据的观测值,这样的点称为异常点、离群点或孤立点。
资料:正确

34.时空数据可视化与地理制图学相结合,重点对时间与空间维度,以及与之相关的信息对象属性建立可视化表征,对与时间和空间密切相关的模式及规律进行展示
资料:正确

35.弹性是指有容错的机制,若一个RDD分片去失,Spark可以根据粗粒度的日志数据更新记录的信息重构它。
资料:正确

36.大数据的基本属性是数据量大
资料:正确

37.广播变量在广播后可以修改
资料:错误

38.NoSQL是泛指非关系型、分布式和不提供ACID的数据库,它不是单纯地反对关系型数据库,而是强调键值存储和文档数据库的优点。
资料:正确

39.数据清洗主要是删除原始数据集中的无关数据、重复数据,平滑噪声数据,筛选掉与挖掘主题无关的数据,处理缺失值、异常值。
资料:正确

40.轨迹数据包含空间和时间属性,并且通常规模巨大且维度高
资料:正确

41.经典的基于节点和边的可视化,是图可视化的主要形式。
资料:正确

42.直接拿 Python 输出的图片用于印刷效果很好
资料:错误

43.FP-growth算法需要对数据库进行3次扫描
资料:错误

44.一个属性如果能由另一个或一组属性导出,则这个属性可能是冗余的。
资料:正确

45.每个变量的最大值和最小值之差称为极差
资料:正确

46.多租户技术是为了实现不同使用者之间的资源分配、隔离和共享。
资料:正确

47.噪声(noise)是被测量变量的随机误差或方差。
资料:正确

48.所有关系型数据中的数据全部为结构化数据。半结构化数据就是介于完全结构化数据和完全无结构化的数据之间的数据。
资料:正确

49.数据集成(Data Integration)是将多个数据源中的数据合并存放到一个一致的数据存储中
资料:正确

50.社交数据分析工具是基于社交网站的海量数据而衍生出来的服务型产品,但是同时它们反过来也为社交网站提供了巨大的参考价值。
资料:正确












22春学期(高起本1709、全层次1803-2103)《大数据导论》在线作业答卷.rar

9.59 KB, 下载次数: 0

售价: 5 学习币  [记录]  [购买]

奥鹏作业答案,奥鹏在线作业答案
您需要登录后才可以回帖 登录 | 会员注册

本版积分规则

 
 
客服一
客服二
客服三
客服四
点这里给我发消息
点这里给我发消息
谋学网奥鹏同学群2
微信客服扫一扫

QQ|关于我们|联系方式|网站特点|加入VIP|加盟合作|投诉建议|法律申明|Archiver|小黑屋|奥鹏作业答案-谋学网 ( 湘ICP备2021015247号 )

GMT+8, 2024-12-25 10:06 , Processed in 0.100501 second(s), 19 queries .

Powered by Discuz! X3.5

Copyright © 2001-2023 Tencent Cloud.

快速回复 返回顶部 返回列表