|
【北京语言大学】大数据技术与应用-22春《大数据技术与应用》作业_2
试卷总分:100 得分:100
第1题,哪些数据需要进行清洗
A、 不完整数据
B、 不同类型数据
C、 相同的数据
D、 不同的数据
正确资料:
第2题,from sklearnneighbors import LocalOutlierFactor nclf = LocalOutlierFactornneighbors=20 n从上面语句可以看出LOF实例的参数k取值为
A、 10
B、 20
C、 30
D、 40
正确资料:
第3题,from sklearnensemble import IsolationForest nclf = IsolationForestmaxsamples=100 randomstate=0n从上面语句可以看出孤立森林中孤立树模型的数目为
A、 100
B、 200
C、 300
D、 400
正确资料:
第4题,不包含任何项的项集是指
A、 项
B、 空集
C、 超项集
D、 子项集
正确资料:
资料来源:谋学网(www.mouxue.com),逻辑回归中的"逻辑"是指
A、 规则
B、 Sigmoid函数
C、 学者名字
D、 以上都不对
正确资料:
第6题,创建LOF异常检测实例的语句是
A、 from sklean.neighbors import LocalOutlierFactor
B、 clf=LocalOutlierFactor(n_neighbors=20)
C、 y_pred=clf.fit_predict(X)
D、 X_scores = clf.negative_outlier_factor_
正确资料:
第7题,根据时间序列数据前后关系进行异常检测的类型属于
A、 数据点异常
B、 上下文异常
C、 集合异常
D、 以上都不对
正确资料:
第8题,检查单个样本点与其他样本点距离是否太远进而判断该点是否为异常点这种类型的异常检测属于
A、 数据点异常
B、 上下文异常
C、 集合异常
D、 以上都不对
正确资料:
第9题,如果一个项集包含K个项则该项集称为
A、 项
B、 空集
C、 超项集
D、 K项集
正确资料:
资料来源:谋学网(www.mouxue.com),用训练好的LOF实例判断数据是否异常正常样本用1表示异常样本用1表示的语句
A、 from sklean.neighbors import LocalOutlierFactor
B、 clf=LocalOutlierFactor(n_neighbors=20)
C、 y_pred=clf.fit_predict(X)
D、 X_scores = clf.negative_outlier_factor_
正确资料:
第11题,定性数据包括
A、 有序数据
B、 无序数据
C、 定类等级数据
D、 定性等级数据
正确资料:、B、C、D
资料来源:谋学网(www.mouxue.com),数据集中趋势分析的常用指标包括
A、 平均值
B、 中位数
C、 众数
D、 四分位数
正确资料:、B、C、D
第13题,异常检测的难点
A、 不能明确定义何为正常,何为异常,在某些领域正常和异常并没有明确的界限
B、 数据本身存在噪声,致使噪声和异常难以区分
C、 正常行为并不是一成不变,也会随着时间演化,如正常用户被盗号之后,进行一系列的非法操作
D、 难以获取标记数据,没有数据,再好的算法也是无用
正确资料:、B、C、D
第14题,属于基于聚类的异常值检测方法包括
A、 MA滑动评价法
B、 3-Sigma方法
C、 One-Class SVM
D、 基于K-Means聚类的异常检测
正确资料:、D
资料来源:谋学网(www.mouxue.com),数据分析的常用统计指标包括
A、 平均数
B、 中位数
C、 众数
D、 方差
正确资料:、B、C、D
第16题,描述性统计分析不包括图形化可视化表示的内容
√、T
×、F
正确资料:×
第17题,聚类的目的是使得同一个簇内的数据对象的相似性尽可能大同时不在同一个簇中的数据对象的差异性尽可能小
√、T
×、F
正确资料:×
第18题,因为 Bayes 理论能够帮助理解基于概率估计的复杂现况所以它成为了数据挖掘和概率论的基础
√、T
×、F
正确资料:×
第19题,逻辑回归logistic regression方法顾名思义属于回归方法
√、T
×、F
正确资料:×
资料来源:谋学网(www.mouxue.com),KNN分类器随着参数k的变化样本的分类结果不会发生变化
√、T
×、F
正确资料:×
第21题,数据类型等级最高的是定类数据
√、T
×、F
正确资料:×
第22题,模糊C均值聚类算法中隶属度的值可以小于0
√、T
×、F
正确资料:×
第23题,z分数标准化是对离散数据进行标准化的方法
√、T
×、F
正确资料:×
第24题,下四分位数是指 数据从大到小排列排在第25%位置的数字即最小的四分位数下四分位数
√、T
×、F
正确资料:×
资料来源:谋学网(www.mouxue.com),描述性统计分析对调查对象局部变量的有关数据做统计性描述即可
√、T
×、F
正确资料:×
|
|