|
【北京语言大学】大数据技术与应用-22春《大数据技术与应用》作业_1
试卷总分:100 得分:100
第1题,数据集{22444466881214162022}的中四分位数为
A、 2
B、 4
C、 6
D、 8
正确资料:
第2题,用训练好的LOF实例对数据进行LOF分数计算并排序的语句是
A、 from sklean.neighbors import LocalOutlierFactor
B、 clf=LocalOutlierFactor(n_neighbors=20)
C、 y_pred=clf.fit_predict(X)
D、 X_scores = clf.negative_outlier_factor_
正确资料:
第3题,数据等级排序T的是
A、 定距等级定比等级定类等级定序等级
B、 定比等级定序等级定距等级定类等级
C、 定比等级定距等级定序等级定类等级
D、 定比等级定类等级定序等级定距等级
正确资料:
第4题,用训练好的随机森林对样本进行类别预测的语句是
A、 from sklearn.tree import DecisionTreetClassifier
B、 clf=DecisionTreetClassifier()
C、 clf.fit(Xtrain,Ytrain)
D、 predictions=clf.predict(Xtest)
正确资料:
资料来源:谋学网(www.mouxue.com),数据集{22444466881214162022283044}的中四分位数为
A、 2
B、 4
C、 6
D、 8
正确资料:
第6题,从软件库中导入随机森林类的语句是
A、 from sklearn.tree import DecisionTreetClassifier
B、 clf=DecisionTreetClassifier()
C、 clf.fit(Xtrain,Ytrain)
D、 predictions=clf.predict(Xtest)
正确资料:
第7题,用训练好的孤立森林isolation forest实例对数据进行异常值检测的语句是
A、 from sklean.ensemble import IsolationForest
B、 LocalOutlierFactor
C、 clf= IsolationForest(max_samples=100,random_state=0)
D、 clf.fit(X_train)
E、 y_pred=clf.fit_predict(X)
F、 y_pred_test = clf.predict(X_test)
正确资料:
第8题,以下不是大数据的特征
A、 大量
B、 多样
C、 高速
D、 实时
正确资料:
第9题,数据集{22444466881214162022}的上四分位数为
A、 12
B、 14
C、 16
D、 18
正确资料:
资料来源:谋学网(www.mouxue.com),数据集{22444466881214162022283044}的四分位差为
A、 20
B、 22
C、 20.5
D、 18.5
正确资料:
第11题,大数据收集的途径包括
A、 互联网
B、 移动互联网
C、 物联网传感器
D、 手动
正确资料:、B、C
资料来源:谋学网(www.mouxue.com),可用于实现数据onehot编码的方法包括
A、 Pandas的head
B、 Pandas的get_dummies
C、 sklearn.preprocessing.OneHotEncoder方法
D、 Pandas的tail
正确资料:、C
第13题,KNN分类器采用的距离度量包括
A、 欧氏距离
B、 马氏距离
C、 曼哈顿距离
D、 以上都不对
正确资料:、B、C
第14题,常用的分类方法包括
A、 朴素贝叶斯分类器
B、 决策树
C、 KNN
D、 以上都不对
正确资料:、B、C
资料来源:谋学网(www.mouxue.com),常用的描述统计分析方法包括
A、 对比分析法
B、 平均分析法
C、 交叉分析法
D、 以上都不对
正确资料:、B、C
第16题,数据类型等级最低的是定比数据
√、T
×、F
正确资料:×
第17题,离散系数是数据集中趋势分析常用指标之一
√、T
×、F
正确资料:×
第18题,minmax标准化是对离散数据进行标准化的方法
√、T
×、F
正确资料:×
第19题,低层次数据可以向高层次转化代价是损失部分数据信息
√、T
×、F
正确资料:×
资料来源:谋学网(www.mouxue.com),Apriori算法中频繁2项集的每个项集长度均为2但并非都是频繁的
√、T
×、F
正确资料:×
第21题,等宽分箱方法是指每个分箱中样本数量一致
√、T
×、F
正确资料:×
第22题,经过z分数标准化处理后数据均值为原数据平均值 标准差为原数据标准差
√、T
×、F
正确资料:×
第23题,决策树每个"内部结点"对应于整体属性"测试"test
√、T
×、F
正确资料:×
第24题,经过z分数标准化处理后数据的绝对值可以大于1
√、T
×、F
正确资料:×
资料来源:谋学网(www.mouxue.com),盖帽法是针对离散型数据中噪声进行处理的方法
√、T
×、F
正确资料:×
|
|