【北语网院】大数据技术与应用22春《大数据技术与应用》作业_1

admin · 发表于 2022-8-11 02:33:09

【北京语言大学】大数据技术与应用-22春《大数据技术与应用》作业_1
试卷总分:100 得分:100
第1题,数据集{22444466881214162022}的中四分位数为
A、 2
B、 4
C、 6
D、 8
正确资料:

第2题,用训练好的LOF实例对数据进行LOF分数计算并排序的语句是
A、 from sklean.neighbors import LocalOutlierFactor
B、 clf=LocalOutlierFactor(n_neighbors=20)
C、 y_pred=clf.fit_predict(X)
D、 X_scores = clf.negative_outlier_factor_
正确资料:

第3题,数据等级排序T的是
A、定距等级定比等级定类等级定序等级
B、定比等级定序等级定距等级定类等级
C、定比等级定距等级定序等级定类等级
D、定比等级定类等级定序等级定距等级
正确资料:

第4题,用训练好的随机森林对样本进行类别预测的语句是
A、 from sklearn.tree import DecisionTreetClassifier
B、 clf=DecisionTreetClassifier()
C、 clf.fit(Xtrain,Ytrain)
D、 predictions=clf.predict(Xtest)
正确资料:

资料来源：谋学网（www.mouxue.com）,数据集{22444466881214162022283044}的中四分位数为
A、 2
B、 4
C、 6
D、 8
正确资料:

第6题,从软件库中导入随机森林类的语句是
A、 from sklearn.tree import DecisionTreetClassifier
B、 clf=DecisionTreetClassifier()
C、 clf.fit(Xtrain,Ytrain)
D、 predictions=clf.predict(Xtest)
正确资料:

第7题,用训练好的孤立森林isolation&nbspforest实例对数据进行异常值检测的语句是
A、 from sklean.ensemble import IsolationForest
B、 LocalOutlierFactor
C、 clf= IsolationForest(max_samples=100,random_state=0)
D、 clf.fit(X_train)
E、 y_pred=clf.fit_predict(X)
F、 y_pred_test = clf.predict(X_test)
正确资料:

第8题,以下不是大数据的特征
A、大量
B、多样
C、高速
D、实时
正确资料:

第9题,数据集{22444466881214162022}的上四分位数为
A、 12
B、 14
C、 16
D、 18
正确资料:

资料来源：谋学网（www.mouxue.com）,数据集{22444466881214162022283044}的四分位差为
A、 20
B、 22
C、 20.5
D、 18.5
正确资料:

第11题,大数据收集的途径包括
A、互联网
B、移动互联网
C、物联网传感器
D、手动
正确资料:、B、C

资料来源：谋学网（www.mouxue.com）,可用于实现数据onehot编码的方法包括
A、 Pandas的head
B、 Pandas的get_dummies
C、 sklearn.preprocessing.OneHotEncoder方法
D、 Pandas的tail
正确资料:、C

第13题,KNN分类器采用的距离度量包括
A、欧氏距离
B、马氏距离
C、曼哈顿距离
D、以上都不对
正确资料:、B、C

第14题,常用的分类方法包括
A、朴素贝叶斯分类器
B、决策树
C、 KNN
D、以上都不对
正确资料:、B、C

资料来源：谋学网（www.mouxue.com）,常用的描述统计分析方法包括
A、对比分析法
B、平均分析法
C、交叉分析法
D、以上都不对
正确资料:、B、C

第16题,数据类型等级最低的是定比数据
√、T
×、F
正确资料:×

第17题,离散系数是数据集中趋势分析常用指标之一
√、T
×、F
正确资料:×

第18题,minmax标准化是对离散数据进行标准化的方法
√、T
×、F
正确资料:×

第19题,低层次数据可以向高层次转化代价是损失部分数据信息
√、T
×、F
正确资料:×

资料来源：谋学网（www.mouxue.com）,Apriori算法中频繁2项集的每个项集长度均为2但并非都是频繁的
√、T
×、F
正确资料:×

第21题,等宽分箱方法是指每个分箱中样本数量一致
√、T
×、F
正确资料:×

第22题,经过z分数标准化处理后数据均值为原数据平均值&nbsp标准差为原数据标准差
√、T
×、F
正确资料:×

第23题,决策树每个"内部结点"对应于整体属性"测试"test
√、T
×、F
正确资料:×

第24题,经过z分数标准化处理后数据的绝对值可以大于1
√、T
×、F
正确资料:×

资料来源：谋学网（www.mouxue.com）,盖帽法是针对离散型数据中噪声进行处理的方法
√、T
×、F
正确资料:×

		自动登录	找回密码
密码			会员注册

VIP会员，3年作业免费下！	奥鹏作业，奥鹏毕业论文检测	新手作业下载教程，充值问题	没有找到答案，请在此处留言！
2022年5月最新全国统考资料	投诉建议，加盟合作！		奥鹏课程积分软件(2021年最新)