9.关联规则的基本概念中错误的是D(2分)
A. K项集指的是K个项的集合
B.置信度是项集出现次数除以总的交易次数
C.相对支持度指的是项集出现次数除以总的交易次数
D .项集频率指的是项集所有交易中出现的次数
13.单舆情的系统架构正确的是B( 2分)
A.规划-存储-采集-分析-报告-管控
B.规划-采集-存储-分析-报告-管控
C.规划-采集-分析-存储-报告-管控
D.规划-存储-分析-采集-报告-管控
14、下列关于舍恩伯格对大数据特点的说法中,错误的是(C )
A.数据处理速度快
B.数据规模大
C.数据价值密度高
D.数据类型多样
15.关于聚类挖掘,表述错误的是:B (2分)
A.好聚类的方法的标准是要产生高质量的聚类结果
B.聚类结果的好坏与能否发现隐含模式无关
C .聚类结果的好坏取决于相似性的度量方法以及具体实现
D. 好的聚类结果应该有高类内相似性和低类间相似性这样的特征
17.哪个不属于知识发现的步骤C( 2分)
A.数据集成
B .数据清理
C.数据开发
D.数据选择
20、Spark生态图中, (D )提供了一个机器学习的算法库( 2分)
A. Tachyon
B. GraphxGraphParallel
C. SharkSQL
D. MLBaseMachineLearning
21、大数据环境下的隐私担忧,主要表现为(B ) (2分)
A.病毒入侵.
B.个人信息的被识别与暴露
C.用户画像的生成
D.恶意广告的推送
30、Hive2也被称为 Stringer,底层的计算引擎由(A)替换()(2分)
○A.Tez, MapReduce
○B. Tez Hdfs
○C. MapReduce,Tez
31、云计算使得使用信息的存储是一个(BD)的方式,它会大大地节约网络的成本,使得网络将来来越音及,成本越来越低。(2分)
□A.密集式
□B.分布式
□C,密闭式
□D,共享式
32、按照服务目的不同,数据流通平台可分为(ACD)(2分)
口A.数据废气交易市场
□B.企业数据开放平台
□C.数据交易市场
□D.数据研发市场E.政府数开放平台
34、下列关于云计算和数据库的说法中,错误的是(BD)(2分)
A.比抽样调查数据更全面
□B.获取样本的代价很高
□C.比抽样凋查更能反映整个群体的特征与规律
□D.以为发现新的商业机会提供决策支持
□E.获取足够大的样本数据乃至全体数据非常容易