哺豌京菲蝗萝让旱巍储伎壬惮
茨室告枫泰公熔沥问舶貌脯曹
第一章 单元测试
1、2011年麦肯锡研究院提出的大数据定义是:大数据是指其大小超出了常规数据库工具获取、储存、管理和( )能力的数据集。
A 计算
B 访问
C 应用
D 分析
答案 分析
2、用4V来概括大数据的特点的话,一般是指:Value、Velocity、Volume和( )。
A Variety
B Vainly
C Vagary
D Valley
答案 Variety
3、大数据分析四个方面的工作主要是:数据分类、( )、关联规则挖掘和时间序列预测。
A 数据统计
B 数据计算
C 数据聚类
D 数据清洗
答案 数据聚类
4、新浪和京东联合推出的大数据商品推荐,是由京东盲目推送到当前浏览新浪网站的用户的页面上的。
A 对
B 错
答案 错
5、目前的大数据处理技术只能处理结构化数据。
A 对
B 错
答案 错
第二章 单元测试
1、我们常用的微软Office套件中的Access数据库软件的数据库文件格式后缀名是( )。
A mdf
B mdb
C dbf
D xls
答案 mdb
2、大多数日志文件的后缀名是( )。
A txt
B csv
C xml
D log
答案 log
3、本课程重点介绍的weka软件的专有文件格式是( )。
A MongoDB
B ARFF
C value
D key map
答案 ARFF
4、数据清洗工作的目的主要是要解决数据的完整性、唯一性、合法性和( )。
A 专业性
B 排他性
C 一致性
D 共享性
答案 一致性
5、八爪鱼软件的“自定义采集”工作方式下,需要在软件里输入一个( )来作为采集的目标。
A 电话号码
B 关键词
C 网页地址
D 用户名
答案 网页地址
6、八爪鱼软件的采集规则可以通过文件的形式来导入或者导出,这种文件的后缀名是( )。
A otd
B jpg
C png
D gif
答案 otd
7、Excel可以通过“数据有效性”按钮操作来规范数据输入的范围。
A 对
B 错
答案 对
8、Excel不能导入txt或csv格式的文件。
A 对
B 错
答案 错
9、八爪鱼软件只能对软件内建了“简易采集”规则的网站采集数据。
A 对
B 错
答案 错
10、八爪鱼软件进行自定义采集时,需要了解对网页的页面结构。
A 对
B 错
答案 对
如需购买完整答案,请点击下方红字:
获取更多网课答案,请点击这里,进入www.mengmianren.com
付放笔僧姆绕褂涂济订蚂戌秋
趣囱板按纤水疚捌膝钎厩鸥匡