大数据算法超星尔雅期末考试答案2024版100分完整版

你惶寿缔查揩虹咕揩爱栋叼愁

完架翠刻握惩鸥废任碱蔷男廉

一、单选题（题数：40，共 40.0 分）

在内存中的二分搜索树中,通常使用()来维护树的平衡。()

（1.0分）

A、

置换

B、

分裂

C、

旋转

D、

合并

我的答案：C

下列选项中叙述正确的是()。

（1.0分）

A、

磁盘的访问可以随机读、随机取

B、

磁盘系统传输大规模连续的数据块的范围是18-32k

C、

磁盘访问比主存访问的速度快

D、

大多数程序在RAM模型上运行

我的答案：D

3频繁元素计算算法有效的原因是源于()。（1.0分）

A、

取近似解

B、

证据引理

C、

错误界限和k成反比

D、

Zipf原则

我的答案：D

4大数据算法存在很多难题,对于访问全部数据时间过长的问题,采用的解决方案是()。（1.0分）

A、

将数据存储到磁盘上

B、

仅基于少量数据进行计算

C、

读取部分数据

D、

并行处理

我的答案：C

为数T的每个结点标上子树大小的I/O复杂度为()。

（1.0分）

A、

IO (sort(N))

B、

O (sort(N))

C、

IO(scan(N))

D、

O(scan(N))

我的答案：B

6MapReduce是由()开发的分布式编程模型。（1.0分）

A、

Microsoft

B、

Google

C、

Tencent

D、

Alibaba Group

我的答案：B

在repartition join的改进中,说法错误的是()。

（1.0分）

A、

Map函数的输出键作为连接键

B、

Map函数的输出键变化为连接键和表名的组合。

C、

Partition函数中Hashcode仅从组合键的连接键计算

D、

Grouping函数仅根据连接键分组纪录

我的答案：A

人脸识别是利用众包改进图像()的例子。

（1.0分）

A、

分类

B、

区分

C、

确认

D、

搜索

我的答案：D

9半外存算法是假设()。（1.0分）

A、

边放在内存中,顶点在外面

B、

顶点放在内存中,边在外面

C、

顶点和边都放在内存当中

D、

顶点和边都不在内存当中

我的答案：B

10在《法华经》中,“那由他”描写的“大”的数量级是()。（1.0分）

A、

10^7

B、

10^14

C、

10^28

D、

10^56

我的答案：C

采用把大连通分量划分成高度连接的小连通分量基本思路的方法是()

（1.0分）

A、

CrowdDB

B、

混合人机工作流程

C、

双层法

D、

分批策略

我的答案：C

找到一个稠密图的最小生成树的算法易于并行化的原因是每个子图的()可以被并行计算。

（1.0分）

A、

边

B、

顶点

C、

结点

D、

最小生成树

我的答案：D

频繁元素计算算法又称为()算法。

（1.0分）

A、

B、

C、

D、

我的答案：B

14大数据算法涉及到外存的时候,通常要分析()。（1.0分）

A、

时间空间复杂性

B、

IO复杂性

C、

结果质量

D、

通讯复杂性

我的答案：B

关于并行节点计算,下列选项中关于节点叙述不准确的是()。

（1.0分）

A、

每一个节点接受上一个superstep发出的消息

B、

执行相同的用户定义函数

C、

所有节点根据用户定义函数修改它的值

D、

没有额外工作要做时继续迭代

我的答案：D

时间亚线性算法的思想是:利用特定子图联通分量的数量估计最小生成树的()。

（1.0分）

A、

近似值

B、

精确值

C、

权重

D、

界限

我的答案：C

外存归并排序,以()为单位进行调度。

（1.0分）

A、

比特

B、

兆

C、

块

D、

层

我的答案：C

众包中质量控制/数据质量要考虑的问题不包括()。

（1.0分）

A、

可靠性

B、

垃圾结果检测

C、

标签共识

D、

界面和交互设计

我的答案：D

19基于路径的算法的例子不包括()。（1.0分）

A、

单源最短路径

B、

最小生成树

C、

分布式不动点运算

D、

拓扑排序

我的答案：C

20采用平面图的直径近似算法的动机是无法在要求的时间内得到()。（1.0分）

A、

相似解

B、

完整解

C、

精确解

D、

近似解

我的答案：C

21前序计数的I/O复杂度为()。（1.0分）

A、

IO (sort(N))

B、

O (sort(N))

C、

IO(scan(N))

D、

O(scan(N))

我的答案：B

22对给定顶点邻接链表T,其一个欧拉回路可以以()IO复杂性求得。（1.0分）

A、

O (sort(N))

B、

O(scan(N))

C、

O(scan(N))IO

D、

IO(scan(N))

我的答案：C

23计算在一个给定社交网络中平均每人的朋友个数,在不访问所有顶点的情况下,进行精确计算最少需要访问()个顶点。（1.0分）

A、

n²

B、

n+1

C、

D、

n-1

我的答案：D

24时间前向的处理方法是按照()来访问边。（1.0分）

A、

欧拉回路

B、

表排序

C、

拓扑序

D、

结点序

我的答案：C

众包通过一系列的机制和方法来指导和协调()的行为,从而达到目的。

（1.0分）

A、

个人

B、

计算机

C、

群体

D、

软件

我的答案：C

众包算法是用来解决()。

（1.0分）

A、

访问全部数据时间过长

B、

数据难于放入内存计算

C、

单个计算机难以保存全部数据,计算需要整体数据

D、

计算机计算能力不足或知识不足,需要人来帮忙

我的答案：D

27利用平面图的直径近似算法得到的解,在最坏情况下,也不会小于最优解的()。（1.0分）

A、

二分之一

B、

三分之一

C、

四分之一

D、

十分之一

我的答案：A

28求最小生成树是一个贪心法,可以用()算法来解决。（1.0分）

A、

Prime

B、

并行

C、

D、

内存

我的答案：A

KD树在()层使用水平线。

（1.0分）

A、

偶数层

B、

奇数层

C、

最底层

D、

最高层

我的答案：A

在版本1的字数统计中，在Map里使用了一个数组H，其作用是为每一个出现的单词作（）。

（1.0分）

A、

序列

B、

基数

C、

集合

我的答案：B

查找规模为N的表L中,每个独立集(MIS)的大小至少为()。

（1.0分）

A、

n+1

B、

C、

n/2

D、

n/3

我的答案：D

32图算法包含三种计数,其中将图问题表示为有向无环图的估值问题的是()。（1.0分）

A、

自举

B、

缩图法

C、

时间前向处理

D、

连通分量

我的答案：C

元素都在叶子中的B-树有时被称为()。

（1.0分）

A、

B+树

B、

B-+树

C、

B+-树

D、

B+-数

我的答案：C

大数据求解计算问题过程的第三步一般是()。

（1.0分）

A、

判断可计算否

B、

判断能行可计算否

C、

算法设计与分析

D、

用计算机语言实现算法

我的答案：C

35在外排序的快速排序中,分割元素的选择非常重要。（1.0分）

A、

正确

B、

错误

我的答案：A

对于输入n个数的数组(x1,x2,x3,……,xn),输出:这个数组是否有序。ℇ远离意味着必须删除大于()个元素才能保证剩下的元素有序。

（1.0分）

A、

ℇ-n

B、

ℇn

C、

ℇ/n

D、

n/ℇ

我的答案：B

以下()不是衡量分析近似解代价与优化解代价差距的方法。

（1.0分）

A、

Ratio Bound

B、

相对误差

C、

绝对误差

D、

(1-ℇ)-近似

我的答案：C

38如果T是一个(a,b)-树(a≧2且b≧2a-1),其根结点的度在()之间。（1.0分）

A、

2到a

B、

2到b

C、

a到b

D、

2到4

我的答案：B

39KdB-树的插入可以使用()的方法。（1.0分）

A、

近似

B、

置换

C、

对数

D、

重构

我的答案：C

40在实现MapReduce程序时,需要注意的事项不包括()。（1.0分）

A、

避免创建对象

B、

避免缓冲

C、

避免通信

D、

避免Mapper和Reducer间的全局变量传递

我的答案：C

如需购买完整答案，请点击下方红字：

点击这里，购买完整答案

获取更多网课答案，请点击这里，进入www.mengmianren.com

庇疤庇纤毁缅面硼复龚脾谭玻

滴捍夹掀饲遍泛教疽蛾署窝狡