大数据价值挖掘是一个从数据到信息,再由信息到知识的凝练过程。相似度的度量方式随着数据对象的属性类型改变而改变。A:错 B:对 答案: 对A:错 B:对 答案: 对

订溶迁嘿幕暖咆低申呐搂小宠

十荆舌陵拨青翱排风谦保挫量

大数据价值挖掘是一个从数据到信息,再由信息到知识的凝练过程。相似度的度量方式随着数据对象的属性类型改变而改变。A:错 B:对 答案: 对A:错 B:对 答案: 对

答案:点击这里查看答案


点击这里,查看数据工程 2024智慧树答案完整版


点击这里,搜索更多网课答案


如需获取更多网课答案,可在浏览器访问我们的网站:http://www.mengmianren.com/

大数据价值挖掘是一个从数据到信息,再由信息到知识的凝练过程。相似度的度量方式随着数据对象的属性类型改变而改变。A:错 B:对 答案: 对A:错 B:对 答案: 对第1张

大数据价值挖掘是一个从数据到信息,再由信息到知识的凝练过程。相似度的度量方式随着数据对象的属性类型改变而改变。A:错 B:对 答案: 对A:错 B:对 答案: 对第2张

注:请切换至英文输入法输入域名,如果没有成功进入网站,请输入完整域名:http://www.mengmianren.com/


下列哪个数据库不属于NoSQL数据库?

A:Neo4J
B:Bigtable    
C:Redis
D:Oracle
答案: Oracle

 MongoDB属于哪类NoSQL数据库?

A:键值数据库
B:文档数据库
C:列数据库
D:图数据库
答案: 文档数据库

关系数据库中的参照完整性主要通过()实现。

A:审计
B:外键
C:主键
D:关键字
答案: 外键,主键

在关系数据库中,为了保证数据的一致性,事务处理必须保证具有哪些特性?()

A:持久性
B:一致性
C:隔离性
D:原子性
答案: 持久性,一致性,隔离性,原子性

下面哪些是NoSQL数据库的特点?

A:高可扩展
B:可用性强
C:模式灵活
D:严格的模式定义
答案: 高可扩展,可用性强,模式灵活

大数据价值挖掘是一个从数据到信息,再由信息到知识的凝练过程。

A:错
B:对
答案: 对

NoSQL数据库是对SQL数据库的否定,可以完全代替SQL数据库。

A:错
B:对
答案: 错

在并行和分布式数据库中,共享内存架构的每个处理器都有自己的磁盘,所有处理器共享一个内存空间。

A:对
B:错
答案: 对

关系数据库采取了强一致性约束,符合CAP理论中的C和P。

A:错
B:对
答案: 错

关系数据库的实体完整性主要通过()实现。

A:主键
B:访问控制
C:审计
D:关系表
答案: 主键

 OLAP一般运行于业务数据库上,OLTP则一般运行于数据仓库上。

A:错
B:对
答案: 错

数据清洗是剔除数据里的异常,使数据集成为现实世界的准确没有重复表示的过程。

A:对
B:错
答案: 对

联邦数据库模式不适宜进行需要在很多的数据源之间进行通讯和数据交换的数据集成。

A:错
B:对
答案: 对

列存储数据对排序操作和数据压缩有较好的支持。

A:错
B:对
答案: 对

在数据仓库中,ETL操作包括()。

A:抽取
B:转换
C:加载
D:传输
答案: 抽取,转换,加载

数据源之间的异构性主要包括()。

A:数据模式的异构性
B:通讯协议异构性
C:数据管理系统的异构性
D:数据类型的异构性
答案: 数据模式的异构性,通讯协议异构性,数据管理系统的异构性,数据类型的异构性

下列哪些技术可以用于在大数据使用过程中保护用户隐私?

A:差分隐私
B:联邦数据库
C:同态加密
D:内存数据库
答案: 差分隐私,联邦数据库,同态加密

下列那一项不属于数据清理中的数据异常?

A:覆盖类异常
B:插入类异常
C:语义类异常
D:语法类异常
答案: 插入类异常

在数据库中,规定了员工表的工资字段必须大于0。如果某个员工的工资

A:语法类异常
B:语义类异常
C:不规则取值
D:词法错误
答案: 语义类异常

下列哪一项不是大数据管理的新挑战()。

A:多源异构跨领域
B:私保护
C:数据规模大
D:高性能数据服务要求
答案: 数据规模大

下列关于不同的簇类型的说法中,不正确的是( )。

A:在明显分离的簇中,同簇中的对象之间的距离要大于异簇的对象
B:在基于密度的簇中,簇通常是高密度的区域
C:在基于邻近度的簇中,度量方式通常是最近邻或连通度
D:在基于中心的簇中,簇的中心通常叫质心,即簇中所有点的平均值
答案: 在明显分离的簇中,同簇中的对象之间的距离要大于异簇的对象

以下哪些选项是K-均值聚类面临的问题?

A:K的选择具有挑战性
B:关于数据的球形假设(到聚类中心的距离)
C:贪心算法存在的问题
D:难以处理噪声异常值
答案: K的选择具有挑战性,关于数据的球形假设(到聚类中心的距离),贪心算法存在的问题,难以处理噪声异常值

凝聚层次聚类中,定义簇间的相似度的方法有( )。    

A:组平均
B:MIN(单链)
C:Ward方法
D:MAX(全链)
答案: 组平均,MIN(单链),Ward方法,MAX(全链)

DBSCAN算法的缺点包括?

A:对于高维问题,密度定义是个比较麻烦的问题
B:对输入参数敏感
C:易受到噪声和异常值的影响
D:当簇的密度变化太大时,不能很好的处理
答案: 对于高维问题,密度定义是个比较麻烦的问题,对输入参数敏感,当簇的密度变化太大时,不能很好的处理

CHAMELEON算法的优点包括:()。

A:复杂度低,适合在大规模数据集应用
B:能识别具有不同形状大小和密度的簇
C:对噪声和异常数据不敏感    
D:能够有效地聚类空间数据
答案: 能识别具有不同形状大小和密度的簇,对噪声和异常数据不敏感    ,能够有效地聚类空间数据

同一组数据通过不同聚类算法得到的簇的个数是相同的。

A:对
B:错
答案: 错

相似度的度量方式随着数据对象的属性类型改变而改变。

A:错
B:对
答案: 对

全链在处理大小不同的簇时,可能使大的簇破裂。

A:对
B:错
答案: 对

DBSCAN聚类结果受参数影响较小。

A:对
B:错
答案: 错

使用KMEANSDBSCAN等多种聚类算法对同一数据集进行聚类时,可能会得到不同的分组数(类数),分组数较多的聚类算法一般是比较好的。

A:对
B:错
答案: 错



排妇酱纠赏捻铺辈你晌瑰闺曝

蕾踞井愧绒瓮煽讹秘哺猎电犯