大数据管理技术(大数据技术原理与应用)中国大学mooc完整答案-买球的app软件下载

3272 人参与  2023-01-04 06:14:50    点这评论
第1章 大数据概述

第1章 大数据概述 单元测验

1、第三次信息化浪潮的标志是:
    a、个人电脑的普及
    b、互联网的普及
    c、云计算、大数据、物联网技术的普及
    d、虚拟现实技术的普及

2、就数据的量级而言,1pb数据是多少tb?
    a、512
    b、1024
    c、1000
    d、2048

3、以下关于云计算、大数据和物联网之间的关系,论述错误的是:
    a、云计算侧重于数据分析
    b、云计算、大数据和物联网三者紧密相关,相辅相成
    c、物联网可以借助于云计算实现海量数据的存储
    d、物联网可以借助于大数据实现海量数据的分析

4、以下哪个不是大数据时代新兴的技术:
    a、hadoop
    b、spark
    c、hbase
    d、mysql

5、每种大数据产品都有特定的应用场景,以下哪个产品是用于批处理的:
    a、mapreduce
    b、pregel
    c、dremel
    d、storm

6、每种大数据产品都有特定的应用场景,以下哪个产品是用于流计算的:
    a、graphx
    b、s4
    c、hive
    d、impala

7、每种大数据产品都有特定的应用场景,以下哪个产品是用于图计算的:
    a、cassandra
    b、flume
    c、storm
    d、pregel

8、每种大数据产品都有特定的应用场景,以下哪个产品是用于查询分析计算的:
    a、mapreduce
    b、hdfs
    c、dremel
    d、s4

9、数据产生方式大致经历了三个阶段,包括:
    a、运营式系统阶段
    b、用户原创内容阶段
    c、感知式系统阶段
    d、移动互联网数据阶段

10、大数据发展的三个阶段是:
    a、萌芽期
    b、低谷期
    c、成熟期
    d、大规模应用期

11、大数据的特性包括:
    a、数据量大
    b、数据类型繁多
    c、处理速度快
    d、价值密度低

12、图领奖获得者、著名数据库专家jim gray博士认为,人类自古以来在科学研究上先后经历了哪几种范式:
    a、实验科学
    b、理论科学
    c、计算科学
    d、数据密集型科学

13、大数据带来思维方式的三个转变是:
    a、精确而非全面
    b、全样而非抽样
    c、效率而非精确
    d、相关而非因果

14、大数据主要有哪几种计算模式:
    a、批处理计算
    b、流计算
    c、图计算
    d、查询分析计算

15、云计算的典型服务模式包括三种:
    a、paas
    b、iaas
    c、saas
    d、maas

第2章 大数据处理架构hadoop

第2章 大数据处理架构hadoop 单元测验

1、启动hadoop所有进程的命令是:
    a、start-dfs.sh
    b、start-hadoop.sh
    c、start-all.sh
    d、start-hdfs.sh

2、以下对hadoop的说法错误的是:
    a、hadoop的核心是hdfs和mapreduce
    b、hadoop是基于java语言开发的,只支持java语言编程
    c、hadoop2.0增加了namenode ha和wire-compatibility两个重大特性
    d、hadoop mapreduce是针对谷歌mapreduce的开源实现,通常用于大规模数据集的并行计算

3、以下哪个不是hadoop的特性:
    a、高容错性
    b、高可靠性
    c、成本高
    d、支持多种编程语言

4、以下名词解释不正确的是:
    a、hdfs:分布式文件系统,是hadoop项目的两大核心之一,是谷歌gfs的开源实现
    b、hbase:提供高可靠性、高性能、分布式的行式数据库,是谷歌bigtable的开源实现
    c、hive:一个基于hadoop的数据仓库工具,用于对hadoop文件中的数据集进行数据整理、特殊查询和分析存储
    d、zookeeper:针对谷歌chubby的一个开源实现,是高效可靠的协同工作系统

5、以下哪些组件是hadoop的生态系统的组件:
    a、mapreduce
    b、hdfs
    c、oracle
    d、hbase

6、以下哪个命令可以用来操作hdfs文件:
    a、hadoop fs
    b、hdfs dfs
    c、hadoop dfs
    d、hdfs fs

第3章 分布式文件系统hdfs

第3章 分布式文件系统hdfs 单元测验

1、hdfs的命名空间不包含:
    a、目录
    b、文件
    c、块
    d、字节

2、对hdfs通信协议的理解错误的是:
    a、hdfs通信协议都是构建在iot协议基础之上的
    b、名称节点和数据节点之间则使用数据节点协议进行交互
    c、客户端与数据节点的交互是通过rpc(remote procedure call)来实现的
    d、客户端通过一个可配置的端口向名称节点主动发起tcp连接,并使用客户端协议与名称节点进行交互

3、采用多副本冗余存储的优势不包含:
    a、加快数据传输速度
    b、节约存储空间
    c、容易检查数据错误
    d、保证数据可靠性

4、假设已经配置好环境变量,启动hadoop和关闭hadoop的命令分别是:
    a、start-hdfs.sh,stop-hdfs.sh
    b、start-dfs.sh,stop-dfs.sh
    c、start-dfs.sh,stop-hdfs.sh
    d、start-hdfs.sh,stop-dfs.sh

5、分布式文件系统hdfs采用了主从结构模型,由计算机集群中的多个节点构成的,这些节点分为两类,一类存储元数据叫 ,另一类存储具体数据叫 :
    a、名称节点,数据节点
    b、数据节点,名称节点
    c、名称节点,主节点
    d、从节点,主节点

6、下面关于分布式文件系统hdfs的描述正确的是:
    a、分布式文件系统hdfs是一种关系型数据库
    b、分布式文件系统hdfs是google bigtable的一种开源实现
    c、分布式文件系统hdfs是谷歌分布式文件系统gfs(google file system)的一种开源实现
    d、分布式文件系统hdfs比较适合存储大量零碎的小文件

7、以下对名称节点理解正确的是:
    a、名称节点通常用来保存元数据
    b、名称节点的数据保存在内存中
    c、名称节点作为中心服务器,负责管理文件系统的命名空间及客户端对文件的访问
    d、名称节点用来负责具体用户数据的存储

8、以下对数据节点理解正确的是:
    a、数据节点用来存储具体的文件内容
    b、数据节点的数据保存在磁盘中
    c、数据节点在名称节点的统一调度下进行数据块的创建、删除和复制等操作
    d、数据节点通常只有一个

9、hdfs只设置唯一一个名称节点带来的局限性包括:
    a、性能的瓶颈
    b、命名空间的限制
    c、隔离问题
    d、集群的可用性

10、以下hdfs相关的shell命令不正确的是:
    a、hadoop fs -ls :显示指定的文件的详细信息
    b、hadoop dfs mkdir :创建指定的文件夹
    c、hadoop fs -copyfromlocal :将路径指定的文件或文件夹复制到路径指定的文件夹中
    d、hdfs dfs -rm :删除路径指定的文件

第7章 mapreduce

第7章 mapreduce 单元测验

1、下列说法错误的是:
    a、hadoop框架是用java实现的,mapreduce应用程序则一定要用java来写
    b、mapreduce框架采用了master/slave架构,包括一个master和若干个slave
    c、map函数将输入的元素转换成形式的键值对
    d、不同的map任务之间不能互相通信

2、在使用mapreduce程序wordcount进行词频统计时,对于文本行“hello hadoop hello world”,经过wordcount程序的map函数处理后直接输出的中间结果,应该是下面哪种形式:
    a、<"hello",1,1>、<"hadoop",1>和<"world",1>
    b、<"hello",2>、<"hadoop",1>和<"world",1>
    c、<"hello",<1,1>>、<"hadoop",1>和<"world",1>
    d、<"hello",1>、<"hello",1>、<"hadoop",1>和<"world",1>

3、对于文本行“hello hadoop hello world”,经过wordcount的reduce函数处理后的结果是:
    a、<"hello",1,1><"hadoop",1><"world",1>
    b、<"hello",2><"hadoop",1><"world",1>
    c、<"hello",<1,1>><"hadoop",1><"world",1>
    d、<"hello",1><"hello",1><"hadoop",1><"world",1>

4、下列关于传统并行计算框架(比如mpi)和mapreduce并行计算框架比较正确的是:
    a、前者是共享式(共享内存/共享存储),容错性差,后者是非共享式的,容错性好
    b、前者所需硬件价格贵,可扩展性差,后者硬件便宜,扩展性好
    c、前者相比后者学习起来更难
    d、前者适用于实时、细粒度计算、计算密集型,后者适用于批处理、非实时、数据密集型

5、mapreduce1.0的体系结构主要由哪几个部分组成:
    a、client
    b、jobtracker
    c、tasktracker
    d、task

第4章 分布式数据库hbase

第4章 分布式数据库hbase单元测验

1、hbase是一种 数据库
    a、行式数据库
    b、列式数据库
    c、文档数据库
    d、关系数据库

2、下列对hbase数据模型的描述错误的是:
    a、hbase是一个稀疏、多维度、排序的映射表,这张表的索引是行键、列族、列限定符和时间戳
    b、hbase列族支持动态扩展,可以很轻松地添加一个列族或列
    c、hbase中执行更新操作时,会删除数据旧的版本,并生成一个新的版本
    d、每个hbase表都由若干行组成,每个行由行键(row key)来标识

3、下列说法正确的是:
    a、hbase的实现包括的主要功能组件是库函数,一个master主服务器和一个region服务器
    b、zookeeper是一个集群管理工具,常用于分布式计算,提供配置维护、域名服务、分布式同步等
    c、如果不启动hadoop,则hbase完全无法使用
    d、如果通过hbase shell插入表数据,可以插入一行数据或一个单元格数据

4、在hbase数据库中,每个region的建议最佳大小是:
    a、100mb-200mb
    b、500mb-1000mb
    c、1gb-2gb
    d、2gb-4gb

5、hbase三层结构的顺序是:
    a、zookeeper文件,.meata.表,-root-表
    b、zookeeper文件,-root-表,.meata.表
    c、-root-表,zookeeper文件,.meata.表
    d、.meata.表,zookeeper文件,-root-表

6、客户端是通过 级寻址来定位region:
    a、一
    b、二
    c、三
    d、四

7、关于hbase shell命令解释错误的是:
    a、create:创建表
    b、list:显示表的所有数据
    c、put:向表、行、列指定的单元格添加数据
    d、get:通过表名、行、列、时间戳、时间范围和版本号来获得相应单元格的值

8、下列对hbase的理解正确的是:
    a、hbase是一个行式分布式数据库,是hadoop生态系统中的一个组件
    b、hbase是针对谷歌bigtable的开源实现
    c、hbase多用于存储非结构化和半结构化的松散数据
    d、hbase是一种关系型数据库,现成功应用于互联网服务领域

9、hbase和传统关系型数据库的区别在于哪些方面:
    a、数据模型
    b、数据操作
    c、存储模式
    d、数据索引

10、访问hbase表中的行,有哪些方式:
    a、通过单个行健访问
    b、通过一个行健的区间来访问
    c、全表扫描
    d、通过某列的值区间

第9章 数据仓库hive

第9章 数据仓库hive 单元测验

1、下列有关hive和impala的对比错误的是:
    a、hive与impala使用相同的元数据
    b、hive与impala中对sql的解释处理比较相似,都是通过词法分析生成执行计划
    c、hive适合于长时间的批处理查询分析,而impala适合于实时交互式sql查询
    d、hive在内存不足以存储所有数据时,会使用外存,而impala也是如此

2、下列关于hive基本操作命令的解释错误的是:
    a、create database userdb;//创建数据库userdb
    b、create table if not exists usr(id bigint,name string,age int);//如果usr表不存在,创建表usr,含三个属性id,name,age
    c、load data local inpath ‘/usr/local/data’ overwrite into table usr; //把目录’/usr/local/data’下的数据文件中的数据以追加的方式装载进usr表
    d、insert overwrite table student select * from user where age>10; //向表usr1中插入来自usr表的age大于10的数据并覆盖student表中原有数据

3、下列说法正确的是:
    a、数据仓库hive不需要借助于hdfs就可以完成数据的存储
    b、impala和hive、hdfs、hbase等工具可以统一部署在一个hadoop平台上
    c、hive本身不存储和处理数据,依赖hdfs存储数据,依赖mapreduce处理数据
    d、hiveql语法与传统的sql语法很相似

4、impala主要由哪几个部分组成:
    a、impalad
    b、state store
    c、cli
    d、hive

5、以下属于hive的基本数据类型是:
    a、tinyint
    b、float
    c、string
    d、binary

下一篇 >>

相关文章

  • 2023-01-04 05:54
  • 2023-01-04 05:45
  • 2023-01-04 05:38
  • 2023-01-04 05:14
  • 2023-01-04 04:07

备案号: 买球平台网址的版权所有 买球平台网址 copyright © 2012-2023 青果答案 all rights reserved. sitemap