很多考生在备考2022年系统集成项目管理工程师考试,希赛小编为大家整理了2022年系统集成项目管理工程师考试知识点:大数据,供大家备考复习。
大数据
大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。大数据技术,是指从各种各样类型的数据中,快速获得有价值信息的能力。适用于大数据的技术,包括大规模并行处理(MPP)数据库,数据挖掘电网,分布式文件系统,分布式数据库,云计算平台,互联网,和可扩展的存储系统。大数据的特点5V:Volume大量、Variety多样、Value有价值、Velocity高速和Veracity真实性。
大数据关键技术:
①HDFS:能提供高吞吐量的数据访问,非常适合于大规模数据集上的应用。
②HBase:不同于一般的关系数据库,是非结构化数据存储的数据库。
③MapReduce:一种编程模型,主要思想:概念“Map(映射)”和“Reduce(归约)”。
④Chukwa:用于监控大型分布式系统的数据收集系统。
数据仓库:数据仓库是一个面向主题的、集成的、非易失的、且随时间变化的数据集合,用于支持管理决策;
数据挖掘:数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。