阿里云大数据认证考试内容主要围绕大数据计算服务、大数据开发与治理平台、实时计算、实时数据仓库、检索分析服务、数据湖、大数据分析与可视化等多个方面展开。以下是对考试内容的详细归纳:
一、大数据基础与阿里云大数据平台
大数据基础:了解大数据基本概念及当前大数据的发展趋势;了解开源大数据平台经典架构、常用组件及其应用场景;了解阿里云大数据产品体系、常用产品及应用场景。
阿里云大数据平台:熟悉阿里云大数据相关产品的基本概念、特点、应用场景以及与其它产品的配合使用;掌握阿里云大数据相关产品的基本操作;了解各产品的最佳使用实践,能识别使用过程中常见的问题,并给出合适的解决方案。
二、大数据计算服务
MaxCompute:了解MaxCompute的产品价值及产品架构;熟悉MaxCompute的核心概念及常用开发工具;熟悉MaxCompute常用的数据迁移工具;掌握MaxCompute SQL的常用DDL、DML操作及内置函数的使用;掌握MaxCompute SQL自定义函数的分类、开发及使用;熟悉MaxCompute SQL性能调优的常用方法;熟悉MaxCompute的权限及安全管理。
三、大数据开发与治理平台
DataWorks:了解DataWorks的产品架构及应用场景;掌握基于数据集成进行数据离线与实时同步;熟悉大数据建模的方法论、数据仓库规划及维度建模的标准;掌握数据开发与运维的基本流程;了解大数据治理的概念及其需求层次,熟悉DataWorks大数据治理的体系及实施路径;了解数据地图及其操作、熟悉数据质量监控、了解数据保护伞;了解DataWorks中数据分析、数据服务、迁移助手等功能。
四、实时计算
实时计算框架:熟悉实时计算的概念及其应用场景;熟悉业界主流实时计算框架;熟悉Apache Flink架构及工作原理;了解阿里云实时计算Flink产品相关概念;掌握阿里云实时计算Flink SQL及其操作;熟悉阿里云实时计算Flink作业管理及调优。
五、实时数据仓库
Hologres:熟悉实时数据仓库架构的演进;了解实时数据仓库造型的主要依据;了解数据仓库的常用架构及云原生HSAP的理念;熟悉阿里云实时数据仓库Hologres的产品特性、技术架构及原理、应用场景;熟悉实时数据仓库面临的挑战以及Hologres的应用对策;掌握Hologres开发工具的使用;掌握Hologres的数据同步的主要方法;掌握Hologres数据开发过程中的数据类型、SQL及Binlog的操作;熟悉Hologres的性能调优的主要方法,包括内部表的优化及Key/Value的查询;掌握Hologres实时数据仓库建设的3种典型场景。
六、检索分析服务
Elasticsearch:了解检索分析技术发展过程的问题及解决方案;掌握Elasticsearch中的基本概念;熟悉阿里云Elasticsearch产品的主要功能特性,如冷热分离计算存储分离、Indexing service、Openstore等;掌握Elasticsearch DSL和SDK的应用开发;掌握Elasticsearch写入流程及写入性能优化的方法;掌握Elasticsearch查询流程及查询性能优化的方法。
七、数据湖
数据湖概念与架构:了解数据湖的相关概念、应具备的能力;了解数据湖架构的演进及发展趋势;了解常用的开源数据湖存储格式;了解数据湖的构建、管理与应用的过程;熟悉云原生数据湖方案及相关产品,如OSS、EMR、DLF;了解数据湖的应用场景;掌握基于阿里云产品构建云原生数据湖。
八、大数据分析与可视化
大数据分析:熟悉大数据分析的相关概念及分类方法;掌握大数据分析的流程及常见工具;熟悉机器学习以及机器学习的主要流程;掌握数据预处理的方法,如数据合并、清洗、规范化等;掌握机器学习算法建模、特征工程、模型评估的主要流程;了解机器学习常见算法的原理,如分类、回归、聚类等。
数据可视化:了解数据可视化的作用及设计原理;了解数据可视化的常用图表;熟悉阿里云数据可视化分析Quick BI产品的特点;熟悉阿里云数据可视化DataV产品的特点;掌握基于阿里云机器学习PAI-Designer进行可视化建模;熟悉基于阿里云机器学习PAI-DSW进行交互式建模。
热门:阿里云认证介绍 | 阿里云认证证书怎么考 | 阿里云认证类别
推荐:阿里云ACA认证视频课程 | 阿里云ACA认证网络课堂 | 阿里云认证考试科目