- 资源介绍
- 更新记录




Spark+ClickHouse实战企业级数据仓库,进军大厂必备掌握数仓构建,完善技术体系,轻松掌握高薪技能现阶段的数据开发领域,数据仓库作为企业战略决策的“大脑”,地位日益凸显,对数仓技术的掌握程度也成了大厂面试必考的一环。本课程结合ClickHouse+Spark 这一对数据处理的“黄金搭档”,选取“大数据量企业数据仓库“这一典型场景,实战大数据量下数仓的建模、设计与调优等实用技巧,快速掌握ClickHouse+Spark核心技能,为晋级大数据架构师铺路!适合人群希望掌握实用的数据仓库建模、设计和调优能力希望快速提升的ClickHouse技术能力希望通过贴近生产实践的案例,提升大数据项目能力的同学技术储备熟悉Java/Scala基础的语法 了解SQL的基本使用 了解Spark基础 环境参数Spark 3.2ClickHouse 22.*Hadoop 3.3Scala 2.12Java 1.8 章节目录:第1章 从0到1搭建项目开发环境,快速上手大数据开发 试看7 节 | 55分钟 本章将从0到1搭建大数据开发环境,通过IDEA+Maven构建多module项目,实现源码、启动脚本、配置等自动构建打包。收起列表 视频: 1-1 大数据时代,你还不知道数据仓库么? (10:28) 试看 视频: 1-2 本章概览 (02:05) 视频: 1-3 基于IDEA + Maven构建Spark工程 (12:18) 图文: 1-4 数据开发环境(Spark/Hive/Hadoop/MySQL/IDEA)搭建 图文: 1-5 Maven安装配置 视频: 1-6 源码、启动脚本、配置等自动构建打包 (13:07) 视频: 1-7 项目多模块规划与自动构建打包 (16:11) 第2章 项目关键技术准备,学习通用的数据处理技术13 节 | 88分钟 本章对项目所用到关键技术进行封装,通过Spark UDF整合IP地址相关的转换功能、二分查找算法、通用Grok数据解析器等,并通过rewrite方式修改Grok组件源码,学习源码整合的思路。收起列表 视频: 2-1 本章概览 (04:00) 视频: 2-2 IPv4和数值转换 (10:51) 视频: 2-3 IP地址简写和全写的格式转换 (04:23) 视频: 2-4 IP地址二分查找 (12:24) 视频: 2-5 Spark自定义IP函数 (04:26) 视频: 2-6 初识Grok通用数据解析器 (15:57) 视频: 2-7 在程序中解析Grok (07:23) 视频: 2-8 自定义Grok表达式 (06:37) 视频: 2-9 Grok工具类封装 (05:57) 视频: 2-10 在Spark中集成Grok (09:43) 视频: 2-11 Grok的序列化问题与源码修改 (05:48) 图文: 2-12 Spark源码优化,支持对MySQL的数据进行更新 作业: 2-13 【阶段作业】如何读取Grok的资源文件 第3章 项目数据准备,操练基于Spark的数据开发与优化8 节 | 61分钟 本章主要是基于Spark,模拟生成项目所需要的基础数据和安全访问日志数据,操练基于Spark对数据进行处理与优化技术。收起列表 视频: 3-1 本章概览 (01:31) 视频: 3-2 项目业务数据 (06:29) 视频: 3-3 生成IP、域名、IP位置的中间数据(上) (09:05) 视频: 3-4 生成IP、域名、IP位置的中间数据(下) (13:56) 视频: 3-5 生成域名备案、IP位置、违规实体数据 (09:43) 视频: 3-6 基于Grok模拟安全访问日志 (16:55) 视频: 3-7 安全访问日志生成之广播变量优化 (02:49) 作业: 3-8 【阶段作业】超大广播变量如何优化? 第4章 初识OLAP数仓架构5 节 | 17分钟 本章主要介绍构建数仓的主流数据技术架构,以及基于ClickHouse的OLAP架构相比典型大数据架构的优势。 收起列表 收起列表 收起列表 收起列表 收起列表 收起列表 第11章 ClickHouse的MergeTree系列引擎原理、实践与优化 第12章 数仓高级之事实表模型设计 第13章 【项目实战第三篇】数据清洗加工,构建项目数据明细层 第14章 构建ClickHouse分布式集群,掌握分布式环境的数据查询、写入优化方案 第15章 【项目实战第四篇】负载均衡与高可用方案实践,自定义Spark写本地分片表策略 第16章 【项目实战第五篇】如何选择合适的维度表存储方案 第17章 【项目实战第六篇】数据汇总层与应用查询优化 第18章 【项目实战第七篇】基于轻量级BI工具的数据展示与可视化监控 本课程持续更新中 |
常见问题FAQ
- 视频课程的格式是什么?
- 视频不加密,网盘在线学习,课程免费更新,持续更新
- 购买后怎么如何下载资源?
- 有些资源没更新完结怎么办?
- 有问题不懂想咨询怎么办?