課程一:據科學 數據科學概覽 信息文明 數據科學 分析思維 比特與數據 數據處理與數據 管理 數據處理的基礎設施 數據管理的技術架構 大數據系統與數 據工程 大數據系統 統計基礎與數學建模 數據挖掘與機器學習 算法 編程語言 數據工程 數據科學應用 智慧城市 人工智能
課程二:HDFS HDFS 簡介、架構設計、工作機制、高可用性、Shell 命令/Java API Mapreduce Mapreduce 簡介、開發入門、工作機制、高級特 性 3 Hive Hive 簡介、架構設計、HiveQL 的使用 Zookeeper 分布式系統理論、Zookeeper 簡介、原理與架構、 API Hbase Hbase 數據庫簡介與安裝、Hbase 架構與功能、 Hbase 常用命令和參數、關鍵流程、Phoenix 介 紹 Sqoop Sqoop 簡介與安裝、數據導入與導出功能 Spark Spark 介紹、基礎概念、Spark 原理與架構、Spark 運行模式 Nifi Nifi 介紹、原理與架構、Nifi 組建詳解、DataFlow 的控制與監控 Oozie Oozie 介紹、原理與架構、實現過程 Hue Hue 介紹、原理與架構 大數據運維與調 優 集群操作系統管理、服務組件管理、組件運維操 作、運維管理平臺
課程三:數據倉庫概述 數據倉庫簡介、數據倉庫設計方法論、數據倉庫 應用 數據倉庫一般架構 架構價值、數據倉庫架構介紹、數據管理(元數 據、數據質量、任務調度、數據安全、服務監控) 數據倉庫結構 與模型構建 主題與主題域、數倉建模流程與方法、數倉表分 類、數倉分層與數據分層 4 數據倉庫建設規范 分層規范、表命名規范、字段命名規范、代碼規 范 數據倉庫建設過程 確定主題、選擇軟件平臺、構建邏輯模型、轉換 物理模型、數據模型轉化步驟、數據模型優化、 數據源接入與數據清洗傳輸、數倉管理 數據應用范圍 數據倉庫優點、應用場景、行業應用舉例(證券、 銀行、醫院) 數據倉庫實際案例 ECS 電商數據倉庫、BIS 實時數據倉庫
課程四:BI 基礎概念 商務 BI 流程、基礎架構、熱點應用、術語介紹、 OLAP BI 的一般框架 總體框架、技術框架、架構解釋、BI/DW 方法論、 框架示例(阿里、騰訊、移動公司、微軟、SAP、 IBM) BI 工具介紹 Tableau、Superset、Redash、QlikView、DataV、 DataFocus、IBM cognos、Polymaps BI 應用場景 與案例分析 制造業、零售業、電商行業、金融業、零售業、 醫療領域、地產案例分析 數據倉庫方法論 數據倉庫與 BI 數據體系框架 現代數據體系、OneData、OneModel、OneID、 OneService 機器學習算法入門 機器學習介紹、機器學習應用