<ruby id="f53rv"></ruby>
<strike id="f53rv"></strike>
<span id="f53rv"></span>
<strike id="f53rv"></strike>
<strike id="f53rv"></strike>
<strike id="f53rv"></strike>
<span id="f53rv"></span>
<span id="f53rv"></span>
<strike id="f53rv"></strike>
<span id="f53rv"><video id="f53rv"></video></span><span id="f53rv"><dl id="f53rv"></dl></span>
<strike id="f53rv"><dl id="f53rv"></dl></strike>
<ruby id="f53rv"></ruby>
<strike id="f53rv"></strike><span id="f53rv"></span>
<strike id="f53rv"></strike>
<del id="f53rv"></del>
<span id="f53rv"><dl id="f53rv"><ruby id="f53rv"></ruby></dl></span>
<span id="f53rv"><dl id="f53rv"></dl></span><strike id="f53rv"></strike>
大數據平臺搭建與高性能計算實戰

大數據平臺搭建與高性能計算實戰

大數據平臺搭建與高性能計算實戰課程/講師盡在大數據平臺搭建與高性能計算實戰專題,大數據平臺搭建與高性能計算實戰公開課北上廣深等地每月開課!大數據平臺搭建與高性能計算實戰在線直播課程(免費試聽)。專家微信18749492090,講師手機13522550408,百度搜索“交廣國際管理咨詢”了解更多。

課程大綱
第一天
上午大數據技術基礎1.大數據的產生背景與發展歷程
2.大數據的4V特征,以及與云計算的關系
3.大數據應用需求以及潛在價值分析
4.業界*的大數據技術發展態勢與應用趨勢
5.大數據項目的系統與技術選型,及落地實施的挑戰
6.“互聯網+”時代下的電子商務、制造業、零售批發、電信運營商、互聯網金融業、電子政務、移動互聯網、教育信息化等行業應用實踐與應用案例介紹
業界主流的大數據技術方案
1.大數據軟硬件系統全棧與關鍵技術介紹
2.主流的大數據解決方案介紹
3.Apache大數據平臺方案剖析
4.CDH大數據平臺方案剖析
5.HDP大數據平臺方案剖析
6.大數據解決方案與傳統數據庫方案比較
大數據計算模型(一)——批處理MapReduce
1.MapReduce產生背景與適用場景
2.MapReduce計算模型的基本原理
3.MapReduce作業執行流程
4.MapReduce基本組件,JobTracker和TaskTracker
5.MapReduce高級編程應用,Combiner和Partitioner
6.MapReduce性能優化技巧
7.MapReduce案例分析與開發實踐操作

第一天
下午大數據存儲系統與應用實踐
1.分布式文件系統HDFS產生背景與適用場景
2.HDFS master-slave系統架構與工作原理
3.HDFS核心組件技術講解
4.HDFS高可用保證機制
5.HDFS集群的安裝、部署與配置,熟練HDFS shell命令操作
6.分布式小文件存儲系統的平臺架構、核心技術與應用場景
7.分布式對象存儲系統的平臺架構、核心技術與應用場景
Hadoop框架與生態發展,以及應用實踐操作
1.Hadoop的發展歷程
2.Hadoop大數據生態圈系統與工具全貌介紹
3.Hadoop 1.0的核心組件與適用范圍
4.Hadoop 2.0的核心組件YARN工作原理,以及與Hadoop 1.0的區別
5.Hadoop資源管理與作業調度機制
6.Hadoop 常用性能優化技術
7.Hadoop集群安裝與部署實踐,以及MapReduce程序在YARN上執行

第二天
上午大數據計算模型(二)——實時處理/內存計算 Spark
1.MapReduce計算模型的瓶頸
2.Spark產生動機、基本概念與適用場景
3.Spark編程模型與RDD彈性分布式數據集的工作原理與機制
4.Spark實時處理平臺運行架構與核心組件
5.Spark容錯機制
6.Spark作業調度機制
7.Scala開發介紹與實踐
8.Spark集群部署與配置實踐,Spark開發環境構建,Spark案例程序分析,Spark程序開發與運行,Spark與Hadoop集群集成實踐

第二天
下午大數據倉庫查詢技術Hive、SparkSQL、Impala,以及應用實踐
1.基于MapReduce的大型分布式數據倉庫Hive基礎知識與應用場景
2.Hive數據倉庫的平臺架構與核心技術剖析
3.Hive metastore的工作機制與應用
4.Hive數據倉庫實踐:Hive集群安裝部署,數據倉庫表導入導出與分區操作,Hive SQL操作,Hive客戶端操作
5.基于Spark的大型分布式數據倉庫SparkSQL基礎知識與應用場景
6.Spark SQL實時數據倉庫的實現原理與工作機制
7.SparkSQL應用分析與操作實踐
8.基于MPP的大型分布式數據倉庫Impala基礎知識與應用場景
9.Impala實時查詢系統平臺架構、關鍵技術剖析
Hadoop集群運維監控工具
1.Hadoop大數據運維監控管理系統HUE平臺介紹
2.Hadoop運維管理監控系統Ambari工具介紹
3. 第三方運維系統與工具Ganglia, Nagios

第三天
上午大數據計算模型(三)——流處理Storm, SparkStreaming
1.流數據處理應用場景與流數據處理的特點
2.流數據處理工具Storm的平臺架構與集群工作原理
3.Storm關鍵技術與并發機制
4.Storm編程模型與基本開發模式
5.Storm數據流分組
6.Storm可靠性保證與Acker機制
7.Storm應用案例分析與實踐:Storm集群安裝部署,Storm程序開發運行操作實踐,Storm與Hadoop集群的集成
8.流數據處理工具Spark Streaming基本概念與數據模型
9.Spark Streaming工作機制
大數據ETL操作工具,與大數據分布式采集系統
1.Hadoop與DBMS之間數據交互工具的應用
2.Sqoop導入導出數據的工作原理,以及Sqoop工具的安裝部署與實踐操作,利用Sqoop實現MySQL與Hadoop集群之間的數據導入導出交互
3.Flume-NG數據采集系統的數據流模型與系統架構
4.Kafka分布式消息訂閱系統的應用介紹與平臺架構,及其使用模式

第三天
下午面向OLTP型應用的NoSQL數據庫及應用實踐
1.關系型數據庫瓶頸,以及NoSQL數據庫的發展,概念,分類,及其在半結構化和非結構化數據場景下的適用范圍
2.列存儲NoSQL數據庫Hbase簡介與數據模型剖析
3.Hbase分布式集群系統架構與讀寫機制,ZooKeeper分布式協調服務系統的工作原理與應用
4.Hbase表設計模式與primary key設計規范
5.Hbase分布式集群安裝、部署與操作實踐
6.文檔NoSQL數據庫MongoDB簡介與數據模型剖析
7.MongoDB集群模式、讀寫機制與常用API操作
8.Cassandra分布式數據庫的平臺架構以及關鍵技術
9.Cassandra一致性哈希算法與數據分布策略,以及NWR策略
10.鍵值型NoSQL數據庫Redis簡介與數據模型剖析
11.Redis多實例集群架構與關鍵技術
12.NewSQL數據庫技術簡介及其適用場景
大數據項目選型、實施、優化等問題交流討論大數據項目的需求分析、應用實施、系統優化,以及解決方案等咨詢與交流討論
第四天學習考核與業內經驗交流

共有 0 條評論

? Top 永久黄网站色视频免费直播