2019年大數(shù)據(jù)初級課程培訓通知
各有關單位: 當前,信息革命已經(jīng)從數(shù)字化、網(wǎng)絡化進入到以數(shù)據(jù)深度挖掘與融合應用為特征的智慧化階段。大數(shù)據(jù)發(fā)展日新月異,引領了社會生產(chǎn)新變革,創(chuàng)造了人類生活新空間,拓展了國家治理新領域,也成為了國家戰(zhàn)略重點和優(yōu)先發(fā)展方向。數(shù)據(jù)科學與大數(shù)據(jù)分析作為當前產(chǎn)業(yè)發(fā)展熱點及高校專業(yè)建設新方向已得到了廣泛重視。大數(shù)據(jù)專業(yè)作為交又型學科,課程涉及數(shù)學、統(tǒng)計和計算機等學科知識,給教學帶來一定的挑戰(zhàn)。為解決大數(shù)據(jù)教學、學習中的困感,華為授權培訓中心廣西帆聯(lián)科技有限公司特舉行“大數(shù)據(jù)師初級課程培訓班” 采用原理加實操方式開展,讓更多人了解數(shù)據(jù)挖據(jù)、數(shù)據(jù)分析原理,掌握 Hadoop、 Python、 Spark等大數(shù)據(jù)主流工具,通過綜合案例的學習掌握實踐教學方法,為學員在大數(shù)據(jù)專業(yè)方面開展實驗教學和科研工作打下基礎。
一、培訓目標: 該課程定位為大數(shù)據(jù)技術的普及,圍繞大數(shù)據(jù)基本功能特性、大數(shù)據(jù)組件基礎技術原理及操作演練的考核。課程包含:大數(shù)據(jù)行業(yè)與技術趨勢介紹、大數(shù)據(jù)人才生態(tài)、數(shù)據(jù)挖掘的基礎算法、Spark,hadoop大數(shù)據(jù)平臺介紹, Hive分布式數(shù)據(jù)倉庫、Streaming分布式流計算引擎、Loader數(shù)據(jù)轉換、Flume海量日志聚合、Kafka分布式消息訂閱系統(tǒng)、ZooKeeper集群分布式協(xié)調(diào)服務等11個常用且重要的大數(shù)據(jù)組件技術原理與架構, 完成該課程的學習,將證明您已經(jīng)系統(tǒng)掌握常用且重要的大數(shù)據(jù)組件技術原理與架構,能夠運用大數(shù)據(jù)解決方案進行海量數(shù)據(jù)的導入和導出等崗位所必備的知識和技能,并且為大數(shù)據(jù)應用業(yè)務奠定了堅實的基礎。
二、培訓對象 適用于從事或準備從事大數(shù)據(jù)技術相關工作,且具備一定云計算基礎知識、計算機算法及編程基礎的從業(yè)人員和高校科研工作者。
三、培訓地點 時 間:2019年7月22日-27日(早上9:00-12:00,下午15:00-18:00) 培訓地點:南寧市大學東路118號永恒朗悅酒店9樓會議中心乾坤廳
四、培訓費用 此次培訓有關費用為5600元人民幣,培訓費包含:報名費,電子教材資料,上機環(huán)境。差旅、餐食及住宿費自理。
五、認證證書 完成本課程可考取華為大數(shù)據(jù)初級認證工程師HCIA-Big Data,考試科目為H13-711,考試費用為1500元人民幣,考試地點于廣西帆聯(lián)科技VUE授權考試中心進行。
六、報名聯(lián)系人 聯(lián)系人:謝新海 電 話:0771-2796086 手 機:15994437962 郵 箱:xinhai.xie@sail-lab.net 報名截止日期2019年7月20日。報名成功后我們于開課前5日與報名人員電話確認。 報名方式一:填寫回執(zhí)(附件一)發(fā)送郵件到聯(lián)系人xinhai.xie@sail-lab.net 報名方式二:線上H5鏈接最后一頁填寫報名信息 七、課程內(nèi)容 Bigdata大數(shù)據(jù)工程師課程大綱 | 大數(shù)據(jù)人才生態(tài) | 大數(shù)據(jù)人才需求 | 大數(shù)據(jù)及數(shù)據(jù)分析、大數(shù)據(jù)挖掘、機器學習、AI概述 | 引入案例開篇(衣食住行、無人駕駛機智過人) | 大數(shù)據(jù)時代:云計算、機器學習、深度學習、人工智能等 | 神奇作用:百事可樂代言人企業(yè)決策、玉蘭油企業(yè)成效 | 案例應用:金融、交通、電商企業(yè)級用戶數(shù)據(jù)分析應用等 | 大數(shù)據(jù)從業(yè)者需求現(xiàn)狀 | 大數(shù)據(jù)認證簡介 | 華為HCIA->HCIP->HCIE大數(shù)據(jù)認證考試說明 | 人才:大數(shù)據(jù)應用技術工程師、大數(shù)據(jù)挖掘及機器學習算法崗、大數(shù)據(jù)系統(tǒng)研發(fā)工程師、大數(shù)據(jù)商業(yè)管理崗 | 大數(shù)據(jù)平臺架構 | 大數(shù)據(jù)環(huán)境分析 | 虛擬化技術、云計算架構 | 什么是大數(shù)據(jù)?什么是數(shù)據(jù)樣本、數(shù)據(jù)集,大數(shù)據(jù)4V/5V是什么? | Hadoop概述 | 大數(shù)據(jù)集群存儲處理技術定義、層次、目的、過程 | 數(shù)據(jù)化決策 數(shù)據(jù)模型與方法 | 什么是機器學習? | 什么是大數(shù)據(jù)挖掘? | 數(shù)據(jù)分析、機器學習、大數(shù)據(jù)挖掘相同點和不同點 | 數(shù)據(jù)挖掘技術與傳統(tǒng)模型的映射 | Spark概述 | 什么是Spark?Spark vs Hadoop優(yōu)勢、什么是Spark ML?Spark MLLib作用 | 用戶畫像與企業(yè)可視化戰(zhàn)略 | 大數(shù)據(jù)挖掘流程 | 認識數(shù)據(jù) | 大數(shù)據(jù)場景案例導入 | 什么是一手數(shù)據(jù)、什么是二手數(shù)據(jù) | 結構化數(shù)據(jù)VS非結構化數(shù)據(jù) | 結構化數(shù)據(jù)的變量(數(shù)據(jù))類型分類 | 描述性數(shù)據(jù)處理 | 數(shù)據(jù)獲取 | 數(shù)據(jù)獲取的原則有哪些? | 內(nèi)部數(shù)據(jù)獲取 | 數(shù)據(jù)庫VS數(shù)據(jù)倉庫 | 關系型數(shù)據(jù)庫SQL、NoSQL非關系數(shù)據(jù)庫技術 | 結構化數(shù)據(jù)VS非結構化數(shù)據(jù) | 外部數(shù)據(jù)獲取 | 外部數(shù)據(jù)獲取概述-行業(yè)數(shù)據(jù)、交易數(shù)據(jù)、API數(shù)據(jù)等 | Python概述 | 網(wǎng)絡爬蟲原理 | Python數(shù)據(jù)采集、爬蟲 | 數(shù)據(jù)預處理 | 臟數(shù)據(jù)的成因和處理的必要性,數(shù)據(jù)處理的常規(guī)方法、基本操作、常用函數(shù)、數(shù)據(jù)透視表 | 數(shù)據(jù)的描述性分析:集中趨勢測度、離散趨勢測度等 | 數(shù)據(jù)清洗:缺失數(shù)據(jù)、異常數(shù)據(jù)等 | 數(shù)據(jù)集成:信息孤島、共享融合數(shù)據(jù)等 | 數(shù)據(jù)轉換:數(shù)據(jù)標準化、數(shù)據(jù)的代數(shù)運 、數(shù)據(jù)的離散化等 | 數(shù)據(jù)規(guī)約:變量規(guī)約、數(shù)值規(guī)約等 | 數(shù)據(jù)可視化 | 大數(shù)據(jù)可視化簡介、常用圖表、工具介紹、可視化技巧 | 大數(shù)據(jù)Hadoop平臺 | Hadoop生態(tài)鏈 | Hadoop入門介紹- Hadoop生態(tài)系統(tǒng)和技術棧 | 大數(shù)據(jù):分布式集群架構 | Linux入門基礎-安裝和使用Ubuntu系統(tǒng) | Hadoop環(huán)境搭建 | Hadoop單機環(huán)境搭建 | Hadoop偽分布式集群搭建 | Hadoop完全分布式集群搭建 | Hadoop場景 | Hadoop優(yōu)點、缺點 | Hadoop風險評估 | 大數(shù)據(jù):分布式文件存儲系統(tǒng) | HDFS分布式文件系統(tǒng)簡介、與傳統(tǒng)文件系統(tǒng)區(qū)別 | HDFS讀寫文件、實現(xiàn)原理 | HDFS架構原理及常用指令 | MapReduce計算引擎 | MapReduce概念、框架和流程 | 大數(shù)據(jù)倉庫 | 大數(shù)據(jù)倉庫概念、數(shù)據(jù)庫vs大數(shù)據(jù)倉庫 | Hive技術架構 | 分布式數(shù)據(jù)倉庫必要性、Hive基礎知識 | Hive技術層面實現(xiàn)方式 | Hive技術應用場景 | Hbase技術架構 | Hbase基礎知識 | Hbase集群模式 | 實踐項目總結 | 寬表設計與用戶畫像 | 網(wǎng)站流量分析與頁面運營 | 大數(shù)據(jù)Spark平臺 | 分布式計算引擎 | Spark簡介、為什么需要Spark、Spark框架 | Spark產(chǎn)品 | Spark基本組件介紹 | Spark運行架構 | Spark和Scala結合 | 日志采集 消息隊列 協(xié)調(diào)服務 | 海量日志采集聚合系統(tǒng)Flume原理 | 分布式消息隊列訂閱系統(tǒng)Kafka原理 | 集群分布式協(xié)調(diào)服務ZooKeeper原理 | 流式計算框架Streaming原理 | Spark機器學習 | 分布式算法庫基礎知識 | Spark ML介紹 | Spark MLLib介紹 | 機器學習工作流 | 機器學習項目案例-房價預測 | 大數(shù)據(jù)建模1 | 機器學習 | 機器學習入門介紹:機器學習、大數(shù)據(jù)挖掘、深度學習、神經(jīng)網(wǎng)絡、人工智能體系 | 機器學習基本思想、大數(shù)據(jù)挖掘基本思想 | 機器學習常用算法分類、有監(jiān)督學些、無監(jiān)督學習、強化學習、遷移學習、算法庫等 | KNN算法 | KNN算法工作原理、最近鄰分類器 | KD-Tree和KNN回歸 | KNN算法應用案例:改進約會網(wǎng)站配對效果 | 貝葉斯算法 | 樸素貝葉斯算法思路、全概率公式和貝葉斯定理 | 貝葉斯網(wǎng)絡模型 | 樸素貝葉斯算法應用案例:互聯(lián)網(wǎng)垃圾郵件過濾 | 回歸算法 | 邏輯回歸(分類) | Logistic回歸算法工作原理 | Sigmoid函數(shù)、梯度上升法 | Logistic回歸算法應用案例:構建信用卡反欺詐模型 | 線性回歸 | 線性回歸的相關概念(相關、獨立和協(xié)方差) | 線性回歸和最小二乘法 | 樹和支持向量機 | 決策樹 | 決策樹算法工作原理 | 決策樹算法演進過程 | 復雜數(shù)據(jù)的局部性建模 | 決策樹ID3、C4.5、C5.0、CART算法 | 樹模型算法應用案例:紅酒分類 | 支持向量機 | 支持向量機算法工作原理介紹 | 線性可分的支持向量機 | 近似線性可分、非線性可分、核函數(shù) | SVM支持向量機分類和支持向量機回歸 | SVM算法應用案例:手寫數(shù)字識別 | 大數(shù)據(jù)建模2 | 聚類和集成算法 | 聚類分析 | 聚類分析算法工作原理 | K-means快速聚類、K-medoids中心點算法 | DBSCAN密度聚類、層次聚類等 | 集成Bagging類算法 | Bagging算法工作原理 | 隨機森林、集成Bagging算法應用場景 | 集成Boosting類算法 | Boosting算法工作原理、 | GBDT梯度提升樹工作原理 | AdaBoost、XgBoost算法工作原理、不同種集成算法優(yōu)缺點 | 神經(jīng)網(wǎng)絡算法:反向傳播神經(jīng)網(wǎng)路、卷積神經(jīng)網(wǎng)絡、LSTM等 | 關聯(lián)與推薦算法 | 關聯(lián)規(guī)則 | 關聯(lián)規(guī)則算法工作原理、基本組成要素 | Apriori算法策略與特點 | FP-Growth算法策略與特點 | PrefixSpan算法模型與方法 | 關聯(lián)規(guī)則應用案例1:百度搜索引擎中的相關搜索 | 關聯(lián)規(guī)則應用案例2:淘寶中訪問相關頁面的關聯(lián)店鋪 | 推薦算法 | 協(xié)同過濾推薦算法工作原理 | 基于用戶的協(xié)同過濾推薦算法 | 基于物品的協(xié)同過濾推薦算法 | 推薦算法應用案例:新聞個性化推薦 | 競品分析-對應分析模型 | 金融大數(shù)據(jù)挖掘項目建模步驟 | 1、數(shù)據(jù)的讀取及定位需要清洗的數(shù)據(jù) | 2、模型有監(jiān)督/無監(jiān)督判斷 | 3、非結構數(shù)據(jù)處理:空值、重復數(shù)據(jù)、離群點處理 | 4、數(shù)據(jù)量綱處理(歸一化/標準化) | 5、構建評分卡模型/反欺詐預測模型 | 6、模型的評估與選擇 | 7、模型的優(yōu)化與封裝 |
八、住宿及交通 培訓地址:地鐵站魯班路站D口出永恒朗悅酒店9層會議中心 推薦酒店:
南寧永恒朗悅酒店 地址:南寧市西鄉(xiāng)塘區(qū)大學東路118號 標準:450元/晚 電話:0771-2336888
雅斯特酒店 地址:南寧市西鄉(xiāng)塘區(qū)大學東路100-1號(近廣西大學(正門)) 標準:240/晚 電話:0771-5810888
城市便捷酒店(廣西大學大店) 地址:南寧市西鄉(xiāng)塘區(qū)火炬路1號創(chuàng)業(yè)大廈9-12層 標準:200/晚 電話:0771-6115000
附件一 報名回執(zhí)表 單位名稱(開發(fā)票名稱) | | 通訊地址 | | 信用代碼 | | 姓名 | 職務 | 性別 | 郵 箱 | 聯(lián)系電話 | 單位名稱 | 是否住宿 | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | 匯 款 方 式 | 公司名稱:廣西帆聯(lián)科技有限公司 公司地址:南寧市大學東路98號世貿(mào)西城廣場B座1501 對公賬號:2102111009201266650 開戶行:工行南寧高新技術產(chǎn)業(yè)開發(fā)區(qū)支行 電話:0771-2796086 | 學員簽字或蓋章 |
|