精準數源—Cloudera官方指定認證培訓機構 一直秉承著(zhù)“科學(xué)、高效、權威、品質(zhì)”的教學(xué)宗旨,以“追求卓越服務(wù),與企業(yè)共同發(fā)展“的努力目標,為企事業(yè)單位培養更多更優(yōu)秀的數據技術(shù)人才,加速企業(yè)以應對大數據挑戰。 【機構優(yōu)勢】 ●Cloudera原廠(chǎng)講師 ●Cloudera原廠(chǎng)課程 ●全球最具權威的大數據資質(zhì)認證 ●國際最新的課程體系 ●國內通過(guò)Cloudera管理員和數據分子式培訓并順利拿到講師資格證書(shū)最多的企業(yè) 【課程內容】 1、Hadoop生態(tài)圈、實(shí)驗場(chǎng)景介紹、用Hadoop工具導入數據 2、pig的特性、使用案例、和pig交互、pig Latin語(yǔ)法、Field定義、用pig執行ETL流程
3、pig處理復雜數據,復雜/nested嵌套的數據類(lèi)型、用pig分析廣告戰役的數據
4、pig的多數據組操作,pig鏈接多數據組、用pig分析離散的數據組
5、用流處理和UDFs擴展pig,Macros和Imports、contributed functions,用其他語(yǔ)言和pig一起處理數據
6、pig故障排查和優(yōu)化,用web界面排查一個(gè)故障的任務(wù)、Data采樣和故障排查、理解執行計劃、提高pig任務(wù)性能
7、hive表結構和數據儲存、對比hive和傳統數據庫、hive vs.pig、hive使用案例
8、hive的關(guān)系數據分析、數據管理、文本處理、優(yōu)化及擴展,在shell、腳本和hue上運行hive查詢(xún)
9、impala和hive、pig、關(guān)系數據庫的不同、使用impala shell
10、采樣impala分析數據,過(guò)濾、排序and limiting results,提升impala性能,impala的交互式分析
11、對比map reduce、pig、hive、impala和關(guān)系數據庫 【課時(shí)】 4天 7課時(shí)/天 【學(xué)員基礎】 該課程適合有SQL經(jīng)驗和基本Unix和Linux命令的數據分析師、業(yè)務(wù)分析師和管理員。 無(wú)需Java和Apache Hadoop經(jīng)驗 【課程時(shí)間】 10月24日—27日(09:00—18:00)
|