《數(shù)據(jù)挖掘技術(shù)落地實(shí)踐》課程詳情
點(diǎn)擊下載課大綱及報(bào)名表
課程簡(jiǎn)介
數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)是屬于大數(shù)據(jù)的核心技術(shù)之一,以科學(xué)嚴(yán)謹(jǐn)?shù)臄?shù)據(jù)依據(jù)幫助企業(yè)做分析決策,同時(shí)其高深的理論門(mén)檻也阻擋了廣大工程師的學(xué)習(xí)上手,在大數(shù)據(jù)時(shí)代,如何進(jìn)行基于海量數(shù)據(jù)在成百上千的機(jī)器進(jìn)行分布式數(shù)據(jù)挖掘更是需要解決的難題,本課程從實(shí)戰(zhàn)角度出發(fā),基于企業(yè)實(shí)際需求,深入淺出的講解數(shù)據(jù)挖掘最常用的算法和企業(yè)場(chǎng)景,讓工程師通俗易懂的掌握,并且進(jìn)行編程落地實(shí)踐培訓(xùn),讓抽象的算法公式完全落地工程化為企業(yè)所用。
課程大綱
一、大數(shù)據(jù)分析挖掘技術(shù)介紹
1、map/reduce
2、mahout數(shù)據(jù)挖掘
3、sql on hadoop
4、spark生態(tài)體系
5、R語(yǔ)言
6、MPI并行計(jì)算
7、GPU并行計(jì)算(深度學(xué)習(xí))
8、fourinone并行計(jì)算
二、常用機(jī)器學(xué)習(xí)算法原理
1、決策樹(shù)
2、隨機(jī)森林
3、協(xié)同過(guò)濾推薦算法
4、樸素貝葉斯算法
5、k-means聚類算法
6、pagerank算法
7、邏輯回歸
三、大數(shù)據(jù)挖掘業(yè)務(wù)場(chǎng)景和生產(chǎn)平臺(tái)
1、互聯(lián)網(wǎng)金融業(yè)務(wù)
2、銀行客戶需求業(yè)務(wù)
3、大數(shù)據(jù)分析生產(chǎn)平臺(tái)
四、編程實(shí)踐
1、迭代類機(jī)器學(xué)習(xí)編程入門(mén)-求圓周率
2、pagerank的并行化實(shí)現(xiàn)(*)
3、邏輯回歸算法的java實(shí)現(xiàn)(*)
4、決策樹(shù)c45,id3的java實(shí)現(xiàn)
5、隨機(jī)森林和全樹(shù)并行化實(shí)現(xiàn)
6、訓(xùn)練數(shù)據(jù)和結(jié)果模擬器
7、模型結(jié)果規(guī)則化處理
課程對(duì)象
初中級(jí)基礎(chǔ)的工程師,數(shù)據(jù)分析/挖掘/大數(shù)據(jù)技術(shù)人員,企業(yè)數(shù)據(jù)建模/決策人員等等
《數(shù)據(jù)挖掘技術(shù)落地實(shí)踐》所屬分類
研發(fā)項(xiàng)目
《數(shù)據(jù)挖掘技術(shù)落地實(shí)踐》所屬專題
excel培訓(xùn)、
《數(shù)據(jù)挖掘技術(shù)落地實(shí)踐》授課培訓(xùn)師簡(jiǎn)介
木巖
(現(xiàn)為知名企業(yè)中間件首席架構(gòu)師)
擅長(zhǎng)領(lǐng)域
研發(fā)管理
職業(yè)背景
現(xiàn)任某知名IT企業(yè)中間件首席架構(gòu)師,前淘寶高級(jí)專家。先后在淘寶交易、淘寶中間件、集團(tuán)核心系統(tǒng)、阿里金融等部門(mén)工作。曾任金蝶總體架構(gòu)部SOA架構(gòu)師,負(fù)責(zé)設(shè)計(jì)ESB。曾艱苦創(chuàng)業(yè),編寫(xiě)和銷售財(cái)務(wù)軟件。
在Java技術(shù)領(lǐng)域從業(yè)十多年,撰寫(xiě)過(guò)多款開(kāi)源軟件,其中,淘寶分布式技術(shù)框架Fourinone為其代表作。他擁有軟件著作權(quán)的代表作有:BS系列軟件(包括財(cái)務(wù)進(jìn)銷存、OA產(chǎn)品、CRM等)、FMS視頻會(huì)議、Flash網(wǎng)站生成軟件(華軍可下載),所有軟件作品均貢獻(xiàn)99%代碼。
作品:
CoolHash數(shù)據(jù)庫(kù)引擎
出版書(shū)籍:《大規(guī)模分布式系統(tǒng)架構(gòu)與設(shè)計(jì)實(shí)戰(zhàn)》