<ruby id="f53rv"></ruby>
<strike id="f53rv"></strike>
<span id="f53rv"></span>
<strike id="f53rv"></strike>
<strike id="f53rv"></strike>
<strike id="f53rv"></strike>
<span id="f53rv"></span>
<span id="f53rv"></span>
<strike id="f53rv"></strike>
<span id="f53rv"><video id="f53rv"></video></span><span id="f53rv"><dl id="f53rv"></dl></span>
<strike id="f53rv"><dl id="f53rv"></dl></strike>
<ruby id="f53rv"></ruby>
<strike id="f53rv"></strike><span id="f53rv"></span>
<strike id="f53rv"></strike>
<del id="f53rv"></del>
<span id="f53rv"><dl id="f53rv"><ruby id="f53rv"></ruby></dl></span>
<span id="f53rv"><dl id="f53rv"></dl></span><strike id="f53rv"></strike>
Python數據建模之分類模型篇

Python數據建模之分類模型篇

Python數據建模之分類模型篇課程/講師盡在Python數據建模之分類模型篇專題,Python數據建模之分類模型篇公開課北上廣深等地每月開課!Python數據建模之分類模型篇在線直播課程(免費試聽)。專家微信18749492090,講師手機13522550408,百度搜索“交廣國際管理咨詢”了解更多。

【課程大綱】
第一部分:預測建模基礎
1、數據建模六步法
?選擇模型:基于業務選擇恰當的數據模型
?屬性篩選:選擇對目標變量有顯著影響的屬性來建模
?訓練模型:采用合適的算法,尋找到最合適的模型參數
?評估模型:進行評估模型的質量,判斷模型是否可用
?優化模型:如果評估結果不理想,則需要對模型進行優化
?應用模型:如果評估結果滿足要求,則可應用模型于業務場景
2、數據挖掘常用的模型
?數值預測模型:回歸預測、時序預測等
?分類預測模型:邏輯回歸、決策樹、神經網絡、支持向量機等
?市場細分:聚類、RFM、PCA等
?產品推薦:關聯分析、協同過濾等
?產品優化:回歸、隨機效用等
?產品定價:定價策略/最優定價等
3、屬性篩選/特征選擇/變量降維
?基于變量本身特征
?基于相關性判斷
?因子合并(PCA等)
?IV值篩選(評分卡使用)
?基于信息增益判斷(決策樹使用)
4、訓練模型及實現算法
?模型原理
?算法實現
5、模型評估
?評估指標
?評估方法
?過擬合評估
6、模型優化
?優化模型:選擇新模型/修改模型
?優化數據:新增顯著自變量
?優化公式:采用新的計算公式
7、模型應用
?模型解讀
?模型部署
?模型應用
8、好模型是優化出來的

第二部分:分類模型評估
1、三個方面評估:指標、方法、過擬合
2、兩大矩陣
?混淆矩陣
?代價矩陣
3、六大指標
?正確率Accuracy
?查準率Precision
?查全率Recall
?特異度Specify
?F度量值(/)
?提升指標lift
4、三條曲線
?ROC曲線和AUC
?PR曲線和BEP
?KS曲線和KS值
5、多分類模型評估指標
?宏指標:macro_P, macro_R
?宏指標:micro_P, micro_R
6、模型評估方法
?原始評估法
?留出法(Hold-Out)
?交叉驗證法(k-fold cross validation)
?自助采樣法(Bootstrapping)
7、其它評估
?過擬合評估:學習曲線
?殘差評估:白噪聲評估

第三部分:邏輯回歸
問題:如何評估客戶購買產品的可能性?如何預測客戶行為?
如何預測客戶流失?銀行如何實現欠貸風險控制?
1、邏輯回歸模型簡介
2、邏輯回歸的種類
?二項邏輯回歸
?多項邏輯回歸
3、邏輯回歸方程解讀
4、帶分類自變量的邏輯回歸
5、邏輯回歸的算法實現及優化
?迭代樣本的隨機選擇
?變化的學習率
6、邏輯回歸+正則項
7、求解算法與懲罰項的互斥關系
8、多元邏輯回歸處理
?ovo
?ovr
9、邏輯回歸建模過程
案例:用sklearn庫實現銀行貸款違約預測
案例:訂閱者用戶的典型特征(二元邏輯回歸)
案例:通信套餐的用戶畫像(多元邏輯回歸)

第四部分:決策樹
1、分類決策樹簡介
演練:識別銀行欠貨風險,提取欠貸者的特征
2、決策樹的三個關鍵問題
?最優屬性選擇
?熵、基尼系數
?信息增益、信息增益率
?屬性最佳劃分
?多元劃分與二元劃分
?連續變量最優劃分
?決策樹修剪
?剪枝原則
?預剪枝與后剪枝
3、構建決策樹的算法
?C5.0、CHAID、CART、QUEST
?各種算法的比較
4、決策樹的超參優化
5、決策樹的解讀
6、決策樹建模過程
案例:商場酸奶購買用戶特征提取
案例:客戶流失預警與客戶挽留
案例:識別拖欠銀行貨款者的特征,避免不良貨款
案例:識別電信詐騙者嘴臉,讓通信更安全
案例:電力竊漏用戶自動識別
第五部分:人工神經網絡
1、神經網絡簡介(ANN)
2、神經元基本原理
?加法器
?激活函數
3、神經網絡的結構
?隱藏層數量
?神經元個數
4、神經網絡的建立步驟
5、神經網絡的關鍵問題
6、BP算法實現
7、MLP多層神經網絡
案例:評估銀行用戶拖欠貨款的概率
案例:神經網絡預測產品銷量
第六部分:線性判別分析(LDA)
1、判別分析簡介
?基本思想
2、判別分析種類
3、判別分析算法
?類間散席
?類內散席
4、LDA線性判別模型
5、多分類判別分析
案例:MBA學生錄取判別分析
案例:上市公司類別評估
第七部分:最近鄰分類(KNN)
1、KNN的基本原理
2、K近鄰的關鍵問題
3、K近鄰的實現算法
?Brute暴力計算
?Kd_tree
?Ball_tre
第八部分:樸素貝葉斯分類(NBN)
1、貝葉斯簡介
2、貝葉斯分類原理
?先驗概率和后驗概率
?條件概率和類概率
3、常見貝葉斯網絡
4、計算類別屬性的條件概率
5、估計連續屬性的條件概率
6、預測分類概率(計算概率)
7、拉普拉斯修正
案例:評估銀行用戶拖欠貨款的概率

第九部分:支持向量機(SVM)
1、支持向量機簡介
?適用場景
2、支持向量機原理
?支持向量
?最大邊界超平面
3、線性不可分處理
?松弛系數
4、非線性SVM分類
5、常用核函數
?線性核函數
?多項式核
?高斯RBF核
?核函數的選擇原則
6、SMO算法
第十部分:模型集成優化篇
1、模型的優化思想
2、集成模型的框架
?Bagging
?Boosting
?Stacking
3、集成算法的關鍵過程
?弱分類器如何構建
?組合策略:多個弱學習器如何形成強學習器
4、Bagging集成算法
?數據/屬性重抽樣
?決策依據:少數服從多數
?隨機森林RandomForest
5、Boosting集成算法
?基于誤分數據建模
?樣本選擇權重更新
?決策依據:加權投票
?AdaBoost模型
6、GBDT模型
7、XGBoost模型
8、LightGBM模型

第十一部分:案例實戰
1、客戶流失預測和客戶挽留模型
2、銀行欠貸風險預測模型

共有 0 條評論

? Top 永久黄网站色视频免费直播