
0人評分過此書
本書系統地介紹大資料探勘的基本概念、經典資訊算法、資訊工具和企業智慧運營應用案例,以運用大資料探勘方法提升企業運營業績與效率為主線,從運營商實際工作中選取了大量運營和銷售案例,詳細講述數據採集、資訊建模、模型落地與精準行銷的全部過程。
全書分為九章,內容包括:大資料探勘與智慧運營的概念,數據預處理,資料探勘中的四種主流算法:群集分析、分類分析、迴歸分析、關聯分析,增強型資料探勘算法,資料探勘在運營商智慧運營中的應用案例,未來大資料探勘的發展趨勢等。主要提供給運營商及其他高科技企業員工、高等院校相關專業本科生和研究生,以及其他對資料探勘與精準行銷感興趣的讀者。
全書分為九章,內容包括:大資料探勘與智慧運營的概念,數據預處理,資料探勘中的四種主流算法:群集分析、分類分析、迴歸分析、關聯分析,增強型資料探勘算法,資料探勘在運營商智慧運營中的應用案例,未來大資料探勘的發展趨勢等。主要提供給運營商及其他高科技企業員工、高等院校相關專業本科生和研究生,以及其他對資料探勘與精準行銷感興趣的讀者。
- 版權資訊
- 內容簡介
- 前言
-
第1章 大數據、資料探勘與智慧運營綜述
-
1.1 資料探勘的發展史
-
1.1.1 資料探勘的定義與起源
-
1.1.2 資料探勘的早期發展
-
1.1.3 資料探勘的算法前傳
-
1.1.4 資料探勘的第一個里程碑
-
1.1.5 最近十年的發展與應用
-
-
1.2 資料探勘的主要流程與金字塔模型
-
1.2.1 資料探勘的任務
-
1.2.2 資料探勘的基本步驟
-
1.2.3 資料探勘的架構——雲計算
-
1.2.4 「金字塔」模型
-
-
1.3 資料探勘對智慧運營的意義
-
1.3.1 「互聯網+」時代的來臨及其對運營商的衝擊和挑戰
-
1.3.2 大數據時代的來臨及其對運營商的挑戰和機遇
-
1.3.3 電信運營商運營發展面臨的主要瓶頸
-
1.3.4 電信運營商發展的「三條曲線」
-
1.3.5 智慧運營與大數據變現
-
1.3.6 資料探勘對於提升智慧運營效率的意義
-
-
1.4 大數據時代已經來臨
-
1.4.1 大數據的定義
-
1.4.2 大數據的「4V」特徵
-
1.4.3 結構化數據與非結構化數據
-
-
1.5 非結構化資料探勘的研究進展
-
1.5.1 文字探勘
-
1.5.2 模式識別
-
1.5.3 語音辨識
-
1.5.4 影片識別
-
1.5.5 其他非結構化資料探勘
-
-
1.6 資料探勘與機器學習、深度學習、人工智慧及雲計算
-
1.6.1 機器學習
-
1.6.2 深度學習
-
1.6.3 人工智慧
-
1.6.4 雲計算
-
-
1.7 現有資料探勘的主要分析軟體與系統
-
1.7.1 Hadoop
-
1.7.2 Storm
-
1.7.3 Spark
-
1.7.4 SPASS(SPSS)
-
1.7.5 SAS
-
-
參考文獻
-
-
第2章 數據統計與數據預處理
-
2.1 數據屬性類型
-
2.1.1 數據屬性定義
-
2.1.2 離散屬性
-
2.1.3 連續屬性
-
-
2.2 數據的統計特性
-
2.2.1 中心趨勢度量
-
2.2.2 數據散佈度量
-
2.2.3 數據相關性
-
-
2.3 數據預處理
-
2.3.1 數據預處理概述
-
2.3.2 數據預處理的主要任務
-
2.3.3 數據清理
-
2.3.4 數據集成
-
2.3.5 數據規約
-
2.3.6 數據變換和離散化
-
-
2.4 數據字段的衍生
-
2.4.1 數據字段的拆分
-
2.4.2 統計特徵的構造
-
2.4.3 數據域的變換
-
-
2.5 SPSS軟體中的數據預處理案例
-
2.5.1 缺失值的實操處理
-
2.5.2 噪音數據的實操處理
-
2.5.3 主成分分析的實操處理
-
-
參考文獻
-
-
第3章 聚類分析
-
3.1 概述
-
3.2 聚類算法的評估
-
3.3 基於劃分的聚類:K-means
-
3.3.1 基於劃分的聚類算法概述
-
3.3.2 K-means聚類算法原理
-
3.3.3 K-means算法的優勢與劣勢
-
3.3.4 K-means算法優化
-
3.3.5 SPSS軟體中的K-means算法應用案例
-
-
3.4 基於層次化的聚類:BIRCH
-
3.4.1 基於層次化的聚類算法概述
-
3.4.2 BIRCH算法的基本原理
-
3.4.3 BIRCH算法的優勢與劣勢
-
-
3.5 基於密度的聚類:DBSCAN
-
3.5.1 基於密度的聚類算法概述
-
3.5.2 DBSCAN算法的基本原理
-
3.5.3 DBSCAN算法的優勢與劣勢
-
-
3.6 基於網格的聚類:CLIQUE
-
3.6.1 基於網格的聚類算法概述
-
3.6.2 CLIQUE算法的基本原理
-
3.6.3 CLIQUE算法的優勢與劣勢
-
-
參考文獻
-
-
第4章 分類分析
-
4.1 分類分析概述
-
4.2 分類分析的評估
-
4.3 決策樹分析
-
4.3.1 決策樹算法的基本原理
-
4.3.2 CHAID決策樹
-
4.3.3 ID3決策樹
-
4.3.4 C4.5決策樹
-
4.3.5 CART決策樹
-
4.3.6 決策樹中的剪枝問題
-
4.3.7 決策樹在SPSS中的應用
-
-
4.4 最近鄰分析(KNN)
-
4.4.1 KNN算法的基本原理
-
4.4.2 KNN算法流程
-
4.4.3 KNN算法的若干問題
-
4.4.4 KNN分類器的特徵
-
4.4.5 KNN算法在SPSS中的應用
-
-
4.5 貝葉斯分析
-
4.5.1 貝葉斯定理
-
4.5.2 樸素貝葉斯分類
-
4.5.3 貝葉斯網路
-
-
4.6 神經網路
-
4.6.1 感知器
-
4.6.2 多重人工神經網路
-
4.6.3 人工神經網路的特點
-
-
4.7 支持向量機
-
4.7.1 支持向量機簡介
-
4.7.2 最大邊緣超平面
-
4.7.3 數據線性可分的情況
-
4.7.4 數據非線性可分的情況
-
4.7.5 支持向量機的特徵
-
-
參考文獻
-
-
第5章 迴歸分析
-
5.1 迴歸分析概述
-
5.2 一元線性回歸
-
5.2.1 一元線性回歸的基本原理
-
5.2.2 一元線性回歸效能評估
-
5.2.3 SPSS軟體中一元線性回歸應用案例
-
-
5.3 多元線性回歸
-
5.3.1 多元線性回歸基本原理
-
5.3.2 自變數選擇方法
-
5.3.3 SPSS軟體中的多元線性回歸應用案例
-
-
5.4 非線性回歸
-
5.4.1 非線性回歸基本原理
-
5.4.2 冪函數迴歸分析
-
5.4.3 指數迴歸分析
-
5.4.4 對數迴歸分析
-
5.4.5 多項式迴歸分析
-
5.4.6 非線性模型線性化和曲線回歸
-
-
5.5 邏輯迴歸
-
5.5.1 邏輯迴歸基本原理
-
5.5.2 二元邏輯迴歸
-
5.5.3 多元邏輯迴歸
-
5.5.4 SPSS軟體中的邏輯迴歸應用案例
-
-
參考文獻
-
-
第6章 關聯分析
-
6.1 關聯分析概述
-
6.2 關聯分析的評估指標
-
6.2.1 支持度
-
6.2.2 信賴度
-
6.2.3 算法複雜度
-
-
6.3 Apriori算法
-
6.3.1 頻繁項集的定義與產生
-
6.3.2 先驗原理
-
6.3.3 基於支持度的計數與剪枝
-
6.3.4 候選項集生成
-
6.3.5 基於信賴度的剪枝
-
6.3.6 Apriori算法規則生成
-
-
6.4 FP-tree算法
-
6.4.1 頻繁模式樹
-
6.4.2 FP-tree算法頻繁項集的產生
-
6.4.3 FP-tree算法規則生成
-
6.4.4 算法效能對比與評估
-
-
6.5 SPSS Modeler關聯分析實例
-
參考文獻
-
-
第7章 增強型資料探勘算法
-
7.1 增強型資料探勘算法概述
-
7.1.1 組合方法的優勢
-
7.1.2 構建組合分類器的方法
-
-
7.2 隨機森林
-
7.2.1 隨機森林的原理
-
7.2.2 隨機森林的優缺點
-
7.2.3 隨機森林的泛化誤差
-
7.2.4 輸入特徵的選擇方法
-
-
7.3 Bagging算法
-
7.4 AdaBoost算法
-
7.4.1 AdaBoost算法簡介
-
7.4.2 AdaBoost算法原理
-
7.4.3 AdaBoost算法的優缺點
-
-
7.5 提高不平衡數據的分類準確率
-
7.5.1 不平衡數據
-
7.5.2 不平衡數據的處理方法——數據層面
-
7.5.3 不平衡數據的處理方法——算法層面
-
-
7.6 遷移學習
-
7.6.1 遷移學習的基本原理
-
7.6.2 遷移學習的分類
-
7.6.3 遷移學習與資料探勘
-
7.6.4 遷移學習的發展
-
-
參考文獻
-
-
第8章 資料探勘在運營商智慧運營中的應用
-
8.1 概述
-
8.2 單個業務的精準行銷——合約機外呼行銷
-
8.2.1 總結歷史行銷規律
-
8.2.2 預測潛在客戶群體
-
8.2.3 客戶群體細分
-
8.2.4 制定層次化、個性化精準行銷方案
-
-
8.3 多種互聯網業務的精準推送
-
8.3.1 根據歷史行銷規律總結單個業務的歷史行銷規律
-
8.3.2 預測潛在客戶群體、預測單個業務的潛在客戶群體及多個業務的聯合建模
-
8.3.3 制定多業務層次化個性化聯合精準行銷方案
-
8.3.4 落地效果評估
-
-
8.4 套餐精準適配
-
8.4.1 痛點
-
8.4.2 資訊潛在客戶群體
-
8.4.3 探尋強相關字段
-
8.4.4 多元線性回歸建模
-
8.4.5 制定層次化、個性化精準行銷方案
-
8.4.6 落地效果評估與模型調優
-
-
8.5 客戶保有
-
8.5.1 總結客戶流失的歷史規律
-
8.5.2 細分潛在流失客戶群體
-
8.5.3 客戶保有效益建模與最優決策
-
8.5.4 落地效果評估
-
-
8.6 投訴預警
-
8.6.1 客戶投訴現象分析
-
8.6.2 資訊潛在客戶群體
-
8.6.3 制定個性化關懷方案
-
-
8.7 網路質量柵格化呈現
-
8.7.1 柵格化呈現的基本原理
-
8.7.2 覆蓋柵格化
-
8.7.3 基於流量聚叢集的網路優化策略
-
-
8.8 無線室內定位
-
8.8.1 傳統室內定位方法
-
8.8.2 基於Wi-Fi信號的指紋定位算法
-
8.8.3 基於資料探勘算法的改進定位方法
-
-
參考文獻
-
-
第9章 面向未來大數據的資料探勘與機器學習發展趨勢
-
9.1 大數據時代資料探勘與機器學習面臨的新挑戰
-
9.2 IEEE ICDM會議資料探勘與機器學習的最新研究進展
-
9.3 「電腦奧運會」——Sort Benchmark
-
參考文獻
-
- 出版地 : 臺灣
- 語言 : 繁體中文
評分與評論
請登入後再留言與評分