中圖網

>

數據庫

>

數據倉庫與數據挖掘

互聯網大數據處理技術與應用

包郵互聯網大數據處理技術與應用

作者：曾劍平編著

出版社：清華大學出版社出版時間：2017-04-01

開本： 32開 頁數： 290

本類榜單：計算機/網絡銷量榜

中圖價:¥30.4(6.2折) 定價 ~~¥49.0~~ 登錄后可看到會員價

加入購物車收藏

開年大促， 全場包郵

?新疆、西藏除外

本類五星書更多>

>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用

全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用

¥14.4¥45
>
決戰行測5000題(言語理解與表達)

決戰行測5000題(言語理解與表達)

¥44.1¥88
>
軟件性能測試.分析與調優實踐之路

軟件性能測試.分析與調優實踐之路

¥56.2¥69
>
第一行代碼Android

第一行代碼Android

¥55.4¥99
>
JAVA持續交付

JAVA持續交付

¥58.1¥119
>
EXCEL最強教科書(完全版)(全彩印刷)

EXCEL最強教科書(完全版)(全彩印刷)

¥31.1¥69.9
>
深度學習

深度學習

¥92.4¥168

買過本商品的人還買了

中國歷代政治得失
錢穆
¥29.4~~¥49.0~~
理想國
[古希臘] 柏拉圖著，張俊譯
¥21.2~~¥56.0~~
明朝那些事兒全集(2020版)/當年明月
當年明月
¥235.2~~¥336.0~~
經濟學通俗讀物:北大經濟課(受益一生的經濟學智慧)
郭海峰
¥9.7~~¥35.0~~
歷史深處的憂慮-近距離看美國之一
林達
¥29.5~~¥38.0~~

商品詳情
商品評論(0條)

中圖價:¥30.4 加入購物車

版權信息
本書特色
內容簡介
目錄

互聯網大數據處理技術與應用版權信息

ISBN：9787302463719
條形碼：9787302463719 ; 978-7-302-46371-9
裝幀：一般膠版紙
冊數：暫無
重量：暫無
所屬分類：
計算機/網絡
>
數據庫
>
數據倉庫與數據挖掘

互聯網大數據處理技術與應用本書特色

本書內容分為三個部分，*部分為互聯網大數據的概述；第二部分為互聯網大數據的獲取與存儲，包括了靜態或動態WEB頁面內容獲取技術、結構化或非結構化數據的存儲、常見的開源系統等；第二部分為處理與分析技術，包括了文本數據預處理、數據內容的語義分析技術、文本內容分類技術、聚類分析、大數據中的隱私保護、大數據可視化等內容；第三部分為綜合應用。

互聯網大數據處理技術與應用內容簡介

本書內容分為三個部分，**部分為互聯網大數據的概述；第二部分為互聯網大數據的獲取與存儲，包括了靜態或動態WEB頁面內容獲取技術、結構化或非結構化數據的存儲、常見的開源系統等；第二部分為處理與分析技術，包括了文本數據預處理、數據內容的語義分析技術、文本內容分類技術、聚類分析、大數據中的隱私保護、大數據可視化等內容；第三部分為綜合應用。

互聯網大數據處理技術與應用目錄

目錄第1部分概述第1章互聯網大數據 1.1從IT走向DT 1.1.1信息化與Web時代 1.1.2大數據時代 1.2互聯網大數據及其特點 1.3互聯網大數據處理的相關技術 1.3.1技術體系構成 1.3.2相關技術研究 1.4互聯網大數據技術的發展 1.5本書內容安排思考題第2部分互聯網大數據的獲取第2章Web頁面數據獲取 2.1網絡爬蟲技術概述 2.2爬蟲的內核技術 2.2.1Web服務器連接器 2.2.2頁面解析器 2.2.3爬行策略搜索 2.3主題爬蟲技術 2.3.1主題爬蟲模塊構成 2.3.2主題定義 2.3.3鏈接相關度估算 2.3.4內容相關度計算 2.4動態Web頁面獲取技術 2.4.1動態頁面的分類 2.4.2動態頁面的獲取方法 2.4.3模擬瀏覽器的實現 2.4.4基于腳本解析的實現 2.5微博信息內容獲取技術 2.6DeepWeb數據獲取技術 2.6.1相關概念 2.6.2DeepWeb數據獲取方法 2.7反爬蟲技術與反反爬蟲技術 2.7.1反爬蟲技術 2.7.2反反爬蟲技術 2.7.3爬蟲技術的展望思考題第3章互聯網大數據的提取技術 3.1Web頁面內容提取技術 3.1.1Web頁面內容提取的基本任務 3.1.2Web頁面解析方法概述 3.1.3基于HTMLParser的頁面解析 3.1.4基于Jsoup的頁面解析 3.2基于統計的Web信息抽取方法 3.3其他互聯網大數據的提取 3.4阿里云公眾趨勢分析中的信息提取應用 3.5互聯網大數據提取的挑戰性問題思考題第3部分互聯網大數據的結構化處理與分析技術第4章結構化處理技術 4.1互聯網大數據中的文本信息特征 4.2中文文本的詞匯切分 4.2.1詞匯切分的一般流程 4.2.2基于詞典的分詞方法 4.2.3基于統計的分詞方法 4.2.4歧義處理 4.3詞性識別 4.3.1詞性標注的難點 4.3.2基于規則的方法 4.3.3基于統計的方法 4.4新詞識別 4.5停用詞的處理 4.6英文中的詞形規范化 4.7開源工具與平臺 4.7.1開源工具及應用 4.7.2阿里分詞器思考題第5章大數據語義分析技術 5.1語義及語義分析 5.2詞匯級別的語義技術 5.2.1詞匯的語義關系 5.2.2知識庫資源 5.2.3詞向量 5.2.4詞匯的語義相關度計算 5.3句子級別的語義分析技術 5.4命名實體識別技術 5.4.1命名實體識別的研究內容 5.4.2人名識別方法 5.4.3地名識別方法 5.4.4時間識別方法 5.4.5基于機器學習的命名實體識別 5.5大數據語義分析技術的發展思考題第6章大數據分析的模型與算法 6.1大數據分析技術概述 6.2特征選擇與特征提取 6.2.1特征選擇 6.2.2特征提取 6.2.3基于深度學習的特征提取 6.3文本的向量空間模型 6.3.1向量空間模型的維 6.3.2向量空間模型的坐標 6.3.3向量空間模型中的運算 6.3.4文本型數據的邏輯存儲結構 6.4文本的概率模型 6.4.1Ngram模型 6.4.2概率主題模型 6.5分類技術 6.5.1分類技術概要 6.5.2經典的分類技術 6.6聚類技術 6.7回歸分析 6.7.1回歸分析的基本思路 6.7.2線性回歸 6.7.3加權線性回歸 6.7.4邏輯回歸 6.8大數據分析算法的并行化 6.8.1并行化框架 6.8.2矩陣相乘的并行化 6.8.3經典分析算法的并行化 6.9基于阿里云大數據平臺的數據挖掘實例 6.9.1網絡數據流量分析 6.9.2網絡論壇話題分析思考題第7章大數據隱私保護 7.1隱私保護概述 7.2隱私保護模型 7.2.1隱私泄露場景 7.2.2k匿名及其演化 7.2.31多元化 7.3位置隱私保護 7.4社會網絡隱私保護思考題第8章大數據技術平臺 8.1概述 8.2大數據技術平臺的分類 8.3大數據存儲平臺 8.3.1大數據存儲需要考慮的因素 8.3.2HBase 8.3.3MongoDB 8.3.4Neo4j 8.3.5云數據庫 8.3.6其他 8.4大數據可視化 8.4.1大數據可視化的挑戰 8.4.2大數據可視化方法 8.4.3大數據可視化工具 8.5Hadoop 8.5.1Hadoop概述 8.5.2Hadoop生態圈及關鍵技術 8.5.3Hadoop的版本 8.6Spark 8.6.1Spark的概述 8.6.2Spark的生態圈 8.6.3SparkSQL 8.6.4Spark Streaming 8.6.5Spark機器學習 8.7阿里云大數據平臺 8.7.1飛天系統 8.7.2大數據集成平臺思考題第4部分綜合應用第9章基于阿里云大數據技術的個性化新聞推薦 9.1目的與任務 9.2系統架構 9.3存儲設計 9.3.1RDS 9.3.2OSS 9.3.3OTS 9.3.4MaxCompute 9.4軟件架構 9.4.1ECS 9.4.2爬蟲 9.4.3模型訓練 9.4.4分類過程 9.4.5開源代碼 9.5阿里云大數據的應用開發 9.5.1開發環境 9.5.2部署 9.5.3運行與測試思考題參考文獻

展開全部

商品評論(0條)

寫書評賺書幣

暫無評論……

書友推薦

>
中國人在烏蘇里邊疆區:歷史與人類學概述
中國人在烏蘇里邊疆區:歷史與人類學概述
[蘇]阿爾謝尼耶夫著，劉宇譯
¥21.6~~¥48.0~~
>
回憶愛瑪儂
回憶愛瑪儂
[日]梶尾真治著，王瑋譯
¥24.0~~¥32.8~~
>
大紅狗在馬戲團-大紅狗克里弗-助人
大紅狗在馬戲團-大紅狗克里弗-助人
[美] 諾爾曼·伯德韋爾著，杜可名譯
¥5.2~~¥10.0~~
>
月亮虎
月亮虎
[英] 佩內洛普·萊夫利著，郭國良譯
¥15.4~~¥48.0~~
>
名家帶你讀魯迅:故事新編
名家帶你讀魯迅:故事新編
魯迅著，陳漱渝主編
¥13.0~~¥26.0~~
>
史學評論
史學評論
楊玉圣
¥14.4~~¥42.0~~
>
有舍有得是人生
有舍有得是人生
梁實秋
¥25.7~~¥45.0~~
>
巴金－再思錄
巴金－再思錄
巴金
¥15.7~~¥46.0~~

本類暢銷

大數據

劉鵬

¥35.2~~¥58~~
大數據叢書數據可視化(第2版)

陳為等

¥163.2~~¥259~~
不良情緒應急處理包--孤獨感

中圖網

¥12.9~~¥30~~
不良情緒應急處理包--精神內耗

中圖網

¥12.9~~¥30~~
孩子、家庭和外部世界

唐納德·溫尼科特

¥17.8~~¥56~~
北魏政治史(二)

張金龍著

¥26.2~~¥70~~

包郵互聯網大數據處理技術與應用

中國歷代政治得失

理想國

明朝那些事兒全集(2020版)/當年明月

經濟學通俗讀物:北大經濟課(受益一生的經濟學智慧)

歷史深處的憂慮-近距離看美國之一

互聯網大數據處理技術與應用版權信息

互聯網大數據處理技術與應用本書特色

互聯網大數據處理技術與應用內容簡介

互聯網大數據處理技術與應用目錄

中國人在烏蘇里邊疆區:歷史與人類學概述

回憶愛瑪儂

大紅狗在馬戲團-大紅狗克里弗-助人

月亮虎

名家帶你讀魯迅:故事新編

史學評論

有舍有得是人生

巴金－再思錄

大數據

大數據叢書數據可視化(第2版)

不良情緒應急處理包--孤獨感

不良情緒應急處理包--精神內耗

孩子、家庭和外部世界

北魏政治史(二)

熊千佳昆蟲記

百年夢憶:梁實秋人生自述

上海灘的賈斯汀·比伯

俄羅斯書簡

女孩們

連科六短篇-短篇經典文庫

包郵 互聯網大數據處理技術與應用

互聯網大數據處理技術與應用 版權信息

互聯網大數據處理技術與應用 本書特色

互聯網大數據處理技術與應用 內容簡介

互聯網大數據處理技術與應用 目錄

包郵互聯網大數據處理技術與應用

互聯網大數據處理技術與應用版權信息

互聯網大數據處理技術與應用本書特色

互聯網大數據處理技術與應用內容簡介

互聯網大數據處理技術與應用目錄