《机器学习Web应用》内容简介|作者

内容简介

机器学习可用来处理由用户产生的、数量不断增长的Web数据。 本书讲解如何用Python语言、Django框架开发一款Web商业应用,以及如何用一些现成的库和工具(sklearn、scipy、nltk和Django等)处理和分析应用所生成或使用的数据。本书不仅涉及机器学习的核心概念,还介绍了如何将数据部署到用Django框架开发的Web应用,包括Web、文档和服务器端数据的挖掘和推荐引擎的搭建方法。 本书适合有志于成为或刚刚成为数据科学家的读者学习,也适合对机器学习、Web数据挖掘等技术实践感兴趣的读者参考阅读。

作者简介:

Andrea Isoni博士是一名数据科学家、物理学家,他在软件开发领域有着丰富的经验,在机器学习算法和技术方面,拥有广博的知识。此外,他还有多种语言的使用经验,如Python、C C 、Java、JavaScript、C#、SQL、HTML。他还用过Hadoop框架。 译者简介 杜春晓,英语语言文学学士,软件工程硕士。其他译着有《Python数据挖掘入门与实践》《Python数据分析实战》和《电子达人——我的第一本Raspberry Pi入门手册》等。新浪微博:@宜_生。

目 录:

第1章 Python机器学习实践入门 1

1.1 机器学习常用概念 1

1.2 数据的准备、处理和可视化

—NumPy、pandas和matplotlib教程 6

1.2.1 NumPy的用法 6

1.2.2 理解pandas模块 23

1.2.3 matplotlib教程 32

1.3 本书使用的科学计算库 35

1.4 机器学习的应用场景 36

1.5 小结 36

第2章 无监督机器学习 37

2.1 聚类算法 37

2.1.1 分布方法 38

2.1.2 质心点方法 40

2.1.3 密度方法 41

2.1.4 层次方法 44

2.2 降维 52

2.3 奇异值分解(SVD) 57

2.4 小结 58

第3章 有监督机器学习 59

3.1 模型错误评估 59

3.2 广义线性模型 60

3.2.1 广义线性模型的概率

解释 63

3.2.2 k近邻 63

3.3 朴素贝叶斯 64

3.3.1 多项式朴素贝叶斯 65

3.3.2 高斯朴素贝叶斯 66

3.4 决策树 67

3.5 支持向量机 70

3.6 有监督学习方法的对比 75

3.6.1 回归问题 75

3.6.2 分类问题 80

3.7 隐马尔可夫模型 84

3.8 小结 93

第4章 Web挖掘技术 94

4.1 Web结构挖掘 95

4.1.1 Web爬虫 95

4.1.2 索引器 95

4.1.3 排序—PageRank

算法 96

4.2 Web内容挖掘 97

句法解析 97

4.3 自然语言处理 98

4.4 信息的后处理 108

4.4.1 潜在狄利克雷分配 108

4.4.2 观点挖掘(情感

分析) 113

4.5 小结 117

第5章 推荐系统 118

5.1 效用矩阵 118

5.2 相似度度量方法 120

5.3 协同过滤方法 120

5.3.1 基于记忆的协同

过滤 121

5.3.2 基于模型的协同

过滤 126

5.4 CBF方法 130

5.4.1 商品特征平均得分

方法 131

5.4.2 正则化线性回归

方法 132

5.5 用关联规则学习,构建推荐

系统 133

5.6 对数似然比推荐方法 135

5.7 混合推荐系统 137

5.8 推荐系统评估 139

5.8.1 均方根误差(RMSE)

评估 140

5.8.2 分类效果的度量方法 143

5.9 小结 144

第6章 开始Django之旅 145

6.1 HTTP—GET和POST方法的

基础 145

6.1.1 Django的安装和

服务器的搭建 146

6.1.2 配置 147

6.2 编写应用—Django

最重要的功能 150

6.2.1 model 150

6.2.2 HTML网页背后的

URL和view 151

6.2.3 URL声明和view 154

6.3 管理后台 157

6.3.1 shell接口 158

6.3.2 命令 159

6.3.3 RESTful应用编程

接口(API) 160

6.4 小结 162

第7章 电影推荐系统Web应用 163

7.1 让应用跑起来 163

7.2 model 165

7.3 命令 166

7.4 实现用户的注册、登录和

登出功能 172

7.5 信息检索系统(电影查询) 175

7.6 打分系统 178

7.7 推荐系统 180

7.8 管理界面和API 182

7.9 小结 184

第8章 影评情感分析应用 185

8.1 影评情感分析应用用法

简介 185

8.2 搜索引擎的选取和应用的

代码 187

8.3 Scrapy的配置和情感分析

应用代码 189

8.3.1 Scrapy的设置 190

8.3.2 Scraper 190

8.3.3 Pipeline 193

8.3.4 爬虫 194

8.4 Django model 196

8.5 整合Django和Scrapy 197

8.5.1 命令(情感分析模型和

删除查询结果) 198

8.5.2 情感分析模型加载器 198

8.5.3 删除已执行过的查询 201

8.5.4 影评情感分析器—

Django view和HTML

代码 202

8.6 PageRank:Django view和

算法实现 206

8.7 管理后台和API 210

8.8 小结 212

《机器学习Web应用》[意]爱索尼克【文字版_PDF电子书_下载】

为您推荐

《谢米尔的小潜水艇》内容简介|作者

内容简介 好的幻想小说都是成长小说,它长久不衰的魅力,在于它能帮孩子处理成长过程中必须面对的内心冲突。它是一面镜子,能照出孩子的自我;是孩子们演练内心冲突的一个舞台;是一次孩子们的自我发现之旅。 日本大幻想文学..

《高考英语高分作文字帖》内容简介|作者

内容简介书籍特色 这是一套对英文字母、单词、短语、句子、文章书法练习的字帖,根据习字者的书法水平和英语程度,由浅入深,由易到难,通过循序渐进的练习,帮助习字者快速提高书..

《魏晋唐小楷-中国历代名碑名帖精选》内容简介|作者

内容简介书籍特色 为传承和发扬传统文化,江西美术出版社北京分社推出《中国历代名碑名帖精选》系列图书,让我们从这里抵达华夏文明的深处。  书法艺术是中华文化瑰宝,古人..

《王福庵印谱-全3册》内容简介|作者

《硬笔楷书入门字帖》内容简介|作者

内容简介书籍特色 广大学生和书法爱好者书写汉字,力求规范、端正、整洁,能用钢笔熟练地书写正楷字,逐步提高书写速度,规范书写习惯。随着国家对传统文化越来越重视,写一手好的..

《李文采临王羲之圣教序碑》内容简介|作者

内容简介本书由僧人怀仁集王羲之书而成。怀仁从唐内府所藏王羲之书迹及民间王字遗墨中集《圣教序》, 历时二十四年。前人评价此碑: “天衣无缝, 胜于自运”, “逸少真迹, 咸萃其中”。由于王羲之真迹不存, 此碑是后人..

《李文采临李邕李思训碑》内容简介|作者

内容简介本书精选历代著名碑帖 (自殷商至近代) 影印出版, 纵贯中国书法史, 更加精当合理, 底本注重艺术性与版本价值相结合, 是广大读者学习书法艺术的首选法帖。碑高一丈一尺三寸六分, 宽四尺八寸五分。字共三十行,..