《推荐系统实践》内容简介|作者

内容简介

随着信息技术和互联网的发展,人们逐渐从信息匮乏的时代走入了信息过载(information overload)的时代 。在这个时代,无论是信息消费者还是信息生产者都遇到了很大的挑战:对于信息消费者,从大量信息中找到自己感兴趣的信息是一件非常困难的事情;对于信息生产者,让自己生产的信息脱颖而出,受到广大用户的关注,也是一件非常困难的事情。推荐系统就是解决这一矛盾的重要工具。推荐系统的任务就是联系用户和信息,一方面帮助用户发现对自己有价值的信息,另一方面让信息能够展现在对它感兴趣的用户面前,从而实现信息消费者和信息生产者的双赢。

作者简介:

项亮,毕业于中国科学技术大学和中国科学院自动化所,研究方向为机器学习和推荐系统,现任职于北京Hulu软件技术开发有限公司,从事视频推荐的研究和开发。2009年参加Netflix Prize推荐系统比赛获得团体第二名,且于当年发起创建了Resys China推 荐系统社区。

目 录:

第1章 好的推荐系统 1

1.1 什么是推荐系统 1

1.2 个性化推荐系统的应用 4

1.2.1 电子商务 4

1.2.2 电影和视频网站 8

1.2.3 个性化音乐网络电台 10

1.2.4 社交网络 12

1.2.5 个性化阅读 15

1.2.6 基于位置的服务 16

1.2.7 个性化邮件 17

1.2.8 个性化广告 18

1.3 推荐系统评测 19

1.3.1 推荐系统实验方法 20

1.3.2 评测指标 23

1.3.3 评测维度 34

第2章 利用用户行为数据 35

2.1 用户行为数据简介 36

2.2 用户行为分析 39

2.2.1 用户活跃度和物品流行度的分布 39

2.2.2 用户活跃度和物品流行度的关系 41

2.3 实验设计和算法评测 41

2.3.1 数据集 42

2.3.2 实验设计 42

2.3.3 评测指标 42

2.4 基于邻域的算法 44

2.4.1 基于用户的协同过滤算法 44

2.4.2 基于物品的协同过滤算法 51

2.4.3 UserCF和ItemCF的综合比较 59

2.5 隐语义模型 64

2.5.1 基础算法 64

2.5.2 基于LFM的实际系统的例子 70

2.5.3 LFM和基于邻域的方法的比较 72

2.6 基于图的模型 73

2.6.1 用户行为数据的二分图表示 73

2.6.2 基于图的推荐算法 73

第3章 推荐系统冷启动问题 78

3.1 冷启动问题简介 78

3.2 利用用户注册信息 79

3.3 选择合适的物品启动用户的兴趣 85

3.4 利用物品的内容信息 89

3.5 发挥专家的作用 94

第4章 利用用户标签数据 96

4.1 UGC标签系统的代表应用 97

4.1.1 Delicious 97

4.1.2 CiteULike 98

4.1.3 Last.fm 98

4.1.4 豆瓣 99

4.1.5 Hulu 99

4.2 标签系统中的推荐问题 100

4.2.1 用户为什么进行标注 100

4.2.2 用户如何打标签 101

4.2.3 用户打什么样的标签 102

4.3 基于标签的推荐系统 103

4.3.1 实验设置 104

4.3.2 一个最简单的算法 105

4.3.3 算法的改进 107

4.3.4 基于图的推荐算法 110

4.3.5 基于标签的推荐解释 112

4.4 给用户推荐标签 115

4.4.1 为什么要给用户推荐标签 115

4.4.2 如何给用户推荐标签 115

4.4.3 实验设置 116

4.4.4 基于图的标签推荐算法 119

4.5 扩展阅读 119

第5章 利用上下文信息 121

5.1 时间上下文信息 122

5.1.1 时间效应简介 122

5.1.2 时间效应举例 123

5.1.3 系统时间特性的分析 125

5.1.4 推荐系统的实时性 127

5.1.5 推荐算法的时间多样性 128

5.1.6 时间上下文推荐算法 130

5.1.7 时间段图模型 134

5.1.8 离线实验 136

5.2 地点上下文信息 139

5.3 扩展阅读 143

第6章 利用社交网络数据 144

6.1 获取社交网络数据的途径 144

6.1.1 电子邮件 145

6.1.2 用户注册信息 146

6.1.3 用户的位置数据 146

6.1.4 论坛和讨论组 146

6.1.5 即时聊天工具 147

6.1.6 社交网站 147

6.2 社交网络数据简介 148社交网络数据中的长尾分布 149

6.3 基于社交网络的推荐 150

6.3.1 基于邻域的社会化推荐算法 151

6.3.2 基于图的社会化推荐算法 152

6.3.3 实际系统中的社会化推荐算法 153

6.3.4 社会化推荐系统和协同过滤推荐系统 155

6.3.5 信息流推荐 156

6.4 给用户推荐好友 159

6.4.1 基于内容的匹配 161

6.4.2 基于共同兴趣的好友推荐 161

6.4.3 基于社交网络图的好友推荐 161

6.4.4 基于用户调查的好友推荐算法对比 164

6.5 扩展阅读 165

第7章 推荐系统实例 166

7.1 外围架构 166

7.2 推荐系统架构 167

7.3 推荐引擎的架构 171

7.3.1 生成用户特征向量 172

7.3.2 特征?物品相关推荐 173

7.3.3 过滤模块 174

7.3.4 排名模块 174

7.4 扩展阅读 178

第8章 评分预测问题 179

8.1 离线实验方法 180

8.2 评分预测算法 180

8.2.1 平均值 180

8.2.2 基于邻域的方法 184

8.2.3 隐语义模型与矩阵分解模型 186

8.2.4 加入时间信息 192

8.2.5 模型融合 193

8.2.6 Netflix Prize的相关实验结果 195

后记 196

《推荐系统实践》项亮【文字版_PDF电子书_下载】

为您推荐

《谢米尔的小潜水艇》内容简介|作者

内容简介 好的幻想小说都是成长小说,它长久不衰的魅力,在于它能帮孩子处理成长过程中必须面对的内心冲突。它是一面镜子,能照出孩子的自我;是孩子们演练内心冲突的一个舞台;是一次孩子们的自我发现之旅。 日本大幻想文学..

《高考英语高分作文字帖》内容简介|作者

内容简介书籍特色 这是一套对英文字母、单词、短语、句子、文章书法练习的字帖,根据习字者的书法水平和英语程度,由浅入深,由易到难,通过循序渐进的练习,帮助习字者快速提高书..

《魏晋唐小楷-中国历代名碑名帖精选》内容简介|作者

内容简介书籍特色 为传承和发扬传统文化,江西美术出版社北京分社推出《中国历代名碑名帖精选》系列图书,让我们从这里抵达华夏文明的深处。  书法艺术是中华文化瑰宝,古人..

《王福庵印谱-全3册》内容简介|作者

《硬笔楷书入门字帖》内容简介|作者

内容简介书籍特色 广大学生和书法爱好者书写汉字,力求规范、端正、整洁,能用钢笔熟练地书写正楷字,逐步提高书写速度,规范书写习惯。随着国家对传统文化越来越重视,写一手好的..

《李文采临王羲之圣教序碑》内容简介|作者

内容简介本书由僧人怀仁集王羲之书而成。怀仁从唐内府所藏王羲之书迹及民间王字遗墨中集《圣教序》, 历时二十四年。前人评价此碑: “天衣无缝, 胜于自运”, “逸少真迹, 咸萃其中”。由于王羲之真迹不存, 此碑是后人..

《李文采临李邕李思训碑》内容简介|作者

内容简介本书精选历代著名碑帖 (自殷商至近代) 影印出版, 纵贯中国书法史, 更加精当合理, 底本注重艺术性与版本价值相结合, 是广大读者学习书法艺术的首选法帖。碑高一丈一尺三寸六分, 宽四尺八寸五分。字共三十行,..