博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
第二章 提供推荐
阅读量:4613 次
发布时间:2019-06-09

本文共 596 字,大约阅读时间需要 1 分钟。

一  协作型过滤

二 搜集偏好

使用嵌套的字典表示偏好:

对于规模巨大的数据集而言,使用数据库来存储信息

无论用什么方式来表达偏好,最重要的是,将偏好对应到数字。如:表达人们是否购买过商品,0表示没有买过,1表示买过;对于一个新闻故事的投票网站,-1表示不喜欢,0表示没有投票,1表示喜欢。

三 寻找相近用户

用于确定人们品味方面的相似程度,相似度评价体系(只介绍2种):

1. 欧几里得距离评价

 公式:

函数pow(n,2)用于求平方。上式为点(4.5,1)与点(4,2)之间的距离的倒数。

由于两个人在偏好空间中的距离越近,其兴趣偏好越相似,数值越小。为了对偏好越相似的情况给出越大的值,将函数值加1(避免被0整除),并取其倒数。

2. 皮尔逊相关度评价

 

优势:···在数据不是很规范(normalized)的时候(比如影评者对影片的评价总是相对于平均水平偏离很大时),会倾向于给出更好的结果。

           ···可以修正“夸大分值”的情况,如:两个评论者对不同的电影的评分情况如下图

算法流程:首先找到两位评论者都曾评价过的物品,然后计算两者的评分总和平方和,并求得两者的评分的乘积之和。代码如下:

 

其他的度量方法:

四 为评论者打分

使用相似度量寻找最接近的n个结果(排序)

五 推荐物品

 

转载于:https://www.cnblogs.com/GuoXinxin/p/10209702.html

你可能感兴趣的文章
[周记]8.7~8.16
查看>>
递归定义
查看>>
kindeditor 代码高亮设置
查看>>
互联网产品的商业模式
查看>>
图的邻接表存储
查看>>
2018 leetcode
查看>>
各浏览器对 onbeforeunload 事件的支持与触发条件实现有差异
查看>>
PHP中获取当前页面的完整URL
查看>>
所谓输入掩码技术,即只有数字键起作用
查看>>
Display对象,Displayable对象
查看>>
安装oracle11G,10G时都会出现:注册ocx时出现OLE初始化错误或ocx装载错误对话框
查看>>
数据结构(并查集):COGS 260. [NOI2002] 银河英雄传说
查看>>
生产环境下正则的应用实例(一)
查看>>
在CentOS7命令行模式下安装虚拟机
查看>>
Arduino可穿戴开发入门教程Arduino开发环境介绍
查看>>
Windows平台flex+gcc词法分析实验工具包
查看>>
3.Python基础 序列sequence
查看>>
Chapter 4 Syntax Analysis
查看>>
Java3D实例应用-载入3ds 模型
查看>>
872. Leaf-Similar Trees
查看>>