推荐算法测试怎么写(如何评价一个好的推荐系统算法)

1.如何评价一个好的推荐系统算法

我们把推荐当作是一个排名任务,这表示我们主要感兴趣的是一个相对较少的项,我们认为这些项最相关并把它呈现给用户。这就是众所周知的Top-k推荐。

把它和评级预测做比较,如Netflix的竞赛。2007年,Yehuda Koren(此次比赛的一个胜出者)指出,人们对使用RMSE作为一个指标并赞成使用RMSE指标存有疑惑,我们应该使用一个特定的排名指标。

然而,在我们有限的实验中,我们发现RMSE指标并不适用于排名。对我们而言,当调整用户留存率时,用于RMSE的矩阵分解优化表现的相当不错,但当从所有的可用项选择推荐时,却彻底地失败了。

我们认为原因是训练会集中于评分较高的项,同时对于这些项产生一个很好的拟合结果。而对于评分较低的项,在损失影响方面没有太大的意义。结果,对他们的预测会不平衡,使得与实际得分相比,一些得分较高,一些得分较低。最后,靠前的条目将显示在热门推荐一栏中,因而破坏了推荐结果。

换句话说,RMSE指标不能辨别真实的内情,而且我们需要特定的排名指标。

2.推荐算法的主要推荐方法的对比

各种推荐方法都有其各自的优点和缺点,见表1。 表1 主要推荐方法对比 推荐方法优点缺点基于内容推荐推荐结果直观,容易解释;不需要领域知识 新用户问题;复杂属性不好处理;

要有足够数据构造分类器 协同过滤推荐新异兴趣发现、不需要领域知识;随着时间推移性能提高;

推荐个性化、自动化程度高;

能处理复杂的非结构化对象 稀疏问题;可扩展性问题;

新用户问题;

质量取决于历史数据集;

系统开始时推荐质量差; 基于规则推荐能发现新兴趣点;不要领域知识 规则抽取难、耗时;产品名同义性问题;

个性化程度低; 基于效用推荐无冷开始和稀疏问题;对用户偏好变化敏感;

能考虑非产品特性 用户必须输入效用函数;推荐是静态的,灵活性差;

属性重叠问题; 基于知识推荐能把用户需求映射到产品上;能考虑非产品属性 知识难获得;推荐是静态的

3.推荐算法有哪些

推荐算法大致可以分为三类:基于内容的推荐算法、协同过滤推荐算法和基于知识的推荐算法。

基于内容的推荐算法,原理是用户喜欢和自己关注过的Item在内容上类似的Item,比如你看了哈利波特I,基于内容的推荐算法发现哈利波特II-VI,与你以前观看的在内容上面(共有很多关键词)有很大关联性,就把后者推荐给你,这种方法可以避免Item的冷启动问题(冷启动:如果一个Item从没有被关注过,其他推荐算法则很少会去推荐,但是基于内容的推荐算法可以分析Item之间的关系,实现推荐),弊端在于推荐的Item可能会重复,典型的就是新闻推荐,如果你看了一则关于MH370的新闻,很可能推荐的新闻和你浏览过的,内容一致;另外一个弊端则是对于一些多媒体的推荐(比如音乐、电影、图片等)由于很难提内容特征,则很难进行推荐,一种解决方式则是人工给这些Item打标签。 协同过滤算法,原理是用户喜欢那些具有相似兴趣的用户喜欢过的商品,比如你的朋友喜欢电影哈利波特I,那么就会推荐给你,这是最简单的基于用户的协同过滤算法(user-based collaboratIve filtering),还有一种是基于Item的协同过滤算法(item-based collaborative filtering),这两种方法都是将用户的所有数据读入到内存中进行运算的,因此成为Memory-based Collaborative Filtering,另一种则是Model-based collaborative filtering,包括Aspect Model,pLSA,LDA,聚类,SVD,Matrix Factorization等,这种方法训练过程比较长,但是训练完成后,推荐过程比较快。

最后一种方法是基于知识的推荐算法,也有人将这种方法归为基于内容的推荐,这种方法比较典型的是构建领域本体,或者是建立一定的规则,进行推荐。 混合推荐算法,则会融合以上方法,以加权或者串联、并联等方式尽心融合。

当然,推荐系统还包括很多方法,其实机器学习或者数据挖掘里面的方法,很多都可以应用在推荐系统中,比如说LR、GBDT、RF(这三种方法在一些电商推荐里面经常用到),社交网络里面的图结构等,都可以说是推荐方法。

4.推荐算法的组合推荐

由于各种推荐方法都有优缺点,所以在实际中,组合推荐(Hybrid Recommendation)经常被采用。研究和应用最多的是内容推荐和协同过滤推荐的组合。最简单的做法就是分别用基于内容的方法和协同过滤推荐方法去产生一个推荐预测结果,然后用某方法组合其结果。尽管从理论上有很多种推荐组合方法,但在某一具体问题中并不见得都有效,组合推荐一个最重要原则就是通过组合后要能避免或弥补各自推荐技术的弱点。

在组合方式上,有研究人员提出了七种组合思路: 1)加权(Weight):加权多种推荐技术结果。 2)变换(Switch):根据问题背景和实际情况或要求决定变换采用不同的推荐技术。 3)混合(Mixed):同时采用多种推荐技术给出多种推荐结果为用户提供参考。 4)特征组合(Feature combination):组合来自不同推荐数据源的特征被另一种推荐算法所采用。 5)层叠(Cascade):先用一种推荐技术产生一种粗糙的推荐结果,第二种推荐技术在此推荐结果的基础上进一步作出更精确的推荐。 6)特征扩充(Feature augmentation):一种技术产生附加的特征信息嵌入到另一种推荐技术的特征输入中。 7)元级别(Meta-level):用一种推荐方法产生的模型作为另一种推荐方法的输入。

5.今日头条的新闻推荐算法是怎样的呢

今日头条开始逐步引入个性化推荐的策略。他们所采用的,是协同过滤(Collaborative Filtering)** + 基于内容推荐,直到今天依然构成今日头条推荐算法的基础。

(协同过滤)是一个很好的方法,直到今天我们还一直使用。但缺点也很明显,对于没有行为(记录)的文章,没办法推荐,所以没办法用于文章的冷启动。所以我们引入了基于内容推荐的策略。比如计算文章的分类、文章的关键词,然后根据用户对文章的阅读、浏览等信息,细化用户的个人资料。——这样子,如果文章是和科技相关的,而用户的个人资料也显示科技相关,那么就算匹配。”

在之后的工作,是把特征、模型做得更加细化。比如,文章实体词的抽取。我们最近对文章的分析,已经做得很细,可以精确地提取实体词。我们近期引入了‘词嵌入’(word embedding)方法,做向量化的分析,还引入 LDA 的方法,进行 topic 分析等等。

6.如何评价一个好的推荐系统算法 – 我爱机器学习

如何更好地掌握机器学习Colorado是伯克利大学的在读博士,同时也是Metacademy的创始人。

Metacademy是一个优秀的开源平台,许多专业人员共同在这个平台上编写wiki文章。目前,这些文章主要围绕着机器学习和人工智能这两个主题。

在Colorado的建议中,更好地学习机器学习的方法就是不断的通过书本学习。他认为读书的目的就是让心中有书。

一个博士在读生给出这样的建议并不令人惊讶,以前本站可能还推荐过类似的建议。这个建议还可以,但我不认为适用每个人。

如果你是个开发者,想实现机器学习的算法。下面列出的书籍是一个很好的参考,可以从中逐步学习。

机器学习路线图他的关于机器学习的路线图分为5个级别,每个级别都对应一本书必须要掌握的书。这5个级别如下:Level0(新手):阅读《DataSmart:》。

需要了解电子表格、和一些算法的高级数据流。Level1(学徒):阅读《MachineLearningwithR》。

学习在不同的情况下用R语言应用不同的机器学习算法。需要一点点基本的编程、线性代数、微积分和概率论知识。

Level2(熟练工):阅读《》。从数学角度理解机器学习算法的工作原理。

理解并调试机器学习方法的输出结果,同时对机器学习的概念有更深的了解。需要有算法、较好的线性代数、一些向量积分、一些算法实现经验。

Level3(大师):阅读《:》。深入了解一些高级主题,如凸优化、组合优化、概率论、微分几何,及其他数学知识。

深入了解概率图模型,了解何时应该使用以及如何解释其输出结果。Leval4(宗师):随便去学吧,记得反馈社区。

Colorado针对每个级别中列出的书中章节阅读建议,并给出了建议去了解的相关顶级项目。Colorado后来重新发布了一篇博客,其中对这个路线图做了一点修改。

他移除了最后一个级别,并如下定义了新的级别:好奇者、新手、学徒、熟练工、大师。他说道,Level0中的机器学习好奇者不应该阅读相关书籍,而是浏览观看与机器学习有关的顶级视频。

机器学习中被忽视的主题ScottLocklin也阅读了Colorado的那篇博客,并从中受到了启发,写了一篇相应的文章,名为“机器学习中被忽视的想法”(文中有BorisArtzybasheff绘制的精美图片)。Scott认为Colorado给出的建议并没有充分的介绍机器学习领域。

他认为很少有书籍能做到这一点,不过他还是喜欢PeterFlach所著的《MachineLearning:》这本书,因为书中也接触了一些隐晦的技术。Scott列出了书本中过分忽视的内容。

如下所示:实时学习:对流数据和大数据很重要,参见VowpalWabbit。强化学习:在机器人方面有过讨论,但很少在机器学习方面讨论。

“压缩”序列预测技术:压缩数据发现学习模式。参见CompLearn。

面向时间序列的技术。一致性预测:为实时学习精确估计模型。

噪声背景下的机器学习:如NLP和CV。特征工程:机器学习成功的关键。

无监督和半监督学习。这个列表很好的指出了机器学习中没有注意到的领域。

最后要说明的是,我自己也有一份关于机器学习的路线图。与Colorado一样,我的路线图仅限于分类/回归类型的监督机器学习,但还在完善中,需要进一步的调查和添加所有感兴趣的主题。

与前面的“读这些书就可以了”不同,这个路线图将会给出详细的步骤。

7.怎么测试一个算法的性能,用什么软件

这个要从两个维度去考证:

一、测算指标,算法都是有数学理论基础的,在翻译成计算机程序后,算法的执行效率可以用赋值、比较、运算等操作次数,以及缓存、内存占用率等指标进行一定的估算,还应对算法效率进行计算,进行比较评估,包括迭代深度、循环/判断嵌套深度等指标。

二、实际测试,这个就是要把算法真的用计算机实现出来,将算法逻辑封装为函数、控件、组件等,可调用的独立环节(尽量减少非算法语句的干扰),然后进行实际调用,记录执行周期,分析实际性能。比如对比记录新旧算法单次执行的周期、固定数量多次执行的周期、执行期间资源占用率、多线程并发调用的执行效率等指标。

另外、对于实际测试,如果想用专业测试软件执行,可以用LoadRunner、Robot等专业软件测试工具执行相应操作,但是对于您的要求,我还是建议收集性能指标的程序最好自己写,其实并不复杂,就是调用您的算法组件,把执行时间等参数记下来。

推荐算法测试怎么写

转载请注明出处育才学习网 » 推荐算法测试怎么写(如何评价一个好的推荐系统算法)

知识

月考的感悟家长怎么写(月考后家长的感想)

阅读(644)

本文主要为您介绍月考的感悟家长怎么写,内容包括孩子月考的家长感言怎么写,月考后家长的感想,家长的月考评价怎么写啊。你是他们的孩子要给他们树立好榜样胜不骄败不馁,就跟父母总结这段时间付出的努力。如果考得不错,也要分析考得不太好的原

知识

做电话销售总结怎么写(电销工作总结要怎么写)

阅读(396)

本文主要为您介绍做电话销售总结怎么写,内容包括电销工作总结要怎么写,电话销售人员工作总结怎么写,电话销售年终总结怎么写。原发布者:于秀兰电话销售工作总结篇一:电话销售人员试用期工作总结电话销售人员试用期工作总结试用期结束了,为此为

知识

人与自然手抄报怎么写(人与自然手抄报)

阅读(500)

本文主要为您介绍人与自然手抄报怎么写,内容包括人与自然手抄报怎样写,人与自然手抄报,人与自然的手抄报。近代以来,由于科学技术水平的发展,人类认识自然、改造自然的能力大大提高,人类实践的范围不断扩大,使得更多的天然自然转化为人化自然,人

知识

赛教课教案怎么写(如何写好一篇教学设计)

阅读(362)

本文主要为您介绍赛教课教案怎么写,内容包括如何写好一篇教学设计,幼儿园体育活动教案怎么写,怎么写教案,具体包括哪些内容,步骤。按照大赛的要求,每个参赛教师都应提供一篇相关录像课的《课堂教学设计方案))(以下简称方案),作为参赛者最后得分的

知识

免字行草怎么写(不字的草书怎么写)

阅读(0)

本文主要为您介绍免字行草怎么写,内容包括书法行草:兔字怎么写,不字的草书怎么写,硬笔“无”字草书怎么写。名家手迹86款,由于较多请点击链接查看。

知识

草得笔顺怎么写(草的笔顺怎么写的)

阅读(699)

本文主要为您介绍草得笔顺怎么写,内容包括草的笔顺怎么写的,草的笔顺怎么写,草的笔画顺序怎么写。草的笔顺是横, 竖, 竖, 竖, 横折, 横, 横, 横, 竖。草拼音: cǎo 部 首:艹笔 画 :9基本释义:1.高等植物中栽培植物

知识

产品知识演讲稿怎么写(介绍产品销售情况的发言稿怎么写)

阅读(536)

本文主要为您介绍产品知识演讲稿怎么写,内容包括介绍产品销售情况的发言稿怎么写,求一份商品知识的重要性论文或者演讲稿,英语产品介绍演讲稿怎么写。亲爱的伙伴们,大家上午--好!我叫***,是来自营业部的一名普通营销员工,今天能够站在这里,首先

知识

微盘群公告怎么写(简单一些群公告)

阅读(351)

本文主要为您介绍微盘群公告怎么写,内容包括简单一些群公告,谁知道群公告怎么发,群公告怎么搞。长期潜水者请自动退群。本群严厉打击潜水者,本群会按聊天记录定期T些人。(发太多 一样的表情直接定义为刷屏 直接T了..) 2、本群的通用

知识

本科论文建议怎么写(毕业论文怎么写,给个建议)

阅读(400)

本文主要为您介绍本科论文建议怎么写,内容包括毕业论文怎么写,给个建议,对论文的评价与建议应该怎么写,毕业论文指导老师意见怎么写。建议书是指个人、单位或集体向有关单位或上级机关和领导,就某项工作提出某种建议时使用的一种常用书信。

知识

340读作写作怎么写(340字写事作文)

阅读(356)

本文主要为您介绍340读作写作怎么写,内容包括340和340读作,340点340读作怎么写,340和340读作。难忘的一件事人生经历的事情很多很多,有喜有悲,有笑有泪,人生真可谓是多姿多彩。当然,我也不例外。在我的生活中,有一件事使我记忆犹新。记得

知识

出售购买合同怎么写(买卖协议书怎么写)

阅读(374)

本文主要为您介绍出售购买合同怎么写,内容包括买卖协议书怎么写,如何写买卖合同给我范本,买卖合同书怎么写。买卖合同( )购字:_____签订日期:____年__月__日签订地点:_________需方:_____ 代表:______ 电话:_

知识

一百元用英语怎么说(100元用英语怎么说)

阅读(592)

本文主要为您介绍一百元用英语怎么说,内容包括100元用英语怎么说,一百元英语怎么说,100元钱英语怎么说。一百元英语:Onehundredyuan 重点单词解释:hundred英 [hʌndrəd]美 [hʌndrəd]num.一百;许多;1

知识

恒温杯怎么用(恒温器怎么用)

阅读(488)

本文主要为您介绍恒温杯怎么用,内容包括格美纳恒温暖暖杯使用方法是怎么有没有比较专业的说法,恒温杯有什么用啊,55°恒温杯怎么用。干式恒温器使用方法干式恒温器是采用微电脑控制和半导体制冷技术制造的一款恒温金属浴产品,仪器可配置多种

知识

好美啊用英文怎么说(她好美啊)

阅读(379)

本文主要为您介绍好美啊用英文怎么说,内容包括她好美啊用英语怎么翻译,好美的景色啊英语怎么说1好美的景色,哇,好漂亮啊用英语怎么说。How beautiful she is !**********************************************

知识

colourpop高光怎么用(有哪些性价比高的高光和修容推荐)

阅读(361)

本文主要为您介绍colourpop高光怎么用,内容包括colourpop眼影干了怎么办,colourpop土豆泥高光怎么上妆该用刷子还是什么,在colourpop中国官方网站购买的高光质量如何。有一些女孩子的五官比较不好看,因此她们在化妆的时候也会用高光和修容来

知识

最美教师推荐表怎么写(身边最美教师推荐词)

阅读(618)

本文主要为您介绍最美教师推荐表怎么写,内容包括身边最美教师推荐词,优秀教师推荐表怎么填写,最美幼师推荐表中个人简历怎么写。最美的语言赞颂老师 老师,大家都说您培养着祖国的栋梁;我却要说,您就是祖国的栋梁。正是您,支撑起我们一代人的脊

知识

书香家庭自荐表怎么写(书香家庭推荐表怎么写)

阅读(577)

本文主要为您介绍书香家庭自荐表怎么写,内容包括书香家庭推荐表怎么写,书香家庭评选表家长自荐说明怎么写,书香家庭推荐表怎么写。写作思路:首先写自己家里的读书环境和读书氛围。然后介绍自己喜欢读的书,以及读这本书的读后感,最后写书给我们

知识

手游评测怎么写(游戏测试自我评价,自我介绍怎么写)

阅读(398)

本文主要为您介绍手游评测怎么写,内容包括一篇手游评测,应该怎样写,写成什么样,才具有意义,手机游戏评测报告怎么写,怎么写手机游戏的测评报告。自我评价怎么写•1•真实诚恳:实事求是简历的真实性是人事经理一致的要求。在求职者书写“自我

知识

儒雅少年推荐表怎么写(墨香少年推荐表怎么写)

阅读(623)

本文主要为您介绍儒雅少年推荐表怎么写,内容包括儒雅少年的主要事迹怎么写,墨香少年推荐表怎么写,儒雅少年的主要事迹怎么写。直接写出学生平时的阅读习惯,再写出对学生的评语。除了在学校的学习及家庭的影响外,最重要的与其酷爱读书分不开。

知识

推荐表单位意见怎么写(优秀员工推荐表推荐部门意见怎么写)

阅读(630)

本文主要为您介绍推荐表单位意见怎么写,内容包括优秀员工推荐表推荐部门意见怎么写,填写推荐表时单位意见该怎么签,职称评审,单位推荐意见怎么写。优秀员工推荐理由 一:良好的个人形象和素养,专业技能或业务水平优秀,为公司利益不计个人得失,对

[/e:loop]