推荐系统开源软件汇总和评点

原文地址:http://in.sdo.com/=1707

SVDFeature

由上海交大的同学开发,采用C++语言,代码质量很高。去年我们参加KDD竞赛时用过,很好很方便,而且出自咱们国人之手,所以置顶推荐! 项目地址: http://svdfeature.apexlab.org/wiki/Main_Page SVDFeature包含一个很灵活的Matrix Factorization推荐框架,能方便的实现SVD、SVD++等方法, 是单模型推荐算法中精度最高的一种。SVDFeature代码精炼,可以用相对较少的内存实现较大规模的单机版矩阵分解运算。 另外含有Logistic regression的model,可以很方便的用来进行ensemble运算

推荐系统开源软件汇总和评点 CofiRank

C++开发的 Collaborative Filtering算法的开源推荐系统,但似乎2009年后作者就没有更新了, CofiRank依赖boost库,联编会比较麻烦。不是特别推荐 项目地址: http://www.cofirank.org/

EasyRec

Java开发的推荐系统,感觉更像一个完整的推荐产品,包括了数据录入模块、管理模块、推荐挖掘、离线分析等,整个系统比较完备。 项目地址: http://easyrec.org/

推荐系统开源软件汇总和评点 Lenskit

http://lenskit.grouplens.org/ 这个Java开发的开源推荐系统,来自美国的明尼苏达大学,也是推荐领域知名的测试数据集Movielens的作者, 他们的推荐系统团队,在学术圈内的影响力很大,很多新的学术思想会放到这里

推荐系统开源软件汇总和评点 MyMediaLite

http://mymedialite.net/index.html 基于.NET框架的C#开发(也有Java版本),作者基本来自德国、英国等欧洲的一些高校。 除了提供了常见场景的推荐算法,MyMediaLite也有Social Matrix Factorization这样独特的功能 尽管是.Net框架,但也提供了Python、Ruby等脚本语言的调用API MyMediaLite的作者之一Lars Schmidt在2012年KDD会议上专门介绍过他们系统的一些情况,可惜由于.Net开发框架日渐式微,MyMediaLite对Windows NT Server的系统吸引力大些,LAMP网站用得很少

LibFM

项目网址: http://www.libfm.org/ 作者是德国Konstanz University的Steffen Rendle,去年KDD Cup竞赛上我们的老对手,他用LibFM同时玩转Track1和Track2两个子竞赛单元,都取得了很好的成绩,说明LibFM是非常管用的利器(虽然在Track1上被我们打败了,hiahia) 顾名思义,LibFM是专门用于矩阵分解的利器,尤其是其中实现了MCMC(Markov Chain Monte Carlo)优化算法,比常见的SGD(随即梯度下降)优化方法精度要高(当然也会慢一些)

推荐系统开源软件汇总和评点 PREA

全名是 Personalized Recommendation Algorithms Toolkit, 开发语言为Java。也是一个轻量级的开源项目 项目网址: http://mloss.org/software/view/420/ 放在Mloss这个大project下。我个人感觉PREA还是比较简陋的,参加开发的三位工程师Joonseok Lee, Mingxuan Sun, Guy Lebanon更新频率很低,提供的资料也少。 不过Mloss下倒是能找到其他一些推荐开源项目 http://mloss.org/software/tags/collaborative-filtering/

Python-recsys

一个非常轻量级的开源推荐系统,python开发,作者似乎只有一位, Python-recsys主要实现了SVD、Neighborhood SVD推荐算法, 这个项目麻雀虽小五脏俱全,评估数据(Movielens,Last.fm)、评估框架也都有 API也很简单清晰,代码简洁,属于推荐入门的良好教材。 不过真正要用到实际系统中,还是得补充很多内容 github的地址位于 https://github.com/ocelma/python-recsys 项目的介绍见: http://ocelma.net/software/python-recsys/build/html/

RapidMiner

项目网址为: http://rapidminer.com/ Java语言开发,RapidMiner(前身是Yale)已经是一个比较成熟的数据挖掘解决方案了,包括常见的机器学习、NLP、推荐、预测等方法(推荐只占其中很小一部分),而且带有GUI的数据分析环境,数据ETL、预处理、可视化、评估、部署等整套系统都有。  

推荐系统开源软件汇总和评点 Waffles

SF地址: http://waffles.sourceforge.net/ Waffles英文原意是蜂蜜甜饼(见logo),在这里却指代一个非常强大的机器学习的开源工具包,基于C++语言开发。 Waffles里包含的算法特别多,涉及机器学习的方方面面,推荐系统位于其中的Waffles_recommend tool,大概只占整个Waffles的1/10的内容(其它还有分类、聚类、采样、降维、数据可视化、音频处理等许许多多工具包,估计能与之媲美的也就数Weka了) 如有需要可加Q 3439227837

推荐系统开源软件汇总和评点 微信名片 推荐系统开源软件汇总和评点

来源:Together_CZ

声明:本站部分文章及图片转载于互联网,内容版权归原作者所有,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2017年2月21日
下一篇 2017年2月21日

相关推荐