ML.NET 示例:推荐之矩阵分解

 

写在前面

准备近期将微软的machinelearning-samples翻译成中文,水平有限,如有错漏,请大家多多指正。
如果有朋友对此感兴趣,可以加入我:https://github.com/feiyun0112/machinelearning-samples.zh-cn

电影推荐 - 矩阵分解示例

ML.NET 版本 API 类型 状态 应用程序类型 数据类型 场景 机器学习任务 算法
v0.7 动态 API 最新版本 控制台应用程序 .csv 文件 推荐 矩阵分解 MatrixFactorizationTrainer

在这个示例中,您可以看到如何使用ML.NET来构建电影推荐引擎。

问题

在本教程中,我们将使用MovieLens数据集,其中包含电影评分,标题,流派等信息。在构建我们的电影推荐引擎的方法方面,我们将使用分解机,它使用协同过滤方法。

“协同过滤”是在一个基本假设的情况下运作的,即如果某人A在一个问题上与某人B具有相同的意见,则在另一个问题上,相对其他随机选择的人,A更倾向于B的观点。

使用ML.NET,我们支持以下三种推荐场景,根据您的场景,您可以从下面的列表中选择三种场景之一。

场景 算法 示例链接
你有用户购买行为中的用户Id、产品Id和评分。 矩阵分解 当前示例
你仅有用户购买行为中用户Id和产品Id,但是没有评分。 这在来自在线商店的数据集中很常见,您可能只能访问客户的购买历史记录。 有了这种类型的推荐,你可以建立一个推荐引擎用来推荐经常购买的物品。 One Class 矩阵分解 产品推荐器
您希望在您的推荐引擎中使用用户Id、产品Id和评分之外的更多属性(特征),例如产品描述,产品价格等。 场感知分解机 基于分解机的电影推荐器

数据集

原始数据来自MovieLens数据集:
http://files.grouplens.org/datasets/movielens/ml-latest-small.zip

ML 任务 - 矩阵分解(推荐)

这个示例的ML任务是矩阵分解,它是一个执行协同过滤的有监督的机器学习任务。

解决方案

要解决此问题,您需要在现有训练数据上建立和训练ML模型,评估其有多好(分析获得的指标),最后您可以使用/测试模型来预测给定输入数据变量的需求。

建立 -> 训练 -> 评估 -> 使用

1. 建立模型

建立模型包括:

  • 定义映射到数据集的数据模式,并使用DataReader读取(recommended-ratings-train.csvrecommended-ratings-test.csv

  • 矩阵分解需要对userId,movieId这两个特征进行编码

  • 然后MatrixFactorizationTrainer将这两个已编码特征(userId, movieId)作为输入

下面是用于建立模型的代码:

   var mlcontext = new MLContext();   var reader = mlcontext.Data.TextReader(new TextLoader.Arguments()             {                 Separator = ",",                 HasHeader = true,                 Column = new[]                 {                     new TextLoader.Column("userId", DataKind.R4, 0),                     new TextLoader.Column("movieId", DataKind.R4, 1),                     new TextLoader.Column("Label", DataKind.R4, 2)                 }             });   IDataView trainingDataView = reader.Read(new MultiFileSource(TrainingDataLocation));   var pipeline = mlcontext.Transforms.Categorical.MapValueToKey("userId", "userIdEncoded")                                    .Append(mlcontext.Transforms.Categorical.MapValueToKey(

                    
                
50000+
5万行代码练就真实本领
17年
创办于2008年老牌培训机构
1000+
合作企业
98%
就业率

联系我们

电话咨询

0532-85025005

扫码添加微信