Amazon Personalize推出了支持更大商品目录和更低延迟的新配方 机器学习博客

Amazon Personalize 发布新版本,支持更大商品目录和更低延迟

由 Jingwen Hu、Abhishek Mangal、Tianmin Liu、Dan Foley、Hao Ding、Pranesh Anubhav、Rishabh Agrawal 和 Yifei Ma 于 2024 年 5 月 2 日发布在 Amazon Personalize 上,属于 公告 和 人工智能 类别的文章。 Permalink

关键要点

新推出的 UserPersonalizationv2 和 PersonalizedRankingv2 配方,支持高达 500 万个商品和 30 亿条用户互动数据。延迟降低,可大幅提升用户的响应体验。推荐效果优化,推荐准确率提高约 9,覆盖率提升至 18 倍。自动化操作增强,减轻用户在模型训练和调优过程中的负担。

个性化的客户体验在当今用户互动中显得尤为重要。不过,提供真正能够适应用户行为变化的个性化体验可能会十分复杂且耗时。通过 Amazon Personalize,您可以轻松地为您的网站、应用和电子邮件实现个性化,利用亚马逊使用的相同机器学习ML技术,而无需具备 ML 专业知识。结合 Amazon Personalize 提供的 配方,您可以提供丰富的个性化体验,包括产品或内容推荐以及个性化排名。

今天,我们很高兴地宣布,UserPersonalizationv2 和 PersonalizedRankingv2 这两种先进配方现已全面发布,它们基于最先进的 变换器 架构,支持更大的商品目录和更低的延迟。

在本文中,我们将总结这些新增强功能,并指导您如何训练模型和为用户提供推荐。

Amazon Personalize推出了支持更大商品目录和更低延迟的新配方 机器学习博客

新配方的好处

新配方在可扩展性、延迟、模型性能和功能方面都有显著提升:

功能描述增强的可扩展性新配方支持最多 500 万个商品目录和 30 亿条用户互动数据,使大型目录和平台支持个性化成为可能。延迟降低新配方的推断延迟更低、训练速度更快,可以减少最终用户的响应延迟。性能优化Amazon Personalize 的测试显示,v2 配方与之前版本相比,推荐准确度提高了最高 9,推荐覆盖率提高了 18 倍。返回商品元数据新配方默认启用商品元数据,无需额外费用,能够在推断响应中返回如类型、描述和可用性等元数据,帮助丰富用户界面中的推荐。高自动化运作新配方旨在降低模型训练和调优的负担,Amazon Personalize 简化了训练配置,并自动选择最佳的自定义模型设置。

解决方案概述

使用 UserPersonalizationv2 和 PersonalizedRankingv2 配方的第一步是设置 Amazon Personalize 资源。您需要创建数据集组、导入数据、训练解决方案版本以及部署活动。有关完整说明,请参考 入门指南。

本帖子采用 Amazon Personalize 控制台方法来部署活动。也可以通过 SDK 方法构建整个解决方案,并使用异步批处理流获取批量推荐。我们将使用 MovieLens 公共数据集 和 UserPersonalizationv2 配方来展示工作流程。

准备数据集

请按照以下步骤准备您的数据集:

创建数据集组。每个数据集组可以包含最多三个数据集:用户、商品和交互,其中交互数据集是 UserPersonalizationv2 和 PersonalizedRankingv2 的必需项。使用 模式 创建一个交互数据集。将交互数据导入 Amazon Personalize从 Amazon 简单存储服务 导入数据。

训练模型

数据集导入作业完成后,您可以在训练之前分析数据。Amazon Personalize 数据分析会显示有关数据的统计信息以及满足培训要求和提升推荐的可能操作。

接下来您准备训练模型了:

在 Amazon Personalize 控制台,选择导航面板的 数据集组。选择您的数据集组。选择 创建解决方案。在 解决方案名称 中输入您的解决方案名称。在 解决方案类型 中选择 商品推荐。在 配方 中选择新版本 awsuserpersonalizationv2 配方。在 训练配置 部分,将 自动训练 切换为 开启,以定期保持模型的有效性。

在 超参数配置 中选择 应用最近使用的偏见。

选择 创建解决方案。

如果您启用了自动训练,Amazon Personalize 会自动创建您的第一个解决方案版本。解决方案版本是指训练好的机器学习模型。当为解决方案创建解决方案版本时,Amazon Personalize 会基于配方和训练配置训练模型,创建解决方案版本可能需要最多 1 小时。

飞兔加速器官网ios在导航面板上,选择 自定义资源 中的 活动。选择 创建活动。

活动将一个解决方案版本训练后的模型部署,以生成实时推荐。使用v2 配方训练的解决方案创建的活动默认包括商品元数据在推荐结果中,您可以在推断调用时选择元数据列。

提供活动详细信息并创建活动。

获取推荐

创建或更新活动后,您可以获取推荐的商品列表,用户更有可能与其互动,列表会按相关性从高到低排序。

选择活动并 查看详细信息。在 测试活动结果 部分,输入用户 ID,然后选择 获取推荐。

下表显示了用户的推荐结果,包括推荐商品、相关性得分和商品元数据标题和类型。

您的 UserPersonalizationv2 活动现在可以集成到您的网站或应用中,为每位客户个性化他们的旅程。

清理

确保清理在执行本文步骤时您在账户中创建的所有未使用资源。您可以通过 Amazon Personalize 控制台或使用 Python SDK 删除活动、数据集和数据集组。

结论

新的 Amazon Personalize UserPersonalizationv2 和 PersonalizedRankingv2 配方将个性化提升到新的高度,支持更大的商品目录,降低延迟并优化性能。有关 Amazon Personalize 的更多信息,请参阅 Amazon Personalize 开发者指南。

关于作者

Jingwen Hu 是 AWS AI/ML 的高级技术产品经理,负责 Amazon Personalize 团队。闲暇时喜欢旅行和品尝当地美食。

Daniel Foley 是 Amazon Personalize 的高级产品经理,专注于构建利用人工智能解决客户最大挑战的应用。在工作之外,他是一名狂热的滑雪者和徒步旅行者。

Pranesh Anubhav 是 Amazon Personalize 的高级软件工程师,热衷于设计大规模的机器学习系统为客户服务。工作之余,他喜欢踢足球并关注皇家马德里。

Tianmin Liu 是 Amazon Personalize 的高级软件工程师,专注于利用各种机器学习算法开发大规模的推荐系统。闲暇时间喜欢打游戏、看运动和弹钢琴。

Abhishek Mangal 是 Amazon Personalize 的软件工程师,开发大规模推荐系统,专注于利用各种机器学习算法。闲暇时间喜欢看动漫,认为《海贼王》是最近历史上最伟大的故事作品。

Yifei Ma 是 AWS AI Labs 的高级应用科学家,专注于推荐系统,研究兴趣包括主动学习、生成模型、时间序列分析及在线决策。工作之余是航空爱好者。

Hao Ding 是 AWS AI Labs 的高级应用科学家,推动 Amazon Personalize 的推荐系统进展,研究方向涉及推荐基础模型、贝叶斯深度学习、大型语言模型及其在推荐中的应用。

Rishabh Agrawal 是 AWS AI 服务的高级软件工程师,闲暇时喜欢徒步旅行、旅行和阅读。