推荐系统中冷启动环节的设计实现

推荐系统中的冷启动分为物料冷启动和用户冷启动。用户冷启动主要是针对新用户,但有时候也用于低活用户拉活。物料冷启动主要是让优质物料得到快速下发,让模型可以迅速捕获到用户对该物料的关注。本文将详细讲解用户冷启动和物料冷启动。

1、用户冷启动

用户冷启动就是通过物料钩子、注册信息、多域信息、联邦学习等各种技巧去迅速获取用户的兴趣点实现个性化推荐,激发用户的留存。此外针对新用户还需要考虑定期刺激用户兴趣,不断用优质物料去试探用户,甚至做到兴趣的流转和承接,迅速抓住用户的兴趣,提高用户黏性。比如,针对信息流推送业务的用户进行冷启动,当一个新用户点击某条推送物料后,用户会迅速进入信息流的某个业务界面(如图文或者视频界面),这时候,对应的业务界面也要做好对应的承接推荐,继续给用户优质的物料,让用户深入地使用该产品,而不是用户点完一个物料以后就完毕了。因此,对承接页的物料展示位的填充就很讲究了,首先,基于推送的I2I物料肯定是要有的;其次,用户的其他兴趣点物料和高热度物料也要着重考虑。同时,对于相同的用户冷启动“打法”,除了针对新用户,也可以定期针对低活用户进行拉活冷启动。用户流失其实是一个常见的问题,关键还是要分析用户为什么流失的问题,比如用户物料兴趣得不到满足,有违规内容,App的生态运转不良,竞品用其他手段拉走了用户等。通过分析得到问题后,就要针对这部分低活用户进行类似冷启动的“打法”,并且做好一系列的兴趣承接工作让用户重新回到App里面。

2、物料冷启动

物料冷启动主要是针对新入库不久的物料,让其得到迅速下发,从而筛选出好的物料,产生流量的“滚雪球”效应。物料冷启动方法很多,主要包括用户粉丝冷启动、物料基础信息冷启动、物料相似性冷启动和物料进退场机制(具体请阅读《推荐系统全链路设计:原理解读与业务实践》一书)。

现在的主流“打法”是物料进退场机制(也称作爬坡机制)。物料进退场机制主要是为每个物料设置一级级的限制,然后就是设置物料爬坡的限制,之后再根据各个业务情况去设置更进一步的流量筛选条件,直到最后物料流入正常流量库。下图展现了整个冷启动物料到正常物料的流程。

图11-1 冷启动物料到自然流量物料库的转换

冷启动流量需要考虑流量放量的速度和物料、用户的基础特征,相比自然流量的模型,冷启动环节的模型需要忽略反馈数据,如点击、下发、点赞、评论等。

3、PID算法

在流量分发的过程中,肯定不可能一次性爆发式地分发下去,而是间隔式地均匀分发。因为,流量在不同时段的量都是不同的,而且物料肯定不应该被集中式下发,应该在各个时段都有分发。所以,为了合理的分发物料,需要对物料流量进行合理的控制,PID(Proportion Integration Differentiation,比例-积分-微分控制器 )就是流量控制的典型算法。

PID算法分为比例、积分和微分三部分,是控制领域的常见稳定控制算法。具体公式如下:

 其中:

图11-2 PID流程

其实,PID操作类似于对热水器的水进行加热到固定水温。比如要将水温加热到40℃,一开始肯定要迅速升温,但是到35℃的时候就要减缓加温力度,到40℃就不再进行加温,只需要维持即可。怎么合理的将水温加到40℃,并且维持在40℃,就是PID需要做的事情。

PID的核心就是

:控制当前主要误差的系数,

图片

越大,调节的力度越大,越激进; 

图片

越小,调节力度越保守。例如,假设某个物料需要发100条,要发10h,则每小时发10条(记为

图片

)。通过计算当前真实要发的量,

图片

越大,达到预期总发放量的速度越快。

:如果仅仅用比例,假设我们计划发10条,但是只发了4条,这样实际发放和计划发放就存在暂态误差。如果暂态误差拉长就会变为稳态误差,所以,我们再引入一个分量,该分量和误差的积分是正比关系。由于这个积分项会将前面若干次的误差进行累计,所以可以很好地消除稳态误差。该值不宜太大,一般取0.8-2之间。

:一般指t时刻和t-1时刻的误差值,即调节控制中的振荡,通常,微分环节相当于放大了反馈信号中的高频信号。系数取得不好会,就会引起高频震荡。

PID算法在实际的应用中就是模拟线上环境,然后对

图片

进行调参,让整个分发系统达到一个稳定的状态。

下面给出将某个物料在8h内分发100条的PID算法代码。

 实现了以上代码后,绘制时间和物料每小时的下发关系图。

《推荐系统全链路设计:原理解读与业务实践》

唐楠烊 著

一套基于业务场景的个性化精准推荐系统解决方案

推荐系统、NLP技术专家撰写

深度解读多层推荐系统构建和优化的原理和核心技术

内容简介:

这是一本指导中高级从业者高质量落地现代推荐系统,围绕现代推荐系统核心技术展开深度解读的专业工具书,又是一套完整的推荐系统高质量落地解决方案。本书基于推荐算法工程师实际工作场景规划内容,融合了作者在阿里巴巴、58同城等多家大厂做推荐系统设计和优化的经验,是一本方法和实践兼具的好书。

本书不针对零基础从业者,而是以帮助初级算法工程师向中高级进阶为目标。书中从底层剖析推荐系统在实际业务场景中可能出现的各种问题,直指问题的本质,并按照推荐系统工作流程逐一破解。

购买链接:《推荐系统全链路设计:原理解读与业务实践》(唐楠烊)【摘要 书评 试读】- 京东图书

 

本文作者: 唐楠烊 IT阅读排行榜

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/752412.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

SAMformer:通过锐度感知最小化和通道注意力解锁变换器在时间序列预测中的潜力

目录 摘要1. 引言当前方法的局限性变换器的可训练性我们贡献的总结 2. 提出的方法符号说明2.1 问题设置2.2 激励示例命题2.1(最优解的存在性) 2.3 变换器的损失景观现有的解决方案 2.4. SAMformer:集成所有方法 3. 实验3.1 主要收获 摘要 基…

【Linux系统编程】进程控制(创建、退出、等待、替换)

目录 再聊进程创建 进程终止 进程等待 进程程序替换 再聊进程创建 初识进程创建 关于进程创建,这里只会说结论,在上面这篇文章中对进程创建进行了比较详细的阐述,而接下来要介绍的,都是基于上文说过的来展开的 一些较为重要…

98%企业竟存N日漏洞超5年,新漏洞利用攻击时长极速缩短!

专注推动网络与安全融合的全球网络安全领导者 Fortinet(NASDAQ:FTNT),近日发布 FortiGuard Labs(Fortinet全球威胁情报响应与研究团队)《2023 下半年全球威胁态势研究报告》。本次新发布的半年度研究报告&a…

MySQL8 新特性——公用表表达式用法 with t1 as (select * from user)

MySQL8 新特性——公用表表达式用法_mysql ctes-CSDN博客 1.普通公用表表达式 MySQL8 新特性——公用表表达式用法 在MySQL 8.0及更高版本中,引入了公用表表达式(Common Table Expressions,CTEs),它是一种方便且可重…

Echarts地图实现:杭州市困难人数分布【动画滚动播放】

Echarts地图实现:杭州市困难人数分布 实现功能 杭州市地区以及散点图分布结合的形式数据展示动画轮播可进去杭州市下级地区可返回杭州市地图展示 效果预览 实现思路 使用ECharts的地图和散点图功能结合实现地区分布通过动画轮播展示数据变化实现下级地区数据的展…

深度学习论文: VanillaNet: the Power of Minimalism in Deep Learning

深度学习论文: VanillaNet: the Power of Minimalism in Deep Learning VanillaNet: the Power of Minimalism in Deep Learning PDF:https://arxiv.org/pdf/2305.12972 PyTorch: https://github.com/shanglianlm0525/PyTorch-Networks 1 概述 提出的VanillaNet通过简化设计&…

《数字图像处理与机器视觉》案例二(基于边缘检测和数学形态学焊缝图像处理)

一、前言 焊缝是评价焊接质量的重要标志,人工检测方法存在检测标准不统一,检测精度低,焊缝视觉检测技术作为一种重要的质量检测方法,正逐渐在各行各业中崭露头角。把焊缝准确的从焊接工件中准确分割出来是焊缝评价的关键一步&…

API接口示例的设计与实现技巧?如何编写?

API接口示例怎么使用?哪些工具可以生成API接口示例? 一个良好的API接口示例可以显著提升开发效率,改善用户体验,并确保系统的稳定性和可扩展性。AokSend将探讨API接口示例的设计与实现技巧,帮助开发者构建高质量的API…

使用el-amap-info-window遇到的问题

使用的这个库https://github.com/yangyanggu/vue-amap 想要滚动amapInfoWindow里的内容,但不触发地图缩放 默认滚动amapInfoWindow里的内容,会触发地图缩放。看了C站一个大佬的文章解决了。 amapInfoWindow会自动滚动到顶部 我的amapInfoWindow里面用了…

Spring AI 接入OpenAI大模型实现同步和流式对话

接入前准备 第一,准备OpenAI API Key,如果你可以科学上网,可以参照[# 如何获得Open ai key]这篇文章在 OpenAI 官方网站上获取 OpenAI API Key。 第二,如果不能科学上网,我们可以通过一些代理商获取OpenAI API Key&a…

使用gradle上传maven工件到新版maven central仓库central.sonatype.com

本文主要用到的插件是sonatype-uploader, 该插件主要功能是上传依赖文件夹到中央仓库。 该文件夹的生成也十分简单,不用担心。 前言 最近在研究maven插件的时候发现发布的网站发生了变化,使用之前的一些插件没能满足我发布依赖的需求,也可…

Reflexion:通过语言反馈增强的智能体

Reflexion: Language Agents with Verbal Reinforcement Learning Reflexion: language agents with verbal reinforcement learninghttps://proceedings.neurips.cc/paper_files/paper/2023/hash/1b44b878bb782e6954cd888628510e90-Abstract-Conference.html 1.概述 最近,Re…

海豚调度调优 | 如何解决任务被禁用出现的Bug

💡 本系列文章是 DolphinScheduler 由浅入深的教程,涵盖搭建、二开迭代、核心原理解读、运维和管理等一系列内容。适用于想对 DolphinScheduler了解或想要加深理解的读者。 祝开卷有益。 本系列教程基于 DolphinScheduler 2.0.5 做的优化。&#xff…

在 AI 公司入职一个月的体验与感悟

已经在一家 AI 公司入职了一个月,对坐班有些厌恶的我,没想到有一天也会开始通勤打卡。而经历了这一个月的工作,我对坐班的态度有所转变,开始理解这种工作方式对我的意义。是时候分享入职这期间的工作内容与感受。 背景 直入正题…

linux命令基础

1. uname 查看系统信息 2. ls 列出目录下信息 3. pwd 显示当前路径 命令全称(print working directory)打印当前工作目录 4. cd 切换目录 命令全称 (change directory,改变目录) 5. clear 清楚屏幕信息 命令:clear 可以使…

Microsoft Defender防病毒怎么关闭!详细步骤看这里!

Microsoft Defender是Windows系统中的防病毒软件,提供了实时的安全保护功能。但是,在某些情况下,用户想要需要关闭Microsoft Defender,但不知道要怎么操作才能关闭?接下来小编给大家带来详细的关闭步骤介绍。 永久禁用…

高性价比蓝牙耳机有哪些?2024超高性价比蓝牙耳机推荐

在2024移动互联网高速发展的时代,蓝牙耳机已成为我们生活中不可或缺的一部分。走在街头,低头看手机,滑动屏幕选歌,耳边传来清晰的旋律,这一幕已经成为现代生活的标配。但面对市场上琳琅满目的蓝牙耳机品牌和型号&#…

[电子电路学]电路分析基本概念1

第一章 电路分析的基本概念和基本定律 电路模型 反映实际电路部件的主要电磁性质的理想电路元件及其组合,是实际电路电气特性的抽象和近似。 理想电路元件 实际电路器件品种繁多,其电磁特性多元而复杂,分析和计算时非常困难。而理想电路元件…

1978Springboot在线维修预约服务应用系统idea开发mysql数据库web结构java编程计算机网页源码maven项目

一、源码特点 springboot在线维修预约服务应用系统是一套完善的信息系统,结合springboot框架和bootstrap完成本系统,对理解JSP java编程开发语言有帮助系统采用springboot框架(MVC模式开发 ),系统具有完整的源代码和…

只会Vue的我,一入职就让用React,用了这个工具库,我依然高效

由于公司最近项目周期紧张,还有一个项目因为人手不够排不开,时间非常紧张,所以决定招一个人来。这不,经过一段时间紧张的招聘,终于招到了一个前端妹子。妹子也坦白过,自己干了3年,都是使用的Vue…