获课:xingkeit.top/5922/
DIEN:深度兴趣演化网络,如何抓住用户兴趣的时间脉搏
在电商推荐的战场上,用户的兴趣从来不是一张静态照片,而是一部不断翻页的电影。上周还在疯狂浏览运动鞋,这周可能已经沉浸在咖啡机的测评里——这种"兴趣漂移"现象,恰恰是传统模型最大的盲区。阿里妈妈2019年发表于AAAI的DIEN(Deep Interest Evolution Network),正是为解决这个问题而生。
从DIN到DIEN:不只是多了一个Evolution
DIN用注意力机制解决了"哪些历史行为与当前广告相关"的问题,但它把用户行为直接等同于兴趣,且忽略了行为之间的时序依赖。DIEN的核心突破在于:用户的行为是兴趣的结果,而非兴趣本身。你点击一双鞋,背后是对运动的热爱;而这份热爱,可能正在随季节悄然消退。
兴趣抽取层:用GRU挖出行为背后的"潜台词"
DIEN的第一层创新是引入GRU对行为序列建模。相比LSTM,GRU参数更少、收敛更快,更适合电商海量数据。但问题随之而来:GRU的隐状态经过多步迭代后,很难学到有意义的兴趣表征,尤其在长序列中梯度传播乏力。
DIEN的解法极为巧妙——引入辅助损失(Auxiliary Loss)。用下一时刻的真实点击行为作为正样本,从非点击项中随机采样作为负样本,让每个时刻的隐状态都能直接接受监督。这相当于给序列中的每一步都装上了导航灯,既缓解了长序列梯度消失问题,又让Embedding层学到更丰富的语义信息。
兴趣演化层:AUGRU让注意力住进GRU的"大脑"
兴趣抽取层解决了"兴趣是什么",演化层则回答"兴趣怎么变"。用户兴趣存在两个关键特性:一是兴趣漂移,同一段时间内兴趣高度集中;二是兴趣独立,买书和买衣服的演化轨迹互不干扰。
DIEN设计了AUGRU(Attention Update Gate GRU),将注意力得分融入GRU的更新门中。与候选广告越相关的历史兴趣,其注意力权重越大,更新门开得越宽,信息在序列中传递越顺畅;不相关的兴趣则被抑制。论文对比了三种融合方式:AIGRU把注意力作用于输入,但即使输入为零仍会影响隐状态;AGRU直接用注意力替代更新门,丢失了维度差异信息;AUGRU让注意力缩放原有更新门,兼顾灵活性与表达力,效果最优。
实战成效:点击率提升超20%
DIEN已部署于淘宝展示广告系统,离线实验中CTR预估AUC显著优于DIN、GRU等基线模型,线上A/B测试点击率提升约20.7%。在淘宝"猜你喜欢"和飞猪旅行推荐等场景中,DIEN的兴趣演化建模能力让推荐更加"懂你"——不仅知道你喜欢什么,更知道你的喜欢正在走向哪里。
DIEN的本质,是用序列建模的深度替用户说出了那句他自己都没意识到的话:我已经变了。
本站不存储任何实质资源,该帖为网盘用户发布的网盘链接介绍帖,本文内所有链接指向的云盘网盘资源,其版权归版权方所有!其实际管理权为帖子发布者所有,本站无法操作相关资源。如您认为本站任何介绍帖侵犯了您的合法版权,请发送邮件
[email protected] 进行投诉,我们将在确认本文链接指向的资源存在侵权后,立即删除相关介绍帖子!
暂无评论