互联网大厂推荐算法实战,书中尽显算法之美

迎梦谈文学2024-04-05 09:10:42  101

推荐系统: 几乎所有基于用户浏览量的APP和网站都需要挖掘出用户的兴趣偏好来精准高效的推送数据,因而推荐算法的人才需求量非常大。 应用场景: 新用户冷启动、热门内容推荐、根据业务需求推荐、平衡用户兴趣与推荐多样性等。 推荐算法根据用户信息(年龄、标签)、行为数据(点击、浏览、收藏、评分、评分)等,从数据库中提取用户信息或者对用户行为做埋点,拿到数据后对其特征提取,建模后抽象出—个用户的信息全貌,例如:A喜欢科普类图书,B喜欢小说类图书,C喜欢音乐类图书。特征匹配后会将物料(信息)精准推送到用户端。 这本书是清华大学赵传霖博士写, 10 多年互联网算法从业经验,主要研究方向为推荐系统、个性化搜索。涵盖推荐系统的基础知识、实际应用场景、推荐系统的评估与评测、算法工程师的自我修养、面试 ,涵盖职业生涯中所有知识点,可谓是人手必备的一本宝典,书中尽显算法之美。 开发阶段: 特征工程、核心概念Embedding ,以及推荐算法中的加速器PS,推荐系统的链路。 推荐系统的链路:召回、粗排、精排、重排。从海量物料中“筛选”,以毫秒级过滤出最优的几十个物料呈现在用户面前。 召回:把百万级物料减到千级。从如何定义正样本和负样本、生成Embedding、定义优化目标4个维度,梳理了向量化召回的脉络,分析了Airbnb、FM、双塔、GCN等业界常用召回算法。 粗排:简单模型,进一步减少物料数量,规模不大的这个环节会被放弃。 精排:VIP,提升预测精确度,特征和模型都比较复杂。偏重记忆的FTRL算法、FM模型;兼顾记忆与扩展的Wide & Deep、DeepFM模型;特征的显式交叉与隐式交叉并举的DCN、AutoInt模型。 重排:提升推荐结果的多样性、优化用户体验、提升算法效率,重点介绍基于启发式规则、基于行列式点过程、基于上下文感知的排序学习这3大重排算法。 评测与用户反馈阶段: 根据推荐系统评测指标(覆盖率、满意度、点击率、转化率等)对推荐准确度(精确率、召回率)进行评测。 面试: 适配即将毕业的萌新、混迹职场多年的求职者。从开发到上线、从维护到优化、从自修到面试,无所不包。

转载此文是出于传递更多信息目的。若来源标注错误或侵犯了您的合法权益,请与本站联系,我们将及时更正、删除、谢谢。
https://www.414w.com/read/133751.html
0
最新回复(0)