推特此次开源算法,哪些有效权重/因素详细罗列
X(原Twitter)本次开源算法总结(基于 xai-org/x-algorithm 仓库)
本次开源的仓库(https://github.com/xai-org/x-algorithm)是 X 平台 For You 时间线(推荐饲料)的全新推荐算法,由 xAI 主导开源。核心变化是:彻底放弃了旧版算法中的手工艺特征(hand-engineered features)和各种人工启发式规则(heuristics),转而完全依赖 基于 Grok 模型的 Transformer(Phoenix 组件)进行端到端学习和排名。
算法整体流程:
- 候选来源:In-Network(关注的人,Thunder 来源) + Out-of-Network(全局推荐,Phoenix 检索)。
- 模型直接从用户历史互动序列中学习相关性,预测多种用户行为概率。
- 最终分数通过 加权求和 计算得出,再施加多样性和 OON(Out-of-Network)调整。
- 多层过滤确保内容质量。
关键点:具体数值权重未开源
与 2023 年旧版 Twitter 开源算法(twitter/the-algorithm)不同,本次 没有公开任何硬编码的数值权重或乘数(如旧版的 LikeWeight = 30、RetweetWeight = 100、Real Graph 权重 0.85 等)。官方明确表示:所有相关性由 Grok-based Transformer 直接学习,加权求和中的具体 weight_i 值属于保密部分,未在代码或文档中披露。
有效权重/因素详细罗列(所有实际影响排名的组件)
以下是算法中明确提及的、实际生效的权重、信号和调整因素(来自 README 和核心组件描述)。它们是当前算法中“有效”的部分,按管道阶段分类列出:
1. 核心排名信号:Engagement Probability Predictions(Phoenix Transformer 输出)
模型为每个候选推文预测以下 15 种用户行为概率(这些概率是排名的核心基础):
正面行为(赋予正权重):
- P(favorite) → 点赞(Like)
- P(reply) → 回复
- P(repost) → 转发(Retweet)
- P(quote) → 引用
- P(click) → 点击推文
- P(profile_click) → 点击作者资料
- P(video_view) → 观看视频
- P(photo_expand) → 展开图片
- P(share) → 分享
- P(dwell) → 长时间停留
- P(follow_author) → 关注作者
负面行为(赋予负权重):
- P(not_interested) → 不感兴趣
- P(block_author) → 拉黑作者
- P(mute_author) → 静音作者
- P(report) → 举报
生效方式:这些概率直接决定了推文的“相关性”。正面行为概率越高,分数越高;负面行为概率越高,分数越低。
2. 加权求和(Weighted Scorer)—— 最核心的有效权重
最终分数计算公式:
Final Score = Σ (weight_i × P(action_i))- 正权重:应用于上述 11 种正面行为(具体数值保密)。
- 负权重:应用于 4 种负面行为(具体数值保密,作用是惩罚可能让用户反感的内容)。
- 生效阶段:Phoenix Scorer 之后,直接决定排序基础分数。
- 说明:这是算法中最主要的“权重”部分,但 exact weight 值未公开,被视为商业机密。
3. 作者多样性调整(Author Diversity Scorer)
- 作用:对同一作者的重复出现进行 分数衰减(attenuation),防止饲料被少数账号霸屏。
- 生效阶段:加权求和之后、最终选择之前。
- 有效性:强制提升内容多样性,是当前算法中少数明确的“后处理权重调整”之一(无具体衰减系数公开)。
4. Out-of-Network 调整(OON Scorer)
- 作用:专门针对非关注来源(Out-of-Network)的内容进行 分数调整(可能提升或衰减,以平衡关注内/外内容比例)。
- 生效阶段:评分阶段,与 Weighted Scorer 并行。
- 有效性:确保推荐饲料不完全被关注列表主导(无具体调整公式公开)。
5. 过滤器(Filters)—— 间接影响“有效权重”(二元筛选,非数值权重)
这些不是传统权重,但会直接决定推文是否能进入排名(相当于权重为 0 或 1):
- 预评分过滤(Pre-Scoring Filters):去除重复、太老、自推、已见、被屏蔽作者、付费墙等。
- 后选择过滤(Post-Selection Filters):去除违规、spam、暴力、已删除内容,并对对话线程去重。
- 生效性:任何被过滤掉的推文分数直接归零,无法上饲料。
总体结论
- 本次开源的核心创新:完全 ML 驱动(Grok Transformer),没有旧版那种明确的手工权重(如 Real Graph 概率、Trust & Dignity 分数、Social Proof 等)。
- 真正“有效”的权重:主要是 15 种行为概率的 保密加权求和,加上作者多样性和 OON 调整。
- 没有公开的具体数值:官方只开源了架构、模型结构和概率列表,实际权重值仍保密(社区分析也普遍认为这是“secret”部分)。
- 如果你想对比旧版(2023 年),旧版有大量硬编码权重(如点赞 30 分、转发 100 分等),但本次已全部移除,转为纯模型学习。