首页

刁窝乡

穆家镇

桐琴镇

仁风镇

西寨镇

南港区

产品中心

项目施工装饰工程企业网站模板
电话：400-123-4657
传真：+86-123-4567
邮箱：admin@youweb.com
地址：广东省广州市天河区号

公司动态

>> 当前位置：首页 > 新闻动态 > 公司动态

马斯克罕见低头：开源推荐算法，自嘲“很烂”不过未来月更_用户_系统_内容

添加时间：2026-01-21 15:55:02 点击量：273

“内容为王”这句话在哪个时代都不会过时。随着消费升级，日益庞大的中国高端群体对高品质的生活方式与旅行体验的需求为高端出境旅游市场带来巨大市场机遇。现今的旅游产品也更向个性化、定制化、品质化靠拢，对内容创新提出更高的要求。内地的旅游内容市场仍有5-10倍的增长空间。最近36氪接触了一家做移动端旅游社区电商的团队——河马旅居指南。

河马旅居定位中等收入人群18-34岁的年轻群体，想通过碎片化的PGC或UGC内容培养用户粘性，由内容社区模式切入出境游市场。传统的旅游内容多是以长图文的游记形式呈现，河马旅居并不刻意强调旅游路线或整个游历过程的感受，在内容呈现上更加碎片化、个性化、移动化以及品质化，以小众或特色地点作为维度输出内容，建立内容社区，类似于旅游界的“小红书”或“什么值得买”。

河马旅居在部分海外旅游城市有一个4到5人的自媒体小团队定期生产PGC内容，每月更新一次内容，以优质的内容导流。目前河马的获客成本低至2-3元/人。

优质的内容利于培养高粘性度的用户，当累计到一定数量的优质内容生产者，达到一定的用户规模时，将由PGC内容带动UGC内容的自发产出，进而开始搭建旅游内容社区，最后完成向旅游社区电商的转型，形成交易闭环。

目前河马旅居的流量较为分散，微信公众号累计粉丝3万，MONO 5万，豆瓣 1万，C端获客主要来自微博、豆瓣，上周刚上线微信小程序。后期需考虑转化用户集中流量，现阶段团队正尝试跟移动WiFi租赁和签证业务团队资源置换，互相增加入口。

商业模式上，河马旅居打算分两步走，第一阶段，先帮助用户解决去哪里玩的问题。河马打算与当地的旅游局或航空公司合作，帮助他们做中国市场的整体营销，宣传当地旅游资源。第二阶段，解决用户怎么玩的问题。平台可通过用户的行为数据分析社区调性从而推荐相应的特色化旅游产品，例如在京都的寺院坐禅、学习茶道、参观日本酒的蒸馏厂等等。

此外，河马旅居也在尝试开拓知识付费的营收渠道。从体验、艺术、咖啡、酒吧、餐厅、酒店等六个维度切入，做成各旅游城市的PDF版官方性质PGC攻略。3月份售出800多本，每本单价15元。

河马旅居创始人余晓盼表示，河马旅居的核心竞争力还是个性化的内容表达。“传统旅游社区把内容做的太死气沉沉了。人美、景美但流水账似的内容很无趣。好的内容本身就是门槛。原创的有趣的才有生命力。”

内容+电商并不是一个新概念，如今传统OTA、头部电商平台以及媒体型电商都在加码内容，但要持续产出有价值的内容并非易事，需要足够规模的内容生产团队长时间的内容积累，而具有极强传播力的爆款内容更是可遇而不可求，营造内容社区所花费的精力也许正是其门槛所在。

河马旅居目前的管理团队为4人，内容产出团队20人。创始人余晓盼任河马主编兼运营，曾任职于私募、资管、律师事务所，为《美食侦探系列》旅行畅销书作者。团队目前正在寻求天使轮融资。

一水发自凹非寺

量子位 | 公众号 QbitAI

就现在，GitHub已经能完整看到马斯克开源的𝕏推荐算法系统了。

开源文件里明确表示，这是一个几乎完全由AI模型驱动的算法系统。

我们移除了所有人工设计特征和绝大多数启发式规则。

我们移除了所有人工设计特征和绝大多数启发式规则。

消息一出，整个社区立刻沸腾了，最高赞上去就是一顿猛夸：

incredible！没有其他平台能做到如此透明。

incredible！没有其他平台能做到如此透明。

马斯克本人也火速转发了𝕏工程团队原帖，不过一向言辞高调的老马，此番却低调表示：

我们知道这个算法很蠢（dumb），需要大幅改进，但至少您可以实时、透明地看到我们为改进它而努力。

其他社交媒体公司都没有这样做。

我们知道这个算法很蠢（dumb），需要大幅改进，但至少您可以实时、透明地看到我们为改进它而努力。

其他社交媒体公司都没有这样做。

早在2022年收购𝕏（原Twitter）之前，马斯克就多次批评该平台过于封闭。

自收购之后，他也兑现承诺多次公开Twitter核心推荐算法，这一次也算是不忘初心了。

原来纯AI驱动的推荐系统，是这样运作的！

话不多说，咱这就扒一扒整套系统的运作机制。

一句话概括这个系统即为：

基于Grok-1同款Transformer架构打造，能通过学习你的历史互动行为（点赞/回复/转发过什么），来决定给你推荐什么内容。

从用户打开“For You”开始，客户端会向服务器发送一个请求，触发整个算法流程。

展开全文

然后系统会先做一件事——搞清楚你是谁、你最近在干什么、你平时对什么内容有反应。

为实现这一目的，系统会拉取两类用户信息：

行为序列（Action Sequence）：一类代表最直接、最强烈的兴趣信号，比如最近点赞、回复、转发、点进、停留过什么。
属性（Features）：另一类代表长期属性，比如关注列表、声明的兴趣主题、地理位置、使用设备等。

行为序列（Action Sequence）：一类代表最直接、最强烈的兴趣信号，比如最近点赞、回复、转发、点进、停留过什么。

属性（Features）：另一类代表长期属性，比如关注列表、声明的兴趣主题、地理位置、使用设备等。

这一步的目标并不是人工构造特征，而是尽可能真实地构建“实时用户画像”——

以前工程师可能会***设“某些属性很重要”，然后手动编写规则或公式去计算一个“用户兴趣得分”。

但这本质上是工程师的猜想，而非用户真实状态的反映。

于是马斯克的这套算法就决定不做任何预设***设，而是尽可能多地、原始地收集用户最真实的行为反应，然后将这堆数据直接喂给后续的模型，从而让模型自己去从原始数据中学习和发现规律。（即“去人工化”和“端到端”）

而拿到实时用户画像后，系统会接着兵分两路，从整个平台的海量推文中快速筛选出几千条“可能相关”的推文。

一条是通过熟人圈。即从Thunder模块，直接抓取你关注的所有人的最新推文。

另一条是通过外部。利用Phoenix Retrieval这一核心检索模块，抓取那些你可能感兴趣、但来自未关注账号的推文。

以上两类来源不同的信息，会在后续阶段被统一对待。

需要提醒，此时筛选出来的还只是推文ID。

于是系统会通过Hydration模块，补全每条候选推文的信息，包括推文全文、作者详情、图片/***、历史互动数据等，以便后续深度评估。

而且在正式开始计算前，还会进一步通过Filtering模块淘汰那些明显不要的内容，例如：

重复或过期的帖子
用户自己发布的内容
来自拉黑或静音账号的帖子
包含用户屏蔽关键词的内容
已经看过或在当前会话中展示过的帖子

重复或过期的帖子

用户自己发布的内容

来自拉黑或静音账号的帖子

包含用户屏蔽关键词的内容

已经看过或在当前会话中展示过的帖子

记住，这一步只做一件事：回答某条内容“能不能出现，而不是值不值得推荐”。

铺垫到这里，最终剩下来的内容会被逐条送入Phoenix排序模型进行打分。

这个模型是一个基于Transformer的模型，它会同时接收：

用户的行为序列与属性信息
单条候选帖子的内容与作者信息

用户的行为序列与属性信息

单条候选帖子的内容与作者信息

然后模型会预测用户对某条推文执行各种操作的概率，并将各种概率按照预设权重进行加权组合（如点赞类正向行为加分、拉黑类负向行为减分），并形成最终排序分数。

基于此，系统还会进行少量工程层面的调节——

比如控制作者多样性，避免单一账号在信息流中占据过高比例（防止某一大V刷屏）。

这里也需要提醒，为了保证送入的每条帖子都是独立评分的，所以系统还特意设置了“不允许候选帖子相互看见”（推文之间没有交叉注意力机制）。

所有候选帖子按最终得分排序，系统从中选出Top-K条帖子，作为本次请求的推荐结果。

而且在返回客户端之前，系统还会进行最后一轮校验，确保内容符合平台安全规范——

例如，移除任何已删除、被标记为垃圾信息或包含暴力血腥等违规内容的推文。

最终，经历重重筛选后的信息会根据分数高低，依次展示给客户端用户。

总结下来，这套系统能够成功运转的五大关键在于（官方划重点版）：

（1）纯数据驱动，拒绝人工规则。

彻底摒弃人工定义“什么内容算好”的复杂规则，改由AI模型直接从原始用户数据中学习。

（2）***用候选隔离机制，独立评分。

AI模型在给内容打分时，每条内容“看不见”其他候选内容，只能看到用户信息。这确保了每条帖子的分数不会因为同批次其他帖子而变化，分数一致且可高效缓存复用。

（3）哈希嵌入，实现高效检索。

检索和排序都使用多个哈希函数进行向量嵌入查找，提高效率。

（4）预测多元行为，而非单一分数。

AI模型不直接输出一个模糊的“推荐值”，而是对多种用户行为同时预测。

（5）模块化流水线，支撑快速迭代。

整个推荐系统***用模块化设计，各个组件可以独立开发、测试、替换。

“是的，这算法太烂了”

不过，虽然众人对老马开源的姿态表达了赞赏，但奈何这套算法还是有一些“缺陷”。

有网友就在𝕏推荐算法开源后吐槽道：

由于API访问受限且成本高昂，现在屏蔽列表的做法已经很少见了，但以前这种做法非常普遍。

算法必须让较旧的屏蔽列表随着时间推移而逐渐消失，这样这些较旧的屏蔽列表就不会再被恶意利用。

由于API访问受限且成本高昂，现在屏蔽列表的做法已经很少见了，但以前这种做法非常普遍。

算法必须让较旧的屏蔽列表随着时间推移而逐渐消失，这样这些较旧的屏蔽列表就不会再被恶意利用。

言下之意是，算法代码显示“被大量用户屏蔽”是一个强负面信号，会直接导致账号被“降权”，即内容更难获得推荐，但代码中没有明确看到针对“屏蔽”信号的时间衰减机制。

这意味着，历史上的屏蔽记录可能至今仍在影响账号的推荐分数。

此番言论也引得马斯克本人现身评论区吐槽：

是的，这算法太烂了。

是的，这算法太烂了。

但不管怎样，老马想要改变的态度已经明确——

不仅过去开源、现在开源，而且接下来还会持续开源，未来每4周将重复一次开源更新。

开源仓库：

***s://github***/xai-org/x-algorithm

参考链接：返回搜狐，查看更多

上一篇: 能分享一下你写过的rust项目吗？

下一篇:网传广东怀集洪水后赵一鸣超市被哄抢，县***回应相关单位正在核实，若属实哄抢者该承担哪些法律责任？