DeepSeek终于能看图了！我第一时间用它算命_模式_视觉_能力

添加时间：2026-05-01 00:35:04 点击量：273

“内容为王”这句话在哪个时代都不会过时。随着消费升级，日益庞大的中国高端群体对高品质的生活方式与旅行体验的需求为高端出境旅游市场带来巨大市场机遇。现今的旅游产品也更向个性化、定制化、品质化靠拢，对内容创新提出更高的要求。内地的旅游内容市场仍有5-10倍的增长空间。最近36氪接触了一家做移动端旅游社区电商的团队——河马旅居指南。

河马旅居定位中等收入人群18-34岁的年轻群体，想通过碎片化的PGC或UGC内容培养用户粘性，由内容社区模式切入出境游市场。传统的旅游内容多是以长图文的游记形式呈现，河马旅居并不刻意强调旅游路线或整个游历过程的感受，在内容呈现上更加碎片化、个性化、移动化以及品质化，以小众或特色地点作为维度输出内容，建立内容社区，类似于旅游界的“小红书”或“什么值得买”。

河马旅居在部分海外旅游城市有一个4到5人的自媒体小团队定期生产PGC内容，每月更新一次内容，以优质的内容导流。目前河马的获客成本低至2-3元/人。

优质的内容利于培养高粘性度的用户，当累计到一定数量的优质内容生产者，达到一定的用户规模时，将由PGC内容带动UGC内容的自发产出，进而开始搭建旅游内容社区，最后完成向旅游社区电商的转型，形成交易闭环。

目前河马旅居的流量较为分散，微信公众号累计粉丝3万，MONO 5万，豆瓣 1万，C端获客主要来自微博、豆瓣，上周刚上线微信小程序。后期需考虑转化用户集中流量，现阶段团队正尝试跟移动WiFi租赁和签证业务团队资源置换，互相增加入口。

商业模式上，河马旅居打算分两步走，第一阶段，先帮助用户解决去哪里玩的问题。河马打算与当地的旅游局或航空公司合作，帮助他们做中国市场的整体营销，宣传当地旅游资源。第二阶段，解决用户怎么玩的问题。平台可通过用户的行为数据分析社区调性从而推荐相应的特色化旅游产品，例如在京都的寺院坐禅、学习茶道、参观日本酒的蒸馏厂等等。

此外，河马旅居也在尝试开拓知识付费的营收渠道。从体验、艺术、咖啡、酒吧、餐厅、酒店等六个维度切入，做成各旅游城市的PDF版官方性质PGC攻略。3月份售出800多本，每本单价15元。

河马旅居创始人余晓盼表示，河马旅居的核心竞争力还是个性化的内容表达。“传统旅游社区把内容做的太死气沉沉了。人美、景美但流水账似的内容很无趣。好的内容本身就是门槛。原创的有趣的才有生命力。”

内容+电商并不是一个新概念，如今传统OTA、头部电商平台以及媒体型电商都在加码内容，但要持续产出有价值的内容并非易事，需要足够规模的内容生产团队长时间的内容积累，而具有极强传播力的爆款内容更是可遇而不可求，营造内容社区所花费的精力也许正是其门槛所在。

河马旅居目前的管理团队为4人，内容产出团队20人。创始人余晓盼任河马主编兼运营，曾任职于私募、资管、律师事务所，为《美食侦探系列》旅行畅销书作者。团队目前正在寻求天使轮融资。

智东西

作者 | 陈骏达

编辑 | 云鹏

智东西4月29日报道，刚刚，DeepSeek的多模态能力已经开启灰度测试。现在，被选中的用户会发现，DeepSeek首页多了一个“识图模式”的入口。上传图片后，DeepSeek能像人一样理解画面，不管是物体还是场景，而不是像过去仅能识别文字。

多位DeepSeek研究员第一时间发文宣传了这一新功能。DeepSeek研究员陈德里称，这一功能来自DeepSeek的“天才多模态同事们”，小鲸鱼现在有了看见世界的能力。

▲DeepSeek多位研究员宣布识图模式的灰度上线（图源：X平台）

我们也有幸被灰度到了，并迅速进行了一波测试。

首先是基本的识物能力，我们上传了一张兔子的照片，识图模式下DeepSeek一眼就判断出兔子的品种，并且可以描述这只兔子的姿态。

我们给DeepSeek上了点难度，上传了一张来自它老家杭州知名景点灵隐寺的照片，图中仅有右下角的路灯上有草书写就的“灵隐寺”字样，不过对人类来说这些字样也有点难懂。我们要求DeepSeek判断这是哪里，并报出图城市的经纬度。

根据建筑风格和路灯上的字样，DeepSeek很快判断出这里是灵隐寺，给出的坐标准确无误。其生成速度也很快，未开启思考模式时，一眨眼的功夫就好了。

我们又上传了一张包含视觉陷阱的图片，这张图中几个物品的摆放很容易让人误以为图中有个人坐在椅子上。

这样的题目同样没能难倒DeepSeek，它判断图中有墙面修补痕迹、垃圾收集区、杂物等等，没有被视觉陷阱蒙骗。

DeepSeek的视觉模式支持深度思考，我们上传了一张随手拍的照片，图中没有任何文字参考，看看DeepSeek能否根据蛛丝马迹判断出位置。

开启推理后，DeepSeek的视觉能力明显增强了。它可以分步骤拆解画面信息，能看到前景、中景、背景的所有信息，然后将地标特征与地理区域匹配，直接判断出山脉是燕山山脉、建筑风格在北京昌平等郊区很常见。

最后它直接把范围收窄到北京昌平区或者海淀山后地区，其中某些猜测选项离我的实际距离已经不到10公里。未来如果接入联网搜索，DeepSeek很可能就顺着网线把我家地址给开盒了。

我们还尝试了热门的看手相玩法，上传后，DeepSeek第一眼先把左右手看错了，我们上传的图片是左手，它判断成了右手。

进入实际分析后，DeepSeek对手相形态的描述基本符合事实，分析得也是头头是道，不过具体该相信多少，这就见仁见智了。

结语：DeepSeek多模态拼图，终于补齐

在过去很长一段时间里，DeepSeek多模态能力的缺失一直是一个遗憾。DeepSeek一直维持着多模态的相关研究，并曾在早期发布开源多模态模型Janus等成果。不过，DeepSeek一直未在其产品中向公众提供多模态能力。

AI走向多模态已经成为不可逆转的大趋势。多模态内容所蕴藏的丰富信息可以扩展AI认知这一世界的触角，也更贴近人类本身理解世界的方式。目前，DeepSeek的识图模式还只是一个测试功能，不过它已经让我们看到了其在视觉解析与跨模态推理上的潜力。返回搜狐，查看更多

上一篇: 2025年现在开发php项目选择lar***el框架好还是thinkphp框架好？

下一篇:有哪些让你目瞪口呆的 Bug ？