我是豆包的重度使用者

我使用豆包的设备,主要是PC端。因为在办公日,主要的时间是在面向一台macbook进行办公。豆包主要满足我需求的是:

  • 知识问答需求方面,基本替换掉了搜索引擎。搜索引擎现在主要被用来找具体的资源页面(URL),比如,某个人的google scholar页面,某篇具体的论文等。对于寻找答案类的搜索query,豆包基本都能给到非常准确的答案。
  • 生成一些文案。比如,一些评语,邮件等。我最近的一封关于苹果开发者账号问题,发给Tim Cook的邮件,就是豆包帮我写的。
  • 翻译文本。
  • 文章/论文解读。
  • 生成代码。基本上是单个的功能文件。对于项目型的正规开发,我更多依赖VS Code上的Github Copilot 插件。
  • 一些文本的格式化。比如,一个excel表内容,转成markdown或是latex格式。

我不太用的一些功能:

  1. 文生图。我个人的需求量小,且用过几次,效果一般。
  2. 打电话。我儿子喜欢给豆包打电话。我用过几次做英语练习,感觉用于增加对话轮次的引导类反问太多,比较压迫,不舒服。

对于豆包要在2026年春晚上亮相,个人感觉是个比较重要的时间节点。春晚上的推广,对于击穿“社会层级”、把一个稍显高端的AI产品,传递到所谓的“下沉市场”,是一个极好的机会。豆包自己做了很好的能力准备,在这次推广后,会彻底成为另一个新的国民级APP。会有大量新增用户,和不错的留存。

关于一些AI硬产品

【Rokid Glasses】

Rokid Glasses在一段时间内的自媒体平台上,热度较高。说是还卖断了货。创始人比较有意思,长相和年龄比较有GAP,创业非常有热情,还到微信来做talk。所以,买了Rokid,还特意定制了内贴的镜片,结论是体验并不太好。原因如下:

  1. 【佩戴不舒适】。智能眼镜首先应该是个眼镜,其次才是智能。这意味着,佩戴起来得舒服。Rokid眼镜的宽度对我这种大脸人士来说,如同受刑。镜体偏重,镜腿表面是光面的,容易下滑,镜框和镜腿易脏(指纹油渍收集器)。过大的黑边框面积,影响视野。这可能和我长期佩戴较为轻盈的无边框眼镜有关。一层屏幕+一层近视镜的原因,感觉影响了透光度。总之,由于佩戴的不舒适感,使它不可能成为我的日常眼镜。
  2. 【无刚需的功能】实时收看微信消息?这会不断和分散个人注意力,佩戴久了,可能会导致一些大脑问题。提词器?一个普通人,一个月又能做几次公开讲话?还是需要备稿和带稿的那种。翻译?最近没出国。一般的翻译需求,在PC端就搞定了。导航?步行或是骑行导航,基本上看一眼就知道路线了,不用实时导航。车载导航就用车上自带的或是手机就好了,画面效果好很多。蓝牙耳机?对于我这种经常听音乐,看短视频的,应该需求还比较强。但佩戴不舒适,又担心漏音,所以不会经常使用。

【Looki L1】

没买,判断下来没必要买。看上去是个具有AI能力的硬件设备,实际上AI能力在云端的算法后台。硬件只是个带存储的摄像头,类似于行车记录仪。个人每天的全量生活场景数据,上传到云端做分析的人,也是心大。无wifi的情况下,上传的流量应该消耗也比较大。借助于现在的VLM进行分析,要几个小时,时间代价较大。这种AI硬件是没有壁垒的,公司能否提供长期的维护能力和有无健全的隐私保护机制,是值得质疑的。

【其他硬件】

短视频平台上刷到过一个用于学英语的AI硬件,外观像个放大镜。拍一个物品,出现其英语单词和解释等。这种功能,有必要再来卖个硬件么?手机上下载个app,开一下摄像头不就ok了?眼看着很多打着AI旗号做创新硬件人,是在把手机中已经集成的功能,又拆出来,讲个垂直功能的故事。确实会有一些目标用户,比如,想让小孩在手机上用一下学英语的能力,又担心被用来打游戏或是刷短视频的家长们,可能买单。但是,我们不会再回到,出门一趟,兜里要装五六个设备的时代了。尤其做面向成年人AI硬件产品的同学,你的设备如果是特别垂直的功能,又和手机能力存在重叠。用户大概率买回来用一段时间,又会回归到手机。

AI时代做产品的指导思想

  1. 所有的AI产品必然会进入到“对话即服务,对话即能力,对话即产品”的阶段。
  2. 产品中的所有的功能是平铺的,意思是无论多么复杂的需求,用户都是通过对话一步到达的,不会再有层级式的产品功能罗列。
  3. 好的产品不会是像以前一样,只取某个场景中极其重要的需求痛点,做效果很好的功能,而是要支持好一个垂直场景中,全量的用户+全量的需求,做到用户通吃、需求通吃,不再区分高频和长尾需求。
  4. 不需要一个产品经理,来苦思冥想,相信做好一个或是某个需求,就能引爆市场。这是错的。之前需要判断需求的重要性和用户的喜好程度,是因为受限于层级式的产品使用界面。注意:这不意味着在项目开发中,所有功能的优化迫切程度是等权重的。
  5. 传统的产品开发思路:“需求调研->功能设计->功能代码增加”是开发不出面向未来的产品的。
  6. 用户愿意把自己每天产生的数据交给谁,谁就赢了。

From Information Technology to Artificial Intelligence

IT行业的工作内容是在不断提高信息流转的效率。如同物流行业,在不断提高物品的流转效率。

  1. 寻找问题答案的效率越来越高。按历史时间轴来看,寻找问题答案的方式进化过程:
    • 找人问。请托,约时间,上门。效率较低。
    • 印刷和书籍普及后。翻书,脱离了对具体的人的依赖。知识开始跨越时空。效率提升。
    • 数字化以后,知识被高效索引。搜索引擎,加快了找相关内容的速度。输入、点击、获得页面、定位知识。
    • AI时代以后。结果即答案,而非网页。能够响应的query也越宽泛。
  2. 信息通道的带宽越来越宽。从文本到图片到短视频,单位时间内,人能接收到的信息量。越来越大。
  3. 全天候的信息触达渠道。归因于终端设备的低成本普及,推荐算法和信息流一类app的出现。我们的大脑、眼睛、耳朵几乎在非睡眠时间,无时无刻不被接入到一个信息通道中。甚至会感觉信息过载的压迫感。
  4. 信息采集/生产方式越来越便捷、越来越高效。从信息采集的角度看一个手机,是:一个记事本、一个录音笔、一个照相机、一个摄像机、一个扫码工具。加之其他的终端,包括行车记录仪、无人机、各类手持拍照设备、智能手表等,都可以便捷的采集和生产数据。
  5. AIGC模型,进一步降低了信息生产成本和放大了信息生产者群体的规模。

“信息爆炸”是1950年代,电视和广播媒体爆发的时代,所提出的概念。信息技术确实导致了信息爆炸。当年的提出者,非常早的意识到了问题,但不会想到在互联网时代、移动互联网时代、AI时代,“信息爆炸”这个现象的规模。

人脑的信息处理能力是有限的,信息过载会导致一系列的生理性问题。

AI生成模型加剧信息内容的规模生产问题,也因为其归纳总结和推理能力,自带了解决“信息爆炸”问题的解决方案。基于AI模型的信息管理、工作管理、生活管理、人生价值管理,成为一种可能或是必然。

AI for Good and AI for Humanity需要高于AI for Productivity。技术要为所有的人的全面自由的发展服务,而非成为出于压迫目的行为的高效工具。所以,要积极思考如技术如何对某个问题进行全局性的改善,而非为少数的人谋取到了更多的利益。