【核心概念】
Agent:可以自主完成任务目标的智能体。最基本的两个特点:自主性(Autonomous)、目标导向(Goal-Oriented)。Agent是概念,具体的实现内涵是灵活的,目前的主流模式是:LLM/VLM 提供决策能力,Function Calling API提供执行能力/工具(tools)。
System Prompt:设定Agent角色和引导Agent行为的文本。
Context:Agent做决策时,所参考的环境信息,包括对话历史、知识库、工具集,等等。
【参考资料】
【核心概念】
Agent:可以自主完成任务目标的智能体。最基本的两个特点:自主性(Autonomous)、目标导向(Goal-Oriented)。Agent是概念,具体的实现内涵是灵活的,目前的主流模式是:LLM/VLM 提供决策能力,Function Calling API提供执行能力/工具(tools)。
System Prompt:设定Agent角色和引导Agent行为的文本。
Context:Agent做决策时,所参考的环境信息,包括对话历史、知识库、工具集,等等。
【参考资料】
两国在进行全领域博弈。更核心的主题是:高科技领域争霸。因为,“科学技术是第一生产力”。
子领域:
在AI方面,黄仁勋提出的5层竞争模型:

对我们的启示:
国内政策会大力扶植每一层中的龙头企业,以加强AI全局的竞争能力。这个过程会有泡沫,但是正向的泡沫。
国内也会期望出现类似于马斯克、黄仁勋、Altman等人的新一批高新技术产业的企业家人群,来替换掉早一代的企业家人群。
技术热点从LLM转到了Agent,在发生着什么。
综上,AI正在从实验和研究领域走向生活和生产领域,解决各种应用问题,创造真正的经济价值。
这给我们的提示:
未来并不会有太多做基模的人和有条件做基模的人。计算资源和数据规模,已经构成了准入门槛。做基模研发的投入产出比在变得越来越低。更多的人需要做:1)基模以后的AI能力提升方式研究。2)AI能力封装成AI应用,解决现实问题。
宋飏
姚顺宇
Geoffrey Hinton
李飞飞
马斯克
统计物理的学习会培养人的系统思维。
很多人焦虑的原因,并不是自己的生活状态绝对不好,而是不如别人好。应当对自己生活状态做理性客观的评估。
正循环的范式:
行动->得到正面激励—>行动的动力增强—>更积极的行动—>得到更多的正面激励—>…..
负循环的范式:
行动->得到负面激励/未得到激励—>行动的动力削弱—>更消极的行动—>更得不到激励—>…..
【具体的例子】
个体的知识和成长方面:
个体的知识落后—>出于自我保护的封闭—>知识输入面窄—>没有进步继续落后—>….
人际关系方面:
不熟—>沟通少—>误会和猜忌—>进一步疏远—>更不熟—>…..
理财方面:
交易失败—>交易心态崩溃—>交易动作变形—>交易进一步失败—>….
【策略】
上面的循环,是一阶马尔科夫链。当进入到一种负循环时,有两种破局之法:1)清零,重新出发。2)更改其中一环的结果。
定性,是通过逻辑思考,构建一个概念框架,把具体的事情,进行抽象和定义后,置于概念框架中的合理位置上。
【新工具论】
AI技术的产生对于人类的宏观意义是:人类又多了一种帮助自己更好的认识世界和改造世界的工具。这种新工具相比于其他出现过的工具,因智慧能力的超越性,异常强大。
【AI工具的两种功用:智力加持 和 行动替代】
认识世界是一种脑力劳动,主要包括:认知、记忆、思考。AI在认识世界方面,会为我们提供智力加持的作用,可以为扮演“外挂大脑”的角色。这部分AI技术对应的是具有理解、记忆、推理能力的大模型技术。AI在拥有了世界知识以后,可以对接用户所有的信息流入源,帮用户理解、记忆和推理信息,辅助用户进行学习、工作和生活。
帮助人类认识世界,这是未来的一大类AI应用场景。目前的豆包、Gemini属于这一类AI功用范畴。这一类AI功能应用,更重要的是:1)触达到用户数据,越多、越私密,越好。2)具有强大的数据分析和深度思考能力。
改造世界是一种体力劳动,主要包括:理解环境、设定目标、规划策略,执行策略以创造结果。AI在改造世界方面,会为我们提供行动替代的作用。这部分AI技术对应的是具有环境感知和环境交互能力的Agent技术。AI Agent可以接收任务指令,执行策略,完成具体的操作过程,达到任务目标。
帮助人类改造世界,这是未来的另一大类AI应用场景。目前的Manus、手机端的执行助手属于这一类AI功用范畴。这一类功能应用,更重要的是:1)精准且垂直的定义场景。2)agent的自进化能力。3)物联网(IOT)生态的发展。
長渕剛,歌手音乐风格,有点像伍佰。简单直接,情感真挚。《トンボ/蜻蛉》,《乾杯》。
学习问题是估计$P_{\theta}(World)$。
推理/应用问题是使用$P_{\theta}(World)$进行生成/反馈/推演。
突闻一位之前熟悉的AI创业者骤然离世。和师兄确认消息后,倍感震惊和遗憾。
虽然直接打交道,并没有几次,但同在一个NLP小圈子,间接的人际关系也不少,也去过创业公司的办公地址参观。
人还很年轻,很有理想。一个在深度学习早期改变NLP解决范式的时候,就积极拥抱深度学习的先驱。给实验室的师兄们提供了早期的深度学习实习机会,这也后来影响了我们这些师弟师妹们的择业路径。一个在创业圈,坚持了好多年的前辈。
悲伤,遗憾。
快跨年了,大家都在规划休假,总结和展望,却有人永远停留在了2025年。你所不在乎的今天,是他人奢求不到的明天。真的是人生无常。去者当怀思,生者当勉励,且行且珍惜。
我使用豆包的设备,主要是PC端。因为在办公日,主要的时间是在面向一台macbook进行办公。豆包主要满足我需求的是:
我不太用的一些功能:
对于豆包要在2026年春晚上亮相,个人感觉是个比较重要的时间节点。春晚上的推广,对于击穿“社会层级”、把一个稍显高端的AI产品,传递到所谓的“下沉市场”,是一个极好的机会。豆包自己做了很好的能力准备,在这次推广后,会彻底成为另一个新的国民级APP。会有大量新增用户,和不错的留存。
【Rokid Glasses】
Rokid Glasses在一段时间内的自媒体平台上,热度较高。说是还卖断了货。创始人比较有意思,长相和年龄比较有GAP,创业非常有热情,还到微信来做talk。所以,买了Rokid,还特意定制了内贴的镜片,结论是体验并不太好。原因如下:
【Looki L1】
没买,判断下来没必要买。看上去是个具有AI能力的硬件设备,实际上AI能力在云端的算法后台。硬件只是个带存储的摄像头,类似于行车记录仪。个人每天的全量生活场景数据,上传到云端做分析的人,也是心大。无wifi的情况下,上传的流量应该消耗也比较大。借助于现在的VLM进行分析,要几个小时,时间代价较大。这种AI硬件是没有壁垒的,公司能否提供长期的维护能力和有无健全的隐私保护机制,是值得质疑的。
【其他硬件】
短视频平台上刷到过一个用于学英语的AI硬件,外观像个放大镜。拍一个物品,出现其英语单词和解释等。这种功能,有必要再来卖个硬件么?手机上下载个app,开一下摄像头不就ok了?眼看着很多打着AI旗号做创新硬件人,是在把手机中已经集成的功能,又拆出来,讲个垂直功能的故事。确实会有一些目标用户,比如,想让小孩在手机上用一下学英语的能力,又担心被用来打游戏或是刷短视频的家长们,可能买单。但是,我们不会再回到,出门一趟,兜里要装五六个设备的时代了。尤其做面向成年人AI硬件产品的同学,你的设备如果是特别垂直的功能,又和手机能力存在重叠。用户大概率买回来用一段时间,又会回归到手机。