人工智能

从LLM到Agent

posted on 2026年1月12日2026年1月12日

技术热点从LLM转到了Agent，在发生着什么。

对于AI的衡量标准，从对话形式的榜单测试，转到了完成现实中具体任务的能力。
除了应用scaling law继续推高单个模型的能力上限以外，单模型迭代求解和多模型分工协作的能力提升方式，发挥空间更大。
AI的自主行为能力（自主思考、自主决策、自主发现、反思）等能力，比执行固定工作流的能力更重要。
AI context从对话历史上下文，开始拓展到全环境上下文（多模态、多输入源、多背景知识）。

综上，AI正在从实验和研究领域走向生活和生产领域，解决各种应用问题，创造真正的经济价值。

这给我们的提示：

未来并不会有太多做基模的人和有条件做基模的人。计算资源和数据规模，已经构成了准入门槛。做基模研发的投入产出比在变得越来越低。更多的人需要做：1）基模以后的AI能力提升方式研究。2）AI能力封装成AI应用，解决现实问题。

理解AI技术的意义—定性篇

posted on 2026年1月7日2026年1月7日

定性，是通过逻辑思考，构建一个概念框架，把具体的事情，进行抽象和定义后，置于概念框架中的合理位置上。

【新工具论】

AI技术的产生对于人类的宏观意义是：人类又多了一种帮助自己更好的认识世界和改造世界的工具。这种新工具相比于其他出现过的工具，因智慧能力的超越性，异常强大。

【AI工具的两种功用：智力加持 和 行动替代】

认识世界是一种脑力劳动，主要包括：认知、记忆、思考。AI在认识世界方面，会为我们提供智力加持的作用，可以为扮演“外挂大脑”的角色。这部分AI技术对应的是具有理解、记忆、推理能力的大模型技术。AI在拥有了世界知识以后，可以对接用户所有的信息流入源，帮用户理解、记忆和推理信息，辅助用户进行学习、工作和生活。

帮助人类认识世界，这是未来的一大类AI应用场景。目前的豆包、Gemini属于这一类AI功用范畴。这一类AI功能应用，更重要的是：1）触达到用户数据，越多、越私密，越好。2）具有强大的数据分析和深度思考能力。

改造世界是一种体力劳动，主要包括：理解环境、设定目标、规划策略，执行策略以创造结果。AI在改造世界方面，会为我们提供行动替代的作用。这部分AI技术对应的是具有环境感知和环境交互能力的Agent技术。AI Agent可以接收任务指令，执行策略，完成具体的操作过程，达到任务目标。

帮助人类改造世界，这是未来的另一大类AI应用场景。目前的Manus、手机端的执行助手属于这一类AI功用范畴。这一类功能应用，更重要的是：1）精准且垂直的定义场景。2）agent的自进化能力。3）物联网（IOT）生态的发展。

世界模型

posted on 2025年12月31日2025年12月31日

学习问题是估计$P_{\theta}(World)$。

推理/应用问题是使用$P_{\theta}(World)$进行生成/反馈/推演。