从LLM到Agent

技术热点从LLM转到了Agent,在发生着什么。

  1. 对于AI的衡量标准,从对话形式的榜单测试,转到了完成现实中具体任务的能力
  2. 除了应用scaling law继续推高单个模型的能力上限以外,单模型迭代求解多模型分工协作的能力提升方式,发挥空间更大。
  3. AI的自主行为能力(自主思考、自主决策、自主发现、反思)等能力,比执行固定工作流的能力更重要。
  4. AI context从对话历史上下文,开始拓展到全环境上下文(多模态、多输入源、多背景知识)。

综上,AI正在从实验和研究领域走向生活和生产领域,解决各种应用问题,创造真正的经济价值。

这给我们的提示:

未来并不会有太多做基模的人和有条件做基模的人。计算资源和数据规模,已经构成了准入门槛。做基模研发的投入产出比在变得越来越低。更多的人需要做:1)基模以后的AI能力提升方式研究。2)AI能力封装成AI应用,解决现实问题。

理解AI技术的意义—定性篇

定性,是通过逻辑思考,构建一个概念框架,把具体的事情,进行抽象和定义后,置于概念框架中的合理位置上。

【新工具论】

AI技术的产生对于人类的宏观意义是:人类又多了一种帮助自己更好的认识世界改造世界的工具。这种新工具相比于其他出现过的工具,因智慧能力的超越性,异常强大。

【AI工具的两种功用:智力加持行动替代

认识世界是一种脑力劳动,主要包括:认知、记忆、思考。AI在认识世界方面,会为我们提供智力加持的作用,可以为扮演“外挂大脑”的角色。这部分AI技术对应的是具有理解、记忆、推理能力的大模型技术。AI在拥有了世界知识以后,可以对接用户所有的信息流入源,帮用户理解、记忆和推理信息,辅助用户进行学习、工作和生活。

帮助人类认识世界,这是未来的一大类AI应用场景。目前的豆包、Gemini属于这一类AI功用范畴。这一类AI功能应用,更重要的是:1)触达到用户数据,越多、越私密,越好。2)具有强大的数据分析和深度思考能力。

改造世界是一种体力劳动,主要包括:理解环境、设定目标、规划策略,执行策略以创造结果。AI在改造世界方面,会为我们提供行动替代的作用。这部分AI技术对应的是具有环境感知和环境交互能力的Agent技术。AI Agent可以接收任务指令,执行策略,完成具体的操作过程,达到任务目标。

帮助人类改造世界,这是未来的另一大类AI应用场景。目前的Manus、手机端的执行助手属于这一类AI功用范畴。这一类功能应用,更重要的是:1)精准且垂直的定义场景。2)agent的自进化能力。3)物联网(IOT)生态的发展。