Vibe Coding

大家都在大谈vibe coding的好处,对造成的项目代码架构混乱、长期可维护性差、无法团队协作,是闭口不谈。

大量的vibe coding内容,导致项目的架构是跟着coding agent的思路走的,很难做一些手动的优化。1) 短时间内生成的code量大,导致程序员并无法精确掌握某个具体的部分。手动优化一点东西,可能就影响全局。2)每次要求code agent实现具体的功能。 coding agent会比较短视的给出能运行的功能代码,但是整体项目的架构合理程度是得不到优化的。
Vibe coding出来的repo,随着开发时间的推移,可维护性就越来越低。

Agent极简入门

【核心概念】

Agent:可以自主完成任务目标的智能体。最基本的两个特点:自主性(Autonomous)、目标导向(Goal-Oriented)。Agent是概念,具体的实现内涵是灵活的,目前的主流模式是:LLM/VLM 提供决策能力,Function Calling API提供执行能力/工具(tools)。

System Prompt:设定Agent角色和引导Agent行为的文本。

Context:Agent做决策时,所参考的环境信息,包括对话历史、知识库、工具集,等等。


【参考资料】

  • https://github.com/sarwarbeing-ai/Agentic_Design_Patterns 《Agentic Design Patterns》英文原版
  • https://adp.xindoo.xyz 《Agentic Design Patterns》中文翻译
  • https://arxiv.org/pdf/2601.12538 《Agentic Reasoning for Large Language Models》

从LLM到Agent

技术热点从LLM转到了Agent,在发生着什么。

  1. 对于AI的衡量标准,从对话形式的榜单测试,转到了完成现实中具体任务的能力
  2. 除了应用scaling law继续推高单个模型的能力上限以外,单模型迭代求解多模型分工协作的能力提升方式,发挥空间更大。
  3. AI的自主行为能力(自主思考、自主决策、自主发现、反思)等能力,比执行固定工作流的能力更重要。
  4. AI context从对话历史上下文,开始拓展到全环境上下文(多模态、多输入源、多背景知识)。

综上,AI正在从实验和研究领域走向生活和生产领域,解决各种应用问题,创造真正的经济价值。

这给我们的提示:

未来并不会有太多做基模的人和有条件做基模的人。计算资源和数据规模,已经构成了准入门槛。做基模研发的投入产出比在变得越来越低。更多的人需要做:1)基模以后的AI能力提升方式研究。2)AI能力封装成AI应用,解决现实问题。

理解AI技术的意义—定性篇

定性,是通过逻辑思考,构建一个概念框架,把具体的事情,进行抽象和定义后,置于概念框架中的合理位置上。

【新工具论】

AI技术的产生对于人类的宏观意义是:人类又多了一种帮助自己更好的认识世界改造世界的工具。这种新工具相比于其他出现过的工具,因智慧能力的超越性,异常强大。

【AI工具的两种功用:智力加持行动替代

认识世界是一种脑力劳动,主要包括:认知、记忆、思考。AI在认识世界方面,会为我们提供智力加持的作用,可以为扮演“外挂大脑”的角色。这部分AI技术对应的是具有理解、记忆、推理能力的大模型技术。AI在拥有了世界知识以后,可以对接用户所有的信息流入源,帮用户理解、记忆和推理信息,辅助用户进行学习、工作和生活。

帮助人类认识世界,这是未来的一大类AI应用场景。目前的豆包、Gemini属于这一类AI功用范畴。这一类AI功能应用,更重要的是:1)触达到用户数据,越多、越私密,越好。2)具有强大的数据分析和深度思考能力。

改造世界是一种体力劳动,主要包括:理解环境、设定目标、规划策略,执行策略以创造结果。AI在改造世界方面,会为我们提供行动替代的作用。这部分AI技术对应的是具有环境感知和环境交互能力的Agent技术。AI Agent可以接收任务指令,执行策略,完成具体的操作过程,达到任务目标。

帮助人类改造世界,这是未来的另一大类AI应用场景。目前的Manus、手机端的执行助手属于这一类AI功用范畴。这一类功能应用,更重要的是:1)精准且垂直的定义场景。2)agent的自进化能力。3)物联网(IOT)生态的发展。