什么是“上下文工程”?提示词工程要更新换代了!

你可能刚刚才玩转“提示词工程”(Prompt Engineering),感觉自己像个能与AI神灵沟通的魔法师。然而,正当你为自己能写出一段完美的咒语(Prompt)而沾沾自喜时,一个更强大的新概念已经悄然登场,并被誉为AI领域的下一个风口——它就是“上下文工程”(Context Engineering),又称为“语境工程”。

如果说提示词工程是教AI“听懂人话”,那么语境工程就是给AI装上一个“超级大脑”+“记忆宫殿”+“全能工具箱”,让它在执行任务时,不仅能听懂,还能记得住、会思考、善利用

1. 什么是语境工程?它是怎么从石头里蹦出来的? 

很多人都以为“语境工程”这个词是AI大神卡帕西提出,其实并非如此,它源于2024年6月一场科技圈大佬的“闲聊”。当时Shopify的CEO Tobi Lutke随口提出了这个词,结果被AI大神、前特斯拉AI总监安德烈·卡帕西(Andrej Karpathy)一眼相中并“开光”。

卡帕西给出了一个堪称经典的定义:“语境工程是一门精巧的艺术与科学,其核心在于为(大模型的)下一步操作,恰到好处地填充其上下文窗口(工作内存)。” 

听起来有点绕?我们来翻译一下:

想象一下,大语言模型(LLM)是一位学富五车但记忆只有七秒的天才博士。

  • 提示词工程:就是你如何向这位博士清晰地提一个问题。比如:“请帮我写一首关于猫的诗。”
  • 语境工程:则是在博士回答问题前,塞给他一本完美的“简报”。这本简报里包含了:博士的人设(“你是一位爱猫如命的浪漫诗人”)、你们之前的谈话(“我们昨天聊到你的猫叫咪咪”)、相关的背景知识(“这是咪咪的照片和它最喜欢的玩具”),以及他能使用的工具(“你可以用这个‘修辞手法’工具来润色诗句”)。

简而言之,语境工程就是动态地管理流入AI工作内存的信息流,确保它在每一步都知道“我是谁、我在哪、我要干什么、我有什么能用的”

2. 语境工程的“后厨”里都有什么? 

一个精心设计的“语境”大餐,包含以下几种核心“食材”:

  • 系统指令 (System Prompt):AI的“人设”和“行为准则”,比如“你是一个言简意赅、风趣幽默的AI助手”。这是AI的灵魂。
  • 用户输入 (User Input):您下达的命令,也就是“客户需求”。
  • 记忆 (Memory)
  • 短期记忆:当前的对话历史,确保AI不会聊着聊着就问“我们刚才说到哪了?”。
  • 长期记忆:跨越多次对话的关键信息,比如你的偏好、项目的背景等。这让AI从一个陌生人变成你的专属助理。
  • 检索到的信息 (RAG):通过“检索增强生成”(RAG)技术从外部知识库(如公司内部文档、网页、数据库)中实时调取的信息。这是AI的“外挂知识库”。
  • 可用工具 (Tools):AI可以调用的API或函数,比如发送邮件、查询天气、搜索网络。这是AI的“瑞士军刀”。
  • 工具反馈 (Tool Output):AI使用工具后返回的结果,比如“邮件已发送成功”。
  • 为了管理好这些“食材”,语境工程师需要掌握四大“烹饪技巧”:

    1. 写入 (Writing) – 记好笔记:将重要的中间步骤、计划、用户偏好等信息,从临时的上下文窗口中“拿出来”,存到外部的“草稿本”(Scratchpad)或“记忆库”(Memory)中,防止丢失。
    2. 选择 (Selecting) – 划出重点:当信息太多时,上下文窗口会“爆炸”。这时需要智能地从中挑选出与当前任务最相关的信息。RAG技术是实现“选择”的核心,它能像一个图书管理员,从浩如烟海的资料中,精准地找出你需要的那一页。
    3. 压缩 (Compressing) – 少说废话:将冗长的对话历史、文档内容进行总结和提炼,变成精简的摘要或结构化数据(如JSON),用更少的文字(Tokens)传递最多的信息,为上下文窗口“减负”。
    4. 隔离 (Isolating) – 分工合作:面对复杂任务,与其让一个AI“精神分裂”,不如组建一个“AI梦之队”。每个子智能体(Sub-agent)有自己独立的、更小的上下文窗口,专注于特定任务(如一个负责规划,一个负责执行,一个负责检查),然后将结果汇总。这大大降低了单个AI的“心智负担”,减少了干扰。

    3. 语境工程 vs. 提示词工程:从“单挑”到“团战” 

    这两者的关系,不是替代,而是进化

     

    简单说,提示词工程是你和AI的“二人转”,而语境工程则是你作为总导演,指挥整个AI团队(包括模型、数据、工具)上演一出“大戏”。

    4. 语境工程:AI智能体的“续命良药” 

    为什么现在的很多AI智能体(AI Agent)应用看起来很酷,一用起来却像个“智障”?它们会:

    • 幻觉 (Hallucination):一本正经地胡说八道。
    • 跑偏 (Derailment):执行几步就忘了最初的目标是什么。
    • 中毒 (Poisoning):被上下文里的错误信息误导,导致后续决策全错。
    • 混乱 (Confusion):工具太多,信息太杂,不知道该用哪个,干脆“摆烂”。

    病因往往不在于模型本身不够强大,而在于它的“上下文管理”一塌糊涂。 

    一个没有经过语境工程的AI助手,在被要求“安排会议”时,只会机械地问:“明天几点?”

    而一个经过精心语境工程设计的AI助手,则会:

    1. (选择)检查你的日历。
    2. (选择)回顾你和对方的聊天记录,了解你们的沟通习惯。
    3. (写入/记忆)它记得你周三下午习惯性地要去健身。
    4. (压缩)综合所有信息,最终给出一个“神奇”的回复:“老板,你明天日程已满。不过我看对方周四上午有空,而且你那天上午通常效率最高,我已经草拟了一份会议邀请,需要现在发给他吗?”

    这里的“神奇”,正是语境工程的功劳。它是构建复杂、长期、可靠AI智能体的绝对必需品

    5. 语境工程会成为新趋势吗?(剧透:已经是了) 

    答案是肯定的

    随着企业和开发者从构建简单的聊天机器人转向开发能自动完成复杂工作的AI智能体,语境工程正从一个“锦上添花”的技巧,迅速成为“不可或缺”的核心能力。未来,我们甚至会看到“语境工程师”这样的新岗位出现。

    因为市场终将明白:决定一个AI应用上限的,往往不是你用了多牛的模型,而是你为这个模型设计了多牛的上下文供给系统。 

    6. 如何修炼成“语境大师”? 

    想成为这场技术变革的弄潮儿?这里有一份“修炼秘籍”:

    1. 转变思维:从“提问者”转变为“AI架构师”。不要总想着怎么问问题,而要开始思考如何为AI设计一个高效的信息工作流。
    2. 掌握核心概念:深入理解RAG、状态管理(State Management)、向量数据库等技术,它们是语境工程的基石。
    3. 拥抱核心工具
    • LangChain (特别是LangGraph):把它想象成AI智能体的“流程编排大师”。LangGraph让你能用图的方式设计AI的工作流,完美实现了状态的“写入”和流程的“隔离”。
    • LlamaIndex:这是AI的“数据管家”,专门负责连接、索引和检索你的私有数据,是实现RAG和“选择”策略的利器。
    1. 从实践中学习
    • 阅读源码:去GitHub上研究优秀的开源AI智能体项目,看看它们是如何管理上下文的。
    • 动手搭建:尝试构建一个小项目,比如“一个能记住你所有阅读偏好的读书推荐AI”,在实践中体会四大策略的威力。
    • 关注社区:关注像davidkimai/Context-Engineering这样的GitHub仓库,里面汇集了大量的学习资源、论文和最佳实践。

    总而言之,如果说大语言模型是强大的“引擎”,那么语境工程就是为这台引擎设计的燃油系统、冷却系统和导航系统。它将AI从一个只会“鹦鹉学舌”的廉价演示,转变为一个真正能为你解决问题的“神奇”产品。这门艺术与科学,正在定义下一代AI应用的真正高度。现在,就从理解它开始吧!



    留下评论