跳至内容
大模型与智能体

大模型与智能体

大模型与智能体 (LLM & Agents) 是当前 AI 领域最热门的前沿技术线。在实验室中,它既是一个可深入研究的方向,也是辅助日常科研的实用工具——用大模型辅助文献检索、代码编写、数据分析已经成为科研的新常态。

专题页面

两个核心层次

这个方向可以分为两个相互依赖的层次:

大语言模型 (LLM) 是底层的"大脑"。它基于 Transformer 架构,通过在海量文本上预训练学会了语言理解和生成能力。GPT-4、Claude、DeepSeek 等都属于大语言模型。LLM 本身是一个"被动"的工具——你给它输入,它给你输出,但它不会主动做事。

智能体 (Agent) 是上层的"系统"。它以 LLM 为核心推理引擎,加上记忆、工具调用、知识库检索和任务规划等能力,成为一个能自主感知环境、做出决策并执行行动的 AI 系统。智能体把 LLM 从"被动回答问题"升级为"主动完成任务"。

简单来说:LLM 是能力,Agent 是如何使用这种能力来做事。

安全与评估

大模型和智能体系统在实际部署中面临一系列安全与可靠性挑战。幻觉 (Hallucination) 是最突出的问题——模型会看起来很自信地说出完全错误的信息。主要的应对策略包括 RAG(检索增强生成)提供事实依据、多步验证和人类审核。

提示词注入 (Prompt Injection) 是另一个重要安全风险:恶意用户通过精心设计的输入绕过系统指令。此外还有内容过滤(防止输出有害内容)和隐私保护(防止泄露训练数据中的隐私信息)等问题。

方向说明优先级
幻觉检测与缓解识别和减少模型生成的虚假信息⭐⭐⭐⭐
提示词注入防范检测并防御恶意提示词绕过系统指令⭐⭐⭐
内容过滤过滤敏感词、偏见、有害内容⭐⭐⭐
隐私保护防止模型泄露训练数据中的隐私信息⭐⭐⭐

前沿方向

方向说明优先级
多模态大模型统一处理文本、图像、音频、视频(GPT-4o、Gemini)⭐⭐⭐
自主智能体能独立完成复杂长期任务的全自主 AI⭐⭐
具身智能 (Embodied AI)赋予 AI 物理身体,在真实世界中感知和行动

学习路径

大模型基础

了解 Transformer 架构、预训练、微调和推理优化,建立对大模型技术栈的基本认知。

提示词工程

掌握提示词设计技巧——这是投入产出比最高的技能,今天就可以开始在 ChatGPT / Claude 上练习。

RAG 与知识增强

让模型学会"基于外部知识回答",这是目前应用最广的增强手段,也是解决幻觉问题的主流方案。

智能体机制

理解 ReAct 架构、记忆、工具调用和多智能体协作等核心机制。

评估与安全

进入幻觉检测、提示词注入防范和多智能体评估等更深层问题。

不是所有任务都需要智能体
如果任务只是一次性问答或简单分类,直接使用模型更稳定、更经济。只有当任务具有多步性、依赖外部工具或需要长期上下文管理时,智能体机制才真正体现价值。