这个世界会好的

AI 大模型基础

Published on
by
  • avatarVychod

Prompt Engineering 与 Context Engineering

提示工程(PE)基础

核心思想

提示工程是与 AI 沟通的“沟通艺术”。清晰的指令 = 优质的输出

详细教学

  1. 基础结构剖析
    1. 角色:你是一个xx领域的资深专家
    2. 任务:你的任务是xxx
    3. 指令:请按照以下要求/步骤进行xxx
    4. 上下文:相关的背景信息是xxx
    5. 输入数据:这是你需要处理的内容:xxx
    6. 输出格式:请以「md/JSON/列表/报告」格式输出
  2. 黄金法则
    1. 法则一:具体明确
    2. 法则二:提供范例(few-short prompting)
      1. 当任务复杂或格式要求严格的时候。直接给出几个输入输出的例子,模型的模仿能力很强
    3. 法则三:分解步骤(step-by-step)
      1. 对于复杂问题,要求模型“一步步思考”

高级提示技巧

核心思想

利用模型的内在推理能力,解决复杂、创造性或易出错的任务

详细内容

  1. 思维链:通过在提示词中明确加入“让我们一步步思考”或“Think step by step”可以显著提升模型在逻辑推理、数学解题等任务上的准确性
  2. 自我验证与批评:让模型“自我检查”,减少事故性或逻辑性错误
  3. 角色扮演与视角控制:通过赋予模型机器具体的角色,获得深度、专业的输出
  4. 模版化与可复用:为你常用的任务类型(如周报生成、代码评审)涉及固定提示模版,只需填充变量即可

上下文工程(CE)的核心

核心思想

上下文窗口就是模型的“工作记忆区”,是稀缺资源。而CE就是指如何高效、智能地利用好这个区域,输出最相关、最结构化的信息,已得到最佳输出

详细教学

  1. 理解上下文窗口:你提供的提示、历史对话、以及插入的知识文档都共享这个空间
  2. CE 的核心策略
    1. 相关性过滤:将长文档交给模型前,需要进行预处理,只提取与当前问题最相关的段落
    2. 结构化:使用段落、列表、分隔符、键值对等让信息层次更加清晰
    3. 优先级排序:将更重要的指令(比如输出格式)放在开头或者结尾,因为模型对于这些位置的信息更加敏感。这是因为开头和结尾的邻居只有一边,会减少对模型理解的干扰

长上下文管理

核心思想

当文档远超模型单词处理能力的时候,如何实现“大海捞针”,如何实现“整体分析”

详细教学

  1. 如何“大海捞针”:先检索、后注入,而不是把整个长文档都喂进去
  2. 管理技术
    1. 摘要链:对超长文档进行分层摘要(拆块->生成块级摘要->对所有块级摘要二次摘要形成全局摘要->当用户提问的时候,先匹配相关段落块,再将具体块以及全局摘要一起注入上下文)
    2. 映射-归纳
      1. 映射:将长文档切分,让模型对每个部分都进行独立分析(比如:分析每章的情感)
      2. 归纳:将各部分的产出再交给模型进行综合归纳(比如:总结整篇文章的情感脉络)
  3. 实用工具意识:使用 langchain、llamaindex 等框架,其中包含很多文本分割、摘要和检索策略

RAG 和私有知识库的构建与作用

RAG 的核心价值

详细教学

  1. 什么是 RAG - Retrieval-Augmented Generation - 先查找,再回答
    1. 传统模型:依赖训练时的固有知识,容易出现缺乏新知识的问题,产生幻觉(编造信息)
    2. RAG 系统:当用户提问时,从私有知识库中去查找最相关的材料再塞入上下文中
  2. 核心价值三角
    1. 知识实时性:无需重新训练,只需更新知识库,模型就可以获得新知识
    2. 答案准确性:提供出处来源,减少幻觉,答案可信度高
    3. 成本与安全性:无需额外微调,私有知识安全可控

如果大模型是个老教授,那么 RAG 就是图书馆管理员

私有知识库构建三部曲

详细教学

  1. 文档加载与预处理
    1. 来源:PDF、word、ppt、excel、txt、网页、数据库等
    2. 预处理:清洗 - 提取 - 分段
      1. 分段的时候需要注意的是:按语义切分、保留块与块之间的少量重叠(防止完整的句子被截断)
  2. 文本向量化
    1. 计算机看不懂文本,只能看懂数学表示-向量
    2. 使用嵌入模型:embedding 模型等,可以将文本转换为一个固定长度的、高维的向量
    3. 神奇特性:语义相近的文本,在数学空间中的距离(如余弦相似度)也会更近
  3. 存入向量数据库
    1. 向量数据库可以根据一个查询向量,快速找到表中最为相似的 N 个向量

向量数据库与 RAG 工作流

详细教学

  1. 完整的 RAG 工作流(串联所有知识)
    1. 用户提问 - 问题向量化 - 数据库查询 - 组装提示词 - 大模型生成 - 返回答案
  2. 优化与评估
    1. 检索优化:如果检索结果不理想,那么需要考虑分段策略、切换嵌入模型或加入元数据过滤(比如只查询某类文档)
    2. 生成优化:指令设计,强调“不许捏造”、“回答需要有理有据”
    3. 评估指标:相关性、准确性、流畅性