pRism

Announcement

Welcome to my blog! This is a sample announcement.

Learn More

标签

1861 字

9 分钟

AI-learn-note1

2026-03-13

LLM

编排

/

AI

/

大模型

/

架构

前言#

AI火的时候，我不了解AI，但是我周围的人聊AI都头头是道。感觉已经落伍了QAQ只能开始学习一下了。这篇blog就补充一下基础知识并分析一下之后我该继续学习哪些内容。

当前生成式AI分层与架构#

一共分为四层：

Infrastructure：算力层，主要用于为上层提供硬件基础。该层研究如何优化效率：分布式训练优化，存算一体/类脑计算，算例调度平台，模型压缩与量化。
Model：模型层：该基于算力层实现具体的模型。该层在研究如何演进架构，实现原生多模态，推理与逻辑增强，长文本上下文。
Middleware：中间件层：基于模型层为具体任务做适配。该层研究如何让任务执行地精准和实现自动化工作流：RAG，Agent，提示词自动优化，数据合成与质量评估。
Application：应用层：是AI应用与人类交流的接口。该层研究如何实现商业闭环和人机交互：垂直领域合规精调，新型人机交互，AI安全与伦理，端侧AI应用。

AI如此总结：

底层在拼命省钱省电；模型在拼命变聪明； 中间件在拼命让它好用； 应用层在拼命找钱挣。

AI举的例子：

以“企业级智能客服系统”为例的全层级穿透：

假设一家保险公司要上线一个“理赔自动咨询助手”，其技术架构如下：

应用层 (Application Layer)：用户交互界面

产品形态： 保险公司的 App 内嵌聊天窗口或微信小程序。

功能： 接收用户上传的理赔材料照片，回答“我的保单报销比例是多少？”。

代表工具： 前端 UI 框架。

中间件层 (Middleware Layer)：大脑的“外挂”

这是核心层，它在后台做了三件事：

数据索引（RAG）： 提前把保险公司的几千页《保险合同》拆碎，存入向量数据库（如 Pinecone 或 Milvus）。当用户提问时，中间件先去数据库里搜出对应的条款。

应用编排： 使用 LangChain 构建逻辑。例如：第一步判断语种，第二步搜索合同，第三步把合同原文发给大模型进行总结。

长期记忆： 记录用户上文提过的车祸地点，确保对话连贯。

模型层 (Model Layer)：处理逻辑的引擎

核心模型： 中间件将“用户问题 + 搜索到的合同原文”打包发给 GPT-4o 或 Claude 3。

任务： 模型不靠自己的记忆瞎编，而是像做“阅读理解”一样，根据中间件提供的材料生成回答。

算力层 (Infrastructure Layer)：底层的燃料

支撑： 上述模型运行在 NVIDIA H100 集群上。

云端： 可能通过 Azure OpenAI 服务调用，或者在自己的私有云上部署模型，以确保理赔数据的隐私安全。

可以说，我们要学的实际上是中间件层的内容。即：如何优化任务执行流程。如果编排任务，如何让agent自动编排任务上。

但是由于是基于大语言模型的基础上做的，所以还是要学习一下大致的机器学习

大语言模型#

谷歌的内容非常好，此处直接引用：

https://developers.google.com/machine-learning/crash-course/llm?hl=zh-cn

上面说明了语言模型，N元语法和上下文的概念

https://developers.google.com/machine-learning/crash-course/llm/transformers?hl=zh-cn

上面说明了大预言模型和Transformer的概念

https://developers.google.com/machine-learning/crash-course/llm/tuning?hl=zh-cn

上面说明了微调，蒸馏和提示词的概念

那么我们该如何让大模型更好用呢？有几个方法：

直接训练
微调和蒸馏
RAG和编排

这里面，前面两种都很困难，因为没有合适的设备跑模型。因此，使用RAG和编排是最实惠的。

中间层#

中间层是我们学习AI主要的目标。它的核心是通过prompt规范AI的输入和输出。在一个有prompt增强的AI应用中，可能会像以下示例一样：

我们发送：

1
请帮我逆向这段代码

中间层会解析为：

1
身份：xxxxx
2
按照以下流程来解决逆向任务：
3
1. 分析字符串
4
2. 寻找主要校验函数
5
3. 分析数据流，寻找加密函数
6
4. 分析加密函数得出exp
7
5. 检验exp是否合理
8

9
相关知识库：
10
1. 逆向的基本流程：xxx
11
2. 常见算法：xxx
12

13
MCP调用格式：xxx
14

15
请完成任务：
16
xxx(本身的输入，也可能是优化之后的)

而agent，智能体，则是在具体的流程上进行优化：

1
# Role
2
你是一名顶尖的恶意软件逆向分析专家，擅长通过 IDA Pro 识别复杂的混淆逻辑、后门行为和加密协议。
3

4
# Capability
5
你拥有操作 IDA Pro 的权限。你可以通过调用提供的【工具集】来获取代码、重命名变量、查询知识库或执行模拟运行。
6

7
# Goal
8
自主分析目标二进制文件，识别其核心恶意功能（如注入、持久化、通信），并完成自动重构（重命名及注释）。
9

10
# Process (Thought-Action-Observation Loop)
11
每当你收到任务或工具返回的结果时，你必须严格按以下格式思考：
12

13
1. **Thought (推理)**:
14
   - 当前我看到了什么关键特征（API、字符串、控制流）？
15
   - 为了达成最终目标，下一步我需要确认什么？（例如：怀疑有解密，需查看入口函数）
16
2. **Plan (计划)**:
17
   - 我将采取哪 1-2 个具体步骤？
18
3. **Action (行动)**:
19
   - 选择并调用工具。格式：`CALL: 工具名(参数)`
20
4. **Observation (观察)**:
21
   - (此处等待系统返回工具执行结果，你无需自行编写)
22

23
# Rules
24
- **严禁凭空猜测**：如果代码被混淆，必须调用工具尝试解密或查询 RAG 知识库，不能瞎编功能。
25
- **由浅入深**：先查看导入表和字符串（全局视野），再深入分析核心函数（局部细节）。
26
- **自动化闭环**：当你确认了函数功能，必须调用 `rename_function` 工具将其固化到 IDA 中。
27
- **终止条件**：只有当你认为已经完全摸清了任务目标的逻辑，才输出 `Final Report`。
28

29
# Available Tools
30
- `list_suspicious_functions()`: 获取包含网络、文件、进程操作的函数列表。
31
- `get_pseudo_code(ea)`: 获取指定地址的伪代码。
32
- `search_rag(keyword)`: 在私有恶意代码知识库中检索相关对抗技巧或算法。
33
- `rename_function(ea, name)`: 在 IDA 中重命名函数。
34
- `run_simulation(ea)`: 在微型沙箱中模拟执行当前函数并获取内存/寄存器变化。