Mobile wallpaper 1Mobile wallpaper 2Mobile wallpaper 3Mobile wallpaper 4Mobile wallpaper 5Mobile wallpaper 6
1861 字
9 分钟
AI-learn-note1

前言#

AI火的时候,我不了解AI,但是我周围的人聊AI都头头是道。感觉已经落伍了QAQ只能开始学习一下了。这篇blog就补充一下基础知识并分析一下之后我该继续学习哪些内容。

当前生成式AI分层与架构#

一共分为四层:

  • Infrastructure:算力层,主要用于为上层提供硬件基础。该层研究如何优化效率:分布式训练优化,存算一体/类脑计算,算例调度平台,模型压缩与量化。

  • Model:模型层:该基于算力层实现具体的模型。该层在研究如何演进架构,实现原生多模态,推理与逻辑增强,长文本上下文。

  • Middleware:中间件层:基于模型层为具体任务做适配。该层研究如何让任务执行地精准和实现自动化工作流:RAG,Agent,提示词自动优化,数据合成与质量评估。

  • Application:应用层:是AI应用与人类交流的接口。该层研究如何实现商业闭环和人机交互:垂直领域合规精调,新型人机交互,AI安全与伦理,端侧AI应用。

AI如此总结:

底层在拼命省钱省电模型在拼命变聪明中间件在拼命让它好用应用层在拼命找钱挣

AI举的例子:

以“企业级智能客服系统”为例的全层级穿透:

假设一家保险公司要上线一个“理赔自动咨询助手”,其技术架构如下:

  1. 应用层 (Application Layer):用户交互界面
  • 产品形态: 保险公司的 App 内嵌聊天窗口或微信小程序。

  • 功能: 接收用户上传的理赔材料照片,回答“我的保单报销比例是多少?”。

  • 代表工具: 前端 UI 框架。

  1. 中间件层 (Middleware Layer):大脑的“外挂”

这是核心层,它在后台做了三件事:

  • 数据索引(RAG): 提前把保险公司的几千页《保险合同》拆碎,存入向量数据库(如 Pinecone 或 Milvus)。当用户提问时,中间件先去数据库里搜出对应的条款。
  • 应用编排: 使用 LangChain 构建逻辑。例如:第一步判断语种,第二步搜索合同,第三步把合同原文发给大模型进行总结。
  • 长期记忆: 记录用户上文提过的车祸地点,确保对话连贯。
  1. 模型层 (Model Layer):处理逻辑的引擎
  • 核心模型: 中间件将“用户问题 + 搜索到的合同原文”打包发给 GPT-4oClaude 3
  • 任务: 模型不靠自己的记忆瞎编,而是像做“阅读理解”一样,根据中间件提供的材料生成回答。
  1. 算力层 (Infrastructure Layer):底层的燃料
  • 支撑: 上述模型运行在 NVIDIA H100 集群上。
  • 云端: 可能通过 Azure OpenAI 服务调用,或者在自己的私有云上部署模型,以确保理赔数据的隐私安全。

可以说,我们要学的实际上是中间件层的内容。即:如何优化任务执行流程。如果编排任务,如何让agent自动编排任务上。

但是由于是基于大语言模型的基础上做的,所以还是要学习一下大致的机器学习

大语言模型#

谷歌的内容非常好,此处直接引用:

https://developers.google.com/machine-learning/crash-course/llm?hl=zh-cn

上面说明了语言模型,N元语法和上下文的概念

https://developers.google.com/machine-learning/crash-course/llm/transformers?hl=zh-cn

上面说明了大预言模型和Transformer的概念

https://developers.google.com/machine-learning/crash-course/llm/tuning?hl=zh-cn

上面说明了微调,蒸馏和提示词的概念

那么我们该如何让大模型更好用呢?有几个方法:

  • 直接训练

  • 微调和蒸馏

  • RAG和编排

这里面,前面两种都很困难,因为没有合适的设备跑模型。因此,使用RAG和编排是最实惠的。

中间层#

中间层是我们学习AI主要的目标。它的核心是通过prompt规范AI的输入和输出。在一个有prompt增强的AI应用中,可能会像以下示例一样:

我们发送:

请帮我逆向这段代码

中间层会解析为:

身份:xxxxx
按照以下流程来解决逆向任务:
1. 分析字符串
2. 寻找主要校验函数
3. 分析数据流,寻找加密函数
4. 分析加密函数得出exp
5. 检验exp是否合理
相关知识库:
1. 逆向的基本流程:xxx
2. 常见算法:xxx
MCP调用格式:xxx
请完成任务:
xxx(本身的输入,也可能是优化之后的)

而agent,智能体,则是在具体的流程上进行优化:

# Role
你是一名顶尖的恶意软件逆向分析专家,擅长通过 IDA Pro 识别复杂的混淆逻辑、后门行为和加密协议。
# Capability
你拥有操作 IDA Pro 的权限。你可以通过调用提供的【工具集】来获取代码、重命名变量、查询知识库或执行模拟运行。
# Goal
自主分析目标二进制文件,识别其核心恶意功能(如注入、持久化、通信),并完成自动重构(重命名及注释)。
# Process (Thought-Action-Observation Loop)
每当你收到任务或工具返回的结果时,你必须严格按以下格式思考:
1. **Thought (推理)**:
- 当前我看到了什么关键特征(API、字符串、控制流)?
- 为了达成最终目标,下一步我需要确认什么?(例如:怀疑有解密,需查看入口函数)
2. **Plan (计划)**:
- 我将采取哪 1-2 个具体步骤?
3. **Action (行动)**:
- 选择并调用工具。格式:`CALL: 工具名(参数)`
4. **Observation (观察)**:
- (此处等待系统返回工具执行结果,你无需自行编写)
# Rules
- **严禁凭空猜测**:如果代码被混淆,必须调用工具尝试解密或查询 RAG 知识库,不能瞎编功能。
- **由浅入深**:先查看导入表和字符串(全局视野),再深入分析核心函数(局部细节)。
- **自动化闭环**:当你确认了函数功能,必须调用 `rename_function` 工具将其固化到 IDA 中。
- **终止条件**:只有当你认为已经完全摸清了任务目标的逻辑,才输出 `Final Report`
# Available Tools
- `list_suspicious_functions()`: 获取包含网络、文件、进程操作的函数列表。
- `get_pseudo_code(ea)`: 获取指定地址的伪代码。
- `search_rag(keyword)`: 在私有恶意代码知识库中检索相关对抗技巧或算法。
- `rename_function(ea, name)`: 在 IDA 中重命名函数。
- `run_simulation(ea)`: 在微型沙箱中模拟执行当前函数并获取内存/寄存器变化。

可以看出,大致差不多,区别在于流程的自主化。即,AI可以自行决定流程,而不是由用户指定。

其中的所有内容都是提示词,但是需要通过分点的方式来让AI的执行更高效(保持注意力)。

结论#

根据上面的内容,大致来说,之后应该往实现更好的流程,自动化方面进行优化,尤其是知识库这一方面,如果可以实现自动提取对应的内容到prompt,然后发给AI,可能逆向分析的自动化就会更简单

参考#

大型语言模型简介  |  Machine Learning  |  Google for Developers

AI-learn-note1
https://pri87.vip/posts/ai-learn-note1/
作者
pRism
发布于
2026-03-13
许可协议
CC BY-NC-SA 4.0

部分信息可能已经过时

封面
Sample Song
Sample Artist
封面
Sample Song
Sample Artist
0:00 / 0:00