62 lines
1.7 KiB
Markdown
62 lines
1.7 KiB
Markdown
# 你的基础设施
|
||
|
||
## K8s 集群
|
||
|
||
- **Namespace**: `tei`
|
||
- **已有组件**: Qdrant, PostgreSQL, Dify, TEI, BGE-M3
|
||
|
||
## 服务列表
|
||
|
||
### TEI (Text Embeddings Inference)
|
||
- **服务名**: `tei` (在 tei namespace)
|
||
- **模型**: BGE-M3 (BGM-M3)
|
||
- **用途**: 生成文本向量(embeddings)
|
||
- **特点**: 中文支持好,比 OpenAI embedder 更适合中文
|
||
|
||
### Qdrant
|
||
- **服务名**: `qdrant`
|
||
- **端口**: 6333 (HTTP), 6334 (gRPC)
|
||
- **用途**: 向量数据库,存储和搜索向量
|
||
- **注意**: Mem0 Server 通过 Qdrant 的 HTTP API 连接
|
||
|
||
### PostgreSQL
|
||
- **服务名**: `postgres`
|
||
- **端口**: 5432
|
||
- **扩展**: pgvector(用于向量支持)
|
||
- **用途**: 存储用户数据、记忆元数据、关系数据
|
||
|
||
### Dify
|
||
- **服务名**: `dify`
|
||
- **用途**: 编排平台,可能提供 LLM 能力
|
||
- **注意**: 需确认 Dify 是否作为 LLM Provider 接入 Mem0
|
||
|
||
### BGE-M3 / BGM-M3
|
||
- **模型**: BAAI General Embedding Model - M3
|
||
- **部署方式**: 通过 TEI 推理服务
|
||
- **特点**: 支持 100+ 语言,中文效果优秀
|
||
|
||
## 网络架构
|
||
|
||
```
|
||
Mem0 Pod(在 tei namespace)
|
||
│
|
||
├── TEI: http://tei-server:8080
|
||
│ └── 模型: BGE-M3
|
||
│
|
||
├── Qdrant: http://qdrant:6333
|
||
│
|
||
├── PostgreSQL: postgres:5432
|
||
│
|
||
└── LLM: 待确认
|
||
├── 选项 1: Dify
|
||
├── 选项 2: OpenAI 代理
|
||
└── 选项 3: Ollama (本地模型)
|
||
```
|
||
|
||
## 待确认事项
|
||
|
||
1. [ ] TEI 服务的具体地址和端口
|
||
2. [ ] Qdrant 是否需要手动创建 collection
|
||
3. [ ] PostgreSQL 是否已创建 `mem0` 数据库
|
||
4. [ ] Dify 的 LLM API 是否可用
|
||
5. [ ] LLM 最终选择(Dify / OpenAI 代理 / Ollama) |