Files
knowledge-base/AI/mem0/04-your-infra.md
hermes-bot 9fd51e7556 refactor: 重构目录结构
- 顶级目录改为 AI/
- 次级目录为具体技术(如 mem0)
- 仓库定位为综合知识库
2026-05-29 16:05:57 +00:00

62 lines
1.7 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# 你的基础设施
## K8s 集群
- **Namespace**: `tei`
- **已有组件**: Qdrant, PostgreSQL, Dify, TEI, BGE-M3
## 服务列表
### TEI (Text Embeddings Inference)
- **服务名**: `tei` (在 tei namespace)
- **模型**: BGE-M3 (BGM-M3)
- **用途**: 生成文本向量embeddings
- **特点**: 中文支持好,比 OpenAI embedder 更适合中文
### Qdrant
- **服务名**: `qdrant`
- **端口**: 6333 (HTTP), 6334 (gRPC)
- **用途**: 向量数据库,存储和搜索向量
- **注意**: Mem0 Server 通过 Qdrant 的 HTTP API 连接
### PostgreSQL
- **服务名**: `postgres`
- **端口**: 5432
- **扩展**: pgvector用于向量支持
- **用途**: 存储用户数据、记忆元数据、关系数据
### Dify
- **服务名**: `dify`
- **用途**: 编排平台,可能提供 LLM 能力
- **注意**: 需确认 Dify 是否作为 LLM Provider 接入 Mem0
### BGE-M3 / BGM-M3
- **模型**: BAAI General Embedding Model - M3
- **部署方式**: 通过 TEI 推理服务
- **特点**: 支持 100+ 语言,中文效果优秀
## 网络架构
```
Mem0 Pod在 tei namespace
├── TEI: http://tei-server:8080
│ └── 模型: BGE-M3
├── Qdrant: http://qdrant:6333
├── PostgreSQL: postgres:5432
└── LLM: 待确认
├── 选项 1: Dify
├── 选项 2: OpenAI 代理
└── 选项 3: Ollama (本地模型)
```
## 待确认事项
1. [ ] TEI 服务的具体地址和端口
2. [ ] Qdrant 是否需要手动创建 collection
3. [ ] PostgreSQL 是否已创建 `mem0` 数据库
4. [ ] Dify 的 LLM API 是否可用
5. [ ] LLM 最终选择Dify / OpenAI 代理 / Ollama