1.7 KiB
1.7 KiB
你的基础设施
K8s 集群
- Namespace:
tei - 已有组件: Qdrant, PostgreSQL, Dify, TEI, BGE-M3
服务列表
TEI (Text Embeddings Inference)
- 服务名:
tei(在 tei namespace) - 模型: BGE-M3 (BGM-M3)
- 用途: 生成文本向量(embeddings)
- 特点: 中文支持好,比 OpenAI embedder 更适合中文
Qdrant
- 服务名:
qdrant - 端口: 6333 (HTTP), 6334 (gRPC)
- 用途: 向量数据库,存储和搜索向量
- 注意: Mem0 Server 通过 Qdrant 的 HTTP API 连接
PostgreSQL
- 服务名:
postgres - 端口: 5432
- 扩展: pgvector(用于向量支持)
- 用途: 存储用户数据、记忆元数据、关系数据
Dify
- 服务名:
dify - 用途: 编排平台,可能提供 LLM 能力
- 注意: 需确认 Dify 是否作为 LLM Provider 接入 Mem0
BGE-M3 / BGM-M3
- 模型: BAAI General Embedding Model - M3
- 部署方式: 通过 TEI 推理服务
- 特点: 支持 100+ 语言,中文效果优秀
网络架构
Mem0 Pod(在 tei namespace)
│
├── TEI: http://tei-server:8080
│ └── 模型: BGE-M3
│
├── Qdrant: http://qdrant:6333
│
├── PostgreSQL: postgres:5432
│
└── LLM: 待确认
├── 选项 1: Dify
├── 选项 2: OpenAI 代理
└── 选项 3: Ollama (本地模型)
待确认事项
- TEI 服务的具体地址和端口
- Qdrant 是否需要手动创建 collection
- PostgreSQL 是否已创建
mem0数据库 - Dify 的 LLM API 是否可用
- LLM 最终选择(Dify / OpenAI 代理 / Ollama)