Files
knowledge-base/AI/mem0/04-your-infra.md
hermes-bot 9fd51e7556 refactor: 重构目录结构
- 顶级目录改为 AI/
- 次级目录为具体技术(如 mem0)
- 仓库定位为综合知识库
2026-05-29 16:05:57 +00:00

1.7 KiB
Raw Blame History

你的基础设施

K8s 集群

  • Namespace: tei
  • 已有组件: Qdrant, PostgreSQL, Dify, TEI, BGE-M3

服务列表

TEI (Text Embeddings Inference)

  • 服务名: tei (在 tei namespace)
  • 模型: BGE-M3 (BGM-M3)
  • 用途: 生成文本向量embeddings
  • 特点: 中文支持好,比 OpenAI embedder 更适合中文

Qdrant

  • 服务名: qdrant
  • 端口: 6333 (HTTP), 6334 (gRPC)
  • 用途: 向量数据库,存储和搜索向量
  • 注意: Mem0 Server 通过 Qdrant 的 HTTP API 连接

PostgreSQL

  • 服务名: postgres
  • 端口: 5432
  • 扩展: pgvector用于向量支持
  • 用途: 存储用户数据、记忆元数据、关系数据

Dify

  • 服务名: dify
  • 用途: 编排平台,可能提供 LLM 能力
  • 注意: 需确认 Dify 是否作为 LLM Provider 接入 Mem0

BGE-M3 / BGM-M3

  • 模型: BAAI General Embedding Model - M3
  • 部署方式: 通过 TEI 推理服务
  • 特点: 支持 100+ 语言,中文效果优秀

网络架构

Mem0 Pod在 tei namespace
    │
    ├── TEI: http://tei-server:8080
    │       └── 模型: BGE-M3
    │
    ├── Qdrant: http://qdrant:6333
    │
    ├── PostgreSQL: postgres:5432
    │
    └── LLM: 待确认
            ├── 选项 1: Dify
            ├── 选项 2: OpenAI 代理
            └── 选项 3: Ollama (本地模型)

待确认事项

  1. TEI 服务的具体地址和端口
  2. Qdrant 是否需要手动创建 collection
  3. PostgreSQL 是否已创建 mem0 数据库
  4. Dify 的 LLM API 是否可用
  5. LLM 最终选择Dify / OpenAI 代理 / Ollama