Embedding 向量模型配置

本页面用于设置知识库检索的核心向量生成服务，即把法律文档中的文字自动转换为计算机可理解的数字向量，从而支撑精准的语义搜索（例如：输入‘证据提交时限’能智能匹配到‘举证期限规定’等相似内容）。该配置直接影响RAG（检索增强生成）功能的效果，是个人知识库、案件卷宗智能检索与AI文书建议能力的基础。当前支持两种服务方式：本地部署的Ollama（适合内网安全环境）和阿里云百炼（适合云端快速接入）。配置生效后，系统将自动对新上传的文档进行向量化处理，并用于后续案件办理中的智能辅助。

Embedding 向量模型配置

操作步骤

在‘选择 Embedding 供应商’下拉框中，点击右侧箭头，选择您希望使用的服务商（如‘阿里云百炼’或‘Ollama’）
根据所选服务商填写对应字段：若选‘阿里云百炼’，请在‘模型名称’栏填写具体模型名（如 text-embedding-v2），并在‘DashScope API Key’栏粘贴您的阿里云API密钥；若选‘Ollama’，请填写‘模型名称’（如 qllama/bge-large-zh-v1.5:latest）、‘API 基础地址’（如 http://10.126.126.5:11434），API Key可留空
填写完成后，点击下方黄色按钮‘测试阿里云百炼 API 连接’（或‘测试 Ollama 连接’），确认提示‘连接成功’后再点击右下角蓝色‘保存’按钮提交配置

注意事项

⚠️重要提醒：此配置与‘个人知识库’‘卷宗生命周期管理’及‘AI文书建议’模块强关联——一旦知识库已完成向量化（即已有文档被转为向量存入RAG向量库），切勿随意更换服务商或模型版本，否则将导致语义搜索结果错乱；此时必须进入‘系统管理 > RAG向量库管理’手动执行‘重置向量库’操作，重新处理全部文档才能恢复正常使用。此外，该配置变更不会影响已归档案件的原始文档内容，仅影响后续新增/更新文档的智能检索效果。

页面路径：http://127.0.0.1:18000/management/page/embedding_configuration_management/