Embedding 向量模型配置
本页面用于设置知识库检索的核心向量生成服务,即把法律文档中的文字自动转换为计算机可理解的数字向量,从而支撑精准的语义搜索(例如:输入‘证据提交时限’能智能匹配到‘举证期限规定’等相似内容)。该配置直接影响RAG(检索增强生成)功能的效果,是个人知识库、案件卷宗智能检索与AI文书建议能力的基础。当前支持两种服务方式:本地部署的Ollama(适合内网安全环境)和阿里云百炼(适合云端快速接入)。配置生效后,系统将自动对新上传的文档进行向量化处理,并用于后续案件办理中的智能辅助。

操作步骤
- 在‘选择 Embedding 供应商’下拉框中,点击右侧箭头,选择您希望使用的服务商(如‘阿里云百炼’或‘Ollama’)
- 根据所选服务商填写对应字段:若选‘阿里云百炼’,请在‘模型名称’栏填写具体模型名(如 text-embedding-v2),并在‘DashScope API Key’栏粘贴您的阿里云API密钥;若选‘Ollama’,请填写‘模型名称’(如 qllama/bge-large-zh-v1.5:latest)、‘API 基础地址’(如 http://10.126.126.5:11434),API Key可留空
- 填写完成后,点击下方黄色按钮‘测试阿里云百炼 API 连接’(或‘测试 Ollama 连接’),确认提示‘连接成功’后再点击右下角蓝色‘保存’按钮提交配置
注意事项
⚠️重要提醒:此配置与‘个人知识库’‘卷宗生命周期管理’及‘AI文书建议’模块强关联——一旦知识库已完成向量化(即已有文档被转为向量存入RAG向量库),切勿随意更换服务商或模型版本,否则将导致语义搜索结果错乱;此时必须进入‘系统管理 > RAG向量库管理’手动执行‘重置向量库’操作,重新处理全部文档才能恢复正常使用。此外,该配置变更不会影响已归档案件的原始文档内容,仅影响后续新增/更新文档的智能检索效果。
页面路径:http://127.0.0.1:18000/management/page/embedding_configuration_management/