跳转至

ASR语音识别服务配置

本页面用于为AILaw法律智能工作平台配置自动语音转文字(ASR)能力,使系统在处理庭审录音、当事人陈述音频等证据材料时,能自动将其转换为可编辑文本,嵌入卷宗工作空间(CaseFile)中供律师审阅与标注。您可选择OpenAI Whisper或阿里云百炼作为转录引擎,并按需填写对应密钥与存储参数。配置生效后,当您通过‘远程扫描’模块上传音频文件,或在‘卷宗生命周期管理’中触发音频转录动作时,系统将自动调用所选服务完成转录,无需人工干预。

ASR语音识别服务配置

操作步骤

  1. 在‘选择 ASR 供应商’下拉框中,点击当前显示的‘阿里云百炼’,可切换为‘OpenAI Whisper’;若保持使用阿里云百炼(推荐国内低延迟场景),请继续下一步
  2. 填写‘通义 ASR 及 OSS 配置’区域的6个字段:① ASR模型名称(如‘fun-asr’);② DashScope API Key(以sk-开头的32位密钥);③ OSS AccessKey ID(LTAI开头的字符串);④ OSS AccessKey Secret(ia820开头的长字符串);⑤ OSS Endpoint(如oss-cn-beijing.aliyuncs.com);⑥ OSS Bucket(如sonaradar-law-studio-asr)
  3. 点击黄色按钮‘测试阿里云百炼 API 连接’,系统将尝试调用API并上传测试音频至指定OSS桶,成功后显示绿色提示;确认测试通过后,点击右下角蓝色‘保存’按钮提交配置

注意事项

注意:1)阿里云百炼方案要求语音文件必须预先上传至配置的OSS Bucket中,系统才会触发转录——此逻辑与‘远程扫描’模块联动,扫描设备上传音频时会自动同步至该Bucket;2)转录结果将作为CaseFileDocument的子项,关联至对应案件(Case)下的卷宗阶段(CasePhase),并在‘文档模板+AI’模块中支持生成笔录摘要或关键事实提取;3)所有AccessKey与API Key属于高敏感凭证,请勿截图或明文共享,建议定期轮换;4)若后续更换服务商,需重新测试连接并保存,否则可能导致卷宗处理流程中断。


页面路径:http://127.0.0.1:18000/management/page/asr_configuration_management/