ASR语音识别服务配置

本页面用于为AILaw法律智能工作平台配置自动语音转文字（ASR）能力，使系统在处理庭审录音、当事人陈述音频等证据材料时，能自动将其转换为可编辑文本，嵌入卷宗工作空间（CaseFile）中供律师审阅与标注。您可选择OpenAI Whisper或阿里云百炼作为转录引擎，并按需填写对应密钥与存储参数。配置生效后，当您通过‘远程扫描’模块上传音频文件，或在‘卷宗生命周期管理’中触发音频转录动作时，系统将自动调用所选服务完成转录，无需人工干预。

ASR语音识别服务配置

操作步骤

在‘选择 ASR 供应商’下拉框中，点击当前显示的‘阿里云百炼’，可切换为‘OpenAI Whisper’；若保持使用阿里云百炼（推荐国内低延迟场景），请继续下一步
填写‘通义 ASR 及 OSS 配置’区域的6个字段：① ASR模型名称（如‘fun-asr’）；② DashScope API Key（以sk-开头的32位密钥）；③ OSS AccessKey ID（LTAI开头的字符串）；④ OSS AccessKey Secret（ia820开头的长字符串）；⑤ OSS Endpoint（如oss-cn-beijing.aliyuncs.com）；⑥ OSS Bucket（如sonaradar-law-studio-asr）
点击黄色按钮‘测试阿里云百炼 API 连接’，系统将尝试调用API并上传测试音频至指定OSS桶，成功后显示绿色提示；确认测试通过后，点击右下角蓝色‘保存’按钮提交配置

注意事项

注意：1）阿里云百炼方案要求语音文件必须预先上传至配置的OSS Bucket中，系统才会触发转录——此逻辑与‘远程扫描’模块联动，扫描设备上传音频时会自动同步至该Bucket；2）转录结果将作为CaseFileDocument的子项，关联至对应案件（Case）下的卷宗阶段（CasePhase），并在‘文档模板+AI’模块中支持生成笔录摘要或关键事实提取；3）所有AccessKey与API Key属于高敏感凭证，请勿截图或明文共享，建议定期轮换；4）若后续更换服务商，需重新测试连接并保存，否则可能导致卷宗处理流程中断。

页面路径：http://127.0.0.1:18000/management/page/asr_configuration_management/