impress_asr_input/models/README.md

# 模型文件说明

## 支持的模型

本项目支持以下 ONNX 语音识别模型：

### 1. SenseVoice（推荐）

- **来源**: 阿里达摩院 FunAudioLLM
- **支持语言**: 中文、英文、日语、韩语
- **采样率**: 16000 Hz
- **特点**: 高精度、低延迟、支持多语言混合识别

**下载地址**:
- HuggingFace: https://huggingface.co/FunAudioLLM/SenseVoice
- ModelScope: https://www.modelscope.cn/models/iic/SenseVoiceSmall

### 2. Whisper ONNX

- **来源**: OpenAI
- **支持语言**: 90+ 种语言
- **采样率**: 16000 Hz
- **特点**: 多语言支持最好，准确度高

**下载地址**:
- HuggingFace: https://huggingface.co/onnx-community/whisper-base

### 3. Paraformer

- **来源**: 阿里达摩院
- **支持语言**: 中文
- **采样率**: 16000 Hz
- **特点**: 中文识别优化，速度快

**下载地址**:
- ModelScope: https://www.modelscope.cn/models/damo/speech_paraformer-large-vad-punct

## 安装模型

1. 从上述地址下载 ONNX 模型文件
2. 将模型文件放入 `models/` 目录
3. 模型文件命名：
   - SenseVoice: `sensevoice.onnx`
   - Whisper: `whisper.onnx`
   - Paraformer: `paraformer.onnx`

## 模型优先级

当有多个模型文件时，系统按以下优先级加载：

1. sensevoice.onnx（最高优先级）
2. whisper.onnx
3. paraformer.onnx（最低优先级）

## 注意事项

- 模型文件较大（50MB - 300MB），建议单独下载
- 模型文件不会被包含在 Git 仓库中
- 首次运行时需要确保模型文件已就位