Commit Graph

4 Commits

Author SHA1 Message Date
84cc5bbc22 docs: 更新 README 项目状态 (VAD + 单元测试)
Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
2026-05-12 16:58:15 +08:00
59c12ab931 feat: 扩展音频格式支持与推理管线优化
- 新增 MP3/FLAC 格式解码 (dr_mp3/dr_flac)
- 修复 Mel 频谱图使用 magnitude² 替代 magnitude 的问题
- 推理管线增加音频重采样 (非 16kHz 自动转换)
- 更新 README 项目状态

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
2026-05-12 16:35:48 +08:00
e31d51f12d docs: 更新 README 项目状态
Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
2026-05-12 16:18:07 +08:00
02e100b318 feat: 初始化 Impress Voice Input 项目
基于 ONNX 的实时语音转文本输入法,C++ 跨平台实现。

核心组件:
- Qt 6 跨平台 GUI(实时识别 / 文件转写 / 配置页面)
- ONNX Runtime 推理引擎(异步模型加载)
- PortAudio 音频采集
- dr_libs 音频文件解码
- JSON 配置管理(线程安全,自动持久化)
- 日志系统(控制台 + 文件输出)

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
2026-05-12 15:53:05 +08:00