From e31d51f12d2819bf302936917d286aff1e00136a Mon Sep 17 00:00:00 2001 From: impressionyang Date: Tue, 12 May 2026 16:18:07 +0800 Subject: [PATCH] =?UTF-8?q?docs:=20=E6=9B=B4=E6=96=B0=20README=20=E9=A1=B9?= =?UTF-8?q?=E7=9B=AE=E7=8A=B6=E6=80=81?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit Co-Authored-By: Claude Opus 4.6 --- README.md | 16 +++++++++------- 1 file changed, 9 insertions(+), 7 deletions(-) diff --git a/README.md b/README.md index 868b725..12919c2 100644 --- a/README.md +++ b/README.md @@ -115,15 +115,17 @@ ctest ## 当前状态 -项目处于 **骨架搭建阶段**,核心功能已规划并创建框架代码: +项目处于 **核心推理实现阶段**: - [x] 项目结构与 CMake 配置 -- [x] 配置管理模块 -- [x] STT 推理引擎框架 (ONNX 集成占位) -- [x] 音频采集/解码框架 (PortAudio/dr_libs 集成占位) -- [x] 三个 GUI 页面框架 -- [ ] 完整 ONNX 推理实现 -- [ ] 流式识别逻辑 +- [x] 配置管理模块 (线程安全,自动持久化) +- [x] STT 推理引擎 (ONNX Runtime 集成,异步模型加载) +- [x] Mel 频谱图提取 (Hann 窗 + FFT + Mel 滤波器组) +- [x] Whisper Tokenizer (BPE 分词) +- [x] 音频采集/解码框架 (PortAudio/dr_libs) +- [x] 三个 GUI 页面 (实时识别 / 文件转写 / 配置) +- [x] 日志系统 (控制台 + 文件输出) +- [ ] 完整 Whisper 推理 (自回归解码 + 流式识别) - [ ] 批量文件转写 - [ ] 跨平台打包