diff --git a/README.md b/README.md index 868b725..12919c2 100644 --- a/README.md +++ b/README.md @@ -115,15 +115,17 @@ ctest ## 当前状态 -项目处于 **骨架搭建阶段**,核心功能已规划并创建框架代码: +项目处于 **核心推理实现阶段**: - [x] 项目结构与 CMake 配置 -- [x] 配置管理模块 -- [x] STT 推理引擎框架 (ONNX 集成占位) -- [x] 音频采集/解码框架 (PortAudio/dr_libs 集成占位) -- [x] 三个 GUI 页面框架 -- [ ] 完整 ONNX 推理实现 -- [ ] 流式识别逻辑 +- [x] 配置管理模块 (线程安全,自动持久化) +- [x] STT 推理引擎 (ONNX Runtime 集成,异步模型加载) +- [x] Mel 频谱图提取 (Hann 窗 + FFT + Mel 滤波器组) +- [x] Whisper Tokenizer (BPE 分词) +- [x] 音频采集/解码框架 (PortAudio/dr_libs) +- [x] 三个 GUI 页面 (实时识别 / 文件转写 / 配置) +- [x] 日志系统 (控制台 + 文件输出) +- [ ] 完整 Whisper 推理 (自回归解码 + 流式识别) - [ ] 批量文件转写 - [ ] 跨平台打包