impress_voice_input

Author	SHA1	Message	Date
impressionyang	49313f15f9	feat: 完善文件转写导出功能 (TXT/SRT/JSON) - 修复导出功能：SRT/JSON 格式直接输出纯文本的 bug - 新增 SRT 导出：按句子分段，均匀分配时间戳，支持字幕格式 - 新增 JSON 导出：结构化数据，包含文件信息、时长、采样率等元数据 - 新增 TXT 导出：包含文件信息和音频参数的格式化文本 - 记录音频文件信息 (时长/采样率/声道数) 用于导出 Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-05-12 19:00:55 +08:00
impressionyang	84cc5bbc22	docs: 更新 README 项目状态 (VAD + 单元测试) Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-05-12 16:58:15 +08:00
impressionyang	59c12ab931	feat: 扩展音频格式支持与推理管线优化 - 新增 MP3/FLAC 格式解码 (dr_mp3/dr_flac) - 修复 Mel 频谱图使用 magnitude² 替代 magnitude 的问题 - 推理管线增加音频重采样 (非 16kHz 自动转换) - 更新 README 项目状态 Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-05-12 16:35:48 +08:00
impressionyang	e31d51f12d	docs: 更新 README 项目状态 Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-05-12 16:18:07 +08:00
impressionyang	02e100b318	feat: 初始化 Impress Voice Input 项目基于 ONNX 的实时语音转文本输入法，C++ 跨平台实现。核心组件： - Qt 6 跨平台 GUI（实时识别 / 文件转写 / 配置页面） - ONNX Runtime 推理引擎（异步模型加载） - PortAudio 音频采集 - dr_libs 音频文件解码 - JSON 配置管理（线程安全，自动持久化） - 日志系统（控制台 + 文件输出） Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-05-12 15:53:05 +08:00

5 Commits