发现和使用优秀的技能扩展
使用NVIDIA Parakeet TDT 0.6B v3(CPU上的ONNX)进行本地语音转文本。比Whisper快30倍,支持25种语言,具备自动检测功能,兼容OpenAI API。适用于在不使用云API的情况下本地转录音频文件、将语音转换为文本或处理语音录音。
Local speech-to-text with NVIDIA Parakeet TDT 0.6B v3 (ONNX on CPU). 30x faster than Whisper, 25 languages, auto-detection, OpenAI-compatible API. Use when transcribing audio files, converting speech to text, or processing voice recordings locally without cloud APIs.