Зажимаешь кнопку — говоришь — отпускаешь. Текст появляется в любом поле ввода. Handy — бесплатная open source утилита speech-to-text: локально, без облака, без подписки.
Под капотом — опенсорсные модели распознавания речи. Есть GPU — берёшь Whisper Large (OpenAI, открытые веса), качество космическое. Нет видеокарты — Parakeet V3 (NVIDIA) на CPU, тоже работает. Обе крутятся локально, ни один байт аудио никуда не уходит.
Тема горячая: Claude Code уже добавил voice mode в терминал, Wispr Flow решает это для всех приложений — но за $17/мес. Handy — то же самое, бесплатно и на твоём железе.
Мой сетап: боковая кнопка мыши. Работаю с Claude Code, Cursor, терминалом — каждый промпт это 3–5 предложений контекста, не «окей гугл». Объяснить агенту задачу голосом быстрее в 3–4 раза, чем напечатать: зажал → сказал → отпустил → текст в поле.
Сложный документ я напечатаю осознанно. Но поболтать с агентом без когнитивного трения на набор — лучше проговорю.
Ссылки: handy.computer, исходники — github.com/cjpais/Handy.