# Управляй голосом
Апрель 2025
Одна из самых важных перемен, произошедших со мной в плане работы за последний месяц — голосовое общение с компьютером.
Давайте разберем,
- почему это важно именно сейчас,
- почему вы могли это пропустить,
- и какие есть реальные кейсы использования.
## Почему сейчас?
Вообще, голосовой ввод не выглядит, как что-то новое. Этот функционал появился в телефонах еще 10 лет назад. Распознавание речи на компьютере тоже существует довольно давно. Кажется, в этом нет никакой инновации.
Но кое-что изменилось.
Помните, как выглядел голосовой ввод на вашем телефоне 10 лет назад?Пользоваться им было невозможно. Проще было записать голосовое. Ваш голос обрабатывался дословно: записывалось все лишнее — каждое "эээ", "ну", "короче", и т.п. В плане текста получалось что-то не то.
Все из-за различий между устной и письменной речью. Устный язык более избыточный – можно несколько раз повторить что-то, объяснить с разных сторон. В речи, мы используем больше слов, чем в тексте. Поэтому наговоренный текст с экрана читается довольно странно.
Именно здесь нам на помощь пришли LLM. Голосовой ввод при помощи программ типа Superwhisper или VoicePal пропускает вашу речь через LLM, превращая ваш устный язык в письменный.
## Удаленка изменила правила игры
Другая причина, почему голосовой ввод не получил такого развития раньше — ковид и удаленная работа. Когда ты работаешь в офисе, особенно в open space, разговаривать с компьютером голосом может быть некомфортно – проще напечатать. Сейчас, когда огромное количество людей работает из дома, — все иначе.
Кстати, даже дома говорить со компьютером поначалу кажется непривычным, но через несколько дней привыкаешь, и это становится абсолютно естественным.
В общем, надеюсь я убедил вас попробовать.
Но зачем?
## Реальные юзкейсы, которые работают для меня
### 1. Запись материалов при помощи голоса
Я диктую голосом все длинные сообщения и рабочие заметки в Notion. Во-первых, это интересно. Да, руки по привычке тянутся к клавиатуре – это это нормально. Это паттерн, который с нами несколько десятилетий. Но как только вы начнете делать это голосом, вы поймете, что по-другому думаете и излагаете свои мысли.
Лично для меня сегодня намного проще записать резюме встречи голосом, потом немного поправить перед отправкой, чем писать его с клавиатуры.
Также вы можете писать статьи и посты в блог. Мне лично пока сложно начинать говорить с чистого листа, нужен какой-то аутлайн. Но как только он есть, наговаривать текст становится несложной и интересной задачей.
### 2. Коммуникация с LLM
Внезапно коммуницировать с ChatGPT, Claude и другими LLM тоже интересно в голосовом формате. Не в смысле прямого голосового общения в реальном времени, а набирать свой промпт голосом.
Почему это круто? Потому что устный язык более избыточный, и вы сможете сообщить больше дополнительных деталей, которые вам, возможно, лень печатать на клавиатуре. Когда мы печатаем, мы стараемся ужаться в какое-то количество символов. Когда говорим, этого ограничения нет. Поэтому большой промпт намного проще записать голосом.
### 3. Ведение дневника
Больше 20 лет, я пытаюсь регулярно вести свой дневник. То возвращаюсь к нему, то снова пропадаю. В конце дня сесть и написать внятный текст — на такое не всегда есть силы. Но оказалось, что у меня всегда есть силы наговорить этот текст в микрофон.
Для этого я использую Курсор (я сделаю про это обязательно отдельное видео). Обычно я записываю "сегодняшнюю заметку" в несколько приемов в течение дня. Просто говорю «Добавь в сегодняшнюю запись, что я сделал статью про голосовой ввод и начал читать новую книгу Нила Стивенсона». Курсор сам разберется в какой файл это добавить и как сделать правильную ссылку на книгу и статью.
Это радикально облегчает ведение дневника.
В общем, если вы давно хотели вести дневник, но вас ограничивал ввод с клавиатуры, то голосовой ввод — хорошее решение.
### 4. Обучение
Есть правило: если хочешь что-то выучить, нужно это прочитать или посмотреть, а потом записать своими словами. Или рассказать партнеру.
Я это правило очень люблю, но мало что записываю. Не люблю читать и параллельно печатать на клавиатуре, когда можно просто нажать Ctrl+C + Ctrl+V.
С голосовым вводом процесс моего обучения выглядит так: я читаю статью, смотрю видео или слушаю подкаст. Как только нахожу важную мысль, нажимаю на паузу, иду в свою систему управления знаниями и создаю дополнительную запись, надиктовывая своими словами то, что только что услышал.
Затем я читаю получившийся текст, исправляю ошибки и структуру.
Получается система: я прочитал что-то, пропустил через себя, сказал голосом и посмотрел на результат глазами. Информация несколько раз прошла через "разные отделы мозга". А главное — в моей системе знаний осталась эта информация и я могу позже к ней вернуться.
---
Если у вас есть вопросы, обязательно напишите в комментариях. И если у вас есть желание поделиться своими находками, как вы используете голосовой ввод в вашей повседневной жизни, пожалуйста, пишите, я буду очень рад.