# Управляй голосом Апрель 2025 Одна из самых важных перемен, произошедших со мной в плане работы за последний месяц — голосовое общение с компьютером. Давайте разберем, - почему это важно именно сейчас, - почему вы могли это пропустить, - и какие есть реальные кейсы использования. ## Почему сейчас? Вообще, голосовой ввод не выглядит, как что-то новое. Этот функционал появился в телефонах еще 10 лет назад. Распознавание речи на компьютере тоже существует довольно давно. Кажется, в этом нет никакой инновации. Но кое-что изменилось. Помните, как выглядел голосовой ввод на вашем телефоне 10 лет назад?Пользоваться им было невозможно. Проще было записать голосовое. Ваш голос обрабатывался дословно: записывалось все лишнее — каждое "эээ", "ну", "короче", и т.п. В плане текста получалось что-то не то. Все из-за различий между устной и письменной речью. Устный язык более избыточный – можно несколько раз повторить что-то, объяснить с разных сторон. В речи, мы используем больше слов, чем в тексте. Поэтому наговоренный текст с экрана читается довольно странно. Именно здесь нам на помощь пришли LLM. Голосовой ввод при помощи программ типа Superwhisper или VoicePal пропускает вашу речь через LLM, превращая ваш устный язык в письменный. ## Удаленка изменила правила игры Другая причина, почему голосовой ввод не получил такого развития раньше — ковид и удаленная работа. Когда ты работаешь в офисе, особенно в open space, разговаривать с компьютером голосом может быть некомфортно – проще напечатать. Сейчас, когда огромное количество людей работает из дома, — все иначе. Кстати, даже дома говорить со компьютером поначалу кажется непривычным, но через несколько дней привыкаешь, и это становится абсолютно естественным. В общем, надеюсь я убедил вас попробовать. Но зачем? ## Реальные юзкейсы, которые работают для меня ### 1. Запись материалов при помощи голоса Я диктую голосом все длинные сообщения и рабочие заметки в Notion. Во-первых, это интересно. Да, руки по привычке тянутся к клавиатуре – это это нормально. Это паттерн, который с нами несколько десятилетий. Но как только вы начнете делать это голосом, вы поймете, что по-другому думаете и излагаете свои мысли. Лично для меня сегодня намного проще записать резюме встречи голосом, потом немного поправить перед отправкой, чем писать его с клавиатуры. Также вы можете писать статьи и посты в блог. Мне лично пока сложно начинать говорить с чистого листа, нужен какой-то аутлайн. Но как только он есть, наговаривать текст становится несложной и интересной задачей. ### 2. Коммуникация с LLM Внезапно коммуницировать с ChatGPT, Claude и другими LLM тоже интересно в голосовом формате. Не в смысле прямого голосового общения в реальном времени, а набирать свой промпт голосом. Почему это круто? Потому что устный язык более избыточный, и вы сможете сообщить больше дополнительных деталей, которые вам, возможно, лень печатать на клавиатуре. Когда мы печатаем, мы стараемся ужаться в какое-то количество символов. Когда говорим, этого ограничения нет. Поэтому большой промпт намного проще записать голосом. ### 3. Ведение дневника Больше 20 лет, я пытаюсь регулярно вести свой дневник. То возвращаюсь к нему, то снова пропадаю. В конце дня сесть и написать внятный текст — на такое не всегда есть силы. Но оказалось, что у меня всегда есть силы наговорить этот текст в микрофон. Для этого я использую Курсор (я сделаю про это обязательно отдельное видео). Обычно я записываю "сегодняшнюю заметку" в несколько приемов в течение дня. Просто говорю «Добавь в сегодняшнюю запись, что я сделал статью про голосовой ввод и начал читать новую книгу Нила Стивенсона». Курсор сам разберется в какой файл это добавить и как сделать правильную ссылку на книгу и статью. Это радикально облегчает ведение дневника. В общем, если вы давно хотели вести дневник, но вас ограничивал ввод с клавиатуры, то голосовой ввод — хорошее решение. ### 4. Обучение Есть правило: если хочешь что-то выучить, нужно это прочитать или посмотреть, а потом записать своими словами. Или рассказать партнеру. Я это правило очень люблю, но мало что записываю. Не люблю читать и параллельно печатать на клавиатуре, когда можно просто нажать Ctrl+C + Ctrl+V. С голосовым вводом процесс моего обучения выглядит так: я читаю статью, смотрю видео или слушаю подкаст. Как только нахожу важную мысль, нажимаю на паузу, иду в свою систему управления знаниями и создаю дополнительную запись, надиктовывая своими словами то, что только что услышал. Затем я читаю получившийся текст, исправляю ошибки и структуру. Получается система: я прочитал что-то, пропустил через себя, сказал голосом и посмотрел на результат глазами. Информация несколько раз прошла через "разные отделы мозга". А главное — в моей системе знаний осталась эта информация и я могу позже к ней вернуться. --- Если у вас есть вопросы, обязательно напишите в комментариях. И если у вас есть желание поделиться своими находками, как вы используете голосовой ввод в вашей повседневной жизни, пожалуйста, пишите, я буду очень рад.