Голосовой набор текста

Боты для голосовых сообщений

Бот в ВКонтакте

Бот «Что тут сказано?» расшифровывает голосовые сообщения. Войс нужно переслать в переписку с ботом, он пришлет текст в ответ. Если надиктовать аудио напрямую в диалог с ботом, он не справится.

Бот расшифровывает войсы

Бота можно пригласить в беседу, тогда он будет автоматически расшифровывать сообщения в чате. Для этого на странице группы кликаем «Пригласить в беседу».

Приглашаем бота в беседу

Дальше выбираем нужный чат, куда добавим бота в качестве участника.

Выбираем чат

В настройках чата находим среди участников бота и даем ему доступ к переписке.

Даем доступ к сообщениям

Теперь если кто-то из участников записывает войс, следующим сообщением бот пришлет расшифровку.

Протестировать другие боты для перевода голосовых сообщений в текст не удалось, группы заброшены, а боты не реагируют на команды.

Бот в Телеграме

Бот Voicy переводит аудиосообщения или аудиофайлы в текст. Можно писать или присылать аудиофайлы боту напрямую или добавить его в чат, тогда на каждую реплику он будет отвечать ее текстовой расшифровкой.

Бот присылает расшифровку сразу после сообщения

Бота нужно настроить. Команда /language вызывает выбор языка, на котором будут записываться голосовые, /engine дает выбрать движок:

  • стандартный wit.ai хорошо распознает слова, но не справляется с сообщениями длиннее 50 секунд;
  • Yandex.SpeechKit работает без ограничений, но распознает слова хуже;
  • Google Speech хорошо распознает голос, работает с любой длиной, но требует оплаты.

Команда /silent отключит уведомления о том, что бот приступил к работе над войсом.

Для отключения бота в чате нужно набрать команду /files.

Сервис Zapisano.org

Иногда нужна точная расшифровка аудиозаписи, но на внесение правок в распознанные тексты или самостоятельный набор с нуля нет времени. В этом случае пока единственный выход — делегировать ручную расшифровку кому-то другому.

За помощью можно обратиться к фрилансерам или в специализирующиеся на транскрибации фирмы. Однако в первом случае придется потратить дополнительное время на поиск ответственного исполнителя и согласование условий, а во втором — на общение с менеджерами по почте.

Для того, чтобы сэкономить время на всех этапах работы, можно воспользоваться сервисом Zapisano.org. Пока это единственный в России сервис расшифровки с личным кабинетом, куда можно быстро загрузить аудиофайлы, оплатить заказ, а после его выполнения хранить исходные аудио и стенограммы.

Интерфейс простой и понятный. После регистрации загрузите файлы или скопируйте ссылку на запись:

Загрузка аудиозаписей для расшифровки

Сервис автоматически подсчитает длительность и спросит, какой тип расшифровки нужен — стандартный, для суда или перевод с иностранного языка. Вам нужно будет только выбрать тариф в зависимости от срочности работы:

Выбор формата тарифа для расшифровки

Прогресс по задачам удобно отслеживать в личном кабинете. Там вы увидите подробности по каждой:

Личный кабинет с прогрессом по задачам

Интерфейс также оптимизирован под мобильные устройства, поэтому в кабинет удобно загружать записи, сделанные на телефон. 

Тестовый перевод можно сделать бесплатно, так что у вас будет возможность оценить сервис.

Сервисы из подборки помогут сделать расшифровку интервью на аудио или видео, быстро узнать содержание голосового сообщения и упростят работу с надиктованным текстом. Качество расшифровки сильно зависит от дикции и скорости речи, поэтому всегда требует правок. Если нужно быстро получить точный текст без ошибок распознавания, единственный выход пока — делегировать ручной труд фрилансерам или специализированным сервисам.

Как увеличить доход от расшифровки аудио

Как я уже писал, базовый заработок на транскрибации аудио в текст не очень высок. Однако, его можно значительно увеличить. Первый способ я уже писал. Это увеличить свой рейтинг на биржах фриланса и наработать базу постоянных клиентов.

А второй способ – это брать более дорогие заказы на расшифровку аудио. Что влияет на стоимость заказов?

  • Некачественная запись звука. В помещении шумно, плохой микрофон или спикер далеко от микрофона.
  • Нужно сделать работу очень срочно. Обычно заказчика на Воркзилле или Кворке дают на транскрибацию около суток. Если просят быстрее, то смело увеличивайте цену работы.
  • Если разговаривает несколько человек. Обычно это полный пипец! Особенно, если эти люди говорят одновременно! Это очень сложная работа!
  • Если Заказчик хочет, чтобы Вы не просто дали ему расшифровку в виде текста, а еще и “причесали” документ. То есть, чтобы сделали форматирование текста, грамотно расставили знаки препинания  и т.п.
  • Если спикер с дефектами речи. Заикание, невнятная дикция, переизбыток слов-паразитов и т.п.
  • Спикер разговаривает на специфическом научном сленге. Вы просто можете не знать этих слов!
  • Ну и конечно же, если запись на иностранном языке. Тут даже без комментариев. Все понятно, что гораздо сложнее.

Короче, если есть такие засады, смело увеличивайте стоимость (и время) транскрибации аудио в видео в несколько раз!

Еще немного фишек для поиска заказов на транскрибацию биржах фриланса:

  • Первое время соглашайтесь на низкие цены. Главное – быстро нарастить  свой рейтинг.
  • Делайте работу качественно. Заказчики смотрят отзывы Исполнителя. Один негативный отзыв может перечеркнуть хорошую работу нескольких месяцев
  • Не работайте с проблемными заказчиками!
  • Обязательно детально уточняйте задание ПЕРЕД тем, как взять его!
  • Сделайте себе небольшое портфолио по выполненной транскрибации и покажите его заказчикам.

Все это позволит Вам стать профессиональным транскрибатором и зарабатывать себе не только на хлеб, но и на масло  с икрой 🙂

Условия и ограничения

Рас­по­зна­ва­ние речи — плат­ная услу­га, но Яндекс даёт 60 дней и 3000 ₽ для тести­ро­ва­ния. За эти день­ги мож­но рас­по­знать 83 часа аудио — боль­ше трёх суток непре­рыв­но­го раз­го­во­ра. Это очень мно­го: за вре­мя под­го­тов­ки этой ста­тьи и тести­ро­ва­ния тех­но­ло­гии мы потра­ти­ли 4 руб­ля за 3 дня.

Если отправ­лять фай­лы с запи­сью боль­ше мину­ты, то одна секун­да аудио сто­ит одну копей­ку. Что­бы рас­по­знать запись дли­ной в час, нуж­но 36 руб­лей. Это при­мер­но в 20 раз дешев­ле, чем берут транс­кри­ба­то­ры — люди, кото­рые сами наби­ра­ют текст на слух, про­слу­ши­вая запись.

Ней­ро­сеть часто пони­ма­ет, когда текст нуж­но раз­бить на абза­цы, но дела­ет это не все­гда правильно. Ещё она не ста­вит запя­тые, тире и двое­то­чия. Мак­си­мум, что она дела­ет — ста­вит точ­ку в кон­це пред­ло­же­ния и начи­на­ет новое с боль­шой бук­вы. Но при этом почти все сло­ва рас­по­зна­ют­ся пра­виль­но, и отре­дак­ти­ро­вать такой текст намно­го про­ще, чем наби­рать его с нуля.

Послед­нее — из-за осо­бен­но­стей нашей речи и про­из­но­ше­ния SpeechKit может путать сло­ва, кото­рые зву­чат оди­на­ко­во (код — кот) или ста­вить непра­виль­ное окон­ча­ние («сла­ва обру­ши­лось на него неожи­дан­но»). Реше­ние про­стое: про­го­ня­ем такой текст через орфо­ней­ро­кор­рек­тор и всё в поряд­ке. Одна ней­рон­ка исправ­ля­ет дру­гую — реаль­ность XXI века 

Всё, при­сту­па­ем.

Ино­гда резуль­тат полу­ча­ет­ся вот таким, но на пони­ма­ние тек­ста это не силь­но влияет. 

Способ 3. Speechpad.ru

Это онлайн блокнот, позволяющий переводить речь в текст. Работать можно как с регистрацией, так и без. Зарегистрированные пользователи могут сохранять сформированные тексты в упорядоченном виде, настраивать интерфейс блокнота, использовать голосовые команды. Приятно, что разработчики записали подробную инструкцию по голосовому вводу текста, которая находится прямо на главной странице сайта:

А с помощью кнопки «Транскрибация» можно записать текст с аудио, видеофайлов или с Youtube-хостинга. 

Плюсы блокнота: 

  • работа и с микрофоном, и с медиа файлами
  • набор текста происходит синхронно диктовке, поэтому правки в текст можно вносить сразу
  • сохранение готового текста в файл 

Минус пользователи отметили лишь один, и он несущественный  — корректно блокнот работает только в браузере Google Chrome. 

Рассмотрим транскрибацию видеоролика с Youtube.

Шаг 1. В строке поиска вводим speechpad.ru и попадаем на главную страницу блокнота.

Шаг 2. Прокрутив страницу до конца, нажимаем кнопку «+Транскрибацию».

Шаг 3. В открывшейся панели транскрибации отмечаем медиа тип «Youtube video»

Шаг 4. В поле «ID файла для проигрывания» вносим ID того ролика, который хотим транскрибировать.

 

ID ролика находится в адресной строке Youtube после знака «=». 

Нажимаем кнопку «Обновить».

 Шаг 5. Включаем воспроизведение видео и нажимаем кнопку «Включить запись»

Шаг 6. Проверяем текст, исправляем ошибки. Кнопка «Скачать» позволяет сохранить результат в формате текстового документа.

Что нужно знать о поиске заказов по транскрибации?

Так, мы разобрались с тем, как перевести аудио в текст, и что может помочь в осуществлении данного процесса. Теперь остановимся на том, кто создает такие задания, и где их можно найти.

Перевод аудиофайла в текст чаще всего востребован людьми, имеющими дело с:

  • лекциями;
  • конференциями;
  • интервью;
  • аудио или видеокурсами;
  • вебинарами и пр.

Таким образом, работу по транскрибации аудио в текст могут заказывать преподаватели ВУЗов, журналисты, репортеры и т. д. Даже студенты могут выступать в роли заказчиков, если им необходимо срочно перевести запись лекции в текстовый формат.

Второй вопрос – где искать заказы по переводу видео в текст. С этим сложностей не возникнет, поскольку такую работу можно найти на всевозможных биржах фриланса. А их в интернете есть огромное множество.

Еще один вариант – самому подать объявление о предоставлении услуг в этой сфере. Работа транскрибатором сегодня не менее популярна, чем наборщиком текста или копирайтером. Размещать свои предложения можно на специальных виртуальных досках объявления и сайтах по поиску удаленной работы.

Но главное, что нужно помнить, – это то, что при подаче объявления или заявки на выполнение заказа по транскрибированию, необходимо избегать шаблонных, стандартных выражений типа «договорная цена», «быстро и качественно» и пр. Необходимо указать конкретно, что именно вы будете делать, за какую цену, и как много времени вам понадобится на выполнение задания.

«RealSpeaker» — сверхточный распознаватель речи

Программа для трансформации голоса в текст «RealSpeaker»  кроме стандартных для программ такого рода функций, позволяет задействовать возможности веб-камеры вашего ПК. Теперь программа не только считывает аудио составляющую звука, но и фиксирует движение уголков губ говорящего, тем самым более корректно распознавая выговариваемые им слова.


«RealSpeaker» считывает не только аудио, но и визуальную составляющую процесса речи

Приложение поддерживает более десяти языков (в том числе и русский), позволяет распознавать речь с учётом акцентов и диалектов, позволяет транскрибировать аудио и видео, даёт доступ к облаку и многое другое. Программа условно бесплатна, за платную версию придётся заплатить вполне реальные деньги.

1Express Scribe

Пожалуй, самая удобная программа для расшифровки текста для Windows и Mac OS, которая совмещает в себе аудиоплеер и текстовый редактор. Принцип работы очень прост – загружаете в программу аудиофайл, прослушиваете его при помощи горячих клавиш на клавиатуре (их можно назначать самому) и параллельно набираете текст. Скорость воспроизведения и громкость аудио также регулируются при помощи клавиатуры. Таким образом, ваши руки постоянно находятся на клавиатуре и отпадает необходимость использовать мышку или переключаться между разными программами. Нужно учитывать, что встроенный редактор текста не распознает ошибки и не имеет многих других привычных функций, например, переключение дефиса в тире. Однако можно пользоваться другими редакторами текста параллельно с Express Scribe, используя горячие клавиши для управления воспроизведением аудио. Программа условно бесплатная, полная стоимость: 17-50 долларов.

Сколько стоит транскрибация

По стоимости транскрибация текста, конечно, не самая высокооплачиваемая услуга. Ценник за выполненную работу может быть разный, и даже отличаться от ранее оговоренной цены.

Что влияет на стоимость

  • Ценовая политика ресурса – если это биржа или сайт фриланса. Если вы не обладатель звездного рейтинга, но при этом хороший специалист, вам все равно придется побороться с конкурентами.
  • Узкоспециальная тема – серьезные заказы с высоким ценником могут доверить специалистам с подтвержденной квалификацией и соответствующим портфолио.
  • Срок исполнения – срочные заказы, как правило, стоят дороже.
  • Длительность материала – телефонный разговор на 5 минут или 2-х часовая запись конференции будут стоить по-разному.
  • Вид транскрибации – дословная транскрибация с сохранением всех фигур речи стоит дороже.
  • Заказчик – может принципиально искать исполнителей высокой или низкой ценовой категории, порой даже независимо от сложности работы. Сколько заказчиков – столько и требований. Не удивляйтесь, что примерно за один и тот же объем работы вы можете получить различное вознаграждение.

Средние расценки

Оплачивается обычно транскрибированные минуты (цена за 1 мин), реже – количество  знаков готового текста (цена за 1000). В среднем цена колеблется от 5 до 15 рублей за 1 мин., если вы фрилансер без опыта работы и не владеете иностранным языком.

Настоящие мастера транскрибации претендуют на более высокий ценник. Приблизительная стоимость 20-25 рублей за 1 мин, при условии, что качество исходника хорошее, и на записи только 1 голос. Мастер имеет право запросить доплату за дополнительную нагрузку (несколько голосов, плохое качество записи и др).

Как избежать недобросовестных заказчиков

В конце хочу поговорить о том, как избежать недобросовестных заказчиков, так как сама не раз сталкивалась с подобным явлением. На просторах интернета есть полно «умников», которые хотят, чтобы для них бесплатно сделали работу.

Они могут быть очень учтивыми при общении, но как только вы высылаете результат, заказчик пропадает, и заработанных денег вы не увидите. Именно таких заказчиков нужно сторониться.

Первый признак недобросовестного заказчика, это высокая цена заказа и свежая регистрация на бирже фриланса.

Такие заказчики делают аккаунты однодневки, которые просто умирают после того, как для них сделают работу. Поэтому у таких заказчиков нужно или просить предоплату, или высылать работу частями, чтобы заказчик их сразу оплачивал.

Можно также договориться с заказчиком о том, что вы высылаете ему скин текста, он проверяет его и оплачивает. После этого вы высылаете текстовый документ.

Данный метод тоже поможет вам перестраховаться от неоплаты работы. Помните, если вы работаете с заказчиком в первый раз, то нужно быть осторожными, чтобы не потратить время зря.

Транскрибация аудио в текст, несложная работа которую может осилить даже новичок

Самое главное проявить внимание и старательность

К тому же на транскрибации можно зарабатывать не хуже чем на копирайте, особенно если вы новичок и у вас нет своей базы заказчиков.

ИСПОЛЬЗОВАНИЕ ОНЛАЙН-СЕРВИСОВ

Это российская
разработка изначально создавалась для распознавания речи и её перевода в
текстовый формат, т.е. достаточно говорить в микрофон, а текст будет набираться
самостоятельно.

Качество, конечно, «не
ахти какое», так как много получается ошибок.

Сервис также частенько
«любит глючить», в этом случае нужно зайти в «Поддержку» и сделать интеграцию
программы.

Если не получится
сделать её самостоятельно, тогда придётся обращаться к специалистам.

В панель для
транскрибации можно залить аудио или видеофайлы, но желательно хорошего
качества, иначе это не сработает.

Также для
транскрибирования аудио необходимо установить виртуальный кабель. Как это
правильно сделать, подробно показано в видео уроках на сайте.

Онлайн сервис dietation.io.    

Это зарубежный сервис,
поддерживающий, помимо русского, ещё 30 языков. Никакие аудио и видеофайлы
заливать нельзя. Используется только микрофон и голос, но зато распознаёт
сервис практически без ошибок.

Функций для
форматирования текста здесь немного, так что лучше пользоваться текстовыми
редакторами.

Google Docs.

Гугл Документы –
популярный сервис от Google. Он бесплатный.

Здесь имеется функция
«голосовой ввод», которым любят пользоваться некоторые транскрибаторы для
упрощения работы.

Принцип действий
простейший – слушаешь в наушниках запись, потом надиктовываешь в микрофон. А
сервис уже сам и речь расшифрует, и текст наберёт.

Правда результат здесь
непредсказуем — «фифти-фифти». Иной раз отменный, а иногда ошибок столько, что
быстрее было бы набрать вручную.

Для работы:

— Заходим на страницу Google Docs через свой аккаунт.

— Создаём новый документ (1).

— Подключаем голосовой ввод. Нажимаем «Инструменты» (2) – «Голосовой ввод»
или же «Ctrl+Shift+S».

— Появляется кнопка записи (3). Если её активировать она станет красной.

Внимание! Нельзя, ни в ком случае, переходить на другие вкладки во время
записи, иначе сервис перестаёт работать. Плюсы сервиса:

Плюсы сервиса:

Автоматическое сохранение набранного текста, при любом раскладе, даже при
внезапном отключении электричества.

Редактирование полученного текста можно осуществлять прямо на сервисе, так
как для этого имеется весь набор функций.

Есть, конечно, и
другие программы, но особой необходимости, как дополнение к вышеперечисленным,
в них нет. В общем, это уже «чисто на любителя».

Перечислю только
названия, так как практических навыков работы с ними не имею:

  1. Онлайн-сервис RealSpeaker.
    На нём можно до 1,5 минут транскрибировать бесплатно. Только для аудиофайлов.
  2.   Профессиональная программа Transcriber-pro. По отзывам очень интересная и с широкими возможностями. Демо версии нет. Для её приобретения нужно обращаться в техподдержку и решать вопрос с ними лично.  
  3.    Программа RSplayer. Очень многие её хвалят. Плеер бесплатный и поддерживает очень многие аудио и видео форматы. Он прост, эффективен и понятен в использовании.  
  4.   Программа Windows-VOCO. Тоже классная программа, которая позволяет подключать словари. Чтобы получить пробную версию, нужно также предварительно отправить запрос разработчикам.  

Способ 2. Dictation.io

Это простой и понятный онлайн сервис для голосового ввода текста. Его интерфейс на английском языке. Открыть сервис можно в любом браузере, но только в Google Chrome есть возможность выбора языка для ввода текста. 

Поэтому работаем в нем. 

Плюсы сервиса: 

  • минималистичный ресурс, ничего лишнего
  • функция автосохранения даже при случайном закрытии браузера  
  • корректное распознавание текста. 

Минус всего один — не работает с готовыми медиа файлами, то есть текст придется диктовать самостоятельно. 

Итак, набираем в адресной строке dictation.io. Открывшуюся страницу прокручиваем вниз. Нажимаем на кнопку «Speech to text».

Откроется окно с полем для текста, полем выбора языка и микрофоном. 

Если сервис запросит разрешение использовать микрофон, нужно нажать «Разрешить», или «Allow». В поле с выбором языка уже будет автоматически установлен русский. 

Внизу белого поля также есть кнопки управления, нам пригодятся: Copy — копировать, Save —  сохранить, Clear — очистить.

Нажимаем на значок микрофона или на кнопку «Start» и диктуем текст.  

Кнопка «Save» позволяет экспортировать набранный текст в текстовый файл с расширением txt.

«Dragon Professional» — расшифровка аудиозаписей в текст

На момент написания данного материала цифровой англоязычный продукт Dragon Professional Individual» является одним из мировых лидеров по качеству распознаваемых текстов. Программа понимает семь языков (с русским пока работает лишь мобильное приложение «Dragon Anywhere» на Android и iOS), обладает высоким качеством распознавания голоса, умеет выполнять ряд голосовых команд. При этом данный продукт имеет исключительно платный характер (цена за основную программу составляет 300 долларов США, а за «домашнюю» версия продукта «Dragon Home» покупателю придётся выложить 75 американских долларов).

Для своей работы данный продукт от «Nuance Communications» требует создания своего профиля, который призван адаптировать возможности программы под специфику вашего голоса. Кроме непосредственной диктовки текста, вы можете обучить программу выполнять ряд команд, тем самым делая своё взаимодействие с компьютером ещё более конгруэнтным и удобным.

Программы для транскрибации

Многие новички, делают серьезную ошибку, начинают работать с подручными программами. К примеру открывают Ворд и запускают аудиозапись в проигрывателе.

Конечно работать можно и так, но как показал мой опыт, переключение между окнами и постоянные поиски нужного момента, забирают прорву времени, и работа тормозится.

Соответственно это уменьшение возможной прибыли.

Лично мне очень понравилась программа для транскрибации Express Scribe, простая в обращении, бесплатная (если конечно вы не решите купить версию ПРО), единственный недостаток, это английский интерфейс.

Но так как я пользуюсь при транскрибации лишь несколькими ее функциями, меня это не сильно смущает. При желании вы можете воспользоваться переводчиком и разобраться в полном функционале программы, лично я этого не делала.

Небольшая инструкция по использованию программы.

https://youtube.com/watch?v=-G1y0Ppe62k

Фактически, для транскрибации вам понадобится всего три функции этой программы, загрузить в нее аудиофайл, запустить трек, и после этого спокойно набирать в текстовом окне.

Есть кнопка регулирования скорости воспроизведения, она тоже помогает при работе, так как в более медленном воспроизведении, реже приходится возвращаться назад.

В принципе похожих программ найти можно много, и многие из них бесплатные, самое главное, скачивайте с проверенных источников, чтобы не заразить компьютер вирусами

Покупать или нет программы для машинной транскрибации

Конечно, мечта любого кто занимается транскрибацией, это получить заказ, загрузить его в умную программку и после этого получить без каких бы то усилий готовый текст, который можно отправить заказчику.

В интернете можно встретить предложения подобных программ, которые смогут распознать речь из любой аудиозаписи. Но тут стоит быть внимательными, помните, чудес не бывает, и я не верю что небольшая группа программистов, или даже один гений смогли бы разработать такую программку.

Приведу небольшой пример. У каждого человека уникальный голос, помимо этого существуют еще и интонации, некоторые люди произносят одинаковые буквы по-разному, а еще стоит добавить окружающие шумы.

Да мы отлично распознаем речь, которую слышим, но сможет ли это сделать компьютер? Ответ однозначный нет, так как в его базе для распознавания аудио, должны быть терабайты информации, о том, как могут звучать слова.

Конечно, работа в этом направлении ведется, единственный наиболее актуальный сервис, который мне попадался это Голосовой блокнот Гугла, но и здесь нужна правильная дикция, чтобы он распознавал большую часть слов, и нужен хороший микрофон.

А что говорить о плохих записях, которые приходится расшифровывать при ручной транскрибации, программа которая могла бы качественно перевести ее в текст не существует.

Работа с голосовым блокнотом speechpad.ru

Поэтому сколь бы ни было заманчивым купить программу для машинной транскрибации, знайте, что полноценного варианта еще не существует. Поэтому лучше всего не тратьте деньги зря.

Даже программа размером в гигабайт не может иметь полноценную базу для распознавания речи. Лучше купите себе хорошие вакуумные наушники, как показала моя практика, с ними работать намного лучше, так как ничто не отвлекает от работы.

Командная строка Яндекса

С её помо­щью мы смо­жем полу­чать нуж­ные клю­чи досту­па, что­бы отправ­лять фай­лы с запи­ся­ми на сер­вер для обработки.

Весь про­цесс уста­нов­ки мы опи­шем для Windows. Если у вас Mac OS или Linux, то всё будет то же самое, но с поправ­кой на опе­ра­ци­он­ную систе­му. Поэто­му если что — .

Для уста­нов­ки и даль­ней­шей рабо­ты нам пона­до­бит­ся PowerShell — это про­грам­ма для рабо­ты с команд­ной стро­кой, но с рас­ши­рен­ны­ми воз­мож­но­стя­ми. Запус­ка­ем PowerShell и пишем там такую команду:

iex (New-Object System.Net.WebClient).DownloadString(‘https://storage.yandexcloud.net/yandexcloud-yc/install.ps1’)

Она ска­ча­ет и запу­стит уста­нов­щик команд­ной стро­ки Яндек­са. В сере­дине скрипт спро­сит нас, доба­вить ли путь в систем­ную пере­мен­ную PATH, — в ответ пишем Y и нажи­ма­ем Enter:

Команд­ная стро­ка Яндек­са уста­нов­ле­на в систе­ме, закры­ва­ем PowerShell и запус­ка­ем его зано­во. Теперь нам нуж­но полу­чить токен авто­ри­за­ции — это такая после­до­ва­тель­ность сим­во­лов, кото­рая пока­жет «Обла­ку», что мы — это мы, а не кто-то другой.

Пере­хо­дим по спе­ци­аль­ной ссыл­ке, кото­рая даст нам нуж­ный токен. Сер­вис спро­сит у нас, раз­ре­ша­ем ли мы доступ «Обла­ка» к нашим дан­ным на Яндек­се — нажи­ма­ем «Раз­ре­шить». В ито­ге видим стра­ни­цу с токеном:

Теперь нуж­но закон­чить настрой­ку команд­ной стро­ки Яндек­са, что­бы мож­но было с ней пол­но­цен­но рабо­тать. Для это­го в PowerShell пишем команду:

yc init

Когда скрипт попро­сит — вво­дим токен, кото­рый мы толь­ко что получили:

Сна­ча­ла отве­ча­ем «1», затем «Y» и «4».

На автомате, в ручном режиме и при помощи профессионалов

Никита АлексеенкоFollow

Mar 22, 2018 · 3 min read

Кто как расшифровывает интервью? По-старинке отслушиваете и набираете ручками? Или пользуетесь какими-то программами? Эти вопросы в журналистской среде задают друг другу регулярно.

Казалось бы на дворе век искусственного интеллекта и нейросетей. Роботы вот-вот оставят без куска хлеба новостников и поработят мир, но идеальных программ для автоматической транскрибации до сих пор нет.

Зато есть небольшой список лучших на сегодняшний день:• Для автоматической расшифровки интервью• Для более удобной ручной расшифровки• Для заказа расшифровки у профессионалов

Для автоматической расшифровки интервью

  • Телегам-бот Voicy — превращает видео- и аудиозаписи в текст. Работает далеко не идеально. Но может очень выручить когда нет времени разбираться в тонкостях и читать этот текст до конца.
  • Dragon Dictation — для тех, кто имеет привычку делать аудиозаметки на ходу.Для iOS, бесплатно, требует подключения к инету.
  • — текст можно наговаривать или включить записанное аудио. Программа российская, и поэтому хорошо справляется даже со сложными текстами.Для Windows, стоит 1690 руб. (для дома) и 49 900 руб. (для профи).
  • RealSpeaker — лучше других справляется с расшифровкой видео (читает по губам). Для Windows, стоит $69.
  • On Air — загружаете онлайн, получаете текст на почту. Раз в сутки расшифрует 10 минут бесплатно, затем по 5 рублей за минуту.
  • Аудио — в текст — бесплатная конвертация аудио в текст онлайн. Сайт сейчас недоступен. Надеюсь, временно.
  • Стандартный аудионабор текста на Айосе, Андройде, Гугл Переводчике, Гугл Доке и множестве других приложений с голосовым набором.

На одном устройстве включаете записанное интервью, а на втором открываете приложение и запускаете аудионабор. Подносите гаджеты поближе друг к другу (желательно в тихом помещении) и наблюдаете.

Если речь длинная, то операцию придется повторить несколько раз — расшифровка через какое-то время может прерываться.

Текст, расшифрованный таким образом, потребует тщательной редактуры — не все слова программы понимают правильно, а с запятыми и точками совсем беда.

Для более удобной ручной расшифровки

  • Express Scribe — загружаете аудиофайл и горячими клавишами управляете воспроизведением. При этом набирая текст в том же окне и не отрывая рук от клавиатуры. Для Windows и Mac, базовая версия бесплатна, за расширенные опции придется доплатить до $60.
  • Transcriber Pro — то же самое, что и программа выше, но плюс возможность работать с видео, автоматически вставлять в расшифровку имена собеседников и русскоязычный интерфейс.Для Windows, 690 рублей в год.
  • Используйте аудиоплееры, в которых можно уменьшать скорость воспроизведения, так не придется прыгать из программы в программу, чтобы ставить на паузу.
  • Otranscribe — всё онлайн, аудио и текст сразу перед глазами, есть простые горячие клавиши для остановки/включения записи и вставки временных меток.
  • Купите медиа-клавиатуру с дополнительными кнопками.
  • Используйте горячие клавиши для быстрого переключения программ (Alt+Tab / ⌘+Tab) и плей/пауза (обычно это пробел).
  • Разместите окна с плеером и текстом рядом, в конце концов.

Для заказа расшифровки у профессионалов

zapisano.org — простой и понятный сайт полностью посвященный услуге расшифровки аудиозаписей в текст. Есть разные тарифы, зависящие от сложности и срочности расшифровки. На онлайн калькуляторе можно сразу посчитать во сколько обойдется услуга.

Расшифровка 1 часа обычного интервью в течение 1 рабочего дня обойдется в 1740 рублей.

Оцените статью
Рейтинг автора
5
Материал подготовил
Андрей Измаилов
Наш эксперт
Написано статей
116
Добавить комментарий