6 программ для расшифровки текста

Программы для транскрибации

Многие новички, делают серьезную ошибку, начинают работать с подручными программами. К примеру открывают Ворд и запускают аудиозапись в проигрывателе.

Конечно работать можно и так, но как показал мой опыт, переключение между окнами и постоянные поиски нужного момента, забирают прорву времени, и работа тормозится.

Соответственно это уменьшение возможной прибыли.

Лично мне очень понравилась программа для транскрибации Express Scribe, простая в обращении, бесплатная (если конечно вы не решите купить версию ПРО), единственный недостаток, это английский интерфейс.

Но так как я пользуюсь при транскрибации лишь несколькими ее функциями, меня это не сильно смущает. При желании вы можете воспользоваться переводчиком и разобраться в полном функционале программы, лично я этого не делала.

Небольшая инструкция по использованию программы.

https://youtube.com/watch?v=-G1y0Ppe62k

Фактически, для транскрибации вам понадобится всего три функции этой программы, загрузить в нее аудиофайл, запустить трек, и после этого спокойно набирать в текстовом окне.

Есть кнопка регулирования скорости воспроизведения, она тоже помогает при работе, так как в более медленном воспроизведении, реже приходится возвращаться назад.

В принципе похожих программ найти можно много, и многие из них бесплатные, самое главное, скачивайте с проверенных источников, чтобы не заразить компьютер вирусами

Покупать или нет программы для машинной транскрибации

Конечно, мечта любого кто занимается транскрибацией, это получить заказ, загрузить его в умную программку и после этого получить без каких бы то усилий готовый текст, который можно отправить заказчику.

В интернете можно встретить предложения подобных программ, которые смогут распознать речь из любой аудиозаписи. Но тут стоит быть внимательными, помните, чудес не бывает, и я не верю что небольшая группа программистов, или даже один гений смогли бы разработать такую программку.

Приведу небольшой пример. У каждого человека уникальный голос, помимо этого существуют еще и интонации, некоторые люди произносят одинаковые буквы по-разному, а еще стоит добавить окружающие шумы.

Да мы отлично распознаем речь, которую слышим, но сможет ли это сделать компьютер? Ответ однозначный нет, так как в его базе для распознавания аудио, должны быть терабайты информации, о том, как могут звучать слова.

Конечно, работа в этом направлении ведется, единственный наиболее актуальный сервис, который мне попадался это Голосовой блокнот Гугла, но и здесь нужна правильная дикция, чтобы он распознавал большую часть слов, и нужен хороший микрофон.

А что говорить о плохих записях, которые приходится расшифровывать при ручной транскрибации, программа которая могла бы качественно перевести ее в текст не существует.

Работа с голосовым блокнотом speechpad.ru

Поэтому сколь бы ни было заманчивым купить программу для машинной транскрибации, знайте, что полноценного варианта еще не существует. Поэтому лучше всего не тратьте деньги зря.

Даже программа размером в гигабайт не может иметь полноценную базу для распознавания речи. Лучше купите себе хорошие вакуумные наушники, как показала моя практика, с ними работать намного лучше, так как ничто не отвлекает от работы.

Программы для транскрибации

В этом разделе я затрону основные категории программ, которые позволят вам быстро стартовать и «влиться» в работу. Если вам нужна подработка удаленно или вы предпочитаете фриланс, знайте, что заработок на транскрибации можно увеличить за счет использования некоторых программ.

В обязательном порядке

  • Текстовые редакторы – для удобной работы с текстом – советую обычный Word или LibreOffice Writer (их можно найти в офисных пакетах Microsoft Office или LibreOffice). Блокнот или Notepad проигрывают из-за ограниченного функционала.
  • Аудио- и видеоплееры – для воспроизведения, редактирования исходных или преобразованных файлов – из самых известных Winamp, KMP, либо другие в вашей операционной системе.
  • Конвертеры – для извлечения и (или) преобразования файлов из одного формата в другой и для улучшения звучания. Adobe Audition и Freemake Video Converter вполне подойдут.

Для оптимизации рабочего процесса

Функционал этих программ позволит вам работать с исходником и текстовым редактором одновременно, не переключаясь между окнами, снизить скорость воспроизведения исходника, автоматически вставлять тайм-код или имена собеседников, автоматически транскрибировать аудио в текст или использовать голосовой ввод, и многое другое.

  • Express Scribe;
  • Transcriber-pro;
  • Speechpad.ru;
  • Dictation.io;
  • LossPlay;
  • Dragon Dictation;
  • RSplayer.

Вспомогательные программы

Утилиты и сайты, чтобы работать было проще:

  • Punto Switcher – программа для автоматического переключения раскладки клавиатуры. Позволит сэкономить много времени при быстром наборе текста, содержащего иностранные слова, избавит от необходимости смены языка вручную и исправления связанных с этим ошибок.
  • AutoHotkey – программа для генерации и использования в работе скриптов. Эта и другие подобные утилиты значительно ускоряют процесс набора текста за счет автозамены сокращений, а также встроенных и настраиваемых шаблонов.
  • Грамота, Тургенев, Главред – это онлайн-ресурсы для проверки содержания вашего текста на наличие ошибок. Необходимы, если исходник подлежит глубокой обработке. Помогут при чистке текста от речевых штампов, жаргонизмов, слов-паразитов, стоп-слов, стилистических ошибок и перегруженности.
  • Тренажеры слепой и десятипальцевой печати, онлайн-измерители скорости – solo.nabiraem.ru позволит быстро измерить скорость вашей печати. Соло на клавиатуре – известный и проверенный сервис, где вы можете повысить уровень своего навыка и даже посоревноваться с другими «гонщиками на клавиатуре».

Сколько стоит транскрибация

По стоимости транскрибация текста, конечно, не самая высокооплачиваемая услуга. Ценник за выполненную работу может быть разный, и даже отличаться от ранее оговоренной цены.

Что влияет на стоимость

  • Ценовая политика ресурса – если это биржа или сайт фриланса. Если вы не обладатель звездного рейтинга, но при этом хороший специалист, вам все равно придется побороться с конкурентами.
  • Узкоспециальная тема – серьезные заказы с высоким ценником могут доверить специалистам с подтвержденной квалификацией и соответствующим портфолио.
  • Срок исполнения – срочные заказы, как правило, стоят дороже.
  • Длительность материала – телефонный разговор на 5 минут или 2-х часовая запись конференции будут стоить по-разному.
  • Вид транскрибации – дословная транскрибация с сохранением всех фигур речи стоит дороже.
  • Заказчик – может принципиально искать исполнителей высокой или низкой ценовой категории, порой даже независимо от сложности работы. Сколько заказчиков – столько и требований. Не удивляйтесь, что примерно за один и тот же объем работы вы можете получить различное вознаграждение.

Средние расценки

Оплачивается обычно транскрибированные минуты (цена за 1 мин), реже – количество  знаков готового текста (цена за 1000). В среднем цена колеблется от 5 до 15 рублей за 1 мин., если вы фрилансер без опыта работы и не владеете иностранным языком.

Настоящие мастера транскрибации претендуют на более высокий ценник. Приблизительная стоимость 20-25 рублей за 1 мин, при условии, что качество исходника хорошее, и на записи только 1 голос. Мастер имеет право запросить доплату за дополнительную нагрузку (несколько голосов, плохое качество записи и др).

Коротко о главном

— Высококачественное аудио можно попробовать расшифровать автоматически — тогда потребуется минимум правок. Чем хуже качество, чем больше шумов, чем тише голос — тем дольше нужно будет возиться с текстом после автотранскрибации. Примеры инструментов: Google Docs, RealSpeaker, Dictation, Voco.

— Если аудио неважного качества и с обилием посторонних звуков, а у говорящего тихая речь, много слов-паразитов и отвлечений не по теме — пожалуй, стоит выбрать ручную расшифровку. Главное, облегчить ее с помощью специальных решений: oTranscribe, Express Scribe, Transcriber Pro, LossPlay или Transcribe (wreally.com)

У последнего также есть платный автотранскрибатор.

— Можно просто делегировать это дело фрилансерам — они сами разберутся, какой способ расшифровки аудио им выбрать и использовать. Как правило, стоимость часа работы опытного автора/редактора/журналиста в разы выше, чем цена на транскрибацию текста. Выгоднее заплатить сторонним исполнителям, а не тратить часы на рутину. Специалистов можно найти на Zapisano, YouDo, FL, Kwork и других площадках.

Осторожно — мошенники

В заработке по расшифровке много лохотронщиков! Лохотронщики могут применять следующие методы:

— Заказчик может прислать расшифровщику часть материала, для проверки его способностей. Данный материал бесплатный. по результату выполнения данного заказа заказчик принимает решение, сотрудничать с данным транскрибатором далее или нет. Подобных частей заказа он может выслать огромному числу человек и всем ответить отказом. Сложа вмести отдельные части, у него выйдет целостный материал.

В данной ситуации я бы посоветовал не браться за выполнение больших бесплатных частей аудио. Пяти минут более, чем достаточно для оценки вашей работы.

— Заказчик может заговорить о внесении некоторой суммы денег, якобы для подтверждения серьезности намерений расшифровщика, может попросить деньги за ваше оформление и прочее.

ЗАПОМНИТЕ! Если работодатель заводит разговор о внесении на его счет какой-то наличности — это мошенник.

Вывод: расшифровка аудио может принести вам приличный доход! Но вам потребуется много сил, навыков и времени! И постарайтесь не попасть на лохотронщиков! Успехов!

Андрей Зимин                     26.05.2014г.

Анекдот в каждой статье:

Google Переводчик

На странице онлайн переводчика от Google присутствует возможность голосового ввода текста. Это может стать альтернативным и в то же время бесплатным вариантом, если требуется надиктовать запись с микрофона. Для начала ввода достаточно нажать на соответствующий значок.

Чуть более сложная задача стоит перед пользователем, если требуется выполнить перевод аудио в текст. Тем не менее зарубежные юзеры придумали решение – нужно установить специальный драйвер в систему и настроить вход микрофона на него. По итогу запущенный в плеере файл будет передаваться как голос, который поступает с микрофона. Это позволяет «обмануть» Google Переводчик и произвести транскрибацию с аудиофайла.

На автомате, в ручном режиме и при помощи профессионалов

Никита АлексеенкоFollow

Mar 22, 2018 · 3 min read

Кто как расшифровывает интервью? По-старинке отслушиваете и набираете ручками? Или пользуетесь какими-то программами? Эти вопросы в журналистской среде задают друг другу регулярно.

Казалось бы на дворе век искусственного интеллекта и нейросетей. Роботы вот-вот оставят без куска хлеба новостников и поработят мир, но идеальных программ для автоматической транскрибации до сих пор нет.

Зато есть небольшой список лучших на сегодняшний день:• Для автоматической расшифровки интервью• Для более удобной ручной расшифровки• Для заказа расшифровки у профессионалов

Для автоматической расшифровки интервью

  • Телегам-бот Voicy — превращает видео- и аудиозаписи в текст. Работает далеко не идеально. Но может очень выручить когда нет времени разбираться в тонкостях и читать этот текст до конца.
  • Dragon Dictation — для тех, кто имеет привычку делать аудиозаметки на ходу.Для iOS, бесплатно, требует подключения к инету.
  • — текст можно наговаривать или включить записанное аудио. Программа российская, и поэтому хорошо справляется даже со сложными текстами.Для Windows, стоит 1690 руб. (для дома) и 49 900 руб. (для профи).
  • RealSpeaker — лучше других справляется с расшифровкой видео (читает по губам). Для Windows, стоит $69.
  • On Air — загружаете онлайн, получаете текст на почту. Раз в сутки расшифрует 10 минут бесплатно, затем по 5 рублей за минуту.
  • Аудио — в текст — бесплатная конвертация аудио в текст онлайн. Сайт сейчас недоступен. Надеюсь, временно.
  • Стандартный аудионабор текста на Айосе, Андройде, Гугл Переводчике, Гугл Доке и множестве других приложений с голосовым набором.

На одном устройстве включаете записанное интервью, а на втором открываете приложение и запускаете аудионабор. Подносите гаджеты поближе друг к другу (желательно в тихом помещении) и наблюдаете.

Если речь длинная, то операцию придется повторить несколько раз — расшифровка через какое-то время может прерываться.

Текст, расшифрованный таким образом, потребует тщательной редактуры — не все слова программы понимают правильно, а с запятыми и точками совсем беда.

Для более удобной ручной расшифровки

  • Express Scribe — загружаете аудиофайл и горячими клавишами управляете воспроизведением. При этом набирая текст в том же окне и не отрывая рук от клавиатуры. Для Windows и Mac, базовая версия бесплатна, за расширенные опции придется доплатить до $60.
  • Transcriber Pro — то же самое, что и программа выше, но плюс возможность работать с видео, автоматически вставлять в расшифровку имена собеседников и русскоязычный интерфейс.Для Windows, 690 рублей в год.
  • Используйте аудиоплееры, в которых можно уменьшать скорость воспроизведения, так не придется прыгать из программы в программу, чтобы ставить на паузу.
  • Otranscribe — всё онлайн, аудио и текст сразу перед глазами, есть простые горячие клавиши для остановки/включения записи и вставки временных меток.
  • Купите медиа-клавиатуру с дополнительными кнопками.
  • Используйте горячие клавиши для быстрого переключения программ (Alt+Tab / ⌘+Tab) и плей/пауза (обычно это пробел).
  • Разместите окна с плеером и текстом рядом, в конце концов.

Для заказа расшифровки у профессионалов

zapisano.org — простой и понятный сайт полностью посвященный услуге расшифровки аудиозаписей в текст. Есть разные тарифы, зависящие от сложности и срочности расшифровки. На онлайн калькуляторе можно сразу посчитать во сколько обойдется услуга.

Расшифровка 1 часа обычного интервью в течение 1 рабочего дня обойдется в 1740 рублей.

ИСПОЛЬЗОВАНИЕ ОНЛАЙН-СЕРВИСОВ

Это российская
разработка изначально создавалась для распознавания речи и её перевода в
текстовый формат, т.е. достаточно говорить в микрофон, а текст будет набираться
самостоятельно.

Качество, конечно, «не
ахти какое», так как много получается ошибок.

Сервис также частенько
«любит глючить», в этом случае нужно зайти в «Поддержку» и сделать интеграцию
программы.

Если не получится
сделать её самостоятельно, тогда придётся обращаться к специалистам.

В панель для
транскрибации можно залить аудио или видеофайлы, но желательно хорошего
качества, иначе это не сработает.

Также для
транскрибирования аудио необходимо установить виртуальный кабель. Как это
правильно сделать, подробно показано в видео уроках на сайте.

Онлайн сервис dietation.io.    

Это зарубежный сервис,
поддерживающий, помимо русского, ещё 30 языков. Никакие аудио и видеофайлы
заливать нельзя. Используется только микрофон и голос, но зато распознаёт
сервис практически без ошибок.

Функций для
форматирования текста здесь немного, так что лучше пользоваться текстовыми
редакторами.

Google Docs.

Гугл Документы –
популярный сервис от Google. Он бесплатный.

Здесь имеется функция
«голосовой ввод», которым любят пользоваться некоторые транскрибаторы для
упрощения работы.

Принцип действий
простейший – слушаешь в наушниках запись, потом надиктовываешь в микрофон. А
сервис уже сам и речь расшифрует, и текст наберёт.

Правда результат здесь
непредсказуем — «фифти-фифти». Иной раз отменный, а иногда ошибок столько, что
быстрее было бы набрать вручную.

Для работы:

— Заходим на страницу Google Docs через свой аккаунт.

— Создаём новый документ (1).

— Подключаем голосовой ввод. Нажимаем «Инструменты» (2) – «Голосовой ввод»
или же «Ctrl+Shift+S».

— Появляется кнопка записи (3). Если её активировать она станет красной.

Внимание! Нельзя, ни в ком случае, переходить на другие вкладки во время
записи, иначе сервис перестаёт работать. Плюсы сервиса:

Плюсы сервиса:

Автоматическое сохранение набранного текста, при любом раскладе, даже при
внезапном отключении электричества.

Редактирование полученного текста можно осуществлять прямо на сервисе, так
как для этого имеется весь набор функций.

Есть, конечно, и
другие программы, но особой необходимости, как дополнение к вышеперечисленным,
в них нет. В общем, это уже «чисто на любителя».

Перечислю только
названия, так как практических навыков работы с ними не имею:

  1. Онлайн-сервис RealSpeaker.
    На нём можно до 1,5 минут транскрибировать бесплатно. Только для аудиофайлов.
  2.   Профессиональная программа Transcriber-pro. По отзывам очень интересная и с широкими возможностями. Демо версии нет. Для её приобретения нужно обращаться в техподдержку и решать вопрос с ними лично.  
  3.    Программа RSplayer. Очень многие её хвалят. Плеер бесплатный и поддерживает очень многие аудио и видео форматы. Он прост, эффективен и понятен в использовании.  
  4.   Программа Windows-VOCO. Тоже классная программа, которая позволяет подключать словари. Чтобы получить пробную версию, нужно также предварительно отправить запрос разработчикам.  

Способ 3. Speechpad.ru

Это онлайн блокнот, позволяющий переводить речь в текст. Работать можно как с регистрацией, так и без. Зарегистрированные пользователи могут сохранять сформированные тексты в упорядоченном виде, настраивать интерфейс блокнота, использовать голосовые команды. Приятно, что разработчики записали подробную инструкцию по голосовому вводу текста, которая находится прямо на главной странице сайта:

А с помощью кнопки «Транскрибация» можно записать текст с аудио, видеофайлов или с Youtube-хостинга. 

Плюсы блокнота: 

  • работа и с микрофоном, и с медиа файлами
  • набор текста происходит синхронно диктовке, поэтому правки в текст можно вносить сразу
  • сохранение готового текста в файл 

Минус пользователи отметили лишь один, и он несущественный  — корректно блокнот работает только в браузере Google Chrome. 

Рассмотрим транскрибацию видеоролика с Youtube.

Шаг 1. В строке поиска вводим speechpad.ru и попадаем на главную страницу блокнота.

Шаг 2. Прокрутив страницу до конца, нажимаем кнопку «+Транскрибацию».

Шаг 3. В открывшейся панели транскрибации отмечаем медиа тип «Youtube video»

Шаг 4. В поле «ID файла для проигрывания» вносим ID того ролика, который хотим транскрибировать.

 

ID ролика находится в адресной строке Youtube после знака «=». 

Нажимаем кнопку «Обновить».

 Шаг 5. Включаем воспроизведение видео и нажимаем кнопку «Включить запись»

Шаг 6. Проверяем текст, исправляем ошибки. Кнопка «Скачать» позволяет сохранить результат в формате текстового документа.

Звуковые переводчики онлайн

Готовы учиться переводить иностранные аудиозаписи? Тогда, приступим.

Топ-5: Аудио переводчики с английского на русский

  1. Использование Гугл Переводчика или Яндекс Переводчика. Этот способ хорош тем, что вы одновременно можете получить, как английский текст, так и его перевод. Настройте переводчик – над левым окном установите исходный язык аудио (английский), а над правым – язык, на который необходимо перевести (русский). Под левым окном переводчика нажмите на микрофон, разрешите использование микрофона, поднесите микрофон к колонкам, включите аудио и наслаждайтесь Подобным образом вы можете работать и с переводчиком от Яндекса:
  2. Еще один очень удобный сервис для распознавания речи и мгновенного перевода — speechlogger.appspot.com. Выставьте настройки – исходный язык, авто пунктуация, язык, далее также нужно поднести микрофон к колонкам, включить аудио и нажать на иконку “Микрофона”.
  3. С использованием speechpad.ru По работе с этим сервисом много инструкций в интернете. Особенно часто его используют для перевода речи в текст. Мы же будем использовать его для автоперевода. Перейдите на сервис speechpad, нажмите на кнопку +перевод, как показано на скриншоте ниже: Теперь выставьте настройки, как у меня на скриншоте: 1. Включите микрофон, 2. разрешите использование микрофона на сайте spechpad, 3. поднесите микрофон к колонкам, 4. Включите аудио (или видео) с иностранной речью.
  4. Второй вариант перевода английского аудио в текст – онлайн сервис dictation.io. Поднесите микрофон к колонкам, включите аудиозапись на английском языке и нажмите на сервисе кнопку “Start dictation”. После завершения записи нажмите “stop dictation”. Сохранить текст можно, нажав на кнопку “save”. Запись сохраниться в текстовом файле txt.
  5. Больше всего мне нравится третий вариант преобразования английской речи в текст. Перейти на сервис онлайн speech-to-text-demo. Он хорош тем, что не обязательно нужно проигрывать аудиофайл, хотя такая функция в сервисе тоже имеется. Благодаря этому, вы можете переводить аудио в текст в абсолютной тишине, если это требуется, например, если вы привыкли работать по ночам. Вторым вариантом является простая загрузка аудиофайла на сервис, где он автоматически распознается и будет переведен в текстовый файл. Однако не любой аудиофайл можно загрузить на сервис. Поддерживаются только расширения .wav, .flac, или .opus. Файл mp3 загрузить не получится, но и здесь есть выход – вам нужно всего лишь воспользоваться любым аудио конвертером, можно тоже онлайн. Рекомендую для конвертации аудио в другой формат сервис — online-audio-converter.com.Итак, теперь рассмотрим поэтапно процесс преобразования английской речи в текст при помощи указанного сервиса. Предположим, что у вас файл mp3. Значит, вам сначала нужно сконвертировать файл при помощи сервиса online-audio-converter.com. Вам нужно открыть аудиофайл, выбрать расширение, в которое необходимо сконвертировать (wav) и нажать кнопку “Конвертировать”. после завершения конвертации скачайте файл: Второй шаг – собственно перевод английского аудио в текст на сервисе speech-to-text-demo. Перейдите на этот сервис, нажмите на кнопку “Upload audio file” (загрузить аудио файл) и выберите из папки вашего компьютера сконвертированный в wav, flac или opus аудио файл. Через некоторое время в окне появится текст аудио. Пример:

Транскрибация вручную

Если Вы хотите экстрима, то попробуйте перевести речь в текст вручную. Даже если Вы планируете в дальнейшем для транскрибации активно использовать программы или сайты, о которых я расскажу ниже, все равно попробуйте это поделать “ручками”. Точнее “ушками”.

Сложность заключается в том, что сразу запомнить большой объем информации очень сложно. Вы играли когда-либо в “глухие телефончики”? 🙂 Вот такой же итог часто получается в случае “ручной транскрибации”, когда “переводчик” пытается запомнить сразу много информации.

Так зачем же я Вам советую попробовать ручную расшифровку аудио в текст? Дело в том, что какие-бы ни были классные программы для транскрибирования, о которых я буду рассказывать дальше, иногда они не могут помочь. Например:

  • В комнате шумно
  • Диктор говорит тихо
  • Диктор говорит с сильным акцентов
  • У диктора “фефекты фикции”
  • Записан на плохой микрофон
  • Одновременно говорит много людей
  • Диктор “вклинивает” иностранные фразы. Или малоупотребительные

Короче, “кочек”, на которых может застопориться Ваша программа масса. И в этом случае нужно подключать транскрибацию “вручную”.

Расшифровка аудио в текст — это легко

Многим кажется, что это довольно легкая работа. Что тут делать? Сидеть, слушать и печатать. Зачем здесь думать?

Но, увы, это не так легко. Данная задача станет легкой, если вам предоставят звуковую запись, на которой диктор профи отлично поставленным голосом и отличной интонацией прочтет вам текст. В реальной жизни это не встречается.

В реальности нужно расшифровать запись переговоров множества людей. Они постоянно разговаривают, перебивая собеседников, говорят отрывисто и неразборчиво. Также, по голосам нужно понять, кто именно говорит и привести их диалог в порядок.

Если говори один человек, голос его может быть невнятным, тихим, шепелявым и пр. Могут доноситься прочие шумы. Все это усложняет работу транскрибера.

Заказчик же хочет получить заказ как можно быстрее. В иных случаях действительно, вам будет предоставлено достаточно времени, но иногда, особенно для журналистов, все нужно сделать довольно быстро, часа через три после эфира. В этой ситуации у вас мало времени.

Например: сейчас транскриберу потребуется расшифровка аудио заседания суда, к утру, тренинг по инфобизнесу. У всех свой проф. жаргон, термины, тематика, аббревиатура. Учтите все это во время расшифровке. Отсюда, у вас должна быть отменная эрудиция. Вы должны отлично обращаться со словарем.

Оцените статью
Рейтинг автора
5
Материал подготовил
Андрей Измаилов
Наш эксперт
Написано статей
116
Добавить комментарий