Как перевести mp3 в текст

Как превратить голос в текст: тестируем 5 сервисов для расшифровки

Я работаю с текстом и мечтаю о программе, которая сможет превратить голос в напечатанные слова.

Например, расшифрует за меня интервью длиной в несколько часов. Или позволит наговорить идеи, а в ответ пришлет заметку. Наконец, «напишет» за меня смс: поймет несколько обрывистых фраз и отправит адресату текст — потому что голосовые сообщения любят не все.

Я протестировал 5 таких сервисов: наговорил один и тот же текст, а потом сравнил результаты. Я использовал два способа: сначала давал программе послушать и расшифровать живой голос, а потом — в записи.

Текст для теста

Вот текст для теста: «Привет. Это тестовая запись для статьи об инструментах, которые умеют превращать голос в текст. Как думаете, этот сервис справится? Распознает интонацию вопроса и, например, числа — один, два, три? Вот что получилось».

Google Keep

Где работает: Android, iOS
Сколько стоит: бесплатно

Что умеет. Это приложение для создания и хранения заметок можно использовать как расшифровщик. Если на главном экране нажать на иконку микрофона и начать говорить, то сервис будет переводить звук в текст — это называется транскрибацией. Загрузить и расшифровать аудиофайл не получится.

У сервиса есть еще один минус: запись останавливается, если молчать две-три секунды, поэтому расшифровывать длинные интервью не получится. Разве что делать это небольшими кусками. Наговорить несколько идей и получить их в блокноте получится отлично.

Результат. Я проверил два способа: наговорил текст самостоятельно и включил запись того же текста через колонку — никакой разницы нет. Вышло хорошо: сервис не распознал только знаки препинания и напечатал числа без пробелов.

Сообщения «Вконтакте»

Где работает: Android, iOS
Сколько стоит: бесплатно

Что умеет. В мобильном приложении соцсеть умеет расшифровывать входящие голосовые сообщения. Это можно использовать и в наших целях: отправлять сообщения самому себе.

Для этого зайдите в раздел с диалогами и в поисковом окне вбейте свое имя. Дальше зажмите значок микрофона и наговорите сообщение. Когда оно появится в диалоговом окне, нажмите на «Аа» справа от записи.

Результат. «Вконтакте» расшифровал живой голос с ошибками в склонениях и перепутал несколько слов: например, «сервис» услышал как «серый». Но справился с числами. Записанный и пропущенный через колонку голос сервис расшифровал намного хуже — получился набор слов, который нужно буквально переписывать.

Источник

Как бесплатно перевести аудиозапись в текст (mp3 to Word)

На днях закончил работу над журналом, который готовил к 55-летнему юбилею мамы. Основой содержимого стали интервью с её близкими и друзьями. С ними я встречался лично, записывал разговор на диктофон. Дальше начиналось самое интересное. Эти записи предстояло расшифровать в текст.

Пять лет назад подобный подарок я уже делал, подруге. В 2015-м ещё не имелось достойных сервисов, способных транскрибировать аудиофайлы в текст. Сейчас технологии достигли необходимого уровня.

Делюсь подборкой соответствующих сервисов, наиболее совершенных. Trial-версия в каждом из них даёт обработать от 30 минут до 9 часов. Как правило, этого достаточно для большинства непромышленных задач. Экспорт готовой стенограммы возможен в Word и т.п. Если звук чёткий, без посторонних шумов, а люди говорят внятно, то качество расшифровки будет близко к 100%. В полученном документе останется лишь настроить стили и разбить его на абзацы.

Здесь можно бесплатно расшифровать три файла. При этом максимальная длина каждого – до трёх часов. Итого, 1 аккаунт = 9 бесплатных часов. Если у вас больше трёх файлов, но все они суммарно меньше 9-часового лимита, просто «склейте» их предварительно в аудиоредакторе. Тогда вам будет достаточно одной учётки. В противном случае на каждые три файла придётся регистрировать новый профиль.

Примечание. Во время регистрации нужно привязать банковскую карту. Если не планируете покупать платный тариф, не забудьте после транскрибации удалить её данные в Настройках. Тогда через 7 дней деньги не спишутся. Безлимитный тариф стоит от 75$ в месяц.

На каждом из этих сайтов бесплатно можно обработать запись до 30 минут. Принцип работы, и, судя по всему, движок, один и тот же. Тарифы не совсем прозрачные. В т.ч., поэтому первый сервис удобнее.

UPD 3.02.2019
3. В комментариях ещё порекомендовали данный сервис от Google:

При регистрации в любом из сервисов Google Cloud даётся 300$ на их использование (бесплатный trial). Этого хватит для перевода около 300 часов аудио в текст.

Как не заводить много электропочт, создавая новый аккаунт, т.к. в существующем истёк trial, а отдавать почти 5 тысяч за платный не хочется? Возможно, вы об этом способе уже слышали. Допустим, у вас почта «mypochta2020@gmail.com», заводя новый аккаунт, в поле e-mail укажите «mypochta2020++@gmail.com». Письмо-подтверждение придёт на «mypochta2020@gmail.com». Насколько я знаю, кол-во плюсов может быть любым.

Используйте технологии XXI века для удобства и экономии времени!

Комментарий удален по просьбе пользователя

60 минут бесплатно, при первой регистрации на cloud дают 300$ на использование любого сервиса в том числе и speach-to-Text
https://cloud.google.com/speech-to-text

60 минут через гугл и 9 часов через указанный в статье сервис. Разница очевидна.

60 минут в месяц бесплатно. 300 баксов дают при первой регистрации, тариф ($0.004 / 15 seconds), после 60 минут в месяц. И того 312.5 часов бесплатно, разница действительно очевидна. Я не эксперт, но что-то мне подсказывает, что все эти сервисы используют google,amazon,ibm и это в лучшем случаи и просто перепродают тебе.

Да, действительно, вы правы. Гугл в таком случае выгоднее. Спасибо за информацию!

я правильно понял, что для того, чтобы им воспользоваться, нужно создать проект, сервисный аккаунт, учетные данные (и т. д.?)?

Ага, и еще, как выяснилось, нужна программа на питоне. Я не программист, нашел такую инструкцию, сделал всё по ней, но застопорился в этом месте, такую ошибку получаю:

NameError Traceback (most recent call last)
in ()
61 storage_client = storage.Client(project_id)
62 blobs = storage_client.list_blobs(bucket_name)
—-> 63 for blob in blobs:
64 print(blob.name)
65 list_blobs(bucket_name)

NameError: name ‘blobs’ is not defined

«На днях закончил работу над журналом, который готовил к 55-летнему юбилею мамы»
Это же какое ЧСВ должно быть у тебя и у твоей мамы что бы такие подарки вообще дарить

Так, ладно, шутки шутками, но скоро 8 марта, пойду доделывать газету для мамы :)))))

Классная ирония про газету)) В интернете, кстати, полно услуг по созданию именных журналов в подарок. Я делал всё сам, в т.ч. вёрстку, процесс от А до Я занял 3 недели. Если нет времени, можно отдать от 10 тыс. и выше, за вас всё сделают спец. фирмы)

Уважаемый Андрей, попробуйте сделать данный подарок своей маме, жене или сестре. Именинница оценит. Вам вовсе не обязательно заказывать тираж 5 тыс. экземпляров, чтобы распространять его через магазины посторонним лицам. Достаточно одного. Таким образом ваше ЧСВ и ЧСВ вашего близкого останется на адекватном умеренном уровне.

Я бы не оценила. Но у нас с вами разные представления о жизни и нашем месте в этом мире и жизни окружающих.

Через гугл переводчик вы можете только наговорить текст. Загрузить аудиофайл для транскрибации невозможно.

Комментарий удален по просьбе пользователя

Можно так завести и в системную диктовку, которая будет работать прямо в Ворде и оффлайн, если это важно (на маке точно, на Win10 вроде тоже есть подобное)

Согласна но там ограничение по символам, беда, Роман

Осталось только теперь БЕСПЛАТНО раздобыть программу по переводу 4К видео в диафильмы и привет 19 век!

Спасибо!
Не понимаю, почему с этим так тухло
Вот пара сервисов есть и хорошо
А софта оффлайн нормального нет

При том что сама технология в любом свежем андроиде есть

беда лишь в том, что андроид ненужон

Пользовался таким способом расшифровать текст: заходил в гугл переводчик, запускал распознавание текста по голосу и включал на фоне, собственно, сам файл. Там в настройках микшера немного надо повозиться, чтобы все работало, но это один из самых действенных и бесплатных способов расшифровать текст.

В Тринт можно загрузить файл по прямой ссылке. Если надо расшифровать видео с известного хостинга, например, ютуба, я делаю так:
1. Копирую url нужного видео
2. Иду на savefrom, чтобы «выдернуть» прямую ссылку на видео
3. Иду на Тринт, там выбираю функцию «добавить через url»

Готово. Существенная экономия времени.

Подскажитеплиз, как удалить карту с сайта trint.com? Есть только графа внесения новых данных карты, но мне оное не надо.

Подскажите пожалуйста, удалось удалить карту? у меня такая же проблема

Имеет смысл добавить в список https://speechtext.ai Использую долгое время (поддерживает много языков, в том числе и русский). Неплохо справляется с разными типами аудио (интервью, видео). Цена в разы ниже, чем Sonix и HappyScribe (меньше чем 3$ за час, HappyScribe (

Источник

Программы для транскрибации, которые помогут расшифровать речь в текст

Как перевести mp3 в текст

10 минут на чтение

Как перевести mp3 в текст

Если вы работаете с видео или аудио, то наверняка находитесь в поисках удобных программ для расшифровки речи в текст. Например, для субтитров или написания статей. В этом материале мы собрали сервисы и программы для транскрибации голоса в письменный формат.

Что такое транскрибация и зачем нужна расшифровка

Транскрибация — это расшифровка информации из аудио или видео в текстовую форму. Это может быть актуально для слабослышащих пользователей или для тех, кто предпочитает потреблять контент в беззвучном режиме, получая информацию из письменной речи.

Цель транскрибации — качественно перевести речь в текстовый формат, который человек будет хорошо понимать при прочтении.

Задачи расшифровки:

Расшифровка используется в субтитрах к видео, в статьях и постах, а также для анализа и исследований.

Ниже представлена таблица, в которой мы указали, где используют расшифровку.

Вид транскрибацииОсобенности
НадиктовкаАвтор читает подготовленный текст — медленно, с выражением и расстановкой знаков препинания. Текст может использоваться для статей, постов, ведения блога или написания материала в журнал
ЛекцияСтуденты записывают речь преподавателя на диктофон для дальнейшей расшифровки лекций, в тексте которых встречаются сложные термины и незнакомые имена. Используется, когда лектор быстро говорит — и записать материал в такой ситуации очень сложно
ПодкастФормат радио, в котором редко встречаются проблемы с речью. Подкаст может быть монологом или диалогом. При расшифровке нужно учитывать, кто говорит — обязательно укажите имя человека. Расшифровка нужна для субтитров
ИнтервьюФормат, в котором участвует двое и более человек. Расшифровка нужна для субтитров в видео, написания статьи или поста. Жесткая дословность не требуется, в приоритете — передать эмоции и главную мысль интервьюируемого
СинхронПохож на интервью. В кадре эксперт дает комментарий по какой-то теме, камера записывает не только голос, но и звуковой фон, который сопровождает запись
ВебинарРечь одного или нескольких экспертов вебинара. Расшифровка похожа на формат подкаста — нужно указать имя говорящего. Транскрибацию используют для субтитров, написания статьи или книги
Фокус-группаФокус-группа используется в маркетинговых исследованиях и социологических опросах. Сложный формат для расшифровки. Изначально все люди могут говорить спокойно, но под конец многие начинают перебивать друг друга. Чтобы этого избежать — задавайте вопросы каждому участнику по очереди. Расшифровка нужна для отчетов, анализа и исследований
КонференцияВ конференции есть ведущий (он же — модератор) и спикеры. Здесь также важно указать имя говорящего. Расшифровка используется для субтитров, написания статей и постов
Телефонные разговорыРасшифровка используется для анализа клиентов, сбора данных о них — интересы, потребности, боли и проблемы. Также это помогает улучшить качество работы менеджеров. Транскрибация звонков используется не только для бизнеса, но и для решения более специфических задач — например, силовики могут прослушивать разговоры потенциальных преступников
СубтитрыИспользуются в видео. Текст должен точно повторять речь говорящего. А чтобы разбить ее на подтемы — используйте тайм-коды
Монтажный листПрименяется в кино и клипах. Это таблица, в которой указаны кадры с репликами героев и техническими комментариями. Здесь нужно не только расписать речь персонажа, но и зафиксировать все, что в данный момент находится в кадре

Далее мы рассмотрим не только программы для автоматической транскрибации, но и сервисы для ручной расшифровки.

Автоматизация email рассылок

Отправляйте цепочки триггерных сообщений приветствия, брошенной корзины, реактивации, совмещая внутри одной цепочки email, SMS и web push.

Сервисы, которые облегчат ручную расшифровку

В этом разделе мы собрали подборку популярных сервисов для расшифровки аудио и видео в текст.

Google Docs

Google Docs — онлайн-сервис для работы с текстом и данными. Внутри платформы можно включить микрофон, который поможет перевести речь в письменный формат.

Чтобы активировать данную функцию, выберите «Создать документ». Далее в верхнем меню найдите раздел «Инструменты» и выберите «Голосовой набор». Либо зажмите кнопки «Ctrl+Shift+S» для вызова команды.

Пример, как работает расшифровка в Google Docs

Особенности:

Плюсы:

Минусы:

Speechpad

Speechpad — голосовой блокнот. Можно использовать на ПК и в смартфоне — есть приложения для Android и iOS. Также для браузера есть возможность подключить расширение «Голосовой ввод текста».

Вы можете наговорить текст в микрофон:

Пример работы голосового блокнота

Либо загрузить файл или URL в панель транскрибации для расшифровки:

Как перевести mp3 в текстПанель транскрибации файлов

Особенности:

Плюсы:

Минусы:

Dictation.io

Dictation.io — простой сервис расшифровки речи на английском языке.

Пример работы сервиса Dictation.io

Особенности:

Плюсы:

Минусы:

RealSpeaker

RealSpeaker — платный сервис транскрибации аудио- или видеофайлов. Первые полторы минуты расшифровываются бесплатно, далее за каждую минуту нужно платить 8 рублей. Максимальная длительность дорожки — 180 минут.

Для работы с сервисом достаточно выбрать язык озвучки, загрузить файл, рассчитать время расшифровки и оплатить услугу.

Как перевести mp3 в текстСервис RealSpeaker

Особенности:

Плюсы:

Минусы:

oTranscribe

oTranscribe — бесплатный сервис для самостоятельной расшифровки речи в текст.

Работа в сервисе oTranscribe

Особенности:

Плюсы:

Минусы:

Transcribe by Wreally

Transcribe by Wreally — универсальный сервис, в котором вы можете расшифровать файл или самостоятельно продиктовать текст. Подписка стоит 20 долларов в год. Есть тестовый период 7 дней, в котором вы можете безлимитно использовать самостоятельную расшифровку и 30 минут для автоматической транскрибации.

Пример, как работает сервис Transcribe by Wreally

Особенности:

Плюсы:

Минусы:

Алгоритм YouTube — встроенные субтитры

Субтитры YouTube — это возможность не только автоматически создать текст, но и самостоятельно расшифровать речь из видео.

Ниже показан пример, как работают автоматические субтитры: текст воспринимается нечетко. Если прозвучало иностранное слово, оно будет переделано под выбранный язык, а не переведено. Также если человек запнулся, алгоритм подберет свой вариант слова.

Как перевести mp3 в текстПример работы автоматических субтитров в YouTube

Чтобы самостоятельно расшифровать речь в YouTube, зайдите в «Творческую студию», перейдите в настройки видео и найдите раздел «Субтитры». В открывшемся окне выберите «Синхронизировать автоматически».

Как перевести mp3 в текстТворческая студия в YouTube

Особенности:

Плюсы:

Минусы:

Dragon Dictation

Dragon Dictation — платное приложение для iOS. Есть тестовый период на неделю, далее необходимо оформить подписку — 14,99 долларов в месяц.

Как перевести mp3 в текстИнтерфейс приложения. Источник

Особенности:

Плюсы:

Минусы:

Speechnotes

Speechnotes — онлайн-сервис для браузеров и приложение для Android. В онлайн-версии только расшифровка файлов платная — 0,1 доллар за минуту. А в приложении есть бесплатный тестовый период, далее нужно приобрести подписку за 69 рублей в месяц.

Скриншот того, как выглядит онлайн-версия, где можно надиктовать текст.

Как перевести mp3 в текстИнтерфейс онлайн-версии

Пример работы приложения:

Особенности:

Плюсы:

Минусы:

Zapisano.org

Zapisano.org — платформа, где профессиональные расшифровщики подготовят для вас текст или субтитры. Цена каждой расшифровки индивидуальна — все зависит от сложности работы. Стоимость одной минуты начинается с 19 рублей.

Как перевести mp3 в текстГлавная страница сайта

Чтобы отправить видео или аудио на расшифровку — загрузите файл или вставьте ссылку на облако, рассчитайте стоимость с помощью калькулятора, зарегистрируйтесь и оплатите услугу. Максимальное время расшифровки — до 6 дней. Можно заказать срочное выполнение работы — текст будет готов на следующий день.

Как перевести mp3 в текстКак оформить заказ на платформе

Особенности:

Плюсы:

Минусы:

Переводчик Google

Переводчик Google — сервис для перевода с одного языка на другой. Здесь вы можете надиктовать материал, трансформировать записанную речь в текст — и перевести его на другой язык. Либо включить видео или аудио на ПК или в соседней вкладке и дать сервису записать речь.

Как перевести mp3 в текстИнтерфейс сервиса Google Translate

Особенности:

Плюсы:

Минусы:

Переводчик от «Яндекса»

Переводчик от «Яндекс» — сервис работает по принципу Google Переводчика.

Как перевести mp3 в текстОбзор интерфейса Yandex Translate

Особенности:

Плюсы:

Минусы:

Rev — платный сервис с искусственным интеллектом. Транскрибация и создание видео стоят от 1,25 долларов.

Как перевести mp3 в текстГлавная страница сервиса Rev

Важно! Подобные сервисы с такими же функциями, но стоимость услуг у них выше: Transcription Panda и GoTranscript.

Особенности:

Плюсы:

Минусы:

Temi — еще один быстрый сервис от создателей Rev. Точность транскрибации — 90-95%. Бесплатно можно расшифровать 45 минут, далее требуется оплата — 0,25 долларов за минуту.

Как перевести mp3 в текстГлавная страница сервиса Temi

Особенности:

Плюсы:

Минусы:

Программы для транскрибации текста

А здесь мы собрали варианты программ для профессиональной работы с расшифровкой речи в текст.

Voco — программа для расшифровки речи в текст на Windows. Есть тестовый период на 14 дней. Платная базовая версия стоит 1867 рублей.

Программа для транскрибации текста — Voco

Особенности:

Плюсы:

Минусы:

Express Scribe

Express Scribe — программа от Windows, которая поддерживает редактор текста Word. В бесплатной версии можно работать только с аудиофайлами. Расширенная версия стоит 59,99 долларов.

Как перевести mp3 в текстПрограмма для транскрибации видео — Express Scribe

Особенности:

Плюсы:

Минусы:

Lossplay

Lossplay — бесплатная программа для Windows, которая предназначена для ручной расшифровки. Выглядит как плеер и напоминает Winamp.

После установки программы вам необходимо будет загрузить кодеки из пакета K-Lite Codec Pack и QuickTime для возможности проигрывания всех поддерживаемых медиа-форматов.

Обзор сервиса Lossplay

Особенности:

Плюсы:

Минусы:

Transcriber Pro

Transcriber Pro — платная программа для профессиональной ручной расшифровки речи. Стоит 799 рублей в год.

Обзор программы Transcriber Pro

Особенности:

Плюсы:

Минусы:

Расширение для браузера

Ниже представлен список расширений для браузера, которые помогут вам работать с транскрибацией в любое время.

VoiceIn Voice Typing

VoiceIn Voice Typing — расширение создано на основе распознавания речи от Google. Оно позволяет использовать расшифровку на любом сайте и при этом работать в любом редакторе. Есть пробная версия с минимальными возможностями. Подписка стоит 25 долларов в год.

После установки расширения разработчик рекомендует закрыть браузер и загрузить его снова, чтобы распознавание речи сработало.

Как перевести mp3 в текстСкриншот настроек и блокнота, куда записывается голос

Важно! Ряд похожих расширений для браузера — Speech Recognition Anywhere и Voice to Text.

Особенности:

Плюсы:

Минусы:

Заключение

В этой статье мы рассмотрели программы для транскрибации — узнали их особенности, плюсы и минусы. Вы можете использовать не только готовые сервисы, в которых люди или ИИ будут расшифровывать файлы, но и самостоятельно заняться транскрибацией аудио и видео.

Рекомендации по работе с расшифровкой:

А чтобы отслеживать потребности клиентов и поддерживать с ними связь в любое время суток — регистрируйтесь в сервисе SendPulse и подключайте наши инструменты: используйте CRM и конструктор лендингов, отправляйте email, Viber и SMS рассылки, а также подключайте чат-боты в таких мессенджерах, как ВКонтакте, Facebook Messenger, Telegram и WhatsApp!

Как перевести mp3 в текст

Журналист без диплома, копирайтер без сертификатов, тексты без воды, трафик без проблем

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *