Распознавание речи осуществляется с помощью облачного сервиса или локально с использованием скачанной модели распознавания. При локальном варианте аудиоданные никуда не будут отправляться, что может быть важно при особых требованиях к конфиденциальности. Использование облачного «1С:Распознавания речи» происходит без нагрузки на оборудование пользователя и упрощает реализацию распознавания речи, особенно при большом объеме аудиоданных.
Мы постоянно работаем над улучшением качества распознавания речи и добавляем новые возможности. Все улучшения сначала появляются в облачном режиме и только потом становятся доступными в локальном варианте, поэтому качество распознавания речи в облачном и локальном вариантах может отличаться.
Для ознакомления с механизмом распознавания речи доступно демоприложение (конфигурация 1С), которое позволит распознавать речь из потокового аудио или звуковых файлов с помощью облачного сервиса или локально. Реализованные в демоприложении возможности можно заимствовать для встраивания распознавания речи в различные прикладные решения на платформе «1С:Предприятие 8».
Потоковое распознавание – пользователь отправляет аудиоданные в режиме реального времени, в ответ периодически получает распознанный текст. Удобно при диктовке текста или при управлении интерфейсом программы.
Длительность одного сеанса при потоковом распознавании речи с помощью облачного сервиса имеет ограничение в 2 часа. При локальном распознавании речи ограничений длительности сеанса нет.
Файловое распознавание – пользователь отправляет на распознавание файл с аудиозаписью и в ответ получает идентификатор задачи, по которому в дальнейшем сможет получить результат распознавания. В данном случае пользователь может отправить готовый аудиофайл, например, запись совещания. Распознанный текст будет предоставлен пользователю с задержкой, которая зависит от длительности аудиофайла и текущей загрузки облачного сервиса.
Файловое распознавание может обрабатывать многоканальные аудиозаписи, в этом случае каждый канал будет распознаваться и тарифицироваться независимо. Для распознавания принимаются форматы аудио WAV signed 16 bit little-endian и Opus в контейнере ogg. Частота дискретизации аудио – от 8 кГц до 48кГц. Максимальный размер аудиофайла – 1Гб длительностью до 4 часов. Результаты распознавания доступны для скачивания в течение 7 суток после выполнения задания.
В настоящее время поддерживается распознавание речи на русском и английском языках. В дальнейшем состав доступных языков планируется расширять.
Облачный продукт «1С:Распознавание речи» доступен средствами встроенного языка платформы «1С:Предприятие 8» с версии 8.3.23 и может быть встроен в любое пользовательское приложение 1С.
Программа 1С, в которую встраиваются механизмы распознавания, должна быть на официальной поддержке.
При локальном распознавании речи рекомендуется учитывать минимальные требования к ресурсам оборудования:
Использование распознавания речи в локальном режиме не тарифицируется.
В облачном режиме стоимость зависит от типа распознавания и длительности аудио.
Примерно 1 час потокового аудио или 4 часа файлового аудио
Тестовый тариф доступен в течение 1 года с момента активации, предоставляется однократно
Примерно 27 часов потокового аудио или 110 часов файлового аудио
1000 руб./год
Примерно 270 часов потокового аудио или 1100 часов файлового аудио
9000 руб./год
Примерно 2 700 часов потокового аудио или 11 000 часов файлового аудио
80 000 руб./год
Примерно 13 500 часов потокового аудио или 55 000 часов файлового аудио
350 000 руб./год
По окончании срока действия тарифа или при списании всех включенных в него единиц использование распознавания речи будет приостановлено.
Поддержка пользователей обеспечивается партнерами и линией консультаций фирмы «1С» по электронной почте ailab@1c.ru.
Сценарии использования и демопримеры работы с механизмом распознавания речи включены в документацию по встроенному языку платформы 1С (см. раздел «Инструкции по разработке на 1С» на сайте Информационной системы 1С:ИТС).
При усовершенствовании работы сервиса для пользователей могут становиться доступными обновленные и экспериментальные версии моделей распознавания речи. "Поведение платформы 1С:Предприятие" при использовании экспериментальных моделей распознавания речи может отличаться от документируемого для основных моделей.
С радостью ответим на все ваши вопросы по телефону: