Как казахстанец и компания Philips создали микрофоны, которые преобразуют казахскую речь в текст

13303

Новая технология заинтересовала госорганы и уже работает в Telegram как чат-бот

Оркен Мамырбаев
ФОТО: ciseventsgroup.com
Оркен Мамырбаев

Заместитель генерального директора РГП «Институт информационных и вычислительных технологий» Оркен Мамырбаев рассказал Forbes.kz о своем проекте и сотрудничестве с компанией Philips. Он посвятил свою научную деятельность развитию государственного языка и сейчас занимается проектами, связанными с искусственным интеллектом и компьютерной лингвистикой.

Оркен Мамырбаев разработал систему распознавания речи на казахском языке, которая преобразует ее в текст. Система Kazakh ASR может определять различные голоса и интонации, а точность преобразованного текста составляет 80%.

Разработка велась три года. В проекте помимо Оркена Мамырбаева было задействовано 8 человек - сотрудников ИИВТ. А также свыше тысячи студентов из трех университетов. Их привлекали для сбора речевых данных и создания большой акустической модели. После разработки системы и ее тестирования на диктофонах собственной сборки, проектом заинтересовалась компания Philips и предложила сотрудничество. 

- У них есть оборудование, у нас ПО. Нам предложили внедрить наше ПО в их smart-микрофоны, которые могут быть использованы и как диктофоны. Мы уже произвели первую партию микрофонов и сейчас будем заниматься их реализацией, - объясняет Оркен Мамырбаев.

ФОТО: личный архив

Микрофоны способны распознавать два разных голоса, которые звучат одновременно, и автоматически преобразовывать речь в текст на два разных канала.

- Если говорить об алгоритме, то программное обеспечение загружается в компьютер. Далее подсоединяем микрофон и начинаем говорить. Устройство автоматически распознает два разных голоса и в двух блоках выводит текст на казахском языке. Такой микрофон полезен во время рабочих совещаний для протоколов, заседаний в госорганах, везде, где может понадобиться сохранение информации в виде текста, - говорит ученый.

Продуктом уже заинтересовались в акиматах. По словам Оркена Мамырбаева с некоторыми из них, например, с акиматом Семея, уже есть договоренности на поставку этих систем.

Также система распознавания речи на казахском языке вызвала интерес в МЦРИАП. Ведомство обратилось к Оркену Мамырбаеву за разработкой речевого управления для незрячих людей на сайте egov.kz

Кроме того, интеллектуальная система Kazakh ASR уже работает в социальной сети Telegram как чат-бот.

- Чтобы воспользоваться этим инструментом, нужно нажать и удерживать кнопку голосового сообщения. После окончания записи бот превратит ваши голосовые сигналы в текст. Ведутся переговоры с одной компанией для внедрения этого инструмента и в мессенджер WhatsApp, - рассказал Мамырбаев.

Аудиосистемы не единственное направление, в котором работает команда ученого. В данный момент Оркен Мамырбаев также занимается разработкой проекта по поиску криминально значимой информации в соцсетях и создания ПО для отслеживания кибербуллинга.

   Если вы обнаружили ошибку или опечатку, выделите фрагмент текста с ошибкой и нажмите CTRL+Enter

Орфографическая ошибка в тексте:

Отмена Отправить