Baidu разрабатывает ИИ для перевода звуков животных на человеческий язык

Китайская компания уже подала заявку на патент данной технологии

Фото: © pexels.com/Tranmautritam

Китайская технологическая компания Baidu подала заявку на патент искусственного интеллекта, предназначенной для перевода звуков и поведения животных на язык, понятный человеку. Как пишут китайские СМИ, заявку на патент этой технологии подали еще в декабре 2024 года, но Национальное управление интеллектуальной собственности Китая опубликовало ее только в мае 2025-го.

Согласно описанию, система анализирует различные типы «данных» животных, включая «голос, язык тела, поведенческие изменения и другие биологические признаки». Затем система определяет «эмоцию», и преобразует ее в понятные человеку формулировки.

По данным Baidu, эта технология использует несколько подобластей ИИ, включая машинное обучение, которое позволяет компьютерам обучаться на основе больших наборов данных; глубокое обучение, которое использует нейронные сети для анализа характеристик голоса и движений; обработку естественного языка, которая применяет вычислительные подходы к анализу и синтезу естественного языка и речи. Если система не распознаёт эмоцию, информация маркируется вручную для дальнейшего обучения модели.

В Baidu уточнили, что технология пока находится на стадии исследований. Разработчики не раскрывают, будет ли запущено отдельное приложение. Компания заявила, что «постоянно ищет возможности для применения ИИ в новых сценариях». Также уточняется, что публикация патентной заявки еще не означает, что она уже выдана. По словам Ю Юнтина, старшего партнера Shanghai Debund Law Firm, процесс оценки заявки может от года до пяти лет.

Перевод «языка» животных — направление, которое исследуется не впервые. В 2000-х годах японская Takara выпустила устройства Bowlingual и Meowlingual для перевода лая собак и мяуканья кошек. Были и краудфандинговые инициативы, такие как No More Woof, но они не достигли коммерческого успеха. Сегодня на рынке Китая представлено множество мобильных приложений, заявляющих о подобных функциях, однако, как отмечает Baidu, существующие решения часто опираются только на один источник данных, что ограничивает точность интерпретации.