В Мичиганском университете изучают, как искусственный интеллект (ИИ) может быть использован для расшифровки собачьего лая.
Модель искусственного интеллекта потенциально может извлекать информацию из вокализации животных, включая возраст, породу и пол собаки. Исследователи также полагают, что она может определить, является ли лай игривым или агрессивным.
В рамках проекта учёные адаптировали модель обработки речи, которая ранее была обучена изучению человеческой речи.
В сотрудничестве с Национальным институтом астрофизики, оптики и электроники (INAOE) в Мексике команда обнаружила, что эта модель может послужить отправной точкой для обучения новым системам общения животных.
Разработка модели искусственного интеллекта для распознавания лая собак ранее была затруднена из-за отсутствия общедоступных данных. Хотя образцы, взятые у людей, легко записывать, при сборе записей животных существует больше ограничений.
Исследователи говорят, что с точки зрения логистики записывать вокализации животных сложнее, поскольку их необходимо записывать либо в дикой природе, либо, для домашних питомцев, с разрешения владельцев.
Существующие голосовые технологии, такие как преобразование голоса в текст и языковой перевод, обучены распознавать нюансы человеческой речи. Инструменты способны различать тон, высоту тона и акцент для перевода речи и идентификации говорящих.
Команда адаптировала эту модель, используя набор данных о вокализациях 74 разных собак — разной породы, возраста и пола. Затем эти записи были использованы для модификации модели машинного обучения.
Модель искусственного интеллекта не только справилась с четырьмя различными задачами классификации, но и превзошла другие модели, специально обученные лаю собак, с точностью до 70%.
Полное исследование можно найти здесь.
Источник: MRCVS