Створено навушники з алгоритмом, який керує 20 видами звуків

Вчені розробили навушники з алгоритмом на основі штучного інтелекту (ШІ), за допомогою яких користувачі можуть обирати конкретні види звуків та керувати ними

Навушники. Фото: freepik.com

Авторами пристрою стали дослідники із Вашингтонського університету. Вони створили систему глибокого навчання, вбудовану у навушники, яку назвали «семантичним слухом».

Вона вміє прибирати весь шум фону, передаючи записаний звук на підключений смартфон. Алгоритм зараз розрізняє близько 20 видів звуків, які користувачі можуть посилити або вимкнути за допомогою голосових команд або програми для смартфона. Середи них сирени, дитячі крики, мова, звуки пилотяга, щебетання птахів, голоси тварин та інше. Після налаштувань навушники оброблятимуть лише обрані звуки.

«Розуміння того, як звучить птах, і виділення його з усіх інших звуків у навколишньому середовищі вимагає інтелекту в реальному часі, чого не можуть досягти сучасні навушники з шумом придушення. Проблема в тому, що звуки, які чують користувачі навушників, повинні синхронізуватися з їх візуальними відчуттями. Тому потрібно обробляти звуки менш ніж за соту частку секунди», – пояснив старший автор опублікованої наукової статті Шьям Голлакота, професор Вашингтонського університету.

Читайте також: Створено окуляри, які дозволять незрячим «бачити» за допомогою звуків

Фото: dl.acm.org

Через обмеження в часі замість використання більш надійних хмарних серверів система «семантичного слуху» вибирає процес, заснований на шумах, що передаються через смартфон. При цьому, щоб люди могли продовжувати ефективно сприймати звуки навколишнього середовища, система повинна підтримувати ці затримки та інші просторові сигнали. Оскільки звуки, що виходять із різних напрямків, досягають вух людей за різний час.

Вчені проводили експерименти в різних умовах, в тому числі на вулиці, в парках та офісах. Результати показали, що навушники з ШІ можуть ізолювати цільові звуки (наприклад, сирени) і водночас усувати фоновий шум. Що стосується виведення бажаних звуків, то 22 учасники оцінили його вище, ніж вихідні шумові записи.

Водночас система іноді мала проблеми з розпізнаванням звуків, які здались їй дуже схожими. Наприклад, людська мова та вокальна музика. Зараз розробники намагаються розв’язати цю проблему. За їх словами, «семантичний слух» показав би набагато кращі результати, якби її моделі машинного навчання ШІ отримали більше реальних даних.

Раніше ми повідомляли, що вчені з Дюкського університету розробили імплант для мозку, за допомогою якого можна спілкуватись лише на основі думок. Пристрій повинен допомогти людям, які страждають на мовні розлади або нездатні на вербальне спілкування з тих чи інших причин.

Ознайомтеся з іншими популярними матеріалами:

Google Chrome додає функцію читання вебсторінка вголос

Alibaba запустила моделі ШІ, які розуміють візуальний контент

Lenovo представляє споживчі AR-окуляри, які можна прив’язати до iPhone

Джерело: Interesting Engineering