Meta представила перекладач, призначений для роботи з мовами, які не мають письмової форми
Майже половина приблизно з 7000 відомих у світі мов (чотири з десяти) існують без письмового компонента. Ці неписані мови є унікальною проблемою для сучасних систем перекладу з машинним навчанням, яким зазвичай необхідно перетворювати усне мовлення в письмове, перш ніж перекладати іншою мовою.
У рамках програми Universal Speech Translator (UST), яка працює над створенням перекладача в режимі реального часу, (щоб жителі метавсесвіту могли легше взаємодіяти), фахівці Meta вивчили Хоккієн, безписьмову мову, якою розмовляють в азіатській діаспорі, і яка є однією з офіційних мов Тайваню.
Велика кількість слів у Хоккієні не мають стандартного відображення у китайській писемності і записуються або в фонетичній транскрипції латинськими символами, або ієрогліфами, що збігаються по фонетиці, безвідносно того, наскільки вони підходять за лексичним значенням. При цьому не існує стандарту — дві людини можуть написати одне й те саме слово по-різному. Тому розробникам довелося зробити подвійний переклад, використовуючи класичну китайську (Mandarin) як проміжну мову.
Дослідники Meta зосередилися на розробці системи speech-to-speech. За словами представників компанії, вони перетворили зразки мови на послідовність акустичних звуків, які використовувалися для створення хвильових форм мови. Потім ці сигнали об’єднали з мандаринським китайським для створення міток.
Компанія опублікувала вихідний код проекту, щоб інші дослідники могли використовувати його у своїх роботах. На додаток до моделей та навчальних даних, Meta випускає першу у своєму роді систему порівняльного аналізу speech-to-speech перетворення, засновану на мовному зведенні Хокієна під назвою Taiwanese Across Taiwan, а також SpeechMatrix, яка є великою колекцією перетворень мови в мову, розроблену за допомогою набору інструментів для обробки природної мови під назвою LASER.
Раніше ми писали, що Meta відкриває 10 віртуальних кампусів, щоб перевести навчання в університетах у метавсесвіт.
ЧИТАЙТЕ ТАКОЖ:
- Керівництво Meta змусить своїх співробітників користуватися віртуальним всесвітом
- Слідом за Meta: Google представив генератор відеороликів за текстовими запитами
- Капіталізація Meta впала до мінімального за більш ніж три роки рівня