close-btn

Google додасть 110 нових мов в Перекладач

Google додає 110 нових мов до Google Translate, що є найбільшим розширенням за всю історію

Google додасть 110 нових мов в Перекладач

Google додасть 110 нових мов в Перекладач Фото: pngwing.com, freepik.com, commons.wikimedia.org

У 2022 році компанія додала 24 нові мови за допомогою машинного перекладу Zero-Shot, коли модель машинного навчання вчиться перекладати іншою мовою, навіть не бачачи прикладу. Згодом компанія оголосила про ініціативу додати 1000 найпоширеніших мов у світі.

Мовна підтримка для понад півмільярда людей

Від кантонської до Q’eqchi, ці нові мови представляють понад 614 млн носіїв, відкриваючи доступ до перекладів для близько 8% населення планети. Деякі з них є основними світовими мовами з понад 100 мільйонами носіїв. Іншими розмовляють невеликі громади корінних народів, а деякі майже не мають носіїв, але активно відроджуються. Близько чверті нових мов походять з Африки, що є найбільшим розширенням африканських мов на сьогоднішній день, зокрема фон, кіконго, луо, га, сваті, венда та волоф.

Цікаве по темі: Google скасовує функцію безперервної прокрутки сторінок у пошуку

Як Google обирає мови

При додаванні нових мов до Перекладача потрібно враховувати багато факторів.  Мови дуже різноманітні: регіональні різновиди, діалекти, різні стандарти правопису.

Насправді, багато мов не мають єдиної стандартної форми, тому неможливо вибрати «правильний» варіант. Підхід компанії полягає в тому, щоб надати пріоритет найпоширенішим різновидам кожної мови. Наприклад, ромська — це мова, яка має багато діалектів по всій Європі. Моделі створюють текст, найбільш близький до південного варіанту мови, який найчастіше використовується в інтернеті. Але в ньому також змішані елементи з інших.

«PaLM 2 став ключовим елементом пазла, який допоміг Translate ефективніше вивчати мови, які тісно пов’язані між собою, зокрема мови, близькі до гінді, такі як авадхі та марваді, а також французькі креольські мови, такі як сейшельська креольська та маврикійська креольська мови. З розвитком технологій і продовженням співпраці з експертами-лінгвістами та носіями мов ми підтримуватимемо ще більше мовних різновидів і правописних конвенцій з часом», — написали в Google.

Ознайомтеся з іншими популярними матеріалами:

Альткоїни, які найчастіше шукають у Google: чи варто купувати

Google інтегрував ШІ-функції в Gmail

Google працює над ШІ, що може озвучувати відео

За матерілами: Blog.Google.

google news