close-btn

Google добавит 110 новых языков в Переводчик

Google добавляет 110 новых языков в Google Translate, что является крупнейшим расширением за всю историю

Google добавит 110 новых языков в Переводчик

Google добавит 110 новых языков в Переводчик Фото: pngwing.com, freepik.com, commons.wikimedia.org

В 2022 году компания добавила 24 новых языка с помощью машинного перевода Zero-Shot, когда модель машинного обучения учится переводить на другой язык, даже не видя примера. Впоследствии компания объявила об инициативе добавить 1000 самых распространенных языков в мире.

Языковая поддержка для более чем полумиллиарда людей

От кантонского до Q’eqchi, эти новые языки представляют более 614 млн носителей, открывая доступ к переводам для около 8% населения планеты. Некоторые из них являются основными мировыми языками с более чем 100 миллионами носителей. На других говорят небольшие общины коренных народов, а некоторые почти не имеют носителей, но активно возрождаются. Около четверти новых языков происходят из Африки, что является самым большим расширением африканских языков на сегодняшний день, в частности фон, киконго, луо, га, свати, венда и волоф.

Интересное по теме: Google отменяет функцию непрерывной прокрутки страниц в поиске

Как Google выбирает языки

При добавлении новых языков в Переводчик нужно учитывать много факторов. Языки очень разнообразны: региональные разновидности, диалекты, различные стандарты правописания.

На самом деле, многие языки не имеют единой стандартной формы, поэтому невозможно выбрать «правильный» вариант. Подход компании заключается в том, чтобы отдать приоритет самым распространенным разновидностям каждого языка. Например, ромский — это язык, который имеет много диалектов по всей Европе. Модели создают текст, наиболее близкий к южному варианту языка, который чаще всего используется в интернете. Но в нем также смешаны элементы из других.

«PaLM 2 стал ключевым элементом пазла, который помог Translate эффективнее изучать языки, которые тесно связаны между собой, в частности языки, близкие к хинди, такие как авадхи и марвади, а также французские креольские языки, такие как сейшельский креольский и маврикийский креольский языки. С развитием технологий и продолжением сотрудничества с экспертами-лингвистами и носителями языков мы будем поддерживать еще больше языковых разновидностей и правописных конвенций со временем», — написали в Google.

Ознакомьтесь с другими популярными материалами:

Альткоины, которые чаще всего ищут в Google: стоит ли покупать

Google интегрировал ИИ-функции в Gmail

Google работает над ИИ, который может озвучивать видео

По материалам: Blog.Google.

google news