Во время посещения сайта Вы соглашаетесь с использованием файлов cookie, которые указаны в Политике обработки персональных данных.

Новые языки в Google Переводчик: компания расширила перечень почти вдвое

 

Google Переводчик — один из самых популярных онлайн-сервисов для перевода текстов на разные языки мира. Его использование удобно для выполнения как личных, так и профессиональных целей. В последнее время в интернете активно ходили слухи о том, что Google собирается существенно расширить количество поддерживаемых языков, и недавно появилась новость, что предсказание сбылось — вышло новое обновление сервиса. Теперь в списке переводов можно найти языки, которыми раньше пользователи хотели оперировать, но не могли.

Как Google обучил систему и сколько языков стало после обновления

Для того чтобы качественно добавлять новые языки в Google Переводчик, команда разработчиков использует передовые технологии машинного обучения. “Обучением” занялся искусственный интеллект крупной языковой модели PaLM. В основе лежит анализ огромных объемов текстов, переводов и языковых структур. Сначала алгоритм обучается на больших массивах данных, а затем его обучают различным нюансам конкретных языков.

До недавнего обновления Google Переводчик поддерживал 133 языка. Благодаря последнему расширению список увеличился до 243 языков.

Как Google выбирает языки для добавления

Добавление новых языков в Google Переводчик — процесс, который требует взвешенного подхода. Компания учитывает несколько ключевых факторов при выборе языков:

  • Количество носителей. Чем больше людей говорит на языке, тем выше вероятность его добавления. Google стремится сделать сервис полезным для максимально широкого круга пользователей.
  • Доступность ресурсов для обучения. Чтобы обучить систему переводу на определенный язык, нужно иметь доступ к качественным текстовым ресурсам на этом языке. Если таких данных мало, процесс усложняется.
  • Культурная значимость. Google также учитывает языки, которые играют важную роль в культуре, несмотря на их малую распространенность. Так компания поддерживает лингвистическое разнообразие и культурное наследие народов.

Новые языки, использующиеся в РФ

Особого внимания заслуживают языки, которые используются на территории Российской Федерации. В последнем обновлении были добавлены 13 языков, на которых говорят представители различных народов России. Среди них:

  • Аварский — один из крупнейших языков Дагестана, являющийся родным для аварцев. На нем говорят более миллиона человек, и он используется как официальный язык в республике.
  • Башкирский — тюркский язык, на котором говорят башкиры, проживающие в основном в Республике Башкортостан и соседних регионах России. Является одним из государственных языков Башкортостана наряду с русским.
  • Бурятский — монгольский язык, на котором говорят буряты, проживающие преимущественно в Республике Бурятия, Забайкальском крае и Иркутской области России. Является официальным языком Бурятии.
  • Чеченский — язык нахской группы кавказских языков, на котором говорят чеченцы, проживающие преимущественно в Чеченской Республике и прилегающих регионах. Чеченский язык является официальным в Чечне наряду с русским.
  • Чувашский — тюркский язык, на котором говорят чуваши, проживающие главным образом в Чувашской Республике и соседних регионах России. Он является официальным языком Чувашии и отличается от других тюркских языков своей уникальной лексикой и фонетикой. Чувашский язык делится на два основных диалекта — верхнечувашский и низовочувашский.
  • Осетинский — язык иранской группы, на котором говорят осетины, проживающие в основном в Северной и Южной Осетии. Он является официальным языком в Республике Северная Осетия — Алания. Осетинский язык делится на два основных диалекта — иронский и дигорский.
  • Удмуртский — финно-угорский язык, на котором говорят удмурты, проживающие преимущественно в Удмуртской Республике и соседних регионах России. Он является одним из государственных языков Удмуртии.
  • Чукотский — язык чукотско-камчатской группы, на котором говорят чукчи, проживающие на Чукотке и в некоторых районах Дальнего Востока России. Это один из официальных языков Чукотского автономного округа.
  • Тувинский — тюркский язык, на котором говорят тувинцы, проживающие в Республике Тыва и соседних регионах России. Он является официальным языком Тувы и имеет несколько диалектов;
  • Якутский — язык тюркской группы, на котором говорят якуты, преимущественно в Республике Саха (Якутия). Он является официальным языком республики и имеет собственную письменность на основе кириллицы.
  • Крымско-татарский — тюркский язык, на котором говорят крымские татары, преимущественно в Крыму и среди диаспоры. Язык имеет несколько диалектов, основными из которых являются кримский, табасаранский и яланецкий. Крымско-татарский язык использует латинскую и кириллицу, в зависимости от исторического контекста.
  • Коми — финно-угорский язык, на котором говорят коми, проживающие в Коми Республике и соседних регионах России. Является одним из официальных языков Республики Коми. Он также использует кириллицу для письма и активно используется в образовании и средствах массовой информации;
  • Луговомарийский — один из марийских языков, относящийся к финно-угорской языковой семье. На нем говорят луговые марийцы, преимущественно в республиках Марий Эл и соседних регионах России. Луговомарийский язык имеет свою письменность на основе кириллицы и включает несколько диалектов.

Эти языки играют ключевую роль в жизни их носителей, и добавление их в Google Переводчик поможет сохранению и развитию национальных культур. Теперь пользователи из регионов смогут переводить тексты на родные языки и получать доступ к глобальной информации, что важно в контексте цифровой глобализации.

Что говорят специалисты о новом обновлении Google Переводчика

Больших изменений в последней версии приложения нет, однако по функциональности, наличию и внедренным изменениям в мобильной и компьютерной версии онлайн-сервис превосходит своих конкурентов, в том числе Яндекс.Переводчик.

Расширение перечня поддерживаемых языков в Google Переводчике — важный шаг, который открывает новые возможности для миллионов людей по всему миру. Теперь пользователи могут переводить тексты на 243 языка, включая редкие и малораспространенные языки, что делает онлайн-сервис еще более универсальным и доступным. Google продолжает следовать своему курсу на развитие технологий, поддерживая языковое и культурное разнообразие планеты.

Популярное