Чтобы повлиять на алгоритмы Google, необходимо изменить модель поведения в интернете целой нации

Проблема использования беларусского языка в сервисах компании Google на протяжении многих лет остается неразрешенной: Беларусский не входит в перечень языков, поддерживаемых компанией. В результате этого возникают проблемы для беларусов – как с получением беларусскоязычного контента, так и с его продвижением. Можно ли это изменить и что каждый из нас может сделать на своем уровне? Попытались разобраться.

Снимок имеет иллюстративный характер. Фото: pexels.com

Проблема

То, что Google «не дружит» с беларусским языком, – проблема совсем не новая. Она периодически поднимается в СМИ, но после краткого обсуждения снова утопает в трясине аргументов: мол, беларусы сами мало пользуются своим языком, а компании Google необходимо держать огромный штат сотрудников, чтобы обеспечивать полноценное функционирование беларусского языка на своей платформе. Это экономически невыгодно. Поэтому – все понимаем, но бизнес есть бизнес.

Еще в 2019 году Франак Вячорка, который на тот момент занимал пост вице-президента Digital Communication Network подчеркивал, что Google фактически «похоронил» беларусский язык.

«Google действительно не пропускает беларусскоязычные ролики на рекламу на YouTube и на других своих платформах. Они считают, что мало контента создается на этом языке, они прекратили поддержку, они перестали нанимать людей, которые вычитывают этот язык. И действительно беларусскоязычным каналам и медиа невозможно раскрутиться, так как контент попросту не пропускают. Это глупость», – отмечал Вячорка в интервью Алине Ковшик на «Белсате».

В результате проблемы с белорусскоязычным контентом в сервисах Google, которые мы сегодня имеем, так и остаются нерешенными.

Капля в море русскоязычного контента

Проблема первая – беларусскоязычный утопает тонет в море контента русскоязычного. Преимущественно из-за того, что русскоязычный контент проходит индексацию несравнимо быстрее, чем даже идентичный контент, но созданный по-беларусски. Индексацией называется процесс сбора, анализа и хранения данных с веб-сайтов и последующее их добавление на страницы поисковых систем. Без индексации сайты и контент на них попросту не могут отображаться в результатах поисковиков – будь то Google, Yahoo, «Яндекс» или какой другой.

Это влечет за собой следующую проблему, которую в 2022 году хорошо описало издание Media IQ: беларусские СМИ, в первую очередь независимые (которые как раз чаще пользуются беларусским языком), очень слабо представлены в сервисах Google и при освещении международных событий практически игнорируются. В результате беларусы остаются под влиянием российского медиаполя.

Так, например, аналитики издания делают вывод, что «беларусский взгляд на украинско-российскую войну практически не представлен в выдаче Google для беларусского пользователя», несмотря на то, что Zerkalo.io и «Белсат» ежедневно публикуют сводки с украинского фронта.

Проблема с рекламой

Следующая проблема – это невозможность давать рекламу по-беларусски в сервисе Google Ads.

Так, еще с 2018 году компания ограничила возможность платного продвижения видеоконтента в YouTube списком из 44 языков (сегодня он увеличился до 51 языка), в котором беларусский язык отсутствует. Согласно установленным тогда правилам, как подчеркивал Франак Вячорка, модераторы должны были проверять видеоконтент на предмет разжигания ненависти и фейков. В результате беларусскоязычный контент перестал проходить модерацию, так как язык не поддерживается, а все, кто работал на нем, столкнулись с проблемой и потеряли аудиторию.

Снимок иллюстративного характера. Фото: freepik.com

Все это привело к тому, что ролики на беларусском языке, размещенные на «гугловском» сервисе YouTube, не монетизируются, а их создатели не получают деньги. Способом обойти это стало то, что на беларусскоязычных YouTube-каналах названия видео и их описания даются по-русски. Пока что только такой способ позволяет продвигать собственный беларусскоязычный контент беларусским пользователям, хотя выглядит это очень странно.

В чем дело

Одной из наиболее очевидных причин отказа от модерации контента на беларусском языке является финансовый фактор. Для отслеживания всего, что выходит на беларусском языке, компании Google необходимо набрать дополнительных сотрудников в команду. Но поскольку контента по-беларусски создается не очень много по сравнению с русскоязычным или даже украиноязычным, то окупить затраты на созданную команду будет проблематично. Такую позицию высказал глава Ассоциации профессиональных пользователей социальных сетей и мессенджеров Владимир Зыков в интервью «Коммерсанту». «Не будет столько контента, чтобы окупить хотя бы зарплату модераторам», – отметил он несколько лет назад.

Следующая причина – Google не выделяет нашу страну как отдельный регион и не помогает искать новости по-беларусски, соответственно Беларусь попадает в медийное поле Российской Федерации, так как в нашей стране русский язык является вторым государственным.

Но есть еще две причины, которые привели к тому, что Google не считает необходимым включать беларусский в список поддерживаемых языков. Одна – довольно прозаичная: беларусы не пользуются беларусским языком и набирают в поиске запросы по-русски, а вторая – когда беларусы набирают запрос по-беларусски, то количество беларусскоязычного контента, который они получают в выдаче, мизерное. Почему? Потому что этого контента очень мало.

Соответственно алгоритмы Google и YouTube предлагают пользователям вместе с несколькими ссылками сайтов по-беларусски целую массу русскоязычного контента. И это та проблема, с которой мы начали нашу статью.

Таким образом, получается дилемма типа «яйцо или курица»: это из-за того, что беларусы не пользуются беларусскоязычным контентом, или из-за того, как алгоритмы Google не отображают его в поиске, либо это контент не индексируется потому, что беларусы им не интересуются?

Украинский опыт

Наши южные соседи имели (да и на самом деле имеют и сейчас) проблемы подобного порядка: алгоритмы Google выдавали непропорционально много русскоязычного контента по сравнению с украиноязычным. И это несмотря на многолетнюю государственную языковую политику и более высокий процент самосознания среди украинцев, благодаря чему контента на родном языке в Украине создавалось куда больше, чем в Беларуси. При этом надо отметить, что украинский язык как раз таки поддерживается Google.

Сильно изменило ситуацию начало полномасштабной войны в 2022 году: российская агрессия спровоцировала стремление большого количества украинцев сознательно отказываться от языка оккупантов. Это отразилось и на поведении украинских пользователей в интернете: они стали делать больше запросов на родном языке и искать больше украиноязычного контента.

Об этом свидетельствуют исследования: так, согласно опросу, проведенному Киевским институтом социологии, получается, что количество пользователей украинского языка в интернете существенно возросло в 2022 году по сравнению с 2017-м, в то время как использование русского языка значительно сократилось.

Количество украинцев, пользующихся украинским и русским языками в интернете, в 2017 и 2022 годах. Источник: zn.ua

Подтверждается это и нашим собственным анализом: мы посмотрели в Google Analytics статистику использования некоторых пар слов на украинском и русском языках за период с января 2021 года по сентябрь 2023 года (для сравнения были взяты пары слов с высокой частотой использования):

  • новости / новіни
  • война / війна
  • Зеленский / Зеленьський
  • Путин / Путін
  • помощь / допомога
  • раненый / поранений

На графике 1 отображены русскоязычные запросы с использованием этих слов. На графике 2 – украиноязычные.

График 1. Количество русскоязычных запросов с использованием выборки частотных слов. Источник: Белсат
График 2. Количество украиноязычных запросов с использованием выборки частотных слов. Источник: Белсат

Как видно, до полномасштабного вторжения России в Украину (обозначен пиком на графиках) количество запросов что по-русски, что по-украински колебалось в районе 1,8 миллиона пользователей. Но после февраля 2022 года украиноязычные запросы стали преобладать, и в итоге с паритета 50 на 50 эта пропорция стала выглядеть как 30 на 70 в пользу украинского языка.

На фоне высокой востребованности украинского языка и роста его популярности украинские СМИ стали активно публиковать статьи с рекомендациями о том, как уменьшить количество российского контента или вообще исключить его при поиске информации в Google.

Среди прочего, там есть рекомендации, которые могут быть использованы и беларусами: например, изменить в настройках аккаунта Google (в меню «Личная информация») язык на беларусский; удалить из приоритетных языков русский язык (это будет означать, что вы будете видеть меньше контента на русском). В этом же меню можно отключить автоматическое добавление языков (ведь алгоритмы Google будут знать, что вы владеете русским языком, и могут позже добавить его автоматически). Также рекомендуется очистить кэш и историю браузера, а также файлы cookie.

Благодаря тому, что целая нация одновременно изменила свое поведение при поиске в интернете, это дало свои результаты. И сейчас отмечается, что алгоритмы компании Google стали выдавать в поиске больше украинского контента.

Но решило ли это проблему полностью? Если судить по тому, что в конце октября 2023 года жена президента Украины Елена Зеленская во время встречи с представителями Google обратилась к руководству корпорации с просьбой «дерусифицировать» поисковую сеть, а также рекомендации на YouTube, то можно предположить, что вопрос остается острым до сих пор. И это несмотря на войну, желание украинцев отмежеваться от всего, что связано с Россией, и активные действия, чтобы изменить алгоритмы Google.

А что беларусы?

Беларусы, понимающие актуальность проблемы, также неоднократно предпринимали попытки решить этот вопрос.

Еще в 2019 году представители беларусского медиасообщества, в том числе главные редакторы крупных онлайн-изданий, выступили с инициативой декларации о необходимости географической локализации интернет-сервисов и признания интернет-сегмента Беларуси отдельным рынком. Подписанты декларации ставили своей целью добиться от глобальных интернет-корпораций признания Беларуси в качестве отдельного рынка и географически локализовать сервисы.

В 2020 году также была создана отдельная петиция на Change.org, которая была подписана почти 32 тысячами человек и отправлена в американский офис Google. Ее создатель Дмитрий Бурдыко отмечал, что столкнулся с тем, что Google Ads «не хочет» давать рекламу на беларусском языке, «хотя понимает ее и распознает». В сопровождении к петиции ее создатель писал, что все попытки дать рекламу блокируются, и отмечал невозможность дать ссылку на страницу сайта на беларусском языке.

Аннетт Кробер-Риель, Светлана Тихановская и Лесли Миллер. Фото: Пресс-служба Тихановской

В феврале 2023 года избранный президент Беларуси Светлана Тихановская и представители Объединенного переходного кабинета встретились с вице-президентом YouTube по связям с правительствами и публичной политике Лесли Миллер, а также с вице-президентом Google по связям с правительствами и публичной политике в Европе Анетт Кробер-Риель.

На встрече демократический лидер подняла актуальные вопросы, которые помогут решить проблему беларусского языка в продуктах Google и YouTube:

  • разрешить монетизацию контента на беларусском языке в продуктах Google и YouTube;
  • разрешить рекламировать беларусскоязычные видеоролики на YouTube;
  • прекратить злоупотребление рекламными инструментами со стороны российских и лукашенковских пропагандистов;
  • обеспечить доступ к сайтам и каналам независимых медиа, признанных режимом Лукашенко экстремистскими, через поисковые системы и другие инструменты Google.

Что происходит сейчас

Чтобы понять, есть ли сейчас какие-либо контакты между беларусскими демократическими силами и представителями ІТ-гигантов и делается ли сегодня что-то для того, чтобы изменить ситуацию с беларусским языком в популярных интернет-сервисах, мы поговорили с советником Светланы Тихановской Франаком Вячоркой.

Он отметил, что окружение Светланы Тихановской находится в постоянной коммуникации как с компанией Google, так и с представителями других организаций.

Относительно компании Google наш собеседник отметил, что все ее основные сервисы переведены на беларусский язык, поэтому обозначил бы ситуацию как «не критическую». При этом он сообщил, что есть некоторые сервисы, которые стоят в плане на локализацию на беларусский язык, а в компании заверили представителей офиса в том, что каждые 3-6 месяцев будут выходить какие-то «апдейты», чтобы было все больше сервисов Google на беларусском языке.

Что же касается поддержки беларусскоязычной рекламы, то Франак Вячорка подчеркнул, что проблема с модерацией контента существует до сих пор: «Роботы не обучены проверять рекламу, если там есть беларусскоязычный контент, и модераторы очень часто не имеют такой возможности». Поэтому если беларусские компании настраивают рекламу, то очень часто это не проходит техническую проверку. Вячорка отметил, что Google ищет возможности решения этого вопроса.

Касательно проблемы рекомендации беларусского контента в поиске Франак Вячорка подчеркнул, что она более сложная и может решаться с помощью «ручной модерации»: многие беларусские сайты работают по-русски, а алгоритмы Google не обучены распознавать, где сайт с беларусским контентом, а где с контентом российских пропагандистов. В этом плане команда Светланы Тихановской делится с компанией своими рекомендациями, чтобы беларусские СМИ имели приоритет, или хотя бы не попадали в «бан» Google.

Что делать обычным беларусам

Франак Вячорка подчеркнул, что для того, чтобы техкомпании активнее использовали беларусский язык, всегда важны любые публичные кампании: сбор подписей, письма с просьбами добавлять беларусскоязычный контент, запросы.

«Это никогда не будет лишним, так как это только укрепляет наш аргумент, чтобы было больше контента на беларусском. Важно, чтобы статистика свидетельствовала в нашу пользу – чтобы у большего количества беларусов был настроен беларусскоязычный интерфейс. Если беларусы будут заходить на беларусскоязычные сайты, то это лучший аргумент для того, чтобы Google больше инвестировал в беларусский язык. Многое в руках самих пользователей. Беларусам нужно просто приучить самих себя сознательно выбирать беларусскоязычный контент, писать комментарии на беларусском языке, создавать больше контента на беларусском языке, тогда он будет выше цениться сервисом Google», – отметил наш собеседник.

При этом Франак Вячорка отметил, что в Офисе Светланы Тихановской создан специальный отдел по сотрудничеству с техкомпаниями, чтобы принимать запросы от беларусов, беларусских организаций, СМИ, НПО. Чтобы рассказать о своей конкретной проблеме, можно писать на адрес tech@tsikhanouskaya.org: так, например, можно обращаться, если нужно разблокировать какой-то ресурс, либо наоборот, заблокировать пропагандистский видеоролик, а также по многим другим вопросам.

Роман Шавель / Авер belsat.eu

Падпісвайся на telegram Белсату

Новости