"Яндекс" признал плохой работу "Яндекс.Новостей" во время протестных акций


Люди идут по проезжей части Тверской улицы во время несогласованной акции. Фото: Филипп Киреев

Представители "Яндекса" ответили на претензии пользователей "Яндекс.Новостей" и признали, что вчера, 26 марта, сервис отставал от картины дня, а на главной странице почти не было новостей о протестных акциях, прошедших в ряде российских городов.

"Ведомости": Сюжет о задержании Навального исчез из главных новостей "Яндекса"

"Медуза": Многие российские СМИ (почти) не заметили массовых протестов. И топ "Яндекса" тоже

TJ: Было ли в топе "Яндекс.Новостей" слишком мало сюжетов об антикоррупционных митингах

Навальный: За "Яндекс" сегодня просто стыдно. Проституция как на Первом канале. И хватит уже врать "это алгоритм"

"Многие посчитали, что Яндекс сознательно убирал новостные сюжеты об акциях протеста из топа Яндекс.Новостей, и обвинили нас в цензуре, не особенно разбираясь в происходящем. Это не так: никакого ручного вмешательства быть не может, работа Яндекс.Новостей по-прежнему полностью подчиняется алгоритмам.

Мы чувствуем необходимость объяснить, как именно выглядел топ новостей в течение 26 марта — и почему. Во-первых, различные новости, связанные с антикоррупционными митингами, были на главной Яндекса. Во-вторых, они периодически исчезали и появлялись снова.

Как формируется топ-5 новостей?

Любая тема, которую освещают СМИ, состоит из отдельных новостей. Алгоритм Яндекс.Новостей объединяет похожие новости в сюжеты. Для большой темы о митингах, прошедших по всей России, было сформировано несколько сюжетов, которые касались самых разных аспектов — от оценки количества участников в Москве до задержаний во Владивостоке. Дальше автоматически оценивается вес каждого сюжета. Для этого используется много факторов — состав источников, плотность потока информации, время публикации сообщений, вес других сюжетов на ту же тему. Сюжеты ранжируются по весу, первые пять попадают на главную страницу Яндекса. Топ обновляется и, соответственно, изменяется — вчера это происходило каждые три-четыре минуты.

Что происходило с новостями про митинги?

В момент начала акции — она стартовала на Дальнем Востоке — событие освещали далеко не все СМИ. В результате в первой половине дня сюжеты формировались лишь из сообщений небольших источников, и некоторое время, примерно до 12:15 по Москве, их общего веса не хватало, чтобы вынести тему в топ-5.

Из-за чего сюжеты о протестах пропадали из топ-5?

На это могли влиять другие темы. Несколько раз в течение дня появлялись популярные сюжеты. Например, про Евровидение или помощника депутата, а в Москве — про весенний фестиваль. Их вес был больше, чем вес сюжетов про акции протеста. Более того, в некоторых случаях вес мог быть завышен — в Яндекс.Новостях существует недобросовестная оптимизация, аналогичная поисковой, и мы с ней боремся.

При этом, разумеется, сами новости о митинге никуда не исчезали — они оставались в Яндекс.Новостях и корректно находились поиском.

Может, вы стали как-то по-другому считать вес? Раньше такого не было.

Нет, принципы подсчёта не изменились. Изменился состав источников. В связи с принятием закона о новостных агрегаторах Яндекс.Новости с января 2017 года могут показывать на главной странице, в сюжетах и в тематических рубриках только материалы СМИ, зарегистрированных в Роскомнадзоре. Поэтому количество источников по сравнению с прошлым годом сократилось — это также влияет на вес сюжетов. И если о гололёде в Москве вчера написали практически все городские источники, то о протестах только те, кто решил об этом писать. В таком случае у двух разных сюжетов оказываются неравные шансы на выход в топ.

А вам не кажется, что вес сюжетов о митингах был недостаточен, если они пропадали из топа?

Кажется. Мы признаём, что вчера Яндекс.Новости отставали от картины дня. Скорее всего, дело в том, что алгоритм кластеризации, который склеивает новости в сюжеты, а сюжеты — в темы, не всегда мог объединять в одну тему, например, сообщения о задержаниях во Владивостоке и об аресте Навального в Москве. Иными словами, временами агрегатор мог рассматривать одну большую, сложную и географически обширную тему про протесты как несколько разных тем, что, в свою очередь, могло повлиять на качество работы сервиса. Точно так же алгоритм срабатывает, когда есть много новостей про ДТП с разными людьми в разных городах. Он полагает, что это разные события, и не объединяет их в общий сюжет.

Пока неточная работа алгоритма кластеризации — всего лишь гипотеза; мы по-прежнему разбираемся, как 26 марта сообщения в Яндекс.Новостях собирались в сюжеты и в темы. Если ошибки и правда были, мы будем на них учиться. Однако ситуация в целом непростая — мы агрегатор, и искусственно поднимать ту или иную тему в условиях молчания крупных СМИ, очевидно, не можем".

"Яндекс"



А был ли митинг?

Навальный арестован на 15 суток

По итогам вчерашних протестов


Медведев рассказал про свои выходные: дела неплохо, на лыжах покатался 😜

Антиправительственная акция в Москве: Трансляция окончена

Антиправительственные митинги по всей России: Трансляция окончена






Мы создали НОВЫЙ канал в Telegram для оперативного обмена новостями: t.me/varlamov_news. Подписывайтесь!

Если вы стали очевидцем какого-либо события или просто обнаружили важную новость, присылайте ее нам через бота: @VarlamovBot.

Не забудьте подписаться на нас в других соцсетях:

Ютуб: youtube.com/c/ivarlamov
Вконтакте: vk.com/varlamov
Фейсбук: facebook.com/varlamov
Инстаграм: instagram.com/varlamov
promo varlamov.ru november 17, 2011 20:24 150
Buy for 2 000 tokens
В этом блоге можно разместить рекламный пост. Ежемесячная аудитория – более 2 млн. уникальных посетителей. Для тех, кто просто хочет скачать прайс, есть эта ссылка. Для тех, кто хочет посмотреть полную презентацию со статистикой, портретом аудитории и моими предложениями по рекламе, есть…
← назад
То, что хуяндекс - членососы-подстилки стало ясно, когда эти трусы убрали рейтинг блогов со своей страницы.

Стыдно работать в яндексе, стыдно юзать их приложения и сайты.

Говеная компания членососов.
то, что они ссыкуны никак на цену их акций не влияет

поэтому ссать хоть и непочетно
но и неубыточно
МВД по тому же принципу работает: не позволяет собраться вместе, разделяет, локализует и ликвидирует.
Суть претензий к Яндексу не очень понятна. Ясен пень, что если Яндекс делает выборку самых важных новостей из путинских СМИ, то Навальный в эти новости никак не может попасть, потому что путинские сми о Навальном молчат. Какие тут могут быть к Яндексу претензии? Другое дело, что яндексовский агрегатор при таком раскладе нахрен никому не всрался, потому что путинские сми - унылый отстойник желтухи и дешёвой пропаганды, а делать из них выборку - бессмысленно.

Edited at 2017-03-27 15:20 (UTC)
Да не будет уже никто восстанавливать аккаунты и счетчики, из тех кто удалил
Вообще,Яндекс давно " отстает" от картины дня.Зато от властей претензий нет.они выбрали,но и мы выбираем
Яндекс вообще от всего отстаёт. И поисковик у них говняный, так ещё кучу левых сервисов прикрутили, которые всё равно толком не работают. Как "Почта России" прям.
Яндекс пишет правильные новости.
Такими деньгами не шутят.
Например сейчас первой новостью у Яндекса Фантазии Пескова про подкуп подростков во время митингов.
Не о судьбе 700 задержанных, не об Аресте Навального а новость с целью опорочить и принизить значение Димонстрации.

Edited at 2017-03-27 13:13 (UTC)
Так я не понял, власти всё-таки предоставили другую площадку для проведения митинга, как говорится сегодня во многих про властных СМИ, или нет, как говорил сам Навальный?
Давай угадаю: тебе щас ответят положительно о предоставленной площадке и ты начнешь вещать и крутить тему о том, что "навальныйсамвиноват".

Не рыпайся, хуила, ты слишком туп и предсказуем.
Это все последствия закона о новостных агрегаторах
Теперь Яндекс может собирать новости только с официально зарегистрированных СМИ. Ну и сколько официальных СМИ писало о митингах? Виноват не Яндекс, а закон.

Edited at 2017-03-27 13:04 (UTC)
Re: Это все последствия закона о новостных агрегаторах
Ну конечно! Кто бы мог подумать!

ЗАКОН!

Он виноват во всем!

– Добрый день, Закон! Как вы прокомментируете свое решение обязать яндекс собирать новости только с официальных и подконтрольных правительству новостных агенств?
– Ну, хм... а-а-а, хм... я просто так решил.
– На вас оказывали давление члены правительства и подведомственные ему органы?
– Нет, ну что вы! Это исключительно мое решение!
яндекс той же самой кнопкой у путена на пульте отключается как и все остальные расиянские сми.
Вот это все, что требуется знать об алгоритме.
Робот-аггрегатор лазит по новостным сайтам, собирает новости. А вот какие это сайты - очевидно же.
← назад