Яндекс научился искать в реальном времени

Статус
В этой теме нельзя размещать новые ответы.

jabbaxatt

Добрый модератор
Регистрация
21 Янв 2009
Сообщения
902
Реакции
433
Интернет, 9 июля 2010 года. Яндекс разработал и внедрил новую поисковую технологию, которая позволяет находить совсем свежие документы — через минуты после их появления в интернете.

Достаточно много поисковых запросов (от 2% в спокойные дни до 8% в дни важных событий) посвящено событиям, которые случились совсем недавно. Задавая эти запросы, пользователи ожидают найти в том числе и документы, которые были созданы только что. Чтобы хорошо отвечать на такие запросы, Яндекс, во-первых, научился выявлять их среди общего потока, и во-вторых, внедрил нового поискового робота — Orange. Orange работает в режиме реального времени. Он умеет находить свежие документы, как только они появились в интернете, индексировать их и выкладывать на поисковые сервера буквально за несколько секунд.

Некоторые сайты интернета обновляются не очень часто, а на других — например, на новостных ресурсах — новые документы создаются постоянно. Orange обходит такие сайты и добавляет новые документы в поиск по мере их появления, без задержек.

Чтобы определять, нужна ли свежая информация в ответ на те или иные запросы, Яндекс разработал несколько детекторов. Они анализируют самую разную информацию — например, тематику сообщений в СМИ или рост количества поисковых запросов по той или иной теме.

«В интернете сейчас все больше real-time информации, которая нужна людям прямо сейчас. И мы хотим дать им возможность находить её прямо сейчас, — говорит Федор Романенко, менеджер качества поиска. — Это только первый шаг, конечно, мы будем улучшать качество поиска по новостным запросам и дальше. Новая технология дает возможность делать это сравнительно легко».

Робот Orange и технология поиска в реальном времени были разработаны специалистами из Yandex.Labs — калифорнийского офиса компании — в сотрудничестве с разработчиками из московского офиса. Подробнее о новых технологиях можно почитать в блоге Яндекса.

Источник - company.yandex.ru/news/press_releases/2010/0709/index.xml
 
Если проверить робота по любому рейтинговому сайту СМИ, то материалы не точто через 2 минуты через 1-2 часа не появляются. Наверное робот еще на тесте.

А Вот вам как яндекс определяет первоисточник. Для просмотра ссылки Войди или Зарегистрируйся
На первой страницы company.yandex.ru даже нет
 
Побывал. Добавил новый материал на
Скрытое содержимое доступно для зарегистрированных пользователей!
. Даже через 2 часа яндекс не всилах обнаружить его по ключевым словам. Вывод один или новая технология не работает или ещё не на стадии внедрения.

jabbaxatt - ссылки под хайд, пожалуйста. Таковы правила.
 
объявить - объявили, но пока не работает ))) как обычно, в общем-то... теперь будут подкручивать алгоритмы..
наверное, сначала заработает только для крупнейших новостных порталов
 
Чем от быстробота отличается, не ясно.
 
отличается тем что сидит на новостных, трастовых сайтах, от гугла отстает минут на 20, т.е. появляется в поиске минут через 40, но опять же выборка идет максимум по 100 сайтам СМИ ИМХО
 
сидит на новостных, трастовых сайтах, от гугла отстает минут на 20, т.е. появляется в поиске минут через 40, но опять же выборка идет максимум по 100 сайтам СМИ ИМХО
Бот просто часто заходит на главные новостных сайтов?
 
Побывал. Добавил новый материал на Для просмотра ссылки Войди или Зарегистрируйся. Даже через 2 часа яндекс не всилах обнаружить его по ключевым словам. Вывод один или новая технология не работает или ещё не на стадии внедрения.

Или сайт ***но и яндексу не нужен. Да врядли робот по всем сайтам шерстит, как выше сказали по избранным. Но их много побольше сотни мне кажется.
 
У меня варез-сайт. Обновления постоянною, а материал добавляется не сразу у выдачу, примерно на слудуещей день. Хотя бот постоянно по сайту прогуливается.
 
У меня варез-сайт. Обновления постоянною, а материал добавляется не сразу у выдачу, примерно на слудуещей день. Хотя бот постоянно по сайту прогуливается.

Orange бот или быстроробот?
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху