Master-X
Форум | Новости | Статьи
Главная » Статьи » Поисковые системы » Законы PageRank » 
СТАТЬИ

Законы PageRank


  Сейчас давайте на время забудем об этой формуле, потому что намного нагляднее рассмотреть пример ее применения, который очень похож на метод PageRank. Это поможет нам лучше понять весь процесс.

  Для этого примера, у нас есть четыре страницы —условно озаглавленные Страница А, Страница В, Страница С и Страница D. Они связаны друг с другом, как показано на следующей диаграмме.



  Для начала, мы не знаем, какое значение PageRank у страниц, поэтому мы просто его присвоим. Для простоты, выберем номер один. И диаграмма с графиком PageRank приобретет вид...



  Пока все просто! Сейчас нужно запомнить правила передачи коэффициента. Сначала, мы применяем понижающий коэффициент. (Понижающий коэффициент, в основном, сообщает, что страница не может голосовать за другую страницу, определяя ее важность, равную своей собственной важности. Это значит, что страницы, до которых сложнее добраться в сети, имеют меньшую важность). Затем мы делим оставшееся значение на количество ссылок. Мы распределяем ту часть коэффициента, которую нужно передать всем и каждой ссылающейся странице, прежде чем, в конечном счете, прибавить к 0.15, которое на передавалось.

  Итак, посмотрим сначала на Страницу А. Значение PageRank, доступное для передачи другим страницам, после понижения составит 1 * 0.85 = 0.85. На этой странице две гиперссылки, поэтому, в конечном счете, мы прибавим 0.425 к значению PageRank страницы В и 0.425 — к значению PageRank страницы С. Сделать это мы сможем, лишь после подсчета ссылок на всех страницах, в противном случае мы получим искаженные результаты.

  Далее, Страница В. На ней всего одна гиперссылка. Поэтому она передает 1 * 0.85 Странице С, после подсчета значений для всех ссылок.

  Страница С также содержит только одну гиперссылку. Поэтому она передает 1 * 0.85 = 0.85 Странице А.

  На странице D одна гиперссылка, и она передает 0.85 Странице С.

  Каждая страница не передает 0.15, поэтому общая сумма включает и эту составляющую. Итак, мы получаем:

  Страница А - 0.85 (от Страницы С) + 0.15 (не передаваемое) = 1

  Страница В - 0.425 (от Страницы А) + 0.15 (не передаваемое) = 0.575

  Страница С - 0.85 (от Страницы D) + 0.85 (от Страницы В) + 0.425 (от Страницы А) + 0.15 (не передаваемое) = 2.275

  Страница D - не получает ничего, но сохраняет непередаваемое значение 0.15 = 0.15

  Графически:



  Новые суммы PageRank показывают, насколько важна Страница С. Но мы еще не закончили. Поскольку все страницы стартовали с одинаковыми значениями, мы, фактически, подсчитали только популярность ссылок (link popularity). Суть PageRank состоит в том, что лучше "связанные" страницы должны получить большее число голосов; поэтому мы должны снова повторить расчеты. На этот раз Страница С имеет большее влияние, потому что ее текущий PageRank выше.

  Итак, давайте посмотрим сначала на Страницу А. Ее текущий PageRank равен 1. Сумма MiniRank, доступная к передаче, после понижения, составит 1 * 0.85 = 0.85. Так как имеется две гиперссылки, в конце процесса мы должны передать 0.425 Странице В и 0.425 Странице С.

  Страница В. Одна гиперссылка — передается 0.575 * 0.85 = 0.48875 Странице С, по завершении всех расчетов, связанных со ссылками.

  На Странице С тоже только одна ссылка, но убойный PageRank 2.275. Поэтому она передает 2.275 * 0.85 = 1.93375 Странице А.

  Страница D содержит одну ссылку, и передает 1 * 0.85 = 0.85 Странице С.

  В результате имеем:

  Страница А — 1.93375 (от Страницы С) + 0.15 (не передаваемое) = 2.08375

  Страница В — 0.425 (от Страницы А) + 0.15 (не передаваемое) = 0.575

  Страница С — 0.1275 (от Страницы D) + 0.48875 (от Страницы В) + 0.425 (от Страницы А) + 0.15 (не передаваемое) = 1.1925

  Страница D — не получает ничего, но сохраняет непередаваемое значение 0.15 = 0.15

  Графически:



  Но ведь это не может быть правильно!? Страница А сейчас самая важная. Повторим цикл расчетов снова и снова. В конечном счете, значения стабилизируются, и после 20 повторений мы получаем:



  У-ух! Наконец мы получили то, что ожидали. Страница С имеет самый высокий PageRank, а Страница А — следующий. Мы продолжаем повторять вычисления, пока числа не будут изменяться слишком значительно. На практике, нужно сделать порядка 50 — 100 циклов расчетов, чтобы сгладить и минимизировать большую погрешность первых вычислений.
09.12.02
Источник: Black Box Group.
Автор: Chris Ridings. Перевод: av.
Стр. « первая   <  1, 2, 3, 4, 5  >  последняя »


Эта страница в полной версии