История ранкинга
Google может отслеживать историю того, как ранжировался сайт с течением времени, а также данные, связанные с этим.
Сюда входят следующие параметры:
Сайт, который "резко поднялся в ранкинге по множеству запросов, может быть либо топиковым документом, либо это сигнал о попытке проспамить поисковую систему"
"Количество или уровень того, насколько документ продвинулся в ранкингах за определенный промежуток времени, может быть использован как коэффициент при определении последующих оценок".
Сайты могут получать вес в соответствии с их позициями в результатах поиска, где топовый результат получает высшую оценку, а последующие сайты получают прогрессивно уменьшающиеся оценки. Google использует следующее равенство:
[((N+1)-SLOT)/N]
где
N = количество измеренных результатов запросов
SLOT = позиции в ранкинге оцениваемого сайта
В этом уравнении первый результат получает оценку 1.0, а последний результат получает оценку, близкую к 0.
Google может отдельно проверять "коммерческие запросы", и документы, которые наберут Х% в ранкингах, "могут быть помечены, или может отслеживаться процентный рост ранкинга" для определения, "насколько велика вероятность спама".
Google, также, может отслеживать:
"Уровень, на котором страница/сайт выбирается как результат поискового запроса с течением времени"
Сезонность - флуктуации, зависящие от месяца или года
Скачкообразность - неожиданные всплески или падения количества кликов
Другие характеристики CTR
Уровень изменения в оценках в зависимости от времени может измеряться для того, чтобы определить, не становится ли поисковый термин более/менее конкурентным, и не нужно ли уделить ему дополнительное внимание.
Google "может отслеживать ранкинг документов с течением времени, чтобы уловить внезапные всплески ранкингов".
Это может означать, в соответствии с Патентом, "либо топиковый феномен (т.е. популярный топик), либо попытку спама поисковой системы".
Google может использовать превентивные меры против спама посредством:
"Использования гистерезиса, позволяя ранкингу расти до определенного предела" - гистерезис, в данном случае, скорее всего означает процесс, который прекращает рост ранкинга. Этот термин имеет множество разнообразных определений.
Ограничение "максимальной границы роста в течение определенного промежутка времени" для данного сайта/страницы.
Google, также, будет "учитывать упоминания документа в новостных статьях, на форумах, и т.п., исходя из того, что спамовые документы упоминаться не будут".
Определенные типы сайтов/страниц (Google особо выделяет "правительственные документы, веб-директории (подобные Yahoo!) и документы, которые показали относительно стабильный и высокий ранкинг с течением времени) могут наделяться иммунитетом против "всплескового" трекинга и наказаний.
Google может, также, "рассматривать значительные падения в ранкинге документов как свидетельство того, что эти документы "не пользуются популярностью" или устарели".
Данные, предоставляемые/генерируемые пользователем
Google старается измерять множество различных типов агрегированных данных, которые пользователи хранят на своих компьютерах, о посещениях веб-узлов. Сюда входят:
Букмарки и списки "Избранное" в браузерах
Они стремятся получить эти данные либо посредством "ассистента браузера" - через тулбар или поиск на рабочем столе, или
Напрямую через браузер - могу предположить, что они разрабатывают свой собственный Google Browser
Google будет использовать эти данные с течением времени, чтобы предвосхищать, насколько важен данный сайт или страница
Google, также, стремится документировать добавления и удаления из "Избранного" и букмарок с течением времени, чтобы облегчить процесс определения важности сайта/страницы
Google будет отслеживать, также, как часто пользователи заходят на сайт/страницу через свои браузеры, чтобы понять, остается ли страница релевантной, или уже потеряла актуальность ("устарела" или "стала непопулярной").
Google может наблюдать за "temp и cache файлами, ассоциированными с пользователем", чтобы определить стили посещений в сети и установить "растущие или убывающие тенденции относительно интереса" к данному сайту/странице.