Отрицательные индикаторы качества блог-документа определяются на этапе «шаг 630». Это может быть частота добавления новых постингов в блог-документ, содержание постингов в блог-документе, размер постингов в блог-документе, распределение ссылок блог-документа и наличие рекламных объявлений в блог-документе. Допустимо использование и других индикаторов.
Частота добавления новых постингов в блог-документ может использоваться в качестве отрицательного индикатора качества этого блог-документа. Обычно фиды содержат только самые последние постинги в блог-документ. Спаммеры генерируют новые постинги пакетами (т.е., множество новых постингов появляется в течение короткого промежутка времени) или в течение предсказуемых интервалов (один постинг в 10 минут, или постинг каждые 3 часа на 32 минуте). Оба сценария связаны с недобросовестными намерениями, и могут использоваться для обнаружения потенциальных спаммеров. Таким образом, если частота добавления новых постингов в блог-документ вписывается в предсказуемый алгоритм, это может стать отрицательным индикатором при оценке качества блог-документа.
Контент постингов в блог-документе может стать отрицательным индикатором качества этого блог-документа. Фид обычно содержит некоторую часть или весь контент нескольких постингов из данного блог-документа. Сам блог-документ также содержит контент постингов. Спаммеры могут помещать одну из версий своего контента в фид, чтобы улучшить его ранкинги в результатах поиска, при этом сам блог-документ будет содержать другую версию контента (к примеру, ссылки на нерелевантные объявления). Несоответствие (между фидом и блог-документом) может стать отрицательным индикатором качества блог-документа.
В некоторых случаях контент может дублироваться в нескольких постингах блог-документа, в результате чего в нескольких фидах будет содержаться один и тот же контент. Подобное дублирование свидетельствует о низком качестве/спамовости фида и может стать отрицательным индикатором качества блог-документа.
Слова/фразы, используемые в постингах блог-документа, также могут стать отрицательным индикатором качества этого блог-документа. К примеру, из коллекции блог-документов и фидов, которые были оценены редакторами как спам, может извлекаться список слов и фраз (биграмм, триграмм, и т.д.), которые часто появляются в спам-контенте. Если блог-документ имеет высокое содержание слов или фраз из этого списка, подобное может стать отрицательным индикатором при оценке качества блог-документа.
Размер постингов в блог-документе может стать отрицательным индикатором качества блог-документа. Зачастую автоматические генераторы постингов создают многочисленные постинги одинаковой или очень мало различающейся длины. В результате распределение размеров постингов может использоваться как надежный критерий для оценки спамовости. Когда блог-документ содержит множество постингов одинаковой или очень схожей длины, это может стать отрицательным индикатором при оценке качества блог-документа.
Распределение ссылок в блог-документе может стать отрицательным индикатором качества блог-документа. Как указывалось ранее, некоторые постинги создаются для увеличения PageRank отдельного блог-документа. В некоторых случаях, большой процент всех ссылок с постинга или с блог-документа указывают на отдельную веб-страницу или на отдельный сторонний сайт. Если количество ссылок на сторонний сайт превышает некоторый предел, это может отрицательно сказаться на качестве блог-документа.
Наличие рекламных объявлений в блог-документе может стать отрицательным индикатором качества блог-документа. Если блог-документ содержит большое количество объявлений, это может отрицательно сказаться на качественной оценке этого блог-документа.
Блог-документы, обычно, содержат три типа контента: контент в виде недавних постингов, блог-лист, и блог-метаданные (т.е., данные об авторе, другая уместная информация о блог-документе и его авторе). Рекламные объявления, если таковые присутствуют, обычно размещаются в разделе метаданных блога, или возле раздела блог-ссылок. Наличие объявлений в разделе недавних постингов может стать отрицательной характеристикой блог-документа.
05.05.07
Источник:
uspto.gov.
Автор:
Google. Перевод:
Seva.