Master-X
Форум | Новости | Статьи
Главная » Статьи » Поисковые системы » Патент Google: Ранжирование блог-документов. Часть 2 » 
СТАТЬИ

Патент Google: Ранжирование блог-документов. Часть 2


Поле идентификатора документа 510 хранит информацию, идентифицирующую блог-документы. Информация может содержать уникальный идентификатор. Поле качественного показателя 520 может хранить качественный показатель для каждого блог-документа, идентифицированного полем 510. Доступ к базе данных 500 может осуществляться в ответ на поисковый запрос, полученный сервером 220. Сервер 220 может повышать, понижать, или полностью удалять блог-документ (т.е. блог и/или блог-постинг) из набора результатов поиска, на основании коэффициента качества, хранящегося в поле 420.

Определение коэффициента качества для блог-документа.

Рис. 6 содержит потоковую карту процесса определения коэффициента качества для блог-документа в реализации, соответствующей принципам данного изобретения. Обработка может начинаться с получения информации об оцениваемом блог-документе (шаг 610). Информация может содержать сам блог, постинг, метаданные блога, и/или дополнительные источники данных, связанные с блог-документом.

Положительные индикаторы качества блог-документа определяются на этапе «шаг 620». Индикаторы могут включать в себя популярность блог-документа, подразумеваемую популярность, присутствие блог-документа в блог-листингах, присутствие блог-документа в ведущих блог-листингах, тэггинг блог-документа, ссылки на блог-документ с других ресурсов, а также PageRank блог-документа. Возможно использование и других индикаторов.

Популярность блог-документа может служить положительным индикатором качества этого блог-документа. Некоторые новостные сайты (обычно называемые «news readers» или «feed readers») существуют за счет того, что пользователи могут подписываться на блог-документ (доставляемый с помощью фида сайта). Подобные аггрегаторы хранят информацию о том, сколько человек подписалось на тот или иной блог-документ. Большее количество подписчиков на блог-документ подразумевает более высокое качество этого блог-документа. При этом подписки должны проверяться на «подписной спам» (когда спамеры подписываются на собственные блог-документы, пытаясь сделать их «более популярными») – путем проверки уникальности подписчиков, или путем отслеживания уникальных IP-адресов подписчиков.

Подразумеваемая популярность блог-документа может быть определена, к примеру, путем оценки клик-потоков в результатах поиска. Если определенный блог-документ привлекает внимание чаще, чем другие блог-документы в результатах поиска, то это может свидетельствовать о популярности блог-документа и, соответственно, служит положительным индикатором качества блог-документа.

Существование блог-документа в блог-листингах может служить положительным индикатором качества блог-документа. Поощряется, также, если блог-документы содержат не только недавние записи (постинги), но и «блог-листингы» - краткие коллекции ссылок на сторонние сайты (обычно другие блоги), которые интересны автору/блоггеру. Ссылка в блог-листинге на блог-документ служит индикатором популярности блог-документа, поэтому совокупность ссылок на блог-документ в блог-листингах учитывается и используется для оценки масштаба популярности блог-документа.

Существование блог-документа в блог-листинге известного или заслуживающего доверия блоггера также служит положительным индикатором качества блог-документа. В подобной ситуации предполагается, что известный или заслуживающий доверия блоггер не станет ссылаться на блоггера-спаммера.

Тэггинг блог-документа может служить положительным индикатором качества блог-документа. Некоторые сайты позволяют пользователям добавлять «тэги» (т.е., «категоризировать») в блог-документ. Подобные тэги служат свидетельством того, что владелец оценил контент блог-документа и определил одну или более категорий, которые больше всего подходят для его контента – это само по себе служит положительным индикатором качества блог-документа.

Ссылки на блог-документ с других ресурсов могут служить положительным индикатором качества блог-документа. К примеру, контент электронных писем или стенограмм чатов может содержать URL блог-документов. Электронное письмо или обсуждение в чате, которые содержат ссылки на блог-документ, служат положительным индикатором качества блог-документа.

PageRank блог-документа может служить положительным индикатором качества блог-документа. Высокий PageRank (параметр, рассчитываемый для обычных веб-страниц) – это свидетельство высокого качества и, таким образом, может применяться к блог-документам как положительный индикатор качества блог-документов. В некоторых реализациях блог-документ (постинг) может не ассоциироваться с PageRank (напр., в случае с новым постингом). В подобных случаях новый постинг может наследовать PageRank родительского блога, пока для этого постинга не будет рассчитан собственный PageRank. Подобный наследуемый PageRank можут служить в качестве положительного индикатора качества нового постинга.
05.05.07
Источник: uspto.gov.
Автор: Google. Перевод: Seva.
Стр. « первая   <  1, 2, 3, 4, 5  >  последняя »


Эта страница в полной версии