Master-X
Форум | Новости | Статьи
Главная » Форум » Поисковые Системы » 
Тема: Как Гугл определяет уникальность изображения?
цитата
04/02/09 в 14:00
 Proo
Вот напр хочу одни и те жи фотки использовать на разных сайтах. Как думаете, если на каждом сайте будет разный размер, скажем где то 300х200, где-то 350х230 и т.п., он будет воспринимать как разный контет, или где то в jpeg зашифрована инфа об изображении, или может как один "изобразительный" ряд я не знаю.. и для него это будет одна и та же фотка?

Как думаете?
цитата
04/02/09 в 15:09
 _s_[sov]
существуют специальные системы распознавания образов. размер пикчи ни к чему. уж гугл думаю машину от ручки всяко отличит.
цитата
04/02/09 в 16:24
 MoriArty
...интересно, а шмеля от гёрлы отличить сможет?
по какому признаку? ;)
цитата
04/02/09 в 16:41
 benzole
_s_[sov] писал:
уж гугл думаю машину от ручки всяко отличит.

не, пока не отличает. по запросу типа "голые бабы" запросто может вывести кусок одноцветного gif-а со сплошной зелёной заливкой )))

Последний раз редактировалось: benzole (29/03/09 в 16:25), всего редактировалось 1 раз
цитата
04/02/09 в 16:44
 _s_[sov]
benzole писал:
не, пока не отличает. по запросу типа "голые бабы" запросто может вывести кусок одноцветного gif-а со сплошной зелёной заливкой )))

даже яндекс отличить может поэтому гугл думаю полюбому. может просто есть погрешности в алгоритме icon_smile.gif
цитата
04/02/09 в 16:55
 Klirik
Proo писал:
Вот напр хочу одни и те жи фотки использовать на разных сайтах. Как думаете, если на каждом сайте будет разный размер, скажем где то 300х200, где-то 350х230 и т.п., он будет воспринимать как разный контет, или где то в jpeg зашифрована инфа об изображении, или может как один "изобразительный" ряд я не знаю.. и для него это будет одна и та же фотка?

Как думаете?

Смело используй. Подозреваю, что пока поисковики могут определять уникальность файлов с изображением, только по контрольным суммам. Конечно, поисковики могут еще вытянуть служебную инфу из файла, но это им ничего не даст, пожалуй, кроме рейтинга популярности фотокамер ) или возможности поиска изображений определенных размеров.
Поэтому верно делаешь, что для каждого реса модифицируешь фотку, уникальность не помешает.
цитата
04/02/09 в 17:15
 benzole
_s_[sov] писал:
даже яндекс отличить может поэтому гугл думаю полюбому. может просто есть погрешности в алгоритме icon_smile.gif


обрати внимание на нижний ряд и на автомобиль во втором ряду. имхо 99,9% ранжирования картинок - это независящие от картинок факторы, никаким образом не связанные с процессом распознавания изображений, и если вокруг пустого белого джипега будет текст "король ямайки" - то этот джипег запросто может выползти в топ по своему запросу.

Последний раз редактировалось: benzole (29/03/09 в 16:25), всего редактировалось 1 раз
цитата
04/02/09 в 18:09
 Ward
Элементарно. В JPEG по первым пяти коэффициентам ряда Фурье каждого чётного спрайта, но не более первых четырёх (есть мнение, что шести). У гугла так. У яндека похуже. По коэфам первых двух спрайтов.
цитата
04/02/09 в 21:21
 Proo
Блин Ward все испортил icon_smile.gif
цитата
04/02/09 в 23:26
 Klirik
Ward писал:
Элементарно. В JPEG по первым пяти коэффициентам ряда Фурье каждого чётного спрайта, но не более первых четырёх (есть мнение, что шести). У гугла так. У яндека похуже. По коэфам первых двух спрайтов.

Откуда инфа?
цитата
05/02/09 в 00:22
 uncle Misha
Оффтопик: Цитата:
Откуда инфа?
С хака и серчинжиниес, там пару мес назад внутреннюю документацию гугловскую Брин постил icon_wink.gif , блин линку не могу найти...
цитата
05/02/09 в 00:46
 Ward
uncle Misha писал:
Оффтопик: С хака и серчинжиниес, там пару мес назад внутреннюю документацию гугловскую Брин постил icon_wink.gif , блин линку не могу найти...


Я не постил её там. icon_cry.gif (шутка))))

Цитата:
Откуда инфа?


Полно же статей по поиску изображений в сети. JPEG ищут по цифровой сигнатуре и по коэфициентам рядов Фуре. Это очевидно и давно известно, так как там больше непочему искать. А вот количество и качество коэфициентов используемых для поиска это уже детали. В данном случае я привёл наши экспериментальные данные по коэфициэнтам.
цитата
10/03/09 в 00:31
 vereteran
Ward: можно как-то поподробнее? особенно на тему что в данном случае есть "спрайт"(ну не выделяют же они объекты из изображения)? Как вычисляются коэффициенты и т.д.

Заранее спасибо.
цитата
10/03/09 в 04:30
 sh00ter
Klirik писал:
Подозреваю, что пока поисковики могут определять уникальность файлов с изображением, только по контрольным суммам.


Ты либо услышал хуйню и не подумав ее воспринял, либо - х.з. Скорее не знаешь, что такое контрольная сумма. взять, к примеру MD5 - изменение нескольких байт исходной последовательности влечет за собой изменение 50% последовательности контрольной суммы. и теперь подумай еще раз.

уверен, что пока гугль нихрена не умеет анализировать изображение. и поиск по картинкам на гугле по бОльшей части основан alt\title
если нужны доказательства - просто погугли.
не стОит преписывать гуглю сверхестественные способности, пока они не могут определять даже первоисточник контента.
цитата
10/03/09 в 13:45
 hectorix
в хелпе гугла описано как он ранжирует картинки - в общих чертах это текст вокруг и альты
цитата
10/03/09 в 15:57
 Skat
на альты он опирается и на ключевики в тексте, больше никак, или по крайней мере очень плохо у него это получается с использованием другис способов
цитата
10/03/09 в 18:45
 JonnyX
sh00ter писал:
уверен, что пока гугль нихрена не умеет анализировать изображение. и поиск по картинкам на гугле по бОльшей части основан alt\title
+1
Новый альт + новое текстовое окружение пиксы = 100% уникальная пикса.
А контрольные суммы и прочие умные вещи это уже что-то из области паранои и фантастики icon_smile.gif ну не станут поисковики так глупо свои ресурсы транжирить, в ближайшие годы точно.


Эта страница в полной версии