Master-X
Регистрация
|
Вход
Форум
|
Новости
|
Статьи
Главная
»
Форум
»
Поисковые Системы
»
Тема:
Как Гугл определяет уникальность изображения?
Новая тема
Ответить
цитата
04/02/09 в 14:00
Proo
Вот напр хочу одни и те жи фотки использовать на разных сайтах. Как думаете, если на каждом сайте будет разный размер, скажем где то 300х200, где-то 350х230 и т.п., он будет воспринимать как разный контет, или где то в jpeg зашифрована инфа об изображении, или может как один "изобразительный" ряд я не знаю.. и для него это будет одна и та же фотка?
Как думаете?
цитата
04/02/09 в 15:04
pierx
Имхо никак. Да и пох ему:
http://images.google.com/images?um=1&hl=en&q=bill+clinton&a rch+Images
http://images.google.com/images?um=1&hl=en&q=george+washing rch+Images
http://images.google.com/images?um=1&hl=en&q=barack+obama&a rch+Images
цитата
04/02/09 в 15:09
_s_[sov]
существуют специальные системы распознавания образов. размер пикчи ни к чему. уж гугл думаю машину от ручки всяко отличит.
цитата
04/02/09 в 16:24
MoriArty
...интересно, а шмеля от гёрлы отличить сможет?
по какому признаку? ;)
цитата
04/02/09 в 16:41
benzole
_s_[sov] писал:
уж гугл думаю машину от ручки всяко отличит.
не, пока не отличает. по запросу типа "голые бабы" запросто может вывести кусок одноцветного gif-а со сплошной зелёной заливкой )))
Последний раз редактировалось: benzole (
29/03/09 в 16:25
), всего редактировалось 1 раз
цитата
04/02/09 в 16:44
_s_[sov]
benzole писал:
не, пока не отличает. по запросу типа "голые бабы" запросто может вывести кусок одноцветного gif-а со сплошной зелёной заливкой )))
даже яндекс отличить может поэтому гугл думаю полюбому. может просто есть погрешности в алгоритме
цитата
04/02/09 в 16:55
Klirik
Proo писал:
Вот напр хочу одни и те жи фотки использовать на разных сайтах. Как думаете, если на каждом сайте будет разный размер, скажем где то 300х200, где-то 350х230 и т.п., он будет воспринимать как разный контет, или где то в jpeg зашифрована инфа об изображении, или может как один "изобразительный" ряд я не знаю.. и для него это будет одна и та же фотка?
Как думаете?
Смело используй. Подозреваю, что пока поисковики могут определять уникальность файлов с изображением, только по контрольным суммам. Конечно, поисковики могут еще вытянуть служебную инфу из файла, но это им ничего не даст, пожалуй, кроме рейтинга популярности фотокамер ) или возможности поиска изображений определенных размеров.
Поэтому верно делаешь, что для каждого реса модифицируешь фотку, уникальность не помешает.
цитата
04/02/09 в 17:15
benzole
_s_[sov] писал:
даже яндекс отличить может поэтому гугл думаю полюбому. может просто есть погрешности в алгоритме
обрати внимание на нижний ряд и на автомобиль во втором ряду
. имхо 99,9% ранжирования картинок - это независящие от картинок факторы, никаким образом не связанные с процессом распознавания изображений, и если вокруг пустого белого джипега будет текст "король ямайки" - то этот джипег запросто может выползти в топ по своему запросу.
Последний раз редактировалось: benzole (
29/03/09 в 16:25
), всего редактировалось 1 раз
цитата
04/02/09 в 18:09
Ward
Элементарно. В JPEG по первым пяти коэффициентам ряда Фурье каждого чётного спрайта, но не более первых четырёх (есть мнение, что шести). У гугла так. У яндека похуже. По коэфам первых двух спрайтов.
цитата
04/02/09 в 21:21
Proo
Блин Ward все испортил
цитата
04/02/09 в 23:26
Klirik
Ward писал:
Элементарно. В JPEG по первым пяти коэффициентам ряда Фурье каждого чётного спрайта, но не более первых четырёх (есть мнение, что шести). У гугла так. У яндека похуже. По коэфам первых двух спрайтов.
Откуда инфа?
цитата
05/02/09 в 00:22
uncle Misha
Оффтопик:
Цитата:
Откуда инфа?
С хака и серчинжиниес, там пару мес назад внутреннюю документацию гугловскую Брин постил
, блин линку не могу найти...
цитата
05/02/09 в 00:46
Ward
uncle Misha писал:
Оффтопик:
С хака и серчинжиниес, там пару мес назад внутреннюю документацию гугловскую Брин постил
, блин линку не могу найти...
Я не постил её там.
(шутка))))
Цитата:
Откуда инфа?
Полно же статей по поиску изображений в сети. JPEG ищут по цифровой сигнатуре и по коэфициентам рядов Фуре. Это очевидно и давно известно, так как там больше непочему искать. А вот количество и качество коэфициентов используемых для поиска это уже детали. В данном случае я привёл наши экспериментальные данные по коэфициэнтам.
цитата
10/03/09 в 00:31
vereteran
Ward:
можно как-то поподробнее? особенно на тему что в данном случае есть "спрайт"(ну не выделяют же они объекты из изображения)? Как вычисляются коэффициенты и т.д.
Заранее спасибо.
цитата
10/03/09 в 04:30
sh00ter
Klirik писал:
Подозреваю, что пока поисковики могут определять уникальность файлов с изображением, только по контрольным суммам.
Ты либо услышал хуйню и не подумав ее воспринял, либо - х.з. Скорее не знаешь, что такое контрольная сумма. взять, к примеру MD5 - изменение нескольких байт исходной последовательности влечет за собой изменение 50% последовательности контрольной суммы. и теперь подумай еще раз.
уверен, что пока гугль нихрена не умеет анализировать изображение. и поиск по картинкам на гугле по бОльшей части основан alt\title
если нужны доказательства - просто погугли.
не стОит преписывать гуглю сверхестественные способности, пока они не могут определять даже первоисточник контента.
цитата
10/03/09 в 13:45
hectorix
в хелпе гугла описано как он ранжирует картинки - в общих чертах это текст вокруг и альты
цитата
10/03/09 в 15:57
Skat
на альты он опирается и на ключевики в тексте, больше никак, или по крайней мере очень плохо у него это получается с использованием другис способов
цитата
10/03/09 в 18:45
JonnyX
sh00ter писал:
уверен, что пока гугль нихрена не умеет анализировать изображение. и поиск по картинкам на гугле по бОльшей части основан alt\title
+1
Новый альт + новое текстовое окружение пиксы = 100% уникальная пикса.
А контрольные суммы и прочие умные вещи это уже что-то из области паранои и фантастики
ну не станут поисковики так глупо свои ресурсы транжирить, в ближайшие годы точно.
Новая тема
Ответить
Эта страница в полной версии