Master-X
Регистрация
|
Вход
Форум
|
Новости
|
Статьи
Главная
»
Форум
»
Поисковые Системы
»
Тема:
Бан поисковиком по джаваскрипту
Новая тема
Ответить
цитата
08/11/06 в 21:33
Proo
Работаю c СЕ.. как я знаю в основном все используют джаваредирект на дорах, ну там зашифрованный, в другом файле, и т.п.. я как то старался этого избегать, обычно в ифрейме показываю рекламу, или так пишу скриптом хтмл, баннеры..
Видел несколько топиков что гугл и яху начали читать скрипты, и вроде как редиректы.. и они им особенно не нравятся.
Вопрос возник, как сейчас с этим? Кто нибудь замечал нечто подобное (по идее бан дожнен быстрей происходить), или все пока по старому?
Всем как положено рейтинг
цитата
08/11/06 в 21:44
s79s
скрипты поисковики давно уже умеют читать... как думаешь, почему их шифруют?? и уж за редирект по головке особо не погладят...
цитата
08/11/06 в 22:01
Scrudge
Всё что умеет читать эксплорер, не может быть секретом для гугли. Тут имхо просто мощностей не хватит чтобы ещё и по яваскриптам ползать и по полочкам их разбирать. Скриптов дохрена и если тупо искать чтото похожее на редирект, то в баню отправятся вместе с дорами половина белых сайтов.
цитата
08/11/06 в 22:24
benzole
пока всё ровно
цитата
08/11/06 в 23:30
Eklmn
что касается жавы, далеко ходить не буду,
это код с моего ЛЛ
Код:
<script type="text/javascript" language="javascript">
<!--
function Rate(id,rating)
{
window.open('/rat'+'e.php?id='+id+'&r='+rating,'','width=10,height=10,toolbars=no,status=no');
self.focus();
alert('Your vote has been added. Thanks.');
return false;
}
function AddFav(id)
{
window.open('/add_favor'+'ite.php?id='+id,'',"width=10,height=10,toolbars=no,status=no");
self.focus();
alert('This link will appear on your personal favorites page. Thanks.');
return false;
}
function Report(rpt,id)
{
desc=window.prompt("What criminal in this link?");
if (desc)
{
window.open('/repo'+'rt.php?id='+id+'&report='+rpt,'',"width=10,height=10,toolbars=no,status=no");
self.focus();
alert('Thanks for helping keep this list clear.');
}
else
alert("Sorry, no reports without description accepted");
return false;
}
-->
</script>
гугл в sitemap этого сайта показывает что не может найти
следующие урлы:
хttp://www.omega-porn.com/repo
хttp://www.omega-porn.com/rat
хttp://www.omega-porn.com/add_favor
а теперь посмотрите откуда он это взял.
-------------
доры он банит по редиректу, а не по тому как он организован.
цитата
08/11/06 в 23:57
Proo
Eklmn писал:
что касается жавы, далеко ходить не буду,
гугл в sitemap этого сайта показывает что не может найти
следующие урлы:
хttp://www.omega-porn.com/repo
хttp://www.omega-porn.com/rat
хttp://www.omega-porn.com/add_favor
а теперь посмотрите откуда он это взял.
-------------
доры он банит по редиректу, а не по тому как он организован.
т.е. он через тулбар определил что редирект? или какой вывод то, не понял че то
цитата
09/11/06 в 00:23
benzole
тулбар тут ни при чём.
гугля глянул в скрипт, увидел простые конструкции и попытался дёрнуть ссылки, которые видит, но так как видит он также, как ботаник без очков, то попытался дёрнуть ссылки типа /rat
цитата
09/11/06 в 07:41
-Nike-
benzole писал:
но так как видит он также, как ботаник без очков, то попытался дёрнуть ссылки типа /rat
Да нормально он все видит, и по 5 раз шифрованные скрипты разбирает, на юмаксе есть длиннющий топ по этому поводу.
Другое дело, что пока разбор явы никак не влияет на бан.
цитата
09/11/06 в 10:04
Eklmn
бан идет в первую очередь из-за редиректа, определяет скорее всего по тулбару, а если точнее,то по разнице во времени между переходом
с одного урла на другой.
у меня все доры которые без редиректа или с таким редиректом
Код:
<img src="c:\pohuy_shto_tut_budet.gif" onerror="window.open('http://kuda_nado.com/','_top')">
целы, так как у постеднего задержка в 1-2сек.
цитата
09/11/06 в 10:33
A d u l t
Ну народ, Вы юмакс почитать не можете? Или мои мессаги еще и здесь запостить?
Там все разжевано по полной. И про выполнение JS пауками и про тулбар.
цитата
09/11/06 в 11:38
-Nike-
Никто не ценит твои труды, к сожалению
цитата
09/11/06 в 11:40
Юнга
A d u l t писал:
Ну народ, Вы юмакс почитать не можете? Или мои мессаги еще и здесь запостить?
Там все разжевано по полной. И про выполнение JS пауками и про тулбар.
А скинь, пожалуйста, ссылку! Я чего-то сходу не нашел...
цитата
09/11/06 в 15:37
Proo
A d u l t писал:
Ну народ, Вы юмакс почитать не можете? Или мои мессаги еще и здесь запостить?
Там все разжевано по полной. И про выполнение JS пауками и про тулбар.
Ага, кинь ссылку пож-ста, тоже не могу найти..
цитата
09/11/06 в 16:57
A d u l t
Топики:
http://www.umaxforum.com/topic/12/16661/
http://www.umaxforum.com/topic/17/15785/
Цитата:
есть страница с примерно следующим ява-кодом.
Code Sample
<script>
crypted = "LJKHDes97856rasdfh ... ru9A8YDWE45W98FWE";
js = decrypt1(decrypt2(decrypt3(decrypt4(decrypt5(crypted)))));
document.write("<script>"+js+"</script>");
function decrypt1(crypted)
{
Функция дешифрования (цикл, составляющий матрицу из crypted, затем обрабатывающий матрицу алгоритмом1 и возвращающий строку из матрицы)
}
function decrypt2(crypted)
{
Функция дешифрования (цикл, составляющий матрицу из crypted, затем обрабатывающий матрицу алгоритмом2 и возвращающий строку из матрицы)
}
function decrypt3(crypted)
{
Функция дешифрования (цикл, составляющий матрицу из crypted, затем обрабатывающий матрицу алгоритмом3 и возвращающий строку из матрицы)
}
function decrypt4(crypted)
{
Функция дешифрования (цикл, составляющий матрицу из crypted, затем обрабатывающий матрицу алгоритмом4 и возвращающий строку из матрицы)
}
function decrypt5(crypted)
{
Функция дешифрования (цикл, составляющий матрицу из crypted, затем обрабатывающий матрицу алгоритмом5 и возвращающий строку из матрицы)
}
</script>
В итоге на экран выводится ссылка в виде картинки размером 1x1 на страницу типа
http://url/test.php?flag=KS7fysdSAFH9s
(flag формируется специальным образом на основе IP адреса). Поверх картинки выводится лейер с текстом.
Скрипт test.php кладет базу все запросы.
Параметр flag сделан для того, чтобы отлавливать глюк с гуглбаром: Если пользователь случайно все-же попадет по этой ссылки, то в параметре flag будет зашифрован его IP, Соответственно потом гугл (взяв инфу из гуглбара) запросит этот адрес с параметром flag, в котором зашифрован IP адрес посетителя. В результате получим несовпадение IP адреса, с которого запрос и IP адреса, зашифрованного в flag. Значит гугл взял ссылку из гуглбара, иначе гугл нашел ссылку сам.
Все алгоритмы дешифрования строятся не только на простых арифметических действиях, но и на работе с объектами(Например в JS создаем текстовое поле, из которого читаем некоторое значение в следующей функции дешифрования. Неверная работа приводит к некорректному дешифрованию).
На страницу с данным яваскриптом ставилась одна ссылка с одного ресурса с пр2.
В итоге из живых людей на странице с яваскриптом и на странице с test.php никого небыло, из ботов на странице с яваскриптом был много кто, на странице test.php с корректным совпадением IP и flag - были Google и MSN.
С некорректным совпадением IP и flag никого небыло.
Период тестирования - 2 недели.
Цитата:
Google Bot IP: 66.249.65.71, 66.249.66.135, 66.249.66.203
MSN Bot IP: 131.107.0.96
Цитата:
Общая теория определения типов сайтов(дорвей/белый/etc) выглядит так:
Существует некий коэффициент, который включает в себя многие параметры.
Например(не факт):
- бонусность хостинга
- доменная зона
- whois-данные
- страна расположения хостинга
- количество бэков
- процентное соотношение бэквордов в бэках
- процент ключевых слов
- процентное соотношение тэгов в документе
- исходящие ссылки документа
- как часто кликают пользователи в выдаче гугла по этому сайту
- как часто пользователи с гугл-баром посещают данный сайт
- тематическая направленность контента на странице
- коммерческая направленность сайта (например хомепага дяди Васи с соседней квартиры - 0%, а сайт amazon.com - 100%)
- и т.д.
Вообщем математиков у гугла достаточно, чтобы грамотно формировать этот коэффициент (помните объявление гугла о наборе на работу в виде математической формулы?)
Затем на основе этого коэффициента идет разложение сайтов по полкам.
Например есть интервал значений коэффициента, который соответствует белым сайтам, дорам и т.д. Ошибки конечно не исключены, но благодаря стараниям математиков они приблизились к 90%-95%(например) точности.
А вообще скорее всего это выглядит так:
К, примеру, 99% сайтов лежат в определенном интервале коэффициентов, тогда как 1% сильно отличается от этого. Специалисты гугла специально интересуются необычными сайтами. Они делают это специально для поиска новых и необычных решений, для отлаживания механизма и т.д. В этот 1% попадают также наши дорвеи, поэтому поиск и бан дорвеев - это побочный продукт деятельности этой команды специалистов.
В результате бан дорвеев - это неожиданная полезная находка для гугла. Вышло так же, как и с песком для новых доменов, когда сами специалисты гугла случайно столкнулись с таким поведением поисковой машины - как песок и решили его оставить.
PS: На традиционный вопрос "Что делать" - отвечу: делать дорвеи такими же, как и обычные сайты. Тоесть модернизировать генераторы.
Цитата:
Что же касается гугл-бара, то всю свою информацию он отсылает и получает по HTTP протоколу, поэтому словить ее не составляет труда.
Специально для параноиков:
Ставим прогу ETHEREAL (снифер траффика на компе), далее запускаем и слушаем траффик, отсылаемый гугл-баром. Те, кто обладает хоть какими-то знаниями в области TCP протоколов, сразу увидят, что отсылает гугль-бар.
А отсылает он следующее:
1. Каждый раз, когда в адресной строке меняется адрес, гугл-бар отсылает запрос на получение PR'а. В этом запросе указан URL сайта, взятый из адресной строки. Тоесть гугль знает, где ходит пользователь и с каим интервалом перемещается по сайтам.
2. Периодически отправляется запрос на сервер гугля за новой версией тулбара.
ЭТО ВСЕ. БОЛЬШЕ НИЧЕГО НЕ ОТПРАВЛЯЕТСЯ.
В данной ситуации вполне может быть, что гугль берет статистику посещений пользователей с тулбарами по конкретному сайту и видит, что пользователи на данном сайте долго не задерживаются - это один из факторов того, что это может быть дорвей.
цитата
10/11/06 в 05:55
separtners
Eklmn писал:
...
-------------
доры он банит по редиректу, а не по тому как он организован.
прям. сделай доры без редиректа, вообще без всего, без ифрейма, фрейма и всяческих аффилейт ссылок - и потом делай такие строгие выводы. а то сказал - как отрезал. только не в тему =)
джаваскрипт читает, согласен, тесты показали - вполне себе переходит. не факт что читает бот, а например не тулбар, но факт остается фактом. что делать дальше ? думать =) на то СЕ всегда и было самой замороченной специальностью из всех, что подразумевает генерацию трафика.
цитата
11/11/06 в 07:49
Synchro
separtners писал:
прям. сделай доры без редиректа, вообще без всего, без ифрейма, фрейма и всяческих аффилейт ссылок - и потом делай такие строгие выводы. а то сказал - как отрезал. только не в тему =)
Во-во. +1
Новая тема
Ответить
Эта страница в полной версии