Master-X
Форум | Новости | Статьи
Главная » Форум » Рунет » 
Тема: Генератор полуэро-хренобредо-мегатекста для доров
цитата
04/04/09 в 16:08
 BredoGen
Вот сделали такую штуку, тексты составляет (язык русский) - http://bredogen.ru/

Уникальность могучая, много лямов цепочек - только от мусора чистили месяц. В итоге сейчас в базе 2 гига с гаком. Текст получается нейтрально-эротический.

Какие мысли, вопросы будут? Качество текста на выходе нормальное?

Ну и вообще, смысл в таком бредогенераторе имеется?
цитата
05/04/09 в 11:45
 SanchezBoy
А чё картинкой текст генерируется? icon_smile.gif Даже не проверить никак...
цитата
06/04/09 в 00:08
 BredoGen


Какой такой картинкой? icon_cool.gif Там просто защита от тырринга стоит. Чтоб нахаляву парсилок не натравили и не уронили все нахрен.
цитата
06/04/09 в 09:21
 Afina
как он работает не поняла чёт icon_confused.gif
цитата
07/04/09 в 10:47
 SanchezBoy
BredoGen, кому надо в лёгкую текст извлекёт icon_wink.gif
По DCfinder уник icon_biggrin.gif
цитата
10/04/09 в 15:39
 Anonymous 84
Хуета какаето.
цитата
10/04/09 в 16:11
 Zmey Горыныч
Прикольно, но надо тестить.
Если дать дорвейщикам, то уникальность должна быть супер, представте тысячи доров по 10к страниц. Массовость может убить любую тему.
Сильно не всматривался, но алгоритм можно улучшить, за чет добавления простых фишек.
цитата
12/04/09 в 13:31
 BredoGen
SanchezBoy писал:
BredoGen, кому надо в лёгкую текст извлекёт


Упарится. smail101.gif Легко не будет.

Zmey Горыныч писал:
Сильно не всматривался, но алгоритм можно улучшить, за чет добавления простых фишек.


Каких? Вот думаю куда копать.

Zmey Горыныч писал:
представте тысячи доров по 10к страниц. Массовость может убить любую тему.


Это да, но тут цепей около 70 000 000 smail54.gif Комбинаций до безобразия много.
цитата
12/04/09 в 14:52
 Vlad2
BredoGen: сами пробовали доры на базе сабжа делать?
цитата
19/04/09 в 10:58
 SanchezBoy
Цитата:
Упарится. smail101.gif Легко не будет.

Упс, а я уже 50к напарсил и сделал дор на этом контенте icon_confused.gif
цитата
26/04/09 в 03:51
 CTAKAH
на цепи маркова смахивает, ниче там пиздатого нет
цитата
26/04/09 в 13:08
 BredoGen
CTAKAH писал:

на цепи маркова смахивает, ниче там пиздатого нет


Они и есть, пиздатого там большая база + очень хорошо очищено от мусора и грязи.

SanchezBoy писал:

Упс, а я уже 50к напарсил и сделал дор на этом контенте

Молодец. icon_smile.gif
цитата
05/05/09 в 12:06
 BredoGen
В общем испытания боем для такого текста завершены. Яша скушал экспериментальный дор с этим бредо-текстом на 100%

Из выдачи выпадений не наблюдалось, наоборот - с каждым апом количество страниц росло. В первый ап морда, во второй ап показал весь второй уровень - в третий ап добавил немного страниц третьего уровня. Сейчас, даже очень дальние страницы находятся в индексе - всего 8к страниц.

Короче показатели нормальные - полет проходит в штатном режиме.

Готов продать базу цепочек и сам генератор. Работа над этим изделием была проведена огромная.

База данных это около 70 миллионов звеньев цепочки собраны в 697 909 записях базы MySQL - размер 2.4 GB

Исходником для составления являлись несколько сайтов с эро-порно-рассказами. Пара женских и мужских сайтов с статьями. И нехилая пачка электронных книжек. Объем изначального текста был более 1.5 GB

Все слова в базе тщательно отфильтрованы:
от мусора (опечатки, переносы слов, разрывы слов, несуществующих слов)
от всяких плохих слов (зоо, детей, некро, зоофилии и подобного запретного)
убраны слова которые встречались в текстах малое количество раз

После чистки база похудела примерно на 40%

По всем вопросам стучать в аську ЗЗ7-7O4-428 Цена вопроса 300$


Эта страница в полной версии