PHP в деталях

Валим свой сервер и флудим поисковики


DL
14.6.2001

Баннер "Поговори со мной о PHP", который красовался три дня на всех страницах сайта, как вы поняли, был шуткой. Началось это с того, что в форуме появилась жалоба, что от рекламы книг разъезжаются таблицы, и предложение повесить баннер с голой бабой и надписью "поговори со мной о php". А как раз в эти дни постоянные участики IRC-канала #phpclub открыли [].

Я решил поизголяться (не, на баннере был не я!) и похвастаться баннером на новостной ленте []. Признаться, такого количества интересующихся рекламой я не ожидал. Две недели назад я подправил код страницы с выпуском, чтобы там выводились только проверенные отзывы. И правильно сделал? находятся хулиганы, которые почти на каждый выпуск постят флуд или абракадабру из букв. Если вы всё-таки хотите увидеть все отзывы на выпуск, включая ещё не модерированные, допишите в адресной строке "comment/" ? они все там. Привести в нерабочее состояние сервер Apache ? нет ничего проще! Разумеется, испытания рекомендуется проводить на домашнем или офисном компьютере, который не жалко "повесить". Методика простая: кладёте в какую-нибудь директорию файл .htaccess следующего содержания:

Options All

RewriteEngine On

RewriteRule [a-z_.]+/?$ /путь к директории/somefile.php

И набираете в адресной строке

http://хост/путь к директории/bla_bla_bla

Сервер ничего не выдаёт броузеру, потому что... запрос "/путь к директории/bla_bla_bla" он переписал, получил "/путь к директори/somefile.php", снова глянул в .htaccess и снова переписал запрос на "/путь к директори/somefile.php". И так до бесконечности. При этом сервер быстренько забивает память компьютера.

Веб-сервер хостера вам "завалить" вряд ли удастся, но попортить _себе_ жизнь легко. Первый раз столкнувшись с такой проблемой, я бился, наверное, час. Поэтому если при отладке директив Rewrite* сервер перестаёт выдавать документы, проверьте, доходят ли запросы до "адресатов". [] Вот читаю и думаю, чего орёт человек... У меня ВСЁ лежит в базе данных, движок ? даже не от «php-nuke» до «parser», а самопальный!


Правда, в большинстве случаев, автору сайта это скорее на руку, т.к. он получает лишнюю возможность дать проиндексировать свой ресурс именно так, как он хочет и никак иначе.

Ну, это вообще можно записывать в коллекцию перлов! Кто угодно в сети может заставить поисковик проиндексировать себя как хочется, знать бы только ip-адреса роботов.

Между тем, Яндекс уже две недели индексирует не совсем то, что вы видите на моём сайте. На страницах с выпусками мой самопальный движок выдаёт ему только текст выпуска, никаких отзывов, никакой навигации (она есть на других страницах, в частности, в архиве). Судя по статистике, мои материалы стали больше находить по правильным запросам, а не по "как открыть в php новое окно". Вообще, непонятно, зачем поисковый движок Яндекса откровенно "светится", имея читаемый адрес (slovo.yandex.ru) и "Yandex" в поле USER_AGENT. Чтобы вебмастеру было виднее, что заботливый Яндекс индексирует его раз в две недели?

Лично мне от этого теплее не становится, зато становится теплее тем, кто хочет "зафлудить" поисковую машину (вспомним сайт Zhopa.ru, который в поисковиках на самые популярные запросы появлялся в первой строчке, пока его админы не забанили _ручками_). Сейчас Яндекс заявляет, что сделал добавление к поисковому механизму, которое не позволяет "флудильным" страницам вылезать в первых строках (сам проверил по запросу "реферат", вроде работает), но я могу флудить с умом. Например, смотреть, что Яндекс крутит в рекламе ("все вопросы кЫ..."), и держать табличку в базе данных с этими вопросами... Так или иначе, пока нет специального удобоваримого для поисковиков формата, им пристало маскироваться под обычного посетителя.


Содержание раздела