Снижаем нагрузку на хостинг с сателлитамиПокупайте «Ежамон»,Мониторит сайты он… Задрали поисковые боты, которые грузят ваши многостраничные сателлиты, заточенные под сапу? Сегодня поделюсь с вами секретом, как отвадить ненужных ботов типа яху, флексум и подобных и снизить нагрузку на хостинг. Сразу скажу, что метод подходит только для сайтов, созданных для продажи ссылок, потому что перекрывает трафик с неосновных поисковиков, которые вы заблокируете. Итак, будем использовать файлы robots.txt и .htaccess 1. Используйте robots.txtЕсли у вас ещё нет этого файла, возьмите его и залейте в корневую папку сайта (не забудьте распаковать). Если файл уже есть, добавьте в него следующие инструкции: User-agent: * Crawl-delay: 5 # задает таймаут в 5 секунды User-agent: Twiceler Disallow: / User-agent: Aport Disallow: / User-agent: Slurp Disallow: / User-agent: msnbot-media Disallow: / User-agent: msnbot-news Disallow: / User-agent: msnbot-products Disallow: / User-agent: msnbot Disallow: / User-agent: ia_archiver Disallow: / Вежливые боты будут следовать инструкциям, в результате чего можно ожидать, что яху, мсн, алекса, cuil и апорт пойдут лесом. Яндекс немного сбавит обороты когда увидит Crawl-delay. В этом способе мы вежливо сообщаем боту: «А не пойти бы вам нах, многоуважаемый бот». 2. Используйте .htaccess (метод подсмотрен на серче)Если у вас ещё нет этого файла, возьмите его и залейте в корневую папку сайта (не забудьте распаковать). Если файл уже есть, добавьте инструкции: RewriteEngine on
RewriteCond %{HTTP_USER_AGENT} liveinternet [OR]
RewriteCond %{HTTP_USER_AGENT} WebAlta [OR]
RewriteCond %{HTTP_USER_AGENT} Yanga [OR]
RewriteCond %{HTTP_USER_AGENT} Twiceler [OR]
RewriteCond %{HTTP_USER_AGENT} Flexum [OR]
RewriteCond %{HTTP_USER_AGENT} Aport [OR]
RewriteCond %{HTTP_USER_AGENT} Slurp [OR]
RewriteCond %{HTTP_USER_AGENT} msnbot [OR]
RewriteCond %{HTTP_USER_AGENT} ia_archiver [OR]
RewriteCond %{HTTP_USER_AGENT} libwww-perl
RewriteRule ^(.*)$ - [F,L]
Этот способ более кардинальный и работает даже с невежливыми ботами. В этом способе бот слышит «Пшол нах». Кстати, это клоакинг. 3. Блокировка по IPМожно ещё блокировать ботов по их IP -адресу. Если кому-то будет интересно, расскажу в последующих постах. P.S.Самый быстрый и простой cпособ отправить сообщение в twitter Команда талантливых дизайнеров и программистов сделает дизайн сайтов Престижная работа в Киеве Слыхали про баночный массаж? |
|
Пётр, 11:17, 26 января 2009
Интересно почитать!!!!!!
bloggle, 17:15, 26 января 2009
жесть конечно, но метод, я думаю, правильный, если использовать с умом. спасибо за инфу.
Эзотеркис, 22:27, 8 февраля 2009
Не хочется Выглядеть тупым, но могу сказать тока одно - Респект и Уважуха!!!
Пошел применять с ходу! тока над подумать к площадкам на wordpresse - htaccess подойдет?
Милости просим в гости, с радостью обменяюсь ссылками. Алекс.
vovan, 02:23, 9 февраля 2009
к wordpress подойдёт. Главное не похерить исходный htaccess, поэтому перед экспериментами желательно сделать резервную копию этого файлика.
Игорь, 21:26, 20 февраля 2009
Действительно интересная статейка! А то боты парят сервачок, из-за чего сайты дольше грузятся. Респект автору :)
lipЪ, 12:32, 3 марта 2009
за 2 метод автоматом бан от яндекса... за клоакинг...так чт не рекомендую
vovan, 00:33, 4 марта 2009
Одно замечание: клоакингом это будет только для ботов, перечисленных в списке.
kavelin, 20:56, 18 мая 2009
Спасибо за пост, еще один вариант, за исключением кэширования снизить нагрузку. Вован, махнемся постовыми? Если интересно, жду ответ на мыло или твит.
Отправить комментарий