понедельник, 1 декабря 2008 г.

Отказ от регистрации в yandex

Яндекс принял решение об отказе в регистрации блога ссылаясь на то, что страницы должны быть уникальны. Несмотря на то, что все стаьи являются авторскими, я решил проверить как на это смотрят поисковики. По совету друзей, зашел на сервис Copyscape, который показал, что в статье О развитии речи ребенка, написанной моей женой - профессиональным логопедом, есть цитата из книги протоиерея Глеба Каледы "Домашняя церковь", которая выложена на многих сайтах. Робот посчитал цитату плагиатом и весь сайт неуникальным. Надо быть осторожным с цитатами, думаю, что таким-же образом не только Яндекс проверяет содержание сайтов. Цитату можно было бы переписать своими словами, но больше понравилась идея выложить картинку вместо текста. Теперь, надеюсь, у поисковиков не будет предлога чтобы не индексировать блог.

PS
Теоретически, если текстовую цитату окружить тегом <noindex></noindex> (либо полностью запретить страницу к индексированию через файл robots.txt) робот поисковой системы не должен его индексировать. Тут есть нюанс: он может его прочитать для выявления повторов, в зависимости от настроек конкретного робота. В этом случае такой метод не подойдет. Различные варианты цитирования можно попробовать на тестовых сайтах.

PPS
Нашел интересную статью на тему как робот поисковой машины анализирует страницы сайта на уникальность.

Статьи схожей тематики:



4 комментария:

  1. Насчет цитаты в виде картинки - неплохой ход.
    Только вдруг Yandex в будущем станет настолько интеллектуальным, что будет делать OCR? ;)

    ОтветитьУдалить
  2. К тому времени он уже будет понимать что такое цитата :)

    ОтветитьУдалить
  3. Не знаю, не знаю, в моем блоге цитат ОЧЕНЬ много, а авторского текста - кот наплакал (таков уж формат блога), но Яндекс индексирует. Я даже знаю, на каком месте мои блоги в рейтинге Яндекса. Возможно, благодаря тому, что иногда я даю ссылки на блоггер.ком в своем ЖЖ, а у того уже неплохой авторитет для Яндекса. А еще на Яндексе есть форма, куда ручками вносишь урл на пост для индексирования. Потратить две - три недели на индексирование таким образом каждой статьи, и упорство победит ;)

    ОтветитьУдалить
  4. С того момента как пришел отказ от Яндекса многое изменилось: я написал письмо в службу поддержки (addurl@yandex-team.ru) и в ответ получил дословно: "Следуйте нашим рекомендациям, развивайте Ваш сайт для пользователей, со временем он появится в поиске." Действительно, теперь несколько страниц проиндексированы, в том числе и эта :) НО, ссылок на страницы блог в выдаче Яндекса нет, как нет и трафика. Попробую последовать совету и запостить ссылки из ЖЖ.

    На Яндексе нашел 2 формы запроса на индексирования: краткая http://blogs.yandex.ru/add.xml и полная http://blogs.yandex.ru/add-catalogue.xml, но они годятся для полного сайта. Где форма для внесения каждой статьи? Конечно это неправильно, что приходится прикладывать столько усилий только чтобы добавить сайт в поисковик. Вот yahoo.com: сам нашел и проиндексировал все страницы! Яндексу есть куда стремиться и у кого учиться :)

    ОтветитьУдалить