Яндекс как-то непонятно индексирует урлы страниц
Всем привет! Я давно хотел написать пост, в котором бы поделиться моими наблюдениями о том, как поисковая система Яндекс индексирует некоторые документы. Дело в том, что любой вебмастер рано или поздно начинает использовать на своих проектах ЧПУ (человеко-понятные урлы). И вот здесь можно столкнуться с проблемой индексации некоторых урлов. Причем именно с проблемой индексации, так как Яндекс попросту говоря, не хочет держать такой урл с кракозябрами в своем индексе. То поисковая система вносит его в свою базу, то снова выкидывает.
Чтобы не говорить лишних слов. Давайте все разберем на примере. Есть у меня один блог, на которой я публикую интересные заметки. Так вот. После проверки индексации страниц, обнаружил, что часть урлов сайта не в индексе. Собственно говоря, вот вам пример статьи и сразу же урда моего блога:
Собственно говоря, что мы видим из урал?
http://myhome.biz.ua/2010/06/grebanyj-mchostru-–-propadayut-domeny-klientov/
А видим мы то, что между mchostru и propadayut стоит дополнительный зназ тире, дефис, как удобно кому (-). Сразу же в голову придет мысль, а разве это препятствие для индексации урла проекта? Судя по всему, да.
Естественно, я решил добавить такой урл через панель ЯндексВебмастер, чтобы не париться с простановкой ссылок. Что же мы видим на самом деле? А то, что Яндекс просто отказывается принимать такой урл. Причем не важно, то ли у Вас всего одна запятая в ссылке урла, то ли их там две, три и более. Или, к примеру, точки в конце урла, внутри.
В общем, выглядит эта ситуация таким образом.
Но мне все равно непонятно, если Яндекс не принимает через свою форму урлы такого вида, однако индексирует их, зачем тогда стоит запрет в форме «Добавления сайтов»? Ведь смотрите сами, на другом моем блоге все индексируется просто здорово, а вот здесь видна реальная проблема.
Особенно данный вопрос интересует меня по той причине, что есть несколько урлов на блоге, которые отлично индексируются поисковой системой Яндекс.
К сожалению сейчас не могу их найти, так как их на моем блоге было всего несколько штук. Но тот факт, что Яндекс не держит такие страницы в индексе – факт. К примеру, вот вам примеры урлов, которые Яндекс выплюнул полностью из индекса и брать назад не хочет. Причем все равно, какой у Вас контент – уник или копипаст.
Придется ставить на них ссылки, так как другого варианта «загона» в индекс я не вижу. Есть варивант создания страницы новой под каждую статью, но это время.
В последнее время не мало компаний приобретает картофель для своих нужд. Если вы хотите приобрести
Поделитесь ссылкой на пост в сервисы:
Оцените запись:
Комментарии
Ссылка кстати не работает, без длинного тире написали вы ее:)
З.Ы. а почему сразу не прописать нормальный урл, или исправить криво сгенерированный? Вроде и сам WP и клиенты типа WLW поддерживают это.
Константин, да, с этим согласен. Я также стараюсь проверять урлы перед публикацией, так как без этого сейчас просто никак. А учитывая тот факт, что Яндекс не индексирует такие страницы, вывод напрашивается сам собой: необходимо подстраиваться под поисковую систему.
Артем Андреевич, спасибо, что сообщили, что не работает. Сам заработался, поэтому и не проверил. Да я хочу сделать, но только после того, как прочитают пост люди). А исправлять там не сложно, другой вопрос в том, что есть сайты, которые участвуют в GGL и там просто-напросто нельзя так просто изменить урл страницы, где находится ссылка. Придется, пожалуй, новую страницу создавать.
Яндекс тоже не совершенен)Лучше просто не использовать лишние mdash или же поработать над классом парсера, который бы просто «кушал» лишнее.
Из личного опыта: странным мне кажется то, что яндекс сначало индексирует, потом удаляет все ссылки и через месяц наконец опять индексирует все ссылки!
Seo-Active, согласен, но в том случае проблема была в том, что я не добавлял сам лишних дефисов. Видимо сам плагин, который отвечает за формирование урл сделал так. А так да, спасибо за ответ.
Ильнур, собственно говоря в этом нет ничего удивительного. Яндекс — машина, а машинам все равно, как там и что там. Им главное — делать заданную работу.
всё просто: не все спецсимволы входят в спецификацию.
сам давно перешёл на «ручное» выставление url-ов. дольше, зато наверняка. пока проблем с индексом не замечал.