Учимся работать с идентификаторами сессий
Меня несколько раз спрашивали об идентификаторах сессий, что они из себя представляют, для чего нужны, и какое влияние оказывают на поисковую оптимизацию. Часто подобные технические вопросы задают слишком поздно, когда сайт уже создан, протестирован и запущен, и у владельца сайта возникают проблемы, если его бюджет не позволяет переписать целые блоки кода сайта.
Проще говоря, ID сессии – это идентификатор, который назначается вам. Так же как и ваше имя, идентификатор сессии дается вам при первом обращении к сайту – в данном случае при авторизации, и используется для отслеживания ваших перемещений с одной страницы на другую, на время вашего пребывания на сайте. Веб-сервер сгенерирует идентификатор сессии в виде набора чисел и присвоит его посетителю сайта. Факторы, определяющие идентификатор сессии, зависят от сайта, предпочтений и потребностей администратора. Генерируемый идентификатор может включать, например точную дату и время визита, если это важно для веб-сайта.
Чаще всего идентификаторы сессии можно увидеть на сайте электронной коммерции, где используется корзина товаров. Добавляя продукты в корзину, пользователи могут продолжать просматривать сайт, пока не закончат делать покупки. Здесь идентификатор сессии используется для ведения учета содержимого корзины.
Как правило, идентификатор сессии сохраняется только на протяжении просмотра сайта. Так что, если открыть страницу сайта с идентификатором сессии и случайно закрыть браузер, то при переходе обратно на ту же страницу URL будет содержать другой идентификатор сессии. Это не окажет никакого влияния на вашу работу с сайтом, но могут возникнуть серьезные трудности у поисковых роботов, создающих обратную ссылку на определенную страницу, что доставит проблемы владельцу сайта.
Представьте, что вы посещаете страницу товаров местного супермаркета, которая использует идентификатор сессии для реализации корзины товаров. Если вы зайдете в понедельник вечером на сайт магазина, идентификатор сессии для отслеживания ваших действий будет иметь следующий уникальный URL: www.yourlocalsupermarket.com/products/milk_sessionid=11111112. Затем если вы случайно закроете браузер, нажав крестик в верхнем правом углу, то понадобится перезапустить браузер, чтобы перейти обратно на сайт и начать покупки заново. Теперь, когда вы вернетесь на сайт, назначенный вам идентификатор сессии будет иметь следующий вид: www.yourlocalsupermarket.com/products/milk_sessionid=898989789. Хотя вы просматриваете ту же страницу что и раньше, для вас создан абсолютно новый URL. Здесь заключена первая проблема SEO с идентификаторами сессий – повторяющийся контент. Два разных URL пауки будут рассматривать как уникальные страницы, хотя в действительности это одна и та же страница. При этом возникает проблема для поисковых машин, поскольку каждый раз при посещении страницы роботом будет создаваться новый идентификатор сессий, из-за чего страница будет по ошибке добавлена в индекс при каждом посещении. При более тщательной обработке страниц поисковая система обнаружит, что 40 различных страниц - это действительности 10 уникальных страниц, проиндексированных три раза подряд.
Та же проблема возникает, когда пользователи начинают ссылаться на страницы вашего сайта. При первом посещении вашего сайта им назначается идентификатор сессии. И большинство пользователей не догадается удалить идентификатор при создании обратной ссылки на ваш сайт в своем блоге или закладке. Следующий пользователь, который перейдет по этой ссылке, содержащей идентификатор сессий, обнаружит нерабочую ссылку, когда на самом деле срок действия маркера идентификатора сессии просто истек. Кроме того, один и тот же пользователь может получить новый идентификатор сессии для замены истекшего, что создаст страницу повторяющегося контента.
Рейтинг больших сайтов особенно страдает от использования идентификаторов сессий для отслеживания действий посетителя из-за огромного объема дублирования контента, возникающего вследствие регулярной активности. Часто поисковые системы прекращают сканирование новых страниц или удаляют их из индекса. Итак, что же делать?
Google предлагает инструмент для управления параметрами, с помощью которых веб-мастер может указать поисковой системе игнорировать все, что следует после идентификатора сессии. Параметр помогает только решить вопрос с повторяющимся контентом, но проблема с входящими ссылками остается. Существуют CMS, которые предлагают аналогичную возможность скрыть часть идентификатора сессии от поисковых систем. Опять же это не решает полностью проблемы исходящих ссылок.
Лучшим решением будет отказаться от использования идентификатора сессии на вашем веб-сайте. Если текущую версию сайта переделывать слишком поздно, то можно внести данные изменения в следующей версии.
Другие статьи
Исправляем ошибку установки обновлений Windows 10
Windows 10 — это уже не самая новая операционная система от Microsoft, но иногда пользователи
Сброс сетевых настроек Windows - командная строка
Сетевые проблемы могут быть очень раздражающими и влиять на нашу работу и повседневную жизнь. В