Учимся работать с идентификаторами сессий

Меня несколько раз спрашивали об идентификаторах сессий, что они из себя представляют, для чего нужны, и какое влияние оказывают на поисковую оптимизацию. Часто подобные технические вопросы задают слишком поздно, когда сайт уже создан, протестирован и запущен, и у владельца сайта возникают проблемы, если его бюджет не позволяет переписать целые блоки кода сайта.
Проще говоря, ID сессии – это идентификатор, который назначается вам. Так же как и ваше имя, идентификатор сессии дается вам при первом обращении к сайту – в данном случае при авторизации, и используется для отслеживания ваших перемещений с одной страницы на другую, на время вашего пребывания на сайте. Веб-сервер сгенерирует идентификатор сессии в виде набора чисел и присвоит его посетителю сайта. Факторы, определяющие идентификатор сессии, зависят от сайта, предпочтений и потребностей администратора. Генерируемый идентификатор может включать, например точную дату и время визита, если это важно для веб-сайта.
Чаще всего идентификаторы сессии можно увидеть на сайте электронной коммерции, где используется корзина товаров. Добавляя продукты в корзину, пользователи могут продолжать просматривать сайт, пока не закончат делать покупки. Здесь идентификатор сессии используется для ведения учета содержимого корзины.
Как правило, идентификатор сессии сохраняется только на протяжении просмотра сайта. Так что, если открыть страницу сайта с идентификатором сессии и случайно закрыть браузер, то при переходе обратно на ту же страницу URL будет содержать другой идентификатор сессии. Это не окажет никакого влияния на вашу работу с сайтом, но могут возникнуть серьезные трудности у поисковых роботов, создающих обратную ссылку на определенную страницу, что доставит проблемы владельцу сайта.
Представьте, что вы посещаете страницу товаров местного супермаркета, которая использует идентификатор сессии для реализации корзины товаров. Если вы зайдете в понедельник вечером на сайт магазина, идентификатор сессии для отслеживания ваших действий будет иметь следующий уникальный URL: www.yourlocalsupermarket.com/products/milk_sessionid=11111112. Затем если вы случайно закроете браузер, нажав крестик в верхнем правом углу, то понадобится перезапустить браузер, чтобы перейти обратно на сайт и начать покупки заново. Теперь, когда вы вернетесь на сайт, назначенный вам идентификатор сессии будет иметь следующий вид: www.yourlocalsupermarket.com/products/milk_sessionid=898989789. Хотя вы просматриваете ту же страницу что и раньше, для вас создан абсолютно новый URL. Здесь заключена первая проблема SEO с идентификаторами сессий – повторяющийся контент. Два разных URL пауки будут рассматривать как уникальные страницы, хотя в действительности это одна и та же страница. При этом возникает проблема для поисковых машин, поскольку каждый раз при посещении страницы роботом будет создаваться новый идентификатор сессий, из-за чего страница будет по ошибке добавлена в индекс при каждом посещении. При более тщательной обработке страниц поисковая система обнаружит, что 40 различных страниц - это действительности 10 уникальных страниц, проиндексированных три раза подряд.
Та же проблема возникает, когда пользователи начинают ссылаться на страницы вашего сайта. При первом посещении вашего сайта им назначается идентификатор сессии. И большинство пользователей не догадается удалить идентификатор при создании обратной ссылки на ваш сайт в своем блоге или закладке. Следующий пользователь, который перейдет по этой ссылке, содержащей идентификатор сессий, обнаружит нерабочую ссылку, когда на самом деле срок действия маркера идентификатора сессии просто истек. Кроме того, один и тот же пользователь может получить новый идентификатор сессии для замены истекшего, что создаст страницу повторяющегося контента.
Рейтинг больших сайтов особенно страдает от использования идентификаторов сессий для отслеживания действий посетителя из-за огромного объема дублирования контента, возникающего вследствие регулярной активности. Часто поисковые системы прекращают сканирование новых страниц или удаляют их из индекса. Итак, что же делать?
Google предлагает инструмент для управления параметрами, с помощью которых веб-мастер может указать поисковой системе игнорировать все, что следует после идентификатора сессии. Параметр помогает только решить вопрос с повторяющимся контентом, но проблема с входящими ссылками остается. Существуют CMS, которые предлагают аналогичную возможность скрыть часть идентификатора сессии от поисковых систем. Опять же это не решает полностью проблемы исходящих ссылок.
Лучшим решением будет отказаться от использования идентификатора сессии на вашем веб-сайте. Если текущую версию сайта переделывать слишком поздно, то можно внести данные изменения в следующей версии.
Ctrl
Enter
Заметили ошЫбку
Выделите и нажмите Ctrl+EnterДругие статьи

O&O ShutUp10++ для полного управления конфиденциальностью в Windows 11
Еще в те дни, когда Windows 10 была самой новой операционной системой, интегрированная система

WinRAR лучший архиватор из себе подобных
WinRAR - это усовершенствованная утилита сжатия данных, которая поддерживает широкий спектр