Информационная, смысловая нагрузка, которую даёт сайт, конечно, находится на первом месте в плане ценности для пользователя-человека. Но необходимо понимать, что поисковики - это роботы, программные алгоритмы. А значит, для них на первом месте будет техническая структура сайта. А значит, следует подробнее рассмотреть сущность техобслуживания, сколько стоит обслуживание сайта и т.п. Дело в том, что информационная структура под названием сайт в процессе функционирования подвержена такому же износу, как и физические механизмы.
Необходимость техобслуживания сайта и рутинные проблемы в этой сфере
Интересно, что функционирование сайта гораздо чаще нарушают не физические факторы (типа повреждений сервера), а информационные, бьющие по программной структуре веб-ресурса. Таких факторов немало. Вот лишь самые основные: Разрушения/изменения исходного кода сайта, его программной составляющей с помощью других вредоносных программ. Такие атаки бывают массовыми и хаотичными, когда в сеть запускают какой-то новый вирус. А бывают точечными, целенаправленными. Например, при хакерских атаках на веб-ресурсы. Цели тоже бывают разные: взлом для доступа к закрытой информации, либо просто разрушение ресурса с целью невозможности дальнейшей его эксплуатации. Соответственно и характер повреждений, степень ущерба варьируются. Типичным является повреждение, когда сегмент вирусного кода встраивается в код сайта. В информационной структуре возникает чужеродный участок, который не только не может выполнять заданные команды, но и приводит к самокопированию вредоносного кода, и дальнейшему заражению других информационных систем, если они находятся в одной сети. Любопытно, что точно по такому же принципу действуют и биологические вирусы. При этом вирус может поразить сайт не только на уровне двоичного машинного кода. Так же как существуют высокоуровневые языки программирования, существуют и вирусы, оперирующие исключительно пакетными файлами, т.е. командами, состоящими из каскада исполнения более мелких подпрограмм. В настоящее время в гораздо большей степени распространены именно «высокоуровневые» вирусы. Здесь разрушающих факторов невероятно много, в том числе и фактор случайности. С точки зрения теории вероятностей информационная система всё равно рано или поздно получит определённые повреждения. Это сродни математической теории о том, что в наборе ложек и вилок с годами какие-то приборы обязательно потеряются. Независимо от того, насколько бережным было их хранение. Постоянное обращение к базе данных, сохранение страницы в кэше, переадресация и многое другое - все эти рутинные многократные действия могут приводить к тому, что называется случайным сегментом кода. Битая программная начинка сайта приводит к некорректным отображениям страниц или отдельных её элементов, сайт начинает тормозить и т.д. Важно подчеркнуть, что в процессе работы повреждаться может как функционал сайта, так и сохраненные в базе данных текстовые, графические, аудио и видео файлы. Не последнюю роль в повреждении данных играют космические лучи. В большинстве случаев он имеет множество ссылок на сторонние ресурсы. Однако эти ресурсы могут поменять адреса. Также любой сторонний сайт зачастую оказывается удалён, или истечет срок его действия. Всё это приводит к тому, что ссылки становятся недействительными. Также бывает, что сторонний ресурс цел, но ссылка всё равно нерабочая, так как "побилась" в результате внутренних повреждений сайта. Разработчики выпускают всё новые и новые версии популярных утилит, мультимедийных платформ и т.п. В большинстве случаев подобные обновления происходят автоматически. Случается, что обновления нарушают работу сайта из-за неучтенных программных конфликтов или неправильной установки. И это не все факторы, из-за которых любой сайт нуждается в постоянном техническом обслуживании. Следует подчеркнуть, что техническое обслуживание подразумевает не только устранение создавшихся проблем, но и улучшение самого сайта. В первую очередь речь идёт об увеличении скорости работы веб-ресурса. Если техническим обслуживанием пренебрегать, сайт, в конце концов, станет непригодным к посещению. Но задолго до этого он безнадежно упадёт в рейтингах поисковиков, а значит, многократно уменьшится его аудитория.Вот самые основные проблемы, которые находятся в ведомстве техобслуживания сайта:
Аспекты самостоятельного техобслуживания ресурса
Видно, что техническое обслуживание сайта - это действительно вариант оптимизации. Занимаются подобной деятельностью специализированные конторы, располагающие штатом профессиональных сотрудников. Однако некоторые моменты техобслуживания можно реализовать самостоятельно:- Доступная для скачивания программа Xenu поможет выявить и устранить самые распространенные "сайтовые" ошибки. В открытый программе необходимо в пути "вкладка options" - "раздел preferences" найти подвижный флажок parallel Threads и установить его на позиции 2-х (два параллельных потока). Затем во вкладке file выйти на Check URL, и в появившейся чистой адресной строке нужно забить адрес сканируемого веб-ресурса, нажать ОК. Сканирование может занять от нескольких минут до нескольких часов - всё зависит от размера сайта, его наполнения, структуры, особенностей хостинга и пр.
- После сканирования Xenu выдаст отчёт, содержащий все имеющиеся на данный момент проблемы. Типичные: ошибка 403 (ссылка ведет на удалённую страницу), ошибка 404 (битая ссылка), ошибка 12029 (нет связи с сервером). Кстати, ошибка 404 часто вылетает, когда происходит сбой в функционировании Dreamweaver. Это HTML-редактор, который проверяет синтаксис различных высокоуровневых языков программирования (PHP, JavaScript). Целью данного редактора является проверка корректности исходного кода веб-страницы.
- В программе Xenu снова идём в раздел file и далее - Export to TAB separated file (выбрать формат txt). Название файла - любое. Полученный файл нужно открыть в Excel, причём в предварительном окне выбрать кодировку 1251 (кириллица Windows). В этом же окне постоянно кликать по "Далее", до "Готово". Откроется таблица Excel, в которой определенные поля будут подсвечены (скорее всего, розовым). Это поля Status-Code, Date, Server, Duration и Charset. Их необходимо удалить.
- Таблица Excel помогает выявить страницы с ошибочными статусами, слишком большим весом, с одинаковыми title. Аналогично можно определить страницы с высоким уровнем вложенности (больше 4). По мере возможности работы сайта лучше от страниц с высоким уровнем вложенности избавляться. Уровень вложенности страницы - это аналогия к чемодану с отделениями. Открытый чемодан - это главная страница сайта, именно относительно нее определяется уровень вложенности. В чемодане четыре больших отделения - это четыре страницы, которые имеют 2 уровень вложенности относительно главной. В двух из четырёх отделений также есть по два отделения - это страницы, имеющие 3 уровень вложенности относительно главной. В этих малых отделениях есть также по два ещё меньших отделения - это страницы, имеющие 4 уровень вложенности относительно главной. Понятно, что большое количество таких мелких «отсеков» затрудняет навигацию по сайту.