данной статье мы попытаемся рассмотреть задачи определенной группы владельцев сайтов. Итак, пусть это будет следующий сайт:
небольшая или средняя суточная загрузка — до 5 тыс. хостов (примерно 15-20 тыс. загрузок страниц);
сайт использует БД и динамическое формирование страниц (связка Apache+PHP+MySQL);
команда обслуживания сайта 1-5 человек;
команда обслуживания являлась разработчиком движка сайта или активно участвовала в разработке, доработке и т.д.
Ни для кого не будет секретом, что под это описание попадает не менее 80 процентов вообще всех сайтов Рунета. Если к сайту при его создании и сопровождении подходят ответственно, то перед разработчиками обязательно ставятся следующие вопросы:
для чего делается сайт?
для кого делается сайт?
что будет на сайте?
Если Ваши ответы на эти вопросы будут — для галочки, для начальства, что-нибудь нароем — эта статься не для Вас. Хотя…
Если же данные вопросы будут решены по совести, то следующим вопросом будет:
ну, как там дела?
На этот вопрос многие, и следует отметить совершенно справедливо, хотят получить ответ с помощью статистики. Вот только статистика разная бывает. Для web-сервера и для web-сайта.
Статистика для администратора web-сервера.
Бывает, например статистика работы web-сервера — это фактически логи сервера, а также различные обработчики логов помогающие узреть основные детали. Данный вариант часто предлагается хостинговыми компаниями. В качестве исходников берут логи web-сервера Apache, настраивают их посуточную архивацию (или используют ротацию для экономии места на диске) и натравливают на логи обработчик — например небезызвестный analog.
Это решение подходит для администратора web-сервера — можно укрупнено рассматривать тенденции загрузки сервера, трафика, ошибки, при желании можно мануально докопаться до самой распоследней строчки лога и выявить, например, ошибку.
Это решение подходит для хостинг компаний — дешево (бесплатно) и сердито (ресурсов требуется самый минимум, а сервис вроде как и предоставлен).
Это решение подходит для построения псевдонаучных отчетов для начальства (распределения по дням недели и т.д. ну в общем вы понимаете…).
Это решение подходило 5-10 лет назад, когда анализ загрузок файлов по каталогам в принципе мог дать картину спроса на некоторую тему (при условии, что на сайте для каждого раздела, статьи и пр. есть свой каталог).
НО! Это решение совершенно не подходит для сегодняшних реалий. Оно не дает информации об изменениях, невозможно проследить спрос к контенту, корректно отследить путь каждого пользователя и т.д. На самом деле решение обработчика лога не может дать вообще никакой информации для контент-менеджера, для тех кому интересен именно каждый посетитель и его запросы. Нужна статистика web-сайта.