Htaccess запретить кэширование. Запрет кэширования посредством PHP

Современные браузеры достаточно часто используют в своей работе локальный кэш. Что это означает? Это означает что браузер, получив от сервера html-документ, картинку или другой ресурс, размещает его в своем локальном кэше (проще говоря, записывает полученный ресурс на жесткий диск машины пользователя) и при последующих запросах к такому ресурсу не обращается на сервер, а получает ресурс из локального кеша.

Данная алгоритм работы браузеров резко повышает скорость загрузки html-документов. Так как если ресурс уже загружался, и как следствие расположен в локальном кэше, то время доступа определяется не пропускной способностью канала связи (например, модемного подключения) а скоростью работы жесткого диска.

Однако наряду с достоинствами данный метод так же порождает ряд проблем. В частности большинство начинающих web-программистов, при разработке динамических сайтов, сталкивается с одной и той же проблемой. Суть этой проблемы заключается в том, что вместо повторного обращения на сервер за страницей, запускающей на сервере скрипт, модифицирующий некую информацию, браузер обращается в локальный кэш. И в результате, например трех обращений, происходит не три модификации информации, расположенной на сервере, а только одна.

Для того, что бы заставить браузер каждый раз обращаться за страницей на сервер необходимо запретить браузеру заносить данный ресурс в кэш. Ниже приведены наиболее распространенные методы, запрещающие кэширование или позволяющие его обойти.

Генерация нового URL

Допустим что запрашиваемый ресурс имеет следующий url: test.html?id=7. Как видно из url’а ему передается один параметр. Добавим, например, при помощи JavaScript, в url еще один параметр, а его значением сделаем случайное число. В результате url будет выглядеть следующим образом: test.html?id=7&rnd=0.6700820127538827. Случайный параметр будет каждый раз генерироваться заново. Ниже приводится листинг, демонстрирующий этот подход:

Генерация нового URL document.write (""); тестовая ссылка

Каждый раз результат такого запроса будет кэшироваться, но так как кэширование производится по всему url, то каждый раз будет получаться новый url и браузер будет вынужден запрашивать с сервера ресурс, так как url двух запросов не будут совпадать в точности.
Поля заголовков

Управлять кэшированием можно так же со стороны сервера. Для этого ресурс, отправляемый браузеру, сопровождается полями заголовка. Детальное описание полей заголовка может быть найдено в стандарте Rfc 2068, который описывает протокол HTTP 1.1.

Поле заголовка Expires

Значением данного заголовка является дата, после которой содержимое ресурса устареет. Если пользователь после этой даты обратиться к ресурсу, браузер должен запросить ресурс у сервера, а не из локального кэша.

Если поле >Expires< содержит дату, прошедшую, по отношению к текущей, то при следующем обращении к ресурсу браузер будет вынужден снова обратиться к серверу. Это произойдет вследствие того, что либо документ не будет занесен в кэш — как уже устаревший, либо при обращении к кэшу браузер определит, что документ уже устарел. Следующий листинг на PHP демонстрирует использование заголовка Expires:

Поле заголовка Last-Modified

Значением данного заголовка является дата последнего обновления ресурса. Большинство современных браузеров используют следующий алгоритм, если ресурс уже находится в локальном кэше:

* запрашивает с сервера дату последнего обновления ресурса
* сравнивает полученную дату и дату ресурса в локальном кэше
* если ресурс на сервере новее ресурса в кэше — запрашивается ресурс с сервера

Если ресурс, расположенный на сервере, содержит в данном поле текущую дату, то браузер будет каждый раз запрашивать ресурс с сервера, а не из локального кэша. Следующий листинг демонстрирует использование поля заголовка Last-Modified:

header ("Last-Modified: " . gmdate("D, d M Y H:i:s") . " GMT");

Поля заголовка Cache-Control и Pragma

И, наконец, поля заголовка, непосредственно отвечающие за кэширование ресурса. Поле Было определено в стандарте Rfc 1945, описывающим протокол HTTP 1.0. Данное поле считается устаревшим, но в некоторых случаях приходится использовать именно его. В частности некоторые proxy-сервера неправильно обрабатывают запросы к постоянно изменяющимся ресурсам, если вместе с ресурсом не передается данное поле заголовка.

Второе поле определено в стандарте Rfc 2068, который описывает протокол HTTP 1.1. Данное поле заголовка позволяет запретить кэширование, и каждый раз запрашивать ресурс с сервера. Следующий листинг демонстрирует использование полей заголовка Cache-Control и Pragma для запрета кэширования:

header("Cache-Control: no-cache, must-revalidate"); header("Pragma: no-cache");

Хорошо Плохо

Статья будет полезна посетителям и владельцам сайтов, которые заботятся о том, чтобы информация, получаемая с их ресурсов, была своевременной и достоверной. Прочитав этот материал, вы поймете, из-за чего посетители могут видеть устаревшую информацию на сайте, а также узнаете способы решения этой проблемы.


В настоящее время скорость передачи данных в сети интернет позволяет с легкостью просматривать видео в хорошем качестве, играть в online-игры, устраивать конференции, быстро скачивать и передавать информацию и т.д. Но так было не всегда! Десять лет назад, чтобы передать 1 Мб информации, приходилось тратить достаточно много времени. Для повышения скорости загрузки страниц сайта было решено сохранять часть данных в кэш браузера (памяти) на локальном компьютере пользователя. Во время последующего обращения к сайту браузер загружал их оттуда при условии, что загружаемые данные не менялись.

Сейчас содержание данных в кэше браузера не является столь востребованным в целях увеличения скорости загрузки. В большинстве случаев данные с сервера запрашиваются методами GET или HEAD. Запросы методами GET и HEAD по умолчанию кэшируются (сохраняются) в логах сервера и прокси-сервера, а также в истории браузера. Из-за того, что информация кэшируется, многие посетители сайта увидят устаревшие данные, а новая станет им доступна только после удаления из кэша. Это может доставить проблемы не только посетителям сайта, но и повлиять на прибыль компании, если сайт коммерческий.

Для решения данной проблемы нужно запретить кэшировать данные, передающиеся с сервера. В интернете описано множество способов запрета кэширования: все они отличаются друг от друга, а некоторые сейчас уже не работают.

Самые распространенные правила опубликованы на авторитетных ресурсах www.spravkaweb.ru (http://www.spravkaweb.ru/php/sovet/nocash) и www.ru.wikipedia.org (http://ru.wikipedia.org/wiki/Мета-теги). Многие сайты позаимствовали эти настройки и используют их сейчас.

По утверждению Википедии, если в заголовке документа написать

Другой авторитетный ресурс www.spravkaweb.ru утверждает, что можно передать четыре заголовка, которые запретят кэширование данных при любых условиях.

При данных настройках сервер отдает заголовки, представленные на рис.3.

Рис.3 Заголовки ответа сервера

Разберем каждую строчку, чтобы понять, как это должно работать.

Заголовок актуальности документа предлагается передать прошедшей датой. Например, «Expires: Mon, 26 Jul 1997 05:00:00 GMT», определив, тем самым, что данные уже не нужны, и кэшировать их не за чем. Это, должно вызывать подозрение не только у людей, но и у поисковых роботов при индексации таких документом. Зачем роботу держать в индексе неактуальную информацию, мало кто задумывается. Поисковые системы не любят, когда им пытаются передать недостоверные данные.

Заголовок «Last-Modified» передает браузеру дату и время изменения документа (в данном примере дата и время будут текущие). Если при каждом заходе на страницу поисковому роботу сообщается, что документ только что изменился (хотя в своем поисковом индексе робот различий не замечает), то, возможно, система будет воспринимать это как воздействие на релевантность поисковой выдачи с целью улучшения позиций сайта. Это может послужить причиной наложения санкций со стороны поисковых систем.

Передача заголовка «Pragma: no-cache» для запрета кэширования данных была одним из первых методов, но на данный момент уже не работает.

Эксперимент

Пример 1.

Проведем эксперимент. Создадим документ cache.php, в котором будем отдавать заголовки из примера, чтобы проверить работает ли данный метод запрета кэширования данных. С сервера будем запрашивать актуальное время, и смотреть, откуда берется информация - из кэша браузера или загружается с сервера.

Во времяэксперимента будем делать переходы по ссылке на файл cache .php , расположенный на реальном сервере, и наблюдать, обновляется время или нет. Если время не обновляется, значит, данные берутся из кэша браузера и запрет не работает.

Показатель времени не обновляется, и это еще раз доказывает, что на большинстве ресурсов содержится недостоверная информация по запрету кэширования. Большой интерес вызывает такое массовое копирование чужих ошибок не только в конкретном случае, но и в целом во всем интернете.

Для того, чтобы показать работающий способ запрета кэширования, приведу второй пример, в котором также посредством эксперимента будет проверена его работоспособность.

Пример 2.

В первом примере предлагалась передача заголовка «Cache-Control: no-cache, must-revalidate», вот только настроен он был неправильно. Дополним заголовок новыми параметрами «Cache-Control: no-cache, no-store, must-revalidate, max-age=0», где

no-store - приватные данные нельзя сохранять на локальном диске (запрещает кэширование в браузерах);

no-cache - директива, использующаяся для запрета кэширования информации прокси-серверами;

max-age=0 - директива, указывающая время, в течение которого хранится информация в кэше браузера;

must-revalidate - директива, сообщающая браузеру о требовании дополнительной проверки актуальности документа, в случае возникновения сомнений.

Создадим документ cache2.php, в котором будем отдавать новые заголовки, чтобы проверить работает ли этот метод запрета кэширования данных.

Порядок и условия эксперимента остаются прежними. Если время меняется, значит, оно запрашивается с сервера, а не из кэша браузера.

Так как при каждом обращении к странице время обновляется, метод запрета кэширования действительно работает. В данном примере параметры передаются из самой страницы, но возможен более универсальный вариант, который настраивается на сервере. На сервере Apache настройки производятся через служебный файл.htaccess, это дает более функциональный механизм запрета кэширования сразу для всех страниц сайта. В файле конфигурации необходимо включить модули mod_headers.c и mod_expires.c, убрав комментарии с фрагмента кода

и добавить в файл.htaccess фрагмент кода

Если сервером является Internet Information Services (IIS) 6.0, то кэширование можно запретить только имея доступ непосредственно к интерфейсу сервера. Сделать это возможно во вкладке «Заголовки HTTP» (HTTP Headers) в настройках сервера.

На рис. 6 приведен пример запрета кэширования посредством передачи заголовков «Cache-Control: no-cache, no-store, must-revalidate, max-age=0» для страниц сайта. Для настройки заголовка «Expires» нужно включить «Установить срок действия содержимого» (Enable content expiration) и «истекает немедленно» (Expires immediate).

Минусы запрета кэширования

Запрет кэширования повышает нагрузку на сервер, на котором находится сайт, потому что приходится отвечать на большее количество запросов. Для посетителей сайта запрет кэширования снижает скорость загрузки страниц, но это заметно лишь при медленной скорости интернета.

Заключение

Своевременное получение информации играет значимую роль как для посетителей сайта, так и для их владельцев. Поэтому владельцам веб-ресурсов нужно тщательно анализировать заголовки, которые отдаются их серверами. Запрет кэширования является важной настройкой, которая позволяет посетителям всегда получать только реальную информацию с вашего сайта. Сейчас на большинстве интернет-ресурсов отдаются заголовки «Expires» и «Last-Modified», которые не только не запрещают кэширование, но и возможно способны препятствовать нормальной индексации сайта поисковыми роботами.

Порой, бывает необходимо запрещать браузеру кэшировать страницу, так как информация на ней обновляется каждый раз. Это может быть генерация данных, соответственно выбранным фильтрам или другой контент, который каждый раз создается по-новому. Одним словом, бывают моменты, когда необходимо запретить коварной программе кэшировать страницу. Сегодня, мы узнаем, как реализовать это разными способами, с помощью PHP или HTML или.htaccess.

Запрет кэширования страницы на HTML

Сделать это можно с помощью мета тегов. Сейчас мы разберем разные варианты запрета на кэширование.

Запрет на кэширование браузером и прокси-сервером

Запрет кэширования страницы, только браузером

Установка кэширования на определенное время, для браузера

С помощью кода ниже, мы можем сообщить браузеру, сколько хранить документ в кэше. После чего, кэш будет обновлен.

Установка кэширования на определенное время, для прокси-сервера

Практически, то же самое, что и в предыдущем коде, только указание стоит конкретно для прокси-сервера.

Запретить кэширование страницы с помощью PHP

Практически, все тоже самое, что в случае с HTML, только информацию будем выводить через header заголовки. Вот, как реализовать абсолютный запрет на кэш:

Также, можно разрешать кэшировать на определенное время. Например, разрешим кэширование только на 1 час.

Запретить кэширование страницы с помощью.htaccess

Для простоты реализации идеи, можно все сделать на уровне конфигураций сервера Apache. Перед этим, нам нужно убедиться в том, что необходимые модули находятся в рабочем состоянии. Открываем конфигурационный файл Apache и наблюдаем следующую картину:

LoadModule expires_module modules/mod_expires.so LoadModule headers_module modules/mod_headers.so ... AddModule mod_expires.c AddModule mod_headers.c

Теперь в файле.htaccess, собственно запрещаем кэшировать выводимые данные. Как нам известно, .htaccess файл будет распространяться на директорию, в которой лежит, и на все субдиректории.

# Заголовок Cache-Control Header append Cache-Control "no-store, no-cache, must-revalidate" # Заголовок Expires ExpiresActive On ExpiresDefault "now"

Важно заметить, что полный запрет кэширования, повышает нагрузку на сервер. Поэтому, играйтесь с этим осторожно! А лучше, установите определенное время, на которое можно кэшировать документы. Например, установим кэширование на 1 час:

# Заголовок Cache-Control Header append Cache-Control "public" # Заголовок Expires ExpiresActive On ExpiresDefault "access plus 1 hours"

Заключение

Веб-мастера часто сталкиваются с кэшированием: браузеры и прокси-сервера, пытаясь ускорить работу Веба для пользователя, стараются сохранить у себя максимально большое количество документов в кэше.

Порой, бывает необходимо запрещать браузеру кэшировать страницу, так как информация на ней обновляется каждый раз. Это может быть генерация данных, соответственно выбранным фильтрам или другой контент, который каждый раз создается по-новому. Одним словом, бывают моменты, когда необходимо запретить коварной программе кэшировать страницу. Сегодня, мы узнаем, как реализовать это разными способами, с помощью PHP или HTML или.htaccess

Запрет кэширования страницы на HTML

Сделать это можно с помощью мета тегов.
Запрет на кэширование браузером и прокси-сервером

Запрет кэширования страницы, только браузером

Установка кэширования на определенное время, для браузера

С помощью кода ниже, мы можем сообщить браузеру, сколько хранить документ в кэше. После чего, кэш будет обновлен.

Установка кэширования на определенное время, для прокси-сервера
Практически, то же самое, что и в предыдущем коде, только указание стоит конкретно для прокси-сервера.

Запретить кэширование страницы с помощью PHP

Практически, все тоже самое, что в случае с HTML, только информацию будем выводить через header заголовки. Вот, как реализовать абсолютный запрет на кэш:

Также, можно разрешать кэшировать на определенное время. Например, разрешим кэширование только на 1 час.

Запретить кэширование страницы с помощью.htaccess

Для простоты реализации идеи, можно все сделать на уровне конфигураций сервера Apache. Перед этим, нам нужно убедиться в том, что необходимые модули находятся в рабочем состоянии. Открываем конфигурационный файл Apache и наблюдаем следующую картину:

LoadModule expires_module modules/mod_expires.so
LoadModule headers_module modules/mod_headers.so
...
AddModule mod_expires.c
AddModule mod_headers.c

Теперь в файле.htaccess, собственно запрещаем кэшировать выводимые данные. Как нам известно, .htaccess файл будет распространяться на директорию, в которой лежит, и на все субдиректории.

# Заголовок Cache-Control Header append Cache-Control "no-store, no-cache, must-revalidate" # Заголовок Expires ExpiresActive On ExpiresDefault "now"

Важно заметить, что полный запрет кэширования, повышает нагрузку на сервер. Поэтому, играйтесь с этим осторожно! А лучше, установите определенное время, на которое можно кэшировать документы. Например, установим кэширование на 1 час:

# Заголовок Cache-Control Header append Cache-Control "public" # Заголовок Expires ExpiresActive On ExpiresDefault "access plus 1 hours"

Современные браузеры достаточно часто используют в своей работе локальный кэш. Что это означает? Это означает что браузер, получив от сервера html-документ, картинку или другой ресурс, размещает его в своем локальном кэше (проще говоря, записывает полученный ресурс на жесткий диск машины пользователя) и при последующих запросах к такому ресурсу не обращается на сервер, а получает ресурс из локального кеша.

Данная алгоритм работы браузеров резко повышает скорость загрузки html-документов. Так как если ресурс уже загружался, и как следствие расположен в локальном кэше, то время доступа определяется не пропускной способностью канала связи (например, модемного подключения) а скоростью работы жесткого диска.

Однако наряду с достоинствами данный метод так же порождает ряд проблем. В частности большинство начинающих web-программистов, при разработке динамических сайтов, сталкивается с одной и той же проблемой. Суть этой проблемы заключается в том, что вместо повторного обращения на сервер за страницей, запускающей на сервере скрипт, модифицирующий некую информацию, браузер обращается в локальный кэш. И в результате, например трех обращений, происходит не три модификации информации, расположенной на сервере, а только одна.

Для того, что бы заставить браузер каждый раз обращаться за страницей на сервер необходимо запретить браузеру заносить данный ресурс в кэш. Ниже приведены наиболее распространенные методы, запрещающие кэширование или позволяющие его обойти.

Генерация нового URL

Допустим что запрашиваемый ресурс имеет следующий url: test.html?id=7. Как видно из url"а ему передается один параметр. Добавим, например, при помощи JavaScript, в url еще один параметр, а его значением сделаем случайное число. В результате url будет выглядеть следующим образом: test.html?id=7&rnd=0.6700820127538827. Случайный параметр будет каждый раз генерироваться заново. Ниже приводится листинг, демонстрирующий этот подход:

Генерация нового URL document.write (""); тестовая ссылка

Каждый раз результат такого запроса будет кэшироваться, но так как кэширование производится по всему url, то каждый раз будет получаться новый url и браузер будет вынужден запрашивать с сервера ресурс, так как url двух запросов не будут совпадать в точности.

Поля заголовков

Управлять кэшированием можно так же со стороны сервера. Для этого ресурс, отправляемый браузеру, сопровождается полями заголовка. Детальное описание полей заголовка может быть найдено в стандарте Rfc 2068, который описывает протокол HTTP 1.1.

Поле заголовка Expires

Значением данного заголовка является дата, после которой содержимое ресурса устареет. Если пользователь после этой даты обратиться к ресурсу, браузер должен запросить ресурс у сервера, а не из локального кэша.

Если поле >Expires< содержит дату, прошедшую, по отношению к текущей, то при следующем обращении к ресурсу браузер будет вынужден снова обратиться к серверу. Это произойдет вследствие того, что либо документ не будет занесен в кэш - как уже устаревший, либо при обращении к кэшу браузер определит, что документ уже устарел. Следующий листинг на PHP демонстрирует использование заголовка Expires:

Поле заголовка Last-Modified

Значением данного заголовка является дата последнего обновления ресурса. Большинство современных браузеров используют следующий алгоритм, если ресурс уже находится в локальном кэше:

  • запрашивает с сервера дату последнего обновления ресурса
  • сравнивает полученную дату и дату ресурса в локальном кэше
  • если ресурс на сервере новее ресурса в кэше - запрашивается ресурс с сервера

Если ресурс, расположенный на сервере, содержит в данном поле текущую дату, то браузер будет каждый раз запрашивать ресурс с сервера, а не из локального кэша. Следующий листинг демонстрирует использование поля заголовка Last-Modified:

Header ("Last-Modified: " . gmdate("D, d M Y H:i:s") . " GMT");

Поля заголовка Cache-Control и Pragma

И, наконец, поля заголовка, непосредственно отвечающие за кэширование ресурса. Поле Было определено в стандарте Rfc 1945, описывающим протокол HTTP 1.0. Данное поле считается устаревшим, но в некоторых случаях приходится использовать именно его. В частности некоторые proxy-сервера неправильно обрабатывают запросы к постоянно изменяющимся ресурсам, если вместе с ресурсом не передается данное поле заголовка.

Второе поле определено в стандарте Rfc 2068, который описывает протокол HTTP 1.1. Данное поле заголовка позволяет запретить кэширование, и каждый раз запрашивать ресурс с сервера. Следующий листинг демонстрирует использование полей заголовка Cache-Control и Pragma для запрета кэширования:

Header("Cache-Control: no-cache, must-revalidate"); header("Pragma: no-cache");