Ir al contenido principal

Caché de datos propios para agilizar ejecución de scripts PHP

De vez en cuando viene bien ayudar a PHP a generar respuestas de forma mucho más rápida y eficiente de lo que ya es capaz por si mismo. En mi opinión, la mejor forma de hacerlo es implementar un sistema de caché propio o (una opción un tanto más aburrida) reutilizar alguno ya existente. En este artículo detallaremos la implementación de una clase que permita este cometido.

Aviso: Este artículo contiene ejemplos de programación en PHP aunque los conceptos explicados pueden ser aplicados a scripts realizados en cualquier otro lenguaje de programación.

Para ilustrar este proceso, veamos el siguiente caso no tan hipotético: Una aplicación web hace uso de una API del clima. El resultado de la consulta es la misma para todos los usuarios y cambia solamente cada hora. Sin embargo, cada consulta tarda un tiempo promedio de 15 segundos. Esto implica que cada usuario deberá esperar esos 15 segundos para ver el resultado (sumado al tiempo que tome la visualización y otros procesos que deba realizar la aplicación web). ¡Eso es mucho tiempo para esperar! Este tiempo puede reducirse si la respuesta a la consulta que haga el primer usuario se guarda en caché y los demás hacen uso de ese caché en lugar de realizar por si mismos la consulta a la API, después de todo, la respuesta no cambiará por un tiempo. De esta forma, solamente el primer usuario tendría que esperar esos +15 segundos y para los demás la respuesta sería mucho más rápida. Una hora después, se repite el proceso con un nuevo “primer usuario”.

Supongo que estás pensando en una opción para que incluso ese primer usuario no deba esperar tanto, ¿verdad? Algo así como tener una tarea que realice la consulta cada hora y que sea esta la que genere ese caché. Este enfoque aunque valido, haría que se realice el consumo de esa API haya o no una consulta de usuario que la requiera y esto implicaría un consumo de recursos no necesario en algunos casos, algo a considerar (especialmente si se debe pagar por cada consulta de la API). En cualquier caso, la aplicación web debería siempre estar en capacidad de consumir el API en la eventualidad que esa tarea remota falle y no se ejecute a tiempo.

Volviendo a nuestro caso, el código para la consulta de nuestra API con el uso de caché sería algo como lo siguiente:

$data_clima = false;
// Creación del objeto caché
$cache = new DataCache();
// Consulta si el archivo caché es valido
if ($cache->read('api-clima')) {
    // Recupera datos del caché
    $data_clima = $cache->getData();
}
else {
    // Realiza consulta a la API externa
    $data_clima = get_api_clima();
    // Genera archivo de caché para el siguiente uso
    $cache->save($data_clima);
}

Al terminar de ejecutarse el bloque, la variable $data_clima contendrá el valor retornado ya sea por la API externa (representada en la función get_api_clima() de este ejemplo) o por los datos almacenados en el caché, que previamente habría sido generado luego de recuperar los datos de la API externa una primera vez. Fácil, ¿verdad? Pero, ¿cómo controlar que se actualice cada hora, según el requerimiento previo? Para esto, adicionamos a nuestra clase una propiedad de vigencia de la caché antes de guardarla. Algo así como:

    $data_clima = get_api_clima();
    // Fija duración de la caché
    $cache->duration(3600);
    // Genera archivo de caché para el siguiente uso
    $cache->save($data_clima);

 De esta forma, le indicamos al caché la vigencia de los datos almacenados (para el ejemplo, una hora o 3600 segundos).

Otra mejora a considerar es la de prevenir el mantener en memoria dos copias de los datos de interés, esto es, una copia en el objeto $cache y otra en la variable $data_clima. Para corregir esta situación y reducir el riesgo de fallos por consumo innecesario de memoria (especialmente si se manejan en simultanea múltiples consultas de datos en caché), podemos implementar un método que recupere los datos y libere el espacio ocupado, así cambiamos el método getData() por exportInto(), así nos queda: 

if ($cache->read('api-clima')) {
    // Recupera datos del caché
    $cache->exportInto($data_clima);
}

Ahora si, ya con todas estas consideraciones, la implementación de la clase DataCache a usar sería la siguiente:

class DataCache {

    private string $filename = '';      // Nombre del archivo de caché
    private mixed $data = false;        // Datos de interés
    private int $maxtime = 0;           // Fecha de caducidad del caché

    /**
     * Lee archivo de caché.
     *
     * @param string $name Nombre asociado al caché
     * @return bool TRUE si pudo recuperar los datos de caché.
     **/
    public function read(string $name) {

        $this->maxtime = 0;
        $this->data = false;
        $this->filename = '';

        $result = false;

        if (trim($name) !== '') {
            // Automáticamente toma el directorio temporal del sistema.
            // Puede personalizar esta parte usando su propio directorio.
            // Usa md5() para "oscurecer" el nombre del archivo a usar y
            // prevenir problemas si el nombre contiene caracteres no
            // validos para nombres de archivo.
            $this->filename = sys_get_temp_dir() . 
                              DIRECTORY_SEPARATOR . 'cache-' .
                              md5(strtolower($name));
            // Lee datos almacenados
            if (file_exists($this->filename)) {
                $this->data = unserialize(
                                  file_get_contents($this->filename)
                                  );
                $result = (is_array($this->data) &&
                           array_key_exists('data', $this->data) &&
                           array_key_exists('maxtime', $this->data));
                if ($result && $this->data['maxtime'] > 0) {
                    $result = (time() <= $this->data['maxtime']);
                }
                if (!$result) {
                    // Falló al recuperar la data necesaria
                    $this->data = false;
                }
                else {
                    // Separa componentes
                    $this->maxtime = $this->data['maxtime'];
                    $this->data = $this->data['data'];
                }
            }
        }

        return $result;
    }

    /**
     * Retorna los datos recuperados del caché.
     *
     * @return mixed Datos recuperados o FALSE si no están disponibles.
     **/
    public function getData() {
        return $this->data;
    }

    /**
     * Asocia los datos recuperados del caché a una variable y luego los
     * elimina de la clase.
     *
     * @param mixed $data Variable en la que retorna los datos.
     **/
    public function exportInto(mixed &$data) {
        $data = $this->data;
        $this->data = false;
    }

    /**
     * Genera un nuevo archivo de caché con los datos indicados.
     *
     * @param mixed $data Datos a guardar en el archivo de caché.
     * @return bool TRUE si pudo guardar los datos en caché.
     **/
    public function save(mixed $data) {

        $result = false;

        if ($this->filename != '') {
            $bytes = file_put_contents(
                $this->filename,
                serialize(
                    array('data' => $data, 'maxtime' => $this->maxtime)
                    ));
            if ($bytes > 0) {
                $this->data = $data;
                $result = true;
            }
        }

        return $result;
    }

    /**
     * Tiempo en segundos para el que los datos en la caché son validos.
     * Debe ser mayor o igual a cero. Valor de cero remueve limite.
     *
     * @param int $seconds Segundos
     **/
    public function duration(int $seconds) {
        if ($seconds >= 0) {
            $this->maxtime = time() + $seconds;
            }
    }
}

Y con esto damos por terminada la implementación de nuestro propia clase administradora de datos en caché. Hemos de tener presente que este es un ejemplo básico y que deben considerarse situaciones a prevenir en un entorno de producción, como por ejemplo:

  • Fallos en la apertura de estos archivos de caché por parte de múltiples usuarios al mismo tiempo.
  • Validar el rendimiento en lectura/escritura de datos extremadamente grandes en los archivos de caché.
  • Proteger/encriptar el contenido de los archivos de caché cuando se manejen datos sensibles.
  • Remover archivos de caché no usados en mucho tiempo para mantener un espacio en disco saludable (sugerencia: implementar una tarea externa que realice esta actividad).

Espero que este artículo sea de utilidad y/o de inspiración para la implementación de tus propias soluciones. Te invito a compartir en los comentarios tus sugerencias para mejorar el código propuesto y los escenarios en que este uso de caché propietario puede ayudarte para reducir el consumo de recursos y agilizar tus scripts en PHP.

Por si acaso, también puedes encontrar este artículo en LinkedIn. y en medium.com.

Imagen de Dok Sev por cortesía de Pixabay

Comentarios

Entradas populares de este blog

Sesión de usuarios en aplicaciones web

Uno de los módulos más importantes y a la vez menospreciados cuando se aborda la tarea de crear un sitio web de servicios, ya sea para una intranet corporativa o un sistema de gestión de información ( SGI ) es la gestión y administración  requerida para una correcta implementación de sesiones de usuario. Y es que llevamos tanto tiempo usando usuarios y contraseñas en Internet, en cualquiera de sus muchas variaciones, que se asume muchas veces que esto ya forma parte del ADN de toda solución web y como tal, se destina muy poco tiempo y estudio a este apartado cuando se planifican las actividades de desarrollo. Lo cierto es que cada aplicación acostumbra desarrollar su propio esquema de manejo de sesiones y asumir que es algo superfluo puede equivaler a “pegarse un tiro en el pie”, especialmente cuando un módulo de este tipo se diseña desde ceros. Al referirse al manejo de sesiones de usuario suele pensarse únicamente en el proceso de capturar el nombre de usuario ( username ) y su cont

Configurando el servicio PHP

En el capítulo anterior ( PHP con Apache sobre Windows ) vimos como configurar PHP para ejecutarse desde un servidor web usando Apache. A continuación veremos los elementos a configurar directamente en PHP para garantizar una ejecución responsable y sin tropiezos de nuestros scripts. Algunos se preguntarán ¿ por qué  molestarse en configurar manualmente PHP cuando frameworks como Laravel  ya te entregan un docker con todo preinstalado y preconfigurado? Bueno, la verdad prefiero tener control de qué está ejecutándose en mi maquina y no me gusta, en lo particular, requerir de un entorno propietario para cada aplicación desarrollada cuando puedo tener uno para todas y no desperdiciar espacio en disco , memoria y/o procesador  ejecutando en cada proyecto un servidor wen y/o PHP por separado. Si, se que muy probablemente soy una minoría en este aspecto, mea culpa . Y en segundo lugar, nunca se sabe cuando tendrás que entrar y ajustar tu configuración de PHP, así que cuando ese día ll

Cómo resolver y/o crear un Sudoku usando PHP (parte 1)

C omo programador, he tenido que realizar proyectos profesionalmente, algunos con mayores retos que otros. Pero aparte de los retos profesionales, existen retos personales, programas que me nace escribir ya sea porque necesito solucionar una necesidad puntual o solamente por el placer de hacerlo. Uno de esos últimos retos fue el de solucionar un Sudoku . Si ya se, existen muchas aplicaciones allí afuera que lo hacen, pero el reto es hacerlo, no copiarlo. Habiendo aclarado las intenciones al respecto, lo primero a tener claro es cómo se define un Sudoku. Para esto, voy a apoyarme en la siempre disponible (aunque no siempre fiable) Wikipedia: Un Sudoku estándar contiene 81 celdas, dispuestas en una trama de 9×9, que está subdividida en nueve cajas. Cada caja está determinada por la intersección de tres filas con tres columnas. Cada celda puede contener un número del uno al nueve y cada número solo puede aparecer una vez en cada fila, cada columna o cada caja. Un sudoku comienza con algu