Skip to content

Configuración de Storage

El sistema utiliza Supabase Storage para almacenar la data cruda (RAW) extraída de las diferentes fuentes.

Creación del Bucket

Para que el sistema funcione correctamente, se debe crear un bucket en el proyecto de Supabase con las siguientes características:

  • Nombre del Bucket: raw-data
  • Acceso: Privado (recomendado) o Público.

Estructura de Archivos

El sistema organiza automáticamente los archivos descargados para mantener un historial ordenado cronológicamente.

APIs sin Paginación

Estructura simple con un archivo por descarga:

{tipo_fuente}/{id_fuente}/{YYYY-MM-DD_HHMMSS}.{ext}

Ejemplos: * api/api_gas/2025-11-24_103000.json * web/noticias_col/2025-11-24_154500.html * complex/banco_central/2025-11-24_090000.bin

APIs con Paginación (Datos Extensos)

Cuando la fuente retorna muchos registros (100K+), el sistema descarga en páginas individuales:

{tipo_fuente}/{id_fuente}/{YYYY-MM-DD_HHMMSS}/
├── page_0001.json
├── page_0002.json
├── page_0003.json
└── ...

Ejemplo: * api/api_regalias/2025-11-24_183107/page_0001.json (10K registros) * api/api_regalias/2025-11-24_183107/page_0002.json (10K registros) * api/api_regalias/2025-11-24_183107/page_0003.json (10K registros)

Configuración Básica

Solo es necesario especificar el nombre del bucket. El sistema se encarga de generar la ruta y el nombre del archivo.

{
  "id": "mi_fuente",
  "type": "api",
  "storage": {
    "bucket": "raw-data"
  }
}

Parámetros Disponibles

Parámetro Descripción Valor por defecto
bucket Nombre del bucket en Supabase. "raw-data"
path (Opcional) Ruta completa del archivo. Si se define, sobrescribe la generación automática de historial. Útil si solo se desea mantener la última versión. None (Automático)

Nota: Para historiales, es recomendable omitir path y dejar que el sistema genere la ruta con timestamp automáticamente.

Limpieza de Datos Antiguos

El sistema está diseñado para retener historial de 2-3 meses. Para mantener la capacidad bajo control:

  1. Estrategia automática: Implementar un job de limpieza que elimine datos > 90 días
  2. Manual: Usar la consola de Supabase para eliminar carpetas antiguas