Configuración de Storage¶
El sistema utiliza Supabase Storage para almacenar la data cruda (RAW) extraída de las diferentes fuentes.
Creación del Bucket¶
Para que el sistema funcione correctamente, se debe crear un bucket en el proyecto de Supabase con las siguientes características:
- Nombre del Bucket:
raw-data - Acceso: Privado (recomendado) o Público.
Estructura de Archivos¶
El sistema organiza automáticamente los archivos descargados para mantener un historial ordenado cronológicamente.
APIs sin Paginación¶
Estructura simple con un archivo por descarga:
{tipo_fuente}/{id_fuente}/{YYYY-MM-DD_HHMMSS}.{ext}
Ejemplos:
* api/api_gas/2025-11-24_103000.json
* web/noticias_col/2025-11-24_154500.html
* complex/banco_central/2025-11-24_090000.bin
APIs con Paginación (Datos Extensos)¶
Cuando la fuente retorna muchos registros (100K+), el sistema descarga en páginas individuales:
{tipo_fuente}/{id_fuente}/{YYYY-MM-DD_HHMMSS}/
├── page_0001.json
├── page_0002.json
├── page_0003.json
└── ...
Ejemplo:
* api/api_regalias/2025-11-24_183107/page_0001.json (10K registros)
* api/api_regalias/2025-11-24_183107/page_0002.json (10K registros)
* api/api_regalias/2025-11-24_183107/page_0003.json (10K registros)
Configuración Básica¶
Solo es necesario especificar el nombre del bucket. El sistema se encarga de generar la ruta y el nombre del archivo.
{
"id": "mi_fuente",
"type": "api",
"storage": {
"bucket": "raw-data"
}
}
Parámetros Disponibles¶
| Parámetro | Descripción | Valor por defecto |
|---|---|---|
bucket |
Nombre del bucket en Supabase. | "raw-data" |
path |
(Opcional) Ruta completa del archivo. Si se define, sobrescribe la generación automática de historial. Útil si solo se desea mantener la última versión. | None (Automático) |
Nota: Para historiales, es recomendable omitir path y dejar que el sistema genere la ruta con timestamp automáticamente.
Limpieza de Datos Antiguos¶
El sistema está diseñado para retener historial de 2-3 meses. Para mantener la capacidad bajo control:
- Estrategia automática: Implementar un job de limpieza que elimine datos > 90 días
- Manual: Usar la consola de Supabase para eliminar carpetas antiguas