subvencionesde.com
Datos

Metodología

Cómo construimos el catálogo, qué cifras se derivan y cuál es la línea roja sobre la generación con IA.

Pipeline diario

Un proceso ETL en Python descarga el listado de convocatorias publicadas en la BDNS por rangos mensuales, normaliza cada registro y lo carga en una base SQLite distribuida (libSQL/Turso) con upsert idempotente. Una segunda pasada recupera el detalle completo (importes, plazos, beneficiarios potenciales, finalidad, ámbito geográfico) y rellena las relaciones M:N con los catálogos internos.

Las resoluciones (lista de beneficiarios concedidos) se descargan de forma agregada para toda convocatoria resuelta. Los beneficiarios individuales se conservan solo de forma selectiva cuando aportan análisis editorial.

Cifras derivadas

Permitido derivar matemáticamente sobre datos oficiales: agregados anuales, importe medio, ratio solicitudes/concedidas, evolución del gasto. Toda derivación se marca como tal y se puede reproducir desde las cifras primarias citadas.

Inferencias estructurales

Permitidas cuando son inequívocas: equivalencia entre tipos de ayuda según la Ley General de Subvenciones, definición de beneficiario según la norma vigente, mapeo entre códigos NUTS de BDNS y provincias / CCAA del INE. Cualquier inferencia opinable se evita o se explicita en la ficha.

Línea roja sobre la IA

  • La IA no inventa cifras. Si no hay dato, se queda como «sin dato».
  • No se interpola para rellenar huecos en series temporales.
  • No se estiman importes ni plazos si la fuente no los publica.
  • No se resumen artículos de prensa para fabricar datos.
  • La IA puede asistir en redacción editorial y agregar texto, pero las cifras citan siempre fuente y fecha.

Calendario de actualización

La ingesta de datos (BDNS, BOE, boletines autonómicos, fondos europeos) se ejecuta de forma manual cuando se procesan nuevas fuentes; no es un sistema automático en tiempo real. La revalidación de páginas (caché ISR) sí es periódica: hubs cada 6 horas, fichas individuales cada 24 horas y portada cada hora. Detalle en /datos/changelog.