Contenido

Dossier técnico — Argos · Radar del Gasto Público

Caso ancla: Sector Hacienda y Crédito Público

Documento técnico para el Ministerio de Hacienda y los órganos de control. Explica qué es la plataforma, cómo analiza, con qué datos, cómo se limita a sí misma, y presenta los descubrimientos verificados del sector. Toda alerta es preliminar y requiere revisión humana: el modelo prioriza, la autoridad competente decide. Ninguna cifra es una acusación ni una prueba de irregularidad.
Generado2026-07-01 20:08:52 UTC
Periodo analizado2022-08-07 → corte (gobierno Petro)
AlcanceSector Hacienda — 18 entidades (17 nativas + UGPP cruzada)
FuentesSECOP I/II · Procesos · PGN · datos.gov.co (ver §4)
Verificaciónsegundo testigo: drift · 14 entidades · 28 cifras re-derivadas · 4 drift
Naturalezainiciativa independiente · no es un sitio oficial del Gobierno · datos públicos

Convención metodológica (en todo el documento): [H] hecho · [HIP] hipótesis · [INF] inferencia · [REC] recomendación · [RISK] riesgo · [TODO] dato faltante. Sensibilidad: 🟢 público/gestión · 🟡 base legal/cuidado · 🔴 sensible.


0. Alcance y límites

1. Qué es Argos y qué analiza

Argos es una plataforma analítica del Estado colombiano —diseño de referencia inspirado en el modelo Palantir (Foundry+AIP+Apollo) pero acotado a la Constitución— que convierte datos dispersos del Estado en decisiones auditables con consecuencias institucionales. Su módulo central es el Radar de Eficiencia.

Principio rector: el modelo prioriza, el humano decide. La plataforma analiza dinero y gestión pública, no al ciudadano.

Los 6 focos del análisis

El Radar: 5 índices 0–100 por entidad

Cada entidad recibe un vector de 5 puntajes (ninguno es un veredicto; cada uno abre revisión):

ÍndiceQué mideEstado del modelo
Costo InstitucionalPeso presupuestal y administrativo frente a su tamaño/función🟡 parcial
Duplicidad FuncionalFunciones/programas/población/contratos compartidos con otras🟢 el más desarrollado
Riesgo Fiscal y ContractualDirecta, baja pluralidad, adiciones, fraccionamiento, concentración🟡 parcial
Valor PúblicoResultados relevantes frente al costo (metas, cobertura, impacto)⚪ pendiente (SINERGIA)
ReformabilidadViabilidad práctica de reformar (norma, personal, litigios, política)⚪ pendiente
La prioridad combina alto costo + alta duplicidad + alto riesgo + bajo valor, modulada por la reformabilidad. Ningún puntaje es un veredicto: abre revisión humana.

Las 6 preguntas que responde por entidad

Costo (¿cuánto cuesta realmente?) · Función (¿mandato legal vigente?) · Duplicidad (¿quién hace lo mismo?) · Riesgo (¿hallazgos, investigaciones, captura?) · Resultados (¿qué entrega y a cuántos?) · Escenarios de reforma (mantener…liquidar, con ahorro y ruta).

Los 8 arquetipos de clasificación (FICHA-MODELO)

Del vector de 5 índices —nunca de un juicio único— sale una hipótesis de reforma: Estratégica eficiente → mantener · Estratégica ineficiente → reformar · Riesgosa → auditar · Redundante → fusionar · Obsoleta → liquidar/rediseñar · Patrimonial → evaluar venta/concesión · Sensible → reformar con cautela · No reformable en corto plazo → plan de mediano/largo plazo.

[H] En este dossier el análisis se instancia sobre 18 entidades del sector Hacienda (§2).

2. A quién analiza

[H] El sujeto de análisis es el Estado y su dinero, no el ciudadano: *dinero público → público; dato personal → reservado*. El perímetro de este dossier es el Sector Hacienda y Crédito Público: el ministerio cabeza de sector más sus entidades adscritas y vinculadas, identificadas por NIT (derivadas del organigrama de la rama ejecutiva nacional).

EntidadNaturaleza jurídicaAdscripción/VinculaciónNIT
Dirección de Impuestos y Aduanas NacionalesUnidad Administrativa Especial conAdscrita a MinHacienda800197268
Ministerio de Hacienda y Crédito PúblicoMinisterio (cabeza de sector)Cabeza del sector899999090
Fondo AdaptaciónEstablecimiento públicoAdscrito a MinHacienda900450205
Unidad de Gestión Pensional y Parafiscales (Unidad Administrativa EspecialAdscrita a MinTrabajo (cru900373913
Fiduprevisora S.A.Sociedad de economía mixta (fiduciVinculada a MinHacienda860525148
Sociedad de Activos Especiales (SAE) SASSociedad de economía mixta (SAS)Vinculada a MinHacienda900265408
Superintendencia Financiera de ColombiaUnidad Administrativa Especial conAdscrita a MinHacienda890999057
Superintendencia de la Economía SolidariaSuperintendencia (UAE)Adscrita a MinHacienda830053043
Administradora del Monopolio Rentístico de lEmpresa Industrial y Comercial delAdscrita a MinHacienda900505060
Contaduría General de la NaciónUnidad Administrativa EspecialAdscrita a MinHacienda830025406
Agencia del Inspector General de Tributos, RUnidad Administrativa EspecialAdscrita a MinHacienda900528648
Financiera de Desarrollo Nacional (FDN)Sociedad de economía mixtaVinculada a MinHacienda860509022
Unidad de Proyección Normativa y Estudios deUnidad Administrativa EspecialAdscrita a MinHacienda900657800
Unidad de Información y Análisis FinancieroUnidad Administrativa EspecialAdscrita a MinHacienda830068074
La Previsora S.A. Compañía de SegurosSociedad de economía mixtaVinculada a MinHacienda860002400
Financiera de Desarrollo Territorial (FindetSociedad de economía mixta (bancaVinculada a MinHacienda800096329
Fondo Nacional para el Desarrollo de la InfrPatrimonio autónomo / vehículo espVinculado a MinHacienda830126425
Grupo BicentenarioSociedad holding de economía mixtaVinculado a MinHacienda901351676

[TODO] Fuera de la trazabilidad de SECOP (operan bajo régimen de derecho privado y no reportan): Central de Inversiones (CISA), FOGAFIN, FOGACOOP — su gasto no es visible por esta vía; se solicita por sus canales.

3. Cómo lo analiza

Arquitectura de datos (híbrida)

datos.gov.co (Socrata API) ──pipeline/*.py──▶ live/*.json ──publish──▶ Vercel Blob
     (registro: store/datasets.json)                                      │
                                                 vercel.json rewrite /live/(.*)
                                                                          ▼
                                          frontend fetch('/live/*.json') (runtime, fresco)

Un cron diario recalcula y escribe a un store; el frontend lee del store al cargar (rápido, sin redeploy). Solo stdlib (urllib): reproducible y auditable. Nada sintético: si una fuente no responde, se marca —no se inventa (CLAUDE.md §5).

Cómo se produce cada cifra

Cruces que marcan anomalías (señal, no prueba)

Concentración (dependencia de un proveedor) · Fraccionamiento (≥3 mínimas cuantías mismo proveedor/categoría/año) · Sobrecosto-señal (brecha de valor por categoría vs promedio nacional — *no* sobreprecio: falta costo unitario) · Proveedor nuevo (matrícula RUES ≤90 días antes del 1er contrato) · OPS recurrente (persona con múltiples contratos) · Duplicidad (misma categoría UNSPSC en varias entidades).

Saneamiento del dato — un caso real del sector

[H] La plataforma distingue concentración real de artefacto de captura. En Hacienda, un proveedor placeholder (documento_proveedor = 'No Definido') agrupaba contratos de proveedores distintos en un mega-proveedor falso, y varios contratos traían valores billonarios mal capturados. Argos los separa a un bucket «sin proveedor identificado» (dato faltante) y excluye los valores imposibles del validado, en vez de leerlos como gasto real. Esto cambió el titular del sector (§7) y es exactamente lo que un tablero ingenuo reportaría mal.

4. Qué datos usa

[H] Todo traza al registro de datasets (store/datasets.json, corte 2026-06-25): 18 fuentes, cada una con su ID Socrata y entidad productora. La frescura se mide con la última actualización real de la fuente (rowsUpdatedAt), no con la hora de descarga: al corte, 14 fuentes abiertas OK y 5 pendientes (sin API abierta → convenio/ingesta manual).

DatasetEntidad productoraID SocrataEstado
SECOP II - Contratos ElectronicosColombia Compra Eficientejbjy-vk9habierta
SECOP II - Procesos de ContratacionColombia Compra Eficientep6dx-8zbtabierta
SECOP I - ContratosColombia Compra Eficientex6v4-i8gfabierta
SECOP I - Procesos de Compra PublicaColombia Compra Eficientef789-7hwgabierta
SECOP I - AdicionesColombia Compra Eficiente7fix-nd37abierta
SECOP Integrado (I + II)Colombia Compra Eficienterpmr-utcdabierta
SUIFP - Ejecucion Financiera de ProyectoDepartamento Nacional de Pv4ap-cvaeabierta
SUIFP - Proyectos vinculados a ContratosDepartamento Nacional de Puwns-mbwdabierta
BPIN - Datos basicos de proyectos (DNP)Departamento Nacional de Pcf9k-55fwabierta
Ejecucion Presupuestal del PGNMinisterio de Hacienda (eqxjxk-qhscabierta
Responsabilidad FiscalContraloria General de lajr8e-e8tuabierta
SPI - Seguimiento a Proyectos de InversiDepartamento Nacional de P7mxf-bp6xabierta
RUES - Registro Unico Empresarial y SociConfecamaras / Camaras dec82u-588kabierta
SIGEP - Planta de personal por entidad (Funcion Publica (DAFP)fvq4-wwtzabierta
ADRES - Recursos del Sistema General deADRES (Min. Salud)i5t3-2ui7abierta
CHIP - Entidades registradas / categoriaContaduria General de la N9dsk-w5azabierta
Ejecucion Presupuestal de Regalias (SGR)Ministerio de Hacienda y Cg4qj-2p2eabierta
Sistema General de Participaciones (SGP)DNP - SICODISpendiente (sin API)

Núcleo del caso Hacienda: SECOP II (jbjy-vk9h) y SECOP I (x6v4-i8gf) para contratos, Procesos (p6dx-8zbt) para selección en curso, PGN (xjxk-qhsc) para presupuesto, RUES (c82u-588k) y Responsabilidad Fiscal (jr8e-e8tu) para verificación cruzada (§9). El detalle de lectura está en /guia y /fuentes.

5. Cómo usa los datos

6. Cómo se piensa a sí misma (gobernanza y autocontención)

La tesis de legitimidad de Argos es explícita: *«La misma caja de herramientas sirve para auditar el gasto y para vigilar opositores. La diferencia no está en la tecnología sino en los límites que se ponen antes de encenderla.»* El riesgo de abuso no es hipotético en Colombia (el escándalo de las «chuzadas» del DAS es el antecedente). Por eso la autocontención se diseña antes, no después.

Los 7 principios

Gobernanza de 4 niveles + 7 garantías estructurales

Consejo Estratégico · Comité de Control y Legalidad («quien controla los logs no debe ser solo el Ejecutivo») · Unidad Técnica · Mesa Ciudadana y Académica. Garantías: ley estatutaria con finalidad taxativa que prohíba el perfilamiento político; contrapesos; minimización y finalidad (autorización judicial cuando toque intimidad); trazabilidad inmutable auditable por Contraloría/Procuraduría sin pedir permiso al Ejecutivo y no borrable; auditoría externa algorítmica con publicación de falsos positivos; debido proceso; cláusula anti-captura (reglas que sobrevivan al cambio de gobierno).

Las reglas rojas — lo que la plataforma NO hará jamás

❌ Vigilancia política o perfilamiento por afiliación/protesta/ideología · ❌ acceso indiscriminado a datos sensibles sin base legal · ❌ modelos secretos (caja negra): toda alerta debe ser explicable · ❌ decisiones automáticas sancionatorias · ❌ mezclar inteligencia de seguridad con programas sociales · ❌ reemplazar a Fiscalía/Contraloría/Procuraduría/jueces.

Debido proceso (enrutamiento)

Detección → dossier explicableREVISIÓN HUMANA (la IA prioriza; el humano decide) → enrutamiento a la competencia: Administrativa · Fiscal (Contraloría, art. 267) · Disciplinaria (Procuraduría, art. 277) · Penal (Fiscalía, art. 250). *Una alerta es una alerta de auditoría, no una prueba penal.*

Cómo se analiza a sí misma: equipo de agentes + abogado del diablo

El análisis por entidad corre como un equipo de 6 roles (coordinador; abogado administrativo→Reformabilidad; financiero→Costo; contratación→Riesgo; datos/ontología→Duplicidad; valor público→Valor), y un abogado del diablo que ataca las conclusiones débiles antes de consolidar («no produce hallazgos propios»; su éxito se mide en falsos positivos evitados). La consolidación recibe hallazgos ya impugnados, no crudos.

Doble verificación de datos (ver §9)

(a) Segundo testigo (pipeline/verificacion.py): contrasta una cifra contra una segunda fuente/institución distinta de la que la produjo (PGN↔SECOP, RUES, Contraloría) y emite veredicto explícito. (b) Motor de *drift* (verifica-data): re-deriva las cifras publicadas consultando la fuente hoy y compara (tolerancia 2%); si diverge, marca *drift* (snapshot desfasado o bug), nunca «la fuente está mal».

7. Descubrimientos y alertas — Sector Hacienda

Todo lo de esta sección se deriva del store verificado (§9). Señal de auditoría, no prueba.

Titular: leer el validado, no el reportado

Procesos en curso (decisión de empalme)

Patrones que requieren validación

Concentración y dato faltante

Ranking de riesgo por entidad

[INF] Score preliminar 0–100 (concentración de proveedor real, participación de valor, ejecución). 3 entidades en rojo, 1 en naranja. El score del ranking coincide con la ficha de cada entidad (misma fuente autoritativa).

#EntidadScoreColorDep. top prov.Motivos
1FINANCIERA DE DESARROLLO NACIONAL53rojo87%dependencia del mayor proveedor ≥70% (87%); ≥70% del valor por régimen especial/directa
2FIDUCIARIA LA PREVISORA S.A.- FIDU45rojo88%dependencia del mayor proveedor ≥70% (88%); ≥70% del valor por régimen especial/directa
3SUPERINTENDENCIA DE LA ECONOMIA SO45rojo77%dependencia del mayor proveedor ≥70% (77%); ≥70% del valor por régimen especial/directa
4UNIDAD DE GESTION PENSIONAL Y PARA31naranja37%≥70% del valor por régimen especial/directa; concentra gasto material
5DIRECCION DE IMPUESTOS Y ADUANAS N23amarillo35%concentra >$1 B contratado; 30 contratos con adiciones atípicas
6FONDO ADAPTACIÓN23amarillo35%≥70% del valor por régimen especial/directa; concentra gasto material
7EMPRESA INDUSTRIAL Y COMERCIAL DEL23amarillo21%≥70% del valor por régimen especial/directa; 30 contratos con adiciones atípicas
8CONTADURÍA GENERAL DE LA NACIÓN23amarillo31%≥70% del valor por régimen especial/directa; 3 contratos con adiciones atípicas
9MINISTERIO DE HACIENDA Y CREDITO P16amarillo25%concentra gasto material; 24 contratos con adiciones atípicas
10SOCIEDAD DE ACTIVOS ESPECIALES SAS15amarillo43%≥70% del valor por régimen especial/directa
11AGENCIA ITRC15amarillo41%≥70% del valor por régimen especial/directa
12UNIDAD ADMINISTRATIVA ESPECIAL UNI15amarillo37%≥70% del valor por régimen especial/directa

Contratos de mayor riesgo preliminar

[INF] Priorizados por score (monto, modalidad, etapa, atipicidad, adiciones). Los de mayor score del sector están marcados error_probable (valor imposible → validar el dato primero):

EntidadObjetoValor reportadoEstado datoScore
MINISTERIO DE HACIENDA YServicios Financieros y de Seguros$766.488 Merror_probable45/naranja
MINISTERIO DE HACIENDA YServicios Financieros y de Seguros$132.333 Merror_probable45/naranja
FONDO ADAPTACIÓN FAServicios de Edificación, Construcción de In$121.782 Merror_probable45/naranja
MINISTERIO DE HACIENDA YServicios Financieros y de Seguros$98.813 Merror_probable45/naranja
SUPERINTENDENCIA DE LA EServicios Públicos y Servicios Relacionados$71.500 Merror_probable45/naranja
FONDO ADAPTACIÓN FAServicios de Gestion, Servicios Profesionale$64.145 Merror_probable45/naranja
FONDO ADAPTACIÓN FAServicios de Gestion, Servicios Profesionale$64.145 Merror_probable45/naranja
FONDO ADAPTACIÓN FATerrenos, Edificios, Estructuras y Vías$55.932 Merror_probable45/naranja

8. Datos faltantes y límites del caso

9. Verificación de este dossier

(a) Segundo testigo — re-derivación en vivo (motor de *drift*)

[H] Las cifras del sector se re-derivan consultando la fuente en vivo y se comparan con lo publicado (tolerancia 2%). Estado al 2026-07-01: drift · modo vivo · 14 entidades · 28 cifras re-derivadas · 4 drift · 0 hallazgo(s) crítico(s). Fuente: datos.gov.co · SECOP II jbjy-vk9h.

Sellos de generación: hacienda.json 2026-07-01T19:26:55 · hacienda_entidades.json 2026-07-01T19:17:41.

(b) Segundo testigo — contraste cross-source

[H] Cada cifra se contrasta contra una segunda fuente/institución distinta de la que la produjo (no es re-ejecutar nuestra propia consulta): señal reforzada o desmentida por un tercero, nunca prueba. *«Sin segundo dato» ≠ exoneración.*

ContrasteInstitucionesVeredictoConfianza
PGN (Hacienda) vs SECOP (CCE) · por sectColombia Compra Eficiente (SECOP) → Ministerioconcuerdamedia
RUES (Confecámaras) · contratista existeNIT del proveedor (SECOP) vs matrícula mercantdiscrepamedia
Contraloría · Responsabilidad Fiscal (inNIT de entidades del tablero vs extracto de releadbaja

[H] Sector Hacienda en el contraste PGN↔SECOP (misma vigencia, dos instituciones): PGN comprometido $10.98 B vs SECOP contratado (vigencia) $260.363 M → concuerda. El comprometido del PGN incluye rubros no contratables (nómina, transferencias, deuda), por eso contratado ≤ comprometido es lo normal.

Vocabulario de veredictos: concuerda 🟢 (las fuentes cohieren) · discrepa 🔴 (no cohieren → bandera) · sin_par ⚪ (la segunda fuente no cubre el caso) · lead 🟡 (coincidencia en fuente parcial → indicio, requiere consulta autoritativa).

10. Cómo se replica para todas las entidades

[H] Este dossier es generado, no escrito a mano: python3 analyses/hacienda/build_dossier.py lee el store y arma el documento. La misma estructura (secciones 0–6 y 10, método y gobernanza) es constante; cambia solo la sección 7 (descubrimientos), que se deriva del perímetro elegido.

11. Anexos

Glosario de etiquetas y estados

Comandos reproducibles

python3 -m pipeline.hacienda           # regenera el sector + fichas por entidad
python3 -m pipeline.verificacion       # segundo testigo cross-source
python3 .claude/skills/verifica-data/verifica_hacienda.py --md   # re-derivación + badge
python3 analyses/hacienda/build_report.py     # informe de empalme + matrices CSV
python3 analyses/hacienda/build_dossier.py    # este dossier (.md + .html)

Registro de fuentes (18 datasets, ver §4)

Trazabilidad: cada cifra del repo traza a uno de estos datasets públicos de datos.gov.co.

Enlaces


*Generado por analyses/hacienda/build_dossier.py desde el store verificado de Argos (datos.gov.co). Señal de auditoría, no prueba. El modelo prioriza; el humano decide.*

Para PDF: abre este archivo y usa Imprimir → Guardar como PDF.