Inicio / Laboratorio de Políticas / Evaluación de Política

▸ Cargar o abrir proyecto —

Módulo · Diseño de evaluación de política pública

Evalúa tu política con método

Evaluar bien no es preguntar "¿funcionó?" al final. Es decidir, antes de implementar, qué pregunta vas a contestar, qué teoría de cambio estás asumiendo, qué vas a medir y con qué método — para que el resultado sea defendible incluso si la política falla en alguna parte.

Seis decisiones: pregunta evaluativa · teoría de cambio · indicadores SMART · método · criterios OCDE-DAC · plan formal. Toma entre 1 y 4 horas según la profundidad y el tamaño del equipo.

01Qué hace exactamente

Te guía por las seis decisiones que separan una evaluación defendible de un reporte cuantitativo intuitivo: (1) qué pregunta evaluativa estás contestando realmente — descriptiva, causal, de valor, de proceso o de gestión; (2) cuál es la teoría de cambio que conecta insumos con impacto; (3) qué indicadores SMART permiten medirla; (4) qué método es coherente con la pregunta (RCT, diff-in-diff, regression discontinuity, synthetic control, cualitativo, mixto, value-for-money); (5) cómo satisface los criterios OCDE-DAC (relevancia, coherencia, efectividad, eficiencia, impacto, sostenibilidad); y (6) cómo todo eso se documenta en un plan de evaluación estilo Pre-Analysis Plan.

02Qué te entrega

Un plan de evaluación descargable en Markdown estructurado por las seis decisiones, listo para someter a un comité técnico o adjuntar a un CONPES. Más una matriz de indicadores en CSV (objetivo, indicador, fórmula, fuente, línea base, meta, frecuencia) que se puede llevar a Excel, cargar en Sinergia o usar como base para un sistema de monitoreo. Si registras el plan antes de implementar, blindas la evaluación contra el sesgo de confirmación.

03Para qué te sirve

Para tomar en serio la pregunta evaluativa antes de recolectar el primer dato. La mayoría de evaluaciones falla porque salta directo a "vamos a medir X" sin definir contra qué contrafáctico, sin teoría de cambio explícita y sin criterio para distinguir cambio real de ruido. También sirve para negociar el alcance con quien financia: cuando quien evalúa puede explicar por qué pidió tres meses de línea base y un método cuasi-experimental, deja de ser tratado como burócrata costoso y empieza a ser tratado como socio del diseño.

← Volver al lab

¿Aún no tienes el problema enmarcado o las alternativas elegidas? Salta a problema público →. ¿Quieres entender las palancas del sistema? Salta a análisis estructural →. Los cuatro son módulos complementarios del mismo lab.

● Trabajando local

— 01Pregunta evaluativa

La pregunta evaluativa determina todo lo demás. Una evaluación que intenta contestar "¿el programa funcionó?" sin distinguir tipo de pregunta, alcance temporal ni tipo de evaluación según Sinergia DNP termina midiendo lo más fácil, no lo más importante.

Tipo de evaluación · tipología Sinergia DNP

La tipología oficial colombiana de evaluaciones. Determina el alcance y el formato del entregable final.

Tipo de pregunta *

Selecciona el tipo que mejor describe lo que vas a contestar. Cada uno exige métodos distintos en el paso 4.

Alcance temporal *

¿En qué momento del ciclo de la política se hace esta evaluación?

Pregunta principal *

Una sola pregunta. Específica el grupo afectado, la magnitud esperada del efecto, el horizonte temporal y, si es causal, el contrafáctico.

Sub-preguntas (opcional · máx 5)

Sub-preguntas que descompongan la principal. Ej.: "¿el efecto varía por género?", "¿se mantiene a los 12 meses?". Útiles para el plan final.

— 02Teoría de cambio

—

La teoría de cambio es el puente entre lo que la política hace y lo que la política logra. Sin ese puente explícito, no hay forma de saber si un resultado se debió a la intervención o al contexto. Cinco niveles del marco lógico (CEPAL/ILPES · Ortegón, Pacheco & Prieto 2005) + supuestos transversales (contribution analysis · Mayne 2008+).

Supuestos transversales · máx 6

✦

Revisar teoría de cambio con IA

El copiloto detecta saltos lógicos, supuestos implícitos, niveles desbalanceados e impactos vagos. Plan Premium o superior.

— 03Indicadores SMART

—

Un indicador no es una métrica. Una métrica es cualquier cosa que puedes medir; un indicador es una métrica que captura algo específico de la teoría de cambio. Specific · Measurable · Achievable · Relevant · Time-bound — si te falta uno, no es indicador, es ruido. La validación SMART por fila es automática y solo informativa: no te bloquea, pero te avisa.

Nivel	Nombre del indicador	Definición operativa	Fórmula	Fuente	Línea base	Meta	Frecuencia	SMART

Sprint E · línea base territorial

¿Tu política se evalúa en un municipio específico?

Selecciona territorio y, al crear un indicador cuyo nombre matchee con datos Fase A (homicidios, hurtos, VIF, cobertura escolar…), aparecerá un botón ✦ para autocompletar línea base + fuente + serie histórica.

✦

Sugerir indicadores con IA

El copiloto propone 4-6 indicadores SMART derivados de tu pregunta evaluativa y teoría de cambio. Plan Pro o superior.

— 04Selector de método

—

El método se elige por la pregunta, no por la moda. Una pregunta causal sin contrafáctico exige cuasi-experimentación; una pregunta de valor exige métodos cualitativos o económicos; una pregunta de proceso exige observación participante. Aplicar el método equivocado a la pregunta equivocada produce evaluaciones técnicamente impecables pero sustantivamente vacías.

Justificación de la elección (opcional)

Por qué este método es viable y por qué descartas los demás. Útil para defender el plan ante el comité.

— 05Criterios OCDE-DAC

—

Los seis criterios canónicos (relevance · coherence · effectiveness · efficiency · impact · sustainability) son el lenguaje franco de la evaluación internacional desde 1991. Una evaluación que se posiciona explícitamente frente a cada uno es leída sin fricción por organismos multilaterales, cooperación y comités técnicos. Llena al menos los más relevantes a tu caso — un criterio "no aplica" con justificación también es una respuesta válida.

— 06Análisis económico

opcional · 3 calculadoras

Tres calculadoras conviven, no compiten. Cuando la pregunta es de valor o gestión, conviene tener al menos una de ellas. CBA Green Book (HM Treasury 2022) para VPN social con tasa de descuento y weights distribucionales. MVPF (Hendren & Sprung-Keyser, NBER 2020) cuando quieres comparar políticas heterogéneas en un solo número — MVPF > 1 es Pareto-superior. CEA (J-PAL) cuando los beneficios no son monetizables. Este paso es opcional: llena las calculadoras que apliquen.

Cost-Benefit Analysis (CBA). Calcula el Valor Presente Neto social de la política. Tasa de descuento social: DNP usa 9%; Green Book HM Treasury 2022 propone 3% ajustada por bienestar. Weights distribucionales opcionales (Green Book 2022).

Costos totales (COP, anuales)

Beneficios totales (COP, anuales)

Tasa social de descuento (%)

Horizonte (años)

Weights distribucionales (notas opcionales · Green Book 2022)

—

Marginal Value of Public Funds (MVPF). Beneficios para receptores ÷ costo neto al gobierno (incluyendo efectos fiscales futuros). MVPF > 1 = política Pareto-superior. Permite comparar políticas heterogéneas (educativo vs subsidio vs crédito tributario). Base pública: policyimpacts.org.

Beneficios para receptores (COP)

Costo neto gobierno (COP, incluye efectos fiscales)

—

Cost-Effectiveness Analysis (CEA). Costo ÷ unidad de outcome. Accesible cuando los beneficios sociales no son monetizables (vidas salvadas, años de escolaridad adicionales, vacunados). J-PAL mantiene base comparativa por sector.

Costo total (COP)

Unidad de outcome

Outcome total esperado

—

— 07Plan de evaluación

El plan de evaluación es el documento que registras antes de empezar a recolectar datos. Es el equivalente público a un Pre-Analysis Plan en investigación: define qué vas a hacer, cómo y con qué criterios de éxito, para que después no puedas p-hackear tu propia evaluación. Completa los cuatro campos finales — todo lo demás ya quedó capturado en los pasos 1-6.

Cronograma estimado

Fases con duración aproximada. Útil para negociar tiempos con quien financia.

Equipo evaluador

Roles y dedicación estimada. Si hay consultores externos o miembros del equipo del programa, sé explícito sobre el conflicto de interés.

Presupuesto estimado

Rangos cualitativos son aceptables si aún no hay cifras firmes. Sin presupuesto, el plan es decorativo.

Plan de uso de los resultados

A quién le va a llegar el resultado, en qué formato, en qué momento, y qué decisión va a informar. Sin esto, la evaluación se convierte en reporte sin destinatario.

— 08Plan de evaluación listo

—

✦

Generar lectura interpretativa del plan

El copiloto interpreta la coherencia pregunta → método → indicadores → criterios. Identifica fortalezas, riesgos del método y puntos a cerrar antes de comité. Plan Premium o superior.

● Trabajando local

←

¿Y los actores que van a juzgar esta evaluación?

Un plan técnicamente impecable puede ser rechazado por razones políticas. Mactor mapea quién va a leer, validar o vetar tu evaluación, sus posiciones probables y dónde tendrás que negociar el alcance.

Análisis de actores →

←

¿La política a evaluar tiene un problema bien definido detrás?

Evaluar una política mal enmarcada es evaluar la respuesta equivocada. Problema público te ayuda a fijar enunciado, alternativas y criterios antes de medir nada.

Problema público →

→

¿La política se mantiene en distintos futuros?

El módulo de escenarios prospectivos arma 4 futuros plausibles (Schwartz · Godet · Mojica) y cruza tu plan de evaluación contra cada uno. Útil para anticipar qué indicadores hay que medir distinto si el contexto cambia.

Escenarios prospectivos →

→

¿Cómo se comunican los resultados de esta evaluación?

El módulo Comunicar la política construye el plan operativo para defender el método, traducir los hallazgos al público y a los actores políticos, y diseñar la medición OCDE 9-dim para evaluar la propia comunicación. Es el otro «evaluar».

Comunicar →

∑

¿Necesitas un memo completo con todo el ciclo?

El informe combinado del lab une lo que hayas avanzado en los 8 módulos (problema · sistema · actores · alternativas · AIN · evaluación · escenarios · comunicar) en un PDF estilo CONPES. Genera memo .pdf o .md desde la sección «Mi informe del lab» del hub.

Informe combinado →

Esta herramienta condensa los marcos canónicos de evaluación de política pública en ocho mecánicas operativas. Las raíces metodológicas: criterios OCDE-DAC (versión 2019/2021), Pre-Analysis Plans del AEA RCT Registry, theory-based evaluation de John Mayne (retrospectiva CJPE 2024) y Ray Pawson, marco lógico de CEPAL/ILPES (Ortegón, Pacheco & Prieto, 2005), value-for-money del HM Treasury Green Book (2022), MVPF de Hendren & Sprung-Keyser (NBER 2020), Cost-Effectiveness del J-PAL, y los protocolos de Sinergia DNP e Ivàlua (Cataluña). Selector de método actualizado a la frontera 2020-2026: DID escalonado (Callaway-Sant'Anna 2021), synthetic control aumentado (Ben-Michael 2021), Double ML (Chernozhukov 2018), causal forests (Wager-Athey 2018) y RDD moderno (Cattaneo-Keele-Titiunik 2023). Warning automático del sesgo TWFE (Goodman-Bacon 2021) cuando el tratamiento es escalonado.

Evalúa tu política con método

— 01Pregunta evaluativa

— 02Teoría de cambio

— 03Indicadores SMART

— 04Selector de método

— 05Criterios OCDE-DAC

— 06Análisis económico

— 07Plan de evaluación

— 08Plan de evaluación listo

¿En qué se basa?

Recursos & Datos del lab

Para guardar y compartir necesitas una cuenta

Invitar a un colaborador