▸ Cargar o abrir proyecto —
Evalúa tu política con método
Evaluar bien no es preguntar "¿funcionó?" al final. Es decidir, antes de implementar, qué pregunta vas a contestar, qué teoría de cambio estás asumiendo, qué vas a medir y con qué método — para que el resultado sea defendible incluso si la política falla en alguna parte.
Seis decisiones: pregunta evaluativa · teoría de cambio · indicadores SMART · método · criterios OCDE-DAC · plan formal. Toma entre 1 y 4 horas según la profundidad y el tamaño del equipo.
01Qué hace exactamente
02Qué te entrega
03Para qué te sirve
¿Aún no tienes el problema enmarcado o las alternativas elegidas? Salta a problema público →. ¿Quieres entender las palancas del sistema? Salta a análisis estructural →. Los cuatro son módulos complementarios del mismo lab.
— 01Pregunta evaluativa
La pregunta evaluativa determina todo lo demás. Una evaluación que intenta contestar "¿el programa funcionó?" sin distinguir tipo de pregunta, alcance temporal ni tipo de evaluación según Sinergia DNP termina midiendo lo más fácil, no lo más importante.
— 02Teoría de cambio
La teoría de cambio es el puente entre lo que la política hace y lo que la política logra. Sin ese puente explícito, no hay forma de saber si un resultado se debió a la intervención o al contexto. Cinco niveles del marco lógico (CEPAL/ILPES · Ortegón, Pacheco & Prieto 2005) + supuestos transversales (contribution analysis · Mayne 2008+).
— 03Indicadores SMART
Un indicador no es una métrica. Una métrica es cualquier cosa que puedes medir; un indicador es una métrica que captura algo específico de la teoría de cambio. Specific · Measurable · Achievable · Relevant · Time-bound — si te falta uno, no es indicador, es ruido. La validación SMART por fila es automática y solo informativa: no te bloquea, pero te avisa.
| Nivel | Nombre del indicador | Definición operativa | Fórmula | Fuente | Línea base | Meta | Frecuencia | SMART |
|---|
— 04Selector de método
El método se elige por la pregunta, no por la moda. Una pregunta causal sin contrafáctico exige cuasi-experimentación; una pregunta de valor exige métodos cualitativos o económicos; una pregunta de proceso exige observación participante. Aplicar el método equivocado a la pregunta equivocada produce evaluaciones técnicamente impecables pero sustantivamente vacías.
— 05Criterios OCDE-DAC
Los seis criterios canónicos (relevance · coherence · effectiveness · efficiency · impact · sustainability) son el lenguaje franco de la evaluación internacional desde 1991. Una evaluación que se posiciona explícitamente frente a cada uno es leída sin fricción por organismos multilaterales, cooperación y comités técnicos. Llena al menos los más relevantes a tu caso — un criterio "no aplica" con justificación también es una respuesta válida.
— 06Análisis económico
Tres calculadoras conviven, no compiten. Cuando la pregunta es de valor o gestión, conviene tener al menos una de ellas. CBA Green Book (HM Treasury 2022) para VPN social con tasa de descuento y weights distribucionales. MVPF (Hendren & Sprung-Keyser, NBER 2020) cuando quieres comparar políticas heterogéneas en un solo número — MVPF > 1 es Pareto-superior. CEA (J-PAL) cuando los beneficios no son monetizables. Este paso es opcional: llena las calculadoras que apliquen.
Cost-Benefit Analysis (CBA). Calcula el Valor Presente Neto social de la política. Tasa de descuento social: DNP usa 9%; Green Book HM Treasury 2022 propone 3% ajustada por bienestar. Weights distribucionales opcionales (Green Book 2022).
Marginal Value of Public Funds (MVPF). Beneficios para receptores ÷ costo neto al gobierno (incluyendo efectos fiscales futuros). MVPF > 1 = política Pareto-superior. Permite comparar políticas heterogéneas (educativo vs subsidio vs crédito tributario). Base pública: policyimpacts.org.
Cost-Effectiveness Analysis (CEA). Costo ÷ unidad de outcome. Accesible cuando los beneficios sociales no son monetizables (vidas salvadas, años de escolaridad adicionales, vacunados). J-PAL mantiene base comparativa por sector.
— 07Plan de evaluación
El plan de evaluación es el documento que registras antes de empezar a recolectar datos. Es el equivalente público a un Pre-Analysis Plan en investigación: define qué vas a hacer, cómo y con qué criterios de éxito, para que después no puedas p-hackear tu propia evaluación. Completa los cuatro campos finales — todo lo demás ya quedó capturado en los pasos 1-6.
— 08Plan de evaluación listo
Esta herramienta condensa los marcos canónicos de evaluación de política pública en ocho mecánicas operativas. Las raíces metodológicas: criterios OCDE-DAC (versión 2019/2021), Pre-Analysis Plans del AEA RCT Registry, theory-based evaluation de John Mayne (retrospectiva CJPE 2024) y Ray Pawson, marco lógico de CEPAL/ILPES (Ortegón, Pacheco & Prieto, 2005), value-for-money del HM Treasury Green Book (2022), MVPF de Hendren & Sprung-Keyser (NBER 2020), Cost-Effectiveness del J-PAL, y los protocolos de Sinergia DNP e Ivàlua (Cataluña). Selector de método actualizado a la frontera 2020-2026: DID escalonado (Callaway-Sant'Anna 2021), synthetic control aumentado (Ben-Michael 2021), Double ML (Chernozhukov 2018), causal forests (Wager-Athey 2018) y RDD moderno (Cattaneo-Keele-Titiunik 2023). Warning automático del sesgo TWFE (Goodman-Bacon 2021) cuando el tratamiento es escalonado.