viernes, 20 de julio de 2007

Sobre las cifras de la CVR

.
Recomiendo leer el documento de Daniel Manrique y David Sulmont:

Preguntas y críticas frecuentemente formuladas sobre las estadísticas de la Comisión de la Verdad y Reconciliación del Perú

Documento elaborado entre el 2006 y 2007, con textos escritos desde el 2004
Julio 2007

Sobre este documento

La presente es una compilación de preguntas y cuestionamientos frecuentemente formulados sobre las estadísticas publicadas por la Comisión de la Verdad y Reconciliación en su Informe Final.

Las preguntas y cuestionamientos recopilados han sido obtenidos investigando en los archivos de algunas listas de discusión en Internet y artículos periodísticos. En muchos casos han sido reformuladas, eliminando mucho del contenido no pertinente, haciéndolas más directas, e incluso en muchos casos más serias de lo que originalmente eran. Creemos haber sido justos con las preguntas y críticas planteadas, no simplificándolas para que sean fáciles de refutar ni tergiversado su sentido.

Nuestro propósito al hacer público este documento se limita a responder a estos cuestionamientos. No entramos a discutir aspectos "de fondo" relacionados con la interpretación de estos resultados ni de las conclusiones de la CVR. Aunque creemos que la discusión importante gira en torno a esos temas, también creemos que es importante aclarar algunos malentendidos acerca del estudio estadístico de la CVR debido a que las conclusiones derivadas éste son capitales para una adecuada comprensión del conflicto armado interno que sufrió el Perú entre 1980 y 2000.

Indice

Sobre este documento
¿Por qué no se ha respondido antes a estos cuestionamientos?
¿Qué tipo de preguntas y cuestionamientos se han formulado?

1. Prolegómenos
1.1) ¿De qué datos realmente disponía la comisión?
1.2) Ok., entonces se identificaron 24,692 muertos y desaparecidos. ¿Por qué la CVR sostiene que fueron cerca de 70000?

2. Preguntas y críticas de sentido común sobre cuestiones técnicas
2.1) Cuál es la diferencia entre la “captura-recaptura” y la “estimación de múltiples sistemas”
2.2) ¿Qué evaluaciones de consistencia se ha hecho a las estimaciones? Y en general, ¿Qué evidencias hay de que las estimaciones son razonables?
2.3) Yo hice el experimento de “captura-recaptura” en casa usando frijolitos de diferentes colores y obtuve los siguientes resultados: de un total de 100 frijolitos, marqué 5, los mezclé con los restantes y cogí 59 al azar. De esos, sólo uno estaba marcado. La “estimación” resultante sería N=5*59/1 =295. ¡El método no sirve!
2.4) ¿Por qué se ha dado la cifra exacta de 69280 muertos y desaparecidos? Lo correcto hubiera sido proporcionar un intervalo de confianza o un margen de error.

3. Cuestiones técnicas
3.1) El método de captura-recaptura implica que no ha habido migraciones en la población bajo estudio. Todos sabemos que durante los años de conflicto hubo masivas olas migratorias (¡que no fueron aleatorias, para colmo!). El método está mal aplicado porque se está violando un supuesto fundamental.
3.2) ¿Por qué se utilizó el método jackknife para la estimación de los intervalos de confianza de los estimadores?
3.3) Ok, pero la aplicación es incorrecta. Se ha construido los intervalos de confianza suponiendo normalidad y estamos ante un problema de conteo, no de estimación de una tendencia central; la población no es normal y el teorema del límite central no es aplicable.
3.4) uhm… ¿pero por qué no computaron intervalos de confianza basados en percentiles de la distribución empírica derivada del remuestreo efectuado en vez de usar esta cuestionable suposición de normalidad?
3.5) La especificación del modelo utilizado hace que la estimación de las víctimas no reportadas sea proporcional a la cantidad de víctimas reportadas. Esto produce una sobreestimación en el caso de tener listas exhaustivas y una subestimación en caso de tener listas muy incompletas. El efecto neto sería una sobreestimación.
3.6) El método supone homogeneidad en la población e independencia entre las listas. Ninguno de estos supuestos es razonable.
3.7) El método supone múltiples repeticiones del experimento para lograr la estimación. La CVR sólo tuvo tres listas. ¿Cómo esperan haber obtenido un resultado razonable?
3.8) La CVR ha usado un modelo con una serie de supuestos y nos ha presentado un número sin hacer un análisis de cuánto cambiarían los resultados si es que cambian los supuestos.

4. Preguntas de interpretación
4.1) Para que la cifra de 69280 sea cierta, 9.48 personas tendrían que haber sido asesinadas por día. Eso no es posible.
4.2) La CVR ha inflado las cifras de forma tal que la responsabilidad de Sendero Luminoso / los agentes del Estado se vea aumentada / disminuida [Nota: hay versiones de este comentario para todas las combinaciones]
4.3) ¿Por qué recién en el estudio de la CVR “aparecieron” todas las víctimas de Sendero Luminoso?

5. Misceláneas
5.1) El método estadístico usado por la CVR sólo es aplicable en las ciencias naturales para estimar poblaciones animales pero no a entornos tan sofisticados como al caso de muertes en el conflicto peruano.
5.2) Los “expertos” de la CVR han usado modelos “log lineales” y estimación “jackknife” para decorar su trabajo y mostrar su sofisticación econométrica.
5.3) La captura-recaptura es un método decimonónico (sic) con un error superior al 50%
5.4) La CVR ha asumido que las proporciones de responsabilidades de las muertes y desapariciones reportadas a ella son las correctas y ha proyectado esa proporción a todas las fuentes para obtener su estimación.
5.5) La CVR ha hecho su estimación basándose en la diferencia poblacional entre los censos de 1981 y 1993. La supuesta gente faltante podría haber muerto por otras razones o podría haber migrado.
5.6) La CVR ha contado reportes de víctimas y no ha tomado en cuenta que algunos de esos reportes podrían estar repetidos. Esto lleva a una sobreestimación.
5.7) Yo conozco el distrito de Chungui, en Ayacucho. Según CEDAP, en este distrito se produjeron 982 muertes y desapariciones atribuibles al conflicto, sobre una población de 4,400 habitantes. La CVR contó 619, de los cuales 258 ya estaban en el registro de CEDAP y 361 eran nuevos. Aplicando el “método de Ball”, la proyección sería 982*619/258 = 2,356. Eso es el 54% de la población de Chungui, lo que está lejos de la verdad. Si bien Chungui fue el lugar más afectado por la violencia, de acuerdo a lo que yo conozco, allí debieron morir alrededor del 30% de sus habitantes, pero no el 54%.
5.8) La CVR ha creído en este resultado porque fue presentado por un gringo y los peruanos [excepto quien formula esta crítica, por supuesto] aceptan cualquier cosa que digan los “expertos internacionales”.
5.9) El experto peruano, Dr. Hugo Ñopo ha demostrado técnicamente / científicamente / contundentemente / etc. que las estimaciones de la CVR son incorrectas.

El texto puede verse en:

http://cifrascvr.wikidot.com/

1 comentario:

Manuel Enrique dijo...

Saludos, doctor Tanaka. En mi blog (lojustovaron.blogspot.com) he escrito sobre esta publicación de Manrique y Sulmont. Lo invito a visitarlo.

A propósito, también puse un link a su blog :)