PARTE I: ESTADÍSTICAS BÁSICAS SOBRE LA ESTADÍSTICA
Jhon Alexánder Monsalve Flórez
Esta reseña surge de conversaciones sobre el libro mantenidas con ChatGPT
La primera parte del libro cumple una doble
función: alfabetizar en el lenguaje mínimo de la estadística y formar criterio
para consumir cifras y gráficos con sensatez. Rumsey instala desde el inicio
una idea rectora: la estadística está en todas partes —medios, salud,
educación, trabajo— y debe leerse con espíritu de detective, no de crédulo ni
de negacionista. Su estilo pedagógico combina íconos, recordatorios y humor
editorial (las viñetas de Rich Tennant), recursos que bajan la barrera de
entrada y promueven una lectura activa.
En el plano conceptual, esta sección introduce los
tipos de datos (categóricos, numéricos; discretos y continuos), la distinción
población–muestra y la diferencia crucial entre parámetros (μ, σ) y
estadísticos (xˉ, s). Se presentan las medidas de centro (media, mediana y un
menor énfasis en la moda) y de dispersión —con especial atención al rango
intercuartílico por su robustez frente a valores extremos—, junto con los
valores z y la distribución normal. Como antesala de la inferencia, se esbozan
el Teorema del Límite Central, los intervalos de confianza y el margen de
error, además del contraste de hipótesis y los valores p (con la convención de 𝛼=0,05). Se
insiste, con acierto, en diferenciar significación estadística de relevancia
práctica y en no confundir correlación con causalidad.
En el plano aplicado, Rumsey muestra cómo el diseño
del estudio condiciona lo que puede concluirse: encuestas frente a experimentos
(incluidos diseños ciego/doble ciego) y la importancia de tasas frente a
números absolutos para comparaciones justas. También advierte sobre sesgos de
medición y deseabilidad social en encuestas, y sobre la manipulación visual de
la información mediante escalas y ejes. Un ejemplo iluminador es el de los
“valores normales” en medicina, entendidos como rangos estadísticos poblacionales
y no verdades absolutas.
La lectura crítica identifica, no obstante, algunos
límites didácticos: referencias imprecisas en ejemplos tomados “de la prensa”,
un sesgo práctico hacia el lector “de oficina” y afirmaciones tajantes (p. ej.,
descalificar en bloque todas las muestras no aleatorias) que en investigación
educativa requieren matiz y justificación. Aun así, el balance es positivo:
esta Parte I ofrece un vocabulario común, criterios para dudar con método y
ejemplos que conectan la teoría con la vida cotidiana y el aula.
En síntesis, la primera parte del libro sienta las
bases para “tomar el control” de los datos: saber qué miden las cifras, cómo se
obtuvieron y cómo pueden engañar o esclarecer, preparando el terreno para las
técnicas descriptivas y gráficas que se desarrollan en las partes siguientes.
Sobre el capítulo 1 “La estadística en pocas
palabras”
El primer capítulo del libro Estadística para
Dummies, escrito por Deborah J. Rumsey, cumple la función de una puerta de
entrada amable a la estadística, un campo que suele intimidar a muchos
estudiantes. Rumsey presenta desde el inicio su estilo pedagógico: íconos,
consejos, advertencias y recordatorios que acompañarán al lector a lo largo de
toda la obra. Esta estrategia, aunque aparentemente simple, refleja la
intención de hacer de la estadística un lenguaje cotidiano y accesible.
Uno de los puntos centrales es la idea de que la
estadística está presente en la vida diaria: en los medios de comunicación, en
la medicina, en la educación, en las encuestas y hasta en la manera en que
interpretamos nuestras decisiones. De esta forma, el capítulo anima al lector a
convertirse en un “detective estadístico”, alguien que no acepta ciegamente los
números, pero tampoco los rechaza con escepticismo absoluto, sino que los
interpreta críticamente.
En nuestra lectura crítica surgieron varios
comentarios y preguntas:
- Sobre la desviación estándar: Rumsey distingue entre la desviación
estándar de la muestra (s) y la de la población (σ). Conversamos sobre la
importancia de no confundir estos símbolos y cómo, en educación, trabajar
con una muestra (s) es mucho más común que tener toda la población (σ).
Esta aclaración fue muy valiosa, aunque notamos que la autora lo plantea
con rapidez y sin detenerse en ejemplos educativos.
- Sobre el Teorema del Límite Central y las distribuciones (Z, t,
binomial): Rumsey anticipa estos temas, aunque aún no los desarrolla. Nos
quedó claro que son pilares de la inferencia estadística que veremos más
adelante en la carrera universitaria simbólica, pero fue útil mencionarlos
para despertar la curiosidad.
- Sobre las gráficas: El ejemplo de construir histogramas con
estatura y peso nos llevó a una discusión importante. Reconocimos que es
correcto usar histogramas en variables continuas, pero advertimos que con
muestras muy pequeñas (ej. 8 estudiantes) el histograma pierde sentido.
Aquí surgió una crítica constructiva: habría sido deseable que Rumsey
aclarara que el histograma es útil cuando hay suficientes datos.
- Sobre medidas de dispersión: Apareció el rango intercuartílico
(RIC) como concepto. A modo de introducción, entendimos que mide el 50%
central de los datos y que es menos sensible a valores extremos que el
rango total.
- Sobre encuestas y experimentos: Rumsey distingue entre recoger
datos mediante encuestas o experimentos. Discutimos cómo un experimento,
en sentido estadístico, requiere un grupo experimental y un grupo control.
Trasladamos esto a la educación, pensando en métodos de lectura o
nutrición escolar, y concluimos que sí es posible aplicarlos en colegios,
aunque con limitaciones prácticas y éticas.
- Sobre valores normales en medicina: Uno de los aportes más
llamativos fue entender que los “valores normales” en un examen de sangre
(como glucosa o colesterol) son estadísticos, porque provienen de estudios
poblacionales y de distribuciones con media y desviación estándar. Sin
embargo, también vimos que no todos los exámenes funcionan así: algunos
son diagnósticos específicos (como el VIH), que no dependen de un rango
estadístico sino de detecciones biológicas directas.
- Sobre intervalos de confianza y margen de error: Rumsey menciona
estos conceptos y los relaciona. Aclaramos que el intervalo de confianza
es el rango de valores donde probablemente se encuentra el parámetro
poblacional, y que el margen de error es lo que define la “anchura” de ese
rango. Fue importante entender que el margen de error no se elige
arbitrariamente, sino que depende del tamaño de la muestra, del nivel de
confianza y de la variabilidad de los datos.
- Sobre contraste de hipótesis: Comprendimos que es el método
estadístico para someter a prueba afirmaciones (como las de los medios o
instituciones) con base en los datos recolectados. En un colegio, por
ejemplo, se podría contrastar la hipótesis de que “los estudiantes leen en
promedio 2 horas al día” frente a una muestra real.
- Sobre correlación y regresión: La correlación la entendimos como
una medida de la relación entre variables (ej. horas de sueño y
rendimiento académico). La regresión, en cambio, se interpreta como una
herramienta que no solo describe la relación, sino que la convierte en una
ecuación predictiva. Estos temas serán desarrollados en semestres
posteriores, pero ya nos llevamos una idea inicial para aplicarlos en
educación.
Finalmente, Rumsey cierra el capítulo con una
exhortación pedagógica: “sé un detective, no un escéptico”. En nuestra
lectura crítica, valoramos esta invitación como una forma de construir un
pensamiento estadístico que combine curiosidad y rigor: dudar de los números,
pero investigando su origen y su método, no descartándolos a priori.
El primer capítulo de Rumsey es introductorio y motivador, aunque simplifica
algunos aspectos que merecen aclaración. Sin embargo, es precisamente en esas
simplificaciones donde surgió nuestra reflexión crítica, conectando la teoría
con ejemplos reales de la escuela y la vida cotidiana.
Sobre el capítulo 2 “La estadística de la vida
cotidiana”
El capítulo 2, titulado La estadística de la
vida cotidiana, continúa con la tesis central de Rumsey: la estadística nos
rodea constantemente en noticias, decisiones personales, fenómenos naturales y
laborales. La autora ilustra esta idea comentando distintas noticias que —según
ella— aparecieron en un periódico, aunque sin dar referencia exacta. Esto
último constituye ya un primer punto crítico: no podemos verificar si los
ejemplos son reales o meramente didácticos.
Rumsey presenta ejemplos variados: desde
trabajadores de una fábrica de palomitas afectados por aromatizantes, hasta
computadores infectados, pasando por datos de mortalidad, encuestas sobre
adolescentes y sexualidad, predicciones meteorológicas, préstamos bancarios y,
finalmente, casos educativos y empresariales. Con todos estos ejemplos insiste
en que debemos ser críticos frente a los números que circulan en la vida
diaria.
Entre los aspectos que más llamaron la atención se
destacan:
- Números absolutos vs. tasas: La autora recuerda que no es lo mismo
hablar de número de fallecimientos que de tasa de mortalidad, pues esta
última permite comparar de forma justa entre poblaciones distintas.
- Sesgos en encuestas: Rumsey resalta cómo las respuestas de los
encuestados pueden estar sesgadas por deseabilidad social o por tabúes
(como ocurre en preguntas sobre sexo o hábitos de estudio). Esto muestra
que incluso un análisis estadístico impecable puede estar basado en datos
poco veraces.
- Ejemplos educativos: Rumsey menciona el caso de un distrito escolar
que gastó 386 mil dólares en clases extra de escritura. El 81,3% de los
estudiantes que asistieron aprobó, frente al 71,7% de quienes no
asistieron. Aunque la diferencia es de apenas 9,6 puntos, la autora
cuestiona si esa inversión se justifica. Este ejemplo pone en evidencia la
necesidad de evaluar tanto la significación estadística como el
costo-beneficio de las políticas educativas.
- Otras aplicaciones cotidianas: Una pizzería que decide mantener a
sus trabajadores activos tras medianoche porque los datos muestran mayor
afluencia de clientes después de esa hora; los horóscopos, criticados como
pseudociencia fácil de refutar con un contraste de hipótesis; una
fotógrafa que descubre que las fotos naturales se venden más que las
posadas; o la influencia del “voz a voz” frente a la crítica especializada
en el éxito de películas.
- Meteorología y predicciones: Rumsey reconoce que los meteorólogos
usan estadísticas, pero subraya que la incertidumbre aún es alta: los
pronósticos son estimaciones y no certezas.
En cuanto a la forma, el capítulo deja varios
puntos de crítica:
- Rumsey invita a cuestionar las fuentes, pero ella misma no
referencia el periódico del cual dice haber tomado los ejemplos. Esto
debilita el rigor del texto y obliga al lector a asumir una actitud aún
más crítica: quizá los ejemplos son reales, quizá son inventados con fines
pedagógicos.
- Enuncia objetivos al inicio: plantearse preguntas sobre
estadísticas cotidianas (cumplido con éxito) y entender las estadísticas
propias del lugar de trabajo (parcialmente cumplido). Si bien habla de
oficinistas y motiva a ser “la persona de confianza para resolver dudas de
datos en la oficina”, el desarrollo es limitado.
- Rumsey menciona incluso a otros trabajadores, como los albañiles,
pero no desarrolla cómo aplican la estadística en su labor. Esto refuerza
la sensación de que el objetivo de “estadísticas en el lugar de trabajo”
queda incompleto.
- El uso de humor (ejemplo: préstamos de la abuela) resulta
discutible en la traducción, pues en el contexto latinoamericano pierde
eficacia y puede sonar forzado.
Este segundo capítulo logra su cometido principal: demostrar que en la vida
cotidiana abundan las estadísticas y que debemos consumirlas con pensamiento
crítico. Rumsey plantea ejemplos variados y entretenidos, aunque sin sustento
en referencias precisas y con un sesgo claro hacia un lector “de oficina”. El
capítulo es didáctico, cumple la función de motivar y abrir los ojos frente a
la omnipresencia de los datos, pero deja vacíos en el cumplimiento de sus
objetivos iniciales, especialmente en la aplicación al mundo laboral.
Sobre
el capítulo 3 “Tomar el control: Tantos números y tan poco tiempo”
El
capítulo 3, titulado “Tomar el control: tantos números y tan poco tiempo”,
continúa la tesis central de Rumsey sobre la importancia de ser cautelosos
frente a las estadísticas. Aunque este énfasis ya apareció en los capítulos
anteriores, la autora logra evitar la simple repetición: cada vez añade matices
nuevos que mantienen la coherencia del libro. En este caso, el eje está en cómo
los datos y, especialmente, los gráficos pueden manipular la percepción del
público.
Rumsey
abre con ejemplos cotidianos que evidencian este riesgo. En el caso de una
lotería, muestra cómo un gráfico de barras truncado puede dar la impresión de
que ciertos números “caen menos”, cuando en realidad las diferencias
porcentuales son mínimas. Esto introduce una lección crucial: la estadística no
solo se manipula en el cálculo, sino también en su presentación visual.
Otro
ejemplo potente es el de los delitos: mientras que en números absolutos los
casos suben de un año a otro, la tasa de delitos por cada 100.000 habitantes
baja debido al crecimiento poblacional. El contraste entre ambas medidas
demuestra que los datos pueden contar historias muy diferentes según cómo se
presenten. En este punto Rumsey exhibe gran habilidad didáctica, enseñando que
los números deben interpretarse “con pinzas”, es decir, con mucha cautela.
La
autora también aborda las consecuencias de estadísticas mal interpretadas o
presentadas sin rigor. Con humor, narra el caso de un esposo que, al escuchar
un titular alarmista sobre celulares y cáncer cerebral, decide botar todos los
teléfonos de la casa. El ejemplo subraya que las estadísticas inexactas o
exageradas pueden llevar a decisiones precipitadas y poco razonables.
Una
de las citas más memorables del capítulo es la siguiente: “Recuerda que una
anécdota es en realidad una muestra no aleatoria con un tamaño igual a uno”
(Rumsey, p.47, 2013). Esta frase, breve pero contundente, resume la
imposibilidad de generalizar a partir de un caso aislado. Además, deja una
enseñanza aplicable incluso a la vida cotidiana: una opinión individual no
define una realidad colectiva.
Sin
embargo, el capítulo también presenta ciertas contradicciones. En la página 46,
Rumsey exhorta a verificar siempre las fuentes y a privilegiar revistas
académicas frente a medios poco confiables. No obstante, en la página 47
menciona un supuesto estudio médico en Colorado y Oregón sin dar referencia
alguna, ni autor, ni fecha. Esto constituye una incoherencia: la autora exige
rigor en las fuentes, pero no siempre aplica esa misma regla en sus ejemplos.
En
cuanto a los objetivos planteados al inicio, esta vez sí logra cumplirlos: Ver
el mal uso de las estadísticas: se evidencia en gráficos truncados, cifras
absolutas que omiten tasas, y ejemplos manipulativos en prensa y salud.
Comprender las repercusiones de estadísticas incorrectas: queda claro en las
decisiones precipitadas que surgen de leer titulares sin análisis crítico.
El
título mismo del capítulo, “Tomar el control: tantos números y tan poco
tiempo”, condensa la propuesta de Rumsey: en un mundo saturado de datos y con
poco tiempo para analizarlos a fondo, no debemos rendirnos ni caer en el
consumo acrítico, sino aprender a filtrar, cuestionar y pensar como usuarios
activos de la estadística. Tomar el control significa empoderarse frente a los
datos, en lugar de ser manipulados por ellos.
En
conclusión, este capítulo es uno de los más sólidos hasta ahora: mantiene la
coherencia con los anteriores, ofrece ejemplos variados (delitos, lotería,
celulares, encuestas) y refuerza la idea de que las estadísticas no son
neutras, sino herramientas que pueden usarse con fines legítimos o
manipulativos. El lector sale con la certeza de que debe mirar cada dato con
espíritu crítico, reconociendo tanto sus posibilidades como sus trampas.
Existen otros textos que profundizan en esta misma línea, como El azaroso arte
del engaño de Gerardo Herrera, que permiten ampliar la reflexión sobre cómo los
números pueden usarse para persuadir o engañar.
Rumsey
cumple en este capítulo con lo que promete: muestra ejemplos de mal uso de
estadísticas y deja claro que las decisiones basadas en datos incorrectos
pueden ser perjudiciales. El valor principal del capítulo es que va más allá de
las cifras: nos enseña a sospechar de las formas en que los datos se presentan,
desde titulares alarmistas hasta gráficos manipulados. Al mismo tiempo, deja
abiertas contradicciones cuando ella misma no da las fuentes de ciertos
ejemplos, lo que exige al lector aplicar justamente la actitud de “detective
estadístico” que el libro promueve.
Sobre
el capítulo 4 “Herramientas del oficio”
El capítulo 4, titulado “Herramientas del
oficio”, marca un punto de inflexión en el libro: mientras los tres
primeros capítulos se enfocaron en alertar sobre el uso crítico de las
estadísticas en la vida cotidiana, este capítulo introduce ya la terminología y
conceptos básicos que sostendrán el resto de la obra. No es casual que con este
capítulo se cierre la primera parte, llamada “Estadísticas básicas sobre la
estadística”, pues ofrece al lector el lenguaje mínimo para empezar a
hablar con propiedad de la disciplina.
Rumsey asocia la estadística con el método
científico, presentando las etapas clásicas: formular preguntas, diseñar
estudios, recopilar datos, analizarlos y extraer conclusiones. El primer
concepto desarrollado es el de datos, que distingue entre categóricos y
numéricos, y dentro de estos, discretos y continuos. La explicación es clara,
aunque la autora introduce ejemplos de variables discretas con valores
infinitos —como el número de lanzamientos necesarios para obtener 100 caras—
que requieren cierta reflexión adicional para entender por qué su rango no
tiene límite superior.
Posteriormente aborda los conceptos de población y
muestra, enfatizando que las muestras no aleatorias son “mal hechas”. Aquí
surge una tensión: desde la estadística inferencial estricta, Rumsey tiene
razón porque la validez de los intervalos y contrastes depende de la
aleatoriedad; sin embargo, en investigación educativa las muestras no
probabilísticas también se usan y, bien justificadas, no pueden considerarse
erróneas. Este contraste revela el sesgo formativo del libro hacia la visión
clásica de la estadística, frente a una visión aplicada en contextos sociales.
La autora subraya que “una muestra aleatoria
pequeña es mejor que una muestra no aleatoria grande”, idea que parece
contraintuitiva, pero es correcta: un buen diseño de muestra garantiza
representatividad, mientras que un gran número de datos sesgados no asegura
nada. El capítulo también diferencia entre parámetros (números que resumen a la
población, como μ) y estadísticos (números que resumen a la muestra, como
xˉ\bar{x}xˉ). Este punto es central para no confundir el alcance de cada
cálculo.
Rumsey dedica espacio a las medidas de tendencia
central: media, mediana y moda. Resalta la media como el estadístico más usado,
pero advierte que puede no ser ecuánime si hay valores extremos, donde la
mediana refleja mejor el centro. Llama la atención que no dé la misma
importancia a la moda, lo que parece una decisión didáctica para concentrarse
en las medidas más útiles en inferencia, aunque en variables cualitativas la
moda resulta fundamental.
Otro bloque del capítulo introduce la desviación
estándar, los percentiles y los valores z (z-scores), definidos como la
distancia de un dato respecto a la media en unidades de desviación estándar.
Estos valores permiten identificar observaciones inusuales: estar “a más de dos
desviaciones” equivale a tener un z-score mayor a +2 o menor a –2. Rumsey
también presenta la distribución normal o campana de Gauss y, de manera
introductoria, el Teorema del Límite Central (TLC), destacando que incluso si
los datos originales no son normales, las medias muestrales tienden a
distribuirse aproximadamente como una campana si el tamaño de la muestra es
grande.
El capítulo aborda luego los diseños de
investigación, diferenciando entre encuestas y experimentos. Rumsey explica con
claridad el valor del “encubrimiento” o diseños ciegos y doble ciegos, donde ni
los participantes ni los investigadores saben qué tratamiento se aplica, para
evitar sesgos de expectativa. Más adelante trata el intervalo de confianza y el
margen de error, ilustrado con un ejemplo cotidiano de gran poder didáctico: el
tiempo promedio de desplazamiento al trabajo (35 minutos ± 5), que clarifica el
concepto como un rango plausible más que como un valor exacto.
Otro tema clave es el contraste de hipótesis y los
valores p. Rumsey señala la convención del 0,05 como nivel de significación,
explicando que si p < 0,05 los datos son demasiado improbables bajo la
hipótesis nula (H₀), lo que da apoyo a la hipótesis
alternativa. Aquí usa la notación Hₐ en lugar de H₁, un detalle de estilo anglosajón que
conviene tener presente. El capítulo culmina con dos recordatorios esenciales: la
significación estadística (un
resultado poco probable bajo el azar no necesariamente es grande o importante
en la práctica) y la diferencia entre correlación y causalidad. Para ilustrar
lo último, Rumsey recurre al clásico ejemplo del consumo de helados y el número
de homicidios en Nueva York, que muestran correlación positiva pero sin relación
causal directa, ya que ambos fenómenos aumentan en verano por un tercer factor
oculto (el calor).
Como elemento de superestructura, la autora incluye
al inicio de la parte una caricatura de Rich Tennant, que ironiza con la frase
“satisfacción al 50%”. Estas viñetas, presentes en cada sección del libro,
cumplen una función pedagógica: relajar al lector y recordarle, con humor, que
las estadísticas sin contexto pueden sonar absurdas o vacías.
Este cuarto capítulo es, hasta ahora, el más sólido del libro. No solo
introduce las herramientas fundamentales de la estadística (datos, parámetros,
medidas de centralidad, dispersión, valores z, TLC, intervalos, contrastes e
hipótesis), sino que también mantiene el espíritu crítico de Rumsey frente a
los sesgos, los malos diseños de encuestas y la confusión entre correlación y
causalidad. Aunque algunas afirmaciones son tajantes (como descalificar todas
las muestras no aleatorias) y ciertas decisiones didácticas resultan
discutibles (como el menor énfasis en la moda), el capítulo cumple muy bien con
su objetivo: dotar al lector de un lenguaje básico del oficio estadístico,
indispensable para avanzar en la comprensión de la disciplina.

Comentarios
Publicar un comentario