



Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Los mejores documentos en venta realizados por estudiantes que han terminado sus estudios
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Descubre las mejores universidades de tu país según los usuarios de Docsity
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Una guía completa de referencia rápida para las fórmulas y conceptos esenciales de estadística descriptiva. Abarca medidas de tendencia central, dispersión, posición y forma, incluyendo ejemplos y explicaciones claras. Es un recurso invaluable para estudiantes de estadística básica y probabilidad.
Tipo: Guías, Proyectos, Investigaciones
1 / 7
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!
Tu guía de referencia rápida para las fórmulas y conceptos esenciales de Estadística Descriptiva.
Símbolo Significado 𝑛 Tamaño muestral 𝑁 Tamaño poblacional 𝑥 1 , 𝑥 2 , … , 𝑥𝑛 Valores individuales de la variable 𝑥𝑖 Valor individual o marca de clase en datos agrupados 𝑓𝑖 Frecuencia absoluta del valor 𝑥𝑖 ℎ𝑖 Frecuencia relativa (𝑓𝑖/𝑛) 𝐹𝑖 Frecuencia absoluta acumulada hasta el valor 𝑥𝑖 𝐻𝑖 Frecuencia relativa acumulada hasta el valor 𝑥𝑖 ∑ Operador sumatorio 𝑥̄ Media muestral 𝜇 Media poblacional Me Mediana Mo Moda 𝑠^2 Varianza muestral 𝜎^2 Varianza poblacional 𝑠 Desviación típica muestral 𝜎 Desviación típica poblacional CV Coeficiente de variación 𝑅 Rango o amplitud
Símbolo Significado 𝑄 1 , 𝑄 2 , 𝑄 3 Cuartiles (primer, segundo y tercer cuartil) 𝑃𝑘 Percentil 𝑘 𝑎𝑖 Amplitud del intervalo 𝑖-ésimo en datos agrupados 𝐿𝑖 Límite inferior del intervalo 𝑖-ésimo 𝐿𝑠 Límite superior del intervalo 𝑖-ésimo RIC Rango intercuartílico (𝑄 3 − 𝑄 1 )
2.1 Media Aritmética
Concepto: La media representa el valor promedio del conjunto de datos. Es sensible a valores extremos y considera todos los valores para su cálculo.
Para datos no agrupados:
𝑥 = ̄^1 𝑛
𝑛 ∑ 𝑖=1^ 𝑥𝑖^ =
𝑥 1 + 𝑥 2 + … + 𝑥𝑛 𝑛
Para datos agrupados:
𝑥 = ̄
∑𝑘𝑖=1 𝑓𝑖 ⋅ 𝑥𝑖 ∑𝑘𝑖=1 𝑓𝑖
=
∑𝑘𝑖=1 𝑓𝑖 ⋅ 𝑥𝑖 𝑛
Donde 𝑥𝑖 representa la marca de clase del intervalo 𝑖-ésimo.
2.2 Mediana (Me)
Concepto: La mediana es el valor central de un conjunto de datos ordenados. Divide la distribución en dos partes iguales y es robusta frente a valores extremos.
Para datos no agrupados: - Si 𝑛 es impar: Me = valor en la posición 𝑛+1 2 - Si 𝑛 es par: Me = promedio de los valores en las posiciones 𝑛 2 y 𝑛 2 + 1
Para datos agrupados:
Me = 𝐿𝑖 + (
𝑛 2 − 𝐹𝑖− 𝑓𝑖 )
⋅ 𝑎𝑖
𝑠^2 = 1 𝑛 − 1
𝑛 ∑ 𝑖=
(𝑥𝑖 −̄ 𝑥)^2
Varianza poblacional (datos agrupados):
𝜎^2 =^1 𝑁
𝑘 ∑ 𝑖=1^ 𝑓𝑖(𝑥𝑖^ − 𝜇)
2
Varianza muestral (datos agrupados):
𝑠^2 = 1 𝑛 − 1
𝑘 ∑ 𝑖=
𝑓𝑖(𝑥𝑖 −̄ 𝑥)^2
3.3 Desviación Típica (Estándar)
Concepto: La desviación típica es la raíz cuadrada de la varianza. Se expresa en las mismas unidades que los datos originales, lo que facilita su interpretación.
Desviación típica poblacional:
𝜎 = √𝜎^2
Desviación típica muestral:
𝑠 = √𝑠^2
3.4 Coeficiente de Variación (CV)
Concepto: El CV permite comparar la dispersión relativa entre distintos conjuntos de datos, incluso con diferentes unidades de medida o diferentes medias.
CV = 𝑠̄ 𝑥
⋅ 100%
3.5 Rango Intercuartílico (RIC)
Concepto: Mide la dispersión del 50% central de los datos, eliminando la influencia de valores extremos.
RIC = 𝑄 3 − 𝑄 1
4.1 Cuartiles
Concepto: Los cuartiles dividen el conjunto de datos ordenados en cuatro partes iguales. 𝑄 1 , 𝑄 2 y 𝑄 3 representan los valores por debajo de los cuales se encuentra el 25%, 50% y 75% de los datos, respectivamente.
Para datos no agrupados: - 𝑄 1 = valor en la posición 𝑛⋅ 14 (primer cuartil) - 𝑄 2 = Me
= valor en la posición 𝑛 ⋅ 24 (segundo cuartil = mediana) - 𝑄 3 = valor en la posición
𝑛 ⋅ 34 (tercer cuartil)
Para datos agrupados:
𝑄𝑗 = 𝐿𝑖 + (
𝑗⋅𝑛 4 − 𝐹𝑖− 𝑓𝑖 )
⋅ 𝑎𝑖
Donde 𝑗 = 1, 2, 3 para 𝑄 1 , 𝑄 2 y 𝑄 3 respectivamente.
4.2 Percentiles
Concepto: Los percentiles dividen la distribución en 100 partes iguales. El percentil 𝑘 (𝑃𝑘) indica el valor por debajo del cual se encuentra el 𝑘% de las observaciones.
Para datos no agrupados: - 𝑃𝑘 = valor en la posición 100 𝑘⋅𝑛
Para datos agrupados:
𝑃𝑘 = 𝐿𝑖 + (
𝑘⋅𝑛 100 − 𝐹𝑖− 𝑓𝑖 )
⋅ 𝑎𝑖
Donde: - 𝐿𝑖 = límite inferior del intervalo que contiene el percentil 𝑘 - 𝐹𝑖−1 = fre- cuencia acumulada anterior al intervalo del percentil - 𝑓𝑖 = frecuencia absoluta del intervalo que contiene el percentil - 𝑎𝑖 = amplitud del intervalo
Moda (Mo)
Valor que ocurre con mayor frecuencia. Útil para identificar el valor más típico o común. Es la única medida de tendencia central apropiada para variables cualitativas.
Varianza ( 𝑠^2 , 𝜎^2 )
Mide la dispersión promedio de los valores respecto a la media. A mayor varianza, mayor heterogeneidad en los datos. Su unidad de medida es el cuadrado de la unidad de la variable.
Desviación Típica ( 𝑠 , 𝜎 )
Raíz cuadrada de la varianza. Mide la dispersión en las mismas unidades que los datos originales, representando la desviación promedio respecto a la media.
Coeficiente de Variación (CV)
Permite comparar la dispersión relativa entre diferentes distribuciones cuando tienen diferentes medias o unidades de medida. Se expresa como porcentaje.
Cuartiles ( 𝑄 1 , 𝑄 2 , 𝑄 3 )
Dividen la distribución en cuatro partes iguales, cada una conteniendo el 25% de los datos. 𝑄 2 coincide con la mediana. Útiles para analizar la distribución y detectar valores atípicos.
Rango Intercuartílico (RIC = 𝑄 3 − 𝑄 1 )
Mide la dispersión del 50% central de los datos, eliminando la influencia de valores extremos. Usado para detectar valores atípicos (outliers).
Asimetría ( 𝑔 1 )
Indica si la distribución tiene cola hacia la derecha (positiva), hacia la izquierda (neg- ativa) o es simétrica (cero). Afecta la relación entre media, mediana y moda.
Curtosis ( 𝑔 2 )
Mide la concentración de datos en la zona central comparada con una distribución normal. Mayor curtosis indica mayor concentración de valores cercanos a la media y colas más pesadas.