Haciendo estudios estadísticos
1.- ¿Cómo se empieza un estudio estadístico?
Debemos tener en cuenta:
¿Qué queremos saber?
"A la característica o cualidad que queremos estudiar la llamaremos variable estadística."
Ejemplos de variable estadística:
Pero no todas las variables estadísticas son iguales. Las hay básicamente de dos clases:
¿De quién quiero saber la información?
Lo segundo que debemos decidir es ¿de quién o qué queremos saber la información? Es decir ¿a qué personas vamos a preguntar o en qué objetos vamos a medir la característica que queremos estudiar?
Como es prácticamente imposible encuestar a toda la población debido al coste en tiempo, dinero y personal que supondría preguntar a todos los españoles sobre sus hábitos sería gigantesco, por eso lo que se hace es seleccionar una muestra.
"Una muestra es una parte de la población sobre la que estudiaremos la variable estadística."
El objetivo es extender las conclusiones que se obtengan sobre la muestra a TODA la población. Así, preguntando a un grupo de españoles en vez de a todos, se puede extraer conclusiones sobre la población española total (y se ahorra una pasta…).
¿Cómo obtengo los datos?
Una vez seleccionada la muestra, hay dos formas de obtener la información que necesitamos:
2. ¿Qué hacemos con los datos que hemos tomado?
Primero calculamos la frecuencia absoluta. La frecuencia absoluta de un valor xi de la variable es el número de veces que se ha observado dicho valor, y se representa ni
Ejemplo: Vamos a suponer el siguiente estudio estadístico: queremos saber el tiempo que nuestros vecinos dedican a desayunar. Los individuos encuestados han dado las respuestas: 0,0,9,0,5,5,9,5,15,0.
Debemos tener en cuenta:
- ¿Qué queremos saber?
- ¿De quién queremos saber la información?
- ¿Cómo obtenemos los datos?
¿Qué queremos saber?
"A la característica o cualidad que queremos estudiar la llamaremos variable estadística."
Ejemplos de variable estadística:
- La marca de cereales para el desayuno.
- El número de horas de sueño.
- El color de los ojos.
- La estatura.
- El número de libros leídos el último mes.
Pero no todas las variables estadísticas son iguales. Las hay básicamente de dos clases:
- Variables cuantitativas: son aquellas que pueden medirse numéricamente. Por ejemplo, "el tiempo dedicado a desayunar", que puede expresarse en número de minutos).
- Variable discreta: tiene un número FINITO de posibles resultados ("paramos de contar" las posibilidades).
- Variable continua: el número de posibles respuestas es infinito, así que debemos agruparlas en intervalos. Por ejemplo, como son demasiadas las posibles respuestas si preguntamos el peso, agrupamos las respuestas en intervalos: "entre 50 y 60 kilogramos", "más de 60 y hasta 70 kg", etc. Puede que aunque no haya infinitas posibilidades sean demasiadas y también debamos agruparlas.
- Variable discreta: tiene un número FINITO de posibles resultados ("paramos de contar" las posibilidades).
- Variables cualitativas: no todas las cosas que podríamos estudiar estadísticamente pueden expresarse con números. En algunos casos se trata de cualidades no medibles numéricamente. Por ejemplo, "la marca de cereales para el desayuno" se expresará de forma no numérica, con el nombre de la marca ("Estadifibra", "Matechoco", etc).
¿De quién quiero saber la información?
Lo segundo que debemos decidir es ¿de quién o qué queremos saber la información? Es decir ¿a qué personas vamos a preguntar o en qué objetos vamos a medir la característica que queremos estudiar?
- El grupo de personas u objetos (individuos) en el que vamos a estudiar la variable estadística se llama población (P).
- El número de individuos de la población se llama tamaño poblacional (N).
Como es prácticamente imposible encuestar a toda la población debido al coste en tiempo, dinero y personal que supondría preguntar a todos los españoles sobre sus hábitos sería gigantesco, por eso lo que se hace es seleccionar una muestra.
"Una muestra es una parte de la población sobre la que estudiaremos la variable estadística."
El objetivo es extender las conclusiones que se obtengan sobre la muestra a TODA la población. Así, preguntando a un grupo de españoles en vez de a todos, se puede extraer conclusiones sobre la población española total (y se ahorra una pasta…).
¿Cómo obtengo los datos?
Una vez seleccionada la muestra, hay dos formas de obtener la información que necesitamos:
- Obtención indirecta: los datos están recogidos y se consultan.
- Obtención directa: los datos se observan directamente sobre los individuos, específicamente para el estudio. Seguramente los datos se ajustarán a nuestros deseos pero costará más obtenerlos.
2. ¿Qué hacemos con los datos que hemos tomado?
Primero calculamos la frecuencia absoluta. La frecuencia absoluta de un valor xi de la variable es el número de veces que se ha observado dicho valor, y se representa ni
Ejemplo: Vamos a suponer el siguiente estudio estadístico: queremos saber el tiempo que nuestros vecinos dedican a desayunar. Los individuos encuestados han dado las respuestas: 0,0,9,0,5,5,9,5,15,0.
Valores de la Variable (xi)
0 ................................... 5 .................................... 9 .................................... 15 .................................. Total: |
Frecuencia Abosluta (ni)
4 3 2 1 10 |
Seguidamente calculamos la frecuencia relativa. La frecuencia relativa de un valor de la variable es su frecuencia absoluta dividida por el número de observaciones. Para el valor xi se representa fi.
Siguiendo con el ejemplo anterior seguimos calculando la frecuencia relativa:
Siguiendo con el ejemplo anterior seguimos calculando la frecuencia relativa:
Valores de la Variable (xi)
0 ................................... 5 .................................... 9 .................................... 15 .................................. Total: |
Frecuencia Absoluta (ni)
4 3 2 1 10 |
Frecuencias relativas (fi)
4 : 10 = 0,4 3 : 10 = 0,3 2 : 10 = 0,2 1 : 10 = 0,1 1 |
3. ¿Cómo podemos ver los datos gráficamente?
Los datos estadísticos se pueden "ver" en dibujos. Sí sí, en serio. ¿A que si lo logramos será genial? Vamos allá.
Los datos estadísticos se pueden "ver" en dibujos. Sí sí, en serio. ¿A que si lo logramos será genial? Vamos allá.
DIAGRAMA DE BARRAS:
Un diagrama de barras de una variable estadística se hace de forma muy sencilla. Por pasos, tras hacer la tabla de frecuencias:
Por ejemplo, en el caso anterior, a partir de la tabla podemos obtener el diagrama de barras siguiente: DIAGRAMA DE SECTORES:
Un diagrama de sectores es un círculo dividido en sectores cuya área será tanto mayor cuanto mayor sea la frecuencia del valor que representa.
|
Diagrama de Barras:
Diagrama de Sectores:
|
4. Calculando números que informan sobre los datos
Media Aritmética:
Antes de continuar, te vamos a preguntar una cosa. Si sacas en dos exámenes un 8 y un 6, ¿a que sabes tu nota media? Lo que haces, quizá sin saberlo, es sumar las dos notas y dividir lo obtenido por dos ¿verdad? Eso que haces se llama media aritmética.
Te vamos a contar más sobre ella y sobre alguna otra cosa… y haremos algunas cuentas.
Se llama media aritmética de una variable aleatoria a la suma de todos los valores observados dividida por el total de observaciones.
Vamos a calcular la media aritmética del ejemplo anterior. Hay dos formas de calcular la media aritmética:
2. A la suma de los valores lo dividimos entre las encuestas realizadas 48:10 = 4,8
Así que decimos que la media aritmética es 4,8
Media Aritmética:
Antes de continuar, te vamos a preguntar una cosa. Si sacas en dos exámenes un 8 y un 6, ¿a que sabes tu nota media? Lo que haces, quizá sin saberlo, es sumar las dos notas y dividir lo obtenido por dos ¿verdad? Eso que haces se llama media aritmética.
Te vamos a contar más sobre ella y sobre alguna otra cosa… y haremos algunas cuentas.
Se llama media aritmética de una variable aleatoria a la suma de todos los valores observados dividida por el total de observaciones.
Vamos a calcular la media aritmética del ejemplo anterior. Hay dos formas de calcular la media aritmética:
- A lo bruto: sumamos todas las respuestas que nos han dado los vecinos y dividimos entre los 10 vecinos encuestados:
2. A la suma de los valores lo dividimos entre las encuestas realizadas 48:10 = 4,8
Así que decimos que la media aritmética es 4,8
- Pensando un poco: En realidad lo que haríamos sería sumar cada valor multiplicado por su frecuencia absoluta y dividir después por el número total de observaciones:
(0·4 + 5·3 + 9·2 + 15·1):10 = 48:10 = 4,8 minutos.
Valores de la Variable (xi)
0 ................................... 5 .................................... 9 .................................... 15 .................................. Total: |
Frecuencia Absoluta (ni)
4 3 2 1 10 |
Media Aritmética:
1.Sumamos todos los valores (0+0+9+0+5+5+9+5+15+0):10 = 48 2. A la suma de los valores lo dividimos entre las encuestas realizadas 48:10 = 4,8 Por lo que decimos que la media aritmética es: 4,8 |
Moda:
¿Qué quiere decir que un color está de moda? Pues que la mayoría de la gente se viste con ese color. ¿Qué significa que está de moda desayunar cereales? Que la mayoría de la gente toma cereales…
La moda de una variable estadística es el valor más frecuente, el más repetido en las respuestas… el de mayor frecuencia absoluta (o relativa).
Si observamos el ejemplo anterior
Valores de la Variable (xi)
0 ................................... 5 .................................... 9 .................................... 15 .................................. Total: |
Frecuencia Absoluta (ni)
4 3 2 1 10 |
Moda:
Como podemos observar en la frecuencia absoluta el valor que más se repite es el "0", por lo que podemos decir que la MODA: "0" |
Podemos estudiar si los datos de nuestras variables están, en su conjunto, más o menos cerca de las medias respectivas.
Existen dos números (parámetros estadísticos) que nos ayudan a MEDIR esta cercanía de los datos a la media, es decir, a medir la dispersión de los datos:
- Varianza: que es la media de las distancias de los valores a la media, al cuadrado.
- Desviación típica:
Pues vamos a ver como podemos calcular la Varianza:
1. Calculamos la distancia de cada valor a la media aritmética, lo elevamos al cuadrado y sumamos los resultados:
0 - 4,8 = - 4,8
0 - 4,8 = - 4,8 9 - 4,8 = 4,2 0 - 4,8 = -4,8 5 - 4,8 = 0,2 5 - 4,8 = 0,2 9 - 4,8 = 4,2 5 - 4,8 = 0,2 15 - 4,8 = 10,2 0 - 4,8 = -4,8 Total: |
(-4,8)² = 23,04
(-4,8)² = 23,04 (4,2)² = 16,8 (-4,8)² = 23,04 (0,2)² = 0,04 (0,2)² = 0,04 (4,2)² = 16,8 (0,2)² = 0,04 (10,2)² = 104,04 (-4,8)² = 23,04 23,04 + 23,04 + 16,8 + 23,04 + 0,04 + 0,04 + 16,8 + 0,04 + 104,4 + 23,04 = 230,28 |
2. Dividimos el resultado anterior por el número de elementos, y ya obtenemos la varianza:
230,28 : 10 = 23,02
Varianza = 23,02
230,28 : 10 = 23,02
Varianza = 23,02
Muy MUY importante
Como es una media de "números al cuadrado" y las cosas al cuadrado son siempre positivas, LA VARIANZA ES SIEMPRE POSITIVA.
Una varianza negativa se considera un "delito matemático", si te aparece alguna revisa tus cálculos porque te has equivocado seguro.
Para calcular la desviación típica:
Si hemos calculado la varianza, la desviación típica es muy fácil de calcular: solo hay que hacer la raíz cuadrada a la varianza.
Desviación típica: √ 23,02 = 4,79
Como es una media de "números al cuadrado" y las cosas al cuadrado son siempre positivas, LA VARIANZA ES SIEMPRE POSITIVA.
Una varianza negativa se considera un "delito matemático", si te aparece alguna revisa tus cálculos porque te has equivocado seguro.
Para calcular la desviación típica:
Si hemos calculado la varianza, la desviación típica es muy fácil de calcular: solo hay que hacer la raíz cuadrada a la varianza.
Desviación típica: √ 23,02 = 4,79
5. Interpretar los resulados
Ya sabes hacer muchas cosas con nuestros datos, pero no tiene sentido que nos pongamos a hacer cuentas y gráficos perdiéndonos entre números y tablas simplemente porque sí.
Ten presente que se trata de dar respuesta a lo que queríamos saber extrayendo conclusiones:
Ya sabes hacer muchas cosas con nuestros datos, pero no tiene sentido que nos pongamos a hacer cuentas y gráficos perdiéndonos entre números y tablas simplemente porque sí.
Ten presente que se trata de dar respuesta a lo que queríamos saber extrayendo conclusiones:
- Las tablas de frecuencias y los gráficos tienen por objetivo organizar y facilitar la visualización de los datos.
- La media aritmética indica un valor representativo de la variable, que resume la información de los datos recogidos y se interpreta en la realidad concreta que estamos estudiando.
- La varianza y desviación típica nos dicen cómo están de agrupados los datos respecto de la media. Permiten saber hasta qué punto la media aritmética da una buena información de la realidad estudiada.
Ejemplo de estudio estadístico:
Se ha realizado una encuesta sobre el número de veces que van unas personas al cine en un mes y hemos obtenido los siguientes datos: 9, 3, 8, 8, 9, 8, 9, 18
Tabla de Frecuencia:
Se ha realizado una encuesta sobre el número de veces que van unas personas al cine en un mes y hemos obtenido los siguientes datos: 9, 3, 8, 8, 9, 8, 9, 18
Tabla de Frecuencia:
Valores de la Variables (xi)
3 ...................................... 8 ..................................... 9 ...................................... 18 .................................... Total |
Frecuencia Absoluta (fi)
1 3 3 1 8 |
Vamos a representar los datos en una gráfica:
Calculamos la media aritmética: (sumamos todos los valores y lo dividimos por el número de valores)
(9+3+8+8+9+8+9+18) : 8 = 9 Media Aritmética = 9
Calculamos la moda: (para ello observamos la tabla de frecuencia y vemos el valor o valores que más se repite)
Vemos que hay dos valores que más se repiten: 8 y 9
Por lo que la Moda = 8 y 9
Pasamos ahora a calcular la Varianza:
Para ello calculamos la distancia de cada valor a la media aritmética, lo elevamos al cuadrado y sumamos los resultados. Finalmente dividimos el resultado anterior por el número de elementos
(9+3+8+8+9+8+9+18) : 8 = 9 Media Aritmética = 9
Calculamos la moda: (para ello observamos la tabla de frecuencia y vemos el valor o valores que más se repite)
Vemos que hay dos valores que más se repiten: 8 y 9
Por lo que la Moda = 8 y 9
Pasamos ahora a calcular la Varianza:
Para ello calculamos la distancia de cada valor a la media aritmética, lo elevamos al cuadrado y sumamos los resultados. Finalmente dividimos el resultado anterior por el número de elementos
9 - 9 = 0
3 - 9 = -6 8 - 9 = -1 8 - 9 = -1 9 - 9 = 0 8 - 9 = -1 9 - 9 = 0 18 - 9 = 9 Total |
(0)² = 0
(-6)² = 36 (-1)² = 1 (-1)² = 1 (0)² = 0 (-1)² = 1 (0)² = 0 (9)² = 81 = 0 + 36 + 1 + 1 +0 +1 + 0 +81 = 120 |
Dividimos el resultado por el número de valores 120 : 8 = 15
Así obtenemos la Varianza = 15
Finalmente nos queda por calcular la Desviación Típica: (realizar la raíz cuadrada de la Varianza)
Desviación Típica = √ 15 = 3,87
Así obtenemos la Varianza = 15
Finalmente nos queda por calcular la Desviación Típica: (realizar la raíz cuadrada de la Varianza)
Desviación Típica = √ 15 = 3,87