Sociedad y medioambiente. Un espacio compartido: Estudio Estadístico
Estamos ante un tema de corte claramente matemático. En él se hace una introducción somera, pero más que suficiente para el nivel que nos ocupa, a la Estadística Descriptiva.
- Se introducen los conceptos de estudio estadístico, población y muestra.
- Se ejemplifican distintas modalidades de recogida de datos, cuestionarios y técnicas de muestreo.
- Se hace hincapié en la tabulación de los datos y la representación gráfica de los mismos.
- Se definen y ejemplifican los parámetros estadísticos más básicos, tanto centrales como de dispersión.
La Estadística es una parte de las Matemáticas que se ocupa de estudiar grandes cantidades de datos sobre un tema concreto.
Su importancia radica en que gran parte de las decisiones que toman Estados, grandes compañías, etc. están basados en los resultados de estudios estadísticos y, en muchas ocasiones, estos resultados pueden malinterpretarse y conducir a conocimientos erróneos (tanto intencionada como accidentalmente).
Para hacer un estudio estadístico sencillo se deben seguir determinados pasos:
1.- Decidir qué es lo que se quiere saber:
Para ello se debe plantear una pregunta clara y establecer un método para obtener respuestas. Este método depende de lo que queramos estudiar:
Al conjunto final de respuestas o datos obtenidos le llamamos VARIABLE ESTADÍSTICA
Una variable estadística puede ser:
Su importancia radica en que gran parte de las decisiones que toman Estados, grandes compañías, etc. están basados en los resultados de estudios estadísticos y, en muchas ocasiones, estos resultados pueden malinterpretarse y conducir a conocimientos erróneos (tanto intencionada como accidentalmente).
Para hacer un estudio estadístico sencillo se deben seguir determinados pasos:
1.- Decidir qué es lo que se quiere saber:
Para ello se debe plantear una pregunta clara y establecer un método para obtener respuestas. Este método depende de lo que queramos estudiar:
- Puede ser la elaboración de un cuestionario con preguntas que haya que responder:
- Abierto: cada uno puede contestar lo que quiera.
- Limitado: con un número prefijado de posibles respuestas libres.
- Cerrado: con un número determinado de respuestas que proporciona el propio cuestionario.
- Puede ser la elección de un aparato de medida adecuado para obtener datos numéricos sobre una magnitud física.
Al conjunto final de respuestas o datos obtenidos le llamamos VARIABLE ESTADÍSTICA
Una variable estadística puede ser:
CUALITATIVA
Si no es un número Por ejemplo:
|
CUANTITATIVA
Si es un número Por ejemplo:
|
2.- Decidir sobre quién o qué lo queremos saber:
Para ello debe elegirse la población, el conjunto de individuos sobre el que se hará el estudio y la muestra, el conjunto de individuos que realmente responderá al cuestionario.
La elección de la muestra es un paso fundamental puesto que debe ser representativa de la población a estudiar si queremos que los resultados obtenidos en el estudio sean fiables.
Esta es una de las partes más complejas de la estadística y hay teorías matemáticas muy complicadas al respecto.
Para ello debe elegirse la población, el conjunto de individuos sobre el que se hará el estudio y la muestra, el conjunto de individuos que realmente responderá al cuestionario.
La elección de la muestra es un paso fundamental puesto que debe ser representativa de la población a estudiar si queremos que los resultados obtenidos en el estudio sean fiables.
Esta es una de las partes más complejas de la estadística y hay teorías matemáticas muy complicadas al respecto.
La elección de la muestra puede ser
|
Los dos métodos plantean problemas
|
3.- Preparamos los datos para analizarlos
Disponemos de dos formas de organizar los datos de modo que "les podamos sacar jugo":
Organizar los datos en tablas es la opción más extendida y eficaz, sólo basta abrir cualquier modelo de hoja de cálculo o base de datos en nuestra pantalla de ordenador y observar que su formato es por defecto una tabla.
Es muy importante la organización de los datos en forma de tabla, ya que los hace más comprensibles y facilita los cálculos.
Disponemos de dos formas de organizar los datos de modo que "les podamos sacar jugo":
- Ordenarlos en tablas.
- Representarlos en gráficas.
Organizar los datos en tablas es la opción más extendida y eficaz, sólo basta abrir cualquier modelo de hoja de cálculo o base de datos en nuestra pantalla de ordenador y observar que su formato es por defecto una tabla.
Es muy importante la organización de los datos en forma de tabla, ya que los hace más comprensibles y facilita los cálculos.
Clase de animal Frecuencia
Aves 8
Peces 1
Mamíferos 7
Reptiles 3
Anfibios 2
Invertebrados 9
Tamaño de la muestra 30
Aves 8
Peces 1
Mamíferos 7
Reptiles 3
Anfibios 2
Invertebrados 9
Tamaño de la muestra 30
Una gráfica estadística es la mejor forma de presentar toda la información que se ha recogido. Con una simple "ojeada" nos permite distinguir, sin dificultad alguna, que opción es la preferida por los encuestados.
La prensa diaria está llena de ejemplos (prueba y verás como en cualquier diario que tengas a mano aparece como mínimo una gráfica estadística).
Existen muchos modelos de gráficas estadísticas, aunque los más difundidos son la gráfica de barras y el diagrama de sectores
La prensa diaria está llena de ejemplos (prueba y verás como en cualquier diario que tengas a mano aparece como mínimo una gráfica estadística).
Existen muchos modelos de gráficas estadísticas, aunque los más difundidos son la gráfica de barras y el diagrama de sectores
4.- Le sacamos jugo a los datos
Los parámetros estadísticos son una forma de resumir la información en un único valor numérico.
Los parámetros estadísticos son una forma de resumir la información en un único valor numérico.
Información que nos aportan:
- Los parámetros centrales son números que representan de forma global al conjunto de los datos.
- Los parámetros de dispersión nos informan sobre lo bien (o lo mal) que la media aritmética representa al conjunto de datos
MEDIA ARITMÉTICA:
El parámetro central más empleado es la media aritmética (a la que normalmente todo el mundo se refiere simplemente como "la media"). Se suele representar con los símbolos que ves en las imágenes y es muy fácil de calcular.
La media es suma el valor de todos los datos y se divide entre el tamaño de la muestra (el número total de datos)
Por ejemplo...
Supón que en una calle hay tres casas con jardín. En uno de los jardines hay 7 maceteros, en otro 3 y en el tercero hay 2. Entonces, el número medio de maceteros que hay en los jardines de esas tres casas (la media aritmética) será:
MODA:
La moda es el dato que más se repite, es decir, el que tiene mayor frecuencia absoluta.
También puede pasar que en una serie de datos haya varias modas, es decir, varios datos con la misma frecuencia absoluta y que sea la mayor de todas.
La moda es el dato que más se repite, es decir, el que tiene mayor frecuencia absoluta.
También puede pasar que en una serie de datos haya varias modas, es decir, varios datos con la misma frecuencia absoluta y que sea la mayor de todas.
RANGO:
El rango es la diferencia entre el dato de mayor valor y el dato de menor valor.
Por Ejemplo...
¿Recuerdas el ejemplo de los maceteros? Pues bien, el rango de esa variable estadística es...
7 - 2 = 5 Porque el dato más grande es 7 y el más pequeño es 2.
VARIANZA:
La varianza es la media de las distancias de los valores a la media, al cuadrado.
Proceso para calcular la varianza: (S²)
1.- Elevamos los datos al cuadrado y los sumamos directamente uno a uno
2.- Se divide entre el número de entrevistas.
3.- Al resultado anterior se le resta la media aritmética al cuadrado
4.- Y obtenemos la varianza
Por ejemplo...
En el ejemplo de la maceta:
1.- Elevamos los datos al cuadrado y los sumamos directamente uno a uno 7² + 3² + 2² = 49 + 9 + 4 = 62
2.- Se divide entre el número de entrevistas. 62 : 3 = 20,66
3.- Al resultado anterior se le resta la media aritmética al cuadrado 20,66 - 4² = 20,66 - 16 = 4,66
4.- Y obtenemos la varianza Varianza = 4,66
DESVIACIÓN TÍPICA
La desviación típica es la raíz cuadrada de la varianza
Por ejemplo...
Siguiendo con el ejemplo anterior:
Calculamos la desviación típica S = Raíz Cuadrada de 4,66 = 2,15
La desviación típica es el parámetro de dispersión más utilizado, y sí que tiene un significado muy claro. Nos informa sobre "la distancia media" entre los datos y la media aritmética. Cuanto menor sea la desviación típica, más representativa será la media, puesto que los datos estarán más agrupados a su alrededor.
COEFICIENTE DE VARIACIÓN:
Otro parámetro muy utilizado es el coeficiente de variación (C.V). Para calcularlo necesitamos saber antes tanto la media aritmética como la desviación típica. El coeficiente de variación se calcula con la fórmula...
Siguiendo con el ejemplo anterior:
Calculamos la desviación típica S = Raíz Cuadrada de 4,66 = 2,15
La desviación típica es el parámetro de dispersión más utilizado, y sí que tiene un significado muy claro. Nos informa sobre "la distancia media" entre los datos y la media aritmética. Cuanto menor sea la desviación típica, más representativa será la media, puesto que los datos estarán más agrupados a su alrededor.
COEFICIENTE DE VARIACIÓN:
Otro parámetro muy utilizado es el coeficiente de variación (C.V). Para calcularlo necesitamos saber antes tanto la media aritmética como la desviación típica. El coeficiente de variación se calcula con la fórmula...
Por ejemplo...
Siguiendo con el ejemplo anterior:
Calculamos el coeficiente de variación C.V. = ( 2,15 / 4 ) x 100 = 0,53 x 100 = 53 %
El coeficiente de variación es un número relativo y se expresa en %. Es muy útil porque, como la desviación típica, nos informa sobre "lo agrupados" que están los datos alrededor de la media. Pero además, nos permite comparar estudios realizados, por ejemplo, en diferentes unidades o cuyas medias sean diferentes.
Siguiendo con el ejemplo anterior:
Calculamos el coeficiente de variación C.V. = ( 2,15 / 4 ) x 100 = 0,53 x 100 = 53 %
El coeficiente de variación es un número relativo y se expresa en %. Es muy útil porque, como la desviación típica, nos informa sobre "lo agrupados" que están los datos alrededor de la media. Pero además, nos permite comparar estudios realizados, por ejemplo, en diferentes unidades o cuyas medias sean diferentes.