Hola chic@s, gracias por conectaros, espero que durante estos días podamos hacer un repaso de lo ya aprendido y avanzar un poco en la asignatura, esperando que todo vuelva a la normalidad lo más pronto posible.
Para cualquier duda podéis enviarme un mensaje al siguiente dirección de email: direccionpondal@gmail.com
Cada entrada del blog se corresponde con la tarea planteada para cada día que en vuestro horario tuvieseis matemáticas y mientras dure el aislamiento iré colgando más tareas, por lo que tendréis que visitar el blog periódicamente. Las actividades planteadas tendréis que realizarlas en el cuaderno de clase así que mucho ánimo.
Aquí os dejo una interesante conferencia de un gran comunicador llamado Eduardo Sáenz para aquellos que queráis visualizarla. Trata sobre las matemáticas y la educación y que espero que aquellos que habéis decidido verla os haga reflexionar.
Hola chic@s, vamos a terminar el tema de estadística y aunque soy consciente de que estéis cansados os pido un último esfuerzo final.
Lo que nos falta por ver en estadística son las medidas de dispersión: rango, desviación media, varianza, desviación típica y coeficiente de variación.
Imaginaros una clase de alumnos en los que la mitad de ellos obtiene un 10 en un examen y la otra mitad un cero. Si hallamos la media nos daría 5. Ahora bien, si pensamos en otra clase en la que todos han obtenido un 5 su media también sería 5. Nos damos cuenta que la media no nos permite diferenciar si estamos en un caso o en otro, es decir, si los datos están muy dispersos como en el caso uno o muy concentrados como en el caso dos. Por eso son necesarias las medidas de dispersión para saber en que caso estamos y poder interpretar mejor los datos.
Cómo calcular el recorrido o rango
El recorrido o rango es la diferencia entre el valor mayor y el valor menor de un conjunto de datos.
Vamos a ver un ejemplo:
Cuatro amigos han sacando las siguientes notas:
Todos tienen una nota media de 5 (lo puedes comprobar), sin embargo, unas están más dispersas que otras. Vamos a ir calculando a lo largo de la lección cada una de las medidas de dispersión.
Empezamos calculando el recorrido para el Amigo A. Su nota más alta es 7 y su nota más baja es 3, por lo tanto, su recorrido es:
El recorrido para el Amigo B es 8, para el Amigo C es 9 y para el Amigo D es 3.
Cuanto mayor sea el recorrido, más dispersos están los datos.
Cómo calcular la desviación media
Cada dato, se encuentra a una cierta distancia de la media:
Cada distancia de un punto a la media, es la desviación de ese punto con respecto a la media. Se calcula como el valor absoluto del valor menos la media:
Cada distancia se mide en valor absoluto, ya que si no es así, los puntos que quedaran a la izquierda de la media, serían negativas y las distancias siempre deben ser positivas.
Si sumamos todas las distancias de cada dato con respecto a la media, es decir, de todas las desviaciones y la dividimos entre el número total de datos, estaremos calculando la desviación media.
La desviación media es el promedio de las distancias de cada uno de los datos a la media. Es la media de lo que se desvía el conjunto de datos con respecto a la media.
La fórmula anterior también podemos ponerla en forma de sumatorio (el signo Σ se utiliza para indicar la suma de varios sumandos):
Ejemplo de cómo calcular la desviación media
Vamos a ver un ejemplo de cómo calcular la desviación media. Vamos a calcular la desviación media de las notas del Amigo C:
Vamos a utilizar tablas, ya que así el procedimiento para calcular la desviación media te sirve para cuando tengas muchos datos y para cuando tengas pocos.
En primer lugar, ordenamos los datos en una tabla con la frecuencia absoluta de cada uno de ellos, dejando la última fila para la suma total de elementos de datos:
Vamos a empezar calculando la media, ya que la necesitamos para obtener las desviaciones. Añadimos una tercera columna para escribir el resultado de multiplicar cada dato por su frecuencia absoluta. En la última fila sumamos los resultados:
Ya tenemos los datos que necesitamos para calcular la media, según la fórmula, que son la suma de las multiplicaciones de cada dato por su frecuencia absoluta y el número total de datos:
La suma de las multiplicaciones de los datos por la frecuencia absoluta es 25 y lo tenemos en la última fila de la tercera columna. El número total de datos es 5 y lo tenemos al final de la segunda columna:
La media es 5.
Una vez tenemos la media, ya podemos calcular la distancia o la desviación de cada dato, como el valor absoluta de la diferencia entre cada dato con la media:
Para ello, añadimos una cuarta columna donde iremos escribiendo la distancia de cada dato:
Por ejemplo, para el dato 1, la distancia sería:
Lo hacemos igual para el resto de datos y los vamos escribiendo en la columna. En la última fila, realizamos la suma de todas las distancias:
Ya tenemos los datos que necesitamos para calcular la desviación media, según la fórmula, que son la suma de las distancias de cada dato y el número total de datos:
La suma de las distancias es 12 y lo tenemos en la última fila de la cuarta columna. El número total de datos es 5, que lo tenemos al final de la segunda columna:
Por tanto, la desviación media para el Amigo C es 2,4.
Las desviaciones medias para el resto de amigos son:
Desviación media Amigo A= 1,2
Desviación media Amigo B= 2,8
Desviación media Amigo D= 1,2
La mayor desviación media es del Amigo B, lo que significa que sus notas están muy dispersas. Para el Amigo A y el Amigo D, la desviación media es menor, lo que significa que sus notas están más cerca de su nota media, que es 5.
Cómo calcular la varianza y la desviación típica
Definimos la varianza como la media de los cuadrados de las distancias de los datos a la media, es decir, la suma de cada distancia al cuadrado, dividida entre el número de datos total:
También podemos encontrar la fórmula en forma de sumatorio:
La varianza no se puede comparar con la media aritmética, ya que el resultado de la varianza está en unidades cuadradas y el resultado de la media en unidades lineales. Por esta razón, utilizamos la desviación típica, que no es más que la raíz cuadrada de la varianza:
La desviación típica se designa con la letra griega «sigma» σ.
La fórmula de la desviación típica, sustituyendo la varianza por su expresión es:
Que también la podemos expresar en forma de sumatorio:
Con la desviación típica, determinamos de forma única la dispersión de un conjunto de datos.
Ejemplo de cómo calcular la desviación típica
Vamos a ver un ejemplo de cómo calcular la desviación típica. Vamos a calcular la desviación típica de las notas del Amigo C:
A la tabla que ya teníamos antes:
Le vamos a añadir una quita columna con los cuadrados de las distancias:
Por ejemplo, para el dato 1 sería:
Lo hacemos igual para el resto de datos y los vamos escribiendo en esa columna. En la última fila, realizamos la suma de todos los resultados:
Ya tenemos los datos que necesitamos para calcular la desviación típica, según la fórmula, que son la suma de las distancias al cuadrado de cada dato y el número total de datos:
La suma de las distancias al cuadrado es 50 y lo tenemos en la última fila de la quinta columna. El número total de datos es 5, que lo tenemos al final de la segunda columna:
Por tanto, la desviación típica para el Amigo C es 3,16
Las desviaciones típicas para el resto de amigos son:
Desviación típica Amigo A= 2
Desviación típica Amigo B= 3,03
Desviación típica Amigo D= 1,26
El Amigo A y el Amigo D tenían la misma desviación media, pero ahora, cada uno tiene una desviación típica distinta, ya que esta determina de forma única la dispersión, por lo que con más seguridad podemos decir que el Amigo D tiene los datos menos dispersos de todos.
Cálculo de la la desviación media, la varianza y la desviación típica con datos agrupados
Voy a explicarte cómo calcular las medidas de dispersión como la desviación media, la varianza y la desviación típica cuando tenemos datos agrupados.
Tenemos los siguientes datos y nos piden calcular la desviación media, la varianza y la desviación típica:
Ordenamos los datos en una tabla, determinando los intervalos necesarios y incluyendo los valores que pertenecen a cada intervalo, con el fin de obtener su frecuencia absoluta (tienes explicado cómo crear esta tabla más detalladamente en la segunda lección del curso de estadística):
Añadimos la tercera columna para la marca de clase:
La marca de clase de cada intervalo es el punto medio de cada intervalo:
Rellenamos la tabla para cada intervalo:
Añadimos otra columna más done multiplicamos cada marca de clase por su frecuencia absoluta, sumando en la última fila todos los resultados:
Con estos datos, podemos calcular la media:
La suma de las marcas de clase por su frecuencia la tenemos en la última fila de la cuarta columna, que es 169,5 y la suma de todos los elementos en la última fila de la segunda columna, que es 24:
Añadimos una quinta columna donde iremos escribiendo la distancia de cada intervalo, haciendo la resta de la marca de clase menos la media:
Tenemos la suma de las distancias de cada intervalo y el número total de datos, los cuales nos sirven para calcular la desviación media:
La suma de las distancias es 6,31, que la tenemos en la última fila de la quinta columna y el número total de datos es 24, que lo tenemos al final de la segunda columna:
Por último, le añadimos una quinta columna con el cuadrado de la distancia:
Con la suma de las distancias al cuadrado de cada intervalo y el número total de datos, podemos calcular la desviación típica:
La suma de las distancias al cuadrado es 7,68 y lo tenemos en la última fila de la sexta columna. El número total de datos es 24, que lo tenemos al final de la segunda columna:
Coeficiente de variación
El coeficiente de variación es una medida estadística que se calcula dividiendo la desviación típica entre el valor absoluto de la media y multiplicando por 100 (para obtener el resultado en tanto por ciento):
Por ejemplo, el coeficiente de variación del ejemplo anterior sería:
El coeficiente de variación se utiliza para comparar datos de una misma población, que se miden en magnitudes diferentes.
Como siempre os dejo un vídeo explicativo con un ejemplo para que lo entendáis mejor: