 Estadística y Excel, varianza poblacional y desviación estándar. Prepárate, respira hondo aguantándolo durante 10 segundos y espera un suma suave que exele. Aquí estamos en Excel. Si no tiene acceso a este libro de trabajo, está bien, porque básicamente lo construimos a partir de una hoja de trabajo en blanco que comienza en una presentación anterior, por lo que podría comenzar de nuevo allí. Sin embargo, si desea comenzar aquí, simplemente con una hoja de trabajo en blanco, también puede hacerlo. Si tiene acceso a este libro, hay tres pestañas a continuación. Ejemplo, practique el ejemplo en blanco, en esencia, la pestaña práctica de la tecla de respuesta que tiene celdas preformateadas. Así que puedes llegar directamente al corazón de un problema de práctica. La pestaña en blanco es donde comenzamos con solo una hoja de trabajo en blanco. Por lo tanto, podemos practicar el formato de celdas dentro de Excel a medida que trabajamos en el problema de práctica. Así que la última vez, lo que hicimos fue tratar de pensar en este concepto de la desviación estándar, que nos da una idea del desembolso, la propagación de los datos alrededor de ese punto medio, que estamos definiendo como la media. Pensamos en la forma intuitiva en que podríamos llegar a esto, si no lo supiéramos de primera mano, o en primer lugar sobre el cálculo de la desviación estándar. Comenzando con una desviación media, donde básicamente tomamos nuestros puntos de datos, hemos tenido un conjunto de datos muy simple, y tomamos nuestros puntos de datos, y los comparamos con la media, el punto medio, el promedio. Y luego básicamente tomamos el valor absoluto de esos artículos, y lo dividimos por el conteo, para obtener un número que nos dé una idea de donde sabes, donde están pobladas las cosas alrededor de ese punto medio. Así que básicamente tomamos como media el promedio de las distancias desde cada punto de datos hasta el medio. Ahora hagamos un pequeño histograma rápido aquí, solo para que podamos ver nuestros datos. Así que voy a seleccionar nuestro conjunto de datos, e ir a la pestaña insertar, y luego insertar gráfico de pestañas. Y agreguemos un histograma que hemos visto en presentaciones anteriores, un histograma bastante aburrido como ese, agreguemos un par de cubos aquí, voy a poner algunos cubos abajo, y entraremos en nuestros cubos de la izquierda, hagamos como 8 cubos solo para hacerlo. Así que ahí tenemos una especie de idea de nuestro conjunto de datos, ¿verdad? Como si tuviera que imaginar este conjunto de datos, lo que tenemos es ese punto medio, el promedio, la media, está en el medio, que no tiene ninguno que esté aquí. Y luego los datos están alrededor de eso. Así que queríamos incluir algunos números negativos y positivos solo para mostrar que podría tener números negativos y positivos en la media, alrededor de ese punto medio. Entonces tenemos dos en el lado negativo y dos en el lado positivo. Así que esa es una especie de representación pictórica de los datos. Y estamos tratando de decir, bueno, el medio, el punto medio, y este pequeño conjunto de datos es el medio de cero, correcto, y estamos tratando de pensar en cuál es, la distancia desde básicamente ese punto medio con un pequeño conjunto de datos. Bien, ahora vamos a hacer algo similar. Pero ahora vamos a usar los cálculos reales que se usa normalmente, y esa será la desviación estándar. Y calcularemos la varianza, que es una especie de componente de la desviación estándar. Ahora, tengan cuenta que hay diferentes cálculos para si se trata de toda la población frente a la muestra, estamos imaginando una población completa de primera mano, así que recuerden, los dos cubos de los que hablamos tienen problemas estadísticos. Uno, tienes todos los datos, eso es lo que estamos imaginando aquí. Así que estamos tratando con toda la población, y donde simplemente tienes una muestra de los datos. Y los cálculos serán un poco diferentes, así que en este momento, vamos a ver que habrá que serán muy similares, pero un poco diferentes. Bien, ahora vamos a tratar con una población, toda la población, está bien, variantes de la población. Así que populación, voy a hacer blanco y negro en el encabezado, el grupo de fuentes home tab se despliega en el cubo, haciéndolo en blanco y negro. Y luego agreguemos otra fórmula. Así que voy a dibujar la fórmula de nuevo yendo a la pestaña insertar, símbolos y ecuación. Así que ahora tenemos nuestro elemento de ecuación, voy a ir a las herramientas ahora. Y luego voy a escribir en la ecuación con nuestra pequeña cosa de tinta aquí. Así que veamos si podemos escribir esto y ver si se rellena correctamente. Así que aquí vamos. Así que voy a decir que esto va a ser un sigma. Por lo que generalmente recomiendan mostrarlo como un sigma al cuadrado. Así que no es no ver mi cosa sigma. Ahí está. Sigma al cuadrado. Y así que aquí lo tenemos. Voy a decir que eso es igual a lo haremos. Eso es lo que solemos usar para representar la varianza. Así que el símbolo a menudo será sigma al cuadrado, ¿de acuerdo? Así que entonces vamos a, vamos a hacer nuestro, nuestro signo de suma se ve así. Y en, entonces, en la parte superior, voy a poner una n aquí, que aún no ve. Pero luego, cuando voy aquí, y pongo la y es igual a 1, entonces ve que todavía no ve ni n arriba. Así que bueno, veamos, si borro la n borrando a n a la n es demasiado feo, no quiere verlo. Y arriba, y borremos esto, creo que puso un ga allí para hacer esto y me aseguro de que sea una y. Así que yo es igual a 1. Bien, voy a seguir adelante a pesar de que todavía no ve ni final. Y voy a decir que esto va a ser un paréntesis. Voy a decir x, así que piensa que es una c, pero voy a poner una x y recoge la x y luego subí, x subí menos mu. Que representa la media, cierralo. Y luego vamos a poner cuadrado arriba. Así que ahí lo tenemos, todavía no reconoce ni n, que tengo que hacer. Excel para que lo reconozcas. Así que puse mi n aquí, tratemos de rodearla. Decir que? ¿Por qué no puedes ver eso? También no hace todavía. Y ahí está. Así que he dado un círculo allí, pone el inotad. Muy bien, y luego pongamos todo eso encima de una n. Así que ahí lo tenemos. Así que pueden ver que esto es similar a lo que hicimos antes. Y que vamos a tomar cada uno de nuestros puntos de datos, tenemos cuatro puntos de datos, y vamos a restarlos de la media, representada por mu, que en nuestro caso era cero. Pero esta vez, vamos a cuadrarlos. Así que eso es, así que va a ser algo que es un poco diferente a la última vez, y luego dividirlo sobre el número, que es n. Así que ese va a ser nuestro cálculo de varianza. Así que voy a decir, muy bien, insertemos que ahora esto va a tener más sentido cuando hagamos el siguiente paso para pasar de la varianza a la desviación estándar, que vamos a tomar como la raíz, raíz cuadrada. Entonces, en esencia, nos gusta cuadrarlo, y luego tomamos la raíz cuadrada de él, ya sabes, así que lo que niega hasta cierto punto, algo así como la cuadratura, ¿verdad? Así que es un poco diferente de lo que hicimos antes, lo que acabamos de decir, tomemos el valor absoluto de ello. Así que no terminamos con los números negativos que llegarán a cero, en este caso, vamos a elevarlo al cuadrado, que tiene un tipo similar de característica que no va a tener porque cuando lo cuadramos, no vamos a obtener los números negativos. Así que eso hace algo similar al valor absoluto, pero obviamente, también aumenta el valor de los números. Y luego vamos a dividirlo por n. Muy bien, así que vamos a la pestaña de inicio, grupo de fuentes, haremos esto naranja, aumentemos un poco el tamaño de la misma. Y eso se ve bien. Muy bien, y luego vamos a hacer otro, que va a ser la desviación estándar para la población, la desviación estándar para la población. Vamos a hacer este formato de encabezado pestaña de inicio, grupo de fuentes, blanco y negro. Bien, esto va a ser muy parecido a esto, esto aquí, excepto que vamos a tomar la raíz cuadrada de todo el asunto. Así que pondremos todo bajo una raíz cuadrada, por ejemplo, y es por eso que se representarán no con un sigma al cuadrado, sino simplemente con un sigma. Entonces, porque vamos a, ya saben, vamos a tomar la raíz cuadrada, eliminarla, eliminar la raíz cuadrada aquí y tomar la raíz cuadrada. Bien, entonces y luego vayamos a la pestaña insertar y dibujemosla de nuevo. Así que voy a decir que hagamos otra ecuación. A ver si puedo escribir esto o, espera un segundo. En eso. Eso no es lo que quiero. Hagamos este. Y veamos si podemos escribirlo de nuevo. Nuevo. Así que lo haré muy rápido aquí. Bien, básicamente escribí lo mismo exactamente lo mismo, excepto que no tengo un cuadrado en el sigma. Y luego voy a agregar lo nuevo que voy a poner, voy a tratar de poner todo esto bajo un símbolo de raíz cuadrada. Y ahí lo tenemos. Entonces, si tuviéramos que eliminar la raíz cuadrada, tendríamos en esencia esa varianza que observamos la última vez, que es que vamos a tomar cada punto de datos menos la media, y luego vamos a elevarla al cuadrado, que tiene la propiedad de eliminar todos los números negativos, por lo tanto, no necesitamos hacer el absoluto dividido por el conteo del número de N. Y luego, debido a que lo cuadramos, puedes pensarlo, bueno, lo cuadramos. Entonces, ¿qué pasa si luego tomo el valor absoluto? Una de las cosas que eso hará es que va a eliminar los números negativos, porque cuando lo elevamos al cuadrado, obtuvimos números negativos. Y entonces podemos absolutizarlo, lo que de alguna manera niega hasta cierto punto la cuadratura y, por lo tanto, ahora hemos llegado a algo similar a lo que tendríamos, pero no exactamente similar. Ese es en realidad uno de los puntos cuando hicimos el promedio. Aquí, así que sigamos adelante e insertemos eso. Así que vamos a traer eso aquí. Así que vamos a tirar de esto. Debajo de aquí, vamos y cuál es mi tamaño, esto resultó ser 16. Hagamos esto 16. Y hagámoslo naranja, así que pueden ver que esto es algo similar a lo que hicimos con nuestro cálculo intuitivo, que fue tomar cada punto menos la media, el valor absoluto, no cuadrarlo, correcto, pero tomamos el valor absoluto. Decicimos de los negativos divididos por 2, ver su sexto, donde tomamos cada elemento menos la media, y luego lo cuadramos eliminando, así que no tenemos que hacer el valor absoluto. Pero ahora lo hemos cuadrado dividido por n, y luego, en esencia, tomando la raíz cuadrada. Muy bien, entonces, ¿cuál es la diferencia? Veamos, hagamos el cálculo real y veamos nuestro conjunto de datos. Así que voy a copiar mi conjunto de datos aquí. Vamos a copiar esta columna. Y, entonces, voy a ver si puedo copiar solo esto, copiemos ese conjunto de datos y pongámoslo aquí. Hagamos una V delgada, poniendo mi cursor entre VI y W haciendo la delgada, y pegándola allí mismo, así que no está en una tabla, aunque parezca una tabla porque solo copié parte de la tabla. Así que vayamos a la pestaña insertar en las tablas superiores y hagamos una tabla con ella. Y ahí lo tenemos. Muy bien, entonces voy a hacer el mismo punto de partida, vamos a tener la media, la misma, la misma parte superior, solo estoy haciendo el numerador aquí, en esencia, así que tomamos la media, que es igual a lo mismo que calculamos antes de cero, que es simplemente el promedio de nuestros datos, así que tomamos que cero está tomando el promedio de los datos, solo los estamos resumiendo y dividiendo por cuatro. Y luego voy a hacer doble clic en este número, quiero hacerlo absoluto. Así que estoy seleccionando F4, y el signo de dólar del teclado antes de la de Y1 para que cada uno de estos números se extraiga de la misma celda. Y luego voy a tomar la diferencia de nuevo, la diferencia, lo mismo que hicimos antes, esto va a ser igual al 6 menos el cero, así que ahí está nuestra diferencia con la media, que por supuesto, son los mismos números en este caso, pero no siempre sería que porque elegimos la media para que sea cero, aquí es donde obtenemos algo diferente, no vamos a tomar el valor absoluto, absoluto, pero vamos a cuadrar cada una de esas diferencias. Entonces, la forma en que lo haces es que dices que es igual, voy a señalar ese número, si tienes un intercalado, si vas a tomar el poder de algo, y eso está en el turno 6 en el teclado, entonces está el intercalado, llevarlo a la potencia de 2 o cuadrarlo. Así que vamos a decir entrar. Así que ahora que los hemos cuadrado a todos, voy a agregar una columna total en la parte inferior ahora. Así que podemos hacer eso yendo al diseño de la tabla y los totales. Ahora, si resumo los datos, si sumo todos mis datos, y simplemente tomo, tomar el podría tomar el promedio, por cierto, si tomo el promedio, de ahí es de donde viene cero. Y si cuento mis datos aquí, podría contar los datos, hay cuatro de ellos, ¿verdad? Y luego puedo tomar la suma de las diferencias, que siempre va a sumar cero, porque estamos comparando todo con el punto medio o la media. Y luego tenemos la cantidad al cuadrado en lugar del valor absoluto, así que antes teníamos 20, porque sólo tomamos el valor absoluto. Y ahora tenemos, por supuesto, un número mayor de 104. Muy bien, así que ahora tomemos nuestro cuadrado. Muy bien, esto va a ser un cálculo de los va a esta diferencia al cuadrado de la media. Así que esta va a ser nuestra diferencia al cuadrado. De la media, que puedes mirar cualquiera de estas fórmulas, pero si estoy mirando aquí, voy a llegar a la varianza, tengo el numerador, así que tengo el 104, y luego el conteo. Así que este va a ser el conteo, que está representado por n, que es igual a este número que contamos, porque acabamos de contar 1,234. Y pongamos un subrayado, contra fan group y subrayado, y eso nos va a dar entonces, si dividimos, nos va a dar la varianza de dividir no quiere darme la división, o tengo que hacer esto, hacerlo de esta manera, y luego dividir, y luego varianza. Ahora, si quiero representar la varianza con un símbolo, podría usar, puedo formatear la celda de una manera en que podemos hacerlo, o podemos ingresar un símbolo para ella. Entonces, por ejemplo, si tuviera que ingresar un símbolo y fuera a los símbolos de la pestaña insertar, iría al texto normal, griego y gótico. Y luego puedes buscarlo arriba, también lo tengo aquí abajo y mi recientemente usado, así que ahí está mi inserto sigma, necesita ser cuadrado. Así que voy a poner un 2 y luego seleccionarlo para hacer click derecho sobre él, formatear, las celdas lo convierten en un subíndice. Y ahora tenemos un subíndice de los dos, no sé por qué es tan grande, sin embargo, lo cual es un poco extraño. Lo que sucedió en mis dos, tengo un gran número dos. Es solo que el tamaño de la fuente se volvió ridículamente grande, por alguna razón, vaya, hagamos esto un dos y bajemoslo a creo que fue once es la fuente que ama, o algo así, esta fuente es once. Número dos, tiene que estar en once. Está bien, está bien, y luego. Así que eso va a ser igual a esto sobre este veintiséis. Y luego vamos a obtener la desviación estándar, la desviación estándar, que está representada por solo un sigma. Entonces, si entro en los símbolos de inserción e ingreso un inserto sigma, y entonces lo hacemos tomando la raíz cuadrada. Así que vamos a tomar la raíz cuadrada. Y eso va a ser igual a esto, en realidad, tienes que hacer una fórmula con eso. Así que va a ser la función de raíz cuadrada, que es igual a sqrt, raíz cuadrada de los veintiséis nos lleva a cinco, ahora agreguemos un par de decimales. Y puedes ver que no son exactamente cinco, es cinco punto uno. Así que es un poco más alto, que es típicamente el caso, cuando usamos este método, a diferencia de nuestro método simplemente intuitivo de solo el promedio, la desviación promedio, por lo que obtienes un número distinto. Y esa es otra de las propiedades. Eso es diferente de la desviación estándar que el promedio. Así que podríamos entrar en eso y un poco más en futuras presentaciones solo para profundizar en ese punto en cuanto a por qué otra razón por la que podríamos usar este número, en lugar de hacer un cálculo como este. Pero por ahora, sigamos adelante y hagamos este grupo de fuentes de pestaña de inicio azul y bordeado, haciéndolo azul y bordeado. Si no tienes ese botón azul, está en la rueda de colores, está el azul. Y ahora, por supuesto, también podemos llegar al acceso directo allí utilizando nuestras funciones de Excel. Así que puedo decir que estas van a ser las variantes papio data anusando Excel. Correcto, y voy a decir que hagamos esta celda un poco más grande. Y esto va a ser lo mismo que esto. Así que copiaré eso y lo pondré aquí. Así que el formato está ahí con él también. Y podría decir que esto va a ser igual a la quinta A, y estamos buscando estos, estos dos, estos dos aquí VAR.PVAR.S, estamos viendo la población en este momento. Y veremos la muestra en un segundo y más en una presentación futura a prueba de futuro. Entonces, si selecciono mis datos, entonces obtenemos el veintiséis, correcto, igual que este veintiséis arriba. Y sigamos adelante y hagamos este soporte y azul y luego puedo tomar mi J, Mac puede calcular mi desviación estándar de la relación de vista POP, y en especificación, está un poco más ancha nuevamente, así que puedo copiar mi sigma va a ser representado por sigma. Así que esto va a ser igual a ST. Y una vez más, tienen el estándar, son estos dos, estamos viendo sentidi punto P puntos, estamos viendo la población en este momento. Así que voy a decir que P, seleccione mis datos e ingrese, agregamos un par de decimales, y llegamos al cinco punto uno. Hagamos esto azul y bordeado, ahora, sólo para comparar eso con las fórmulas, que veremos con más detalle más adelante, que es la varianza de la muestra y Excel. Así que eso va a ser igual a la varianza, la varianza. Así que la varianza, pero veamos la muestra sólo para obtener la diferencia. Y recojamos los datos. Entonces, si uso ese cálculo, obtengo 35 agregando un par de decimales, agregaremos algunos decimales aquí, incluso allí, y luego vamos a decir que si tomé mi muestra, la desviación estándar en Excel es igual a la desviación estándar de la muestra, entonces nuestros datos, obtenemos algo un poco diferente. ¿Derecha? Así que hablaremos más sobre eso en futuras presentaciones, porque estamos enfocados en la población aquí. Pero hagamos eso amarillo por ahora. Sólo para decir que eso es, eso es un poco diferente de la fórmula para la población. Bien, en una presentación futura, podríamos sumergirnos un poco más en el análisis de la diferencia entre usar este cálculo y por qué este tipo de cálculo más intuitivo, posiblemente más intuitivo. Otra razón por la que podríamos usarlo, usar este en su lugar como el derecho predeterminado.