 Estadística y Excel Desviación Media Desviación estándar y varianza para una población con datos salariales. Prepárate, respira hondo, aguanta durante 10 segundos y espera una exhalación más suave y relajante. Aquí estamos en Excel. Si no tiene acceso a este libro, está bien, porque básicamente lo construiremos a partir de una hoja de cálculo en blanco. Pero si tienes acceso, hay tres pestañas debajo del ejemplo, ejemplo en blanco de práctica, en esencia, tecla de respuesta pestaña de práctica que tiene celdas preformateadas. Por lo tanto, podría llegar directamente al corazón de un problema de práctica, la pestaña en blanco en una hoja de trabajo en blanco con solo nuestros datos. Así que podemos practicar el formato de las celdas dentro de Excel a medida que trabajamos en el problema de la práctica. Ahora, si no tiene estos datos, puede escribirlos aquí, no es un conjunto de datos muy largo, puede crear su propio conjunto de datos utilizando técnicas que hemos visto en presentaciones anteriores. También puedes consultar caclecagl.com para otros conjuntos de datos de práctica. Vayamos a la primera pestaña, la pestaña de ejemplo para tener una idea de lo que vamos a hacer, hemos estado profundizando un poco más en las ecuaciones para nuestro análisis estadístico. Mientras que antes de ese punto, estábamos viendo las cosas desde un punto de vista más intuitivo, así que hablamos de la ecuación media. Y luego quisimos pensar en ecuaciones que tienen que ver con la dispersión de datos, siendo la estándar la desviación estándar, así como la varianza. La última vez que tuvimos un problema de práctica, tomamos un conjunto de datos muy simple, para que podamos pasar por estos conceptos, pensando en la desviación promedio más intuitiva, y luego pasar a la desviación estándar. Y la varianza hará algo similar aquí, sin embargo, ahora tomando un conjunto de datos un poco más complejo. Así que echemos un vistazo. Vayamos a la pestaña en blanco. Este es nuestro conjunto de datos salariales. Una vez más, en el lado izquierdo que representa a los salarios de, digamos, una corporación, estamos imaginando que esto no es una muestra, sino toda la población de los datos. Así que voy a eliminar esta cosa de CACLE, voy a mantener presionado el desplazamiento control un poco. Así que nos acercamos a 235, pongamos una tabla alrededor de los datos puestos en los nuestros en los datos en alguna parte. Hemos la pestaña en las tablas superiores y creemos la mesa en la que las hormigas bailarinas hacen su danza mágica budú alrededor de las ventas. Y ahí está nuestra tabla, hagamos que una columna B delgada sea delgada haciendo que baje así. Y luego haremos algunos de nuestros análisis estadísticos estándar, ¿verdad? Así que ahora, por supuesto, podríamos ordenar los datos y queremos verlos de menor a mayor, por ejemplo, o de mayor a menor. Y podríamos cambiarlo de mayor a menor si quisiéramos hacer eso. Y ahora podemos hacer nuestro cálculo normal. Entonces, nuestros cálculos estadísticos incluyen la media, o promedio, primero formateemos todos nosotros mismos al script que normalmente haríamos, pongamos nuestro cursor en el triángulo, hagamos clic derecho en toda la hoja de trabajo y luego formateemos las celdas. Y me gusta ir con moneda y números negativos, entre corchetes y sin signo rojo de dólar, y no necesitamos ningún decimal en este momento, los agregaremos según sea necesario cuando las ventas los requieran. Así que ahí lo tenemos. Tenemos. Haré que el salario sea blanco en la parte superior. Así que pudimos ver eso pero no todos los datos, deshacer quiero poner el encabezado, voy a ir a la pestaña de fuentes y hacer que sea blanco. Y hagamos que todo sea audaz para que todo sea audaz, muy bien, así que ahora vamos a hacer esto grande. Y entonces tenemos el promedio o la media. Y luego podemos hacer el mínimo, podemos hacer Q1, cuartil 1, podemos hacer la mediana, que también es cuartil 2, podemos hacer cuartil 3, podríamos hacer el máximo. Y entonces hagámoslo. Así que tenemos que el promedio va a ser igual a voy a hacer esto rápido porque lo hemos visto varias veces en el pasado, simplemente usando nuestra función promedio, haga doble click en la función, seleccionando los datos con ellos en una tabla, puedo seleccionar las hormigas danzantes de flecha hacia abajo alrededor de los datos, haciendo su magia y haciendo el cálculo. Entonces, en el mínimo es igual a M y N, voy a hacer control chef para poner el corchete o chef 9 para poner el corchete y luego seleccionar los datos. Así que ese es el número más pequeño en el conjunto de datos, Q1, puedo hacer cuartil igual a cuartil. Voy a elegir la primera opción de cuartil, o simplemente puedes presionar la pestaña porque está en la pestaña superior, y luego puedo y luego puedo seleccionar los datos, este tiene otro argumento, recordarás, tengo que presionar una coma y decir que quiero el que representa el cuartil número 1, y luego no 10 1, y luego la mediana podría ser el cuartil 2, o usamos la función mediana, que probablemente sea la pestaña más común. Seleccionando los datos e ingresar el cuartil 3 es igual al cuartil 3, tabulador, seleccionando los datos, esta vez, necesito una coma, no un 1, sino un 3, porque estoy en el cuartil 3, y el máximo es igual al max de esplaza 9, y datos, y datos. Así que ahí está nuestro estándar, nuestros cálculos de datos estándar ahí mismo, pongamos algunos corchetes alrededor de esto, diremos que esto va a ser la pestaña de inicio, las fuentes, los bordes de agrupación, y hagamos que sea nuestro menú desplegarle azul, si no tienes ese azul, está en el estándar de más colores, está el azul, ahí está el boom. Y luego podríamos calcular el promedio usando la media, o promedio, calculado, o lo que calculamos método manual, digamos, que sería simplemente nuestra fórmula de, simplemente voy a tirar de la fórmula rápida aquí. Algo como esto, verdad. Ahí está nuestra fórmula. Así que vamos a tomar, vamos a resumir, vamos a resumir todo esto, que son las x, y luego suman todo y dividen por el final o el número de elementos, correcto, así que somos todos los que están haciendo lo mismo, vamos a resumir todo. Haremos esto en un formato de tabla igual a la su n, la más famosa de las funciones, y seleccionando eso, y luego el conteo del conteo, o n, el número de datos. Podríamos hacer que con n sea igual a la función de conteo, contándolo, hay 51 de ellos, y luego podemos darnos el así que vamos a dividir, dividir, que se apoderan de un segundo, tengo que golpear. Me está pitando, deja de sonarme, necesitamos una división. Y ese va a ser el medio. Y entonces esto es igual a esto dividido por el 51. Y obtenemos el mismo número aquí, como calculamos allí, pero lo hicimos manualmente. Ahora vayamos a la casa o algo manualmente, pestaña de inicio, grupo de fuentes, subrayarlo, hagamos esto como una columna de encabezado, pestaña de inicio, grupo de fuentes, lo haré en blanco y negro. Haré esta pestaña de inicio azul y con bordes, grupo de fuentes, bordes, azul. Bien, ahora hagamos un histograma, podríamos hacer un histograma a partir de estos datos. Entonces, digamos que seleccionamos el inserto de datos. Y vamos a hold on this after data selected as recias, I think so insert and then charts este gram. Así que aquí está nuestro histograma de datos. Y tiene uno, dos, treinta y cuatro, cinco, sesenta y siete, ochenta y nueve, diez, once, voy a cambiar los cubos a once. Que coincida con lo que tengo en mi práctica. Así que voy a hacer doble clic en los cubos. Y hagamos once contenedores para lo que sea. Así que ahora tenemos nuestro histograma, que se ve así de nuestros datos, el histograma que nos da una idea de la propagación, recordando que la media es ese punto que setenta y uno por aquí, es ese punto que si piensas en el como un tambaleante y pones el punto de apoyo aquí, que básicamente estaría centrado en ese punto tambaleante. Bien, así que ahora hagamos la variación. Entonces, y, y el estándar hace la desviación promedio, y luego iremos a la desviación estándar. Así que comenzaremos con el promedio que haremos esto bastante rápido. Debido a que lo vimos antes, sólo estamos usando un conjunto de datos diferente. Ahora, copiemos el conjunto de datos sobre copiemos toda la columna a seleccionando toda la columna haciendo clic derecho y copiemos. Voy a poner eso al lado y la columna M, haga clic derecho y pegue lo solo la tabla normal que se ha implementado. Y luego quiero un flaco en poner mi cursor entre el final o no, no y ponerlos en más pequeño para que enfatices el O, no. A, y luego vamos a decir que ésta va a ser la desviación promedio promedio. Y pondré mi fórmula aquí. Así que no volveré a escribir la fórmula, sólo voy a copiarla y pegarla. Si desea copiar esa fórmula y escriba la en Excel. Recuerde, puede hacerlo yendo a la pestaña insertar, haciendo una ecuación y luego usando el elemento de tinta aquí es la forma más fácil de colocarlo en su lugar, lo haré en naranja para que se vea un poco diferente. Y tal vez, así que ahí vamos, está bien, hagamos esto, este blanco y negro, insertar, inicio, quiero decir, grupo de fuentes, blanco y negro en las letras. Bien. Así que ahora, ahora voy a tomar mis datos. Y en realidad, debería haber puesto mis datos al otro lado de aquí. Así que voy a tomar toda esta columna y podría arrastrarla o cortarla, voy a hacer clic derecho y cortarla. Y luego pongámoslo aquí y la columna Q, haga clic derecho y pegue, que se ve mejor. Y luego puedo eliminar esta columna, M y N, hacer clic derecho y eliminar. Y hagámoslo. Y luego puedo hacer un flaco. Así que la N es flaca de nuevo. Muy bien, así que ahora haremos nuestra desviación promedio, promedio. Así que yo compararía eso con la media. Así que aquí está la media, la media va a ser iguala, podría hacerlo de esta manera, promedio, doble clic de todo esto, correcto, llegamos a ese mismo número, tenemos dos aquí. Así que ahí está nuestro medio. Y luego voy a decir que tomen la diferencia. Diferencia de cada punto al punto medio de la media. Así que eso es el 84000, menos el 71. Y luego aquí es donde es donde está un poco más simplificado, en comparación con la desviación estándar. En cambio, estoy usando la desviación promedio, que está mal escrita, pero vamos a decir que esta es la aplicación. Así que saquea el valor. Y vamos a envolver el texto en los encabezados, pestaña de inicio, alineación, envolver el texto centrándolo, el valor absoluto es una fórmula fan que es igual a avies, avies. Así que abdominales, la función abs no tiene nada que ver con tus abdominales, abdominales. Así que no sientas que te va a ayudar a que te guste, ejercita tus abdominales, aunque ya sabes, quien sabe. Pero voy a entrar en mi mesa aquí. Y luego voy a hacer una columna total y los estilos de tabla. Vamos a sumar el total, podría por aquí, podría tomar mi promedio. Una vez más, si quisiera, solo voy a poner un promedio aquí, aquí, voy a poner mi cuenta. Así que voy a decir cuéntenlos, por favor. Y luego aquí, voy a resumir las diferencias. Así que fíjate, si los resumo, todavía llegó a cero que podría haber sido menos evidente en la presentación anterior. Pero observe que si el punto medio, si el promedio es 71 para 98, y tomo la diferencia de cada punto del evento promedio, todavía voy a obtener números positivos y negativos que deberían sumar cero en esencia, correcto. Y luego esta es la función de suma, estamos sumando todas las diferencias, que ahora hemos hecho absolutas, de modo que no tenemos, así que ahora estoy mirando la distancia desde el punto medio sin números negativos. Entonces puedo calcular la desviación promedio de las ventas, digamos que esto es igual a la desviación promedio, veamos si puedo promediar que debería haber una G en alguna parte. Y digamos que hagamos esto como blanco y negro, grupo de fuentes de pestaña de inicio, negro, blanco. Muy bien, ahora voy a tomar esto como la suma de la distancia de la media, que es simplemente igual a ese 9,790. Y luego voy a dividir eso por decir cositas y dividir, creo que la coma o el conteo, pero contar, y luego y eso está en nuestra fórmula. Así que ahora tenemos el numerador, lo resumimos, tomamos el valor absoluto de dividir por n, el conteo, así que los contamos como 51, lo que significa 1234 hay 51 de estos elementos. Así que es igual a 51 subrayar el subrayado del grupo de fuentes de la pestaña de inicio subrayar y esta será la desviación promedio que es igual a los 9,790 dividido por el 51 puede agregar algunos decimales, pestaña inicio, alineación o grupo de fuentes a agregar decimales. Y ahí lo tenemos. Hagamos que sea azul y negrita o azul en la pestaña de inicio grupo de fuentes azul y con borde o borde azul, de la manera que quieras decirlo. Así que esa es la forma intuitiva de hacerlo. Derecha. Así que ahora vamos a comparar eso de nuevo con la varianza y la desviación estándar, que es, que es básicamente nuestros cálculos predeterminados para medir este tipo de distancia promedio, en esencia desde el punto medio o media. Así que voy a hacer un flaco. Y hagamos esto de nuevo, flaco, solo copiaré estas fórmulas. Así que voy a decir que esta va a ser la variación. Y voy a copiar esta fórmula, porque la hemos visto antes, pero si desea escribir la fórmula, puede volver a entrar en la ecuación de inserción de tabulación y luego en tintarla aquí. Así que puedes escribir cosas, y lo hará arriba. Así que eso es realmente genial, realmente genial. Me pareció muy agradable. Así que todos deberían estar impresionados por lo que siento y esta es la pestaña de inicio, grupo de fuentes. Esto debe ser blanco y negro. Y luego aquí abajo, tenemos la desviación estándar, y de nuevo, haré que esta pestaña de inicio en blanco y negro, fan group sea blanca. Y copiaremos esa. Y observe que la desviación estándar es básicamente toda esta cosa que está debajo de la varianza. Y luego, y es por eso que está representado por un sigma al cuadrado frente a un sigma. Así que vamos a calcular la varianza, y luego pasar a la desviación estándar. Así que hagamos una X flaca, una X flaca, y luego diremos que vamos a copiar esta columna. O, copiemos la columna. O, en realidad, toda la columna? Sí, bueno, copiemos los datos, solo copiaré los datos en la columna O, y volveremos a crear nuestra tabla. No quiero el total todavía, porque voy a rehacerlo. Y luego voy a poner eso en columna. ¿Por qué? Porque ahí es donde aterrizamos, lo pegaré 123 para empezar. Y luego pondré una mesa alrededor, simplemente pondré mi cursor en la celda, y luego insertaré tablas de pestañas. Las hormigas bailarinas trabajan en su magia que son danzas budú, llegando a eso, y luego vamos a compararlo con la media nuevamente. Así que la media, igual a la pestaña promedio de los datos de datos, no el no el encabezado, solo los datos, boom, ese es nuestro mismo promedio o media que obtuvimos aquí. Y luego tendremos la diferencia de diferencia. Esto es lo mismo. Hasta este punto, los 84.000 menos 271 498, tenemos nuestras diferencias. Pero terminamos con esos números negativos, queremos eliminarlos negativos, pero no lo vamos a hacer con valor absoluto. Esta vez, vamos al cuadrado cuadrado, lo que elimina los negativos, pero también nos deja con el problema de que lo elevamos al cuadrado todo, lo que significa que el siguiente paso es tomar el valor absoluto, ¿verdad? Así que podría decir que esto va a ser igual a la diferencia al cuadrado o al quered, cambiar seis a la potencia de dos o al cuadrado, entrar. Así que ahí lo tenemos. Y entonces, pongamos nuestros totales a continuación. Así que voy a entrar en mi mesa, mesa, de nuevo, el diseño de la mesa. Y las opciones de estilo de tabla. Pongamos nuestros totales a continuación. Una vez más, puedo hacer esto como mi promedio, hagamos un promedio. Hagamos un conteo aquí, digamos contado. Así que hay 51, y luego aquí, haremos la suma. Así que suma cero como antes, pero ahora tengo la suma aquí de las diferencias al cuadrado, ¿verdad? Así que eso eliminó lo negativo, pero también cuadró todo. Así que ahora lo que puedo decir ya que sabes que he estado yendo a mi fórmula, ¿verdad? Así que resumimos la diferencia, pero ahora la cuadramos en lugar de tomar el valor absoluto. Ahora vamos a dividirlo por el número que nos dará la varianza, luego tomaremos la raíz cuadrada, que nos dará la desviación estándar. Muy bien, así que hagámoslo. Vamos a decir que esta va a ser la diferencia al cuadrado de la media. Simplemente volveré a escribir esto y es igual a este número. Y voy a dividir eso por. Así que divide, puse eso allí. Así que podría poner un signo de división, no se me apuesta a dividir por el conteo, que estamos representando en nuestra fórmula con una n. Así que eso equivale a esta celda, que es lo que contamos, que solo cuenta todo en la tabla que está en la columna z, pondamos un subrayado debajo de ella, grupo de fuentes hontas debajo de la línea. Entonces tenemos la varianza de varianza, que se representa como sigma al cuadrado a menudo, por lo que puedo ir a mi pestaña insertar símbolos. Y sería bajo texto normal, griego y gótico. Y si lo has estado usando, estará aquí abajo y recientemente usado. Así que solo diré sigma, insertalo. Está bien, necesito un cuadrado. Así que voy a poner para entrar, hizo algunas cosas extrañas de formato. Así que voy a volver a la primera pestaña, quiero esto a las once. Así que eso también, cuando lo resalto, y hace algunos locos 26, póngalo en dos, pero luego voy a resaltar solo los dos clic derecho. Formate las celdas y haga que se subin dice, boom. Muy bien. Así que tienen que tener los símbolos de fantasía, esto dividido por esto. Así que ahí lo tenemos, ahí está nuestra varianza, y luego tenemos la desviación estándar de desviación estándar, que es solo el sigma y luego insertamos, la ecuación, no es ecuación, capa. Así que deshace, lo que pasó. Hazlo de nuevo, inserta el símbolo de un inserto sigma, boom. Muy bien, así que esto va a ser y luego y ahora necesitamos la raíz cuadrada, que es la fórmula igual a sq raíz cuadrada, este sqrt de eso nos va a dar esto a 7. Y pueden ver que va a ser mayor que el número al que llegamos con nuestra, con nuestra desviación promedio, correcto. Y, entonces, estos números tendrán más sentido cuando hagas comparaciones de ellos con otros conjuntos de datos, ¿verdad? Entonces, cuando comparas la varianza de dos conjuntos de datos que hacen, entraremos en más adelante. Pero en este momento, podríamos simplemente, solo pasaremos por los cálculos de ellos. Así que voy a ir a la pestaña Inicio, Número y agregaremos algunos decimales. Pongamos algunos bordes azules alrededor de esta pestaña Inicio, Grupo Fuente, Borde y Azul. Y este, por supuesto, es el que vamos a usar más a menudo, y de nuevo, observe cómo es útil poder hacer esto en un formato de tabla, ¿verdad? ¿Quién es la fórmula aquí, a veces conectar el álgebra en la fórmula es agradable? Pero a veces es agradable ver, ya sabes, la fecha de un formato de tabla, como una declaración de impuestos, ¿verdad? Porque entonces realmente desglosas los cálculos, paso a paso. Y algunos de esos pasos, algunos de los subcálculos pueden darle mejores conocimientos a veces, y también, pueden ser números útiles en sí mismos, dependiendo de lo que estés haciendo. Sin embargo, calculemoslo también con Excel aquí. Así que voy a desplazarme hacia abajo, y haremos la desviación estándar, la desviación estándar de la población con Excel, enfatizando aquí que estamos pensando en esto como toda la población, porque si dices igual a ST, existe la desviación estándar SD de viernes para la población versus la muestra. En este momento estamos enfocados en la población. Así que voy a seleccionar ese, y luego todo nuestro conjunto de datos y columna y, y boom, así que si agrego un par de decimales, pestaña inicio, grupo de números, par de decimales, obtenemos el mismo número aquí. Si tomo la varianza, la varianza de un pop, tu pop, pones sound, eso sería igual a la quinta A. Así que queremos la varianza VAR de la población, haciendo doble clic en esa función y luego seleccionando todo el conjunto de datos. Obtenemos nuestro número aquí, que coincide. Hagamos lo mismo para la muestra solo para poder comparar y contrastar. Estándar de la desviación para una muestra de muestra estoy arruinando mis mayúsculas y griega minúsculas, pero esta vez es igual al estándar para la muestra. Y seleccionaremos todos nuestros datos en la columna Y. Y podemos agregar un par de decimales solo para que coincida con lo que hicimos en la pestaña inicio superior, números que agregan un par de decimales. Se puede ver que no es exactamente lo mismo que tenemos arriba para la población. Hablaremos más sobre eso más adelante. Y luego tenemos la varianza de una correa pop de una muestra igual al VAR. Así que tenemos el VAR para la muestra, seleccionando nuestros datos en la columna Y, y ahí lo tenemos. Podemos ver que no es exactamente lo mismo que para la población. Hablaremos más sobre eso en futuras presentaciones. Seleccionemos esta pestaña inicio, grupo de fuentes, borde y azul. Hagamos que este sea amarillo. El hecho de que no lo seamos es como no exactamente lo que estamos haciendo todavía. Pero solo queríamos señalar que se moverá en futuras presentaciones. Revisemos la ortografía vista revisar pestaña. Variaciones ortográficas mal escritas, cambielo. Bien. Y ahí lo tenemos.