 Estadísticas y mazo de cartas de Excel, Estadísticas y Excel parte número 2, prepárate, respira hondo conteniéndolo durante 10 segundos y esperando un huevo suave y relajante. Así que aquí estamos en Excel. Si no tiene acceso a este libro, está bien porque básicamente lo creamos a partir de una hoja de cálculo en blanco. Sin embargo, lo hicimos en una presentación anterior, por lo que no puede volver a la presentación anterior a partir de una hoja de trabajo en blanco. Pero si tiene acceso a este libro de trabajo, tres pestañas más abajo, ejemplo, ejemplo en blanco de práctica y clave de respuesta esencial pestaña práctica. Al tener ventas preformateadas, puede ir directamente al corazón del problema de la práctica. Una pestaña en blanco es donde trabajamos el problema de práctica a partir de una hoja en blanco, donde continuaremos trabajando el problema de práctica aquí, lo que nos permite practicar el formato de celdas dentro de Excel a medida que trabajamos en el problema de práctica. Entonces, en un problema de práctica anterior, hablamos sobre el lanzamiento de una moneda. Y ahora estamos pasando a una situación un poco más compleja en la que no solo tenemos cara o cruz. Más bien tenemos la baraja de cartas. Y estamos practicando algunas herramientas estadísticas, así como la forma en que podemos usar Excel para ayudar a modelar nuestros problemas de práctica. Así que primero tuvimos que colocar las cartas en el mazo. Así que notamos que teníamos las cartas en la baraja, tenemos los palos de las cartas y tenemos los números de las cartas. Y luego etiquetamos, ya sabes cuántas cartas son haces frente a 2, 3, 4, etc. Y también etiquetamos la dama y el rey como 1112 y 13. Para darles un valor numérico y desglosando el valor total de las cartas, el número de cartas debe ser 52. Ahora bien, podemos hacer algún tipo de suposiciones generales con una baraja de 52 cartas. Si robáramos una carta de 52, una dividida por 52, tendríamos un 1,92% de posibilidades de 13 de 52 de obtener un palo de picas, corazones, diamantes, trebles y 4 de 52 de poder sacar una carta de unas a través de un rey de cualquier palo. Así que quisimos reflejar una selección de muestreo aleatoria. Para hacer eso, necesitábamos darle un valor único a cada carta en lugar de tener de una a 13. Y luego vuelve a empezar con diferentes trajes. A continuación, enumeramos todas las cartas y sus palos y les dimos un número individual. Así que ahora tenemos cada tarjeta numerada del 1 al 52, lo que nos permite usar nuestra herramienta de muestreo aleatorio para luego dibujar una muestra aleatoria entre 1 y 52. Luego hicimos un ejemplo estático de ese sorteo aleatorio. Y lo hicimos 5.000 veces en Excel, que es parte de la belleza de Excel, lo que le permite hacer un tamaño de muestra largo y grande es un tamaño de muestra bastante grande. Y luego desglosamos nuestros resultados. Así que estos son los números de asignación, estos son los números de cartas, este es el palo y los resultados, lo que significa que las de picas que sacamos 79 veces aquí, teníamos el 10 de corazones, que etiquetamos como la carta número 23. Sacamos 113 veces, luego tomamos el porcentaje del total 79 sobre el total, que era 5.000. Y eso nos dio nuestro porcentaje, que esperamos que sea de alrededor de 1.9 a 1 sobre 52. Esta es la diferencia. Y luego hicimos un histograma de nuestros datos. Y también lo formateamos en un gráfico de barras, un par de ejemplos de algunos gráficos diferentes a los que podemos dar formato. Así que vamos a continuar esta vez. Y también vamos a ver cómo puedo reflejar una situación en la que la baraja no es exactamente justa en Excel para que podamos hacer algunas comparaciones usando nuestras herramientas y viendo cuáles serían los resultados, desde un punto de vista estadístico. Muy bien. Ahora, sólo una cosa que quiero señalar aquí es que también podemos hacer un histograma en lugar de los resultados reales del porcentaje. Porque cada uno de estos es uno de 52. Por lo tanto, se podría pensar que todos estos números deberían rondar este diente de 1.9. Hagámoslo muy rápido. Voy a seleccionar esta columna y simplemente insertar gráficos, histograma y boom. Así que ahora tenemos este histograma. Voy a tirar esto aquí y quitaré el título. Y puedes ver que no voy a meterme con las cajas en este momento. Pero por defecto, se puede ver que el punto central está en algún lugar cerca de lo que cabría esperar, que es el 1.92. Es el punto final en 1.9. Así que está un poco inquinado un poco fuera del centro, pero está en algún lugar por ahí, ¿verdad? Sí tomo. Así que fíjate que lo sumo para obtener el 100%. Si tomo el promedio de todos estos números de los porcentajes, puedo sumar un par de decimales. Número de pestaña de inicio, un par de decimales, me acerco bastante, ¿verdad? No es exacto, porque hay más decimales, pero el promedio de todos los resultados está en alguna parte, está bastante cerca de ese 1.92. Tomemos un par de estadísticas más. Ahora que estamos aquí abajo. Y podríamos decir, que tan probable o cuántos clubes sacamos bien, sabemos que nosotros, el número de clubes debería, esperaríamos que fuera como el 25%, correcto. Así que podemos contar el número de tréboles frente a corazones frente a picas, y así sucesivamente. Así que vamos a tratar de decir, digamos, voy a copiar para no estropear los nombres, voy a copiar las picas, voy a pegar 123. Y luego copiaré el corazón, un número de corazón. Y voy a codificar aquí, sólo para asegurarme de que tengo la ortografía exacta, porque voy a usarla en nuestras fórmulas. Y luego copiaré los diamantes. Y voy a poner eso aquí abajo y hacer click derecho y pegar los 123 y copiar los palos y pegar los 123. Así que ahora me gustaría obtener el conteo, vamos a bajarlos. Cuando vaya a tomar estos, agárralos y tira de ellos hacia abajo un poco. Y me gustaría contar los resultados de cuántas veces hemos tenido una velocidad. Entonces, para hacer eso, lo que me gustaría hacer es mirar esta columna y decir Excel, mirar esa columna. Y cada vez que veas una pica, quiero que cuentes no sólo cuentes, es diferente, quiero que resumas esta columna. Así que podemos usar nuestra función de suma, pero una pequeña alternativa en la función de suma, va a ser SamFs. Ahora voy a usar el que tiene una S, ifs con una S, y luego paréntesis. Y aquí está nuestro argumento, dice, ¿cuál es el rango de la suma? ¿Cuál es el rango, quieres una suma, voy a desplazarte hacia arriba, voy a decir que quiero que resumas estos resultados. Sólo los números, y luego la coma, y luego los criterios, ¿cuáles son los criterios que quiero que hagas? Este es el rango de criterios, quiero que resuman esta columna, si encuentran en esta columna, seleccionando esta columna, ese es el rango de criterios, coma. Siguiente argumento, ¿cuál es el criterio que establece? Así que una vez más, tenemos el rango de suma aquí, el rango de criterios aquí, si dentro de ese rango de criterios, ves que picas, y entra. Y sale con 101.00233, voy a copiar eso, copiarlo aquí, y debería tomar las ventas relativas. Así que ahí lo tenemos, tomemos el total ahora, total, igual a la suma de esos elementos, llegamos a 5000. Eso se ve bien. Y luego vamos a decir que esto es igual a este número, dividido por el total. Y eso nos va a dar vamos a hacer un porcentaje de la pestaña inicio, el grupo de números, y el porcentaje lo desafía, agregue un par de decimales. Así que no es exactamente el 24%. Pero es, ya sabes, el 25%, pero está bastante cerca. Y luego hagamos doble clic en eso, quiero hacer que este 5000 sea estático, no está en una tabla. Por lo tanto, tengo que convertirlo en una referencia absoluta para que sea estático, para poder copiarlo. Así que en este uso 61, voy a poner mi cursor allí, seleccionar F4 en el teclado, signo de dólar antes de UI 61. Entrar. Ahora puedo volver a poner el cursor sobre él, llenar el control, arrastrarlo hacia abajo. Si sumo esto, entonces es igual a la suma, debería obtener 100% 1 o 100% número de pestaña inicio, grupo por ciento definirlo y agregar un par de decimales debería ser exacto. Y subrayemos estos dos grupos de fuentes. Subrayar. Así que este es el conteo. Este es el porcentaje, llamémoslo el porcentaje porcentual. Y haré estos encabezados. Pestaña inicio grupo de fuentes cubo, negro, blanco, centrado así que ahí lo tenemos. Ahora, el valor esperado esperado debe ser igual a 1 sobre 4, porque sólo hay cuatro palos y están igualmente representados. Si subo el número de la pestaña inicio por ciento definir sumo un par de decimales, también puedes ver que como iguales, hay 13 de cada uno de cada palo dividido por 52. Y si lo hago un porcentaje, sumo un par de decimales a la derecha a un cuarto. Así que entonces puedo decir, vamos a copiar eso, esto es igual al que está arriba, voy a copiar eso. Eso es lo que esperaríamos que sucediera. Y el número de la pestaña inicio, y lo sumaremos igual a la suma, que por supuesto, saldrá a cien. De nuevo, vayamos al grupo de los números, hagamos que sea el cien por ciento. Y entonces la diferencia, que sólo diré div, va a ser igual a esto, menos esto. Y podemos restar eso. Y sólo haz nuestra pequeña tabla de análisis sobre esto. Y haré que esto sea un porcentaje. Número de porcentaje de la pestaña inicio, agregue un par de decimales. Es interesante. Y luego sigamos adelante y luego el formato de encabezado, la pestaña inicio, el grupo de fuentes, el negro, el blanco y el centro. Y luego haré que esto sea azul y bordeado como es nuestra pestaña general de inicio personalizado, bordes del grupo de fuentes, despegados en el cubo, si no tienes ese azul, está en los colores más, azul estándar. Bien. Ahora, también podríamos hacer algunos números y pensar en cuántas veces salió cada número individual, es decir, como el haz de picas, y el haz de corazones y el haz de diamantes, hay cuatro cartas para cada uno. Así que podría enumerar algo así, podría decir, bien, digamos que estas son mis tarjetas. Y sólo quiero decir unas, dos, tres, y así sucesivamente, de cualquier palo de cualquiera de los cuatro palos. Así que sí copio eso, voy a bajar a trece, el haz al rey. Y yo podría decir, muy bien, entonces voy a decir que quiero hacer mi conteo de cada uno de esos. Entonces, si quiero contarlos, si subo a mi sistema, fíjate, realmente no quiero usar los números asignados aquí, no es tan fácil de hacer, al menos porque entonces tengo que el número uno es el haz, pero el siguiente haz está etiquetado como el número 14. Así que pude hacer eso. Pero tengo esta otra columna, que me muestra muy bien el número de la tarjeta, sin importar el palo. Así que quiero, básicamente, decirle a Excel todo en esta columna. Si tiene uno, quiero que resumas esta columna, así que podríamos usar un tipo de técnica similar aquí, podría decir, está bien, esto va a ser igual a la suma, si quiero el que tiene la S, porque creo que es más fácil de usar. Ese es el más nuevo, creo, el rango de la suma. Así que voy a subir y decir que quiero que sumes este rango de nuevo. Y luego me estoy desplazando hacia abajo con la coma, y luego el rango de criterios, quiero que mires a través de esta columna para ver los criterios. Y luego la coma, cuál es el criterio, el criterio es que si ves un 1, entonces vas a sumar el rango, este rango de suma, así que entonces da 363. Si lo relleno y lo copio, ahí tenemos nuestros resultados. Y este va a ser el total igual a algunos paréntesis que lo resumen, debería llegar a los 5.000, si ese es mi número de cheque, porque ese es nuestro total, ¿cuántas veces hicimos esto? Y luego vamos a decir que el porcentaje del porcentaje total del total va a ser igual a 363 dividido por 5.000. Ese segundo número, quiero que permanezca igual cuando lo copie, por lo tanto, estoy seleccionando F4 y el signo de dólar del teclado, pero antes de la doble A y el 70, Enter. Y luego voy a poner el cursor sobre el número de la pestaña de inicio por ciento a P, agregando un par de decimales, luego lo controlaré y lo arrastraré hacia abajo. Entonces, lo resumiremos y debería llegar al 100% correcto porque solo estamos sumando el alma gemela total de la cumbre, y luego iremos a la pestaña inicio, números porcentuales, un par de decimales. Ahí lo tenemos. Lo que era lo esperado esperaba el valor esperado en una base porcentual también sería igual, hay cuatro cartas de cada número cuatro aces, dividido por 52 en la baraja. Por lo tanto, se esperaría un porcentaje de la pestaña inicio, un número porcentual, sumando un par de decimales, 769. Si copio eso, ahí está nuestro valor esperado. Y luego, la diferencia entre lo que sacamos y el porcentaje esperado, también podemos hacer como, quiero decir, si ese es el porcentaje, cuál sería la cuenta real, esperarías, entonces de 5000, que obtendrías 385, ¿verdad? Sería el número esperado de conteo que en cualquier caso, vamos a decir que la diferencia va a ser igual a esto, menos esto. Y agreguemos un par de decimales a eso. Y luego, o, hagámoslo un porcentaje y luego agreguemos decimales. Muy bien, y luego copiaremos la diferencia. Copiaremos los totales. Y ahí lo tenemos, pondamos un subrayado aquí y simplemente formateemos estas cosas, subrayelos encabezados, la pestaña inicio, el grupo de fuentes, el cubo, el negro, el blanco, la alineación, centrado. Y eso es todo lo que necesitamos. Y luego haré que todo esto sea azul y con bordes, iremos a la pestaña de inicio, al grupo de fuentes, al borde y al cubo azul. Bien, fueron solo algunas otras estadísticas, algunas otras estadísticas que podemos hacer a partir de nuestros números. Ahora imaginemos una situación en la que quiero crear otro recuento. Pero en lugar de cómo me gustaría crear algunos números que están sesgados de alguna manera, digamos que queremos decir que falta un número número cinco y posiblemente haya un as que sea exagerado. Así que la gente sacó cinco de la baraja y puso aces en la baraja, ¿verdad? Así que tomaron, tal vez sacaron un tres, sacaron el número más bajo y pusieron los aces. Así que vamos a hacer eso, voy a copiar otro al azar. Así que esta es nuestra selección aleatoria, puedo barajar la selección aleatoria, que va de uno a cinco mil, hasta llegar a cinco mil. Voy a copiar toda esta columna, hacer click con el botón derecho y copiarla y llevarla a un lado aquí. Y luego voy a pegar los 123 click derecho, pegar 123. Así que ahora hemos reflejado otra muestra aleatoria, voy a insertar una tabla, insertar, tabla, boom, vamos a envolver el texto y hacerlo un poco más delgado de nuevo, no necesitamos que sea tan ancho. Y vamos a ir a la pestaña inicio, alinear, envolverla y centrarla, en realidad espera un segundo. Estoy equivocado aquí arriba, y luego pestaña inicio y envuélvelo y centrarlo. Bien, y ahora quiero ajustar los resultados. Por lo tanto, obtenemos resultados que son diferentes de lo que cabría esperar de una muestra aleatoria de una deuda de 52 tarjetas. En otras palabras, vamos a imaginar que hay como un tres de diamantes, digamos que no estaba en la baraja, y que haya una sobrerepresentación de las de picas, hay múltiples as de picas dentro de la baraja. Ahora, hay varias formas de hacer esto. Pero la forma más fácil de hacerlo es tratar de buscar el número que representa el tres de diamantes. Y sustituyámoslo por el número uno de las de picas. Así que si vuelvo por aquí y busco el número que representa el tres de diamantes, podemos ver que es un 29. Así que voy a ir y decir que cada vez que veas un 29, me gustaría que lo reemplazaras por uno. Así que voy a seleccionar todo el conjunto de datos. Y vamos a ir de la manera más fácil para hacer esta pestaña de inicio, editando la búsqueda, pero voy a ir a la buscar y reemplazar. Y le voy a pedir a Excel cada vez que veas 29. Me gustaría que lo reemplazaras con un 1 cada vez que veas un 29. Quiere que lo reemplaces con un 1. Bien, entonces puedo decir reemplazar todo, reemplazar cada uno, voy a decir reemplazar todo. Y todo listo. Así que ahora no debería haber 29. Si busco un 29 fan next, no hay 29, por lo que reemplazó todos los 29 en los datos. Así que ahora tenemos una especie de conjunto de datos escado. Y veamos cómo se mapea eso básicamente cuando tomamos estos datos y hacemos nuestros cálculos con ellos. Así que voy a hacer el mismo tipo de cosas que hicimos antes y podría ser más fácil de hacer si simplemente copiamos lo que hicimos la última vez. Así que la última vez, tomamos nuestro conjunto de datos aleatorios. Aquí es donde estamos en una situación de mera palabra, excepto que nuestro conjunto de datos se ha sesgado un poco. Y luego voy a copiar todas las fórmulas de toda esta tabla. Y si lo pongo en la misma posición relativa a mi conjunto de datos, entonces espero que me de las mismas fórmulas y menos hay referencias absolutas. Y es posible que tenga que resignar la tabla, por ejemplo, porque va a una tabla, pero puede ser un poco más rápido. Así que voy a hacer click con el botón derecho y copiarlo todo. Y luego vamos a traer eso aquí. Ahora quiero ponerlo en la misma posición relativa, saltando una línea, poniéndolo en app, click derecho, y lo voy a pegar con las fórmulas, porque con suerte, las fórmulas apuntarán al lugar correcto. Puede que no lo estén porque estoy usando una tabla. Así que tendremos que ajustar eso. Pero ahí está, hagamos esto un poco más delgado y vamos a verlo. Así que aquí sólo tenemos un número. Eso está bien. Esto, esto, sólo tenemos nuestros números. Este es nuestro traje. Estos están codificados. No hay nada que ajustar aquí. Los resultados. Vamos a ver qué está haciendo el mismo cuenta. Si eso se ve bien, pero entonces está sacando la tabla equivocada, correcto. Todavía está sacando la tabla del sistema anterior. Así que voy a tener que reemplazar las tablas de conteos y en todas estás. Así que voy a decir que no cuentan si la tabla tiene que ser esta, esta, porque estoy tirando de estos números. Hagámoslo de nuevo. Tendré que rehacer esta fórmula dirá que esto es igual a contar si está entre paréntesis. Y vamos a decir que es igual a contar si luego paréntesis. Y luego el rango va a ser este rango, todo eso. Y luego la coma, el criterio es el número asignado, no el número de tarjeta. Número asignado. Ahí lo tenemos ahora, debería copiarlo hasta el final. Porque estamos en una mesa. Si miro el porcentaje total, este es este porcentaje dividido por el total que parece que está haciendo lo correcto. Pero estaríamos hasta el final, el número real sigue siendo correcto, creo que está recogiendo el número correcto porque tiene una referencia absoluta. Y entonces la diferencia es la diferencia entre esos dos. Así que eso parece correcto. Muy bien, si analizamos los resultados aquí, esperaríamos que el leis esté un poco sobrerepresentado. Así que lo haré amarillo. Y el tres de diamantes es el otro, que pusimos en corto, correcto, así que los diamantes están aquí abajo. Así que este. Así que esos dos se ven bastante extraños. Por supuesto, así que podemos ver claramente, bueno, parece que el trío de diamantes podría no estar en la varaja. Y parecería que, ya sabes, el as de picas de nuestros cajones parece estar sobrerepresentado, ya sabes, muchos más cajones con el as de picas de lo que normalmente obtendrías, ¿verdad? Esa es la idea general. Entonces podemos hacer algunas representaciones pictóricas, podríamos hacer un histograma de los resultados, podríamos hacer un histograma tratando de mostrar todas las cartas del 1 al 52. Pero también podríamos hacerlo con un gráfico de barras. Así que hagamos un par de esos, sólo para tener una idea de las diferencias entre las herramientas. Así que si miro si trato de ir a los resultados e insertar un histograma, histograma de gráficos, aquí. Así que ahora tenemos un histograma de los resultados para cada tarjeta, luego estamos llegando a los cubos predeterminados que están aquí abajo, podríamos mirar los cubos y decir que tal vez queremos más cubos. Digamos que queremos como 12 cubos o algo así. Y ahora tienes estos dos objetos que están en el exterior. Así que vamos a cerrar eso. Ahora, la otra forma en que podrías intentar hacer un histograma es porque podrías decir que quiero contar los 52 números y podría tomar todo el conjunto de datos aquí y decir qué pasaría si hiciera un histograma de ese histograma de gráficos. Así que ahora puedes ver que los cubos que está armando son de 1 a 4 hasta 54. Tratemos de reducir los cubos a sólo 123 hasta 52. Pude seleccionar los tamaños de los cubos y puedo tratar de decir, oye, mira, quiero las curvas en una sola entre ellas. Así que ahora tienes 1 o 2 y así sucesivamente hasta 52 y ahora, por supuesto, en este, puedes ver este enorme y el primer cubo y puedes ver que nos falta algo por aquí. Puedes hacerte una idea de estos valores atípicos para los resultados aquí en este histograma. Ahora, es posible que desee reflejar esto, este gráfico podría estar mejor representado simplemente haciendo un gráfico de barras porque entonces puede numerar en lugar de cubos del 1 al 52. Para hacer eso y lo estoy haciendo rápido porque los vimos la última vez, pero sólo o algunos de ellos al menos la última vez. Pero ahora me gustaría decir, oye, mira, quiero que enumeres estos números del 1 al 52. Así que voy a seleccionar esta columna y quiero que esté en el eje X sin incluir el total manteniendo presionada la tecla control y quiero los resultados en la I. Y esta vez, no un histograma, vamos a ir a los gráficos insertar y construir un gráfico de barras. Y así tenemos nuestro gráfico de barras. Ahora, de nuevo, de forma predeterminada, intenta trazar ambos. Así que lo que voy a hacer es que voy a hacer esto muy amplio porque quiero que quepa 52 números en esta cosa. Y de hecho puse los 52 números allí. Así que se ve bien que subió a 50. Eso se ve bien, sólo necesito eliminar ese primer conjunto de datos que no es útil para mí. Así que voy a decir datos, no quiero la primera serie, sólo queremos la segunda serie. Y ahí lo tenemos. Así que ahí lo tenemos, voy a deshacerme de la llave aquí abajo. Y luego podríamos poner el conteo si queremos, no los voy a seleccionar, sólo voy a seleccionar el gráfico, y luego el diseño del gráfico. Agregue herramientas y quiero las etiquetas de datos. Así que puedo poner las etiquetas de datos como aquí arriba. Así que ahí están nuestras etiquetas de datos. Y de nuevo, notoriamente falta esta en el 29. Así que, de nuevo, obviamente los datos nos dicen, sabes que algo no está del todo bien aquí, también podemos hacer el histograma del porcentaje del total, que esperaríamos que las cosas estuvieran rondando el valor real de 1,92 si fuera una baraja justa de 52 cartas. Así que si selecciono esta columna, y voy al histograma insertar, gráficos, y le echo un vistazo, puedes ver de nuevo, tenemos este tipo de valores atípicos. Así que parece, algo se ve un poco extraño. Con eso, diría que está bien, porque uno esperaría que estuviera rondándolos 1,92. Y se podía ver ese punto medio. Es como si tuvieras una gran cantidad de datos en el medio. Pero, de nuevo, es como si tuvieras estos valores atípicos que están sucediendo aquí. ¿Qué pasa si tomo el promedio de todos los resultados? Si tomo el promedio de estos resultados, ya se ha tomado, todavía el promedio sigue estando bastante cerca de 1,9 a 3 del promedio al promedio esperado. Así que ahí está. Pero pudimos ver un par de esos, esos valores atípicos. Y de nuevo, podríamos hacer algunas mesas más para contar el número, el número de haces, verdad, si hiciera mi cuenta aquí en la mesa. Tenemos las picas, las picas contra los corazones y el conteo de diamantes, es esto sacando todo lo que debería, de la mesa adecuada. Valor esperado. Y la diferencia aquí, así que fíjense en las picas, el número de picas está sobrerepresentado. Y no estamos reconstruyendo la mesa porque teníamos esto de antes, nuestra hoja de trabajo se detuvo. Pero fíjense que los estados están sobrerepresentados porque nosotros no lo hacemos. Hemos reemplazado el diamante con una pala, verdad, pero lo hemos hecho. Así que esa es la idea general. Y luego podemos comparar y contrastar esos datos de este conjunto de datos, que estamos diciendo que representa una baraja injusta y tiene demasiados haces. No tiene uno de los tres a los datos que tenemos de una baraja justa y cuando estamos haciendo nuestro análisis estadístico. Eso es a menudo lo que estamos haciendo. Estamos tratando de decir, cuáles serían los resultados si aceptamos la suposición esperada de que no es una baraja justa frente a hay una diferencia estadística con respecto a lo que dicen los datos reales. Podemos sacar sus propias conclusiones.