 Estadísticas y Excel, ejemplo de estadísticas de lanzamiento de moneda. Obtuve datos, pongámonos manos a la obra con estadísticas y Excel o OneNote. En este caso, pero hablaremos de Excel 2, no es necesario que lo hagas. Pero si tiene acceso a OneNote, donde en el icono, en el lado izquierdo, una presentación de nota 1315 moneda lanza un ejemplo de estadísticas en la pestaña Excel, también estamos cargando transcripciones en OneNote. Por lo tanto, puede usar la herramienta de lectura inmersiva, posiblemente cambiar el idioma si así lo desea y, a continuación, leer la transcripción o escuchar la transcripción en varios idiomas diferentes, vinculándola a las presentaciones de video mediante las marcas de tiempo. En la versión de escritorio de OneNote, aquí los datos en el lado izquierdo, recuerde las dos categorías principales de problemas estadísticos, una es donde tenemos todos los datos, toda la información para toda la población, y estamos aplicando nuestras herramientas estadísticas para organizar esa información, para que podamos obtener significado de ello. Y a una situación en la que no tenemos todos los datos, toda la información de toda la población, y a menudo dependemos de muestras de esos datos. Y luego aplicamos herramientas estadísticas similares, no tanto para que podamos entender completamente el examen de la muestra en sí, sino para que podamos inferir los resultados de esa muestra a toda la población. Ahora, aquí, estamos pensando más en el segundo de esos cubos en los que no conocemos a toda la población. Sin embargo, a menudo, es útil pensar en situaciones en las que conocemos a toda la población y podemos obtener básicamente las respuestas. Y luego también podemos tomar una muestra de esa población y usar nuestras técnicas de muestreo para ver si cuando inferimos los resultados de la muestra a toda la población. Son aplicables. Y entonces, en una presentación anterior, hicimos eso con las alturas, teníamos toda una población de alturas, tomamos muestras de esas alturas para ver qué tan representativas eran las muestras para toda la población. Ahora haremos algo similar con los lanzamientos de monedas, que a veces es un poco más fácil, porque tienes como el 5000-50, los dos resultados en los lanzamientos de monedas, a diferencia de los datos de alturas donde tienes el rango de las alturas, pero también es un poco más matemático y teórico, porque cuando pensamos en los lanzamientos de monedas, se puede pensar en toda la población como un tipo de cosa conceptual, que sería una cantidad infinita de lanzamientos. En otras palabras, cuando pensamos en lanzar una moneda, si tuviéramos una moneda, y asumiéramos que si fuera una moneda justa, esa sería nuestra suposición general. La moneda justa significaría que cada vez que la lance, tendrás la misma posibilidad de que salga cara o cruz. Así que eso va a ser como la hipótesis nula. Y luego, ¿cómo probaríamos si ese es o no el caso cuando tendríamos que darle la vuelta un montón de veces? Y luego probar si lo que pensamos que estaría sucediendo es realmente lo que está sucediendo. Y si encontramos evidencia de que ese no es el caso, algo más está sucediendo, entonces la pregunta es, ¿qué tipo de evidencia estadística necesitaríamos para anular la suposición general de que sería 5.050? Ahora, ¿cuando pensamos en esto desde un concepto de muestreo estadístico, pensarías, bueno, ¿en qué está pensando toda la población aquí? Bueno, es una idea conceptual que si lanzas la moneda, una cantidad infinita de veces, entonces saldrás a 5.050. Pero obviamente, en el mundo real, nunca podrás lanzar la moneda una cantidad infinita de veces. Así que cualquier cantidad de veces que lances la moneda, en teoría, puedes pensar en un tipo de concepto similar al de cuando tomamos una muestra de toda la población de alturas. Por lo tanto, cualquier cantidad de bolteretas va a ser un ejemplo finito de la cantidad de bolteretas del concepto conceptual de voltearlo una cantidad infinita de veces. Y si fuera una moneda completamente justa, sabemos que el resultado de un número infinito de veces sólo conceptualmente sería 5.050. Si era una moneda justa. Así que esa es un poco la idea. Entonces, dos cosas como siempre, nos gustaría hacer aquí, nos gustaría decir, queremos saber esto conceptualmente para la estadística y también queremos pensar en cómo podemos probar esto en Excel. Así quedaremos una idea de cómo podemos usar las herramientas de Excel para probar esto. Ahora, obviamente, si tuvieras que generar esto en Excel, puedes usar algo como el generador aleatorio nuevamente. La última vez usamos el generador aleatorio para obtener un número decimal aleatorio de varios decimales. Esta vez, sin embargo, vamos a usar el entre aleatorio. Entonces, si quiero simular el lanzamiento de una moneda, básicamente puedo decir, mira, lo que quiero hacer es asignar un 1 a las cabezas a los detalles y ahora que tengo una asignación numérica a mis resultados, puedo usar un generador aleatorio aleatorio entre la parte inferior es 1 y la superior es 2. Y luego Excel nos dará esta generación aleatoria, que básicamente simula cualquier cosa que sea aleatoria entre dos números, ¿verdad? Así que ahora tenemos nuestro generador aleatorio con el que podemos jugar y simular algo de esta naturaleza. Así que ahora, mientras miro mi generación aleatoria, puedo usar esta fórmula y puedo copiarla en tantas celdas como quiera. Ahora, sin importar cuántas celdas copie, si lo copio a 100, ventas, eso sería como simular 100 lanzamientos de la moneda. Y 100 lanzamientos de la moneda es algo así como a partir de una idea o concepto de muestreo, 100 lanzamientos de una cantidad infinita de lanzamientos, una muestra de 100 de una muestra de la población real. ¿Qué es una idea conceptual del infinito, ¿verdad? Entonces, entonces, si echamos un vistazo a nuestros, básicamente puedo organizar mis datos. Así que una vez que tenga mis lanzamientos de moneda aleatorios, me convencí de que puedo decir que este generador aleatorio va a seguir generando resultados aleatorios. Así que voy a copiar este campo generado aleatoriamente y pegarlo estático. Así que ahora está pegado sin la fórmula real. Pero al igual que los 1 y 2 codificados, también puedo usar Excel, si quiero que me den el resultado. En términos de palabras, puedo usar una fórmula en Excel para decir, si hay una, dime que es una cara, ¿verdad? Así que lo haremos en Excel si quieren, si quieren ver esas fórmulas para hacer eso. Pero, pero conceptualmente, solo puedo decir, bueno, uno está por delante y dos son las colas, lo ordené por cara y luego cruz aquí. ¿Para qué podamos ordenar los caras en la parte superior y cruz en la parte inferior? ¿Puedo hacerme una idea al hacer eso? Solo decir que se parece un poco a 5050, tal vez, ¿verdad? Pero realmente no puedo decirlo con solo mirar los resultados de los datos, por lo que tendríamos que realizar un análisis estadístico al respecto. Entonces, me gustaría decirle a Excel, para contar el número de cabezas, simplemente cuente el número de cabezas. Ahora, conceptualmente, que simplemente tomaríamos nuestro conjunto de datos y diríamos que esta es la cantidad de veces que salió cara, si hicieras esto, y realmente lanzaras la moneda. Entonces tendrías que contar cuantas veces cuenta su cabeza. Así que podemos jugar con estas cosas mucho más rápido y entender más conceptualmente y entender las fórmulas de Excel. Así que esto es igual a conteo. Si es así, está tomando estos datos, podemos tomar cualquiera de los dos. Pero si tomamos los datos numéricos, vamos a decir que hay que contar si hay uno. Y si tomamos los datos, que son los datos de texto, podemos decir que cuenten, si ven un conteo de caras, si ven caras, entonces tiren, tiren de eso y obtuvimos 52. Y luego puedes hacer lo mismo con las colas. Así que voy a decir, Excel, toma estos datos y cuentas y si fuera esta columna, ves un 2. O cuenten si por aquí, ven una cola. Y luego, si sumo esos dos, fíjate que no hice exactamente 100 voltretas y estoy feliz de no haberlo hecho, a menudo en estadísticas, la gente usa 100. Porque si yo tuviera 100 y hubiera 52, cara de 100. Bueno, eso es el 52%. Pero es útil hacer ese paso adicional de decir, bueno, que pasaría si no fueran 100 voltretas, entonces tendrías que hacer los cálculos para pensar, pensar en cuánto estaba fuera de sentido. Si no fuera de 152, no sería 52%, si salieras con 52. Entonces, si lo sumo, salió solo 99 lanzamientos, así que lo volteamos 99 veces, salió cara 52 veces, salió cruz 47 veces. Muy bien, bueno, entonces podemos decir, si tomo ese 52 dividido por 99, así es como voy a obtener el porcentaje. Así que puedo sacar la calculadora confiable que 52 sobre 99 nos dará si muevo el decimal dos lugares sobre 52.53 sobre su redondeo, ¿verdad? Si multiplico por 100%, el porcentaje 52.53 aproximadamente y luego, si miro la otra cruz, será 47 sobre 99. Si muevo el decimal dos lugares por encima de 47.47 aproximadamente y eso nos dará el porcentaje total del 100%. Por lo tanto, no tenemos que voltearlo exactamente 100 veces para obtener un porcentaje correcto, que es a menudo lo que se ve como un problema de ejemplo. Entonces, si hago eso con una fórmula, sería, ya sabes, el 52 sobre el 99. Y este sería el cuadragésimo séptimo sobre el 99. Este es un cálculo común para ver bien, tienes la suma y luego el total y luego quiero ver, quiero ver el porcentaje de cada elemento en comparación con el total. Así que esto es como un porcentaje corrido, que es un cálculo bastante común muy útil para poder visualizar en Excel o matemáticamente, porque es, es muy común y útil. Muy bien, voy a bajar aquí, ahora bajamos. Y ahora podríamos hacer esto muchas más veces en Excel. Así que ahora voy a usar la misma función aleatoria entre aquí y podría probarlo y decir, digamos que vamos a hacer algunas pruebas diferentes y vamos a darle la vuelta en cualquier momento entre dos y quince veces. Ahora, como era de esperar, si le doy la vuelta sólo dos veces, entonces no vas a obtener un resultado que sea representativo de que, en este caso, obtuve dos colas. Y, ya sabes, eso podría no ser obvio, si tengo dos colas, eso va a ser engañoso. Así que no tengo una muestra lo suficientemente grande como para decirme realmente algo sobre los datos, ¿verdad? ¿Cuántas más veces los voltee intuitivamente? Es de esperar que nos acerquemos al 5.050. Correcto, pero aún así tres veces todavía podrías obtener tres cruces, si le das la vuelta tres veces, ¿verdad? Esta es una prueba en la que le dimos la vuelta cuatro veces. Así que sólo estoy usando la herramienta generadora aleatoria y sólo en cada celda, volteando la dos veces esta, tres veces. En la tercera prueba, le dimos la vuelta cuatro veces. Y sólo cuatro, le dimos la vuelta cinco veces, y así sucesivamente. Así que puedes ver, a medida que avanzamos en los resultados, a medida que lo volteamos más veces, esperarías que obtuvieramos un resultado más cercano a lo que sabemos que es el resultado real en la población real. Simplemente sabiendo que intuitivamente, teórica o lógicamente, si fuera una moneda justa, usando nuestro conocimiento conceptual sería 5.050, a pesar de que todo el bote si lo volteamos infinitas veces. Muy bien, entonces, si es así, esta es otra herramienta generadora aleatoria. Y esto seguirá apoblando generaciones aleatorias. Y así puedes probarlo al azar. Y puedo copiar toda esta prueba, que se seguirá generando aleatoriamente cada vez que haga clic en algo de esta tabla, y luego puedo pegarla aquí 123. En otras palabras, pegue sólo el valor. 12.30. Y luego puedo ejecutar mis pruebas estadísticas en él. Así que en este caso, tuvimos la prueba de dos, obtuvimos dos caras y cero cruces. Entonces, si tuviera que hacer mi porcentaje, dos de dos es el 100%. Para eso para las caras, cero de dos es cero para las cruces, así que eso suma el 100%. Así que esto es un poco engañoso, sólo le dimos la vuelta dos veces, y llegamos a un resultado, que obviamente no nos va a dar demasiada información sobre toda la población si tuviéramos que infigir una cantidad infinita de veces. Por lo tanto, esto no sería suficiente para anular la suposición de los NOL de que es una moneda justa, porque no tenemos suficiente muestra para obtener realmente una información. Y en este caso, tenemos tres, así que resultó que salió una cara y dos cruces por tres. Así que uno dividido por tres es 33%. Aproximadamente, y dos dividido por tres es 67%. Y en este caso, le dimos la vuelta cuatro veces, resultó que salieron dos caras, dos cruces, que son cuatro y cinco mil cincuenta. Y este, salió cinco veces, le dimos la vuelta cinco veces, dos caras, tres cruces, y así sucesivamente. Ahora, en Excel para obtener estos resultados, lo que hicimos fue usar count, si, de nuevo, dije count si estas dos celdas tienen un uno. Y entonces dos de ellos tenían un uno. Y en la segunda, dije contar si la celda tiene un dos. Así que aquí está el conteo de criterio si ese rango tiene el criterio de un dos, y luego contó cuántos de ellos hay. Y luego nos dividimos, nos dividimos para llegar a nuestro, cabezas, cabezas divididas por el total. A continuación, es posible que queramos ejecutar ejemplos o experimentos similares en los que vayamos a darle la vuelta más tiempo. Entonces, en este caso, nuestra secuencia numérica se resordenó un poco aquí en Excel, pero estamos imaginando que se trata de pruebas múltiples, en las que vamos a lanzar la moneda muchas más veces usando el mismo concepto en Excel de iguales al azar entre uno y dos, uno representando cara, dos representando cruz. Así que ahora tenemos un montón de pruebas que hicimos. Y acabamos de copiar esta herramienta de generación aleatoria y todas las ventas. Esto va a generar aleatoriamente todos nuestros resultados para nosotros. Y luego, si copio toda esa herramienta de generación aleatoria en otra celda para poder cambiarla de una generación aleatoria a solo números codificados, obtenemos nuestros resultados. Y así, de nuevo, la secuencia numérica en el lado izquierdo se estropeó un poco. Así que lo hemos volteado un montón de veces aquí, no estoy seguro exactamente cuantas veces, pero lo averiguaremos en los cálculos aquí. Así que puedo resumir cada uno de ellos. Entonces, si miro las cabezas, la fórmula va a ser Excel, mira esta columna de números que volteamos, creo que va a ser 75 veces, pero mira esa columna de números. Y luego, y luego dime cuantas veces cuentas las veces que ves un 1 y un Excel nos da 34 veces. Y luego hacemos lo mismo con las colas, decimos, oye, Excel, cuenta esta columna de números y dime cuántas veces obtienes un 41. Y quiero decir, lo siento, cuántas veces obtienes un 2, ese es este conteo sí, y Excel dice 41 veces ahora entre un 1 y un 2, que son las dos cosas que pueblan estas celdas, llegamos a 75 como total. Y entonces podemos decir, muy bien, si hay 75 de ellos, puedo echar un vistazo a las 34 caras de divididas por las cruces, quiero decir, divididas por el total de 75. Y eso resulta en 45, aproximadamente un 45,33% por ciento. Podría hacer lo mismo con las cruces 41 dividido 2 por del total de 75 nos da 54,66,55. Aproximadamente 5 más 55 es el 100%, que es una especie de doble comprobación de que hemos hecho las cosas correctamente allí. Entonces, si miro sólo las cabezas, entonces esperaría que saliera, ya sabes. 5.050, o toda la población, si fuera una moneda justa sería 5.050. Si le dieramos la vuelta infinitas veces, aquí, salimos a 45, hay 5.356. 52, podríamos hacer lo mismo con las cruces, por supuesto. Pero si nos centramos en uno de los resultados, entonces se vuelve un poco más fácil para nosotros pensar en esa serie de resultados, ¿verdad? Así que 60, este es, ya sabes, un tipo de contorno bastante alto para 74 voltretas, ¿verdad? Pero aún así podría suceder claramente que tengamos, ya sabes, 45, aquí está nuestro, ya sabes, debería ser, ya sabes, pensaríamos que sería alrededor de 5.050. Ahora, si tomo esa serie de resultados centrales, es posible que quieres traerla y ponerla en una columna vertical en un formato de columna. Así que pude hacer eso. Así que podría usar un Excel. Puedo hacerlo básicamente copiándolo y luego pegándolo y transponiéndolo. Así que lo haremos en Excel si quieres practicarlo en este problema de práctica en Excel. Y luego podría compararlo con lo que sería el hipotético resultado esperado, pero en la población saldría 5.050 si lo lanzamos una cantidad infinita de veces si fuera una moneda justa. Y luego podemos ver las diferencias entre los resultados por prueba. Así que estos son los resultados por prueba, 45% de cabezas frente a 50%. En cuanto a la real, este salió 53 frente a 3 frente a 53%. Diferencia 56 versus 50. 18.29. Y se puede ver que, por supuesto, esperaríamos que algunos de los resultados estuvieran por encima, otros por debajo si se tratara de muestras aleatorias. Ahora, si contamos todas las pruebas que hicimos 75 de ellas, entonces, y si tomo el promedio de todos los promedios, entonces nos estamos acercando bastante. Ahora mismo estamos en 50,33 frente a 50. Entonces, para que puedan ver, por supuesto, tomamos una muestra más grande, esperarían que nos acerquemos al promedio real de toda la población, que es un concepto teórico, en este caso, de 5.050 tienen un número infinito de bolteretas. Así que aquí está el número de cabezas si tuviéramos que tomar un histograma de los datos. Y así y luego este, así que vamos a buscar para que pudiéramos hacer y pudiéramos hacer esto varias veces, ¿verdad? Podría tomar el generador de números aleatorios y, básicamente, hacer lo mismo. Lo mismo otra vez, y no vamos a obtener exactamente los mismos resultados que verán aquí. Salimos con bueno, puedo verlo en mis datos. El primero fue del 45%. Y por aquí, ¿a dónde iré? ¿A dónde fui? Salí con 75 bueno, eso pasaría a ser lo mismo, pero luego fue 53 en 56, así que si vuelvo a la casa, ahora hicimos lo mismo. Y tengo, tengo el 4551, 51. Así que aquí está el mismo proceso que hicimos para generar otro montón de bolteretas, 75 bolteretas cada una. Y lo hicimos, ya sabes, varias veces, podíamos tomar los mismos datos, los datos de las cabezas, representarlos verticalmente. Así que aquí se representa verticalmente 4551, 51. Y podemos comparar, ya sabes, los histogramas que se generan a partir de ellos, los histogramas no van a ser, ya sabes, exactamente iguales. Pero uno esperaría que comenzaran a parecerse a lo que tenemos, ya sabes, conjuntos de datos más grandes sería la idea general. Así que estos son histogramas de los pronedios de todos los resultados que hicimos 100 pruebas de 75. Ahora, entonces, podrías decir, bueno, bueno, cómo puedo simular una situación en la que no es una moneda justa. Así que ahora, ahora, tengo la hipótesis nula, que es 500050. Si fuera justo, pero si no lo es, tendría que demostrar que no es justo. No podemos simular eso. Bueno, de una manera, podríamos decir, usemos mi herramienta de generación aleatoria y digamos que si es un 1, eso es una cara, y si es cualquier otra cosa que no sea un 1, va a ser cruz. Así que podríamos usar el mismo tipo de concepto, pero luego ir a 3. Y ahora vamos a aplicar todo, eso es 1 por delante, todo lo que no es un 1, una cola, hacer las mismas herramientas de generación de números, pero ahora vamos de 1 a 3, correcto, y luego podemos copiar toda esta herramienta de generador aleatorio sobre 2, para obtener los números codificados. Y aquí están nuestros resultados numéricos codificados. Y de nuevo, los números están un poco desordenados aquí. Para él, para el número de bolteretas, pero creo que esto equivale en realidad a 7074 bolteretas, por lo que podría llegar a 75. Así que creo que este 74 es un poco. Entonces, lo que sucedió aquí es, es aquí, tomé el número de caras, lo que significa que voy a decir contar si hay uno, y tomó todas las cabezas. Ahora, en este caso, en realidad dice un poco de trampa. Y no me di cuenta de que mis números no estaban bien calculados aquí. Porque esto es bueno, en realidad, este es uno, este se está poblando correctamente. Uno, dos, así que este se ve bien. Así que el otro tenía algunos divertidos. Así que creo que esta es la correcta. Pero todavía lo atajo diciendo que, bueno, si hay 21 caras, y le di la vuelta 74 veces, entonces las dos y las tres van a ser una o el resto están pobladas. Y asumo que son colas. Así que acabo de tomar 74 menos menos 21, nos da 53. De modo que el 53 y el 21 suman 74, que es el número total de lanzamientos. Ahora fíjate que sería mejor si hiciera otra función de conteo para contar esta columna, si resultara ser tres o dos, porque entonces obtengo una especie de doble verificación de mi total, lo que me gusta hacer como contador. Pero, pero, pero eso requiere una fórmula un poco más compleja, porque entonces tengo que oye, a ver si no es sólo uno, sino uno o dos, verdad. Así que lo atajo, porque si no es un uno, podría haber dicho que también podría decir, ya sabes, si no es un uno, entonces pon algo aquí, verdad. Si no es esta cosa, entonces pon algo aquí, verdad. Pero en cualquier caso, eso suma 74, y luego puedo tomar mi 21 sobre 74 que nos da un 28,37%. Y el otro es 53 sobre 74. De nuevo, ahora, de nuevo, se esperaría que saliera 5.050. Así que si sólo mido cara, y voy a mirar estos resultados, si lanzo una moneda varias veces, y obtengo resultados de 28 caras, 26 caras, 36 caras, 42 caras, observe que ninguno de estos resultados está por encima del 50%. Eso es bastante inusual si fuera una moneda justa, verdad. Así que esto nos daría una preponderancia de evidencia para decir que la hipótesis nula no se ve apropiada aquí. ¿Por qué aunque estoy viendo una muestra, parece bastante improbable que este vaya a ser el caso, verdad? Entonces, si tuviera que ver nuestros resultados de esta manera, transpondría todos los encabezados en una columna. Y ahora vamos a compararlo con el 50%. Eso era lo que esperábamos. Y el primero, está fuera por 22. Por lo tanto, las cabezas son demasiado bajas para 22. Es demasiado bajo para 24. Así que fíjate, siempre es demasiado bajo, verdad, no siempre es el mismo número. Pero eso nos ha dado una evidencia bastante buena de que estamos como. Bien, esta cosa parece que está inclinada hacia las colas. ¿Por qué porque lo haríamos, esperaríamos, entonces que sería que, ya sabes, no lo haría. Así que no siempre salió cruz, verdad. Pero en esto es lo común que va a pasar. Vamos a obtener la expectativa, que es la hipótesis nula, lo que esperábamos que sucediera si fuera justo, y luego lo probaremos. Y veremos si hay una diferencia entre los datos reales y lo que se pensaría que estaría sucediendo o con toda la población. En este caso, toda la población sería como si hubiéramos lanzado una moneda justa una cantidad infinita de veces y habría sido una división de 5.050. Así que aquí hay un histograma de las caras en una moneda no justa de los resultados que tomamos aquí. Y fíjate, son los resultados los que están poblando alrededor del 31 al 35%, en lugar de alrededor del 50. Y tienes esto, esta forma que parece que está sucediendo de manera consistente, verdad, y los valores atípicos alrededor de ese punto central. Algo equilibrado. Frente a esto está el histograma que vimos y una situación justa en la que está más cerca del 50%. Y luego tienes este tipo de forma poblando a su alrededor. Así que ese es el tipo, ya sabes, el tipo de conceptos en los que teóricamente podemos pensar aquí, aplicando más un concepto matemático, porque pensamos en el infinito en este caso, que es un término matemáticamente integral para toda la población si lo volteamos infinitamente cantidad de veces. Y también como podemos y luego las estadísticas son similares a una situación que vimos antes y esperamos, donde, donde no tenemos un concepto teórico, tenemos una población real de pesos de individuos frente a una muestra de esa población de ejemplo. Pero ese es un concepto similar al de los giros teóricos e infinitos frente al número de videos de muestra. Y podemos ver como puedes jugar con estas cosas en Excel con bastante facilidad una vez que conoces algunos de estos conceptos, lo que realmente te ayuda a entender lo mejor si puedes, ya sabes, ejecutar pruebas en Excel.