 Estadísticas y Excel, ejemplo de estadísticas de encuestas electorales. Tengo datos. Vamos a meternos en ello con las estadísticas y Excel. Bueno, usaremos una nota aquí, pero seguiremos hablando de Excel, no es necesario. Pero si tiene acceso a OneNote, donde en el icono del lado izquierdo de la página de ejemplo de estadísticas de encuestas electorales de OneNote 1335, también estamos cargando nuestra transcripción. Por lo tanto, puede usar la herramienta de lectura inmersiva, cambiar el idioma si así lo desea y poder leer o escuchar la transcripción en varios idiomas diferentes utilizando las marcas de tiempo para vincularlas a las presentaciones de vídeo. La versión de escritorio de OneNote aquí recuerda a las dos categorías principales, aquellos problemas estadísticos, uno de los cuales es donde conocemos todos los datos de la población que utilizan de herramientas estadísticas para organizar esos datos de tal manera que podamos extraer significado de ellos. El número dos es cuando no tenemos todos los datos de toda la población, pero posiblemente podemos obtener una muestra de la población aplicando herramientas estadísticas similares a la muestra como lo haríamos para toda la población. Si tuviéramos todos los datos, no porque estemos particularmente interesados en la muestra, sino con la esperanza de que la información sobre la muestra sea útil para decirnos algo sobre toda la población. Ahora, es útil a menudo, cuando estamos practicando estadísticas, usar una situación en la que ya conocemos la información sobre toda la población, para que luego podamos tomar muestras de ella y probar si las muestras realmente nos dicen algo que podamos inferir a toda la población para que luego podamos aplicar esas mismas herramientas estadísticas en los casos en que no, conocemos a toda la población. Y luego podemos tomar las muestras y podemos crear herramientas para ver que tan seguros podemos estar acerca de esas muestras. Así que estamos explorando esos conceptos. En este momento en presentaciones anteriores, lo hicimos con toda una población de alturas, tomando una muestra de la población de alturas, para ver que tan cerca se relaciona la muestra con los resultados para toda la población de datos. Y luego también lo hicimos en áreas más teóricas, cuando pensamos en lanzar una moneda, por ejemplo, o estamos pensando en robar cartas de un mazo en el que toda la población se puede considerar como un concepto teórico, como si lanzáramos la moneda una cantidad infinita de veces, como si robáramos una carta de un mazo una cantidad infinita de veces. Ahora, en este caso, vamos a suponer que sabemos la respuesta de toda la población, de modo que podemos obtener nuestra muestra para ver que tan cerca está la muestra de la población. Así que vamos a suponer que tenemos una situación de tipo electoral. Y ya conocemos los resultados, obviamente, de nuevo, en la vida real, no conocemos los resultados. Es por eso que tomamos la muestra. Pero cuando hacemos nuestras pruebas estadísticas y pensamos en las herramientas que estamos usando, de nuevo, es útil para nosotros pensar en una situación en la que vamos a decir que ya conozco el resultado de toda la población. Y eso va a hacer que el 60% de la población está a favor del candidato A. Y ahora vamos a pensar en cómo podemos simular una muestra para ver que tan cerca estaría la muestra del resultado real del 60%. Queremos hacer esto para pensar en nuestros métodos de muestreo estadísticamente, así como pensar en cómo podríamos estructurar un problema como este usando nuestras herramientas en Excel. Entonces, si usamos nuestras herramientas en Excel, podríamos decir, si tuviéramos que tomar una muestra aleatoria, porque solo estamos diciendo que es del 60%, entonces podríamos estructurar nuestra función aleatoria nuevamente. Así que ahora estamos usando nuestra función aleatoria de nuevo. Pero ahora vamos a decir que es aleatorio entre 1 y 100. Y si dibujamos un grupo aleatorio de personas, y dicen que son para el candidato A, y estamos asumiendo que la población real sería el 60%, para el candidato A, y el 40%. El no candidato escribe algo que no sea el candidato A, o entonces podemos usar esto y decir. Bueno, si el resultado de nuestro sorteo aleatorio entre 1 y 100 está entre menos de 60 o menos, entonces sería similar a si el candidato fuera para el candidato A. Así que básicamente puedo hacer una muestra aleatoria como esta, podemos usar nuestras herramientas generadoras y decir, voy a decir que este es un sorteo aleatorio entre 1 y 100. Cualquier empate que ocurra entre 60 o menos es equivalente a un voto por el candidato A, cualquier cosa que esté por encima de 60 sería un voto no candidato, un voto por otra persona. Y, por supuesto, podemos copiar esto. Así que ahora tenemos nuestra muestra de esta persona. Está por debajo de 6.060 o menos, por lo tanto, bote por el candidato A, este está por encima de 60. Por lo tanto, no bote por el candidato A, este está por debajo de 60. Por lo tanto, es un voto para el candidato A, este está por encima de 60. Así que tenemos a nuestra gente al azar que básicamente podemos aplicar esto a un tipo de equivalencia de si o no con el candidato A. Así podemos estructurar nuestras herramientas en Excel. Y podemos copiar esto porque esta es una fórmula fácil de copiar. Y podemos ejecutar una prueba como esta con bastante facilidad para tratar de comprender cuáles serían los resultados de esto. Así que ahora tenemos una generación de cajas aleatorias que está haciendo 10 muestras de la cantidad de muestras que queramos hacer. Y luego podemos empezar a usar esto para aplicar nuestras herramientas estadísticas para ver si nos da resultados. Eso, básicamente, es de esperar. Ahora, una vez que tengo una herramienta de generación aleatoria como esta, puedo copiarla entera porque tiene fórmulas y pegarla estática, es decir, sólo los números. Así que estos son simplemente números codificados para todas esas generaciones aleatorias. Así que ahora, si voy al final de esto, resumiendo nuestros resultados, esto es para el candidato A, le estamos pidiendo a Excel que mire esta serie de números y esta columna. Que representa la encuesta que hicimos, que nos va a dar resultados de ser para el candidato A o no, para el candidato A, la fórmula que se ve así, vamos a decir que es igual a contar los elementos en esta columna. Si este es el rango, está el rango de criterios de esta columna, y luego el siguiente criterio, la coma es si es menor o igual que 60. Ahora, debido a que tenemos que poner esto menor o igual que es, y ese tipo de texto similar, tenemos que poner las comillas alrededor de eso, y luego tenemos que conectarlo con el 60. Con una respuesta, parece un poco complejo, pero no está tan mal una vez que lo haces varias veces. Y por lo tanto, estamos viendo esta columna, y está contando todos los números que son iguales a 60, o inferiores a 60. Y luego podemos hacer lo mismo si no es un, así que si no es un, estamos mirando esta columna, es esta fórmula, mira ese rango, Excel, por favor, coma, y esta vez. Sólo toma mayor que no iguala, pero todo lo que está por encima de 60. Y eso nos va a dar este número, este número, entonces es un doble cheque, o este número es nuestro total, sumando esos dos, así que 102 más 48. Eso significa que lo hicimos 150 veces. En otras palabras, si cuento todas estas filas, eso llegaría a 150. Entonces, puedo tomar mi porcentaje, y puedo decir cuál es el porcentaje de veces que tuvimos una favor del candidato a ver sus en contra, que sería 102. Dividido por el total de 150 al 68% de las veces para el candidato a, y el otro es 48 dividido por el total de 150 a 32% de las veces no. Así que, de nuevo, esperaríamos que tuviéramos el punto de partida, a priori que dijimos que debería ser 6040, si hiciéramos esta cantidad infinita de veces, porque o si tenemos los datos de toda la población, dijimos que los datos de población eran del 60% para el candidato a. Así que si hice esto, de nuevo, hicimos lo mismo aquí de nuevo, y esto sale a 6535. Este 157. Así que este está por debajo de 43. Este sale al 5740, 352, 4867 y 33, y así sucesivamente. Así que aquí está nuestra serie de resultados. Para nosotros haciendo esto varias veces. Ahora voy a tomar esta columna de números, sólo voy a tomar los que son para el candidato aquel porcentaje para el candidato a, y ponerlo en el formato de una columna, lo que podemos hacer en Excel básicamente transponiendo. Y es un procedimiento bastante simple, si quieres ver este problema de práctica o hacerlo también con nosotros en Excel. Entonces podemos decir, voy a enumerarlo de esta manera. Así que ahora tenemos la columna a, y estos son los ejemplos. Entonces, cuántas muestras tomamos 10. Y estos son los resultados que obtuvimos, que fueron el porcentaje para la columna a. Y entonces podemos comparar eso con lo que se esperaba, o cuál es el número real, que dijimos que sabíamos a prioridad ante mano, sabíamos que ya era 60. Y creamos una prueba que pensarías que si hiciéramos la prueba un número infinito de veces porque saldría al 60% porque hicimos la prueba para hacer un sorteo aleatorio entre uno y 100 y tomamos todo lo que, estaba entre por debajo de 60 y por debajo así que en cualquier caso. La diferencia es de 853 y luego se pueden ver las diferencias de arriba y de abajo si tuviera que tomar el promedio de estos en esta columna, sale alrededor de 61, que está bastante cerca del real de 60. Bien, si lo fuéramos, podríamos, podríamos ejecutar este experimento con Excel. Sólo dado el hecho de que es algo bastante simple de ejecutar, esto es un poco borroso porque copió un montón de columnas aquí, habíamos ejecutado el mismo tipo de cosas, de una a 100. Pero puedes hacerlo básicamente, un montón de veces, no una cantidad infinita de veces, pero si un montón de veces en Excel. Por lo tanto, es interesante tratar de ejecutar la misma prueba. Que puedes construir muy fácilmente, y analizar tus resultados y ver cuanto más te acercas a la realidad, esto es básicamente la muestra que ejecuta esto, acabo de copiar la misma fórmula hasta el final. Y lo hicimos, ya sabes, un montón de veces. Así que este es un enorme generador de números aleatorios que son relativamente enormes, ya sabes, y luego lo copié. Y luego aquí están los resultados reales, que acabo de darnos algunos de ellos. Así que ahora tienen la muestra 123, lo mismo que hicimos antes, y el total de la muestra aquí abajo. Y ahora tienes el mismo tipo de concepto. Es decir, tomamos esta columna y dijimos que los contáramos, si son menores o iguales a 60, obtuvimos 50 de ellos, este los cuente, si son mayores que 60, obtuvimos 30. Lo hacíamos a veces. Así que este número de columnas aquí es 80, tomamos una muestra de 80 de la población teórica es 80. Y luego dijimos, bueno, 50 de 850, de 80, eran para el candidato a, eso es 63 acerca de y 30 de 80 es 38 acerca de, y eso es un total del 100%. Ahora, hicimos esto un montón de veces, esta vez. Así que ahora tenemos muchos más resultados. Ahora, si pongo estos resultados, de nuevo, en una columna, voy a ir aquí y decir, y he hecho un atajo, esta tabla, así que esto no tiene, esto no es tan largo como la tabla que haremos en Excel. Sólo les di el tipo de idea, pero aquí están los resultados. Así que ahora tenemos los resultados, los porcentajes. Y lo hicimos un montón de veces. Así que puedes ver, boom, boom, boom, todo el camino hasta aquí. Y luego tomamos el promedio. Así que esta vez lo hicimos un montón de veces. Y comparamos cada uno con lo esperado. Y esta es la diferencia ahora, y entonces básicamente puedes hacer histogramas. Así que este es un histograma de los resultados porcentuales que hemos obtenido al probarlo un montón de veces. Y es de esperar que, si se prueba esto un montón de veces, ronde el 60%. Derecha. Si miro mi histograma de aquí, tenemos el punto medio, se inquina un poco hacia la derecha. Correcto, porque uno esperaría que estuviera en 60%. Y es interesante, entonces, mirar sus resultados y ver como el histograma, a medida que mira resultados más grandes y tratar de hacer un histograma a partir de él, luego mira a empezar a mirar la estructura del histograma. A medida que haces esto y tienes más resultados que estás agregando a ello, porque pensarías que la forma debería acercarse a la teoría. Y en nuestro caso, debido a que hicimos una especie de concepto matemático y lo tomamos todo por debajo del 60%, hicimos un sorteo al azar. Uno pensaría que cuantas más veces tenga un resultado, obtendrá algo que se reducirá y se verá más como una forma de campana, una especie de estructura a medida que obtenga más resultados. Así que podría ser un concepto interesante tener una idea de ciertas cosas, hacerlo conceptualmente en Excel con pequeñas cantidades de datos y luego simplemente ejecutar lo mismo con grandes cantidades de datos y observar la estructura de los gráficos e histogramas a medida que se hace más, lo que debería acercarte si estás haciendo algo matemático a la población real, que en este caso, dijimos que eran 60 de toda la población, lo cual es realmente un concepto matemático porque sería algo similar a lo que ocurre con el lanzamiento de una moneda, ¿verdad? Si lo hiciéramos una cantidad infinita de veces, esperarías que fuera, ya sabes, 60, pero luego va a disminuir y todo eso si los agrupas a todos. Así que ahí está ese.