 Estadísticas y publicaciones de Excel sobre ejemplo de línea de montaña rusa de distribución. Tiene datos, vamos a meternos en ellos con estadísticas y Excel, no es necesario, pero si tiene acceso a una nota, estamos en el icono del lado izquierdo de una presentación de nota 1536 publicaciones en el ejemplo de línea de montaña rusa de distribución, también estamos cargando transcripciones en OneNote. Así que puedes ir a la pestaña de vista, lector inmersivo cambiar el idiomas y así lo deseas. Ya sea leer o escuchar la transcripción en varios idiomas diferentes, pudiendo vincular las presentaciones de video con las marcas de tiempo versión de escritorio de OneNote aquí y presentaciones anteriores, hemos estado pensando en cómo representar conjuntos de datos tanto matemáticamente usando fórmulas como los cuartiles promedio o medio, la mediana, así como representaciones pictóricas como una caja y bigotes o un histograma, el histograma. Por lo general, lo que visualizamos cuando pensamos en la propagación de datos, utilizando terminología como que estás esgado hacia la derecha o hacia la izquierda, ahora estamos viendo familias de curvas que se pueden representar con ecuaciones, lo que podría darnos más poder predictivo, si esas curvas pudieran aproximarse a nuestro conjunto de datos real. En presentaciones anteriores, observamos la curva simple de una distribución uniforme, ahora estamos hablando de los puntos sobre la distribución, es más complicado, pero no es veneno. No es tan complicado, son puntos sobre puntos en la distribución. Por lo general, esto se relaciona con ejemplos de líneas, cuando se habla de escenarios de tipo empresarial. Así que eso es lo que usaremos aquí, me imagino que estamos esperando en la fila para una montaña rusa. Por lo tanto, X es igual a las llegadas durante un minuto, así que estamos tratando de mostrar cuánta gente está llegando en un plazo de un minuto. Ese es el lapso de tiempo, la montaña rusa en vivo, eso es con lo que estamos lidiando. Y luego la media, es lo que generalmente vamos a necesitar si vamos a usar las funciones de Excel. Así que imaginemos que, en la práctica, estuviéramos tratando de determinar los datos relacionados con cuántas personas aparecen dentro de una fila, y luego veremos si hay alguna observación que podamos hacer al respecto para ver si se ajusta a un equilibrio en el tipo de distribución, en cuyo caso, podríamos usar una fórmula que los demás poder predictivo sobre lo que podría estar sucediendo en el futuro en relación con la línea. Ahora, en Excel, podemos tener un generador de números aleatorios aquí para aproximar los puntos de la distribución con un elemento de aleatoriedad. Entonces, si desea consultar Excel, puede hacerlo, también trabajaremos este problema en Excel. Pero en lugar de simplemente usar un generador de números aleatorios, vamos a tener que darle a Excel la media para crear números aleatorios de acuerdo con las condiciones de una distribución de paisan. Y estos son los números que obtenemos de esa generación aleatoria, creo que generamos como mil números en el ejemplo en Excel. Aunque no pusimos todos esos números aquí en nuestro problema de práctica en OneNote. Entonces, si tuviéramos todos nuestros números, ¿qué significan estos números? Bueno, significa que si estamos en G con nuestro cronómetro, bien, viendo cuántas llegadas están ocurriendo, durante cada intervalo de tiempo de un minuto, estamos esperando a medida que pasa cada minuto y decimos, bien, esta vez, y ese minuto, llegaron cuatro personas y otro intervalo de tiempo de un minuto. Llegaron tres personas y otro intervalo de tiempo de un minuto, dos personas llegaron en otro intervalo de tiempo de un minuto, llegaron seis personas y así sucesivamente. Voy a saltar aquí a la izquierda. Ahora, una vez que tenemos nuestros datos, podemos ponerlos en nuestros contenedores o cubos. Así que estas son las llegadas que han aparecido. Y vamos a decir, bien, vamos a contar las llegadas. Esto representa el número de llegadas, las personas que han estado apareciendo dentro de los intervalos de tiempo, que dijimos que era una vez más, el minuto. Así que ahora vamos a decir, de los mil conteos que tuvimos, cuántas veces llegó cero gente, cuántas veces llegó una persona a la gente y vamos a contar estos artículos aquí. En Excel, podemos, podríamos llamar a eso una frecuencia. Y podrías usar una ecuación como esta para hacerlo. Ahora tengan cuenta que también podría decir por qué no uso una función counted. Podría, podría decir que esto es igual a contar si, lo que significa que si encuentras cero en este número de campos aquí, Excel, me gustaría que contara el número de veces que aparece un cero. Sin embargo, a veces, cuando usas estos generadores de números aleatorios, no te da un número entero o algo así. Así que a veces esa fórmula no te da el resultado correcto. Por lo tanto, la frecuencia a menudo lo capta con mayor precisión, he encontrado, que es una función de matriz de robo, una frecuencia un poco más sofisticada. Y luego estamos recogiendo la matriz de aquí, y luego los contenedores de datos aquí, y esto en realidad sólo derrama la fórmula. Esto significa que creo que hicimos 1000x con muestras de 11 minutos para ver cuánta gente llega. Y no llegó ninguna persona en intervalos de 60 a 1 minuto, llegó una persona. Y 171, intervalos de 1 minuto, llegaron 2 personas, y 243, intervalos de 1 minuto, y así sucesivamente. Entonces, si sumo esto, este número aquí abajo debería vincularse a si sumo esta columna, el número de muestras que tuvimos, si hicimos este 1000, multiplicado por el número de generaciones de números aleatorios. Eso nos da la doble verificación de que todo está calculado correctamente. Este va a ser el porcentaje del total. Entonces, si 62 personas 62 veces cero personas llegaron, entonces eso significa que 62 de 1000 veces 62, eso dividido por 1000, o 6.2 veces es el porcentaje que esa persona cero llegó de los 1000. Así que podemos representar esto como un porcentaje del total, ¿verdad? Entonces, si 171 veces una persona llegó en el intervalo de 1 minuto de intervalos de 1000 a 1 minuto, podría tomar 171 dividido por 1000. Y obtendríamos el 17.1, y así sucesivamente. Entonces podemos decir, bueno, bueno, si miro la media de los datos, podemos calcular la media. Y podría usar mi fórmula en Excel para hacer eso. Y esa sería una fórmula promedio. Así que tomaría el promedio de este conjunto de datos en su totalidad. Sólo tomaría el promedio de todo el conjunto de datos, sumándolos y dividiéndolos por el número de eventos, que fue el 1000. Y luego la varianza, que es la varianza que usa la fórmula de la población y la varianza que usa la fórmula de la muestra. Y el punto al que queremos llegar es que la media, por supuesto, está cerca de la media que teníamos cuando empezamos. Ahora, ahora recuerda que si estuvieras haciendo esto en la práctica, estuvieras sentado allí con un cronómetro contando las llegadas, es posible que no tuvieras ninguna, es posible que no supieras la media, es posible que tengas una idea de ello. Pero no sabrás cuál es la media, la razón por la que comenzamos con una media aquí es porque necesito la media. Para generar estos números aleatorios de acuerdo con una distribución de paisan. Fíjense, cuando tomo la media aquí, obviamente, va a ser algo cercano pero no exacto a la media que pusimos cuando generamos los números aleatorios. El punto que queremos ver, sin embargo, es que si tomo mis datos y también hago mi cálculo común de la varianza de los datos, que sería esta fórmula, entonces si está cerca de la media, entonces eso es una indicación de que podría estar siguiendo una pieza sobre distribución. Entonces, si miro esto, si miro mis datos, y digo, está bien, esto me da algún poder predictivo sobre cómo voy a regular mis líneas en las montañas usas y todo eso, y cuánta gente va a aparecer. Bueno, entonces puedo empezar a decir, analicemos los datos con una media de los datos. Echemos un vistazo a la varianza de los datos. Si esos dos son similares, entonces posiblemente pueda aproximarme a lo que está sucediendo aquí con un punto en la distribución, representándolo con una fórmula, lo que hará que sea más fácil hacer predicciones en el futuro, también podemos trazar esta información. Así que si trazo la frecuencia, estamos trazando la frecuencia aquí. Así que aquí están los números, 0 hasta 229. Recuerde que cuando estamos viendo el equilibrio en la distribución, la idea es que podría subir infinitamente en esta dirección, no lo va a hacer en la práctica, porque no es como si un número infinito de personas fuera a aparecer en un intervalo de tiempo de un minuto. Eso es muy poco probable, pero en teoría es como subir al infinito. Es por eso que normalmente tendrá un sesgo hacia la derecha. Así que esto no tiene exactamente forma de campana, va a estar básicamente sesgado hacia la derecha es la idea general. Ahora, si gráfico estos datos, estamos diciendo, oye, esto se ve como un equilibrio en el tipo de distribución. Y sabemos que la media es igual a la varianza. Así que eso nos ha dado más evidencia de que esto se ve como un punto en nuestro tipo de distribución. Esto es lo mismo, pero en lugar de representar los números en términos de la columna de frecuencia de recuento, estamos viendo el porcentaje del total. Como puedes ver, en esencia puedes representar el mismo concepto con la columna de porcentaje en lugar de la columna y obtienes el mismo tipo de distribución. Mira y siente. Un vistazo rápido aquí, si tuviera que recordar calcular nuestros y tuviera que pensar en los cálculos de la media y la varianza. Recordarán que si tomo todos mis conjuntos de datos y restos la media, que es este número, estamos viendo la distancia entre cada uno de nuestros puntos de datos. El número de llegadas que aparecieron en un intervalo de un minuto, menos la media. Y ahí está nuestra diferencia. Y si tuviera que sumar todas las diferencias, no tengo todos mis datos. Pero si sumaba todas las diferencias en mil muestras, saldría a cero. Recordarás que tuvimos que hacer algo para obtener nuestro número de diferencial, que suele ser la desviación estándar y la varianza, la elevamos al cuadrado, así que la elevamos al cuadrado. Así que esta es la diferencia al cuadrado, lo que hace que todos los números sean positivos, pero también mucho más grande ya que ahora están al cuadrado, sumando eso, eso nos da nuestro 2553. Así que la suma al cuadrado de la diferencia. Y luego, si dividimos eso por el conteo, que fue el mil, hicimos mil muestras. Eso nos da nuestra varianza, solo para mostrarles cómo estamos obteniendo la varianza aquí en otro formato para obtener la varianza. Y luego, si sacamos la raíz cuadrada, obtenemos la desviación estándar. Bien. Entonces, digamos, bien, bueno, parece que podría ser un punto en la distribución. Así que ahora, si tomo mis mismos datos, el número de llegadas, voy a usar la media. Esta vez, voy a usar la media que calculamos en nuestros datos reales, 2.3, conjunto 7, 3. Y voy a usar eso para generar nuestros puntos en la función de distribución de puntos. Así que ahora voy a decir que mi mismo número de llegadas podría ser 01234, el número de personas que llegan en un intervalo de un minuto, y ahora voy a estimarlo, no con mis datos reales, sino con una policía en punto de est. Porque ahora he llegado a la determinación de que podría seguir esa función, lo que me da más poder predictivo. Y todo lo que necesito con el aplomo en punto de est, tienes la x, que va a ser la del número de llegadas, 012. Y luego la coma, la media, todo lo que realmente necesitas es la media. Y la media, la tenemos aquí con un 2.73. Y luego la coma, el argumento acumulativo, el acumulativo va a ser si va a ser acumulativo, estás preguntando cuál es la probabilidad de, digamos, como que de 0 a 3 personas serían acumulativas hasta 3, lo que sumaría estos porcentajes. Mientras que si dices que no es acumulativo, lo que estamos haciendo aquí, falso o cero, entonces vas a decir cuál es la probabilidad de que llegue una sola persona, sólo dos personas que lleguen en este caso. Caso, no cero o dos personas, y luego obtenemos nuestro porcentaje de probabilidad de que este porcentaje de probabilidad de sea similar a nuestro porcentaje de la columna total, llegamos aquí, no estamos recibiendo la frecuencia real. Debido a que en realidad no le dijimos a Excel cuántas pruebas ejecutar, sólo usamos los puntos en la distribución para obtener este porcentaje, esta columna de porcentaje, y luego, independientemente de cuántas pruebas ejecutemos, sea cual sea la muestra, podemos multiplicar por 2 por ciento, para obtener los valores numéricos reales, correctamente. Así que esos van a ser nuestros puntos sobre la fórmula. Si miro la diferencia entre lo que obtuvimos aquí, con los puntos en contra y aquí, obtuve 2.6, el punto 2 17.1 24.3 versus 6.5, a 17.8 24.3. Así que esta sería otra indicación si estoy haciendo esto en la práctica, estoy como, bien, tengo mi conjunto de datos, y parece que la media está cerca de la varianza, lo que significa que podría ser un punto en la distribución, el gráfico real se ve como un punto en la distribución. Si gráfico un punto en la distribución y miro lo que obtuve en mi conjunto de datos real, en comparación con los puntos en la distribución, en términos de porcentajes, se parece bastante, lo que significa que los puntos sobre la distribución podrían darme un buen poder predictivo. Así que este es otro, repasaré esto en un segundo. Vayamos primero a la derecha. Entonces, si tomo la media, de los puntos en la distribución, obviamente, va a ser ese 2.75. Y puedo entender que eso es lo que me pasa. Y recuerden, cuando calculamos los puntos, ponemos que fue 2.75. Pero si nos fijamos en esta columna, esta columna está tomando la columna X por la columna P de X. Entonces, si multiplico esas dos columnas hasta el final, así que esto es como dos veces que el punto 243 nos da sobre el punto 4, 9, 9, y luego resumo esta columna, esa es una forma en que podemos obtener. La media aquí es que obtenemos el cálculo de la media. Y también podemos hacer eso con una fórmula, que es una fórmula de suma de productos. Solo para tener una idea de la fórmula de Excel, esto va a ser lo mismo. Así que es una especie de fórmula sofisticada que podría ser útil de vez en cuando, nuestro producto de suma, y luego estamos eligiendo las dos matrices básicas, y eso, en esencia, hará lo mismo, correcto. Estamos tomando el producto de suma de esta columna, y esta columna. Así que lo probaremos en nuestra presentación de Excel, si quieres probar las fórmulas, y luego la varianza. Si tomo esto, y luego esto es x menos la media, en esta columna, y luego esto va a elevar el número al cuadrado, eso nos va a dar esta columna. Y si resumo esa columna, esa es una forma en la que básicamente podemos calcular la varianza. Y también puedo hacer eso con una fórmula de producto de suma, que haremos en Excel. Si quisieras hacer eso y poner todo en una fórmula aquí, fíjate, es un poco raro. Podrías estar diciendo lo que parece un poco extraño para calcular la media y la varianza, fíjate, es un poco diferente a cuando realmente tenemos nuestros datos aquí. Porque cuando realmente tengo mis datos, entonces estamos trabajando con los datos. Mientras que en lugar de trabajar con los porcentajes de los totales, mientras que cuando calculo los puntos de distribución aquí, no estamos viendo una muestra de mil unidades de datos. Estamos viendo el porcentaje del porcentaje de probabilidad. Básicamente, estamos diciendo que este es el porcentaje de probabilidad de que una persona aparezca en el periodo de tiempo de un minuto. Así que, en cualquier caso, esos van a ser esos elementos. Y luego podemos hacer preguntas como, ¿cuál es la probabilidad de que menos que tengas menos de tres llegadas? Por lo tanto, ¿cuál es la probabilidad de que haya tenido menos de tres llegadas? Si miro mi conjunto de datos, ahora, el SP esto es igual o menor que, así que si voy a mis llegadas aquí, puedo decir, bueno, tiene 6.5, para tener cero personas, 17.8, de 124.322.12. Así que llegamos a eso lo que obtenemos aquí 70.75, más o menos porque esos números fueron redondeados. Y luego también puedes usar los puntos en la distribución usando el acumulado para calcularlo. Así que puedes decir, bueno, van a ser los puntos en la distribución, la X va a ser el número que queremos, que acabo de codificar como 3, y luego la coma. La media va a ser la media que calculamos arriba o la que empezamos con la izquierda y luego la coma, y luego, esta vez, el 1 representa el verdadero acumulativo o el 1. Así que ahora está contando hasta ese punto de 0 a 3, en lugar de solo darnos el resultado de 3 en sí. Y luego, aquí, tenemos otra pregunta que podría surgir entre si queremos estar entre, digamos, 2 y 5. Eso es un poco complicado, porque en los problemas de práctica, quieres decir, bien, estás incluyendo los 2 o los 5, así que tienes que determinar si está entre 2 y 5, ¿estás incluyendo los 2 o los 5, entonces solo estás hablando de los 3 y los 4? Que sería 22.12 más 15.09. Así que, a diferencia de un problema de libro, tienes que ser muy específico sobre si incluyen o no el 2 y el 5, así que ponemos entre los dos, lo que significa que no estamos incluyendo el 2 o el 5 en este caso. O puedes usar los puntos en la distribución, esto se vuelve un poco complicado, porque podrías decir, bien, ¿cómo va a funcionar? Si miro mis puntos sobre la distribución, si digo la función acumulativa, si digo para 5 sería cuánto sería esto hasta 5, entonces, ¿cómo puedo pasar de 2 a 2 a partir de 2? Bueno, tengo que pasar de esto a 5, y luego restar la cantidad que sube a 2, ¿verdad? Así que tengo que hacer una resta. Así que podría hacerlo con dos puntos sobre distribuciones y un punto de fórmula sobre distribución. Y luego vamos a subir a 4 en este caso, porque no estamos incluyendo 5. Así que ahí es donde se pone un poco complicado, porque esto no incluye 5, así que voy a subir a 4 comas, la media y luego la coma, va a ser acumulativo. Menos estamos restando otro punto en la distribución aquí, que va a subir a 2 y luego la media y también va a ser acumulativo. Muy bien, si graficamos estas dos cosas juntas, entonces estas son nuestras gráficas, dos formatos diferentes de la gráfica. Así que esto va a ser azul como los puntos reales. Y luego la naranja es de nuestro conjunto de datos. Así que puedes ver que no son exactos. En otras palabras, si miro mi conjunto de datos real, eso es lo que generamos aquí. Eso va a ser, en esencia, este gráfico que agarramos y que obtuvimos con nuestro conjunto de datos, o este otro con los porcentajes. Y luego comparamos eso con los datos que obtuvimos de los puntos en la curva suave real que obtuvimos en nuestra fórmula. Y están muy cerca. Entonces, en la práctica, podemos decir, bien, vamos a recopilar nuestros datos, luego tomamos nuestros datos y dijimos, solo la media es igual a la varianza. Si es igual a la varianza que podría ser un equilibrio en la distribución, luego lo graficamos, parece que podría tener la forma de una publicación sobre la distribución. Luego calculamos los puntos en la distribución, miramos la diferencia entre ella y la forma y luego podemos graficarlo uno encima del otro y decir, oye, mira, estas dos cosas. Mira, no son exactos, pero se alinian bastante cerca. Y, por lo tanto, si puedo usar los puntos en la distribución, entonces me dará más poder predictivo en el futuro porque puedo simplemente rematar números en una ecuación para la que tengo una ecuación. A diferencia de un resultado aleatorio de números que no tengo una forma real de extrapolar al futuro, que sería fácil sin, ya sabes, métodos más complicados.