 Estadísticas y distribuciones potencial de Excel, Cree y compare la línea de muestra en espera y los datos con la distribución exponencial de los datos, vamos a meternos en ello con las estadísticas y Excel, no es necesario, pero si tiene acceso a una nota donde en el icono de lado izquierdo una presentación de una nota 15 en la distribución exponencial, Cree y compare los datos de espera de la línea de muestra con la pestaña de distribución exponencial. También estamos cargando transcripciones en OneNote. Para que pueda ir a la pestaña ver, la herramienta lector inmersivo, cambiar el idioma si así lo desea, poder leer o escuchar la transcripción y varios idiomas diferentes vinculando la transcripción a las presentaciones de video usando las marcas de tiempo de la versión de escritorio de OneNote aquí y presentaciones anteriores. Hemos estado pensando en cómo podemos representar diferentes conjuntos de datos tanto numéricamente como con cálculos, como la media o la media de la mediana, cuartiles, y pictóricamente. Con cosas como esa caja y bigotes y el histograma, el histograma es la herramienta principal que imaginamos cuando pensamos en la propagación de datos. Y luego podemos describir los datos en el histograma usando términos como que estás esgado hacia la izquierda, estás esgado hacia la derecha, ahora estamos viendo esas familias de curvas que tienen funciones relacionadas con ellas, que a menudo se aproximan a los conjuntos de datos en el mundo real. Y si podemos aproximar un conjunto de datos con una curva, sería genial porque nos da más poder predictivo. Con la fórmula real. Hemos estado observando diferentes tipos de curvas en el pasado que a menudo se representan en escenarios de la vida real, como los puntos de distribución uniformes en la distribución, la distribución binomial, y ahora estamos viendo la distribución exponencial, recordando que como vimos en una presentación anterior, a menudo se relaciona con los puntos de distribución. Y en la práctica, en un escenario empresarial, a menudo vemos los puntos en las situaciones de distribución y espera en las filas, haciendo preguntas como, ¿cuál es la probabilidad de que llegue tanta gente dentro de ciertos intervalos de tiempo? Como un minuto o un segundo. Y con él y también podríamos hacerlo en el espacio. ¿O las distancias? Por ejemplo, ¿cuántos baches hay en tantos kilómetros de carreteras? ¿O cuál es la probabilidad de que haya tantos baches y tantos kilómetros de carretera? Y luego, si hacemos la pregunta sobre la distribución exponencial, le damos la vuelta a las cosas, preguntando cuál va a ser el tiempo intermedio promedio entre la próxima llegada. Por ejemplo, en una situación de cola de espera, a veces es un poco más difícil imaginar la distribución exponencial y cómo encaja en una situación de cola de espera. Así que ahora vamos a hacer un problema que va a ser similar a lo que hicimos en el pasado para Coisan y el binomio, lo que significa que intentaremos generar algunos números aleatorios que sean equivalentes o similares a que realmente salgamos y probemos y recopilemos los datos. De modo que podamos comparar esos datos reales con un equilibrio en la distribución, que será la curva suave. Así que vamos a empezar a imaginar que el tiempo medio de llegada en horas es de 10. Así que vamos a imaginar que hay 10 llegadas en una situación de espera en fila o una reunión, cuántas personas van a aparecer en un cierto periodo de tiempo. Vamos a decir que el número promedio de llegadas o clientes a un restaurante o algo así va a ser 10. Tenga en cuenta que esta es generalmente la pregunta que nos hacemos cuando se trata de un tipo de distribución de veneno. ¿Cuál es la probabilidad de que llegue tanta gente en un cierto intervalo de tiempo? En este caso, una hora, el promedio de llegadas, ¿estamos diciendo que en una hora van a ser 10? En este caso, ahora, cada vez que estamos lidiando con el tiempo, siempre tenemos que preguntarnos, vamos a pensar en esto en términos de horas, minutos o segundos. Y este caso, vamos a desglosarlo en las llegadas en minutos. Entonces, si llegan 10 personas en una hora, puedo dividirlas 10 por 60. Y vamos a decir que en el punto 166 personas que llegan en un intervalo de un minuto, eso puede ser un poco abstracto, sentir ese número porque ahora estás diciendo que está bien, eso es obviamente menos, no puedes tener menos que una persona entera llegando. Pero obviamente es un promedio, ese concepto del promedio. Entonces, vamos a darle la vuelta a esto para pasar de los puntos sobre el tipo de pregunta a una pregunta exponencial, que es el tiempo entre llegadas en horas. Pensemos primero en horas. Así que ahora estamos pensando en cuánto tiempo pasará de media entre llegadas. Entonces, si tenemos 10 personas que llegan por hora, puedo tomar una más de 10. Y eso nos daría más o menos un punto 1. Así que ahora estamos viendo las horas en términos de una fracción de hora. Así que ya sabes, el punto 1, si lo miramos en términos de minutos, puedo decir, bien, si hay un punto 166 personas que llegan en un minuto, entonces puedo tomar mi cálculo y decir, uno sobre el punto 1666, continúa para siempre, y luego un 7 es aproximadamente 6 minutos. Así que tenemos unos 6 minutos del tiempo intermedio entre las llegadas. Ahora, lo que queremos hacer es imaginar que realmente estamos saliendo y contando los intervalos entre la llegada para que estemos en el restaurante o donde sea que esté la fila. Y en realidad estamos contando el tiempo entre la llegada de una persona, tenemos el cronómetro en marcha, y luego vamos a contar el tiempo que tarda en llegar la siguiente persona. Vamos a tratar de generar esto con un generador de números aleatorios, lo cual es un poco más complicado, porque no puedes usar el generador de números aleatorios normal. Y no tenemos las funciones de Excel para dar una generación de números aleatorios similar a la que teníamos con la distribución de puntos binoma y los puntos en la distribución. Así que vamos a inventar nuestro propio tipo de fórmula aquí. ¿Y qué va a hacer esto? Así que va a ser igual a menos ln, que es un logaritmo natural, no voy a entrar en eso en detalle. 640, pero ten en cuenta que lo que estamos tratando de hacer aquí es generar la aleatoriedad de los números, que todavía tiene un elemento aleatorio, pero sigue más o menos las condiciones de lo que estaría presente en un entorno natural que tiene una distribución exponencial, una especie de relación relacionada con él. Entonces, vamos a decir uno menos el rand, este es el generador de números aleatorios normal que hemos visto en el pasado para lanzar monedas al aire y demás. Y luego dividimos eso por esta media, la tasa de llegada en minutos, el 1.66 para siempre. Así que no te preocupes demasiado por esa fórmula, sólo el concepto es, estamos imaginando que vamos a salir, en realidad estamos probando esto con nuestro cronómetro, y este es un generador de números aleatorios, que nos da una aproximación de eso, ya sabes, en lo que sucedería en la vida real, si nuestra situación de línea siguiera una distribución de veneno. Lo que entonces pensarías que también se sigue cuando miras los tiempos intermedios una distribución exponencial. Entonces, por ejemplo, este primero, tuvimos, el primer cliente entró y el tiempo entre llegadas fue de 14. Y luego el siguiente, el siguiente tiempo de llegada entre ellos, fue de 1.16 minutos. Y esto es en minutos, por cierto, en lugar de segundos como nuestro ejemplo anterior. Y luego la tercera, tardó 2.83 minutos, y luego la siguiente llegada, 5.81 minutos, 4.15 minutos, 1.1 minutos, punto, 1, 5 minutos, punto, o, 7 minutos. Y fíjense en la tendencia que ven, cuando miran esto, tenían uno bastante grande aquí, y luego tenían muchos que son bastante bajos, si 5 es un poco grande, pero no es demasiado grande, tienen muchos que son bastante bajos 6.347, y luego terminaron saltando hasta 10. Así que ahora tenías un intervalo entre clientes de 1.12 bastante alto, y luego vuelve a bajar a 412. Volvió a subir 439, 414 saltó a 14. Así que tienes muchos que están en el rango más bajo, y luego salta hasta 21. Lo cual es bonito, ya sabes, no hemos visto nada tan alto durante algún tiempo, verdad, y luego tienes muchas cosas más bajas. Y eso es lo que generalmente esperaríamos a menudo en este tipo de situaciones de espera en la fila. Es por eso que da el tipo de carácter de la curva inclinada hacia abajo que hemos visto con esa distribución exponencial. Entonces, si tomo la media de estos datos, si solo tomo el promedio de estos datos, ahora estamos llegando a 6.49, que está cerca de 6, porque debido a que usamos ese 6 como nuestro como nuestro tipo de interino, esa fue nuestra media de nuestro conjunto de datos que pusimos en nuestro cálculo con este punto. 166 por aquí. Así que la media es, ya sabes, algo así como lo que esperaríamos son números generados aleatoriamente. Y entonces, lo que haría en Excel es simplemente copiar todo esto, porque esta celda tiene este generador de números aleatorios, eso significa que esta celda, esta celda siempre se van a regenerar al azar. Así que lo que estoy haciendo, simplemente, copiaría los mismos datos, estos números son diferentes. Porque puedes ver que básicamente hizo malabarismos con los números. Pero la idea es que esto se siga generando con esta función. Pero ahora codificamos los números, para que no cambien debido a esa herramienta de generación de números aleatorios. Bien, ahora podemos contar la frecuencia de estos elementos. Y podemos hacer nuestro tipo estándar de frecuencia de hacerlo de esta manera, donde diríamos bien, aquí están nuestros contenedores. Estos son los minutos que representan los minutos entre las llegadas ahora, así que tenemos 0, ya sabes, si miro, si miro estos números. ¿Cuál es el conteo en el que tenemos 0 minutos hasta los 40 minutos entre las horas de llegada? Y ten en cuenta que realmente no puedes usar una función counter para hacer esto, porque estos números de aquí ahora no son números enteros. Así que tenemos que usar la frecuencia, que nos va a dar los contenedores. Así que aquí está nuestra frecuencia de fantasía, que vamos a tomar la matriz de datos aquí. Y luego vamos a decir que los bins, que están aquí, van a ser nuestra función de matriz que nos dará la frecuencia. Y luego pondrá estos artículos en nuestros cubos. Entonces, en este caso, tenemos el número 1. Entonces, un minuto, cuántas veces tuvimos el minuto, y nosotros y en nuestro conjunto de datos de este lado, 51 veces. 2 minutos o hasta 2 minutos, tuvimos 30 de esos 3 minutos, 31, 4 minutos, 19, 5 minutos, 26 minutos, 18, 7 minutos, 14, 8 minutos, 14, 9 minutos, 1810 minutos, y se podía ver que comenzaba a bajar. A medida que nos acercamos a esos números más altos. Así que había muchos de ellos, se puede ver que están en la parte inferior. Así que el tiempo entre llegadas. Tendemos a tener un grupo que está en el lado más corto cuando las cosas siguen esta distribución exponencial. Y luego tenemos algunos que tardan mucho más en los intermedios, y así es como puedes imaginar lo que está sucediendo con nuestra curva. Entonces vamos a decir, bueno, también puedo representar esto en términos de un porcentaje del total. Así que estas bandas de frecuencia, si la sumo, deberían sumar el número de conteos que hicimos aquí. El número de clientes que analizamos instaló el tiempo intermedio, que fue de 300. Así que eso parece correcto. Y así puedo dividir cada uno de estos por el total de 300. Así que 51 más de 300, ups, espera un segundo. 51 sobre 300 nos da el punto nos da el punto 1, 7 o 17 por ciento. Así que vamos a poder representar esto como un porcentaje que también, que es lo que se va a representar cuando hagamos la distribución exponencial real. Y eso es mostrar ese cálculo. Bien, entonces podría hacerlo, puedo hacerlo de esta manera, X es igual a las llegadas durante un minuto. Y esta vez usemos nuestro punto X, pon realDiasty. Así que ahora voy a hacer lo mismo, no usando nuestros números generados aleatoriamente, que representan que realmente salimos con un cronómetro. Pero ahora vamos a hacer la curva suave usando nuestro exponente punto dest. Donde solo voy a tomar la X aquí, vamos a tomar la lambda, y luego vamos a tomar la acumulativa, no va a ser acumulativa, así que ponemos un 0. Así que ahora vamos a trazar esto con nuestra curva real, que es similar a la que nos está dando, nos está dando los porcentajes, ¿verdad? Porque cuando uso esta curva, no voy a obtener una frecuencia real, porque debido a que estamos viendo los porcentajes. Así que tendría que, ya sabes, similar a esto, ¿cuál es la probabilidad de que tengamos un minuto y luego si lo hiciera 300 veces, pensarías que 300 veces el punto 1411 sería la frecuencia real. Ya sabes, de ello. Es por eso que necesitas el porcentaje que tenemos, para que podamos comparar allí. Y esto es lo que obtenemos cuando obtenemos la curva suave o la curva generada a partir de nuestra función, ¿verdad? Y puedes compararlos. Así que si este es el 1, estos son los versículos 1, 2, 2, 3, 3, 4, 4, 5, 5, 5. Y como pueden ver que hay algo similar, y si tuviera que trazar esto, estos son los tiempos entrellegadas de nuestro conjunto de datos real, trazando esto en un histograma que se ve así. Y se puede ver que se aproxima a la forma que esperaríamos. No es perfecto, por supuesto, porque no generamos, sólo generamos 300 números. Aquí, aquí está, aquí está con otro tipo de gráfico. Y luego, si lo miro en comparación con la curva real, la curva real, que es la curva azul, en este caso, por lo que la curva azul es una curva suave y agradable, en comparación con la curva generada aleatoriamente, podemos ver que se aproxima a lo que esperaríamos de la distribución exponencial. Entonces, la idea general con estas situaciones de espera en la fila, ¿por qué sucede eso? Puedes ver por qué sucede aquí es porque tienes estos, los tiempos son a menudo cortos, los intervalos a menudo son cortos, pero luego tienes algunos de esos intervalos que son los intervalos largos, ¿verdad? Y eso es lo que se le da a ese tipo de forma característica. Lo que sucede a menudo en estas situaciones de espera en la fila. Así que si estuvieras en una, si es así, si vieras los puntos en la distribución en una situación de cola en espera, entonces, de nuevo, a menudo pensarías que si tomaras el exponencial el tiempo entre eso, seguiría. Ya sabes, este tipo de forma característica exponencial también.