 estadísticas y Excel generando datos de práctica en Excel. Prepárate, respirando profundamente, aguantando durante 10 segundos esperando una exhalación suave y relajante. Aquí estamos en una hoja de cálculo de Excel en blanco, vamos a armar un conjunto de datos solo dentro de Excel. Así que podemos usar esos datos para aplicar y practicar nuestras herramientas estadísticas. En otras palabras, muchas veces la gente podría estar pensando, me gustaría practicar mis herramientas de análisis estadístico dentro de Excel, como la función promedio, la función mediana, los cuartiles, me gustaría ir a mi pestaña de inserción en la parte superior, en el grupo gráficos, y luego insertar un histograma o un cuadro y bigotes, pero no tengo ningún dato para hacer eso, y muchas veces, eso es en realidad un punto de parada para las personas. Sin embargo, no debería ser porque hay muchos recursos diferentes que podemos usar para obtener los datos, voy a volver a la pestaña Inicio como mi método predeterminado, por supuesto, es conectarse y obtener datos que podemos aplicar estas herramientas analíticas a otro método es solo hacer algunos datos en Excel, así que podemos practicar las herramientas con las que queremos practicar. Y hay otra ventaja además de que es fácil hacer un conjunto de datos dentro de Excel. Y es que cuando descarga un conjunto de datos, lo que está tratando de hacer es aplicar sus herramientas estadísticas para obtener información sobre ese conjunto de datos, sin embargo, si realmente crea su propio conjunto de datos, a medida que crea el conjunto de datos, podrá comenzar a visualizar lo que las herramientas estadísticas le darán como resultado de ese conjunto de datos. En otras palabras, palabras, si hago mi propio conjunto de datos, debería poder comenzar a visualizar como creo el conjunto de datos, como se verá el histograma y la caja y los bigotes, y entonces estás haciendo una especie de ingeniería inversa. Y de esa manera, lo que podría darte una mejor comprensión a veces. Así que creo que es una buena práctica hacerlo por esa razón, también. Así que estamos en una hoja en blanco. Aquí abajo, estamos enfocados en 175, voy a acercarme un poco más manteniendo presionada la tecla control y hacia arriba en la rueda de desplazamiento del mouse. Así que ahora estoy en 235, normalmente comenzaré formateando toda la hoja, esto es lo que hago cada vez, porque de lo contrario, te confundirás, verdad, así que quiero formatear toda la hoja. Primero, voy a seleccionar la computadora portátil triangular, o puedes seleccionar control a para toda la hoja, haga click derecho y formatee todas las celdas. Así que este es mi formato subyacente. Ahora suelo ir a la moneda y luego voy a los números negativos entre corchetes, voy a quitar el signo de dólar y voy a agregar los decimales de nuevo, los quité hace un segundo, pero los voy a agregar nuevamente. Así que vamos a empezar con decimales. Ahora, si comienza con decimales o no, dependerá del conjunto de datos con el que esté trabajando, si está redondeando los números, los decimales no son importantes, entonces puede quitarlos y luego solo agregarlos cuando sea necesario. Así que voy a decir que está bien, ese es mi formato subyacente. Y ahora, si necesito cambiar el formato en una celda en particular y convertirla en un porcentaje o algo así, entonces siempre puedo entrar y hacer eso para esa celda en particular. Muy bien, así que ahora vamos a, vamos a hacer nuestro conjunto de datos. Entonces, una de las formas en que podemos hacer esto es que podemos usar la función aleatoria. Así que podría decir que esto es una función, voy a decir igual, estoy en la celda A, por supuesto, la celda A1 es igual significa que vamos a tener una función y voy a escribir RAND. Y entonces es RAN, de, seleccionando eso y luego, si lo cierro, noto que ni siquiera hay un argumento aquí, solo generará un decimal aleatorio. Así que ahí está mi decimal aleatorio, y luego puedo seleccionarlo y puedo arrastrarlo hacia abajo, poniendo mi cursor en el controlador de relleno, y el controlador de relleno es ese pequeño cuadrado. Entonces, si pongo el cursor en el controlador de relleno, puedo arrastrarlo hacia abajo, y si hago doble clic en cualquiera de estos, ahora ha puesto esa misma función aleatoria hasta el final, ¿verdad? Lo recalcula. Entonces, si desea un bloqueo, si después de hacerlo, una vez que desee bloquear esta función, para que no siga cambiando. Luego puede copiar su función aleatoria, o seleccionarla y hacer clic derecho y copiarla y luego ponerla en otro lugar, hacer clic derecho y pegarla solo los números. Así que ahora aquí, puedes ver si miro la barra de fórmulas, esta es solo números, esta sigue generando diferentes resultados aleatorios. Y luego, si quiero que estos resultados aleatorios sean algo más que decimales, entonces puedo multiplicarlos bien, puedo decir, está bien, bueno, y si lo quiero por cien, esto vez es esto, y, ya sabes, ahora es hasta ahora puedo, ya sabes, podría decir que esto es igual al que está por encima, y luego puedo copiar eso. Entonces puedo copiar esto, ¿verdad? Así que ahora tengo, ya sabes, un conjunto de números generados aleatoriamente entre cero y cien. Y esencias, creo que esa es básicamente la idea general de esto. Entonces, pero obviamente, cuando puedo, entonces puedo aplicar, y puedo, si quisiera cambiar esto, ya sabes, el doscientos o algo así, entonces puedo hacer eso, o mil, puedo, puedo usar esa herramienta generadora aleatoria. Así que al menos me da un conjunto de números con los que puedo comenzar a jugar, cierto, para que pueda comenzar a hacer mi función promedio, para que pueda ir aquí y decir, es igual al promedio, y ahí está mi función, voy a hacer doble clic en la función. Así que recuerde, cada vez que hacemos estas funciones, presiono iguales, escribo los corchetes de funciones y luego voy a seleccionar este rango. Y eso me va a ayudar a calcular el promedio, podría verificar que si quisiera hacerlo manualmente, correcto, podría decir, bueno, esto es igual a la suma. Así que ahora esta es la famosa función sum tengo que saber que una de las funciones más importantes es todo esto. Y luego puedo dividirlo por el número, puedo hacer eso con una función de conteo igual a conteo, quiero que cuentes el número, ahí está mi conteo de estos, ¿cuántos hay debería ser ocho? ¿verdad? Puedo verlo aquí mismo. Y luego puedo dividir esto por igual, voy a golpear. Así que ahora es igual a lo que está en G2, G2, dividido por este, G4. Así que tomar el 311.09 dividido por 8, o tomar lo que está en G2, dividido por lo que está en G4 nos dará ese promedio. Así que, de nuevo, podemos jugar con estos números. Ahora, debido a que los generamos al azar, comenzamos a pensar, podemos pensar en que es exactamente lo que vamos a obtener como resultado. Así que déjenme darles algunos ejemplos más de esto, voy a, voy a limpiar esto, voy a seleccionar poner mi cursor en 1, y estoy arrastrando a G8. Y observe que este rango de celdas, puedo nombrar con sólo dos celdas, es de 1 a G8. Y debido a que todo es una caja grande, sólo necesito esas dos celdas, no necesito cuatro puntos para nombrar este rango, sólo necesito dos puntos. Eso es así que te lo encuenta, porque eso es lo que harán las referencias de celdas. Así que voy a eliminar esto. Y digamos, digamos que quiero números aleatorios entre un cierto conjunto de números, digamos que sólo quiero números generados aleatoriamente entre 1 y 5, escriba sólo uno de cada cinco. Así que voy a decir que esto va a ser igual RAND. Y luego entre RAND entre, y ahora tengo mis argumentos aquí. Así que quiero entre, ¿verdad? Esta es una retención de matriz RAND en segundo, RAND entre, este es el que quiero que se ejecute entre, tengo mi argumento en la parte inferior y superior. Así que el fondo, quería ir a 1, no quiero ir por debajo de 1, y luego, si golpeo una coma, eso me lleva al segundo argumento. Entonces, ¿qué tan alto quiero que llegue? Quiero que vaya a 5, y luego cierro los corchetes, CONTROL, SHIFT, CERO, ese es mi argumento. Así que debería darme algo entre 1 y 5 ahora, correcto, así que 1 y 5, me da un 3, o puedes hacerlo como 1 y hagamos 1 y 6, voy a hacer doble clic en él, ir al final. Y eso sería como un dado, como si estuviéramos tirando un dado, ¿verdad? Entre 1 y 6. Y ahora, si copio eso hacia abajo, y pongo mi cursor en el controlador de relleno, arrastre lo hacia abajo. Así que ahora tienes nuestros números entre 1 y 6. Ahora, todos estos son igualmente resultado como una tirada de dados, ¿verdad? Así que esperarías eso porque todos son iguales a los que vas a obtener si copio esto hasta el final, si lo hiciera un montón de veces, tendrías algo que se distribuirá de manera uniforme. Lo que voy a hacer ahora es introducir un histograma para tener una idea visual de la difusión de los datos. Hablaremos de histogramas más adelante. Pero por ahora, seleccionemos los datos. Así que puedo poner mi cursor en 1 y arrastrar todo el camino hacia abajo. Esa es una forma en que puedo seleccionar los datos. Y luego tendría que dejar que se cierre el desplazamiento de clic hacia arriba. Otra forma en que podemos seleccionar los datos es poner nuestro cursor sobre 1, mantener presionadas las teclas, control y mayús al mismo tiempo y luego la flecha hacia abajo en el teclado. Así que esa es una gran herramienta. No tienes que hacerlo de esa manera, pero si tiene muchos datos, eso podría ser útil. Ahora estamos en la parte inferior, estamos aquí abajo en la fila 59. Realmente no quiero ingresar el histograma aquí abajo porque si lo hago, estará aquí abajo en algún lugar y lo quiero en la parte superior para que no tengan que arrastrarlo de nuevo a la parte superior. Entonces, para volver a la parte superior sin anular la selección de los datos, podría hacer con una pulsación de tecla manteniendo presionada la tecla control, eso y luego el retroceso, no eliminar, sino retroceso. Así que ahora que los datos están seleccionados, estoy en la parte superior de la hoja. Ahora voy a ir a la pestaña insertar en la parte superior, voy a ir a los gráficos, y luego vamos a ingresar un histograma. Así que presione el histograma. Y ahí vamos, ahora, esto nos da una especie de cubo y resumir los datos en cubos. Así que nos da un valor predeterminado de entre 1 y 2.4, quiero tener una extensión de solo 1 ya que solo hay 5 conjuntos de datos. Así que voy a hacer doble clic en estos datos, hablaremos más sobre cómo hacer esto en el futuro. Pero voy a cambiar este contenedor. Y voy a cambiarlo a solo 1. Y ahí lo tenemos. Así que ahora que tienes los contenedores ahora, podríamos ser un poco más específicos y podríamos haber sido capaces de entrar como un gráfico de barras ya que solo hay 5, 5 elementos aquí. Pero la idea general es que tienes una dispersión de los datos, que esperarías que fuera algo uniforme, porque si tiras un dado un montón de veces, entonces cada número esperarías que aparezca de manera algo uniforme. Esa es la idea general aquí, ¿verdad? Entonces, cada vez que use un generador aleatorio, obtendrá, obtendrá números que esperaría, sin mirar a la propagación de los datos sería algo uniforme. Y por lo general, lo que estamos tratando de hacer cuando estamos tratando de hacer estadísticas es comparar algo que va a tener una propagación uniforme con algo que no tiene una propagación uniforme. Entonces, por ejemplo, si el dado estaba amañado, o algo así, y digamos eso, digamos que fue manipulado para tener un 6 muchas veces, correcto. Esperarías que obtuvieras un tipo de respuesta sesgada que tiene un sesgo hacia, ya sabes, el 6. Así que sigamos haciendo esta dieta al azar, y así sucesivamente. Así que ahora, así que ahora vas a decir, oye, ¿Hay algo mal con su dado, ¿verdad? Debido a que ahora estás sesgado allí, esperaría que fuera algo parecido. Pero hay un sesgo en ello. Y eso parece que parece extraño, ¿verdad? Es esto lo que se espera ponderado como lo que está pasando. Así que hablaremos más sobre eso más adelante. Pero puede hacerse una idea, como si crea sus propios conjuntos de datos, que tipo de resultado general sería en los datos. Ahora, hagamos esto de una manera diferente. Voy a, voy a eliminar toda esta fila, voy a poner mi cursor en la A, seleccionarlo, hacer click derecho y eliminar esa columna. Digamos que estamos hablando de salarios. Bien, digamos que estamos hablando de salarios, y yo digo que esto va a ser igual al azar entre ellos. Y digamos que vamos a decir que los salarios van a estar en algún lugar entre un mínimo de 60,000 y un máximo de coma de 80,000. Correcto, así que ahora si eso es 8,080,000. Así que ahora, si selecciono esto, me va a dar al azar entre allí, ahora estoy pensando que lo más probable, ya sabes, el medio estaría alrededor, ya sabes, 70,000 o algo así, ¿verdad? Esta es la parte superior e inferior. Así que esto no me daría una propagación que pensaría que sería algo normal, mentir, como una institución, pero al menos me dará un punto de partida, ¿verdad? Así que puedo decir, está bien, eso me da 77, 751. Ahora, si fuera a construir mi conjunto de datos, podría decir bueno, copiémos ese número generado al azar. Así que ahí lo tenemos, está bien, ahora, cada uno de estos, creo, es independiente del del que está por encima. Así que cada uno es como tirar un nuevo dado, ¿verdad? Por lo tanto, recuerde que si desea preservar este conjunto de datos, probablemente desee copiarlo y luego codificarlo. Así que digamos que tomo esto, este conjunto de datos, y digo, digo, está bien, copiémoslo y pongámoslo aquí, voy a pegarlo 123, pegándolo solo con los valores, porque cada vez que hago algo, cambia en el lateral, ¿verdad? Así que ahora este es el primero que hicimos, vamos a codificar por colores. Así que voy a ponerle un color. Y eso fue seleccionado al azar. Ahora, si hago un histograma basado en eso, seleccionando estos datos, incerte, histograma, y voy a mantener presionada la tecla control desplácese un poco hacia abajo, y vamos a eliminar esto. Y cambiemos el tamaño del cubo. Así que tamaño del cubo. Y voy a decir que el cubo es como un cambio de mil, digamos. Así que ahora me ha dado, ya sabes, un montón más de rangos y tienes esta amplia gama de rangos de cubos. Y, y cualquier número es igualmente probable que surja. Así que no tienes realmente un centro para los datos. ¿Qué sucede si quisiera intentar crear un conjunto de datos que tuviera un centro correcto? Podría decir, está bien, bueno, ese es el rango completo, creo que el medio, puedo crear otro conjunto de datos aquí, vayamos desde aquí y digamos que este va a ser rand. Y va a estar entre el medio, creo que va a estar entre, como 70, o digamos, entre, como 68000 y como 72000, cierto, eso va a ser como el rango medio. Puedo decir, está bien, copiemos eso. Y ahora que he agregado algunos que están en el medio, haré que sea verde claro. Y copiemos eso. Voy a copiar ese conjunto de datos. Y voy a poner, pegar, 123, solo los valores, para que no siga generando. Y ahora, si selecciono todo este conjunto de datos, podría tener algo que se aproximen más a lo que esperaría con un punto final central central, ¿verdad? Así que voy a ir a insertar gráficos, histograma. Y ahora podemos decir, bien, tomemos este conjunto de datos y digamos que se extenderá de 1000. De nuevo, 1000 en la propagación. Y ahora tienes algo, ya sabes, eso es un poco más, hacia el medio, correcto. Así que ahora tienes algo que está empezando a aproximarse a algo en el medio, digamos, digamos que lo arrastro aún más. Así que tienes más que está en esa sección central. Y luego voy a copiar esto, copiar esto, y pegarlo 123 hasta que todo esto sea verde. Y luego voy a hacer doble clic en este conjunto de datos. Y voy a arrastrar esto hacia abajo, hablaremos más sobre gráficos más adelante, solo estoy tratando de tener una idea. Para mostrar una idea, sabes cómo se ven tus diferentes conjuntos de datos ahora que tienes algo que se parece un poco más a que está centrado, ¿verdad? Así que este es solo un concepto general de cómo podemos generar nuestro propio conjunto de números dentro de Excel al que luego podemos aplicar nuestras herramientas estadísticas y como podemos, en esencia, realizar ingeniería inversa de algo como la creación de un histograma, por ejemplo, a medida que generamos nuestro conjunto de datos. Y podrías estar pensando, bueno, eso es hacer trampa, nos estás enseñando cómo hacer trampa, para que podamos crear un conjunto de datos que haga que el gráfico se vea como queremos que se vea. Pero no, no es hacer trampa, cuando estamos practicando tratando de entender algo como de construir un motor, para entender cómo funciona un motor, no es hacer trampa. Lo que queremos poder hacer es decir, oye, si puedo crear un conjunto de datos, que luego llenará un histograma, como el que imaginé en mi mente, entonces cuando aplique esas mismas herramientas estadísticas a otros conjuntos de datos, y cree histogramas, tendré una mejor comprensión conceptual de lo que realmente sucedió. Así que puedo tomar decisiones basadas en lo que está pasando, y esto a menudo es esclarecedor para las personas, porque las personas a menudo tienen conceptos erróneos de cómo se verán los datos, cuando los traza en un histograma. Como, por ejemplo, si trazaras estos datos aleatorios en la parte superior, y acabo de tomar una muestra aleatoria, eso es lo que básicamente está haciendo entre un cierto conjunto de números, o como cuando teníamos el 1 entre 1 y 6, y tomamos una muestra aleatoria entre 1 y 6, mucha gente diría, bueno, si hicieras eso un montón de veces, entonces pensarías que el histograma debería verse como una curva de campana similar a esta, menos como esta, que se parece más a una especie de línea recta. Y, y ese es el tipo de cosas que muestran una especie de desconexión, de lo que realmente está sucediendo. Entonces, si piensas de esa manera, si eso es lo que pensabas, dices, bueno, oye, debería parecer una curva de campana porque tomaste una muestra aleatoria. Entonces eso no es exactamente correcto. Hablaremos más sobre eso en futuras presentaciones. Entonces, por qué ese sería el cas, pero si puede llegar al punto en el que construye su conjunto de datos, y usted y usted pueden decir si esto va a resultar en una curva de campana, una distribución en forma de campana, o esta va a ser una distribución sesgada porque la construí de esa manera, sé dónde van a estar los valores atípicos. Bueno, entonces tienes una mejor idea de cómo leer el histograma porque lo has sometido a ingeniería inversa. En cualquier caso, profundizaremos en la creación de más histogramas en futuras presentaciones.