 Estadísticas e histogramas de Excel con datos relacionados con el automóvil, datos obtenidos, vamos a meternos en el con estadística si coeficiente intelectual. Por lo tanto, no es necesario, pero si tiene acceso al libro de OneNote, estamos en el histograma de presentación de OneNote 1065 de lado izquierdo con la pestaña de datos relacionados con el automóvil, también estamos cargando transcripciones en OneNote, para que pueda usar la herramienta lector inmersivo, cambie el idioma si así lo desea, y lea o escuche la transcripción en varios idiomas diferentes utilizando las marcas de tiempo para vincularse a las presentaciones de vídeo, versión de escritorio de OneNote. Aquí continuando con nuestro tema de tomar datos y hacer representaciones pictóricas a partir de ellos, la herramienta principal, esta vez es el histograma, por lo que tenemos datos relacionados con el automóvil, si desea buscar conjuntos de datos con los que pueda practicar, le sugerimos que busque cago darkhamcle.com, nuestro primer conjunto de datos tiene el nombre de los vehículos en el lado izquierdo y las millas por galón. Si tuviéramos que poner esta información en Excel, por ejemplo, primero querríamos ordenar la información por las millas por galón, porque a menudo, primero tendremos la información por el nombre, pero si tenemos una gran cantidad de datos, entonces eso no nos dará lo suficiente para extraer realmente el significado de los datos. Muy a menudo, es posible que deseemos ver otras herramientas, como calcular el promedio y la mediana. Si tuviera que hacer esto en Excel, el promedio tiene una función promedio, el promedio o la media, sería igual al promedio, y luego simplemente seleccionando los datos nos dará el 24. En este caso, ¿qué hace ese promedio? Bueno, es tomar toda esta columna de números, resumirlos y luego dividirlos por el conteo de esos números. Y luego la mediana, recordarán, está tomando el que está en el medio, al igual que Rocky, el entrenador de boxeadores le dijo que golpeara al que estaba en el medio, si ves a tres de ellos por ahí. Así que tomamos la mediana. Y en Excel, la función sería simplemente igual a la mediana o al segundo cuartil. Todo esta es la función más común, y tienes el 23. Así que eso sería simplemente elegir el que está en el medio. Así que esos son algunos datos matemáticos, representación pictórica, entonces podrías tener el histograma. Entonces, en Excel, crear el histograma, generalmente tan fácil como seleccionar todo el conjunto de datos, y luego insertar el histograma, Excel y luego rellenar los cubos. Así que ahora estamos viendo las millas por galón que caen entre 9 y 13, y luego 13, a 1616, a 2020, a 24, y así sucesivamente. Ahora, si miramos este histograma, no es exactamente como un histograma en forma de campana, ¿verdad? Se está inquinando hacia la derecha, lo que significa que tenemos la cola sucediendo aquí hacia la derecha, de modo que cuando llegamos a 46 a 50 millas por galón, nosotros, ya sabes, este podría estar, ya sabes, un poco fuera del rango normal. Entonces, ¿cuál es nuestro objetivo? Por lo general, cuando miramos estos datos, queremos tener una idea del punto central, si piensas en esto como un tambaleante, donde se centra. Y entonces, ¿cuál es la propagación? ¿Qué eso va alrededor de ese punto central? Y es posible para nosotros aproximarnos a esto con una curva o una línea de algún tipo que podamos predecir que podemos hacer matemáticamente, no siempre, será así, cierto, esto no parece aproximarse exactamente a algún tipo de curva que podamos hacer fácilmente con una función. La razón por la que nos gustaría hacer una función con una ecuación matemática, si fuera posible con un conjunto de datos es que eso nos da más poder predictivo, porque ahora tenemos, ya sabes, una ecuación en la que podemos conectar números, lo que sería genial, pero no todos los conjuntos de datos cumpliremos con lo que nos gustaría allí. Echemos un vistazo a otro. Estos son otros datos relacionados con el automóvil. Así que tenemos el nombre del coche, y luego los cilindros, así que el número de cilindros. Entonces, si tuviera que tomar el promedio, esta es la mediana, y he agregado el máximo y la media, estos son nuestros cálculos promedio, o cálculos normales que harían casi todo el tiempo bien, obtuvimos nuestros datos, podríamos ordenar los datos, así que ahora tengo los más altos a la derecha. Y luego bajan al número de cilindros, hasta tres. Entonces, claramente, cuando miramos el número de cilindros, observe el conjunto de datos, esperan números enteros claramente, ¿verdad? Estamos hablando de cuántos cilindros hay en un automóvil. Así que es de esperar que lo sepas, en algún lugar entre dos y ocho aquí, pero el alto por lo que no tenemos tanta variación de datos, y esto podría darnos algunas formas diferentes en las que podría ser más fácil crear los gráficos, gráficos, pero primero, podemos calcular el promedio. Así que podemos resumir esto y tomar el promedio, que es 5. Ahora, tengan cuenta que cuando pensamos en 5, es posible que no tenga muchos vehículos que tengan 5, correcto, no tiene ningún vehículo, hay 3 que tienen 5 cilindros. Pero normalmente, pensarías ir, ya sabes, de 4 a 6, generalmente. Así que recuerde que ese promedio a veces puede ser un poco engañoso dependiendo del conjunto de datos. Así que tenemos que saber de que estamos hablando, la mediana, la del medio, es 4, este es el cálculo para la mediana, si tuviera que seleccionar ese conjunto de datos, el máximo es tomar este conjunto de datos y elegir el valor más alto, la fórmula para eso en Excel es simplemente igual al máximo, y luego el conjunto de datos, y eso son 8, y luego el mínimo es 3 igual al mínimo, y Excel le dará el mínimo, estas son fórmulas comunes en Excel, la fórmula más común, por supuesto, la función de suma, pero luego la otra función es un medio promedio bastante común. Y luego lo menos común, pero a menudo bastante útiles conocer es el máximo y el mínimo. Entonces, observe que podemos, podemos tener una representación gráfica con bastante facilidad en Excel aquí, porque sabemos que cuando pensamos en los cilindros, no tenemos como 1.2, o, ya sabes, no tenemos tanta variante, sabemos que va a estar en algún lugar en este caso entre 1 y 8. Por lo tanto, podría ser útil mirar esto en un formato de tabla para ver cuántos pueblan entre 1 y 8, es una fórmula fácil de hacer en Excel porque podemos usar la fórmula Kaunith para hacerlo. Entonces, el conteo, si sería contar si el rango, así que estamos tomando este rango. Y luego decimos, el segundo es el conteo de criterios. Si este es un 1, ahora ninguno de ellos tiene 1 para contar, si es un 2, ninguno de ellos tiene un 2, 3, hay 4 de ellos. 4, hay 204, 7, 3. Así que claramente, ese es el número 5 más grande, aunque ese fue el promedio no es el que se esperaba que tuviera un resultado solo porque sabía un poco sobre cuántos cilindros tiene un automóvil, y luego 684 y 804. Aquí hay otro recuento, si sólo se recoge esta celda, la misma fórmula, tomando el rango de datos de la etapa. Entonces, si tuviéramos que construir un histograma con esto, si simplemente seleccionamos estos datos y creamos un histograma. Luego crea nuestros cubos, 3 a 4, 4 a 5, 5 a 5, 5 a 6. Ahora, podemos ajustar estos cubos aquí abajo, porque realmente querríamos que fueran solo de 1 a 8, posiblemente. Pero a veces, cuando creas un histograma en Excel, eso puede ser un poco complicado. Para tratar de obtener esto, este eje X sea exactamente lo que quieres, lo que significa que me gustaría que esto fuera solo 1234 a 8, porque quiere que tenga un rango, así que eso puede ser un poco complicado. Y así, cuando ves este tipo de datos, a veces puede ser más fácil decir que me gustaría un histograma. Pero pero en lugar de hacer el histograma, sólo necesitaría un gráfico de barras. Por lo tanto, podría ser más fácil hacer esta tabla y luego crear su histograma a partir de un gráfico de barras basado en esta tabla en lugar del conjunto de datos. Así que podemos venir aquí y decir que este es otro histograma básicamente creado, en lugar de estos datos de esta pequeña tabla que armamos, que a veces es más fácil de armar que otras. Y este caso, porque si tuviéramos un rango entre un 0 y uno de un montón de decimales, y no sabemos qué es, entonces la lluvia, va a ser un poco más difícil. Necesitamos los rangos, necesitamos los cubos, pero si tienes algo como esto, ahora puedo decir oye, mira, sólo necesito 8, 8 cubos, cierto, que estén bastante bien definidos. Así que puedo crear una tabla y luego hacer nuestro histograma en este formato. Así que ahora acabo de llegar a un 23, 45, 67 y octavo. Y así, y este podría ser un formato un poco más claro para que lo pongamos. Reconocido simplemente reconociendo cómo se ven los datos y haciendo un tipo ligeramente diferente de histograma o usando una herramienta diferente. Podríamos recortar esto aún más y decir, oye, mira, realmente no necesito a los que no tienen nada porque sólo tengo unos pocos factores. Así que podríamos reducir el conjunto de datos a algo como esto. Y luego y luego podríamos ponernos un poco elegantes, nos pusimos un poco elegantes con los colores aquí. Formatos tan diferentes. Para el histograma. Echemos un vistazo a otro, y en este caso tenemos el nombre y la potencia. Entonces, en contraste con los caballos de fuerza, observe que la potencia puede variar mucho más, así que no puedo. Así que va a ser más difícil usar las dos noticias, el segundo método que vimos la última vez. Entonces, la idea general, tenemos el nombre, y luego tenemos la potencia, podríamos tratar de clasificar la potencia de baja a alta o de alta a baja. Y eso nos dará una idea de la potencia, pero nos gustaría verlo, ver otra información relacionada con él. Aquí están nuestros cálculos estándar, hagámoslo esta vez, de esta manera, el promedio tomando el promedio, que es tan malo sumando todo esto y luego dividido por 1234, el conteo correcto. Y luego vamos a tomar la mediana, tomarla del medio, al igual que Rocky, el entrenador del boxeador le dijo que golpeara al del medio. Esa es la que vamos a hacer, vamos a golpear la que está en el medio, y esa es la función mediana. Mediana, tenemos el máximo, esa es la más alta, la función para hacer eso en Excel es simplemente igual al máximo, es decir, tomar el número más alto en este conjunto de datos. Y el mínimo simplemente será igual al conjunto de datos de corchetes mínimos, tome el número más bajo en el conjunto de datos. Entonces, cuando miramos los caballos de fuerza, tenemos el max 230, el min 46, el promedio 104 y el del medio 994. Ahora, solo mirando estos números, tengan cuenta que, como si este máximo fuera un valor atípico, es como 230, ya sabes, ahí, no es como si estuviera ahí fuera en sí mismo. Pero recuerde que los valores atípicos en el extremo superior o inferior podrían tener un impacto en el promedio frente a la mediana, entonces, si ves una gran diferencia entre el promedio y la mediana, no hay una gran diferencia aquí. Pero si ves una gran diferencia, entonces tu proceso de pensamiento estaría bien, tal vez haya algunos valores atípicos que están sesgando el promedio que necesitas vigilar. Entonces, si miro una representación pictórica de un histograma, tenemos algo que está sesgado hacia la derecha, porque tenemos el extremo de la cola a la derecha, es decir, los que están aquí en 226 a 244, la alta potencia, solo hay unos pocos de ellos aquí, cierto, así que tenemos una especie de medio, eso está en algún lugar por aquí, justo allí. 104 es el promedio. Así que el punto medio, si tuviera que tomar un tambaleante, ya sabes si tratar de ponerlo como en el medio. Así que esta cosa se equilibra, ya sabes, de izquierda a derecha en el histograma, y ahí está nuestra propagación de los datos, así que claramente, esto va de los cubos bajos, 46 a 64, p64 a 80, a 82 a 100, p100 a 118, y así sucesivamente. Ahora tenga en cuenta que es posible para nosotros crear un gráfico de barras y recrear estos datos. Pero no es tan fácil como con los últimos datos porque no tengo simplemente de 1 a 8 cubos diferentes que están bien definidos, porque ahora tengo números, desde estos números, necesito un cubo, necesito algo que vaya desde no puedo enumerar todos los números desde 46 hasta 244. Eso sería que el gráfico sería inútil. Así que tengo que tener algún tipo de rango en los cubos. Así que eso significa que si tuviera que tratar de hacer un histograma de gráfico de barras, sería un poco más difícil porque entonces tendría que hacer los rangos yo mismo y luego usar un poco más complicado, todavía es factible. Pero tienes que hacer un cálculo un poco más complicado para recoger los números que están entre un cierto rango, esa sigue siendo una herramienta útil para hacer. Lo haremos en Excel en futuras presentaciones, porque a veces es posible que desee un gráfico de barras incluso cuando esté usando los rangos. Porque es posible que, por ejemplo, desee tener dos gráficos de barras uno encima del otro y eso podría ser más fácil de hacer. Luego, con los histogramas, es posible que tenga un poco más de flexibilidad. Si crea su propia tabla en otras palabras, y luego crea un gráfico de barras con ella, entonces lo hace con la herramienta de histograma. Así que vamos a echar un vistazo a ellos en futuras presentaciones.