 Estadísticas y Excel Hamlet, Harry Potter y Estadísticas obtuvieron datos. Vamos a meternos en el con las estadísticas y el coeficiente intelectual. Así que no estás obligado a hacerlo, pero si tienes acceso a esta nota en línea estamos ubicados icono a la izquierda al lado de una nota y presentaciones de Excel presentación en el número 1010, Hamlet, Harry Potter y Estadísticas. También estamos intentando cargar nuestras transcripciones en OneNote, para que pueda ir a la pestaña ver, use la herramienta lector inmersivo. Y si lo desea, puede cambiar el idioma al idioma que elija y leer o escuchar las transcripciones en ese idioma, versión de escritorio de OneNote. Aquí pensando en cómo podemos organizar los datos para que podamos extraer algún significado de esa información de esos datos. Ahora tenga en cuenta que, por supuesto, cuando tenemos diferentes tipos de datos, y tenemos diferentes objetivos con esos datos, vamos a utilizar diferentes herramientas para organizar los datos de diferentes maneras. Sin embargo, no importa el objetivo, no importa el tipo de datos que tengamos, generalmente nos gustaría ordenar los datos de diferentes maneras. Así que podemos obtener diferentes ángulos, diferentes perspectivas sobre esos datos. Porque si miramos algo desde diferentes ángulos, es más probable que obtengamos una imagen más completa de lo que está sucediendo, que si miramos algo desde un ángulo en particular. Ahora, por supuesto, todos los ángulos que miramos podrían no tener el mismo peso, puede haber un ángulo particular que miramos, que da una mejor imagen que si miramos algo desde un ángulo diferente, pero si juntamos todos los ángulos, generalmente será una mejor imagen más completa que sólo una vista en particular. Bien, aquí tenemos la obra de Shakespeare Hamlet. Y lo que hemos hecho es simplemente sacar las palabras, y hemos enumerado las palabras y la frecuencia con la que aparecen en la obra. Ahora, primero, por supuesto, esto es simplemente para señalar que ahora tenemos una lista de datos, una lista de palabras y con que frecuencia aparecen. Y claramente, para hacer la obra de Shakespeare de Hamlet, esas palabras tienen que ser ordenadas de una manera muy particular. Así que uno pensaría que el genio de Shakespeare no está simplemente en seleccionar las palabras que usan, aunque eso sería importante, pensaría, sino también, va a haber una gran importancia en el orden de las palabras. Si pensamos en los datos como las palabras, el orden de las palabras, será muy importante llegar a un resultado final, como Hamlet. No podríamos, no podríamos simplemente juntarlos al azar, posiblemente chatear GTP podría hacerlo ahora mismo en este momento, pero tendrías que tener algún tipo de inteligencia, ya sea humana artificial, para juntar las palabras con el fin de hacer un buen poema, o jugar o lo que sea que estemos creando. Sin embargo, también podemos ver esto en términos de otra forma de ver la obra de Hamlet, que a menudo es realmente útil en diferentes campos el inglés y la literatura, por ejemplo, porque, quiero decir, si podemos enumerar todas las palabras que aparecen y ordenar las palabras, entonces podemos hacer preguntas como, bueno, ¿qué palabra es más? Es realmente importante que ese señor fuera la palabra más importante, podemos extraer algún significado de las palabras que están aquí, podríamos decir, oye, bueno, si señor es el más grande, ¿cuál es la palabra que se usa más, entonces posiblemente, ya sabes, la mayor parte de la obra, podemos adivinar dónde se desarrollará la obra en un entorno cortesano y todo eso, donde hay muchos señores alrededor y todo eso. Y de nuevo, puedes hacer las preguntas es que es un componente clave para hacer un tipo de obra muy memorable, y puedes continuar, ya sabes, diferentes tangentes desde la organización de esta información de esta manera, también he visto una organización de los diferentes tipos de tropos o herramientas retóricas que usa Shakespeare también. Y esa es otra lista que podría ser bastante interesante de ver para las personas que están tratando de perfeccionar sus propias habilidades, habilidades retóricas, y todo eso, podrían decir, bueno, ¿con qué frecuencia sabes que el mejor dramaturgo usa estos diferentes tipos de herramientas retóricas? ¿Y por qué podría ser interesante también, también hay algunos casos en los que no sabemos quién escribió algo en particular, muy a menudo, como si miras los textos bíblicos, tienen preguntas en términos de quién escribió este artículo en particular, o cuando nos gusta la gente que escribió los favorolas papers y demás. No sabemos quién escribió realmente documentos particulares, a veces la forma en que pueden hacer una conjetura educada sobre eso es que pueden enumerar la cantidad de palabras que aparecen y dicen, bueno, esta persona en particular tiende a usar estas palabras más o usar estos trucos retóricos más que estas frases más que otra persona. Y esa puede ser una forma de determinar quién escribió qué, así que incluso algo como una obra de teatro, ya sabes, podemos verlo desde diferentes ángulos. Y posiblemente podamos extraer algún significado de ello. Y depende de cuál sea nuestro objetivo, ¿cuál es nuestro objetivo? Si nuestro objetivo es decir, ¿quién escribió esto realmente? Porque no sé, entonces podríamos ordenarlo de diferentes maneras. Si nuestro objetivo es decir, hmm, ¿puedo ver esto de diferentes maneras? Y tratar de decir que, ya sabes, qué, qué, qué más puedo tirar para hacerme un mejor jugador, cierto, o algo así. Y de nuevo, podríamos ordenar los datos de manera diferente para tratar de entender, ya sabes, cómo se están armando. Entonces, sí, si tomamos estos datos, entonces, por supuesto, lo primero que vamos a hacer, por lo general, si solo contamos todas las palabras, podría no ser una orden, a primera vista, ¿verdad? Podría ser una mezcla aleatoria de palabras, podríamos haber ordenado las palabras en orden alfabético. Pero lo siguiente que pensaría que haría con casi cualquier tipo de datos, es ordenar los datos de menor a mayor o de mayor a menor. Entonces, en este caso, claramente, uno pensaría que querríamos la palabra más alta, así que estamos viendo cuál es nuestro objetivo, si es mejorar nuestras habilidades como poeta, o tratar de averiguar quién es quién está escribiendo qué es. Está realmente escrito por Shakespeare o algo así, podríamos primero querer lo que es, cuál es el que se va a usar más, y tratar de extraer, ya sabes, algún significado de eso. Así que eso suele ser lo primero que haremos. Ahora, una vez que tienes esto, es, es útil, porque puedes mirar estos datos y decir, está bien, puedo obtener algún significado simplemente de esta lista de datos. Pero si tuviéramos una gran lista de datos, entonces podría ser más difícil extraer significado de esos datos. Por lo tanto, el siguiente paso que hacemos a menudo es crear una representación pictórica de los datos. Y quiero enfatizar una y otra vez, que la representación pictórica no es simplemente emblutecer los datos para las personas que no tienen una mentalidad estadística, debido a que la imagen va a activar otro ángulo que estamos viendo los datos, esta imagen está diciendo lo mismo que esta tabla. Y puedo, puedo extraer el mismo tipo de significado de este conjunto de datos en particular. No es un conjunto de datos demasiado complejo. Pero aún así, la imagen me da una mejor, ya sabes, una representación pictórica, que es un ángulo diferente para mirar. Y por lo general aparece un poco más con la imagen. Y si tenemos conjuntos de datos más complejos, entonces algunos conjuntos de datos, la imagen claramente es la única forma en que podemos comprender los datos para poder evaluar lo que está sucediendo. Así que ahora tenemos la imagen. Ahora bien, esto en Excel es lo que llamamos una barra, un gráfico de barras. Así que es solo su gráfico de barras estándar. Entonces, lo que está sucediendo en los ejes X, solo tenemos la lista de las palabras y solo enumeramos todas las palabras. Y luego en la Y, tienes cuántas veces subiendo el eje Y, cuántas veces han aparecido. Y luego, claramente, cuando miramos las barras a 28, está el 228. Si vamos a la mirada, tenemos 49, que aparece aquí abajo, alrededor de esa barra alrededor de la barra 50, así que obtenemos una buena representación pictórica. Así que el gráfico de barras es bastante agradable cuando tienes algo en el eje X que podemos graficar fácilmente en el eje X, echaremos un vistazo a los datos más adelante, donde tenemos datos numéricos, posiblemente en un eje X, y es menos fácil para nosotros usar cada uno de estos, cada uno de estos puntos de datos como un punto en el eje X. Y es por eso que vamos a usar básicamente un histograma, lo cual puede ser un poco confuso porque se parece a un gráfico de barras. Y en realidad podemos crear un histograma usando la herramienta de gráfico de barras en Excel que también veremos más adelante. Pero ese es el precursor de eso ahora, si hicimos lo mismo con otros textos como Harry Potter, esto es con Harry Potter 9.5. Estas son las palabras más utilizadas en la serie, las palabras más utilizadas en la serie, así que las busco en línea, dicen que estas son las palabras más utilizadas. Ahora ten en cuenta que si entraste y cuentas todas las palabras que aparecen en Harry Potter y miraste esto, podrías decir que está bien, ahora tengo esto. Esta información podría no ser la más útil porque tengo muchos de esos, muchos anuncios, muchos tos, así que podrías decir oye, como si necesitar ordenar mis datos para ser un poco más receptivo, posiblemente estos no lo sean, así que ahora han dado otro paso y dijeron frecuencia de visualización de palabras sin parar y toda la serie. Ahora no quiero entrar en detalle sobre las palabras sin parar y que son las palabras separada, pero lo que hicieron es, por supuesto, dijeron, oye, mira, quiero extraer estos datos en particular para obtener una reunión en particular. Sobre Harry Potter, posiblemente el estilo de escritura de Harry Potter, posiblemente alguien esté tratando de imitar tal vez el estilo de escritura de Harry Potter para tener un éxito similar con el o algo así y sacan esta información y dicen, ya sabes, tal vez esas palabras no me están ayudando tanto con mi objetivo. ¿Qué pasa si trato de encontrar un término de decir, voy a mirar este conjunto de datos y tratar de determinar palabras sin parar y tratar de extraer esas palabras en particular y posiblemente, entonces obtendré un conjunto de palabras que son más significativas? Así que pueden ver cómo están usando técnicas aquí para recortar el conjunto de datos de acuerdo con los objetivos que tenemos. Así que aquí, entonces sucedería lo mismo, queríamos ordenar las palabras, posiblemente por la frecuencia, la frecuencia con la que aparecen, este es solo otro formato del gráfico de barras. Así que hicimos lo mismo. Tenemos la lista de palabras aquí, y luego, en lugar de tener el gráfico de barras con el eje X, tener las palabras y luego los recuentos en la Y, ahora tenemos el eje X que tiene el recuento de las palabras, y el, las palabras en la Y. Así que ahora, por supuesto, este es el recuento más alto de los 51 que se alinean de esta manera. Entonces, cuando trabajamos en Excel, podemos hacer esto con bastante facilidad. Podemos, ya sabes, cambiar. Y claramente, cuando miramos este tipo de gráficos, hay un par de objetivos. Por lo general, un objetivo es como podemos mirar pictóricamente para que podamos obtener más significado de ello. Y luego, cuando lo miras desde el punto de vista de la presentación, estás tratando de darle estos datos a otra persona. Luego, a veces, hay otro objetivo, por supuesto, de puedo hacer esto un poco más atractivo, posiblemente cambiando los colores solo por el atractivo de ello, posiblemente cambiándolo de un gráfico de barras que es más estándar que el pop que la gente ha visto más a menudo para girarlo de lado para que no lo haga. Elimine cualquier información de los datos, pero es más atractivo visualmente, o al menos diferente tal vez. Así que lo mismo aquí. Ahora sacamos estas palabras, y esta era su cuenta sin esas palabras, hicimos otro gráfico con él, y ya sabes, tenemos un color diferente ahora, que estas son cosas que puedes hacer en Excel, que practicarás si vas al lado de Excel de las cosas, y construiremos este también. Obviamente, si miramos este recuento de palabras, vemos que los nombres se usan Run, Hermione, doble puerta miró al profesor Hagrid Forreida del Tiempo, Ojos. Así que es una lista interesante. No estoy seguro exactamente de lo que sacaría de eso, pero claramente, hay muchas conversaciones en las que hablan entre sí y les gusta decir el nombre del otro, supongo. Entonces, cuando hablas en una novela, tienes que mencionar cuando hablan entre sí que los nombres de las personas son un montón de veces. No sé. No sé qué extraes de eso, no soy novelista.