 Muchas gracias, Janine, por la bienvenida y bienvenidos a todos por este tutorial. Estoy arrancando yo, pero quien va a tomar la posta en unos minutos es Elio. Yo voy a estar en el trasfondo, en el chat, para responder cualquier pregunta, cualquier consulta que tengan. Y como decía Janine, si les da la conexión, si quieren, si pueden, pueden prender las cámaras, si no, está bien también. Vamos a tener momentos donde Elio va a ir mostrando cosas en la pantalla, compartiendo la pantalla. Nos somos de estudio, si no usan el estudio y usan una otra interfaz o usan una terminal, también está bien. Y la propuesta es que si quieren seguir a la par a Elio, a medida que va mostrando cosas, está buenísimo, sino también va a haber tiempo para que hagan algunos ejercicios que les vamos a proponer en grupos más pequeños para que pasos puedan sacarse las ganas de echarla entre ustedes. Otra cosa importante es vamos a hacer dos pausos, en el horario de estas tres horas, de cinco minutos cada una, vamos a tratar de hacerlo lo más rigurosos posible, en eso ahora la próxima pausa va a ser aproximadamente dentro de 50 minutos, o sea, cuando cinco minutos antes que se cumpla la primera hora de tutorial ir a segunda pausa, cinco minutos antes que se cumpla la segunda hora de tutorial. Espero que hayan podido seguir todas las indicaciones en esta página preparatoria, si alguien tuvo algún problema por favor avísenme por el chat, así activamos el plan B. Y a ver si la última cosa, estamos terminando de actualizar, se están subiendo las últimas detalles a la misma página web que les compartimos, donde va a estar todo el material, que si desean pueden seguir también por ahí, ese material es de licencia abierta, lo pueden luego compartir, aprovechar, reutilizar, lo único que pedimos a cambio es que digan de dónde salió. Así que con eso, si alguien está listo, le dejo el micrófono y la palabra. Todo se ha terminado de realizar instantáneamente ahora, si hay preguntas, si el tutorial no se ha grabado, no estamos grabando, así que la respuesta es que sí, está en la nube, perfecto. A ver si vamos a grabar la nube, ahora que vamos a trabajar con muchas datos meteorológicos o climáticos. Bien, ahí yo mandé para hacer el link a una página, una pequeña página de internet en GitHub, con donde van a estar los materiales y las cosas que vamos a ir siguiendo. Entonces la idea es que si en algún momento quieren volver, tienen ahí los apuntes. Primero, quizás empezar con un poco de qué es lo que vamos a ver, en qué consiste, qué es lo que va a incluir y qué es lo que no va a incluir este tutorial. El tutorial, ahora vamos a trabajar con datos grillados, datos espaciales, pero en grillas regulares, datos espaciales en puntos metidos por ahí, en medidas en cualquier lado. Está la idea de las áreas, o sea, valores que valen para un área, como se decía, población de una determinada provincia o un determinado país, y eso es un valor que funciona un área. Hay temas de polígonos y cosas así que no vamos a tocar. Entonces específicamente para datos grillados, con una grilla regulada, tenemos una observación de una variable más o menos continua en una grilla bien ordenada, que puede ser regular en lójito de latitud o en alguna otra en alguna otra proyección. Entonces, voy a empezar con un ejemplo rápido que más o menos cubre un poco de todo lo que vamos a ver, que lo mando ahí y que ahí pueda, ahí mande el ejemplo y pueden bajarse el código. Y voy a ahora compartir mi pantalla. Ah, algo preparado. Ahora vamos a usar, voy a leer los datos en un formato que es, está ahí, como una tabla, un DataFrame esencialmente y yo lo uso y hago eso y trabajo mucho con lo que es DataTable, que tiene una sintaxis que es bastante particular y que quizás no le gusta a todo el mundo, pero también se puede trabajar tranquilamente con la función de la variable y todo eso. Y en los materiales que pusimos ahí, siempre que hacemos alguna manipulación de datos, está como la opción DataTable de la variable para que lo sigan. Pueden poner el chat para tener una idea de cuánto, de qué usar y cuánto tenemos que aplicar de cada cosa. Si, ¿qué usan más o cómo están más familiarizados? Si con la idea de Diplier, y TIDR y todo eso, o con DataTable, se usan una votación informal en el chat y mi predicción igual es que va a ganar Diplier. Hay varios con ambas, veo muchísimos. Muchísimas gente usa con ambas cosas y otro con Diplier. Bueno, entonces podemos a lo que veo, se puede usar lo que más o menos con seguridad total. No hay nada más que complicado y siempre está el código en Diplier. Yo creo que estoy muchísimo más cómodo con DataTable. Entonces vamos a hacer este ejemplo que yo directamente voy a hacer neat acá para ver el código y la salida. Entonces en el momento que esperamos que todo lo que renderice bien, bien, acá estamos. Bien, sigue este código y ya más o menos tienen la idea de esta historia que se da para gente, para R más o menos intermedio, ya está cómodo con el código, con el Rmd y todo eso. Así que la mayoría de las cosas que acá son cosas familiares y además justamente la idea de trabajar los datos, estos datos grillados con una tabla es que todo sea traducible a cosas que ya que se hacen con datos de otros tipos. Entonces lo que hacemos lo que hace en este ejemplo es cargar un paquetes y acá ya leemos los datos que los tenemos en este archivo, ya no te pierdas aquí en bajomar.nc y usamos la, esta función RIT del CDF que vamos a hablar un poquito de qué son esas cosas y leemos estas dos variables, SCT y MSL. SCT es la presión en la superficie del mar, la temperatura de la superficie del mar, si surf es temperature. Claro, esto no tiene los datos. Bueno, no van a poder correrlo porque los vamos, porque la parte de bajar los datos. Bueno, esta es una función de ayudita para hacer un mapa y que es lo que hacemos primero. Hacemos, esto hace un cálculo de donde calcula las anomalías mensuales. Es decir, cuánto se, como es la diferencia entre el dato y su dato promedio para SMS y para la aptitud de la aptitud, si llegan en el código de la rediglo o si, la table y si, no más cómodos acá con the player. Y esto, ya con esto podemos hacer una cosa que es calcular el índice de Enso, que es una niño, oscilación del sur, una característica súper, robusta, súper importante de lo que es la variabilidad de la temperatura de la superficie del mar y que se define como la temperatura media de la SST, en una caja en el Pacífico Tropical, entre 5 sur y 5 norte y entre 170 y 120. Entonces eso se hace, todos estos verbos, todas estas cosas, lo que seguramente ya saben con otros tipos de datos es filtrar esos datos y hacer un promedio para cada tiempo. Y bueno, acá ya tenemos una serie de temporales, entonces la floteamos con Gigiplot, como ven, esta es como bail y el índice Enso. Acá se define que hay un evento niño, o sea un Enso positivo, cuando la temperatura esta va por encima de 0,5 grados, o un evento en Enso negativo, una niña, cuando va por abajo, no sé ya cómo empezar a podríamos hipotomizar o hacer cosas. Y una cosa interesante para ver cuál es la relación entre éste índice, que es algo que es una temperatura promedio en el Pacífico Tropical, y la presión a nivel global. Y para hacer esto está este código donde unimos, unimos los datos que habíamos, yo digo que en realidad es datos acá, pero bueno, estos datos, los datos, lo unimos con el índice éste que armamos y hacemos una regresión lineal en cada latitud de longitud y luego lo ploteamos en esto con contornos y donde se puede ver ya algo interesante al menos para el sistema de la atmósfera, que es algo que en realidad estamos hablando de acá, en el Pacífico Tropical. Tiene un efecto, la correla de la regresión, los conscientes de regresión son muy altos en lugares que están muy lejos de ese lugar. O sea que esto ya es un resultado copado interesante que se llama las telecorecciones. La pregunta sobre este código, algo que ya hemos visto, bueno, si no hay nada. Igual, la idea es que para, digamos, al final de este tutorial salga todo esto que debimos de leer los datos, bueno, descargarlo también, hacer ciertas transformaciones con estos datos, disfrutando los campos espaciales en forma como el tabla y graficándolos en forma espaciales en campos de dos menciones, sea naturalizadas secundarias para todos. Pero como dijeron el chat, lo primero que hay que hacer es aprender a descargar estos datos y que bueno de dónde salen los datos siempre es un tema. Pero en este caso tenemos esta para datos de clima. Esta servicio que está muy bueno es el Elementator Store, que tiene una cantidad enorme, es una cosa del centro europeo, financiado por el centro europeo y otras organizaciones, que tiene un montón de bases de datos que tiene que ver con el clima. Y fijan, pueden ir bajando y hay un montón, un montón, un montón y pues sigue. Y que se pueden bajar de forma programática. O sea, uno le dice, manda una API, básicamente que nos le manda un request, una serie de una lista con las cosas de qué es lo que quiere bajar, qué variables, de qué base de datos, en qué área y en qué formato lo quiere. Dice todo un tiempo, dice los procesas y después se lo devuelve. Entonces vamos a empezar haciendo eso. Yo voy a abrir, vamos a empezar acá con un PR Markdown nuevo que tengo. Y ya vamos a hacer bajar datos que están en formato netcdf, que no sé cuántos de ustedes ya usaron datos en este formato, cuántos no, si hay quien no haya usado puede ponerlo en el chat. Veo que hay quien dice nunca. Bueno, si hay gente nunca no es nuevo, entonces más razón para explicarlos un poco. Son unos datos que, eso es un formato de datos que está muy bueno para, para el clima, o sea, está pensado para datos espaciales y grillados en particular. Que lo que tiene de cómodo es que en el mismo dato, en el mismo archivo, tiene todos los metadatos que se necesita para entender para poder leer los datos. Es decir, tiene, por ejemplo, cuál es el código para datos faltantes, cuál es la proyección, si tiene una proyección, cuáles son las dimensiones de esos datos, cuáles son las variables, la cual están medidas y la temperatura está en Kelvin o están entre grados centígrados. Y además permite leer cachos, bloques continuos, pero igual está bueno tener bloques de esos datos. Entonces uno puede tener un archivo, net CDF de 3 gigas con los datos tridimensionales de la temperatura del aire durante 40 años. Pero si uno necesita, bueno, yo quiero nada más leerla una determinada parte, por ejemplo, en Sudamérica. Uno puede leer un cuadradito nada más y lo único que levanta en memoria es ese pedazo. Entonces vamos a hacer, a ver un poco, voy a estar en la librería a meter, que tiene una forma, unas funciones para ver y leer esos datos. Y uno, el archivo que hay un archivo de ejemplo. Este archivo, o sea, si corren esto, creo que no van a poder ver esto. Voy a poner mi consola acá arriba. Esto es un archivo, se llama temperatura-temperature.nc, y usando y con meter una función que llama clans net CDF. Entonces leemos con esto lo que nos hace es no leer el archivo, sino que nos da un pequeño vistazo de qué es lo que tiene ese archivo. Si corremos esto, nos devuelve este print, ya nos envuelve un objeto, pero acá lo que hacemos es print y vamos a default. Y que nos dice qué es lo que tiene este archivo en ese, y vemos que acá nos está diciendo que tiene variables. Las variables se llama air y nos dice acá una descripción de qué es lo que es eso. Todos estos datos metadatos que están adentro del archivo. Sí, este es la temperatura diaria media en grados Kelvin y en qué dimensiones está, que nos dice lo tituló, el longitud por latitud, por nivel, por tiempo. Y acá abajo podemos ver cuáles son esas dimensiones. Tiempo, nivel, latitud y longitud, cuántos valores tiene eso de cada variable, el rango y la dimensión. Esto está en millibare. En los meteorógicos, muchas veces usamos la coordenada vertical en vez de metros por encima del mes de metros, usamos presión. Entonces, millibare. Entonces acá ya podemos ver cuánto tenemos. Porque sabemos que tenemos 17 niveles, 73 latitudes, 144 refitudes y un tiempo. Entonces, esto es 17 por 76 por 144 por 1, un tiempo. Y tenemos esta cantidad de datos, es casi 180,000. Lo cual es, por ahora, es totalmente marejable el RSI que lo podemos leer. Entonces yo voy a cancel uno y para leerlo, es la función written asides, también de meter. Si queremos leer todo lo que hay en el archivo, todas las variables, en este caso hay una, todas las variables, todas las dimensiones y todo lo que hay, podemos poner así lo más. Y nos devuelve esto. Por defecto, si son archivos muy grandes, a veces conviene leerlos como una matriz, o en realidad una RAI, una matriz multidimensional. Pero la idea necesitaría es trabajarlos como Tostady. Entonces, te lo devuelve así, donde tenemos columnas que nos definen las dimensiones y las columnas con los datos. Si fijan acá, los datos son todos constantes porque estamos en el mismo punto. Latitud 90 grados, todas las longitudes son el mismo punto. Y tenemos ciertas estas cantidades. Y entonces, básicamente, si ustedes saben analizar datos por esta foto de tabla, acá se termina el tutorial y listo porque no hay mucho más que decir, en realidad. Pero bueno, en realidad hay ciertas cosas que están compadas para aplicar específicamente cuando esta tabla y cuando estas cosas son definen datos en dos dimensiones, son tres dimensiones. Pero primero vamos a conseguir datos que no sea estos datos de juguete que vienen con el paquete. Entonces, vamos a bajarlos, vamos a buscar cómo bajarlos de este servicio. Ustedes ya, como preparación, se crearon el usuario en esa página y setearon su usuario y código y clave en R. Así que no deberíamos tener problemas en eso, sino vamos a ver qué musemos. Entonces, voy a venir acá a la página y voy a buscar datos de lo que vamos a usar que es una base de datos llamada Era5, que era, significa, European Reanalysis. Es un reanálisis que es una base de datos que combina observaciones y modelos y modelos climáticos para generar una muy buena estimación del estado de la atmósfera, pero sin huecos, o sea, en una grilla regular y sin datos faltantes durante todo el período que tiene. Y lo que vamos a usar es datos mensuales. Y uno puede usar niveles de presión que son en polumétricos, a nivel de distintos alturas, o hay algunas variables que están definidas a una altura, por ejemplo, la temperatura de superficie del mar solamente tiene una altura desde la superficie. Y eso está, es un single level, o sea, que hay búsqueda y entonces monthly. Acá estamos. Vamos a hacer esta, que era los datos mensuales en niveles únicos desde 1979 al presente. Esto de 1979 es como el año de la climatología, porque es cuando empezaron a haber satélites. Y cuando hay satélites, es cuando tenés la revolución de que empiezan a ver datos especialmente en el Inferiosur, donde hay mucho océano y donde hay tierras, tampoco hay muchas observaciones. Y acá tenemos una descripción de todas las datos y cada variable con una descripción, pero vamos a ir acá, el botoncito de descargar los datos. Y acá tenemos que definir qué es lo que queremos. Queremos el tipo de producto. Vamos a poner este, que es el promedio de reanálisis. Podríamos pedirle los miembros del ensembles, porque esto tira muchos modelitos y después en las subcropedias, que eso es mejor que nada. Y en variables, vamos a bajar un par de variables. La precipitación total, la presión a nivel del mar está y la temperatura de superficie del mar. Tres variables de superficie. En años yo voy a seccionar todo, menos 2021, porque los últimos, creo que un par de meses, un par de, sí, creo que entre los últimos tres meses, los tres meses más recientes tienen datos que pueden cambiar. Entonces aparece otra dimensión y es un lío manejarlo, no vale la pena. Entonces vamos a elegir hasta 2020 y todos los meses del año. Y luego acá en time, como estos son datos mensuales, solamente tenemos un... Y acá podemos desegir en geographical area. Podríamos decir, dame toda la región, en este caso global, o poner acá y elegir una subregión. Vamos con datos globales. Y finalmente el formato, este es el formato gril, que es un formato rento. Así que vamos a usar net city. Bien, y entonces hasta acá, ya podremos, si se veamos, clic acá en submit form. Me ejecutaría ese registro y entonces podemos esperar y nos va a aparecer un link donde podemos clicar y bajar los datos. Pero algo más interesante que vamos a hacer es hacer clic acá donde dice show request. Y donde nos muestra este código de Python. R, en una conferencia de R, no se preocupe, ya lo vamos a cambiar a R. Y este código, básicamente lo que hace es, si lo corremos, nos ejecuta este request y nos da vuelve los datos. Pero yo voy a copiar todo esto, lo voy a poner acá en un código. Lo que, pero lo voy a seleccionar y voy a ir acá a Deans, les van a ver esto. Y voy a buscar este, que es el paquete que vamos a usar para dejarlo los datos SMWFR. Y vamos a poner Python to list. Y esto lo que va a hacer es que todo esto que tenemos seleccionado lo va a parcer y lo va a poner, lo va a convertir. Ahí está en una lista de R, que esto es un request válido, que es un request que vamos a poder pasarle a una función para que nos vuelve los datos. Yo voy a hacer unos cambios acá, un cambios que acá tenemos el target, lo voy a cambiar por algo. Tiene más de temperatura mar, pero lo vamos a poner temperatura mar, si parecen los datos más. Y otra cosa que voy a hacer es agregar un campo que, bueno, esto es conocer un poco, que es el campo grid. Y lo que va a hacer es que nos permita bajar los datos en una grilla que no es la resolución completa que tiene, que es creo que es 0,5 por 0,5. Para trabajar con, como estamos viendo datos a nivel global y que si queremos ver patrones que hay gran variabilidad de gran escala, capaz no necesitamos tanto detalle y nos hace, de hecho, poder pasar problemas de tanto detalle porque no lo queremos ver. Entonces voy a poner 2,5, 2,5. Esto significa que quiero que la grilla en la que me vuelve tenga 2 grados, sea de 2,5 grados de longitud o 2,5 grados de latitud. Bien, entonces voy a correr esto y ahí tengo un request que es una lista. Ahora, para que esta lista se convierta en un archivo de netcdf hay que usar el paquete european SWMFR, que nunca va a correr exactamente como son las siglas, así que menos mal por el autocompletán de RStudio. Y la función es WFR request. Y ahí metemos nuestro request justamente. Y esto lo que va a hacer es, cuando yo lo corra, que ya lo voy a correr. Me aparece esto que me explica que estaba pidiendo los datos a este servicio con este número usuario. Acá hay un ire y ahí ya lo bajó. Fue bastante rápido. Esto te general puede tardar unos 5 minutos. Y esto depende cuánto el tamaño que ustedes le pidan va a tardar más o menos. Si ustedes le piden brilla global todos los años, una cosa de muchos niveles, muchas variables, puede estar una hora tranquilamente. El servicio este puede estar ahí dando vueltas una hora. Si van al, eso lo van a poder ver acá arriba. Cuando vayan a la página en your requests, ahí tengo una, les aparece un listado. Acá ya, ya está hecho, entonces lo podría descargar acá también. En el momento que está corriendo les aparece, digamos el request, como está corriendo está haciendo cosas. Y si hay algún error también, acá desaparece el error. Y cabe esto, correo rápido porque esta calle, o sea tiene una caché. Entonces ustedes corren, hacen un request y a los 5 minutos hacen de nuevo, porque el corriendo de nuevo el código es sin querer, que no está tan bueno hacerlo. Va a ser mucho más rápido que la primera vez. Por default lo guarda en una carpeta temporal, vamos a guardarlo en datos. Ok, ahora sí, ponemos esto. Nuestro archivo, bien, la ruta del archivo. Y para confirmar que está todo bien, podemos hacer, usar glance.cdf. Ahí está, y podemos ver que tenemos, si tenemos todo lo que queríamos. Acá tenemos las tres variables que pedimos, longitud, latitud, tiempo, perfecto. Hay que subprenuntar cómo sacarlo el código Python en un objeto. Ok, voy a hacer lo de nuevo, voy a mostrar lo de nuevo. Podríamos hacer permutation, inservir pressure, inservir temperature, todos los años menos 2021, todos los meses, solo el mes, solo el 00. Toda la región en el cdf. Clique acá en mostrar el request del API. Copiar la parte que empieza con Retrip, que es básicamente una especialista. Pues ahora lo selecciono todo esto. Voy a Add-ins, en tanto se está haciendo este truquitos de R. Y acá abajo Python to list. Yo lo que hago es buscar list acá. Y me aparece acá Python to list. Mars to list también existe, porque hay otro servicio también para bajar datos que usa como otra codificación, otro sistema que se llama Mars. Entonces si ustedes usaran eso, usarían ésta en vez de Python. Verte cómo es Python, es Python to list. Clique ahí. Hay que acordarse de seleccionar, porque se fija que es el texto que hay seleccionado. Y esto lo voy a borrar, porque tenemos lo mismo. Y a la pregunta ahí de si hay un límite de datos, la realidad es que sí hay un límite también. Además de que como hice pago, tarda mucho. Hay una cierta cantidad de registro que es el máximo que no me acuerdo exactamente cuándo es. Uno lo puede ver, así que tengamos que seleccionar todos. No, no, claro, este no me va a llegar, porque es un solo nivel. Si vamos a la cinco, vemos a... Arremos todo esto, todo esto, todos los niveles, todo, todo. Y acá nos dice ahí está. Acá abajo, nos dice que nuestro request es muy demasiado largo, donde estamos pidiendo 20 millones de registro y el límite acá está es 100.000. En este caso, si uno tiene muchos más de eso, lo que tiene que hacer es dividirlo en dos y después uno lo puede leer separado o puede... hay algunas utilidades para unir estos archivos en el CDF. Uno se llama CDO y otro que se llama NCO. NCO. Pero ahora vamos a... tenemos sucientemente pocos. Así que los ya está, los leímos bien. Vimos acá que estos datos tienen lo que sea y lo que creemos que tiene. Pero vamos a, como que es lo primero que uno quiere ver es qué pinta tiene esos datos. Entonces, vamos a leerlos, vamos a leer datos. Archivo. Y lo que yo voy a hacer por ahora es leer nada más la variable SST, que es la temperatura de superficie del mar. Porque así trabajamos con una sola y lo está rosso. Y entonces eso lo voy a hacer con el aumento bars, que es un... toma un vector de caracteres con las variables y lo voy a poner el SST. Ahí lo he hecho, listo. Vemos acá los datos. Es una tablita. Y ahora como hacemos para gráficar estos datos y ver que funcionen. Vamos a dar ggplot. Lo que yo se empiezo es agarrar datos, agarrar y graficar el primer tiempo, por ejemplo. Para quiero ver en 2D qué pinta tiene, entonces usando toda la tablita uno puede superar. Vamos a usar, creo que es así. Tiempo igual. No tiempo, no. Time. Igual. Si es time, se llama la variable. Time. Igual. Y ahora vamos a ggplot porque esta es una tabla. Y lo que hacemos es decir, bueno, el eje x va a la longitud, el eje y va a la latitud. Y ahora tenemos que usarlo un geom y el más básico y que funciona siempre. No le gusta esto. A ver, vamos a... falta cargar. Vamos a hacer un raster que son cuadraditos, que van a ser cuadraditos donde el centro cada vez va a ser las coordenadas de cada punto y el fin, o sea, el color de ese cuadradito va a ser empiado a SST. ¿Corremos esto? ¿Cuántos años? ¿Cuántos somos? ¿Cinco años? Ya estamos de usar R y todavía uno sigue poniendo igual, en vez de igual igual para comparar. Ahí está. Ahí tenemos nuestros datos. Ya podemos ver un par de cosas. Podemos ver que tenemos en este barrio. Es un dato de temperatura del mar. Entonces, donde no hay mar, tenemos datos faltantes. Este grisesito nos dice que es datos faltantes. Lo que está bueno está bueno porque nos está dando gratis el contorno de los continentes. Es una forma bastante burda, pero está bueno para verlo. Y además vemos que la longitud está entre 0 y 360, que es algo que a veces hay que tener en cuenta porque también puede estar entre menos 180 y 180. Una última cosa que podemos hacer es no leer todo esto, todo en la región, sino leer un cacho de esa región. Si esto es en vez de SST fuera alguna, la temperatura de muchos niveles, capaz no podemos ni siquiera podemos en memoria leer todo. Entonces podemos supongamos que no sé, yo me pongo el zapato de algún investigador neocelandés que le interesa la temperatura del mar en Nueva Zelanda y las islas que hay por ahí. Entonces, yo al menos me da mi interés a esto. Entonces podría leer todo y hacer un filtro, pero eso es beneficiente y además como decía, si capaz ni siquiera puedo leer todo. Entonces lo que puedo hacer es agregar un argumento que se llama subset, que me permite leer solamente un cacho de estos datos. Y es una lista donde tengo el nombre de la dimensión. Por ejemplo, vamos a elegir el hemisferio sur. Entonces, el titularatitud es el nombre de la dimensión sobre la cual estoy seleccionando. Y luego un vector cuyo rango va a determinar el rango del pedazo que va a ser continuo de datos que voy a elegir. Entonces yo voy a acabar entre menos 90 y 0. Entonces esto lo que me está haciendo es solamente el hemisferio sur. O sea, esta parte y si queremos elegir acá, digamos entre 100 y 200 de longitud. 100, 200. Entonces yo le voy a leer esto y voy a mandarle lo mismo que acá, directamente, para ver qué es lo que estoy leyendo. Y como ven me está agarrando esa partecita donde como tenemos datos faltantes en las islas, podemos ver ahí en Nueva Zelanda y las islas que están cerca de Nueva Zelanda. Acá, como le decía, solamente se puede en principio, solo se puede, por cómo funciona el XCF, seleccionar rangos continuos. Pero hay, desde la manga, digamos, hay una programación de que uno puede usar subset para agarrar cachos separados, por ejemplo, si no quiere Nueva Zelanda y Sudamérica, por ejemplo. Y otros detalles de subset para, por ejemplo, si uno no sabe cuál es el, o no quiere escribir cuál es el menor, puede poner DNA y eso hace como si fuera ahí, implica decir el mínimo de esto, de la actitud, o si está del otro lado, el máximo. Entonces ahí sería dame de lo mínimo que tenés la actitud, que no importa cuánto sea, hasta cero. Pero no la sabemos qué es 90, entonces lo dejamos. Bien, ahora lo que vamos a hacer es, para que no se aburren, vamos a empezar y bueno, es toco a ustedes hacer todo esto de ejercitar. Entonces lo que vamos a hacer es dar un tipo para ejercicios en el cual lo que vamos a hacer es, donde el tenemos acá, y a partir. La idea es que agares a ustedes y tienen básicamente tres opciones que les proponemos. Una es, si quieren, digamos, si nunca trabajan un tipo de variable, entonces la idea no es perderse el tiempo de ver cuáles variables hay y qué sé yo. Básicamente seguir más o menos al pie de la letra todo esto que hice y replicarlo, por hacerlo en sus malos. Y bueno, esto es lo que es recomendado si no tienen tanta experiencia con este tipo de datos, si quieren terminar a tiempo el ejercicio en los 10 minutos que vamos a dar. Pueden, o pueden, si ya estuvieron siguiendo el código en vivo y va sobre el salió bien. Lo que pueden hacer es, les proponemos esta, alguna de estas tres preguntas que se pueden hacer para responder con estos datos, cómo varía la temperatura media global a la hora del tiempo, de qué depende la presentación en alguna región que ustedes quieran elegir, o cómo varía la temperatura, la superficie del mar cubierta por hielo a lo largo del año, o si ya trabajaron con cosas parecidas y ya tienen una pregunta o tienen cosas análisis que ya se les están ocurriendo con algunas variables que ya conocen. Pueden hacer las suyas, variarse y bajarse los datos que quieran de CDS. Obviamente, siempre teniendo en cuenta que el tiempo es limitado y que la idea no es perderse todo el tiempo pensando qué cosa va a bajar. Lo que pueden hacer en ese caso también es inspirarse en algunas de estas preguntas para y modificarla. Entonces ahora, Pao, creo que vas a abrir los cosos. Vamos a abrir unos breakout rooms para que haga eso en estos 10 minutos. Si quieren preguntas, pueden preguntarles a sus compañeros o también pueden pedir ayuda. Así que bueno, en 10 minutos nos vemos y si hay preguntas, lo vemos ahí. Ahí estamos todos de vuelta. Ahora sí, sin mutearme. Lo que vamos a hacer ahora son 5 minutos de pausa mientras si tienen preguntas, pueden escribirlas ahí en el documento compartido y si no tienen preguntas pueden pensar preguntas en estos también 5 minutos, donde vamos a dar una pausa, aléjense la pantalla, sigues un poco también y nos vemos. Yo voy a poner acá un cronometrito para que quede bien claro, para que estemos sin cronizados. Que nos vemos. Así que ahora creo que hay 2 veces. Bien, ok, ya está justo a responder una pregunta en el chat, pero como se me cerró su juego, hay alguna pregunta, o sea, tengo para hablar de una pregunta ahora, si no le seguimos la ronco respondiendo también en el documento compartido. Nadie si las ponen, pago está atentado. Si no, preguntas, todo que es súper claro. Podieron bajar los datos, veos si es, bueno, donde no hay cámaras abiertas, en días no puedo saber. Se compartiendo, sí. Bueno, entonces ahora tenemos nuestros datos. Yo ahora voy a seguir con el ejemplo de ese STI, ustedes, cuando bajaron otra cosa, te darán otra cosa. Una cosa para aclarar es que ahora yo estoy, vamos acá, en este código, por acá, bajo los datos. La idea es que uno no esté bajando los datos, o sea, este código, cuando le des que no quede en este, en el RMD, no? Porque si no, cada vez que ni tean, va a bajar los datos, va a hacer el request, el servicio, va a esperar a que termine y va a volver. Lo cual aún es gasto innecesario para ellos con el servicio, gasto de tiempo, es necesario para ustedes. Entonces esto en realidad tendrían que tener un, tendrían que dejarlo en el script que prepara datos o que descarga datos, no? Descargar datos.r, eso se corre una vez y una vez que lo tienen, ya está. Y eso, y si hacen eso, es importante poner el path, porque si no, por defecto, esto baja los datos en una carpeta temporal y esa carpeta temporal, en cuanto reinician r, o cierran r, desaparece junto con el archivo y tiene que volver a descargar. Entonces, ahora que tenemos estos datos, vamos a ver alguna, un poco más de cómo graficar para que no sean estos cuadraditos muy feos. Lo primero que voy a hacer ahora es quedarme con un solo, con este, un solo campo de SST, solo para variar, voy a hacer en formato data table. Y vamos a jugar con este SST 1, que nos cita los datos, creo que lo llamé, como lo llamé, que no me tienen datos, ok, datos. Bien, entonces SST 1 y ya vimos cómo hacer esto de user raster, o sea cuadraditos, que es una cosa que más o menos sirve, pero medio feúcho, y además, como que no permite, es como demasiado lavado, yo creo que hay una forma mejor que permite ver como las estructuras de estos campos, que es usar contornos, los curvas de nivel. Y eso se hace con el ungeo de GGplot, que es un contorno, y hay que darle el z, como que es como si fuera la altura de este contorno, pues como una montañita, y vamos a ponerle SST, que es la variable. Entonces acá nos dan los contornos, que estos son líneas de igual valor de la variable, o sea que la variable está, vale lo mismo en todas estas líneas, vale lo mismo en todas estas líneas más que acá, probablemente. A mí me gusta, este es el geomontor que viene de GGplot. A mí me gusta usar geomontor 2 de meter, no solo porque yo lo programé, pero sino también porque el default, en vez de este azul, que es medio feo, el default es negro, que creo que es bastante más razonable. Y además tiene un par de otras cosas extra que no se pueden hacer con el geomontor de GGplot, como temas con proyecciones, o cambiar el, o usar cosas raras en los breaks. Entonces acá tenemos los contornos, la deseventaja de estos contornos es que perdemos, como son todos negritos, veo que perdemos y no sabemos qué valor, qué valor representa esta línea, no sabemos si esta línea es mayor, que el valor de esta línea es mayor o menor que esta línea, o sea, sabemos qué tal tiene que ser mayor, porque conocemos la variable, pues si le damos esto a alguien no, no lo va a poder ver. Además, bueno, perdemos gratis los contornos de los continentes, pero bueno, eso es otra cosa. Entonces una cosa que vamos a usar es contornos llenos, que es eso lo que hace es que rellena los contornos con un color que va a ser proporcional a el valor de la variable, como el valor intermedio de la variable, todo ese área. Y entonces vamos a volver a obtener esa idea de esa información del valor. Entonces vamos a hacer otra vez eso. Y voy a usar geoncontor field, esto es de meter. Hay un geoncontor field, field de ggplot, que también tiene algunos default distintos y geoncontor field, además tiene esas cosas extra, lo mismo extra que tiene geoncontor 2. Pero la sintaxis es exactamente igual, z está igual, y ahí tenemos una cosa muy bonita con los contornos, donde el relleno me da una idea de la temperatura, podemos ver bien claro que acá es más, acá es menos y además que valor tiene. Lo que sí, ahora perdimos, creo que es hora de agarrar algo más razonable que estos continentes pixelados, estos continentes medio como fuera del Mario Bros. Y para eso hay básicamente hay que tener hay que conseguir los datos de dónde están los puntos que definen los contornos de los continentes en paquete que hay mucho que es r natural earth que tiene uno se puede descargar esos datos en distintas con el nivel de detalle con los continentes, los países, las divisiones entre países, pero como no se los dice descargar y porque no tiene, vamos a usar lo que ya está, la idea no es ver mapas, es nada más tener el mapa para tener una idea de dónde está operado, es usar una función de ggplot que llama map data, que le ponemos word acá y ya nos da una la serie de longitud de la etitud de todos los distintos países de los continentes y eso hay que ponerlo en un polígono, entonces vamos a hacer esto data, debemos decir que todos los datos lo saque de acá, en este caso las coordenadas x es longitud, la coordenada y es latitud y ya es importante poner el grupo, esto básicamente define cada polígonos cada país o cada región, si entonces si yo corro esto ahí ya tengo unos países y lo que yo voy a hacer acá es ojo, acá en este caso la longitud va a ir de menos 180 a 180 o 200 en este caso porque la Rusia se pasa un poquito, pero nuestros datos están entre 0 y 360, entonces ahí esas algunas veces me molesto, uno puede decir bueno voy a mover mis datos o voy a mover mi mapa, hay una función de meter que es convert longitud y uno le mete la longitud y si la longitud estaba entre menos 180 y 180 te la vas a hacer a la otra a 0 a 360 y viceversa, pero en este caso es mucho más fácil, tan fácil como poner un 2 acá y este es el mismo mapa pero centrado en el pacífico, que yo además como estudio cosas que pasan acá, quiero verlo así, no me gusta centrarlo en el Atlántico porque no me importa, entonces en este geopolígon ya me deciden estos mapitas, entonces yo lo voy a ya guardar en algo que yo haré una cosa que llame mapa así ya lo puedo reutilizar y para reutilizarlo también voy a hacerle agregarle unas cosas que es este argumento Inherit IS, yo voy a poner false porque quiero que sea autocontenido que es que no me herede los IS que yo les pueda poner a ggplot, la llamada ggplot original, si no yo la doci a la nochada ggplot le pongo un fill, me lo va a meter acá y también lo voy a poner filly white que sea blanco porque me parece un resulto malito, no más. Bien, entonces si ahora agarramos esto, le sumamos el mapa así lo más, ahí lo tenemos y tenemos el mapa, el problema es que él no se ve muy bien del mapa porque el mapa es un cachito más chico y o sea todavía tenemos estos cuadrados, estos píxeles horribles blancos que ahora en este caso ya no los queremos, el problema es que en principio como no lo podemos evitar porque ahí no hay datos, entonces si no hay datos en cerca de la costa tienen los quesos cuadrados, una solución podría ser aumentar la resolución de los datos, bajarlos en vez de 2,5 a 0,5 pero eso en realidad no es una solución muy buena porque es para una cuestión estética vamos a bajarlos un montón más de datos y complicarnos la vida. Entonces voy a hacer un truquito de geon control fill que es que podemos, voy a agarrar así esta parte no para ver cómo se ve esto si del mapa, para recordar, tenemos estos recuerden, entonces hay una función de geon, una parte del argumento geon control fill que es na fill que lo que hace es que te rellena los valores donde hay nevas y lo podemos rellenar con un valor constante con un 0, podemos darle min y nos rellenan con la media o podemos ponerle tru y es tru que es como lo más simple y que lo que hace es un relleno con una interpolación bilinear, el medio fea que no es la idea, no es obtener datos válidos ahí porque obviamente no hay datos válidos acá, si no rellenar esos contornos que hay en relleno, pero ahora que nosotros sabemos que acá hay un montón de datos que en realidad no representan nada, que podemos enmascarar con el mapa arriba y ahí vamos, y ahí entonces no tenemos esas cuadrados horrendos que están cerca de la costa porque los datos que están cerca de la costa básicamente están en cierta forma interpolados o extrapolados si se quiere, pero que eso no es un problema porque es un extra por una cosa razonable y lo que está adentro de estos continentes ya sabemos que no nos importa. Bien, otra cosa otro poquito que podemos hacer, otra cosa interesante que no es algo que nos justo vamos a ver con estos datos en particular porque están en longitud latitud es que pasa cuando tenemos los datos en una grilla que es regular pero no en longitud latitud y nosotros lo queremos plantear en longitud latitud porque no se tenemos otros datos que están en longitud latitud. Entonces para mostrar un ejemplo voy a usar estas variables, surface que es un data set de ejemplo que viene con meter que lo que tiene es una topografía en una región de argentina y tiene lo que tiene en longitud latitud y también tiene un x y un y entonces vamos a ver un poco qué pinta tiene esto de nuevo está bueno como es un solo campo no hay que extraer un solo campo vamos a hacer ahora es lonlat se llama lonlat no longitud latitud lo cual nos ahorra mucho teclado y voy a poner los puntos nomás que un point que esto es como un paso incluso un paso atrás que geom raster y si queda su cuadrado que rellena se hace un punto ahí en donde tenemos datos solamente para ver dónde tenemos datos bien entonces si se fijan esto no es una no es una grilla regular no porque claramente no están en un cuadradorito así pero tiene una estructura no es como que claramente ahí está tiene estas líneas acá donde se sigue en derecho y esto nos indica es que hay hay una estructura regular pero que está en otra proyección y que no sé cuántas experiencias tendrán con proyecciones con la idea de que la tierra es esférica y entonces si hacemos el longitud latitud por ejemplo tenemos esta cosa que se deforman las áreas en cerca de los polos y tenemos un montón de problemas la distancia entre un punto no la puedes medir como la distancia de la longitud pero la distancia entre la diferencia de longitud es más un cuadrado más la diferencia de latitud del cuadrado raíz cuadrado porque eso asume que la tierra es esférica es plana y no lo es entonces para superar eso hay estas proyecciones que es cambiar esas coordenadas y en vez de usar longitud latitud las otras coordenadas distintas que son en este caso las x a que ahora vamos a ver qué pinta tiene eso si ponemos acá en vez de longitud latitud x ahí vamos a ver que ok acá encontramos que sí acá es una cosa que es una grilla regular y fíjense los números los valores tenemos hay un cero acá en el centro del dominio y valores que llegan a cerca del orden de un millón esto porque estos valores de x si lo que nos da es la distancia en metros que está a cada punto con respecto a este punto central en una determinada proyección entonces ahora podríamos acá hacer usar un con ser contornos acá por ejemplo y en vez de color hay que poner z de acuerdo a eso siempre si tenemos algo las cordilleritas hay el problema es que si ahora queríamos mostrar esto junto con los datos de cct no podemos porque los datos de cct están los valores de longitud latitud están entre cero tres sesenta menos noventa noventa y acá tenemos un millón o sea que estaría como un puntito ahí lo que tendríamos que hacer es proyectar red es proyectar o sea pasar todos estos estas limitas a sus equivalentes en longitud latitud y para eso necesitamos saber la proyección está porque hasta ahora yo le mostré los puntitos que dije que es una proyección pero no sé pero hay millones de proyecciones infinitas y bueno de dónde viene como sabes la proyección eso viene de arriba de dios de los metadatos que puedas tener eso de tener datos si no tener la proyección cuál es proyección es un problema recurrente para los que trabajan con datos referenciados en este caso no va a ser un problema porque yo voy a hacer sus de los metadatos y voy a decir cuál es la proyección y esta es la proyección no es eso se llama una pro string es una tona a una cadena de caracteres que te dice que fine los distintos parámetros de la proyección la proyección es LLC que es Lambert conical Lambert conical algo conformal ok acá me tiran porque ella es la que trabajó con estos datos justamente y sus y sus parámetros que tienen bueno esta proyección necesita una latitud 1 una latitud 2 una latitud 0 y una latitud central etcétera o sea esto ya nos define nos define la proyección y lo que podemos hacer entonces ahora es usar el argumento un argumento de geom con torfil ahí paul le pasó todo este choclazo por el chat y podemos decirle pro y le mandamos la pro string y eso lo que va a hacer es va a calcular estos contornos en este espacio en estas coordenadas donde las todos regular y lindo y luego nos va a pasar a longitud y latitud usando esta definición de la proyección entonces si yo lo corro ahí vamos algo que está en longitud y latitud fíjense que aquí sí ahora tienen valores de menos 40 menos 20 grados 285 300 también grados de longitud y fíjense de la forma rara que tiene así que tiene que ver con que las distancias se van deformando y entonces ahora ya podemos ver como está tarde de plotear esto mismo junto con las las sst entonces voy a agarrar ese campo que estaba usando a pesar de la longitud vamos a probar que recorrer como era el másquita este perfecto y ahora agreguémosle otro pero cambiémos los datos hacemos surface ahora hay que cambiarlos ahora hay que usar x y si no lo que tú de la actitud porque lo que define a los puntos en esta dato es x y si se acuerda volvamos esto estas coordenadas acá son los que nos nos definen las la grilla regular de estos datos y necesitamos el z entonces si corremos respondo a Richard Tomás y que pregunta si funciona con los códigos epsg que esos son como proyecciones medio estándar no es un numerito yo creo que a esto funciona con cualquier cosa que funcione con pro 4 con el paquete pro 4 que creo que si le metes más pro y acá el numerito ahí funciona y otro y en realidad como más avanzado todavía que acá por realidad uno por una función cualquiera arbitraria que uno se haga que con la idea de proyectar los datos propios o hacerle lo que quiera entonces lo que va a recibir esa función es los datos de estos de todos estos pequeñitas y ahí bueno uno tiene la toda la libertad de la responsabilidad de hacer lo que se les cae y volvemos acá y faltó igual y ahí tenemos nuestras por el dato de superficie del mar y acá nuestros datos de altura de altura y si se fijan claramente ahí hay un problemita que es que estamos usando la misma es que es el relleno para dos variables distintas esta variable tiene datos entre cero y cinco mil metros que es mucho más que cualquier cosa que tenga esto entonces básicamente esto se lleva a toda la variabilidad y nos está mostrando esto y todo esto queda casi cero entonces eso no se puede hacer en chichin por como bien el no se puede usar dos escalas de colores o de fil para dos variables distintas pero si las traje para acá es porque hay solución a todo esto no voy a decir no no se puede ya está teniendo hay otro paquete que se llama chichin news que lo que hace es justamente permitir esta cosa es permitir generar nuevas escalas que como se usa es que uno define el geom que usa la escala y luego acá le ponemos poner una escala si queremos pero no se falta porque hay usas por default y ahora ponemos news que el fil en este caso y lo que dice es todo lo que viene va para acá los próximos geom van a usar una escala completamente independiente así de falta entonces ahí lo borremos y ahí tenemos las dos cosas con las dos escalas acá quizás un último detalle que podríamos ver es que estos contornos llenos no se llevan demasiado bien con este tipo de escala con este tipo de guía porque ya en principio no pasa nada pero acá cuando hacemos esta estos contornos estamos con alguna manera discretizando nuestros datos no estamos diciendo todo esta cosa que de acá que en principio pueden tener más o menos ser tenemos una cierta variabilidad lo vamos a achatar y ponerle un color uniforme es a que estamos un color discreto y después hay un salto y todo lo que está acá va a tener otro color mientras que acá en como pero como es el número es el numerito que ha asignado a la variabilidad al valor de la variabilidad es un número continuo estamos la variable que elige la escala que elige chichiplotes a continuar y nos da este degradé continuo infinito pero estaría bueno poder unir este degradé a esta las escalas acá a estos cortes en particular una cosa que estaría muy bueno poder marcar dónde están estos cortes y esa manera ya poder ver directamente ok qué valor es este y puede decir que todos los valores de acá es entre tal y tal valor que es algo que no se puede ver acá y para eso vamos a usar otra otra cosa de meter que son que es justamente una escala discretizada que la idea es justamente tomar una escala que es unos valores que son discretos pero que tienen un cierto valor asociado y entonces convertirlo de no de alguna manera en una cosa contigo vamos a ver cómo funciona eso vamos a volver como se hace un otro fil ct cual es este pero ahora le vamos a cambiar y vamos a usar el fil en vez de usar fíjense que acá está usando esto que llamo el nivel mid que es el nivel medio entre los dos niveles de estos contornos y eso es una variabilidad eso es una valor computado por el por el geon por el a por el está en realidad y ahora vamos a poner otro que es simplemente el nivel y la forma de referirse a los niveles computados es con estos dos puntos aunque eso está medio deprecado ahora pero es la que me gusta esta fíjense que nos da esto que por la pinta que tiene esta guía ya vemos que es una cosa discreta si son valores discretos que tienen esta como etiqueta no de los 10 a 275 de 580 así entonces acá ya podemos saber que toda esta cosa amarilla corresponde a esto a este esta discretización que es valores de 300 a 305 kelvin que es 2 a 273 27 grados 27 y 33 grados de 2 grados el problema es esto que esto es puramente discreto y que no tiene en cuenta los cortes que es el valor que representa y eso puede traer problemas si nuestros cortes que nosotros elegimos no son todos equistantes esponjamos que acá elegimos cuáles son los en dónde vamos a dibujar los contornos y que valores y ponemos 272 275 285 así corregamos esto ahí tenemos el 300 con un poquito más para que todo entonces tenemos distritos cortes que claramente tienen como distinta grosor no este son 3 grados nada más y estos son con 15 pero acá aparecen como equistantes y estaría bueno una forma de hacerlo más que tengan en cuenta eso entonces lo que vamos a usar es vamos a poner una escala y yo le voy a poner esta sí que vamos a hacer vamos a comer vamos a usar una cosa de meter que permite convertir cualquier usar cualquier estada escala continua como estas y dice pero con valores discretos que vengan que tengan esta formita que vengan de una discretización y la forma es usar este argumento súper que probablemente nunca usaron y ponerle esto lo que le dices esto que realiza una escala continua ahora vas a hacer la que sea discretizada entonces si hacer eso vamos a tener una cosa que es más razonable donde los para empezar que acá o sea esto es parecido a lo que tenemos acá que lo está diciendo que es una cosa más una cosa continua los cortes acá representan los cortes acá y la distancia entre los cortes es directamente por la distancia de los cortes que hay bien buenísimo entonces vamos ahora a cortar acá un poquito y volver a hacer otro ejercicio donde la idea es que hagan justamente tomen esto y hagan la siguiente parte de lo que lo que eligieron a hacer si entonces si hicieron la opción uno de replicar pueden replicar estas mismas cosas y si hicieron las dos la opción dos los materiales les tienen acá según la pregunta que hicieron alguna las sugerencias de qué cosas graficar de qué cosas graficar y bueno y si si le dije en la opción 3 de irse por la suya son ustedes tengan son libres a hacer lo que quiera entonces igual que antes 10 minutos 15 15 minutos 15 minutitos como siempre cosas que tengan dudas le pueden seguir poniendo el documento compartido y también la respondemos y si tienen dudas pueden pedir ayuda volviendo a la gente de los cutos estamos espero que hayan llegado en puerto vamos a hacer nuevamente cinco minutos de pausa para descansar un poco después de esto igual que antes si no tienen preguntas pueden pensar las preguntas para que las respondemos después de a la vuelta de la pausa y hacemos ahora cinco minutitos y volvemos aléjase las pantallas distívense y piense en preguntas los ojos intentando iniciar los cocineros siempre decimos que no hay que enseñar solos pero a veces no tan acompañado no todos que preguntas hay hasta ahora que no hayamos respondido el documento compartido el chat para mencionar muy rápido tu consulta malena en el chat pusimos algo en el documento y ahora vamos a agregar algún link para que tengan en cuenta en general los reanálisis en general se hacen todavía bajo resolución porque son muy costosos generarlos si les interesan datos meteorológicos tal vez pueden recurrir a los pronósticos o en la análisis que parecía el reanálisis incorpora observaciones pero en tiempo real esos necesariamente se generan en resolución de mucho más alta porque necesitamos mas robo de calle para saber si mañana va a ayudar entonces ahora buscamos algunos links para compartir también 30 por 30 cuánto era cuánto es más o menos no porque él era el era cinco estentados horarios tiene un atraso de cinco días o algo así más o menos o sea como que no es tiempo real pero no puede tener los otros en cinco días y como también respondía por ahí para más resolución o sea como un rey de dos siempre entre bueno más resolución es basas para general ser productos con regionales quizás o con menos tiempo de temporal digamos el era tiene cuarenta años y ahora están seguiendo más y igual hay algunos productos de más regionales yo nunca usé hay unos european reanálisis que están muy altas bastante de alta resolución cinco kilómetros así pero son regionales y también pueden fijarse que este paquete también permite descargar datos de otros otros servicios que se llama es web apis se llama el smw de fe que tiene otras hay lo más paso que tiene otras data sets que la verdad que no los conozco hay un regional huerra un regional reanálisis por ejemplo que no sé bien cómo que son pero pueden chupear ahí se tiene que crear otra cuenta en otro lado y hacer lo mismo algo parecido a lo que lo quisieron para crearse para setear sus creencias nr con cds pero éstos otros y vamos a hacer una cosa más de gráficos que no podía hacer un tutorial sin son que tocas estas cosas de los contornos y que se yo sin mostrarlo porque es como esas cosas de todos tenemos alguna cosita que que si alguien nos empieza nos preguntan podemos hablar sobre eso y para molestando todos pero que son una cosa extra que le podemos poner a nuestros contornos que es un efecto de reliever que además que quedan muy lindos reútil y ahora van a ver por qué muchas veces en en metrología y demás este en muchas otras ramas con que las variables tienen como un punto medio muy natural que yo el cero general es un punto medio natural y a veces otra se trabaja con anomalías no con se le resta la media entonces lo que uno le interesa es o que es cuánto por encima cuánto por debajo de la media está esta variable y entonces eso se llama anomalías y para ese tipo de cuando tenemos ver las cosas así es muy natural usar escalas divergentes que vamos a mostrarlo acá por ejemplo donde la escala el cero no el medio o el cero no está obvio pero es medio artificial y vamos a poner una escala esta es igual que es que el fil gradient 2 de ggplot solamente que los defaults el máximo el mínimo está andado vuelta porque no sé si no sé qué hacién se le ocurrió que por default en esto el valor alto tenía que ser azul y el bajo tenía que ser rojo que para mí es como no tiene sentido vamos a usar este que acá no va a funcionar porque el midpoint es por default de cero vamos a poner 290 entonces la idea de esto es ver cuánto se va cuánto cuánto por encima cuánto por debajo está en la temperatura de 290 supongamos que 290 es alguna temperatura 290 kelvin es alguna con temperatura clave para algún proceso físico que nos interesa o biológico quizás y entonces lo que queremos lo que vemos acá es bueno cual que toda esta región está por encima y toda esta región está por debajo pero el problema que tiene esto ahora es que si ahora hay un imprimio en blanco y negro o lo ve en blanco y negro no es tan común pero por construcción de esta escala tienen la misma intensidad para el ritmo de para abajo esto es lo que hace que sea como de definir que sea que significa que sea divergente yo voy a copiar esto que es importante pues no más para mostrar que es lo que se ve es una forma de simular y de desaturar los colores de un plot y fíjense que se hace un sexto no hay forma de ver ok esto que es esto por encima por debajo del cero de nuestro valor medio es exactamente igual que esto no hay forma de distinguir pero podemos hacer esto de base vamos a agregar otra capa que es otro y otro jeon con toro jeon tan acá esto se llama en contornos de tan acá o contornos iluminados y se comporte igual que que todos los contornos pero bien qué cosa más hermosa como se ve la el relieve que tiene se ve la imagen bien veo y se sabe que tiene la imagen muy borrosa será por mi cal a ver a ver a ver ahí ahí va gracias por avisar gracias gracias era porque estaba se había puesto que va a utilizar para vídeo entonces quedaba bien ahora sí pueden ver esta preciosura en toda su expresión como se ve esta cosa de que estos quedan como altos y estos quedan como bajos y si ahora le hacemos esto mismo voy a copiar acá simulando que alguien lees nuestro paper que hicimos le interesa leerlos en un primer su presión a blanco y negro de láser tiene esto y ahora esto es totalmente claro que parte son esta partecita que está como relieve positiva y la otra es negativa y eso si no les voy a de cabeza bueno ya no sé qué más tengo que hacer me encanta me pedió con mi directora de este seis para para agregarlos pero bueno ese es lo último para para ver el tema de graficar porque vamos a pasar algo un poco más vamos acá porque no estamos graficando los campos como vienen pero estaría bueno hacer cuentitas hacer cálculos modificar estos datos que no sea solamente lo que hay sino justamente calcular relaciones y demás entonces vamos a empezar con con lo más casi lo más obvio lo más fácil lo más directo lo primero que uno podría hacer es calcular proveños y bueno lo bueno como yo les anticipaba al principio de tener los datos ahora como tablas es que cualquier cosa casi prácticamente cualquier cosa que se les ocurra que le pueden hacer si ya lo pueden hacer igual que lo harían con cualquier con de player en su vida normal entonces por ejemplo si quieren hacer bueno como calcular el promedio un campo de promedio de temperatura superficie del mar de todo el año todo el promedio y eso es esencialmente calcular el promedio de la variable de sct para cada punto para cada longitud que es se traduce es una operación que se traduce directamente en el paradigma de agrupar summarize y demás se para ver el ejemplo como sería esto y si lo hacemos con idea de de player ahora abrimos esto podríamos grubar y ahora estamos y ahora comprimpulamos con summarize en sct vamos a poner un grupo porque si no va a haber algo y básicamente ya tenemos el campo y lo podemos incluso tenemos y esto sería la temperatura media de la superficie del mar usando todo el año podríamos si quisiéramos ver cuánto los campos medios por mes lo único que es es agarrar la cara y meterle algo así creo que esto es pero hay una cosa de lucridate y obviamente acá como participaba y va a tener problemas ahí con la función más si estoy usando sct 1 que tiene un solo campo no la idea se va metiendo que era el campo medio ahí va entonces datos tiene sct ahora sí tenemos todos los campos medios por mes y también podemos hacer cosas como seleccionar datos podríamos si queremos filtrar algún punto en particular que nos interesa simplemente por ejemplo digamos de hacerlo pacífico y ahora lo que tenemos es una serie temporal esto perdón 180 medio de pacífico por ejemplo lo que es una cosa interesante para ver en esta hora sería ver cómo se comportan temporalmente distintos puntos que podrían ser distintos entonces yo acá tengo guardados un par de puntos que pueden ser interesantes que son bueno este el medio pacífico 080 180 180 180 180 180 50 de hecho vamos a mostrar los acá vamos a hacer esto y no me hubiese lo que pasa cuando lo hicieras con sus amigos estos tres puntos uno en el ecuador otro en el norte aca y otro en el sur ahí cerca del estrecho de el pasaje de radio y si queremos entonces ver cómo se comporta temporalmente lo que podríamos hacer es directamente hacer un show con estos puntos decir también datos y sería un right join porque queremos quedarnos con lo que está a derecha que es puntos si corremos esto lo que estamos haciendo estamos filtrando esos puntos en particular entonces fíjense que tenemos estos puntos ahí nada más y podemos ver y vamos a ver más latitud y entonces ahora vamos a ver las estitas temporales vemos por ejemplo y acá ya se ven cosas interesantes como que acá o sea en estas temporales están en los extraterrópicos se ve claramente la diferencia de temperatura medio bien tropical bien casi polar y hay un ciclo anual super super evidente incluso acá también mientras que acá en la parte tropical no hay mucho ciclo anual es casi la variabilidad de más de más larga frecuencia que es que un año y como este ciclo anual es tan fuerte y la verdad que no es muy interesante porque ya sabemos bueno si en verano es caliente en vierno frío nadie va a escribir un piper sobre eso lo que se suele hacer o uno muchas veces quiere hacer es calcular las anomalías con respecto a ese ciclo anual si o sea restable el promedio de cada mes y bueno eso haríamos un grupo de entonces para cada mes y cada longitud y la actitud un mutate creemos una nueva columna que se llama scta de anomalía entonces tan simple como la dato menos el promedio el promedio obviamente para cada punto hacemos algo de esto y el promedio agrupando por mes o sea todos los enero es todo el febrero y lo que yo voy a hacer acá es esto porque hacer uno en group esto es lo que odio de de player que deja a los grupos hallando vueltas y voy a sacar ms si o sea porque acá te lo crea y y es por mes no por cada ahi acabo de leer el chat tarde no es mosca, es polilla, por alguna razón no me encuentro, no me llevo tan bien con deplay y ahora podemos graficar algo un mes en particular o sea a filter time igual a algún tiempo en particular o según el leitorio cuento cintos constituyen y ver qué pinta tienen las anomalías y cómo son las anomalías, ya directo usar la escala de urgente. Ahí tenemos algo interesante, vamos a viendo este mes, si se fijan, esta estructura como que cambies ya está ahí, ya la conocemos listo, está acá todo, esta es desde la ciclonal de meses, bueno veamos qué más hay ahí y ahí podemos ver que este mes en particular, este año particular, lo que nos está diciendo que acá en esta región del Pacífico Central tuvo unas anomalías o sea la temperatura y fue casi o más de 4 grados por encima de lo normal, decidí que creen. Por ejemplo, o sea que promedios uno podría calcular el desvío estándar o cualquier cosa de ese estilo, hacer sumas y multiplicaciones igual que con cualquier otro datos porque en definitiva son datos. Pero hay algunas metodos, algunas cosas un poco más complicadas que no es simplemente promediar o restar, que se llevan bastante mejor con los datos en formas de matriz, no en una forma medio rara, donde las cosas de los datos están alargados. Y uno de ellos es, por ejemplo, las componentes principales, no sé qué significa eso, los componentes principales, si no lo conocen pueden ponerlo en el chat, pero básicamente es tomar una matriz y como descomponerla en distintas matrices que explican la variabilidad de esa matriz ortogonalmente, sin que no estén correlaciones entre ellas, y que la primera componente explica la mayor cantidad de variabilidad posible, la siguiente componente explica un poquito menos, pero la mayor variabilidad que no está explicada por la primera y así. Es una forma, un método súper, súper potente y usado para reducción de variabilidad de dimensionalidad, por ejemplo, y para analizar datos así como estos espaciales donde uno tiene estructuras y formas y estaría bueno ver que caracterizarlas de alguna manera. Entonces, lo que hay meter tiene una función que se llama EOF, que viene de Empirical Portogonal Function, que es la forma que tiene los meteorologos y climatólogos de decirle a la análisis de componentes principales, es exactamente lo mismo. Y la cosa es que lo que hay que darle es una fórmula, una forma de decirle cómo esos tides definen esa tabla, larga tide, definen una matriz. Y la forma general de hacer eso es con una fórmula. Entonces, vamos a hacer EOF de nuestro campo de SST, una cosa que hay que hacer primero es sacarle los datos faltantes porque hacer componentes principales no permite datos faltantes. Entonces, todos estos, ¿se acuerdan que los continentes son datos faltantes? Vamos a sacárselos. Entonces, vamos a meter, se llama EOF y lo primero es la fórmula, que es esta forma que define cómo vamos a mover los datos. Y la forma que tiene es, le decimos cuál es la variable. Es parecido a cómo unaría la fórmula en un modelo lineal. Entonces, la variable SST y embajada es en función, se define como una función de, y ahora hay que poner lo que define las filas y lo que sostiene las columnas, separado por una barrita horizontal, vertical, como no. Entonces, ¿qué es lo que definen nuestras filas y columnas? Lo que define nuestras filas, podemos decir que es el tiempo o podemos decir que es la ubicación. En este caso de sea la ubicación, vamos a poner longitud y latitud. Este más es como el más del modelo lineal, es que está sumando, sino que estás como diciendo esto y esto. Entonces, lo que nos dice acá es que las filas van a estar definidas por las combinaciones de longitud y latitud, y las columnas es el tiempo. Y luego, bueno, un argumento que es n, que es la cantidad de componentes que queremos ver y yo voy a, ¿qué componentes queremos ver en realidad? Y vamos a poner las primeras dos. Nunca, y vamos a correr. Esto está grabado, después podemos contar la cantidad de veces que me equivoqué que puse SST en vez de datos. Entonces, acá hay como pequeño, digamos, pequeñas ventajas quizás de trabajar con los datos. Así que es que ahora, básicamente la mayor parte de este tiempo, que no es tanto, pero ahora, porque no son tantos datos, se toma en básicamente convertir esta cosa, y que a nosotros nos gusta tanto para trabajar en esta matriz. Que eso toma su tiempo a veces. Daría muy lindo poder trabajar con estas cosas, tenemos que tener los datos guardados con una matriz o una RAI, pero poder usarlos y hacer toda esta sintaxis tipo de player o tipo de table, pero todavía no se puede. Bien, entonces, ¿qué es, vamos a ver rápidamente qué es esto? Y básicamente son, qué ops, lo puse. Las siguientes son tres datatables de tres tablas, que son unas left o otras right y otras sdf de standard deviation. Y que la, básicamente la izquierda de la derecha viene de esto, de los que están a la izquierda de esta barrita y lo que están a la derecha. Sí, y acá vamos a tener, en este caso, campos espaciales. Si tenemos datos que dependen del objetivo de la actitud, sí, que es lo que pusimos acá. Y acá vamos a tener series temporales. Y la idea es que lo que está haciendo esto es descomponiendo todo nuestro abreabilidad espacio-temporal en una parte que sea espacial y la otra parte que es la temporal. Y para ver, tenemos una idea, vamos a ver la parte izquierda. Sí, que es esta temporal espacial. ¿Ese es espacial? Porque yo acá puse los virtudes de la actitud. Yo en realidad tengo la libertad de poner el mejor, definirlo como quiera. Pero luego tengo que saber cómo interpretarlos. Y vamos a, bueno, graficarlos. Phil con sdta, si está lo variable. Y este PC es las titas componentes principales. Yo les pedí acá 2, la 1 y la 2. Se acaban de tener PC 1 y PC 2. Vamos a graficar en facets. PC. Ahí va. Y bueno, como estos son siempre anomalías, vamos a poner una escala de divergentes. Quedó raro porque en realidad esto no está hecho correctamente, porque vamos a corregir esto. ¿Qué es lo que está pasando? Acá hay un error conceptual, si se quiere, que es que yo estoy, que al estar en una escala en una grilla regular, en la titulatitud, tengo muchísimos juntos acá abajo, en los polos, que en realidad representa en una área muy muy chiquita cada uno. Incluso, en el polo 90 grados, representan cero, prácticamente, literalmente, o están unos y los otros. Entonces, lo que hay que hacer en realidad, es pesar. Pesar esta variable para que el área sea, para que el peso de cada punto sea proporcional a su área. Y para eso hay que multiplicarlo por el coseno de la latitud, la cuadrada del coseno de la latitud, por 180, ahí estamos. Y esto es un detalle, en realidad. La ventaja de las cosas que están en mucho, el tiempo para hacer su café. Vamos a prepararse el mate, mientras eso se hace. Voy a comentar que, bueno, esto que está acá, que también apareció en uno de los campos de la normalidad, es este fenómeno de el enzo que les comentaba al principio, que es el líneo donde, periódicamente, acá tenemos temperaturas mucho más altas que normal, o mucho más baja que lo normal. Dejémoslo hacer. Y que explica, es una parte muy importante de la variabilidad del océano, y que es muy importante en el resto del clima. Y una forma un poco más fácil de definirlo, de definir este estenso, es usando, haciendo, agarrando la cajita acá, en una zona que se llama el líneo 3-4, que ya está definida de agua por muchos otros estudios. Y que, y tomando el promedio de las anomalías de temperatura. Eso de yo, yo tengo por acá los datos que voy a copiar, porque nunca vamos por exactamente cuántos, ahí estamos, es este. Entonces, es una cajita que está entre 5 y menos 5 de la actitud, y entre menos 170, o sea, 170 oeste y 120 oeste. Y fíjense acá que ya usé esta longitude, para convertir a la longitude de datos. Porque acá estoy usando, digamos, en esta comparación, estoy usando las actitudes que van entre menos 180 y 180. Entonces, lo que hago es, temporalmente para esta comparación, lo convierto, agrupo por cada tiempo y hago el promedio de las anomalías de temperatura. Entonces, en eso, lo voy a llamar en eso. Y esto, este enso es una serie temporal ahora, porque es un valor por cada tiempo, o sea que no hay nada demasiado raro en eso. Entonces, lo vamos a piscar. No fíjense, bueno, esta es la pinta que tiene este índice en estos últimos 40 años, donde hay estos picos súper altos, donde son estos el nínio monstruosos, que tienen un montón de efectos en la temperatura euroval, incluso, y en pintadas cosas. Bueno, vamos a ver en qué cosas, un poco. Recusir, recuerdan, en datos, tenemos, si los bajamos, no solo datos de temperatura de SST, sino de otras variables, de precipitación y de presión al nivel del mar. Entonces, lo vamos a leer, porque no los tengo leídos. ¿Venías de datos? Temperatura, para actual, yo ahí los voy a leer como, ¿qué nombre tenía? Bueno, vamos a hacer, no me acuerdo los datos, entonces, Plans, vamos, ¿qué nombre tenía estas variables? MSL, que es presión, NINSI level pressure, presión al nivel del mar medio del lugar, y TP total precipitation. Vamos a ponerle... Es muy malo, ¿no? Bueno, y ahora que la tenemos, lo que podemos hacer es fijarnos qué relación hay entre estas variables y el niño, este índice que armamos. Y podemos armar, podemos armar por relaciones o regresiones que nos dan interpretaciones un poco distintas. En este caso, vamos a hacer una regresión. ¿Y cómo hacemos eso? Bueno, primero tenemos que agregar juntar todo en una tabla. Entonces, tenemos que agarra presión y hacer un join. Cualquiera join, va a ser igual con NSI. Entonces, ahora vamos a tener nuestra tabla, nuestra tabla que teníamos hasta acá, estos son los datos espaciales. Y acá le agregamos el valor de NSI, que fíjense que está repetido. Bueno, en este caso, la actitud 90. No es solamente por la actitud, sino porque es 1 para cada tiempo. O sea que básicamente en cada coordenada tenemos el valor de ENSO, que es 1 para todo lo mal, no es un campo. No es un campo, es un valor para cada tiempo. Y ahora es donde si queremos hacer el valor de la regresión para cada, en un campo de regresión, ¿valor cuánto es la regresión de un valor? Vamos a hacer correlación mejor, porque acá como tenemos dos variables distintas, la regresión puede tener distintas distintas valores, depende de la variable, de la artimención de la variable. Entonces, es igual que antes. Vamos a agrupar por cada el objetivo de la actitud y ahora hacer una correlación. Y vamos a hacer vamos a hacer la correlación con el insilio del pressure ENSO34 por un lado y la regresión con la precipitación por el otro. Un buen grupo. Buenísimo y vamos a poner correlaciones. Y ahí ya está, es así. La ventaja de los datos así con una tabla, la calculamos, que ahora correlación va a ser vamos a hacer dos valores, la correlación con la entre ENSO y la precipitación total y la correlación entre ENSO y la presión al nivel del mar para cada logística de la actitud. O sea que tenemos un campo que ahora lo podemos graficar. Para graficar los dos vamos a hacer en un facet hagamos un pibotronger donde cols es cols es decir ahí tenemos ahora son campos de logística de la actitud y para cada variable el valor. Esto va a ser mucho más fácil para platear. Hacemos y ahora la divergente porque es parte de 0 de los positivos en nativos y es la variable. Aquí vemos el mapita ah el problema del mapita vamos a hacer voy a agarrar de acá porque el mapita el problema que tenemos es que nuestro file está relleno y ahora sí tenemos datos arriba de los confidentes. Entonces tocamos en un mapita con este es el mismo mapa de antes pero el file es un NNA para que no fué entre los contornos la división entre países y no. No faltó ahí tenemos la precipitación y la relación la correlación entre la precipitación entre el ENSO y la precipitación y la presión que ahí vemos de nuevo estas cosas acá las teleconexiones efectos al arbol cáncer puedes agarrar un cachito acá vamos a ver que tienen efectos de la precipitación también eso se lo dijo para ustedes si quieren seguirlos ahora cuando hagamos ejercicios vamos a hacer ejercicios ahora vamos a seguir entonces con ahora que viene todo esto vamos a hacer unos 10 minutos donde sigan igual que antes acá con los datos que se hayan bajado o replicar esto que está acá o terminar con las si no es la tercera parte la opción 1 a replicar los datos responder estas preguntas si hayas calcular las anomalías o las correlaciones o los campos medios que quieran o si la opción 3 bueno, lo que necesiten vamos a hagamos 10 minutos y vi tu pregunta Jesús vamos a prepararlo para cuando volamos creo que falta una gente que está ahí en las salas ya van a volver a volver, siempre volver le queda otra yo que dije siempre volver espero que hayan conseguido vosas lo primero que ahí Jesús rojo preguntó cómo representaría el p valor de las correlaciones de ese mapa ahí es un poco donde mi falta de deployer no sabría cómo hacerlo bien en deployer porque lo que hay que hacer es usar core.test que esto te devuelve varias cosas de la correlación incluidos el estimate es el valor y el pvalor entonces haciendo esto uno extrae esos valores y tiene una lista creo que Samarites creo que no se lleva muy bien con obtener las cartilistas si saben más de cómo manejarse, creo que hay que poner tipo de acá pero data table es directo entonces lo estoy haciendo acá, así que perdónenme pero básicamente calcular la correlación y tener el estimate y el pvalio y ahora esto devuelve una cosa que tiene longitud, latitud, estimate y pvalio acá lo estoy haciendo nada más para uno no lo estoy haciendo el melt y después es una cosa que hay que tener cuidado cuando uno calcula estos pvalores cuando uno piensa en los pvalores en forma espacial una de las cosas es que hay que tener cuidado es que si uno tiene que ajustar el pvalor de alguna manera porque piensen cuántas comparaciones cuántos test-dipotes se están haciendo acá uno por cada pixel si acá tenemos 144 por 72 será más o menos pixels estamos haciendo 10.000 comparaciones lo cual significa que si a un pvalor de 0,05 nuestro el error de tipo 1 nominal no va a ser 0,05 porque test-dipotes garantizo que al menos alguna por azar alguna de las 10.000 comparaciones que haces por azar te va a dar significativo mayor que eso más bien una forma más o menos de controlarlo es usando esta función que ajusta el pvalor y usar fdr que es false detection y eso más o menos controla eso creo que no es perfecto pero y luego ya tenés un campo de estimado de valores de correlación estimados en un campo de pvalores entonces lo puedes hacer como un contor donde el z es el pvalor y el break en el break que te interesa o puedes poner puntitos en donde el pvalor es menor que algún valor o hay un paquete que se llama gg pattern que permite hacer contornos y ponerle un patrón eso es como lo que se ve mucho en las revistas muy hecho de ponerle puntitos o algún rallado o algo donde es significativo o donde no es significativo entonces esto es lo que lo haría voy a igual después ahora como sigue esto primero voy a preguntar si tienen preguntas ahora terminamos unos minutos hasta este cuarto ahora dejamos un tiempo para preguntar y también lo que les vamos a pedir si son dramables es que xanen hicimos una corta de encuesta un formular de feedback para que nos digan que les gustó y que no les gustó ahí los mando pao pero les falta un htps y otra cosa que los invitamos a que vayan al slag al canal de slag de este tutorial y que compartan lo que fueron armando si es que llegaron algo que les pareció interesante y lindo pueden compartirlo y también pueden hacer preguntas acá si les da algo y allá voy a compartir este documento en vivo que tiene más o menos lo mismo que está en la página con algunas cosas menos pero esto por ejemplo creo que no está en la página así que nada preguntas comentarios que quieren hacer eso el podería del canal de este tutorial para si quieren compartir algo si quieren preguntas o más cosas por ejemplo ahí creo que Shiana decía lo del plot de EOF revisar el plot podemos ir allá y hablar sobre eso vale así que gracias por venir y los liberamos vayan a pueden ir a cenar merendar, almorzar o lo que sea que sea apropiado en su uso horario