 Buenas, buenas y muy bienvenidos al curso de procesamiento de datos. Soy Paúl Huckman y voy a ser tu instructor en este curso y antes de comenzar vamos a hablar de qué se trata cuando hablamos de procesamiento de datos porque bueno, al final tienes que entender bien qué vamos a estar haciendo en este curso. Bueno, cuando hablamos de procesar datos en general, en general referimos a la actividad de tomar algún documento, alguna gran mezcla de información y en alguna manera lo ordenamos y lo clasificamos para que logramos convertirlo a datos ya bien ordenados. Entonces es un trabajo de pulir información y de prepararlo y standardizarlo. Pero esto es el procedimiento general. Pero hay que recordar que obviamente nosotros hacemos este curso con un lento de materialismo urbano. Estamos haciendo este curso como metabolismo series y tenemos nuestro hub de datos y en este hub hay varios procesos, hay recopilación de datos, hay procesamiento de datos y hay análisis. Y este curso forma parte de tres cursos y ese es el segundo curso y ahí hicimos otro curso para recopilar datos, tal vez lo has hecho antes, tal vez no, no hay problema si no lo has hecho porque hemos separado los procesos y cualquier persona puede entrar en cualquier parte del proceso y colaborar con nosotros y con la comunidad para contribuir a nuestro proyecto pues y lo que tenemos en este sitio son fichas de ciudades y en cada ficha hay una cantidad de documentos y son estos documentos donde vamos a procesar datos. Entonces para ya capturar mejor de qué se trata tenemos que entender qué es lo que al final queremos hacer en metabolismo series. Entonces nuestra misión es colaborar con mejorar de forma sistemática la sostenibilidad de las ciudades de la siguiente manera. Queremos crear y compartir conocimiento acerca del metabolismo urbano y agilitar e implementarlo en políticas y en la práctica. Entonces esto es la misión pero para lograr hacer avances y para lograr compartir conocimiento un pedazo fundamental es tener datos y nosotros hemos visto en los años pasados que uno de los elementos que realmente hace falta en nuestro campo es el acceso a datos, datos abiertos, datos confiables y de tenerlos en una manera accesible y poder analizar así las ciudades ya tomando en cuenta todo lo que está pasando en la ciudad. Hay muchos hoyos en datos y mucha dificultad obtenerlos. Entonces el sistema que hemos hecho permita de recopilar datos y luego de presentarlos y de compartirlo con gente. Entonces cuando vemos en general el tema del metabolismo socioequenómico entonces a cualquier nivel no necesariamente ni de la ciudad vemos que hay muchos sitios y muchos recursos algunos muy buenos tome información. Aquí por ejemplo hay información mundial sobre los depósitos de minerales, la extracción, hay también sitios donde podemos ver cómo se mueve todo los flujos de materiales aquí igual podemos ver a nivel del país cómo se mueve todo y también vemos impactos a nivel mundial, verdad a veces a nivel nacional a veces a nivel regional los impactos que estamos haciendo al medio ambiente. Entonces nosotros estamos interesados en algo similar pero lo queremos tener a nivel urbano porque ya la ciudad sobre todo más y más importantes hay mucho crecimiento en las ciudades y hay un impacto mayor de las ciudades en el medio ambiente y también las ciudades dentro de distintos países tienen perfiles muy distintos. Entonces un entendimiento a nivel del país no es suficiente para realmente capturar qué es lo que está pasando y para lograr hacer intervención. Entonces por esto hemos creado el portal de datos dentro del sitio de Metabolism of Cities y ahí hay perfiles de muchas ciudades y en conjunto con la comunidad hemos estado recopilando datos y te invitamos también a ayudar a esto pero lo que vemos aquí es que tenemos datos de distintos tipos pero hasta ahora hemos estado enfocando en la recopilación de datos. Entonces cuando vemos en un perfil de una ciudad aquí vemos buenas aires vemos que hay un perfil y dentro del perfil tenemos una sección, una librería con data sets. También hay otros tipos de datos ya lo van a ver pero cuando vemos una ficha vemos los detalles meta y vemos aquí un adjunto y ahí ya está el documento que puede facilitar datos interesantes y útiles sobre los flujos y los stock y la población y muchos otros detalles interesantes y importantes pero esta información está así como un adjunto nada más aquí también en mapas y las mapas el sistema ya crea una visualización de los lo que se llaman shapefiles pero hasta ahí llega nosotros tenemos imágenes que muestra lo que hay dentro del mapa y tenemos las fichas de excel y los pf para los data sets pero hasta ahí básicamente es una gran librería pero que contiene como libros en sí por decirlo así y uno puede realizar lo que hay dentro del libro pero hay que hacerlo uno por uno entonces no está navegable para el usuario de navegar y de entender bien qué es lo que hay. Además todavía no es tan fácil extraer datos específicos pero al final lo que nosotros tenemos en el sistema diseñado es un portal que sí facilita al usuario de navegar por ejemplo los datos en el mapa pero en un solo mapa no en una imagen nada más sino un mapa intractivo donde hay capas y las capas vienen de distintos archivos porque uno de los problemas más grandes es que los datos están en actualmente en sitios web o en documentos distintos entonces puede ver que a un mapa sobre las plantas de energía que hay en la ciudad hay otro documento que facilite datos sobre las emisiones que ocurren hay otro capa que muestra sobre el uso de energía dentro de la ciudad en sí pero es súper interesante poder vincularles todos y poder visualizarles todos en un solo mapa entonces para hacerlo necesitamos procesar esta información que hay en alguna forma estandarizarlo y lograr que la base de datos lo logre leer que el sistema logre detectar bien que hay dentro de los documentos para poder crear este tipo de mapas y visualizaciones y no solamente son mapas así también queremos hacer por ejemplo comparaciones dentro de varios o dentro de ciudades o dentro de plantas de energía para poder decir bueno a ver cómo comparar uno al otro y a ver qué podemos hacer para entender mejor cuál es más eficiente también queremos hacer visualizaciones de data sets de las cifras para que hay mucho más es mucho más fácil entender qué es lo que pasa en lugar de ver una gran hoja de excel que podemos ver ya una visualización de los datos y poder comparar y activar y filtrar es estos datos si logramos hacer lo visual en general es mucho más accesible para el usuario como unicorriente y este es el usuario que queremos que logra navegar el sitio y que logra entender qué es lo que pasa dentro de la ciudad también queremos vincular los diferentes las fichas de la infraestructura con los datos que tenemos si tenemos datos de una planta de tratamiento de aguas negras en la ciudad y tenemos datos cifras de cuánta es el contenido de cierta contaminación dentro del agua o tal vez la cantidad de agua que sal o entra necesitamos crear una sola ficha para poder navegar todos estos detalles en un solo lugar otra cosa que queremos es lograr que el usuario pueda filtrar los datos porque a muchos diferentes usuarios le interesan diferentes cosas y es importante que no logran solamente bajar datos que están dentro de un solo archivo pero que también pueden filtrar y decir bueno a mí me interesa cierto tipo de material y quiero saber todo lo que tiene de una ciudad de este material o tal vez de todas las ciudades dentro de un país o de una región igual tal vez están interesados en todo lo que pasó en una ciudad pero en en cierta época en cierto año por ejemplo entonces así pueden ver filtros para lograr luego bajar información muy específico y ya así extraer la información reglante para tu proyecto pero para hacer todo esto necesitamos importar la información en alguna manera lo que nosotros sentimos que es uno de las cosas principales las metas principales es de lograr hacer un balance de materiales dentro de una ciudad porque como uno sabe las materiales no se pierdan verdad los flujos no se pierdan su uso en algún lugar y tiene un origen y un destino y si logramos hacer una balanza completa de los materiales puede ser un solo material puede hacer agua por ejemplo o puede hacer todos los metales o todos los materiales de construcción pero si logramos obtener todos los datos posiblemente de distintos fuentes pero logramos y a cargarlos bien en el sistema clasificarlos bien si ya procesamos todos los datos el sistema puede generar un balance de materiales y así visualizaciones donde podemos ver cómo exactamente es que fluyen los flujos de materiales y exactamente donde están siendo usados y luego uno puede clicar aquí navegarlo para entender mucho mejor qué es lo que pasa pero todo esto solo podemos hacerlo si logramos procesar la información que ahora tenemos en un formato muy en el formato original digamos que ya no todo y no logra leer bien el sistema entonces el proceso de procesar los datos contiene varios distintos elementos y eso no son pasos que van uno después de otro sino son distintos actividades que uno puede hacer cuando uno procesa datos y esos son ejemplos de tipo de actividades pero nosotros vamos a hacer en este curso algunos de ellos no todos entonces vamos a hacer validación porque toda la información que hay necesitamos asegurar que remete el válido y que tiene que merece ser cargado dentro del sistema a veces tenemos que ordenar los datos también el proceso de recapitulación que significa que tenemos que reducir la cantidad de información porque simplemente es demasiado y no nos sirve tener tanto igual la agregación como hay varios pedazos de datos y que tenemos que juntarlas para ya tener la información que realmente nos interesa y finalmente también necesitamos clasificar la información que hay para que el sistema puede leerlo y puede entender este es la cantidad de material este es el lugar etcétera etcétera entonces necesitamos hacer todos los procesos y según el estado del documento original vas a hacer todo esto vas a ser solamente un solamente vas a validar listo todo depende del documento que vas a trabajar pero en el curso vamos a aprender todo esto para lograr ya procesar la información y la actividad de analizar y de reportar es algo que estamos viendo en el último curso porque primero necesitamos procesar los datos para que el sistema lo pueda leer y puede visualizarlo y cuando ya tenemos todo esto ya vamos a entrenar a los a ustedes de cómo pueden analizar y reportar información que ya está procesado en y dentro del sistema bueno esto es un resumen en breve de cuáles son las actividades que estamos viendo en este curso ya vamos a entrar más en el detalle sobre los elementos fundamentales en este primer módulo de cuando vamos a procesar datos pero hay algunos requisitos unos prerequisitos a tomar en cuenta antes de comenzar entonces si has hecho primer curso estás bien no hay problema estás listo pero si no es importante que logras entender un poco de qué se trata en el data hub que tenemos en metables homocéticos entonces navegarlo y revisar algunos fiches de distintas ciudades para que tenés en idea de qué es lo que hay dentro de esto portal para saber bien vamos a estar trabajando ahí entonces para entenderlo bien de qué se trata la plataforma luego tienes que tener un entendimiento básico del materialismo urbano y tenemos algunos vídeos para esto si todavía es un concepto que no tenés tan tan claro pues y luego tenés que tener data para procesar y si has hecho el otro curso está bien ya tenés data de datos de tu ciudad pero si no vas a poder escoger datos de otras ciudades que otra gente han trabajado entonces siempre tenemos datos pero tenés que escoger qué ciudad vas a trabajar lo vamos a ver nos luego el curso no te preocupes ahora pero esos son los prerequisitos para el curso y como dije si no has hecho el otro curso pos entrar al curso de recuperación de datos y revisar algunos vídeos por lo menos la introducción tiene un vídeo de qué es el materialismo urbano entonces ahí podés revisarlo y ver algunos otros vídeos si querés para ya familiarizarse con el material con el tema de que estamos tratando y eso es lo único al resto lo vas a aprender dentro de este curso bueno esto es todo mucha suerte espero que lo vas a disfrutar y aquí vamos a verte en el siguiente vídeo cuando vamos a entrar ya al material del curso