 Bueno, muy buen día, muchas gracias por estar aquí. Soy David González, formo parte del equipo de América Latina del OCCRP, que es el Organized Crime and Corruption Reporting Project, una organización global que se dedica a hacer periodismo de investigación con redes en casi prácticamente todo el mundo. Y bueno, me acompañaba Mario Fick Patrick, coordinadora de datos de infobades, somos parte de la comunidad del periodismo de investigación en América Latina y bueno, venimos a hablarles de ALEP, que es una herramienta desarrollada por el OCCRP, que es bastante poderosa para apoyar proyectos de periodismo de investigación específicamente, pero también otro tipo de investigaciones, por lo cual estamos aquí, queremos compartirle, bajo este nombre de seis formas en las que ALEP te puede ayudar a hacer una investigación. Yo voy a estar hablando sobre todo del tema de ALEP en sí mismo, es una perspectiva no bien de usuarios, somos periodistas, no somos necesariamente técnicos, con lo cual es una perspectiva de personas que hemos usado la herramienta. Aquí están enumeradas rápidamente las seis razones, que son básicamente seis funcionalidades que puede tener la herramienta, que sirve para hacer búsquedas generales, exploraciones muy específicas en bases de datos, puede ayudarles a tener un espacio personal para uso de las propias investigaciones, y dentro de eso otras cosas que puedes hacer, como subir tus propios documentos, hacer listas para referencias cruzadas y hacer gráficas relacionales, cosa que vamos a ir hablando un poquito más en detalle, a medida que avancemos en la presentación. Entonces bueno, lo primero, ahí tienen el QR y además la dirección, donde pueden encontrar la herramienta. Básicamente ALEP es una herramienta que es definida por la jefa de datos de América Latina como una suerte de Google para periodistas, como les digo, puede tener utilidades más allá del periodismo, pero es una herramienta que tiene una especificidad para el uso en el periodismo, sobre todo en investigación. Porque bueno, cuenta sobre todo con acceso, con bases de datos que han sido integradas allí, de entidades públicas de más de 141 países, y que se pueden revisar de una manera muy específica dentro de esa plataforma, correcto. También cuenta con algunas filtraciones que gracias al trabajo periodístico han sido obtenidas. Lo interesante de esto, aquí ponemos este gráfico un poco para hacer el apunte general, es que ALEP está desarrollado en un modelo en el que identifica principalmente pistas que los periodistas solemos utilizar en nuestras investigaciones. Por ejemplo, si estamos buscando el domicilio de una empresa, ALEP tiene una capacidad especial de identificar domicilios, números de teléfono, cuentas de correo, a veces cuentas hasta si hay una información sobre una cuenta bancaria, una cuenta bancaria, si existe la información, es decir, identificaciones, números de pasaporte, DNI, etc. O sea que está construido de una manera que permite, en materia de periodismo de investigación de extrema utilidad, porque permite compararse, por ejemplo, este individuo es quién es basado en dos identificaciones de fuentes distintas y uno compara el DNI de ambos y dice, bueno, sí, es correcto que esta es la persona o la fecha de nacimiento. En fin, se presenta, está construido de esa manera y ayuda mucho para los procesos de investigaciones. ¿Cuáles son las ventajas? Tienes un lugar seguro para tus datos y tus documentos. Se trabaja muy fuertemente en el tema de la seguridad. Tiene un acceso diferencial para periodistas pero también para otro tipo de investigadores, con lo cual, simplemente el OCCRPILO que hace es analizar la solicitud que presenten para acceder al sistema y, después de eso, teniendo el acceso, pues existe ese acceso diferencial y, bueno, una gran disponibilidad de bases de datos que pueden ser de gran utilidad. Búsquedas generales, creo que es bastante, digamos, se desprende del propio término. Aquí tenemos un ejemplo con Odebrecht, una empresa brasileira, digamos, involucrada en el caso La Vallato. Simplemente anotas y ahí empiezas a ver donde en qué bases de datos está mencionada Odebrecht. Ahí vemos que aparecen el Registro Nacional de Contratistas de Venezuela en otras bases de datos, propias de La Vallato, en fin. Entonces, con una búsqueda general de una compañía ya puedes tener ese tipo de funcionalidad. Aquí vamos a ir alternando porque Mario les va a ir comentando ejemplos de uso que ella ha tenido. ¿Qué tal? Buenos días. Gracias por estar acá. Bueno, como les decía, David, estas herramientas de ALEF nos sirven a los periodistas que quizás a veces no tenemos a mano un Data Scientist para ayudarnos, a veces sí, pero a veces no. Entonces, podemos utilizar esta herramienta para ayudarnos a procesar la información. Este es un ejemplo del Dataset de Poletines Oficiales de Paraguay que son documentos PDF que fueron... Los subimos a la ALEF, o sea, al subirlos a la ALEF este tipo de archivos que suelen ser en un formato PDF que no podemos trabajar, los convierte a texto. O sea, lo puedo tener en un formato que, por ejemplo, me permite hacer por un lado tenerlo en la imagen tal cual yo lo puedo ver en la web. Y por otro lado, hay un campo de búsqueda arriba a la derecha ahí donde está la lupita donde yo puedo buscar, por ejemplo, si estoy buscando una empresa de Poletines Oficiales de Paraguay o una persona con esa lupita puedo, con esa palabra clave, en esta forma de subirlo tiene una ventaja que es que yo puedo verla como PDF o como texto. Si ustedes ven arriba decía View, Text and Mentions. Allí tenerlo como texto la búsqueda es más fácil. Entonces, con esa lupita yo puedo buscar lo que me interesa en un documento que a veces tiene muchísimas páginas como los PDF. Y por otro lado tiene una herramienta también muy atractiva, que es Mentions. Mentions es naturalmente ALEF es lo que hace identifica nombres y datos que pueden ser de interés para un periodista, como pueden ser teléfono, nombres de empresas, nombres de personas. Esto lo hace digamos, con un criterio periodístico automáticamente ALEF. Y si yo me paro en uno de esos nombres que naturalmente me extrajo la herramienta eso me va a llevar en qué bases de datos están esos otros nombres. O sea, si yo estoy trabajando supongamos, o estoy buscando información de Juan Salazar que aparece en ese boletín oficial de Paraguay, ahí me va a identificar como hay un nombre y lo extrajo automáticamente me va a identificar en qué otras bases de datos cargadas en ALEF yo puedo tener más información de esa persona que es la que a mí me interesa puntualmente sobre la que puedo estar trabajando. Así que vamos a ver después otro ejemplo, pero esto es una forma de en qué medida esta herramienta nos sirve para trabajar con un PDF que puede ser de muchas páginas y difícil de navegar. Correcto, eso en cuanto a las búsquedas generales y patrones de uso después está la exploración de bases de datos específicas al principio les mencionaba el ejemplo de Odebrecht, uno pone Odebrecht y empieza a salir bueno, está mencionado en el registro de contratistas en Venezuela, en el registro de compañías de Brasil, en fin entonces ahí uno tiene una disponibilidad amplia de bases de datos en la columna de la izquierda se muestran en este caso por ejemplo, cuántos registros de compañías, de contrataciones de personas de interés, de gazetas de licencias y concesiones en fin, una cantidad tremenda de bases de datos específicas que puedes, digamos, escoger para navegar y buscar datos en ellas y de pronto estás haciendo investigación sobre Brasil, precisamente sobre Venezuela o Argentina puedes ir a la base de datos específicas de la Gazeta Oficial Argentina y ahí hacer una búsqueda, luego está la, digamos, la lefteda roja, apenas entras una descripción del tipo de documentos, las cantidades de documentos que están asociadas a esa base de datos por ejemplo, esta que tiene la Gazeta Oficial Paraguayas señala que tiene 5.000 documentos ya reconoce automáticamente correos que están mencionados en los documentos algunos números de teléfono y bueno, al momento de hacer cruces de las investigaciones es de una utilidad tremenda desde el punto de vista periodístico sigo, sigo yo ahí, esto en cuanto a las búsquedas generales después yo creo que la segunda gran funcionalidad que es muy atractiva es la posibilidad de tener un espacio propio un espacio propio digamos que nosotros en la nomenclatura de ALEF se llaman investigaciones simplemente la abres y a partir de allí cuentas con privilegios de administración para invitar a alguna persona un investigador asociado al proyecto que estás desarrollando y empiezas a gestionar con las posibilidades que te da la plataforma y la herramienta, aquí básicamente vamos mostrando los pantalla son las capturas de pantalla como se abre la investigación se abre la investigación, no hay investigación le pones el nombre que deseas, una breve descripción y a partir de allí tienes, digamos, acceso a esta pantalla que te permite como que estén aquí mencionadas como subir documentos y demás de los cuales vamos a estar hablando en un momentito con este ejemplo que va a mencionarles más Sí, quería pasamos una antes ahí Sí, bueno, esto era como subir cuando yo creé una nueva investigación este era un ejemplo de SCAP Conference y luego yo creé, por ejemplo una investigación sobre Cristina Kirchner un ejemplo para que ustedes puedan ver cómo trabajarlo en esa investigación que en una de las slides anteriores también se podía compartir con otros con un mail, con otras personas que están usuarios dentro de Aleph entonces yo puedo trabajar conjuntamente sobre una investigación lo que hago es subo un documento en upload document entonces, por ejemplo, en esa investigación que yo me abrí subí los fundamentos del fallo contra Cristina Kirchner la vicepresidenta que era un documento extenso de 1600 páginas que a mí me resultaba difícil de trabajar para ver la información que tenía entonces yo subí ese PDF luego, si yo me paro sobre el digamos, donde está el archivo, el PDF ahí me va a mostrar qué cosa, me va a mostrar el documento como ya les había dicho anteriormente me voy a mostrar en PDF original porque era un documento judicial en PDF y a su vez Aleph me lo convierte automáticamente en texto entonces, al tenerlo en texto, yo luego puedo trabajar con las funcionalidades que les había dicho antes puedo hacer búsquedas, por ejemplo si a mí me interesa ver cuántas veces aparece Lázaro Baez que es un empresario asociado a los negocios que tenía la familia Kirchner entonces ahí me va a ir llevando a través de ese documento judicial que es muy extenso de las funciones de Lázaro Baez que era lo que en principio yo quería ver para ver también qué otras conexiones puede haber sobre ese nombre que yo estoy mirando dentro de Aleph también es interesante porque si yo estoy buscando ese nombre me va a tirar luego en otra base de datos hay otro lugar donde está cargado Lázaro Baez que yo pudiera ver de qué se trata eso entonces hace asociaciones dentro de la información que está cargada adentro de Aleph, dentro de sus montones de base de datos que tiene que ahí al principio habíamos el número ahora no lo recuerdo pero entonces me asocia los nombres y yo puedo tener más información de la que tenía en mi universo original y puedo ir subiendo eso puedo mirarlo desde mi carpeta investigación que yo bautice y que además tengo acceso a yo pero los que yo pueda compartirlo también pueden tener acceso para ir haciéndolo en forma colaborativa base de datos de 141 países tenemos 5 minutitos para seguir bueno subir documentos creo que ya ha quedado bastante claro por los 2 ejemplos anteriores aquí simplemente mostramos como Aleph te muestra el panel para que hagas precisamente eso como lo subes y aquí está el ejemplo que va contando Marien de la... perdón, esto era entonces acá se ve el PDF tal cual el documento judicial que se ve y luego está en opción texto y si después yo busco por ejemplo dentro de ese documento la palabra empresa yo quiero saber la cantidad de veces que aparecen mencionadas empresas para ver qué empresas aparecen en ese fallo con una búsqueda de palabra clave empresa me va a ir tirando en cada parte donde está eso me facilita el trabajo si quieres avanzar una más luego hay una funcionalidad importante que es la de crear listas por ejemplo si en este trabajo que hace Mariel aquí aparece 20 nombres esos 20 nombres nosotros a su vez los podemos reorganizar y compartirlos con el Aleph y aprovechar una de las funcionalidades que a mi me parece más interesante es que es crear los listados de personas con un objetivo y ese objetivo es hacer referencias cruzadas o sea puedes hacer una investigación específica para tener una lista de personas y después mirar compararlo con todo el corpus de bases de datos de Aleph por ejemplo en este caso yo lo que hice fue extraje de esos nombres de, perdón extraje primero los nombres de los acusados junto con Cristina Kirchner y en New Lease lo que hice fue cargué yo a mano los nombres que yo quiero cruzar que son el resto de los acusados con la nacionalidad y la fecha de nacimiento con ese formato que es año, mes y día que está especificado en la herramienta porque así me muestra en qué otras bases de datos de Aleph yo tengo mencionado a esas personas condenadas y que quizás están vinculados a otros casos, a otras situaciones a otras empresas esa lista la puedo cargar yo y armar personalizar la lista que yo quiero cruzar por ejemplo Raúl Nelson Periótip está mencionado en ese documento y uno lo pone en el Aleph y resulta que tiene cuatro compañías en Panamá tres en el Reino Unido y de eso no se habla en el fallo entonces ya tienes una aplicación automática de las posibilidades que te da Aleph para hacer y complementar y seguir pistas investigativas entonces eso es lo que llamamos la referencia cruzada y después la posibilidad de todo esto surgen relaciones que son muy complejas de graficar diagramas o bien tu manualmente o a través de las ayudas de las listas que presentas para ubicarte en relaciones de datos que se manejan de investigación periodística pueden llevarte a eso y tener cosas como esta muy sencilla en el caso venezolano Hugo Chávez, Nicolás Maduro o otras pues y otras gráficos más complejos bueno de momento lo dejamos hasta aquí para cumplir los tiempos y bueno les invitamos por supuesto que si tienen interés en Aleph nos pueden buscar podemos responder preguntas a la orden y bueno aplicar se aplica a ustedes mandan su aplicación si acorde eso pueden mandar la aplicación y simplemente a partir de ahí a usarlo y a completar su investigación muchísimas gracias por su atención hay una posibilidad de preguntas ahora hay alguna pregunta que tan potente es el OCR que extrae PDFs porque sabemos que luego hay PDFs escaneados, fotocopiados vuelto a escanear consejos realmente extrae la gran mayoría o han tenido problemas de algunos que no se pueden leer como perspectiva de usuario no hablo como técnico no puedo dar una apreciación pero en el tiempo que llevo usando Aleph es realmente potente tiene una gran capacidad de extraer el texto de los PDFs y tu manejarla a partir de ahí a tu conveniencia si no he encontrado un caso todavía por decirla en una experiencia de uso en el que haya algo que se le haya quedado fuera de los PDF yo diría que es bastante atractivo de ese punto de vista ¿Puedo hacer otro? ¿Ustedes mostraban que extraía por ejemplo nombres de instituciones eso no sé, bueno, a lo mejor es más técnico pero ¿saben cómo se hace? o sea, tienen catálogos esa extracción a través de análisis de lenguaje natural ¿Cómo se hace? No, me supera en esa pregunta lo que sé es que lo hace y lo hace bastante bien en términos generales O sea, la pregunta es porque si son catálogos esos catálogos tienen que construir y pues veo que es una herramienta a nivel latinoamérica entonces para saber si hay catálogos en distintos países esto tiene alcance global nosotros, digamos, formamos parte de la comunidad latinoamericana que trabaja con el OCCRP pero ahí tiene bases de datos de Malta bases de datos de Rusia lo que tú imagines lo puedes tener allí y a partir de allí, bueno, con el uso y la inteligencia periodística apropiada, puedes ir te orientando para encontrar información cruzada en otros países si vos recuerdas al principio cuando era el tipo de base de datos a la izquierda identificaba las distintas bases de datos, por ejemplo, leaks de distintos leaks internacionales que consigue, son documentos filtrados que nomás son documentos confidenciales que OCCRP accede y los partners de esas investigaciones por ejemplo se van subiendo ese tipo, diferente tipo de base de datos en el cual vos podés ir filtrando y viendo también hay algo que creo que vos lo dijiste o no, pero hay como dos tipos de acceso un acceso libre que es un poco más acotado en la cantidad de vasos de datos o sea que cualquiera puede entrar y luego cuando vos pedís sumarte a OCCRP, tenés un acceso a la totalidad de las bases de datos o sea un acceso más restringido que es para común, entrando normalmente y sino aplicando por una cuestión también de seguridad de OCCRP ok gracias gracias vos por las preguntas muchas gracias les agradecemos mucho a Andrés y Mariel