 É o logo para o vídeo que estás gravando. Agora sí. Podemos empezar ya? Perfeito. Aora, muchas gracias por volver del café, que sempre se agradece e volvais. Sobretudo, por isso ponemos estas charlas de esta gente maravillosa, justo... justo despues. Lo voy a presentar. Aqui dice que Fernando Puente se presenta como informático de vocación e de profesión. Buena persona, amigo de sus amigos, un clásico de Ponte Vedra, nació en el 75, agora con bigote de serie, vive en Madrid, pero puedes encontrarlo en cualquier congreso e en los mejores furanchos. Esta es su vigesimo novena workham. Correcto. Como oponente. Todas las disfruta como si fuera la primera, así que aprovechar todos a pasillar con el, hablar de tecnología, de negocios o sobretudo de comida. E nada, no está en un tema del que no se habla mucho, así que muchas ganas de escucharte. Bienvenido. Gracias. Buenos días. Bienvenidos a esta charla. Gracias por acudir a esta ponencia, en la cual vamos hablar hoy, al igual que estamos hablando todo el dia, de contenido. En este caso, de como proteger el contenido. Nos cuesta mucho generarlo, todo o tipo de contenido, texto, imágenes e al final lo que queremos es, por un lado difundirlo e seguramente generar negocio con él, como decía hace, perdón, hace unos cuantos años nuestro querido Bill Gates, en el final el contenido, es eso que decíamos, el reino, de onde vamos a sacar realmente el dinero. E como decía antes, nos cuesta mucho generarlo, puede ser el esfuerzo, puede ser dinero, lo que queremos ahora mismo es protegerlo. También queremos difundirlo. Así que ao largo del dia de hoy, en esta charla vamos a ver estrategias que muchas de ellas os pueden ayudar a entender como proteger ese contenido de posibles actores maliciosos e también, pues como mejorar las estrategias que actualmente tenéis en eso, en la defensa de vuestros contenidos. Como decía antes Juan, pues soy Fernando Puente, soy embajador de marca de Rayola, soy además consultor, especializado en performance e soy además profesor del curso de periodismo deportivo. E como decía antes, vamos a hablar de proteger el contenido. Que tipo de contenido e como lo protegemos? La verdad es que hay una solución muy fácil e sencilla e además es legal, que es las famosas condiciones generales. Esos testos que leis cuándo llegáis a todas e cada uno de vuestras webs que visitáis, donde expresáis cuáles son los derechos de uso, la propiedad intelectual, leis todos esto, cada vez que llegáis a una web. Está a la solución, esto é o que tenéis que hacer. Pero quanto de vosotros pensáis que esto soluciona realmente proteger el contenido? Alguno lo piensa? Realmente no. Internet se ha convertido en una jungla e isto realmente nos protege porque además están los actores maliciosos que veremos hoy, aquellos que nos vienen e nos copian el contenido, aquellos que nos roban las imágenes, aquellos que nos duplican el contenido, aquellos que nos atacan. O sea, que ao final esto, muy rara, a veces funciona. Así que vamos a ver qué otras estrategias podemos hacer. Todas legales, muchas de ellas a través de una implementación técnica o a través de una implementación lógica para ir protegiendo nuestro contenido. O primeiro de todos, de los humanos. Lo sé que quería llamar humanos en este caso. Los voy a licenciar de aquellos que son automatizaciones ou aquellos que son bots. E son propuestas muy sencillas. Aquellas desde que arranca eliminando algo tan sencillo como o botón derecho. Que bueno, es una práctica para al menos ir poniendo capas para que no puedan copiar el contenido o que no puedan seleccionar el texto. Recordemos que estamos viendo a un humano que viene a visitarnos nos copia una frase o le da al botón derecho para intentar copiar o texto. Son todos esos que vienen a robarnos el contenido. Insisto en lo de robarnos el contenido. Que nos ha costado mucho generar e luego, además, pues al final lo va a poner en su web e encima nos va a hacer competencia. Outra de las estrategias que podemos tener son marcas de agua en nuestras imágenes ou añadir funciones de copyright, añadir metadatos, añadir humor de pago. Como veis, hay una gran cantidad de estrategias para ponen una serie de limitaciones. Cuidado en todas estas estrategias tener siempre en cuenta podemos ir en contra del SEO de nuestra página por ejemplo, se ponemos un muro de pago o en contra de la experiencia de usuario si hacemos, por ejemplo, un modelo freemium. Pero esa es un pouco la idea que os quiero transmitir. Que podeis implementar ese tipo de estrategia. Algunas, por exemplo, incluso de acceso condicional como habréis visto en algunos medios que os dejan leer unas cuantas entradas de su sitio y a la cuarta o quinta entrada e os pasan a un modelo freemium. Bueno, pues es una manera rudimentaria, por así decirlo, de proteger el contenido al menos de esos humanos. Tambien hay situaciones en las cuales queremos proteger el contenido de traducciones automáticas porque estamos, por ejemplo, protegendo nuestra marca, estamos protegendo el texto, no queremos que se traduzca. Es otra de las razones que tienen los malos para copiarnos el contenido. Algo que está estricto en inglés, me lo traduzco a español, bueno, a través de traducciones automáticos. Tambien tenemos los métodos para protegerlo a nivel de página e incluso a nivel de elemento. Ésto se utiliza mucho en protección de marca porque no queremos que nuestra marca se traduzca automáticamente. Podemos dejar, por exemplo, que se traduzca toda a página pero que nuestra marca o una palabra específica no se traduzca. O segundo actor son los que yo denomino Seocotillas. Seocotillas, aquel que viene no por el contenido, viene a enterarse de máis cosas. Que é o que está buscando? Está buscando realmente como en nuestro enlazado, como en nuestra jerarquía, porque é parte también del contenido. É nuestra estrategia de contenido. Cómo lo ponemos, dónde lo ponemos, de qué manera lo ponemos, nuestro enlazado, interno, externo. Incluso vienen también a ver o dato sensible de nuestro sitio. A través de herramientas o bien, como veíamos antes, a través de intervención humana. Tambien podemos establecer estrategias, podemos eliminar los fichs de contenido que como todos sabéis automáticamente tiene Wordpress, podemos limitarlos para entorpecer esa lectura, podemos también bloquear los comentarios, podemos añadir, como decía antes, marcas de agua, podemos hacer estrategias de Hotlink que para aquellos que nos sepan é aquellos que utilizan nuestras imágenes de nuestro sitio en su web. Directamente, no nos copia la imagen se lo que hacen é servirla en su sitio. Es decir, unha serie de propuestas de nuevo, volver a intentar proteger. Lo mismo de antes. Podemos ir en contra de, en este caso, se utilizamos estrategias de Hotlink, o tema de compartir nuestras imágenes en redes sociales o compartir nuestras imágenes en otras plataformas. O sea, que é sempre con cuidado, ir buscando esa balanza. Tambien os pongo un ejemplo para incluso bloquear aquellos acesos que é o que se llama incrustar a través de un e-thrain. Para aquellos que no lo conozcais, también son técnicas que se han utilizado onde a competencia tiene un contenido e o que haces incrustar en nuestro se non lo tenemos bloqueado. Quando utilizan herramientas automáticas, aqui os pongo alguns ejemplos que vienen a escanearnos por ese concepto de SEO, pero pode ser SEO o pode ser robar o copiar el contenido. Bueno, pues unha de las estrategias para proteger-lo seria bloquear todos esos user-alien, que son os habituales relacionados con ese escrapeo SEO de nuestro sitio. E por último, pues aumentar la seguridad de vuestro sitio, porque también pode ser un ataque o que estén intentando para bloquear-os. Non solo necesito proteger que non se me lleve en el contenido, necesito proteger que mi web siga activa con muy buenas prácticas. Teniendo una buena estrategia de certificados, con un proveedor de confianza, en general buenas prácticas. Teniendo diferentes entornos, teniendo contraseñas seguras, todo eso que se habla casi siempre, eso también es proteger el contenido, porque estamos protegendo nuestro sitio de que siga vivo. E, en último caso, como os pongo aquí, pues hay outro tipo de soluciones. Hay la posibilidad de acudir al DMCA, hay la posibilidad de solicitar unha retirada de contenido a través de los buscadores, es decir, hay soluciones un poquito más allá si sois capaces. Non son inmediatas, non son rápidas, pero en algunas infracciones de copyright o en algunas infracciones relacionadas con contenido es la única manera que tenéis de protegeros de ese tipo de competencia. O siguiente actor serían los que ya son no humanos. Aqui nos metemos en el mundo del escrapeo, que ahora se habla tanto, eso de las web automáticas, eso del escrapeo de contenidos, ese tipo de cosas. Escrapear non es ilegal, es ilegal el uso. Lo que sí es ilegal, por ejemplo, es que a través del escrapeo que os haga un tercero, os tire el servicio, porque entonces se consideraría al ataque. Pero sí, quiero dejar aquí claro que escrapear una web está consentido e, además, se lo consentimos. A no ser que lo bloqueemos, se lo bloqueamos con una serie de estrategias, entonces sí es algo ilegal. En este caso seria algo parecido a lo que veíamos antes. Colocamos reglas específicas en el robuste XT, filtramos el userIen, al final con ese objetivo de que no nos escrapeen, de que no nos vengan o que les limitemos ese escrapeo. Hay una que me gusta mucho, que son los famosos Honipods, que son las trampas, que a mi me encanta, sobretodo en sitios de clientes donde sufren muchos escrapeos, me encanta a hacer lios a sus robots e que estén en un bucle infinito. Me encanta muchísimo. Me divierto mucho en gastarles los recursos. E luego ya se cansan e non vuelven. Con lo cual, al final consigo consigo eso. Podemos añadir capsas también, como seguro que habéis visto que hay en algunos sitios, que detectan un número alto de peticiones, pues añade un catcha para que haya una validación humana, es decir, aquilo que estamos intentando en este nivel es todas esas herramientas que son automáticas, poner una serie de impedimentos para que, al menos, les cueste lo más posible llegar hasta o contenido. A nivel de WordPress tenemos, como decíamos antes, dos posibles, tanto los fit, pues también lo podemos deshabilitar, sino en nuestra estrategia, o la famosa resapi. La resapi, al final, es algo público donde también nos pueden escrapear os contenidos. Eso es algo también que podemos desactivar. Aquí, como veíamos antes, os pongo ejemplos. Estos son os user-alien habituales para os escrapeos, hay más, o también lo pueden inventar, lo pueden cambiar o user-alien. Hay algunos más avanzados que incluso utilizan o user-alien de Googlebot para simular que el que nos está escrapeando es la araña de Google, pero bueno, se les puede detectar por outra serie de razones, la red de la que viene, en la zona geográfica de la que viene, en ese tipo de cosas. Estos son os más habituales ejemplos, como veíamos antes, como desactivo o fit de nuestro sitio, muy habitual también, sino lo necesitamos, aunque aquí, de nuevo, vuelvo a la balanza de necesitamos proteger o necesitamos difundir. E, lo mismo para el caso de la resapi, que ahora mismo nos aconsejo deshabilitar la del todo porque muchos de los plugins e de los contenidos, de los temas utilizan la resapi, pues aquí lo que hacemos es bloquearla solo para aquellos que están logados, es decir, cuando estamos utilizando o editor e no se puede llegar a la resapi públicamente. Siguiente, estrategia, en este caso, iríamos contra a la difusión de nuestro contenido en redes sociales. Puede que no nos interese que nos difundan el contenido por cualquier razón, o por bien un tercero se quiera aprovechar de la notoriedad de nuestro contenido a través de una especie de clickbait. Bueno, pues también es una posibilidad de llegar a incluir, como decíamos antes, marcas de agua o de copyright en nuestra imagen porque al menos de esa manera e se las llevan, pues saben desde onde se las han llevado. Podemos hacer también una estrategia a través de los metadatos, aquellos cabeceras Open Graph donde se describe o contenido. Podemos crear como os digo aí etiquetas Open Graph que sean falsas, entonces da la sensación de que está compartiendo o contenido e a lo mejor le estáis redirigiendo una página este contenido no se comparte en redes sociales e también bajando un poquito máis de nivel podéis incluso bloquear lo que son os bots que utilizan as redes sociales para venir a scrapear ese contenido e compartirlo de novos estrategias para poner impedimentos a que se lleve en nuestro contenido. La siguiente sería avanzar mucho máis seria a hacernos invisibles en los buscadores e a sé que esto va en contra de muchas de las estrategias pero puede ser también que tengamos un contenido a hacer a través de unha newsletter algo que queramos que no se comparta. Bueno, pues también tenemos algunas posibilidades de hacernos invisibles en las redes. Que es lo que hacemos por las estrategias habituales bloquear en este caso que nos rastreen el sitio aquí os pongo tres ejemplos a través de cabeceras a través del robots.txt o a través por ejemplo de un WAZ de un firewall web prohibiendo o bloqueando eso suseralle estas estrategias para que no seamos ni rastreados ni indexados. Dentro de WordPress tamí lo podemos hacer de esta maneira o famoso check que normalmente deshabilitáis en cuanto tenéis el sitio ya en producción pues en este caso haríamos o contrario disuadimos a los motores de que nos vengan a escrapear a indexar que al final o que haces a añadir esa etiqueta a cada una de las páginas. Tambien podemos hacerla esta adicional para que nos rastreen sino para que se nos han rastreado no quede almacenado en ese buscador concreto. E por último y ahora que estamos con la moda la moda que ya lleva un año pues tambien es una posibilidad de protección e seguro que lo habéis visto ahora mismo se está utilizando muchos estos modelos conversacionales de bots o ChagPT e todos estos Cloud e todos estos que se basan en dos momentos para que os que nos sepáis estas inteligencias digitales tienen dos momentos tienen un momento de entrenamiento donde lo que hacen es recopilar metainformación para su base de conocimiento e luego tienen outro momento de interacción que es quando hacemos la pregunta el segundo momento no lo tienen todos el primero es como arrancó ChagPT o como han arrancado muchos modelos estos LLM yo hago una pregunta en lenguaje natural el tiene su modelo de entrenamiento preparado e nos dá una respuesta ao mejor nos interesa que nuestro contenido no de base a su conocimiento porque no nos interesa porque al final todo o que nós estamos aportando a la inteligencia artificial o único que gana e dinero é o Penay le hemos ayudado a entrenar o Penay o que sea le hemos ayudado a entrenar sus bots con nuestro contenido e no hemos recibido nada a cambio e não é como os buscadores que nos indexan aparecemos pinxan e ao menos recibimos una visita bueno, pues esas dos estrategias tanto o de entrenamiento como o de interacción que la veremos después tamén podemos intentar protegerlas o concepto é o mesmo ao final o que estamos proibiendo é que os user aí os robots que vienen a nuestro sitio os proibamos isto é que hacerlo previamente se isto implementáis agora seguramente na versão de echa GPT ou na cloud o que sea que estéis utilizando se já se ha entrenado porque isto se entrenou con datos de 2021 queres recordar não podeis hacer nada isto não vai atrás isto o que va a permitir é que em novos entrenamientos o seu sitio não o coja os pongo os dois ejemplos que halla o mesmo este é o que utilizan os Common Crawl que os user aí utilizan por muchas das inteligencia artificiales e este novo que é o que publico echa GPT o pasado mes de agosto vale mas não sabemos como entrenou o modelo anterior o de 2021 a estratégia como os digo é esta intentar que não utiliza o nosso conteúdo para o seu entrenamiento e aquellos outras inteligencia artificiales que tenen interacción e seguramente o que has visto agora com Bing por exemplo ou com os plugins de echa GPT o que hacen é que utilizan a parte de base de conocimiento e en función de una série de enlaces en función de uma série de parámetros poden ir a consultar em tiempo real vuestro sitio e complementar a información de resposta vale perdón seria este outro exemplo no é un user aí em distinto o único que está publicado e conocido é o de echa GPT que en este caso o que proibiríamos é que en ese momento o bot se tiene que consultar nosso conteúdo para una resposta adicional não pode consultar vale e termino con una reflexión sempre se dice que o melhor defensa é um bom ataque bom estando em Galicia e fazendo um pequeno chiste diria depende en este caso não o recomiendo no en este caso o melhor defensa é uma boa defensa no ao final ao largo de o que habís visto aí é como ir colocando capas é como ir colocando impedimentos a protección igual que así habla em materia de seguridad ao 100% não existe vale podemos combinar muchas estrategias pero sempre estamos listos que nós que nos sepá coger o conteúdo que nos sepá extraer a estrategia do nosso conteúdo pero bueno vamos intentar ponérselo difícil espero que no dia de hoy os lleveis unas cuantas ideas para poder implementar e que aquello que os cuesta tanto generar e que é de lo que vivís pues se lo pongáis difícil aos malos para que nos copien e para que nos saquen beneficio de ello así que muchas gracias alguma preguntilla para éste bom hombre por aí a ver sí enhorabora Fernando Borrachar grafia e arra yola por el fichaje tengo una pergunta específica porque é un caso que nos ocurre a menudo como aprovedor de hosting de todas as estrategias que has puesto aí para proteger contenido hay un caso muy común que é o de gente que hace grabación de pantalla de cursos por exemplo deseo para ser muy preciso nos copian construye unha web e os venden a cursos que valían 500 600 o 700 euros os venden a 10 euros entonces a nosotros nos llegan os produtores de hosting nos llegan os autores oye que podeis hacer para quitar éste etcétera o ponemos en manos de os abogados e tal tú que recomendarías a los creadores de cursos en vídeo que los tienen incluso un muro de pago es decir está protegido sí, pero bueno nos pasa en nuestro sector al final yo creo que plastiante todos aquí venimos del mundo del software e nos ha pasado nos ha pasado igual luego está el tema de las licencias de xejepele io aí sempre recomiendo al menos tener un reclamo visual que en este caso de los vídeos pues puede ser una mosca por lo menos para identificar que el contenido ha salido de tú sitio o el contenido ha sido creado por ti aunque luego hay mil estrategias también para poder quitar esa mosca pero lo máis difícil muchas veces es demostrar que el contenido es tuyo e sobre todo en digital en digital es muy difícil se estuviéramos en outro foro podíamos estar hablando de tema de blockchain e demás pero creo que nadie registra el contenido a través de blockchain podíamos hacerlo técnicamente seria má fácil de demostrar que el contenido ha salido de ti porque está cifrado tan os que nos aguanto pero es muy difícil en ese caso al menos la parte de demostración es unión porque normalmente ese contenido lo van a intentar posicionar hablar con el buscador bien a través de un aviso de mca o un aviso de propiedad intelectual a google a vinga todos estos para que digan este contenido infringe un tema de derechos elimina-lo usted por lo menos para quitarle la visibilidad luego es máis difícil que el tio lo quite del sitio pero al menos empezar de esa manera o que se sola hacer e os pasará vosotros eso o que pero aí ya tienes que ir a través de la policía porque tú necesitas un á orden porque claro tú inicialmente no puede ser juez e parte dices este de fulanín lo quito o que entonces te metes tú en un problema tampoco sabes logo por detrás si era una sociedad que se funda al principio se dividieron os contenidos e ahora están enfrentados muchas veces o máis difícil es demostrar que el contenido es tuyo no te digo nada en los medios es exactamente igual muchas gracias nada una última pregunta aí arriba muy guai da serra alguna técnica o herramienta para saber se tú o contenido está siendo duplicado hay varias herramientas relacionadas con el mundo del SEO para buscar duplicidades el problema es que no te devuelven el contenido completo no sé ninguna que haya dado eso no lo lamento pero ninguna que me dé el 100% de veracidad no hay algunas que detectan eso parte del contenido duplicado por frases por títulos e demás pero el contenido tal cual no es máis la mayoría de las veces son usuarios los que te avisan dices oi es que este contenido ya lo he visto aquí o este contenido hace referencia aquí también el propio buscar tus contenidos en Google la mayoría lo veo por clientes míos empieza a salir la competencia cuándo te lo ha te lo ha copiado lo que pasa es que ahora realmente no copian ahora lo que hacen los malos es que te escrapean lo pasan por chat gpt lo reescribe e encima más bonito que el tuyo posiciona mejor porque además se han hecho un curso de nicho de keywords de no sé qué le meten las keywords buenas chat gpt que escribe mejor que tú han hecho una fusión en los artículos e encima sale enganando lamentablemente es muy complicado por eso voy un pouco por esta idea vamos intentar poner impedimentos para que almeno no se beneficien de eso muy bien pues más preguntas que tengais el va a estar por aquí oi e mañana oi e mañana e estará encantado de recibiros e eu te voy a dar un regalito pues siempre se agradece também un regalito no muchas gracias muchas gracias muy bien gracias a todos disfrutar de la