
Image by ijeab, from Freepik
Como Uma YouTuber Está Enganando Bots de IA Que Roubam Seu Conteúdo
Uma YouTuber está tomando uma posição criativa contra modelos de IA que raspam e reutilizam conteúdo online sem permissão.
Com Pressa? Aqui estão os Fatos Rápidos!
- Uma YouTuber esconde texto irrelevante nas legendas para confundir raspadores de conteúdo de IA.
- Os resumidores de IA lutam para filtrar o lixo, gerando resumos de vídeo imprecisos.
- A técnica interrompe a raspagem de IA, mas não é à prova de falhas contra ferramentas avançadas de transcrição.
F4mi, uma criadora conhecida por seus vídeos aprofundados sobre tecnologias obscuras, desenvolveu um método para atrapalhar resumidores de IA, preenchendo suas transcrições com textos enganosos e confusos para as máquinas, mas ainda legíveis para os espectadores humanos, conforme relatado inicialmente por ArsTechnica.
O crescimento de canais do YouTube “sem rosto”, gerados por IA, tem sido uma preocupação crescente para muitos criadores de conteúdo, como observado pelo Medium. Esses canais costumam usar ferramentas de IA para gerar roteiros, narrações e visuais, retirando frequentemente material de vídeos existentes para produzir imitações quase instantâneas.
Muitos YouTubers relataram que viram seu trabalho copiado e reutilizado, com modelos de IA obtendo diretamente de suas transcrições de vídeo.
Para combater isso, a F4mi recorreu a um formato de legenda com décadas de existência chamado .ass, originalmente desenvolvido para a legendagem de animes por fãs. Diferente dos arquivos de legenda padrão, .ass suporta opções avançadas de formatação como fontes personalizadas, cores e posicionamento.
Ao explorar essas funcionalidades, a F4mi incorpora textos adicionais às suas legendas, invisíveis para os espectadores humanos, mas altamente disruptivos para as ferramentas de raspagem de IA.
O método dela envolve a inserção de texto extra fora dos limites visíveis da tela, usando truques de formatação para tornar as palavras transparentes e ilegíveis para os humanos. O texto inserido inclui trechos de domínio público com pequenas substituições de palavras, assim como nonsense gerado por IA projetado para sobrecarregar as ferramentas de resumo.
Quando a IA tenta extrair e resumir essas legendas, acaba com uma versão distorcida e imprecisa do conteúdo original.
F4mi descobriu que, embora as ferramentas básicas de IA tivessem dificuldade com sua abordagem, modelos mais avançados como o Whisper da OpenAI ainda eram capazes de extrair informações significativas.
Para neutralizar isso, ela experimentou embaralhar ainda mais o texto ao nível do arquivo, mantendo-o legível durante a reprodução, adicionando outra camada de complexidade para a IA que tenta analisá-lo.
A ArsTechnica observa que o YouTube não oferece suporte nativo para legendas .ass, então F4mi teve que converter suas legendas para o formato .ytt do YouTube. No entanto, essa solução alternativa veio com desvantagens, particularmente em dispositivos móveis onde as legendas alteradas às vezes apareciam como caixas pretas.
Para abordar isso, ela desenvolveu um script em Python que esconde seu texto enganoso como legendas pretas sobre fundo preto, visíveis apenas quando a tela desvanece para preto.
Apesar desses esforços, F4mi reconhece que seu método não é à prova de falhas. A IA ainda pode gerar transcrições diretamente da faixa de áudio, e leitores de tela avançados podem extrair texto visível de vídeos.
Ainda assim, seu experimento destaca a crescente resistência entre os criadores de conteúdo contra modelos de IA que raspam material online sem consentimento. À medida que o conteúdo gerado por IA continua a proliferar, contramedidas inovadoras como as de F4mi podem se tornar cada vez mais comuns.
Deixe um comentário
Cancelar