Se você está prestando muita atenção ao YouTube recentemente, você pode ter notado a tendência crescente de Os chamados “canais sem rosto do YouTube” Isso nunca apresenta um humano visível conversando no quadro de vídeo. Enquanto alguns desses canais são simplesmente de autoria de humanos tímidos à câmera, muitos mais são Totalmente automatizado através de ferramentas movidas a IA Para criar tudo, desde os roteiros e dublagens até as imagens e a música. Sem surpresa, isso é frequentemente vendido como uma maneira de Faça um dinheiro rápido fora do algoritmo do YouTube com um mínimo esforço humano.

Não é difícil encontrar YouTubers reclamando sobre uma inundação desses canais sem rosto roubar seus arquivos de transcrição incorporados e Executando -os através de resumizadores de IA para gerar suas próprias imitações instantâneas. Mas um youtuber é tentando revidarsemear suas transcrições com dados de lixo que são invisíveis para os seres humanos, mas venenosos para qualquer IA que se atreve a tentar trabalhar em um arquivo de transcrição escalfado.

O poder do .ass

YouTuber F4miquem cria Alguns mergulhos profundos excelentes sobre tecnologia obscurarecentemente detalhou seus esforços “Para envenenar quaisquer resumos de IA que estavam tentando roubar meu conteúdo para fazer slop”. A chave para o método do F4MI é o formato de legenda .assCriado décadas atrás, como parte do software de Fansubbing Software Advanced Substation Alpha. Ao contrário dos formatos de legenda mais simples e mais populares, o .ASS suporta recursos sofisticados, como fontes, cores, posicionamento, ousado, itálico, sublinhado e muito mais.

https://www.youtube.com/watch?v=nedfujqa1s8

São essas características sofisticadas que permitem que o F4MI oculte o lixo e o lixo em suas transcrições do YouTube sem afetar a experiência da legenda para seus espectadores humanos. Para cada pedaço de texto real em seu arquivo de legenda, ela também inseriu “dois pedaços de texto fora dos limites usando o recurso de posicionamento do formato .ass, com seu tamanho e transparência definidos como zero, para que sejam completamente invisíveis”.

Nessas caixas de legenda “invisíveis”, o F4MI adicionou texto de obras de domínio público (com certas palavras substituídas por sinônimos para evitar a detecção) ou seus próprios scripts gerados por LLM, cheios de fatos completamente inventados. Quando esses arquivos de transcrição foram alimentados em sites populares de resumo da IA, esse texto lixo acabou sobrecarregando o conteúdo real, criando um script totalmente não relacionado que seria inútil para qualquer canal sem rosto que tenta explorá -lo.

Source link