Transformações e licenças.
Ed Newton-Rex afirma ser injusto usar obras criativas para treinar redes neuronais geradoras sem pagar licença aos autores. O seu manifesto já tem mais de 50 mil signatários (1). Argumenta que as empresas que treinam estas redes gastam muito dinheiro em pessoal e computadores e, por isso, deviam também pagar pelos dados que usam, que vêm do trabalho criativo dos artistas (2). Isto presume que beneficiar de algo obriga a remunerar o autor, presunção consequente de se subsidiar certas profissões concedendo monopólios sobre a cópia. Mas isto é uma excepção. Felizmente para todos, incluindo os artistas, o normal é pagar a quantia combinada quando o trabalho é feito, e pronto. Não se paga licenças aos professores pelo uso do que se aprendeu, aos médicos por cada dia de saúde ou ao electricista cada vez que se liga um interruptor.
Quando se passou da tecnologia de Gutenberg para o domínio digital exigiram outra excepção. Não se concede monopólios sobre números e álgebra. Por exemplo, em 1976, Diffie e Hellman inventaram um método algébrico para trocar chaves criptográficas (3) do qual depende todo o comércio online. Saía caro se déssemos por isto os mesmos privilégios legais que se dá por bonecos ou cantigas. Também os parâmetros das redes neuronais não dão direito a monopólios. Por muito tempo e dinheiro que custe criar e treinar os modelos, o resultado não é propriedade de ninguém porque são números. Mas quem carrega no botão da máquina fotográfica, grava uma música ou faz um desenho no computador fica com um monopólio comercial sobre os números que o aparelho guardou. E como não se pode especificar que números pertencem a quem, esta excepção obriga a censurar os outros conforme o significado dado aos números, bloqueando sites, proibindo a partilha de ficheiros ou até declarando ilegal ver provas desportivas sem licença (4). Agora exigem ainda mais uma excepção: querem cobrar pela autorização de treinar modelos alegando que aprendem a imitá-los à custa do seu trabalho. Mas nunca se pagou licença para aprender e nem é verdade que estes modelos aprendam a fazer o que os autores fazem. Não aprendem a escrever, nem a compor música nem a desenhar. Aprendem apenas a converter formatos digitais. É como gravar um documento do Word em PDF.
Se representarmos a posição de Lisboa e de Coimbra no espaço é difícil planear uma viagem porque a Terra roda sobre si própria, orbita o Sol e o Sol anda disparado pela galáxia. A posição de cada cidade muda ao longo do tempo em espirais aninhadas e isto complica muito o traçado e a escolha do caminho a seguir. Mas uma transformação algébrica adequada permite projectar estas coordenadas em duas dimensões num mapa estático onde é fácil escolher o percurso. Ou seleccionar outros destinos, porque qualquer ponto do mapa corresponde a um ponto na superfície da Terra. Escolher coordenadas ao acaso na outra representação, de espaço e tempo, calha quase de certeza algures no vácuo onde a estadia seria desconfortável e curta.
O grande poder das redes neuronais, a tal "IA generativa", é encontrar transformações convenientes para o que quisermos fazer. Por exemplo, normalmente representamos texto no computador atribuindo um número a cada letra, o que torna difícil prever a palavra seguinte. Os modelos de linguagem são operações algébricas que transformam esse formato noutro que dá imediatamente a distribuição de probabilidades da próxima palavra. E é só isso. Depois gera-se texto aplicando estas transformações para ir escolhendo palavras novas mas a rede neuronal é apenas uma sequência de operações que converte umas coordenadas noutras. É o mesmo com a geração de imagens a partir de texto. A rede transforma a sequência de números representando letras numa representação intermédia que se pode ajustar aleatoriamente e depois transformar nas matrizes de números como normalmente representamos imagens. É só isto que uma rede neuronal consegue fazer. Não tem desenhos, nem texto, nem canções. É só contas. Isto fica disfarçado por metáforas como a de "alimentar" a rede com as obras dos autores mas apenas se dá as coordenadas dos pontos que nos interessam para calcular a projecção adequada. Como a que permite calcular onde Lisboa e Coimbra ficam no mapa.
Esta tecnologia pode substituir muito trabalho humano, não só de artistas mas de toda a gente. Isso vai impor muitas mudanças mas não justifica licenças para aprender nem muito menos monopólios sobre a álgebra. Infelizmente, há grupos poderosos que querem expandir estes monopólios. Os "direitos de autor" são maioritariamente detidos por grandes empresas em benefício dos seus accionistas e, do outro lado, as grandes empresas que criam redes neuronais também querem acesso exclusivo aos dados para inibir potenciais concorrentes. Nós é que saímos prejudicados com a negociata, não só pelo efeito dos monopólios nos preços como também por concentrar ainda mais o controlo sobre o desenvolvimento e uso desta tecnologia.
O que nos deve preocupar não é actores fictícios (5) "roubarem" o trabalho dos actores humanos (6) ou minudências afins. O que temos de precaver são coisas como a violação de privacidade, burlas, e abusos de poder por parte do Estado. O reconhecimento de matrículas, a utilização massiva de informação que queremos privada e a vigilância descontrolada por parte das autoridades são exemplos do que nos deve preocupar. Estes monopólios que os artistas exigem, além de absurdos, limitam a concorrência, a transparência e a possibilidade de desenvolvimento e avaliação independente dos modelos. Para regular estas coisas é crucial que fique tudo à vista, modelos e dados, em vez de oculto atrás de acordos de exclusividade entre a Disney e a Google ou entre a Sony e a Meta. E é preciso que a tecnologia esteja acessível a todos em vez de apenas a quem pode contratar equipas de advogados e pagar licenças para fazer contas.
1- Statement on AI training
2- Guardian, Thom Yorke and Julianne Moore join thousands of creatives in AI warning
3- Wikipedia, Diffie–Hellman key exchange
4- A PJ lançou uma “campanha se sensibilização” contra ver futebol pirateado: Acredita, acaba com o teu jogo!. É certamente um dos crimes que mais preocupam os portugueses.
5- Particle 6, AI Commissioner
6- CNN, Hollywood is fuming over a new ‘AI actress’