Margem A, Margem B

Sobre como as tribos de linguagem natural e formal firmaram a paz

Ler na fonte | POR CARMEN TORRIJOS

A IA generativa tenta abrir-nos o caminho para a informação e a produção, mas na sua frenética chegada não estava ciente da existência de duas tribos bem diferentes: a que só usa a linguagem natural e a que também pode comunicar com os sistemas em linguagem formal.

Era uma vez um rio, com uma aldeia em cada margem. Os habitantes de uma margem, na qual a maioria das pessoas vivia, comunicavam-se apenas em linguagem natural, embora em diferentes línguas. Escreviam romances e poemas, mas também leis, manuais e tratados. Na outra margem, muito menos povoada, os habitantes usavam diariamente esta linguagem, mas também compreendiam e utilizavam a linguagem formal, quando necessário. Programavam, estudavam matemática e lógica e combinavam ambas as linguagens para viver, trabalhar ou até mesmo fazer piadas. Eles não entendiam que os habitantes da outra margem não fizessem o mesmo, mas ao mesmo tempo gostavam de valorizar a linguagem privada. Na fronteira da linguagem natural, a linguagem formal era considerada como algo complicado e alheio, que lhes gerava uma grande preguiça. Os adolescentes escolhiam muito cedo em que margem queriam viver e, a partir desse momento, um rio largo e profundo e muito poucas pontes dificultavam a comunicação com a outra margem.

Assim, as relações entre os dois povos estavam estagnadas há séculos quando a inteligência artificial chegou para se instalar na região. Para poder desenvolvê-la, era necessário formar equipas com profissionais de um lado e do outro do rio, que logo descobriram que tinham dificuldade em entender-se nas questões mais básicas do projeto. As pessoas da margem da linguagem formal começaram a construir por conta própria um sistema de codificação que permitia aos nativos da linguagem natural usar as suas ferramentas e produzir mais rápido, e assim nasceu algo que eles chamavam de inteligência artificial generativa. Pela primeira vez, eles colocaram em circulação uma moeda de uso comum entre os povos, que chamaram de prompt. No entanto, depois de tantos séculos, as fronteiras entre as duas formas de comunicação não eram tão fáceis de neutralizar. Nesse sistema, ainda em testes, as camadas sobrepostas de uma linguagem e outra eram confundidas e transparentes.

Margem A: linguagem natural

A história que acabamos de contar é mais alegórica do que fictícia. A revolução da IA generativa, que nos permite fazer pedidos a um chatbot para nos ajudar em tarefas que antes levavam muito mais tempo, como escrever um relatório ou ilustrar um artigo, não é apenas tecnológica. É também social e cultural e, no âmbito económico, abre novos perfis profissionais, novos nichos de mercado e toda uma nebulosa de consequências e efeitos onde por enquanto só vemos dois ou três passos à frente.

A interação entre o código informático e a linguagem foi revelada no seu máximo precisamente nas ferramentas de IA generativa

Os plug-ins ou plug-in para ChatGPT são um bom exemplo (1). Não muitas marcas os descobriram ainda, mas os casos de uso continuam a crescer e começam a comportar-se como os novos aplicativos. O complemento Expedia (2), por exemplo, permite que se prepare uma viagem com dados reais, como horários de voo, acomodações disponíveis e tarifas. Se estivermos a preparar uma viagem à República Checa, podemos pedir para sugerir hotéis para dormir em Praga, ajustar a pesquisa ao nosso preço máximo por pessoa por noite, e recomendar os melhores restaurantes típicos em Brno ou onde beber cerveja em Pilsen. Também pode ajudar-nos com a organização dos horários e do plano de rota e aqui não há risco de dados falsos: podemos confiar, porque a informação não vem do modelo de linguagem, mas do plug-in, que nos fornece os links para o site da Expedia para que possamos verificá-los. A nossa confiança nos resultados estará, portanto, em relação direta com a nossa confiança na marca e não no sistema de IA. Outro complemento interessante é o do Amazon Gift Chooser, que nos ajuda a escolher o melhor presente, desde que lhe dêmos informações sobre a pessoa que a quem queremos dar, os seus gostos e o seu limite de gastos. Com cada ideia, ele adicionará um link para a Amazon para que possamos comprá-lo diretamente, embora agora só trabalhe com a Amazon EE. EUA e com preços em dólares. O objetivo é sempre o mesmo e não é pequeno: permitir que os utilizadores combinem as capacidades de conversação GPT com a oferta de valor de uma marca, numa plataforma web que ultrapassou os 100 milhões de utilizadores apenas dois meses após o seu lançamento3. Todos os pedidos a estes sistemas são feitos apenas em linguagem natural, num novo género literário a meio caminho entre a instrução e a descrição a que chamamos prompt.

Nós acedemos a esses complementos de duas maneiras, ambas simples uma vez que estamos na pista: a primeira é dentro do próprio ChatGPT, na sua versão paga, habilitando as funcionalidades beta. Quando selecionamos o GPT-4, aparece uma guia plug-in onde podemos encontrar uma loja plug-in, uma loja no mais puro estilo Google Play ou Apple Store, com um catálogo de extensões gratuitas que podemos instalar e usar sem mais. A segunda opção, mais acessível se não tivermos a versão paga, é na forma de uma extensão para o Google Chrome, que será instalada no nosso navegador e ativada quando abrirmos o ChatGPT como uma camada adicional. Entre estes últimos estão alguns muito práticos, como editGPT, que nos permite aplicar um controlo de alterações semelhante ao do Word para saber em que o chatbot melhora os seus textos, ou Prompt Genius, um gestor de prompts destinado a preencher algumas lacunas de funcionalidade do ChatGPT. Este génio incorporado permite que nós tenhamos algo fundamental, que é salvar os nossos prompts favoritos na própria interface para que não tenhamos que reescrevê-los de cada vez. Por exemplo, se encontrarmos o prompt ideal para os nossos comunicados de imprensa ou menus semanais, podemos lançá-los sempre que precisarmos sem termos que escrevê-los novamente.

Foi com o Prompt Genius quando encontrei algo que me chamou a atenção: a possibilidade de definir variáveis dentro dos prompts. Demorei algum tempo para entender por que uma funcionalidade que eu reconhecia tão natural e necessária me era ao mesmo tempo tão estranha no contexto, tão estridente e fora do lugar como um iglu numa praia tropical: no exemplo, no meio de uma frase em espanhol, havia uma palavra trancada entre chaves duplas ({{}}).

Margem B: linguagem formal

Começando pelo princípio: uma variável é um conceito conhecido para qualquer estudante dos cursos mais básicos de iniciação à programação. É um elemento contêiner que não é fixo como o resto do código, como o nome indica, mas cujo conteúdo pode mudar com cada execução. Já não acontece com tanta frequência, mas nos primeiros tempos do envio em massa por e-mail era comum receber de vez em quando um e-mail com a mensagem «Damos-lhe as boas-vindas:». Esta sensação de desencanto ao encontrarmos as próprias entranhas da computação ocorre porque estamos diante de uma variável, o nome da pessoa receptora, uma informação em mudança em cada mensagem que é extraída de um banco de dados em que cada e-mail tem um nome de primeira mão associado, que será inserido automaticamente. A extensão Prompt Genius transfere este conceito das variáveis informáticas para o prompt e permite incluir nele uma ou mais, marcadas neste caso com chaves duplas ({}). É uma maneira rústica de incluir um sinal gráfico para que o sistema saiba que essa palavra é um curinga que pode adquirir valores diferentes. Por exemplo, imagine que você encontrou o prompt perfeito para o ChatGPT escrever para você um guia turístico para os seus fins de semana de fuga. Você investiu algum tempo na criação desse prompt, mas há conteúdo que é cada vez diferente, como a cidade que você vai visitar. É tão simples quanto deixar a palavra {{cidade}} entre as chaves, e o Prompt Genius perguntar-lhe-á qual é em cada nova execução, para que você tenha o prompt preparado em questão de segundos. O que estamos a fazer é nada mais do que acumular facilitadores adicionais sobre uma ferramenta já facilitadora como o ChatGPT. Estamos obcecados, há vários anos, por poder colocar qualquer conteúdo que quisermos ao alcance de um simples pedido na nossa língua, e caminhamos numa trajetória sem retorno que nos leva a pavimentar cada vez mais o terreno.

ILUSTRADOR VAN SAIYAN

Certamente estamos diante de uma aproximação vencedora, exceto porque o que chamamos de nossa língua é muito mais limitado do que pensamos. A linguagem natural é a que nos permite expressar as nossas ideias e emoções e criar ligações sociais, algo que é e vai continuar a ser prioridade por pura sobrevivência. Agora, a diferentes velocidades estamos a chegar a momentos evolutivos em que este sistema de expressão encontra limites. Um exemplo é o uso da linguagem inclusiva em castelhano, uma língua que viu brotar um conflito social de uma dualidade de género de herança indo-europeia, e da ausência de um género neutro que pudesse resgatar-nos (4). E aqui, numa sociedade ocidental em que as visões de progresso valorizam o bilinguismo como um tesouro das pessoas e dos povos, lutamos diariamente para não ter que ultrapassar as fronteiras entre a linguagem natural e a formal. Este último estamos a utilizá-lo sem nos aperceber, por exemplo, quando indicamos a opcionalidade com uma barra (os/as alunos/as), um gesto moderno, certamente não anterior ao século XVIII e totalmente alheio à linguagem natural, mas útil para expressar duas opções equivalentes no mínimo espaço possível. Por um lado, a convenção da barra (/) tem experimentado um forte crescimento desde a chegada da Internet e das mensagens instantâneas. Na linguagem informal por escrito é eficaz no que comunica, é breve, resolve. E, no entanto, numa linguagem mais elevada, tendemos a evitá-la por pouco elegante, como num artigo ou num livro. Acontece também com a rejeição generalizada ao uso da arroba (@)para marcar a inclusividade, uma solução escrita também breve e eficaz, mas que descartamos de plano e que já mal vemos em comunicações, publicidade ou imprensa. Porquê? É simples. No caso da barra de opcionalidade, quando a encontramos a ler em voz alta, somos obrigados a marcá-la com uma pausa ou um gesto leve. No caso da arroba, o nosso cérebro colapsa.

A minha sensação de desconforto ao encontrar uma palavra entre chaves no meio de um prompt, embora não seja verbalizada com muita frequência, é comum a grande parte dos falantes: além das letras e os nossos sinais de pontuação habituais, colchetes e chaves, como asteriscos ou percentagem, são símbolos que percebemos como alheios à linguagem natural, vindos de outro planeta, de alguma forma não totalmente válidos para a comunicação entre as pessoas. Como se fossem propriedade mais do mundo dos números, ou das máquinas.

Enquanto isso, do outro lado do rio, as expressões regulares são há décadas uma ferramenta de imensa utilidade para os programadores, irredutíveis apesar do tempo e da chegada de técnicas muito mais avançadas. Estes são conjuntos de caracteres que representam simbolicamente um padrão de pesquisa num texto e que nos anos 60 o matemático Ken Thompson introduziu entre as funcionalidades de um editor de texto chamado QED6. Por exemplo, imagine que quer encontrar números de telefones móveis espanhóis num milhão de textos da Internet. Teria que indicar na expressão regular que está a procurar três conjuntos de três dígitos, separados por espaços ou não, e marcar que o primeiro dígito do primeiro conjunto pode ser tanto um 6 quanto um 7, porque muitos telefones na Espanha já começam com um 7. A expressão poderia ficar mais ou menos assim:

\b[67]\d{2}[-.\s]? \d{3}[-.\s]? \d{3}\b

Nada como a sequência de nove números do nosso telefone, mas com uma eficácia de cem por cento para detectar esse, ou qualquer outro. A opcionalidade neste caso é marcada com colchetes «[67]», enquanto a expressão «\d» serve para indicar que nesse lugar se espera um dígito qualquer. Entre as chaves «{}» indicamos o número de dígitos que queremos encontrar em cada conjunto, juntamente com outros símbolos para identificar um espaço («\s») ou marcar o início e o fim da regra («\b»). Estas expressões são complexas de aprender e de criar, mas uma vez dominadas desdobram todo o seu potencial. Uma convenção tão arbitrária como as nossas palavras ou os nossos fonemas, mas mais eficiente, que hoje ainda surpreende pela forma como sustenta desde as sombras grandes projetos de software.

A ponte

Que a maior parte da população digitalizada tivesse um conhecimento básico em expressões regulares, ou que fossem naturalmente incluídas como aprendizagem a partir da escola, poderia melhorar a eficiência na procura de informações, mas também promover uma maior compreensão entre os especialistas em programação e as outras disciplinas, além de incentivar o desenvolvimento de competências valiosas, como o pensamento lógico e sintético. Não se trata de substituir a linguagem natural. A motivação é mais expandir os seus limites, democratizando uma ferramenta que provou muito o seu valor. A interação entre o código informático e a linguagem, até agora nas margens opostas de um rio com muito poucas pontes, foi revelada no seu melhor precisamente nas ferramentas de IA generativa. Aos poucos estamos a adquirir o hábito de interagir com elas sem código (chamamos-lhes no-code ou low-code). Estamos a normalizar texto para texto, texto para imagem, texto para música, texto para vídeo, integramos o prompting nas nossas vidas como a nossa nova interface de trabalho. Com os três ou quatro truques que rolam pelas redes, estamos a aprender a pedir aos sistemas o que precisamos, sem maior esforço. Mas é precisamente esta revolução do texto-a-tudo que colocou diante dos nossos olhos uma nova colisão entre línguas. Num caminho supostamente pavimentado, aparecem minúsculos buracos onde o militante da linguagem natural encontra o código sem querer.

Ninguém é falante nativo da linguagem formal. Generalizar o hábito de aprender e usá-la, ou incentivar o pensamento numérico e lógico, é uma missão coletiva

A manifestação mais recente de tudo isso, e talvez a ponte mais moderna e melhor traçada até hoje neste rio, é o Code Interpreter que a OpenAI anunciou em 6 de julho de 2023 (7). Esta funcionalidade, igualmente útil para programadores e não programadores, é uma evolução natural do ChatGPT que nos permite carregar arquivos, interagir com eles e obter resultados além da conversa escrita. Podemos, por exemplo, carregar um arquivo de dados macroeconómicos e obter gráficos automáticos, ou pedir-lhe para nos gerar um código QR a partir de um link para uma web. Podemos pedir-lhe que escreva um relatório a partir de alguns dados e depois exporte o resultado em PDF, ou que extraia o texto que aparece numa imagem. Agora, essa magia revolucionária seria impossível sem um passo intermediário: a máquina traduz o nosso pedido para código numa linguagem de programação muito concreta, Python, que podemos ver gerar diante de nossos olhos, e é o próprio código que gera o resultado, que depois o sistema nos retorna num link para download. A razão pela qual a OpenAI decidiu não tornar o processo cem por cento transparente para os utilizadores não programadores é provavelmente maximizar o seu público, e isso gerou uma conjuntura sem precedentes. Por um lado, os habitantes da margem da linguagem natural terão que se acostumar a ver fragmentos irritantes de código precedendo os seus resultados. Por outro lado, os habitantes da borda do código agora podem criá-lo sem escrevê-lo, mudando o esforço de lugar para construir em linguagem natural o melhor prompt possível. Também é significativo que a OpenAI tenha decidido, semanas após o lançamento deste módulo, mudar o nome de Code Interpreter, evidente para uma margem, mas não para a outra, para Advanced Data Analysis. Muito mais explicativo, muito mais para todos, muito mais ponte.

Nesta era da inteligência artificial, estamos diante de tecnologias tão capazes, com um potencial tão brilhante, que nos colocam repetidamente num espelho diante das nossas próprias limitações. Algumas delas são naturais, predeterminadas – a nossa capacidade de cálculo, mínima, a anos-luz da artificial – mas outras são adquiridas ou inconscientemente auto-impostas. Um condicionamento cultural omnipresente, embora muito pouco evidenciado até agora, bloqueou ao longo dos séculos a boa parte da população a inclinação para usar a linguagem formal quando necessário. Um instrumento tão humano e útil como a língua, que descartamos porque cometemos o erro de entendê-lo como alheio à espécie.

Não sabemos se caminhamos para um mundo onde todos programaremos ou para um mundo não-code onde os de sempre programarão, mas, além da incerteza, não podemos discutir a utilidade de um olhar híbrido, capaz de se comunicar em ambas as linguagens sem tantos complexos. Talvez seja um bom momento para rever se nossos itinerários educacionais, tão cuidadosamente construídos, estão agindo como restrições que perderam o seu sentido original. Não só a divisão tradicional entre ciências e letras ou a escolha exclusiva de disciplinas no ensino básico fazem parte de um sistema expirado, mas também as mensagens constantes em que as pessoas adultas se posicionam — às vezes com vergonha, às vezes com um orgulho mal compreendido — numa ou noutra margem.

A revolução da IA generativa não é apenas tecnológica. É também social e cultural

Ninguém é um falante nativo de uma língua formal. Generalizar o hábito de aprender e de a utilizar, ou encorajar o pensamento numérico e lógico, é uma missão colectiva que vai para além da construção de pontes sobre um rio, e é tão capacitante e inclusiva como o bilinguismo natural. Trata-se de deixar de dizer que nem toda a gente é boa em tudo e ousar mais tentar. Tem muito mais a ver com perder o medo de nadar.

Notas

 1OpenAI: «ChatGPT plug-ins» em openai.com (Março de 2023). Disponível em: https://openai.com/blog/chatgpt-plugins

 2Expedia Group: «ChatGPT wrote this press release — no, it didn’t, but it can now assist with travel planning in the Expedia app» em Expedia.com (abril de 2023). Disponível em: https://www.expediagroup.com/investors/news-and-events/financial-releases/news/news-details/2023/Chatgpt-Wrote-This-Press-Release–No-It-Didnt-But-It-Can-Now-Assist-With-Travel-Planning-In-The-Expedia-App/default.aspx

 3Hu, K: «ChatGPT define recorde para base de usuários mais rápidos – nota de analista» na Reuters (fevereiro de 2023). Disponível em:https://www.reuters.com/technology/chatgpt-sets-record-fastest-growing-user-base-analyst-note-2023-02-01/

 4Álvarez Mellado, Elena: «Linguagem inclusiva: algumas chaves linguísticas» em elDiario.es (julho 2021). Disponível em:https://www.eldiario.es/opinion/zona-critica/lenguaje-inclusivo-claves-linguisticas_129_8021559.html

 5FundéuRAE: «A arroba (@) para o gênero, uso inadequado», em fundeu.es (fevereiro de 2011). Disponível em:https://www.fundeu.es/recomendacion/arroba/

 6https://es.wikipedia.org/wiki/Ken_Thompson

 7Yildirim, Soner: «ChatGPT Code Interpreter: how it saved me hours of work», em Towards Data Science (julho de 2023). Disponível em: https://towardsdatascience.com/chatgpt-code-interpreter-how-it-saved-me-hours-of-work-3c65a8dfa935#

Bibliografia

Álvarez Mellado, E.: «Linguagem inclusiva: algumas chaves linguísticas» em elDiario.es (julho 2021). Disponível em:https://www.eldiario.es/opinion/zona-critica/lenguaje-inclusivo-claves-linguisticas_129_8021559.html

Expedia Group: «ChatGPT wrote this press release — no, it didn’t, but it can now assist with travel planning in the Expedia app» emExpedia.com (abril de 2023). Disponível em: https://www.expediagroup.com/investors/news-and-events/financial-releases/news/news-details/2023/Chatgpt-Wrote-This-Press-Release–No-It-Didnt-But-It-Can-Now-Assist-With-Travel-Planning-In-The-Expedia-App/default.aspx

FundéuRAE: «A arroba (@) para o gênero, uso inadequado», em fundeu.es (fevereiro de 2011). Disponível em:https://www.fundeu.es/recomendacion/arroba/

Hu, K: «ChatGPT define recorde para a base de usuários mais rápido-crescente – nota do analista» na Reuters (fevereiro de 2023). Disponível em:https://www.reuters.com/technology/chatgpt-sets-record-fastest-growing-user-base-analyst-note-2023-02-01/

OpenAI: «ChatGPT plug-ins» em openai.com (março de 2023). Disponível em: https://openai.com/blog/chatgpt-plugins

Yildirim, S.: «ChatGPT Code Interpreter: how it saved me hours of work», em Towards Data Science (julho de 2023). Disponível em:https://towardsdatascience.com/chatgpt-code-interpreter-how-it-saved-me-hours-of-work-3c65a8dfa935#

Artigo publicado na revista Telos 123

Leave a Reply