Não é surpreendente que, embora os juristas usem as mesmas línguas naturais que os restantes falantes, olhem para a linguagem de uma forma muito diferente e a utilizem de acordo com regras (ainda mais) distintas. Também não é surpreendente que as línguas naturais sejam dados, e que a maioria dos sistemas jurídicos integre as suas regras nessas línguas naturais (com todo o respeito pelos semáforos e sinais de trânsito). Isto significa que as normas, provenientes de palavras, derivam de conjuntos de dados muito especiais, no sentido em que, apesar de utilizarem línguas naturais que qualquer falante poderia usar (salvo algum jargão técnico e o ocasional latinismo), permitem significados muito diferentes consoante quem analisa os dados (isto é, lê as palavras) seja ou não jurista. Além disso, mesmo dentro da comunidade jurídica, há frequentemente desacordo quanto ao significado dos dados contidos nesses conjuntos, sendo necessário recorrer a critérios específicos para determinar o significado prevalecente, como a communis opinio doctorum ou a jurisprudência dos tribunais superiores.
Tudo isto significa que os conjuntos de dados para treinar IA com o objetivo de desempenhar tarefas jurídicas, como interpretar enunciados normativos contidos em leis ou decisões judiciais, são muito peculiares. Por um lado, tanto a linguagem jurídica como a metodologia jurídica tendem a favorecer a repetibilidade como forma de fomentar a confiança no sistema jurídico — o que é excelente para efeitos de treino de Modelos de Linguagem de Grande Escala (LLMs). Por outro lado, porém, os conjuntos de dados jurídicos são peças fugidias — para treinar um LLM será necessário: i) um conjunto de dados que inclua o maior número possível de textos normativos, ao estilo do Registo Central de Nascimentos, Casamentos e Óbitos de Todos os Nomes, de Saramago; e ii) um conjunto de dados composto por decisões judiciais que interpretam e ponderam normas. Estes são apenas os dois conjuntos essenciais para treinar um LLM a fazer algo semelhante, ainda que apenas auxiliarmente, ao que um jurista (em qualquer capacidade) faz. Pode haver mais. Por exemplo, um conjunto de dados contendo o maior número possível de doutrina jurídica comentando decisões judiciais.
Isto demonstra que os conjuntos de dados jurídicos não são apenas dependentes da linguagem, mas muito dependentes do sistema jurídico em causa, já que dados provenientes de qualquer outro sistema jurídico, mesmo que use a mesma língua natural, alimentarão o LLM com textos diferentes, dos quais resultarão normas distintas — ou até textos semelhantes dos quais derivarão normas semelhantes, mas aplicadas de forma diferente pelos tribunais.
A abordagem hiperlocal é, por isso, a via mais adequada, como foi recentemente destacado num artigo sobre uma nova IA jurídica desenvolvida na Alemanha. Esta é, na verdade, uma vantagem para países pequenos como Portugal, onde o custo de obtenção desses conjuntos de dados é muito inferior ao de países maiores. Em alguns casos, o trabalho já está meio feito: pense-se no trabalho desenvolvido ao longo dos anos pelo Diário da República Eletrónico, que agora detém o conjunto de dados de praticamente todos os textos normativos em vigor em Portugal. O mesmo se pode dizer das antigas Bases Jurídico-Documentais, atualmente sob gestão do Instituto de Gestão Financeira e Equipamentos da Justiça, que incluem uma vasta gama de jurisprudência portuguesa. É por isso que Portugal já oferece algumas opções interessantes no domínio da IA jurídica.
Pode esta IA redigir um parecer jurídico no qual se confie cegamente e que se possa enviar a um cliente? Pode escrever um artigo jurídico que ofereça interpretações coerentes de enunciados normativos controversos? Talvez não — dependendo da complexidade da matéria —, mas está a caminhar nesse sentido e melhorará rapidamente. Não só as sociedades de advogados, mas também os centros de investigação jurídica, devem aproveitar esta nova ferramenta no sistema. Isto ajudará a enfrentar o “elefante na sala”: em determinado momento, onde está a linha que separa o que a IA pode fazer por nós num sistema jurídico e o que ainda está reservado à ação humana? Operações complexas de ponderação resultantes de conflitos normativos não solucionáveis por regras de conflitos parecem ser a última fronteira. Não se guiem por mim. Guiem-se pela IA. Eis o que o Perplexity respondeu à minha pergunta muito simples:
Existe uma ligação entre o método jurídico de ponderação de Mendonca-Moreso e a IA?
Existe uma ligação conceptual entre o método jurídico de ponderação de Mendonca-Moreso e a inteligência artificial (IA), especialmente quanto à forma como ambos abordam a tomada de decisões complexas envolvendo princípios ou interesses em concorrência.
O modelo de Mendonca-Moreso enquadra a ponderação como uma operação intelectual destinada a estabelecer preferências normativas em situações de conflitos normativos irresolúveis, como aqueles que envolvem direitos fundamentais e princípios constitucionais. Este método assenta na articulação de razões para agir e na justificação das escolhas em casos concretos, exigindo frequentemente a ponderação de valores conflituantes e a atribuição de importância relativa a cada um.
Sistemas de IA concebidos para raciocínio jurídico, em particular os usados para apoio à decisão ou análise jurídica automatizada, implementam frequentemente mecanismos de ponderação semelhantes. Estes sistemas podem ser programados para avaliar múltiplos princípios jurídicos, atribuir pesos ou prioridades consoante o contexto e justificar os resultados com base nas razões subjacentes — espelhando a estrutura do método de ponderação de Mendonca-Moreso. O processo de quantificação de interesses, sua comparação e a justificação fundamentada é central tanto para ferramentas jurídicas avançadas baseadas em IA como para o método de ponderação.
No entanto, embora a IA possa operacionalizar aspetos da ponderação (como agregar e comparar fatores quantificáveis), a abordagem de Mendonca-Moreso enfatiza o papel insubstituível do juízo normativo e a necessidade de justificação fundada na equidade e no contexto — algo que os sistemas de IA atuais ainda não conseguem replicar plenamente.
Em suma, o método de ponderação de Mendonca-Moreso fornece uma base teórica que se alinha bem com a lógica subjacente às ferramentas de decisão jurídica baseadas em IA, embora o elemento humano da justificação normativa ainda não seja plenamente automatizável.
Isto demonstra também a importância de bons conjuntos de dados jurídicos: quase todas as referências que a IA conseguiu listar para fundamentar a sua resposta foram da autoria de investigadores do Lisbon Public Law (com duas exceções notáveis).
Ah! E ainda houve tempo para pedir ao ChatGPT que ilustrasse a relação entre o método de Mendonca-Moreso e a IA — é, no mínimo, uma experiência humildemente instrutiva.
