Pesquisa6 min de leitura

LexBench BR: como medimos qualidade em IA jurídica

Apresentamos o primeiro benchmark público para avaliar modelos de IA em 30 tarefas jurídicas reais em português brasileiro.

15 de abril de 2026

Toda empresa de IA jurídica afirma ser a melhor. Quase nenhuma mostra como mediu isso. O LexBench BR existe para mudar essa conversa: é um benchmark público, com rubricas auditáveis, que avalia modelos de inteligência artificial em 30 tarefas reais de direito brasileiro.

Por que benchmarks genéricos não servem para o direito brasileiro

Benchmarks internacionais de LLM medem raciocínio geral, matemática ou conhecimento de common law. Nenhum deles diz se o modelo calcula corretamente um prazo do CPC, identifica a tese de um repetitivo do STJ ou redige uma contestação no padrão forense brasileiro. Um modelo pode liderar rankings globais e ainda assim ser inútil para um escritório de advocacia no Brasil.

As 30 tarefas do LexBench BR

As tarefas foram desenhadas com advogados em exercício e cobrem o trabalho real de um escritório, distribuídas em categorias verificáveis:

Jurisprudência: localizar e aplicar precedentes do STF, STJ e TST a um caso concreto.
Cálculos: liquidação trabalhista, correção monetária e prazos processuais.
Drafting: redação de petições, contestações, recursos e cláusulas contratuais.
Prazos: contagem correta sob CPC e CLT, incluindo suspensões e feriados forenses.
Análise documental: extração de fatos e riscos de contratos e processos.

Metodologia: rubricas auditáveis, não opinião

Cada tarefa tem uma rubrica objetiva: a resposta cita a fonte correta? O cálculo bate com o resultado de referência? A peça contém os requisitos legais obrigatórios? As pontuações são reproduzíveis: qualquer pessoa pode auditar o critério, e é por isso que o LexBench é aberto.

LexAI, Claude, GPT-4, Gemini e Harvey no mesmo teste

O LexBench compara a LexAI com modelos de fronteira (Claude, GPT-4, Gemini) e com ferramentas de IA jurídica estrangeiras como o Harvey. O padrão se repete: modelos genéricos vão bem em fluência e mal em fundamentação brasileira; ferramentas voltadas ao direito norte-americano não conhecem as fontes nacionais. A LexAI lidera justamente nas tarefas onde a âncora à fonte oficial brasileira é decisiva.

Publicar isso é desconfortável e proposital. Qualidade em IA jurídica só avança quando deixa de ser slogan e vira número auditável. O LexBench BR é o nosso compromisso com essa régua.

Quer ver a LexAI aplicada ao seu escritório? Agende uma demonstração ou receba nossas análises de IA jurídica por email, uma vez por mês, sem spam.

Agendar demonstração Receber por email