Paulo Gala avatar

Paulo Gala

Paulo Gala é economista e professor da FGV

88 artigos

HOME > blog

O papel das Estatais brasileiras na Corrida por uma IA Soberana

O Estado brasileiro está redescobrindo uma vocação antiga sob roupagem nova: a de arquiteto de infraestrutura estratégica

Prédio da Dataprev (Foto: Rafa Neddermeyer/Agência Brasil)
Selo Fonte Preferida no Google do Brasil 247

O mundo vive hoje a maior corrida de investimento em infraestrutura da história moderna. As projeções de mercado para 2026 apontam algo em torno de US$ 600 bilhões em investimentos globais em data centers, num movimento que lembra a disputa histórica por zonas industriais — mas agora voltado à economia digital e à soberania de dados. Governos passaram a tratar data centers como ativos estratégicos, disputando sua instalação com subsídios, incentivos fiscais e facilitação regulatória. O Brasil entrou nessa corrida: projetos bilionários de hiperescala se multiplicam pelo território, atraídos por energia limpa e abundante. Mas atrair data centers privados estrangeiros é apenas metade da equação. A outra metade — a decisiva — é construir capacidade computacional pública, sob jurisdição e comando brasileiros.

É nesse contexto que ganha enorme relevância o que entrou em operação em maio de 2026: o SoberanIA, primeiro ecossistema comercial brasileiro de inteligência artificial generativa em português voltado ao setor público. A iniciativa, liderada pelo Governo do Piauí com apoio direto do Ministério da Ciência, Tecnologia e Inovação e do Ministério das Comunicações, e integrada ao Plano Brasileiro de Inteligência Artificial (PBIA) e ao programa Nova Indústria Brasil, materializa algo que até pouco tempo parecia retórica: o Estado brasileiro produzindo, e não apenas consumindo, tecnologia de fronteira.

O que é o SoberanIA?

O coração da plataforma é o Soberano 1, um modelo de linguagem de grande porte (LLM) com 30 bilhões de parâmetros, treinado a partir de um conjunto curado de dados integralmente em português, que já alcançou 500 bilhões de tokens. Não se trata de um exercício acadêmico: o modelo chega ao mercado com seis produtos prontos para uso pela administração pública. O Gov Chat unifica o acesso a serviços públicos por WhatsApp, aplicativo e web. O BO Fácil permite o registro de boletins de ocorrência por áudio ou texto, com validação policial. O Seduc AI gera materiais didáticos personalizados para professores da rede pública. Os Agentes SEI analisam processos do Sistema Eletrônico de Informações, classificando documentos e monitorando prazos. Há ainda um gerador de Termos de Referência alinhado às diretrizes do Banco Mundial e uma API com kit de desenvolvimento para que gestores criem suas próprias soluções.

A arquitetura institucional do projeto é reveladora de um novo modelo de articulação entre Estado e mercado. A AWS participou do treinamento do modelo em nuvem e a Oracle integra o arranjo comercial — mas os dados sensíveis dos clientes governamentais e de Defesa ficam armazenados em sala cofre operada pela Telebras, sob jurisdição brasileira, em infraestrutura localizada no país. O Serpro já assinou memorando de entendimento para utilização da plataforma, cooperação em pesquisa e integração com sistemas federais como Gov.br, SEI e Sigepe. Em outras palavras: o setor privado global entra com escala e capacidade técnica; o Estado brasileiro retém o controle sobre o ativo mais sensível de todos — os dados de seus cidadãos.

Telebras e Dataprev: as estatais como camada de soberania

Quem acompanhou a trajetória recente da Telebras não se surpreende com seu papel no arranjo. A empresa que construiu a Rede Privativa da Administração Pública Federal, desenvolveu criptografia nacional em parceria com a ABIN e opera o Satélite Geoestacionário de Defesa e Comunicação Estratégica agora estende sua função de “escudo digital de Estado” para a era da inteligência artificial. A lógica é a mesma que defendi ao tratar da empresa como braço estratégico das telecomunicações brasileiras: há ativos cujo valor não se mede pelo balanço contábil, mas pela capacidade de proteger o país de vulnerabilidades externas. A sala cofre que abriga os dados do SoberanIA é a versão computacional daquela “proteção invisível”.

A Dataprev completa o quadro. A estatal hospeda mais de 55 bilhões de dados extremamente sensíveis dos cidadãos brasileiros — toda a espinha dorsal da Previdência Social, do trabalho e da renda — e opera, junto com o Serpro, a Nuvem Soberana de Governo, projeto que prevê mais de R$ 1 bilhão em investimentos e combina duas camadas de proteção: soberania dos dados, com armazenamento sob as leis brasileiras e em infraestrutura nacional, e soberania operacional, com gestão feita diretamente por empresas públicas em data centers próprios. Seu presidente, Rodrigo Assumpção, foi explícito sobre a ambição: a Dataprev quer ser a fornecedora de capacidade de inteligência artificial para o governo. Como ele mesmo resume, a IA está em algum lugar entre a chegada dos computadores pessoais e a chegada da eletricidade — e a estatal não pode ter menos capacidade do que o governo demanda.

Vale lembrar: Dataprev e Serpro estiveram na lista do Plano Nacional de Desestatização até 2023. Tivessem sido privatizadas, o Brasil estaria hoje negociando com acionistas privados — possivelmente estrangeiros — o acesso à infraestrutura que processa o pagamento de 40 milhões de benefícios previdenciários. A retirada das duas empresas do PND, pelo reconhecimento de sua relevância estratégica, permitiu que voltassem a investir, contratar e se consolidar como pilares da transformação digital do Estado. Juntas, lucraram cerca de R$ 1,2 bilhão em 2024. O argumento de que estatal é sinônimo de prejuízo, mais uma vez, não sobrevive aos dados.

Por que isso importa: complexidade, capacidades e dependência

A leitura pela ótica da complexidade econômica é direta. Modelos de inteligência artificial, data centers e nuvens soberanas são produtos de altíssima densidade de conhecimento — exatamente o tipo de capacidade produtiva que separa economias que comandam seu destino tecnológico daquelas que o terceirizam. Um país que depende integralmente de LLMs estrangeiros para operar seus serviços públicos não terceiriza apenas software: terceiriza a camada cognitiva do próprio Estado. Terceiriza o idioma em que sua burocracia pensa, a legislação que o modelo conhece, os vieses culturais embutidos no treinamento e, no limite, a continuidade de serviços essenciais diante de qualquer choque geopolítico.

O setor público brasileiro tem, hoje, dependência estrutural de soluções de IA desenvolvidas no exterior. O SoberanIA não elimina essa dependência da noite para o dia — um modelo de 30 bilhões de parâmetros não compete em capacidade bruta com os gigantes de fronteira. Mas esse não é o ponto. O ponto é a construção de capacidades: 70 pesquisadores treinando modelos, bases de dados nacionais em português sendo curadas, servidores públicos sendo capacitados, integração com FINEP, BNDES, FAPESP e CNPq sendo articulada. É o aprendizado tecnológico em sua forma clássica, aquele que Celso Furtado e a tradição desenvolvimentista sempre souberam que não se importa pronto — se constrói fazendo.

Em uma era em que dados, modelos e capacidade computacional se tornaram pilares do poder nacional, o Estado brasileiro está redescobrindo uma vocação antiga sob roupagem nova: a de arquiteto de infraestrutura estratégica. A Telebras conectando e protegendo; a Dataprev processando e hospedando; o Serpro integrando; e agora uma plataforma nacional de IA generativa operando em português, sob leis brasileiras, a serviço do cidadão. Investir nessa infraestrutura computacional pública não é nostalgia estatista — é a condição material para que o Brasil mantenha, na era da inteligência artificial, a capacidade de orientar seu próprio ritmo de transformação social e tecnológica. 

* Este é um artigo de opinião, de responsabilidade do autor, e não reflete a opinião do Brasil 247.

Artigos Relacionados