Metodologia: A Mão Invisível das Big Techs

Esta base de dados sistematiza informações públicas sobre ações de influência, projetos de lei e processos que envolvem as principais empresas de tecnologia em diferentes países e jurisdições. Seu objetivo é oferecer uma visão das estratégias que essas companhias empregam para influenciar a agenda política e os marcos regulatórios que afetam sua atividade.

Não se trata de um levantamento exaustivo de todas as atividades de influência nos países que fizeram parte do projeto A Mão Invisível das Big Techs, pois os dados registrados dependem da qualidade e do nível de detalhamento das informações públicas disponíveis em cada país.

Esta base de dados pode ser de interesse de jornalistas, pesquisadores, acadêmicos, políticos, agentes sociais e pessoas que busquem compreender como as empresas de tecnologia utilizam táticas para influenciar decisões públicas que as afetam, bem como quais são os temas que mais lhes preocupam.

As estratégias de influência nem sempre são fáceis de detectar, em parte porque nem todos os países exigem que elas sejam registradas. E, nos países que o fazem, em muitos casos a informação disponível para a população requer contexto adicional para ser interpretada adequadamente. Por essa razão, o Centro Latinoamericano de Investigación Periodística (CLIP), em conjunto com a Agência Pública e outros 15 veículos de comunicação, coletou e padronizou ações de influência em nossos países.

Cada equipe jornalística buscou e contribuiu, usando as informações disponíveis, com três tipos de dados de seu país:

Para reunir em um mesmo repositório padronizado milhares de registros de diferentes naturezas, eles foram categorizados por temas, utilizando inteligência artificial; verificamos manualmente as informações relacionadas às identidades das pessoas envolvidas nas ações de influência; e realizamos uma verificação adicional com os aliados do projeto.

O resultado são cinco conjuntos de dados que documentam:

  1. Ações de influência (2.939) sobre agentes públicos de Argentina, Austrália, Brasil, Canadá, Chile, Colômbia, Costa Rica, Equador, El Salvador, Estados Unidos, Guatemala, México, Paraguai, Peru, República Dominicana, Uruguai e em uma entidade supranacional (a União Europeia); protagonizadas pelas chamadas Big Five — Google, Apple, Meta (dona do Facebook), Amazon e Microsoft —, suas empresas aliadas, outras empresas de tecnologia que têm grande impacto na vida cotidiana das pessoas (Mercado Livre, TikTok, entre outras), e associações e grupos de lobby. Também incluímos as principais empresas associadas a data centers. Este conjunto de dados se chama “influence_actions”.
  2. Projetos de lei (800) na Argentina, Austrália, Brasil, Canadá, Chile, Colômbia, Equador, El Salvador, Indonésia, México, Paraguai e União Europeia. Este conjunto de dados se chama “bills”.
  3. Processos (312) promovidos por ou contra as empresas de tecnologia na Austrália, Brasil, Canadá, Chile e Colômbia. Este conjunto de dados se chama “court_cases”.
  4. Agentes públicos (930) que assinam projetos de lei listados no conjunto de dados #2, ou que participam das ações de influência listadas no conjunto de dados #3. Este conjunto de dados se chama “public_officers”.
  5. Funcionários ou representantes das empresas de tecnologia (1.406) que participaram de pelo menos uma das reuniões listadas no conjunto de dados #3. Este conjunto de dados se chama “tech_reps”.

As bases de dados estão em inglês.

Fontes dos dados e critérios de inclusão

As fontes de onde os dados foram extraídos são públicas. Algumas vêm de informações oficiais, como portais de transparência governamentais ou registros de entrada em instituições; outras vêm de informações acessíveis publicamente, como releases e comunicados oficiais. Foram usadas mais de 180 fontes. A lista completa pode ser consultada ao final desta nota metodológica.

Ações de influência

No conjunto de dados “influence_actions”, a maioria dos dados provém de plataformas oficiais do governo, registros públicos online de atividades de lobby e gestão de interesses particulares em países onde esses registros existem, como o portal Infolobby no Chile e a plataforma Agenda Transparente no Brasil. É necessário esclarecer que as ações registradas nesses portais podem omitir reuniões e encontros que tenham ocorrido fora do horário de trabalho ou em um local que não seja a sede de uma instituição (como um restaurante ou bar, por exemplo). Esse é o caso do Infolobby, pois no Chile não é obrigatório registrar encontros que ocorram em contextos informais.

Nos países onde não é obrigatório registrar as ações de influência de privados junto ao setor público, este projeto fez múltiplos pedidos de informação pública a diversas entidades estatais, solicitando dados sobre os operadores das empresas de tecnologia; consultou informações publicadas em redes sociais e meios de comunicação; e obteve outros registros públicos de entradas em instituições públicas ou declarações de conflito de interesse, entre outros. Também foram incluídas evidências obtidas em arquivos históricos de imprensa, organizações da sociedade civil, think tanks e plataformas corporativas.

As informações sobre essas reuniões e os nomes de quem delas participou foram verificadas manualmente pelos jornalistas deste projeto em diferentes etapas do processo de construção da base de dados.

Na coluna url do conjunto de dados, podem ser encontrados os links para a fonte primária de informação sobre cada ação de influência específica.

Este projeto definiu como “ações de influência as reuniões (e pedidos de reunião) entre pessoas que representam as empresas de tecnologia e agentes públicos, audiências, cumprimentos protocolares, visitas de cortesia, entrega de brindes, convites para eventos, casos da prática conhecida como “porta giratória” (revolving door), treinamentos oferecidos pelas empresas de tecnologia a instituições públicas para apresentar seus produtos, comunicados emitidos pelas empresas sobre projetos de lei e eventos em que, pela descrição, é possível deduzir que houve interação entre agentes de entidades públicas e funcionários ou representantes das empresas de tecnologia.

Também foram incluídos registros de ações cuja natureza específica não pôde ser determinada, por exemplo, entradas sem descrição ou eventos com informações escassas. Eles foram incorporados porque envolvem, pelo menos, um representante de uma empresa de tecnologia e um agente público ou porque mencionam uma empresa de tecnologia na descrição do encontro.

No caso do Brasil, foram registradas 904 entradas de lobistas na Câmara dos Deputados entre 2021 e 2025. No entanto, esses dados não estão incluídos em todas as visualizações, pois esta equipe não pôde verificar de maneira independente o motivo de cada uma dessas visitas. No repositório, essas ações estão marcadas com a etiqueta “Tema não definido” (em inglês, “no clear topic”).

A base de dados inclui as pessoas que puderam ser documentadas como participantes desses encontros: agentes públicos, com nomes e cargos; e representantes da indústria de tecnologia, com nomes e empresas que representam. Essa informação foi corroborada com diferentes fontes. Foram excluídos os nomes de outros executivos das empresas de tecnologia que, cuja participação em ações de influência não pode ser verificada, embora apareçam em diversos documentos.

É necessário esclarecer que participar de uma dessas reuniões ou aparecer nesta ou em outras bases de dados que documentam ações de influência no setor público não é um ato ilegal nem ilegítimo. Entretanto, considera-se que publicar essas informações é de interesse público, dado que diz respeito aos processos de tomada de decisão pública e transparece o exercício de influência em assuntos públicos.

Por fim, é importante acrescentar que, em alguns casos, foram detectados erros nos nomes de pessoas provenientes da plataforma Infolobby. Durante o processo de verificação, foi feito um esforço razoável para identificar e corrigir erros nesses nomes, mas este projeto não pode garantir que todos tenham sido corrigidos. Além disso, foi constatado que a mesma pessoa pode estar registrada na plataforma várias vezes e com variações em seu nome. Por essas razões, alguns nomes incluídos na base podem conter imprecisões derivadas diretamente dessa ou de outras fontes oficiais e documentos de origem.

Projetos de lei

Os projetos de lei compilados na base de dados “bills” vêm de fontes oficiais de parlamentos e plataformas legislativas, incluindo repositórios digitais de senados e congressos nacionais, além de portais de acompanhamento de projetos de lei, bases legais provinciais e plataformas de jurisprudência e regulação. Foram escolhidos por tratarem de temas relacionados à regulação tecnológica, inteligência artificial, segurança digital ou redes sociais.

No caso das iniciativas legislativas, o projeto decidiu manter visíveis os nomes dos legisladores e funcionários que assinam os textos, visto que se trata de informação pública disponível nos repositórios oficiais. Tornamos esses nomes públicos por princípios de transparência, prestação de contas e interesse público, pois são considerados elementos essenciais para a análise do processo legislativo e não comprometem a privacidade pessoal dos atores envolvidos.

Processos

Por fim, na base de dados “court_cases”, as informações utilizadas provêm de repositórios oficiais e de acesso aberto, que incluem sentenças, resoluções e documentos processuais de tribunais na Austrália (AustLII), Brasil, Canadá (Suprema Corte), Colômbia (Conselho de Estado) e Chile (Lexsoft). No Canadá, para um caso específico, as informações foram extraídas de um anúncio feito pela rede social TikTok e verificadas no site do Tribunal Federal de Vancouver. Foram escolhidos porque mencionam alguma empresa de tecnologia como demandante ou demandada, ou aparecem na descrição do processo.

Sobre o uso de inteligência artificial para categorizar os temas

Uma vez obtidas as informações, este projeto buscou identificar os temas comuns às ações de lobby. Para esse exercício, foi utilizada inteligência artificial (IA).

Foram fornecidas à IA as colunas subject, tags e url (ou link) dos três conjuntos de dados, para que analisasse as informações e gerasse uma primeira lista de temas comuns. Essa lista serviu como base para outra lista, elaborada manualmente por jornalistas. O resultado final foi uma classificação em 21 temas.

Tema (em inglês) Descrição 
AI Regulação, adoção e uso de IA. Tudo relacionado explicitamente à inteligência artificial.
Children’s Rights Questões específicas relacionadas a crianças: proteção, riscos, acesso a plataformas, etc.
Data Centers Questões relacionadas à construção e ao funcionamento de data centers, assim como seu impacto social e ambiental.
News Media Regulação, normas e negociações sobre o conteúdo dos meios de comunicação e do jornalismo nas plataformas.
Personal Data & Privacy Questões relacionadas à privacidade e à regulação de dados pessoais.
Taxes Política fiscal e isenções tributárias.
Elections Propaganda eleitoral, desinformação nas eleições, normas sobre conteúdos eleitorais e políticos. 
Scams & Fraud Golpes, fraudes e pequenos furtos cometidos por meio de plataformas digitais.
Content Regulation Normas sobre conteúdo em plataformas digitais: regulação de conteúdo, distribuição, monetização, etc.
Content Moderation Normas sobre moderação, ou seja, aplicação interna da regulação de conteúdo: indústria de moderação, transparência sobre moderação, trabalho dos moderadores.
Antitrust / Competition Interações relacionadas a normas, casos ou decisões antitruste ou de concorrência. 
Public Procurement Compras, licitações ou interações comerciais entre empresas de tecnologia e o setor público. 
E-Commerce Assuntos relacionados ao comércio eletrônico: logística, pagamentos, marketing digital, etc.
Energy Questões energéticas: construção de infraestrutura energética, disponibilidade de energia, etc.
Environment & Sustainability Questões ambientais e climáticas (água, clima, emissões de carbono, tecnologias limpas, etc.).
International Affairs Geopolítica, assuntos internacionais, diplomacia.
Health Serviços de saúde, regulação de tecnologias sanitárias.
Labor & Employment Questões trabalhistas: trabalho em plataformas, contratos de trabalho, regulação laboral.
Security & Defense Tecnologia de defesa e forças armadas, tecnologia para segurança pública, cibersegurança, questões de segurança pública, exceto golpes e fraudes (por exemplo, tráfico de drogas, crime organizado).
Education Assuntos educacionais: educação tecnológica, adoção de tecnologia em escolas e universidades.
Social Development Questões gerais de políticas sociais (por exemplo, pobreza, alimentação, agricultura).
Tech infrastructure Demais assuntos relacionados à infraestrutura tecnológica, exceto data centers: cabos, construção de redes, satélites, fibra ótica, espectro, Wi-Fi, transformação digital, etc.
Government & Policy Administração eletrônica, propostas de política geral.

Com essa base, foram programados scripts para que a IA atribuísse entre um e três temas a cada registro de lobby, projeto de lei ou processo. Após a primeira atribuição, todos os registros foram revisados manualmente, algumas categorias temáticas foram ajustadas e precisadas, e a IA recebeu uma segunda rodada de classificação. No caso do Brasil, que tinha a maior quantidade de registros, uma verificação extra foi realizada por jornalistas para construir a versão final.

Mesmo assim, constatou-se que alguns registros ainda não podiam ser classificados de forma clara devido à escassa informação disponível nas fontes públicas (por exemplo, no Brasil apareciam entradas com descrições muito gerais, como “reunião” com uma empresa de tecnologia). Esses casos foram agrupados na categoria “no clear topic” (tema não definido). Ao todo, foram identificadas 1.245 ações sem um tema definido.

Por esse motivo, essas ações foram excluídas das visualizações que mostram dados por tema, embora tenham sido mantidas na base para refletir a atividade registrada, exceto nos casos em que foi explicitamente indicado que o evento não ocorreu.

Também é importante ter em mente que uma mesma ação de influência pode estar classificada em diferentes temas. Por isso, os gráficos temáticos não mostram o número exato de ações, mas sim quantas vezes os temas se repetem.

Considerações para o uso da base de dados

A base permite identificar estratégias e temas em comum entre diferentes jurisdições. Pode ser útil para detectar padrões de como as empresas de tecnologia defendem seus interesses e para observar os temas mais sensíveis para elas e para a sociedade em relação ao uso das plataformas em diferentes países.

No entanto, três aspectos devem ser considerados por todos os usuários ao analisar ou citar esta base de dados:

Links para fontes genéricas

As fontes exatas para cada registro podem ser consultadas na base de dados para download, nas colunas denominadas “url” ou “link to document” de cada uma das três bases de dados.

Base de dados “Ações de influência”

Argentina
Austrália
Brasil
Canadá
Chile
Colômbia
Costa Rica
Ecuador
Estados Unidos
Paraguai
Peru
República Dominicana
União Europeia
Uruguai

Base de Dados “Projetos de Lei”

Argentina
Austrália
Brasil
Canadá
Chile
Colômbia
Equador
El Salvador
Indonésia
México
Paraguai 
União Europeia

Base de dados “Processos”

Austrália
Canadá

A Mão Invisível das Big Techs é uma investigação transnacional e colaborativa liderada pela Agência Pública e o Centro Latinoamericano de Investigación Periodística (CLIP), em conjunto com Crikey (Austrália), Cuestión Pública (Colômbia), Daily Maverick (África do Sul), El Diario AR (Argentina), El Surti (Paraguai), Factum (El Salvador), ICL (Brasil), Investigative Journalism Foundation – IJF (Canadá), LaBot (Chile), LightHouse Reports (Internacional), N+Focus (México), Núcleo (Brasil), Primicias (Equador), Tech Policy Press (EUA) e Tempo (Indonésia). O projeto tem o apoio da Repórteres Sem Fronteiras e da equipe jurídica El Veinte, e identidade visual da La Fábrica Memética.

Sair da versão mobile