ferramentasBNCC Computação
← ferramentas

// Frequência de Letras

Explore as frequências de cada letra no Português Brasileiro e analise qualquer texto. O Índice de Coincidência revela se um texto é natural, cifrado por substituição simples ou por cifra polialfabética.

Criptoanálise estatística EF09CO05 EM13CO08
Frequências de referência — Português Brasileiro

Frequência média de cada letra em textos escritos em português. Passe o mouse sobre uma barra para ver o valor exato.

IC de referência do Português: 0,0731
Analisar texto

Cole qualquer texto em português. Letras acentuadas são normalizadas por padrão (ã→a, é→e…) para comparação com a tabela de referência.

Por que o Índice de Coincidência importa para criptografia?

O IC mede o quão "desigual" é a distribuição de letras de um texto. Em português, algumas letras (A, E, O) aparecem muito mais que outras (K, W, Y), gerando um IC alto (~0,073). Essa desigualdade é uma impressão digital da língua — e persiste em cifras de substituição simples, já que a frequência é apenas "mascarada" por outro símbolo. Cifras polialfabéticas (como Vigenère) "embaralham" essa distribuição, aproximando o IC de 1/26 ≈ 0,038 (distribuição uniforme).

Aleatório / OTP
IC ≈ 0,033–0,048
Distribuição próxima à uniforme. Ocorre em texto verdadeiramente aleatório ou em cifras de fluxo/Vigenère com chave longa.
Cifra polialfabética
IC ≈ 0,048–0,065
Típico de Vigenère com chave curta (2–8 letras). Quanto menor a chave, mais o IC se aproxima do valor da língua original.
Natural / Monoalfabética
IC ≈ 0,065–0,080
Texto natural ou cifra de substituição simples (César, Atbash, etc.). O IC da língua é preservado pois é só uma permutação.

Atenção: o IC sozinho não distingue texto natural de cifra monoalfabética — para isso, é necessária análise de frequência completa (comparar com a tabela de referência) e busca por padrões como artigos e preposições curtas.