Frequência de Letras — Ferramentas BNCC Computação

Frequências de referência — Português Brasileiro

Frequência média de cada letra em textos escritos em português. Passe o mouse sobre uma barra para ver o valor exato.

IC de referência do Português: 0,0731 ⓘ

Analisar texto

Cole qualquer texto em português. Letras acentuadas são normalizadas por padrão (ã→a, é→e…) para comparação com a tabela de referência.

Normalizar acentos (ã→a, é→e, ç→c…)

Índice de Coincidência — posição na escala

Histograma de frequências Sobrepor referência PT

Texto analisado

Referência PT-BR

Letra	N	% Texto	% Ref. PT	Δ

Por que o Índice de Coincidência importa para criptografia?

O IC mede o quão "desigual" é a distribuição de letras de um texto. Em português, algumas letras (A, E, O) aparecem muito mais que outras (K, W, Y), gerando um IC alto (~0,073). Essa desigualdade é uma impressão digital da língua — e persiste em cifras de substituição simples, já que a frequência é apenas "mascarada" por outro símbolo. Cifras polialfabéticas (como Vigenère) "embaralham" essa distribuição, aproximando o IC de 1/26 ≈ 0,038 (distribuição uniforme).

Aleatório / OTP

IC ≈ 0,033–0,048

Distribuição próxima à uniforme. Ocorre em texto verdadeiramente aleatório ou em cifras de fluxo/Vigenère com chave longa.

Cifra polialfabética

IC ≈ 0,048–0,065

Típico de Vigenère com chave curta (2–8 letras). Quanto menor a chave, mais o IC se aproxima do valor da língua original.

Natural / Monoalfabética

IC ≈ 0,065–0,080

Texto natural ou cifra de substituição simples (César, Atbash, etc.). O IC da língua é preservado pois é só uma permutação.

Atenção: o IC sozinho não distingue texto natural de cifra monoalfabética — para isso, é necessária análise de frequência completa (comparar com a tabela de referência) e busca por padrões como artigos e preposições curtas.

// Frequência de Letras