Частота вживання літер в англійській, українcькій та російській мовах
Левова доля зашифрованих простими програмами текстів розшифровується на основі інформації про частоту вживання літер в тих чи інших мовах. Подаю тут довідкову інформацію актуальну для українських криптоаналітиків. Джерела інформації наступні:
- Англійська - онлайн довідник UNIX програми caesar(6).
ETAONRISHDLFCMUGPYWBVKXJQZ
- Українська - сайт Slovnyk.org ("без урахування Ґ, по загалу"), а саме тут http://www.slovnyk.org.ua/txt/rizne/slova/symstat.html, ця ж сторінка у мене - symstat.html.
ОАНИІРВТЕСКЛДУПМЗЯЬГБЧХЙЦЮЖЇШЄФЩ-'
- Російська - сайт Spectator.ru ("по текстам в целом"), а саме http://spectator.ru/life/language/letter_frequency, ця ж сторінка у мене - letter_frequency.html.
ОЕАНИТСЛВРКДМУПЯЬЫГБЧЗЖЙШХЮЭЦЩФЪ
ENG % UKR % RUS % |
|
Всю цю радість можна зкачати в одному CSV-файлі - letters_stat.csv.
Viktor V. Chmel, 3/31/2004 01:41:00 PM.