Die
Buchstabenhäufigkeit ist eine
statistische Größe, die angibt, wie oft ein bestimmter
Buchstabe in einem Text oder einer Sammlung von Texten („Korpus“) vorkommt. Sie kann als absolute Anzahl oder in Relation zur Gesamtzahl der Buchstaben des Textes angegeben werden. Die Häufigkeitsverteilung der Buchstaben hängt von der jeweiligen
Sprache ab. Während frühere Annahmen pauschal die statistische Verteilung der Buchstabenhäufigkeit durch das
Zipfsche Gesetz vorherzusagen glaubten, hat die
quantitative Linguistik gezeigt, dass eine Reihe anderer
Wahrscheinlichkeitsverteilungen in Betracht zu ziehen sind (Best 2005). Zählungen zur Häufigkeit von Buchstaben oder Lauten in Texten oder Textkorpora sind spätestens seit dem frühen 19. Jahrhundert nachweisbar. Für manche Zwecke ist es auch interessant, wie häufig ein Buchstabe am Wortanfang oder am Wortende vorkommt.