UTF-8 (Abk. für
8-Bit UCS Transformation Format, wobei
UCS wiederum
Universal Character Set abkürzt) ist die am weitesten verbreitete
Kodierung für
Unicode-Zeichen (Unicode und UCS sind praktisch identisch). Die Kodierung wurde im September 1992 von
Ken Thompson und
Rob Pike bei Arbeiten am
Plan-9-Betriebssystem festgelegt. Die Kodierung wurde zunächst im Rahmen von
X/Open als
FSS-UTF (
filesystem safe UTF in Abgrenzung zu
UTF-1, das diese Eigenschaft nicht hat) bezeichnet, in den Folgejahren erfolgte im Rahmen der Standardisierung die Umbenennung auf die heute übliche Bezeichnung
UTF-8.