UTF-8 (åtta-bitarsUnicode transformationsformat) är en teckenkodning (längdvarierande) som används för att representera text kodad i Unicode, som en sekvens av byte (oktetter), till exempel i textfiler. Unicode använder upp till 21 bitar per tecken, vilket inte får plats i en byte, och därför används vanligen en av metoderna UTF-8 eller UTF-16 för att få en serie bytes.