UTF8

UTF8 (of UTF-8) is een manier om karakters op te slaan en is een uitbreiding op de ASCII-tekenset. De karakters uit de ASCII-tekenset worden onverminderd overgenomen in UTF8.

Omdat UTF8 meerdere karakters kan bevatten, neemt het ook meer ruimte in beslag (1-4 bytes UTF8 t.o.v. 1 byte ASCII).


Een UTF8 maakt veelal gebruik van een zogenaamde Byte Order Mark (BOM).