UTF-X
UTF-X (Unicode Transformation Format) bezeichnet verschiedene Kodierungsformen des Unicode-Standards, die festlegen, wie Unicode-Zeichen als Bytesfolgen gespeichert werden. Die wichtigsten Varianten sind UTF-8 (variable Länge, 1–4 Bytes, rückwärtskompatibel zu ASCII), UTF-16 (2 oder 4 Bytes) und UTF-32 (immer 4 Bytes). UTF-8 ist heute das dominierende Format im Web, da es speichereffizient für lateinische Texte ist und dennoch alle Unicode-Zeichen darstellen kann.