Ir para:

UTF-8 (UCS Transformation Format 8) é o caráter de codificação mais comum da World Wide Web. Cada caráter é representado por um até quatro bytes. UTF-8 é compatível com versões anteriores de ASCII e pode representar qualquer caráter Unicode padrão.

Os 128 primeiros carateres UTF-8 correspondem precisamente com os 128 primeiros carateres ASCII (numerado 0-127), o que significa que o texto ASCII existente já é um UTF-8 válido. Todos os outros carateres utilizam dois até quatro bytes. Cada byte tem alguns bits reservados para efeitos de codificação. Porque os carateres não ASCII requerem mais do que um byte para armazenamento, eles correm o risco de ficarem corruptos se os bytes são separados e não recombinados..

Saiba mais

Conhecimento geral

Etiquetas do documento e contribuidores

Contribuidores para esta página: mdnwebdocs-bot, mansil
Última atualização por: mdnwebdocs-bot,