Charset

angl. character set = "znaková sada", zkráceně charset [čáset]

Charset je přiřazení znaků číslům. V kontextu češtiny a slovenčiny jde hlavně o to, který diakritizovaný znak bude odpovídat jakému číslu od 128 do 255. Na webu se čeština kóduje převážně do tří znakových sad (psáno 2003): 1. iso-8859-2, 2. windows-1250 a 3. UTF-8 (unicode). (Pokud nevíte, jaké kódování používáte, pravděpodobně používáte windows-1250.) Autor české nebo slovenské stránky používající diakritiku by měl u dokumentu dát nějak vědět, jaké kódování používá (aby se to čtenáři zobrazilo správně), dělá se to dvěma možnými způsoby: 1. http hlavičkou "content-type" s hodnotou "text-html;charset=použité kódování" (někdy se to dynamicky překódovává za použití programů typu Saczech nebo ModCzech), nebo 2. meta tagem ve hlavičce dokumentu se stejnými hodnotami.

Na stránkách Jak psát web o charset: Čestina na webu, Diagnóza chybné češtiny, Česká kódování v tabulkách, Rozdíly kódování win a iso, Interpunkce na webu

 

Encyklopedie

Jak psát web