인코딩과 문자 집합/유니코드
유니코드는 이세상의 모든 문자 집합을 통합하기 위해 만들어진 문자 집합이다.
유니코드의 처음 256자는 ISO/IEC 8859과 동일하며, 이후의 문자들은 규칙에 따라 배정되어 있다.
유니코드 문자 영역
+/-- 0000~007F: Basic Latin
- U+0021: EXCLAMATION MARK
- U+0022: QUOTATION MARK
- U+0023: NUMBER SIGN
- U+0024: DOLLAR SIGN
- U+0025: PERCENT SIGN
- U+0026: AMPERSAND
- U+0027: APOSTROPHE
- U+0028: LEFT PARENTHESIS
- U+0029: RIGHT PARENTHESIS
- U+002A: ASTERISK
- U+002B: PLUS SIGN
- U+002C: COMMA
- U+002D: HYPHEN-MINUS
- U+002E: FULL STOP
- U+002F: SOLIDUS
- U+0030: DIGIT ZERO
- U+0031: DIGIT ONE
- U+0032: DIGIT TWO
- U+0033: DIGIT THREE
- U+0034: DIGIT FOUR
- U+0035: DIGIT FIVE
- U+0036: DIGIT SIX
- U+0037: DIGIT SEVEN
- U+0038: DIGIT EIGHT
- U+0039: DIGIT NINE
- U+003A: COLON
- U+003B: SEMICOLON
- U+003C: LESS-THAN SIGN
- 0080~00FF: Latin-1 Supplement
- 0100~017F: Latin Extended-A
- 0180~024F: Latin Extended-B
- 0250~02AF: IPA Extensions
0000~00FF까지는 ISO/IEC 8859와 동일하다.