인코딩과 문자 집합/유니코드

유니코드는 이세상의 모든 문자 집합을 통합하기 위해 만들어진 문자 집합이다.

유니코드의 처음 256자는 ISO/IEC 8859과 동일하며, 이후의 문자들은 규칙에 따라 배정되어 있다.

유니코드 문자 영역

+/-
  • 0000~007F: Basic Latin
    • U+0021: EXCLAMATION MARK
    • U+0022: QUOTATION MARK
    • U+0023: NUMBER SIGN
    • U+0024: DOLLAR SIGN
    • U+0025: PERCENT SIGN
    • U+0026: AMPERSAND
    • U+0027: APOSTROPHE
    • U+0028: LEFT PARENTHESIS
    • U+0029: RIGHT PARENTHESIS
    • U+002A: ASTERISK
    • U+002B: PLUS SIGN
    • U+002C: COMMA
    • U+002D: HYPHEN-MINUS
    • U+002E: FULL STOP
    • U+002F: SOLIDUS
    • U+0030: DIGIT ZERO
    • U+0031: DIGIT ONE
    • U+0032: DIGIT TWO
    • U+0033: DIGIT THREE
    • U+0034: DIGIT FOUR
    • U+0035: DIGIT FIVE
    • U+0036: DIGIT SIX
    • U+0037: DIGIT SEVEN
    • U+0038: DIGIT EIGHT
    • U+0039: DIGIT NINE
    • U+003A: COLON
    • U+003B: SEMICOLON
    • U+003C: LESS-THAN SIGN
  • 0080~00FF: Latin-1 Supplement
  • 0100~017F: Latin Extended-A
  • 0180~024F: Latin Extended-B
  • 0250~02AF: IPA Extensions

0000~00FF까지는 ISO/IEC 8859와 동일하다.