인코딩과 문자 집합/Base64
베이스64는 인코딩된 코드들을 7비트 환경에서 사용할 수 있도록 64개의 문자로 변환하는 표시법이다.
64개의 문자들은 알파벳과 숫자, 그리고 2개의 특수문자를 사용하며, 2개의 특수문자는 일반적으로 +와 /이다.
변수 | 문자 | 변수 | 문자 | 변수 | 문자 | 변수 | 문자 | |||
---|---|---|---|---|---|---|---|---|---|---|
0 | A | 16 | Q | 32 | g | 48 | w | |||
1 | B | 17 | R | 33 | h | 49 | x | |||
2 | C | 18 | S | 34 | i | 50 | y | |||
3 | D | 19 | T | 35 | j | 51 | z | |||
4 | E | 20 | U | 36 | k | 52 | 0 | |||
5 | F | 21 | V | 37 | l | 53 | 1 | |||
6 | G | 22 | W | 38 | m | 54 | 2 | |||
7 | H | 23 | X | 39 | n | 55 | 3 | |||
8 | I | 24 | Y | 40 | o | 56 | 4 | |||
9 | J | 25 | Z | 41 | p | 57 | 5 | |||
10 | K | 26 | a | 42 | q | 58 | 6 | |||
11 | L | 27 | b | 43 | r | 59 | 7 | |||
12 | M | 28 | c | 44 | s | 60 | 8 | |||
13 | N | 29 | d | 45 | t | 61 | 9 | |||
14 | O | 30 | e | 46 | u | 62 | + | |||
15 | P | 31 | f | 47 | v | 63 | / |
변환 방법
+/-먼저 문자열의 2진수를 24비트씩 묶고, 맨 뒤에 모자라면 0을 붙인다.
그뒤 6비트씩 앞부터 위의 데이터를 가지고 변환한다. 한편, 파일의 끝과 그냥 0인 것을 구별하기 위하여 맨 마지막에 붙어서 0이 된 비트열은 =로 대응한다. 즉 2바이트인 11111100/11111111은 24비트로 11111100/11111111/00000000이 되고, 6비트씩 묶으면 111111/001111/111100/000000이며, 이는 다시 /P8=으로 변환된다.
변형
+/-URL이나 파일 명에서 +와 /, =을 사용할 수 없을때는 이 세글자를 대체하기도 한다.
여기서 파생된 것으로 UTF-7이 있다.