한글인코딩
-
UTF-8, UTF-16, UTF-32, 한글 인코딩EDI 관련 기술 용어 2022. 7. 20. 11:00
지난번에 이어, 유니코드 기반의 문자들을 바이트(byte) 열에 표현하는 인코딩 방식을 정리해보겠습니다. UTF 인코딩 방식으로는 UTF-8, UTF-16, UTF-32 등이 있습니다. UTF 뒤의 숫자는 한 문자를 인코딩하는 길이로, UTF-8은 유니코드 문자를 8비트(1바이트) 값으로 인코딩함을 의미합니다.UTF-8 문자의 코드가 속한 범위에 따라 1~4byte 인코딩하는 가변 길이 인코딩 방식입니다.유니코드 문자 모두를 인코딩하며 가장 많이 사용되는 방식입니다.아스키(ASCII) 문자들은 변형없이 1바이트에 그대로 인코딩하고, 중동과 유럽 지역의 언어는 2바이트, 한글을 포함한 아시아권은 3byte 이상으로 인코딩합니다.웹에서 많이 사용되며, XML 및 HTML의 기본 인코딩으로 UTF-8..