텍스트 파일을 저장하려는데 아래와 같은 메시지가 발생한 경우 해결 방법을 알아본다.
"이 파일에는 ANSI로 인코딩된 문서로 저장하는 경우 손실될 유니코드 형식 문자가 포함되어 있습니다. 유니코드 정보를 보존하려면 [취소]를 클릭한 다음 인코딩 드롭다운 목록에서 유니코드 옵션 중 하나를 선택 하십시오 계속하시겠습니까?"
해결방법은?
ANSI 형태로 인코딩 되어있을 파일을 [다른이름으로저장] 하여 UTF-8 로 인코딩을 변경한 후 [저장] 하면 된다.
왜 이런현상이 발생했을까?
컴퓨터 언어의 인코딩을 이해해야 하는데 간략히 설명하면 아래와 같다.
유니코드 ?
유니코드는 전 세계에 있는 모든 문자를 다루기 위한 표준 문자 전산 처리 방식이다.
문자와 코드를 1:1로 매핑해놓은 표라고 볼 수 있다.
이 유니코드를 인코딩 하여 각 언어들을 표기 할 수 있다.
ANSI ?
일반적으로 MS-DOS 의 인코딩인 OEM-US 나 Windows-1252 를 이야기 한다.
한글의 경우 ANSI 타입으로 읽었을때 한글은 키보드 기준으로 봤을때 여러 키의 조합이기 때문에 ANSI 로 표현하지 못하는 경우가 생긴다.
UTF-8 ?
유니코드에서 한글은 한자 다음으로 많은 코드를 차지하고 있는 문자인데
UTF-8 은 유니코드를 인코딩 하는 방식 중 하나로 가장 표준적으로 사용된다고 볼 수있다.
한 글자당 3byte 를 사용한하는데 한글역시 3byte를 사용하기 때문에 UTF-8 을 사용하면 무리 없이 한글을 표현할 수 있는 것이다.
만약 영어만 사용한다면 인코딩 Type 이 ANSI 일 경우 더 적응 용량을 가질 수 있으며 UTF-8을 사용하면 한글 이나 한자 같은 조합된 언어를 쓸 수 있다고 생각하면 편하다.
더 기술적이고 학술적인 부분은 패스~