묻고답하기
EUC-KR 과 UTF-8 그리고 EUC-KR의 미래......
2009.10.21 15:12
UTF-8은 유니코드입니다.
유니코드는 전세계의 모든 문자를 한꺼번에 표현할 수 있는 인코딩입니다.
한글도 완벽히 표현할 수 있습니다.
유니코드에도 여러가지 종류가 있는데, 인터넷에 올릴 HTML 파일을 유니코드로 작성할때는 반드시 UTF-8이여야 합니다.
EUC-KR은 한글과 '한국에서 통용되는 한자' 그리고 '영문'을 표현할 수 있습니다.
그러나 일본식 한자/중국어의 간체자 등은 표현 할 수 없습니다.
또한 프랑스어의 악상이나 독일어의 움라우트 등도 표현할 수 없습니다.
다만 HTML문서의 경우 EUC-KR로도, 외국 문자를 정확히 표현하는 방법이 있습니다.
요즘의 외국사이트들은 대체로 UTF-8을 사용합니다.
따라서 미래 지향적인 사이트를 만들려면 UTF-8이 좋습니다.
다만 UTF-8로 HTML문서를 만들면 파일의 용량이 다소 늘어나는 문제가 있습니다.
EUC-KR에서는 한글 1자가 2바트이지만 UTF-8에서는 한글 1글자가 3바이트 입니다.
다만 영문이나 숫자나 공백이나 특수 기호 등은 1바이트입니다.
Unicode(유니코드)란 ?
세계 각국의 언어를 통일된 방법으로 표현할 수 있게 제안된 국제적인 코드 규약의 이름이다.
8비트 문자코드인 아스키코느를 16비트로 확장하여 전세계의 모든 문자를 표현하는 표준코드이다.
8비트로 표현할 수 있는 256자는 영어나 라틴권 등에서 문제가 없으나, 한국,일본,중국,아랍 등의 다양한 문자들을 표현하는데 한계가 있다.
또한 각 나라마다 같은 코드 값에 다른 글자를 쓰는 방식으로는 국제간의 원활한 자료교환이 불가능하기 때문에 코드를 16비트 체제로 확장해서 65,536자의 영역 안에 전 세계의 모든 글자를 표시하는 표준안이다.
영어를 사용하는 국가에서 아스키 코드보다 두배의 공간이 필요하기 때문에 일반적이 통신등에서는 그 만큼의 낭비가 되지만 유니코드를 이용하면 프로그램을 하나만 만들면 모든 나라들의 글자를 처리할 수 있기 때문에 그 만큼 큰 이점도 된다.
자유게시판에 올리려고 했는데 안 보이네요...
그래서 올려 봅니다.
제로보드 배포가 중지되면서 XpressEngine 갈아 타는 사람이 많아졌습니다.
일부 몇명은 제로보드 4를 고수하고 있는 상황이고요...
(UTF-8버전 제로보드4가 있는 줄 몰랐네요...)
저도 제로보드를 고수하고 있지만 XpressEngine를 테스트 하면서 언제쯤 갈아 타야 할지 고심 중에 있습니다.
국제적인 추세에 따라 유니코드 즉, UTF-8을 따라 가는 상황인지는 모르겠지만...
우리나라 인터넷 환경이 어떨지는 궁금하네요...
UTF-8과 EUC-KR 사용비율이 어떻게 되는지 궁금합니다.
그리고 EUC-KR이 가까운 미래에 어떻게 되는지도 궁금하네요...
유니코드는 전세계의 모든 문자를 한꺼번에 표현할 수 있는 인코딩이긴 하지만, 주로 방문하는 유저들이 국내인이라면 UTF-8로 갈아 탈 필요가 없는 것 같고...
순전히 영어와 한국어로 페이지 구성한다면 EUC-KR만으로 충분할 것 같습니다.
그리고 익스프레스엔진 버젼은 국내인 뿐만 아니라 외국인도 다운 받아서 누구나 설치 할 수 있게 되어 있더군요.
다른나라 언어별로 설정해서 설치하고 이용할 수 있으니까요...(메뉴도 언어 설정에 따라 다르게 나오더군요.)
물론 html은 그 나라 언어별로 작성해줘야하지만...(전 한국어로 작성해서 영어로 설정 바뀌면 번역되어 나오는 줄 알았답니다...--ㅋ)
XpressEngine 사용해보니 깔끔하고 괜찮은 것 같습니다.
몇몇을 뺐으면 하는 것이 있지만...
우리나라 인터넷 환경은 거의 대부분 마이크로 소프트사의 익스플로어를 쓰고 있습니다.
브라우저 선택권이 있었는지 알게 모르게...
근데 거의 대부분 인터넷 옵션서 'URL을 항상 UTF-8로 보냄' 체크 해체해서 사용하고 있습니다.
이유가 파일이름이 한글로 되어 있는 이미지가 안 보이기 때문에
EUC-KR 환경에서 인터넷을 하는 것이 아닐까 싶네요...
그러자면 EUC-KR 버젼의 XpressEngine 나와 줄 법 한데...
(전 국민이 제로보드만 쓰는게 아니고 타 보드게시판 쓰시는 분도 많는데...)
요즘 국제적인 추세가 UTF-8 추세로 가고 있다면, EUC-KR의 미래는 어떻게 될까요?
제로보드 바꿔야 하냐 고심하다가 글을 올리고 보니 횡설수설 해버렸네요...
여러분의 생각 들어 보고 싶네요...
제가 뭔가를 걱정하고 무얼 생각하고 있다면 저의 머리를 시원하게 긁어 주는 글을 보았으면 하네요.
그럼....
댓글 1
-
백성찬
2009.10.21 18:48
-
라르게덴
2009.10.22 11:45
이게 사용자입장에서보면 그런 맘도 생기는데요. DB호환이나 언어등록되고 출력되는 프로그램적으로보면 UTF-8로 가는게 좋을 거 같아요.
xe는 utf-8이 아니면 사용할 수 없습니다.