> 강좌 > 인코딩 & 유니코드

인코딩 & 유니코드

홈페이지에 일본어 구현하기

인터넷 초창기에는 euc-kr 인코딩을 사용했기에, 한글과 일본어를 한 페이지에 동시에 나타내기 힘들었다. 물론 euc-kr 인코딩으로도 일본어를 나타낼 수는 있지만, 일본식 한자들(예: 国,広)과 장음기호(ー), 반복기호(々) 등은 표현할 수 없었다. 또한 euc-kr의 일본어는 진짜 일본 글자가 아니라 ▒■□◆●○☎♨♧♥♬ 이런 그림 기호들 중의 하나에 지나지 않는다. 즉 일본어처럼 보일 뿐이지 실은 한글의 일부인 것이다.

그러나 유니코드(UTF-8)가 보편화된 요즘에는, 유니코드(UTF-8)로 인코딩하면 한 페이지에 한글과 일본어는 물론 중국어 간체나 유럽어, 아랍어 등 모든 문자를 정확히 표현할 수 있다. 모든 페이지를 UTF-8로 인코딩할 필요는 없고, 일본어/중국어 회화 페이지에만 적용하면 되는 것이다. (단, 블로그, 특히 가입형 블로그의 경우, 특정 페이지에만 특정 인코딩을 적용하기는 사실상 불가능하다.)

※ 유니코드는 여러 종류가 있는데, 윈도2000/XP이상에서 내부적으로 사용하는 Unicode (UTF-16LE)로 된 웹 문서(.html 등등)는 인터넷에 올릴 수 없다. 인터넷의 유니코드는 UTF-8이 원칙이다.

※ 특정 웹페이지의 인코딩을 유니코드(UTF-8)로 작성한 다음, 폰트(글씨체)를 한글 폰트(굴림,명조 등...)와 일본어 폰트(MS Mincho , MS Gothic 등....) 를 섞어서 사용한다면 문장이 길어질수록 밀리는 현상이 발생한다. Tahoma 폰트를 일관적으로 사용하면 문장의 글자가 밀리는 현상이 없어진다.

추가 사항: UTF-8로 일본어를 인코딩하더라도, 한글 OS/브라우저의 경우, 한일 공통의 한자는, 한글 폰트에 있는 한자가 웹페이지에 우선적으로 나오게 된다. 이러면 글자 모양에 일관성이 없으므로, 일본어 문장 전체에 일본어 폰트를 지정해 주어야 한다.

그리고 이건 좀더 미묘한 문제인데,
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="en" lang="en">
이런 웹페이지 언어 지정이 en (영문) 이 아닌 ko (한국어)로 되어 있다면, lang="ja" 속성을 사용해, 일본어라는 것을 웹브라우저에게 명백히 알려주어야 한다. 그래야만 한일 공통 한자에도 일본어 폰트가 적용되었었다. (이건 인코딩과는 별개의 문제다)

예를 들어, 日本国の広島に友達が住んでいます。 라는 문장이 있다면 이것에 다음과 같은 태그를 붙여 주면 된다.
<span lang="ja" style="font-family:'MS Mincho', serif">日本国の広島に友達が住んでいます。</span>

이것은 브라우저에서 아래처럼 보인다. 즉 MS Mincho라는 일본어 폰트(글자체)로 표현된다.

日本国の広島に友達が住んでいます。