2007年08月20日

このblog

って、内部では結構気の利いたことをやっている。

このblogで私はしばしば、チェコ語を、ハーチェクやチャールカ、クロウジェクなどをそのままに表記することがある。
日本語とチェコ語を同じページに表記しようとする場合は、
 ・ページの文字コードをUnicode(utf-8など)にする
 ・チェコ語の特殊文字の表記に実体文字参照を使う
 ・チェコ語の特殊文字は画像にする
 ・そんなの面倒なので、諦める
のどれかを取ることになる。
このページはShift_JISで記述されているのであるが、私は書き込みの際に「実体文字参照」なんか使わない。
キースクリプトを「チェコ語」に切り替えて、ベタ打ちするのだ。
くどくなるが、このページは文字コードが Shift_JIS なので、本来はそんなことをすると整合性が取れなくなり、最悪みんな文字化けして収拾がつかなくなる危険性さえあるのだが、実はそんな問題は起きないような対策が取られている。
例えば、「Č」という文字を入力しても、保存する際に内部で自動的に「Č」と変換してから保存しているのである。
だからShift_JISのままでも問題ない。

すごいね。

...ではあるのだが、一方では「xml使ってるんだから、utf-8使うべきじゃないの?」という気持ちもある。デフォルトの文字コードなんだし。
posted by D(各務) at 23:29| Comment(0) | TrackBack(0) | web/net/pc
この記事へのコメント
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

※ブログオーナーが承認したコメントのみ表示されます。
この記事へのトラックバックURL
http://blog.sakura.ne.jp/tb/5138883
※ブログオーナーが承認したトラックバックのみ表示されます。
※言及リンクのないトラックバックは受信されません。

この記事へのトラックバック