番外編: ブラウザで森九段の名を正確に表記する方法

2010/7/21追記: 文字化けを生じていたため修正しました。記事掲載当初は正しく書かれていたはずなのですが、データの移行作業時にミスが生じていたようです。失礼いたしました。

SVGというあまり流行っていない形式を使って将棋盤を表現するという試みを何度かに分けて行なってきましたが、今回はその脱線ネタです。流行らないといっても、SVGはWebでどう使うかを厳格に定めたれっきとした規格があり、そのおかげで安心して使えるからこそ、ブログでお奨めできるわけです(規格化されてなくて安心できないけど便利だから使う、という技術もありますが)。

ご存じの通り、ネットワークの世界にはおびただしい数の規格が存在しています。そのほとんどはSVGよりも普及していないマイナーな技術なのですが、逆に誰もが無縁でいられないほど広く普及しているために時に多くの人を振り回してしまうような規格も存在しています。将棋の世界では、日本将棋連盟棋士の森九段の名が森けい二九段とひらがな混じりに表記されてしまうことが代表例でしょう(現在、将棋連盟の棋士紹介のページは画像で森九段のフルネームを表記していますが、ページのタイトルは「森けい二九段」になっています)。今回の話題は文字コードです。

といっても、現在では森九段のフルネームをネット上で正しく表記することは不可能ではありません。現に森 雞二と漢字表記している将棋ファンのWebサイトもいくつかあります。当ブログでも、この漢字表記を用いることを推奨いたします。ただし、ひらがな表記が使われ続けることにももっともな事情がありますので、直ちにすべてのひらがな表記を改めましょう、とまでは申し上げないことにいたします。以下、細かい説明に移ります。

まず、文字コードの面倒なお話以前に、そもそもこの漢字をコンピュータで入力する方法がわからない、という方が多いのではないかと思いますので、その方法を紹介いたします。すでに将棋パイナップルにて表記法が示されていますが、いささか高級な手筋ですので(ただし、これが唯一の方法である場合もあります。これについては後述)、Windowsで使えるもっと簡易な方法を代わりに紹介いたします(古いバージョンのWindowsではできないかもしれません。あしからず)。もっとも、こちらもあまり使う機会が多くないと思われる方法ですので、特に棋士の名を入力する機会の多い方は、将棋パイナップルに書かれているように森雞二の名をブラウザ上でコピーして変換辞書に単語登録してしまいましょう。

単語登録するほどではないがいざというときにはの字を入力したい、という場合の方法は、いくつかありますが、Windowsの場合はMicrosoft IME部首変換を用いるのが一番簡単でしょう。の部首は隹ですので、ひらがな入力モードで「ふるとり」と入力した後、(スペースキーや変換キーなどを押さずに直ちに)F5キーを押してみてください。すると多くの場合、「IME パッド – 部首」という小さなウィンドウが現れるはずです。そこに列挙されている字の中からの字を探してクリックすれば入力することができます。成功すればこれで完了です。

F5キーで文字群が現れない場合は、キーの設定が変更されているか、Microsoft ナチュラル インプットなどIME以外の日本語環境が動作していることが考えられます。この場合、言語バーIME パッドボタンを押して部首を選択するか、ツールボタンからIME パッド部首を選択することで同じウィンドウが出せますので、隹(8画)を選択してを探してクリックしてください。言語バーに上記のボタンがない場合は、言語バーのオプションを選択して上記のボタンを有効にする必要があるかもしれません。さらに言語バータスク バーと一体化している場合は、一体化している部分を右クリックして言語バーの復元を選択するところから始めなくてはならないかもしれません。嗚呼、めんどくさい。

上記のウィンドウをご覧になると、部首のほかにも文字一覧や総画数から文字を探せることに気づかれると思いますが、膨大な数の漢字から所望のものを探す必要があります。部首がわかっている漢字を探す場合には、部首索引で探すのが妥当でしょう。またWindowsのバージョンによっては、マウスで字を手書きすることによって文字を探せる手書きモードがあります。ただし、これでを出させるのは意外に難しいかも。

…と、ここまで苦労しつつもなんとか、あるいは案外簡単にを出せたと思われますが、実はここからが大変なのです。なんと、WindowsやMacintoshで長年用いられてきたシフトJISに含まれない漢字なのです(Windows Vistaなどの新しいOSでサポートされているJIS2004などには含まれるようです)。そのため、髮桙フ字を正しく扱えないソフトが数多く存在するのです。たとえば、私がよく使っているサクラエディタではを表示することができません。また、正しく表示することはできてもファイルへの保存などの場合の取り扱いに注意が必要になる場合があります。たとえばWindows 2000/XPのメモ帳では、を含んだテキストは文字コードをUnicodeもしくはUTF-8に指定しないとファイルに保存させてくれません。また、Windows 2000/XPのワードパッドの場合、を含んだテキストを(Unicodeでない)テキスト ドキュメントで保存すると誤って処理されます(エラーを出してくれない)。さらに、日本語に対応しているメールソフトの大半は、を含んだメールを出そうとすると普段お目にかかれない動作をするはずです。

幸いにしてUnicodeでWebページを作成できる場合は(UTF-8はUnicodeの一部です)、可能なかぎり、<head></head>の間に

<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />

などの表記を入れて、文字コードを明示するのがよいでしょう。

現在においてを含んでいる文字コードはいくつかありますが、現実的な選択肢はUnicodeしかありません。そのため、Webサイトやブログの作者の愛用するソフトがUnicodeに対応していないと、が入ったページを作成するのが非常に難しくなりますので、すべてのページにを要求するのは酷です。メールに関しては特に複雑な事情があるため、メールでブログを更新している人などは特に困るかもしれません。これが、への全面対応が難しい最大の理由です。

このような場合に唯一使えるのが、将棋パイナップルにて紹介されている、数字で文字を指定する方法です。実はここで使われる数字もUnicodeにて規定されたもので、ブラウザでの表記法として10年以上前に規格が制定されています。ですので、ブラウザでのみ閲覧されることがわかっているファイルを作成する場合は、この方法で問題ないでしょう。

どちらを用いる場合も、ブラウザが対応していないとを表示させることができませんので、すべての人が閲覧可能というわけにはいかないと思われます。しかしながら、数多くのソフトの中でもっとも厳格な規格対応を求められるのがブラウザであり、実際、今や日本語フォントを表示できる大多数のブラウザでUnicodeの文字の多くが表示されるのは間違いありません。リッチ・インターネット・アプリケーションと呼ばれる、高度な技術を駆使したWebページへの注目が高まっている昨今においては、ブラウザが多くの標準規格に準拠していることが特に重視されます。また、人の名を正確に表記することも大事です。以上から、無理にとまでは申し上げないものの、できるだけ多くのページでの字が見られるようになるよう祈っております。

2 Comments »

  1. 森九段の「けい」の文字は機種依存文字のようで、どう表記しようにも、受け手にそのコードが無くてはどうしようもありません。
    僕は今Vistaで、6つのブラウザ、Sleipnir、Firefox、IE8、Chrome、Opera、Safariでチェックしましたが、いずれも「森 髮椏纈」と見えています。どうしても、となれば、画像として挿入するしか無いでしょう。こちらの地元富士山の見える名所「さった峠」の「た」なども機種依存文字のようで、書くことはできますが受け手の多くは文字化けを起こします。

  2. 失礼いたしました。記事が文字化けしていました。
    修正いたしましたので、Windows Vistaのいずれのブラウザでも正しく見られるようになったと思います。
    ご指摘ありがとうございました。

RSS feed for comments on this post · TrackBack URI

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です