[19839]hmtさん
地名の場合も含めて、入力できない字はどのように処理するのが良いでしょうか。
やや古風ですが、[左右][上/下][外<中]という記法があります。
例: 森[區鳥]外 吐[口葛]喇
ただし、この例ではたまたま「區」「葛」が使えましたが、ほかの文字でもそうとは限りません。
私が好んで使うのは、Unicodeを指定する方法です。
長所として、
・ネットワーク環境ならば具体的な字形がすぐに見れること、
・多文字環境への可搬性が高いこと
が挙げられます。
たとえば、こんな感じです。
森〓外[〓はU+9DD7] 吐〓喇[〓はU+5676]
「〓」は、この文字が使えないことを示す記号です。吐【カ】喇などとしてもいいでしょう。
(個人的な文書では、単に「吐\x{5676}喇」などとしますが)
http://www.unicode.org/cgi-bin/GetUnihanData.pl?codepoint=5676
などとリンクしておけば、親切でしょう。
コードは、Unihan Database
http://www.unicode.org/charts/unihanrsindex.html
などで調べられます。
[19907]般若堂そんぴん さん
トカラ列島も正しく入力できない地名ですね.吐と喇は出ますが,「口偏に葛」……お?「葛」の下の部分も正しく表示されませんね.正しく表記されるフォントもあるのでしょうか?
Arial Unicode MS、CulimChe、MingLIU、MS Hei、MS Song などが、「中が人」の(般若堂そんぴんさんの言う「正しい」)グリフを持ちます。
Arial Unicode MS以外は、中国・台湾・韓国のフォントです。
この文字は、JISの字体では「中が匕」、Unicodeの字体では「中が人」になっています。
ただし、統合(JISの用語では包摂)されているので、もう片方の字体のために使ってもかまいません。