市区町村変遷情報に関して。
[80268][80316] 中島悟 さん で、多数のご指摘をいただいていますが、中島悟さんもおっしゃるように、今回のご指摘の内容は、大きく分けて次の3つに分けられると考えられます。
(1)明らかに別の字であり、入力時の誤りである
(2)旧字体・新字体等が入力の際に一貫しておらず、入力時の誤りである
(3)当時としても表記の揺れがあったと思われ、文献によって表記に揺れがあり、本当の「漢字」を特定することが困難
(1)は言い訳のしようのないで誤りであり、精査し、順次修正していきます。
(2)は各文献を鵜呑みにしたり、編集作業時にその場しのぎで統一方針が定まっておらず誤ったもので、これも順次修正していきます。
(3)は悩ましく、調査も困難を極めるのですが、そのままではデータベースとしての機能が不十分であるので、判断をして何らかの結論を出し、順次修正していきます。
いずれにせよ、
市区町村変遷情報においては、その名のとおりあくまで「変遷」をまとめたものであり、途中でいつの間にか名称が変わっていたり、不連続になってしまうことは許されません。変更するためには、改称手続きや、その他の変更するだけの理由が必要です。
(1)(2)(3)とも、内容により調査・作業にかかる時間は差がありますが、少しずつ既に対応しています。詳細については、まとめてレスします。
――――――――――
変遷情報検索の件。
[80316] 中島悟 さん
誤字はともかく、「ヶ」「ケ」以外も異字体を一括検索できるようにはならないでしょうか?
これは、前述の入力そのものの誤りの件とは別に、
変遷情報検索の利用者の便宜を図るための観点で、異体字等を同一視する検索システムのご提言であると考えます。
例えば、「一ノ宮村」と思って検索しても想定したデータを発見できず、実は正式な村名は「一之宮村」であった場合。
本人が気づけば、「一之宮村」で再検索すれば事なきを得るのですが、「ない」「検索の不具合だ」となってしまっては元も子もないです。
こういった事態を避けるためにも、現在の
「ヶ」と「ケ」を区別しない
と同様に、便宜を図ろうとするものです。
[80319] グリグリ さん からもありましたが、以下に、「ヶ」「ケ」と同様の、私なりの案を示します。もし、他に何か対象とした方が良いものがあれば、お教えいただければ幸いです。
なお、以下に挙げるものをすべて対象とすると決定した訳ではありません。対象を広げ過ぎると、多大な負荷を与え、かえって検索の性能に影響を与えることがあり、利用者の便宜に逆行するおそれがあるからです。
グリグリさんから、いくつか試行し、その影響を検証してみようとの話がありましたので、それに先立ち示すものです。
なお、例は、実在するものとは限りません。イメージとして例示するものです。
番号 | 対象 | 例 | 備考 |
1 | ノ, の, 之, 野 | 一ノ宮, 一の宮, 一之宮, 一野宮 | 一宮 をこれに加えるのは困難か |
2 | ヶ, ケ, が | 関ヶ原, 関ケ原, 関が原 | 関原 をこれに加えるのは困難か |
3 | 島, 嶋 |
4 | 曽, 曾 |
5 | 館, 舘 |
6 | 沢, 澤 |
7 | 滝, 瀧 |
8 | 竜, 龍 |
9 | 篭, 籠 |
10 | 条, 條 |
11 | 峰, 峯, 嶺 |
12 | 弥, 彌 |
13 | 岳, 嶽 |
単に旧字体・新字体の差異もあれば、異体字もあります。
[74087]拙稿で「旧字体・新字体の表記方法について」として方針を述べています。