ご挨拶!
皆さんこんにちは!私は日本で大学院生をしているMikuです。 私はGSoCを通して、日本における住所検索アルゴリズムを改善する予定です。このような機会をいただけてとてもわくわくしています。
私のプロジェクトについて
皆さんもご存じの通り日本の住所は独特で世界的に一般的な住所の仕組みと異なり、Block addressが基本となっています。しかしながら、OSMの住所検索アルゴリズムであるNominatimはこれら日本独自の住所システムに対応しておらず日本の住所を正しく検索することは困難です。 そこで私のGSoCのプロジェクトでは検索アルゴリズムに日本の住所に対応する機能を追加することでこの問題に取り組みます。これらの機能の追加方法はこちらのリンクを参照することができます。
私のプロジェクトの目標
- houseenumber、block_number、neighborhoodなど、日本特有の構成要素に適切にタグを設定できるsanitizerを開発する
- 日本の住所構造に基づいて適切なフォーマットを生成できるtokenizerを実装する
- (Option)tokenizerに、中国語と日本の漢字を区別する機能を追加する
お読みいただきありがとうございました。この問題はとても日本独自のシステムに基づいています。もし何かコメントがありましたらご指摘いただけますと幸いです。
Discussion