JP6811087B2 - 検索装置、検索方法、及びプログラム - Google Patents

検索装置、検索方法、及びプログラム Download PDF

Info

Publication number
JP6811087B2
JP6811087B2 JP2016245972A JP2016245972A JP6811087B2 JP 6811087 B2 JP6811087 B2 JP 6811087B2 JP 2016245972 A JP2016245972 A JP 2016245972A JP 2016245972 A JP2016245972 A JP 2016245972A JP 6811087 B2 JP6811087 B2 JP 6811087B2
Authority
JP
Japan
Prior art keywords
character string
character
type
search
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016245972A
Other languages
English (en)
Other versions
JP2018101224A (ja
Inventor
アレン真人 飯田
アレン真人 飯田
幸司 伊藤
幸司 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Communications Corp
Original Assignee
NTT Communications Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Communications Corp filed Critical NTT Communications Corp
Priority to JP2016245972A priority Critical patent/JP6811087B2/ja
Publication of JP2018101224A publication Critical patent/JP2018101224A/ja
Application granted granted Critical
Publication of JP6811087B2 publication Critical patent/JP6811087B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、入力された文字列に基づいて情報を検索する技術に関連するものである。
アルファベット文字(ローマ字と称してもよい)の文字列を入力することにより、かな文字の情報で構成されるデータベースを検索する場合、アルファベット文字の文字列をかな文字の文字列に変換し、当該かな文字の文字列を用いてデータベースを検索する。
アルファベット文字の文字列をかな文字の文字列に変換する場合、従来技術では、かな文字とアルファベット文字の文字列との1対1の対応関係を用いて、アルファベット文字の文字列をかな文字の文字列に変換する。このような変換技術に関連する先行技術文献として、例えば、特許文献1がある。
特許第4001872号
一般に、かな文字の文字列には複数のアルファベット文字表記がある。例えば、「おおにし」は、onishi、oonishi、ohnisi、等と表記することができ、これらは全て「おおにし」を示す正しいアルファベット文字(ローマ字)の文字列である。
しかし、上述した従来技術における変換方法では、「o」は「お」と変換され、「on」では「おお」に変換されない。従って、例えば、onishiを入力して、かな文字の情報で構成されるデータベースを検索しても、期待する検索結果「おおにし」は得られない。よって、従来技術では、アルファベット文字の文字列を入力することにより、かな文字の情報で構成されるデータベースを検索する場合において、ユーザは、システム側で登録された形式のとおりにアルファベット文字の文字列を入力する必要があり、曖昧な文字列での検索ができず、利便性が低かった。特に、人名の場合、表記がばらつきやすく、同性の場合でも異なるアルファベット文字の文字列が登録される場合が多く、検索が容易ではなかった。
なお、上記のような課題は、アルファベット文字からかな文字への変換に限らず、様々な文字種に係る変換において生じ得る課題である。
本発明は上記の点に鑑みてなされたものであり、第1文字種の文字で表記された文字列である第1種文字列を、第2文字種の文字で表記された文字列である第2種文字列に変換し、当該第2種文字列を用いて所望の情報の検索を行う技術において、所望の情報に対応する第1種文字列を特定できない場合でも、所望の情報の検索を容易に行うことを可能とする技術を提供することを目的とする。
開示の技術によれば、1つ又は複数の第1文字種の文字からなる第1種文字列の入力に基づいて、データベースに対する検索を行う検索装置であって、
第1種文字列毎に、当該第1種文字列に対応付けられた、1つ又は複数の第2文字種の文字からなる第2種文字列を格納する格納部と、
第1種文字列の入力を受け付ける入力部と、
前記入力部により入力された第1種文字列である入力第1種文字列を要素毎に区切り、区切った要素毎に、当該区切った要素に対応する1つ又は複数の第2種文字列を前記格納部から取得し、取得した第2種文字列を用いて前記データベースを検索し、検索結果を取得する処理部と、
前記検索結果を出力する出力部とを備え、
前記第1文字種の文字はローマ字であり、前記第2文字種の文字はかな文字であり、前記処理部は、前記区切った要素の1つとしての前記入力第1種文字列の終端の文字列が子音である場合に、ローマ字表記で子音を有する1以上のかな文字を前記格納部から取得し、前記検索に利用する
ことを特徴とする検索装置が提供される。
開示の技術によれば、第1文字種の文字で表記された文字列である第1種文字列を、第2文字種の文字で表記された文字列である第2種文字列に変換し、当該第2種文字列を用いて所望の情報の検索を行う技術において、所望の情報に対応する第1種文字列を特定できない場合でも、所望の情報の検索を容易に行うことを可能とする技術が提供される。
本発明の実施の形態における検索装置100の機能構成図である。 検索装置100のハードウェア構成図である。 検索装置100の処理の全体の流れを示すフローチャートである。 アルファベット文字列に対する処理例を示す図である。 表示例を示す図である。 ステップS1の詳細処理例を示すフローチャートである。 ステップS1で参照されるテーブルの例を示す図である。 ステップS2の詳細処理例を示すフローチャートである。 ステップS2で参照されるテーブルの例を示す図である。
以下、図面を参照して本発明の実施の形態(本実施の形態)を説明する。以下で説明する実施の形態は一例に過ぎず、本発明が適用される実施の形態は、以下の実施の形態に限られるわけではない。
以下では、アルファベット文字で表記される文字列を、かな文字で表記される文字列に変換し、当該変換された文字列を用いてデータベースを検索する例を説明するが、これは一例に過ぎない。変換元の文字種はアルファベット文字以外の文字種でもよく、変換先の文字種もかな文字以外の文字種でもよい。なお、かな文字は、ひらがなでもよいしカタカナでもよい。以下では、例として、ひらがなを用いる場合を示している。
以下、アルファベット文字で表記される文字列をアルファベット文字列と呼び、かな文字で表記される文字列をかな文字列と呼ぶ。アルファベット文字列は、1つ又は複数のアルファベット文字からなる文字列であり、かな文字列は、1つ又は複数のかな文字からなる文字列である。なお、本実施の形態でのアルファベット文字、アルファベット文字列はそれぞれ、ローマ字、ローマ字列と言い換えてもよい。
また、以下の実施の形態における検索の適用分野は特定の分野に限られないが、一例として、座席表等に利用される所定の組織における人名のデータベースに対する検索に適用することができる。
(装置構成)
図1に、本実施の形態における検索装置100の機能構成図を示す。図1に示すように、本実施の形態における検索装置100は、入力部101、表示部102、変換・検索処理部103、データ格納部104を含む。また、図1に示すように、検索の対象となる情報を格納したデータベース105が検索装置100にネットワークを介して接続されている。なお、データベース105は、検索装置100の内部に備えられていてもよい。また、データ格納部104が検索装置100の外部に備えられ、検索装置100とネットワーク接続される構成であってもよい。なお、データ格納部104が検索装置100とネットワーク接続される構成であっても、当該検索装置100とデータ格納部104とを含む構成を「検索装置」と称してよい。
入力部101は、ユーザからのアルファベット文字列の入力を受け付ける。表示部102は、入力部101により入力されるアルファベット文字列を表示するとともに、変換・検索処理部103による検索結果を表示する。表示部102は、検索結果を出力する出力部の例である。表示部102に代えて、表示を行わない出力部を備えても良い。その場合、例えば、出力部から出力された検索結果は、他の装置に送信され、当該他の装置で検索結果の表示がなされる。例えば、検索装置100がウェブサーバやアプリケーションサーバとして動作し、これにネットワーク接続されるユーザ端末(クライアント)から入力された文字列が入力部101から検索装置100に入力され、検索結果が上記の出力部からユーザ端末に返される構成であってもよい。
変換・検索処理部103は、入力部101から入力されたアルファベット文字列をかな文字列に変換し、当該かな文字列を用いてデータベース105に対する検索を実施する。データ格納部104には、アルファベット文字列をかな文字列に変換する際に参照される各種のテーブルが格納されている。
データベース105は、かな文字列からなる検索対象情報を格納するデータベースである。本実施の形態では、検索処理をかな文字列で行うが、データベース105には、かな文字例以外の情報も格納されており、検索装置100は、検索結果として、かな文字列以外の情報も表示することが可能である。例えば、人名を漢字やアルファベットで表示したり、メールアドレス、電話番号等を表示することができる。データベース105は、かな文字の情報のみを有する(アルファベット文字を有しない)データベースであってもよい。
なお、入力部101あるいは変換・検索処理部103が、既存のかな漢字変換機能を備え、入力されたアルファベット文字列をかな文字列あるいは漢字に変換し、変換後のかな文字列あるいは漢字が表示部102に表示されてもよい。また、既存のかな漢字変換機能が備えられる場合において、「うt」、「石t」のように、かな漢字変換機能で変換できた文字と、変換されないアルファベット文字が混在して表示されることとしてもよい。
既存のかな漢字変換機能により、かな文字列あるいは漢字が未変換のアルファベット文字とともに表示される場合でも、以下で説明する検索処理はそのまま実行することが可能である。
<検索装置100のハードウェア構成例>
本実施の形態に係る検索装置100は、例えば、1つ又は複数のコンピュータに、本実施の形態で説明する処理内容を記述したプログラムを実行させることにより実現可能である。すなわち、検索装置100が有する機能は、当該コンピュータに内蔵されるCPUやメモリ、ハードディスクなどのハードウェア資源を用いて、検索装置100で実施される処理に対応するプログラムを実行することによって実現することが可能である。上記プログラムは、コンピュータが読み取り可能な記録媒体(可搬メモリ等)に記録して、保存したり、配布したりすることが可能である。また、上記プログラムをインターネットや電子メールなど、ネットワークを通して提供することも可能である。
図2は、検索装置100をコンピュータで実現する場合における当該装置のハードウェア構成例を示す図である。図2に示す検索装置100は、それぞれバスBで相互に接続されているドライブ装置150、補助記憶装置152、メモリ装置153、CPU154、インタフェース装置155、表示装置156、及び入力装置157等を有する。
当該検索装置100での処理を実現するプログラムは、例えば、CD−ROM又はメモリカード等の記録媒体151によって提供される。プログラムを記憶した記録媒体151がドライブ装置150にセットされると、プログラムが記録媒体151からドライブ装置150を介して補助記憶装置152にインストールされる。但し、プログラムのインストールは必ずしも記録媒体151より行う必要はなく、ネットワークを介して他のコンピュータよりダウンロードするようにしてもよい。補助記憶装置152は、インストールされたプログラムを格納すると共に、必要なファイルやデータ等を格納する。
メモリ装置153は、プログラムの起動指示があった場合に、補助記憶装置152からプログラムを読み出して格納する。CPU154(プロセッサ)は、メモリ装置153に格納されたプログラムに従って当該装置に係る機能を実現する。インタフェース装置155は、ネットワークに接続するためのインタフェースとして用いられる。表示装置156はプログラムによるGUI(Graphical User Interface)等を表示する。入力装置157はキーボード及びマウス、ボタン、又はタッチパネル等で構成され、様々な操作指示を入力させるために用いられる。
(検索装置100が実行する処理の流れ)
次に、図1に示した構成を備える検索装置100が実行する処理の流れを図3のフローチャートの手順に沿って説明する。なお、以下のステップS1とステップS2については概要であり、詳細処理は後述する。
ステップS1において、入力部101から入力されたアルファベット文字列が変換・検索処理部103に渡され、変換・検索処理部103が、当該アルファベット文字列を、ローマ字表記において確実にかな文字がまたがない単位のアルファベット文字列に分割する。一例として、図4(a)に示す「onis」が入力された場合、「o」、「ni」、「s」の3つのアルファベット文字列に分割される。仮に「on」と「is」に分割する場合、かな文字「に」がこれら2つの要素をまたがるので、「on」、「is」の分割はなされない。
ステップS2において、変換・検索処理部103は、ステップS1で分割されたアルファベット文字列毎に分析を行って、データ格納部104に格納されている変換テーブルを参照することで、アルファベット文字列を、1つ又は複数のかな文字列に置き換える。図4の例では、(b)に示すように、「o」は、「お」、「おお」、及び「おう」に置き換えられ、「ni」は「に」に置き換えら、「s」は「さ」、「し」、「す」、「せ」、「そ」に置き換えられる。また、「ni」を構成する「n」と「i」について、「n」は「ん」に置き換えられ、「i」は「い」に置き換えられる。これら置き換えられた文字列は、候補配列(メモリ領域)に格納される。
ステップS3において、変換・検索処理部103は、ステップS2で得られたかな文字列の集合を、かな文字列の全ての可能な組み合わせで検索がなされるように、正規表現に変換する。図4の例では(c)に示すように変換がなされる。(c)に示す正規表現における"^" は行の先頭を示し、"|"は、「又は」を示す。
ステップS4において、変換・検索処理部103は、ステップS3で作成した正規表現を用いてデータベース105に対して検索をかける。
ステップS5において、変換・検索処理部103は、データベース105から得られた検索結果を表示部102に渡し、表示部102が検索結果を表示する。図4(c)に示した正規表現の場合、例えば、「おおにし」、「おにし」、「おうんいさ」等が検索によりマッチして、表示部102に表示される。変換・検索処理部103は、マッチしたかな文字列のみをデータベース105から取得して、表示部102に表示させてもよいし、マッチしたかな文字列に紐付られた情報(例:漢字名、ローマ字名等)も取得して、表示部102に表示させてもよい。
図5に表示画面の一例を示す。図5に示す例は、「ot」を入力した場合の例である。この場合、変換・検索処理部103による変換・検索処理により、「おおた」、「おおつき」、「おち」がマッチし、これらに対応する情報が表示されている。
なお、上記の例では、「onis」、「ot」等を入力した場合を説明しているが、検索装置100は、1文字のアルファベットの入力毎に、当該1アルファベット文字と、それまでに入力したアルファベット文字とからなる文字列に対して上述した処理を実行し、1文字のアルファベットの入力毎に順次検索結果を表示する。つまり、所望の情報にマッチするかどうか定かでないアルファベット文字列を順次入力して検索結果を絞り込むという、曖昧検索+インクリメンタルサーチが実現される。
例えば、「o」を入力した時点で、おおにし、おがた、おぐり、おうえ、の4名の情報が検索結果として表示され、次にhを入力した時点で、「oh」の検索結果として、おおにし、おうえ、の2名の情報が検索結果として表示され、次にnを入力した時点で、「ohn」の検索結果として、おおにし、の1名の情報が検索結果として表示される。また、例えば、「o」を入力した時点で、おおにし、おがた、おぐり、おうえ、の4名の情報が検索結果として表示され、次にuを入力した時点で、「ou」の検索結果として、おうえ、の1名の情報が検索結果として表示される。また、例えば、「o」を入力した時点で、おおにし、おがた、おぐり、おうえ、の4名の情報が検索結果として表示され、次にgを入力した時点で、「og」の検索結果として、おがた、おぐり、の2名の情報が検索結果として表示される。
また、例えば、「o」を入力した時点で、おおにし、おがた、おぐり、おうえ、の4名の情報が検索結果として表示された場合において、入力部101から、特定の人に確定することを示す情報が入力された場合に、変換・検索処理部103が、当該特定の人の情報を選定して表示部102に渡し、表示部102が当該情報を表示してもよい。特定の人に確定することを示す情報は、例えば、既存のかな漢字変換機能で表示されている複数の変換候補から1つの変換候補(例:大西)を選択することであってよい。
すなわち、本実施の形態に係る技術により、ユーザがアルファベットの1文字を入れるだけで探したい情報(例として人名とする)の複数候補を表示し、更に1文字追加する度に人名の候補が絞られて表示することを実現できる。これにより、探したい人名を迅速に検索することが可能となり、曖昧な文字の入力でも検索が可能となる。また、既存のかな漢字検索と組み合わせる場合、完全一致検索と異なり、入力中の未変換のローマ字が文字列に混ざっている場合でも検索結果を表示できる。
(ステップS1の詳細処理例)
以下、前述したステップS1における、変換・検索処理部103により実行されるアルファベット文字列の分割処理を、図6のフローチャートを参照してより詳細に説明する。
ステップS101において、開始インデックス(start index)と終了インデックス(end index)を0に初期化する。ステップS102において、終了インデックスを1増加させる。図4(a)の「onis」の例では、この時点で、終了インデックスは「o」を指している。以下、適宜、図4(a)の「onis」についての例を用いて説明する。
ステップS103において、終了インデックスが指す文字(「o」)を分析する。ステップS104において、終了インデックスが指す文字(「o」)が文字列(「onis」)の最後の文字であるかどうかを判定し、YesであればステップS105に進み、NoであればステップS106に進む。
ステップS105では、サブストリングを文字セットに加えて処理を終了する。サブストリングとは、開始インデックスの次の文字から終了インデックスの文字までの文字列である。例えば、図4(a)の例において、開始インデックスが0で、終了インデックスが1の場合、サブストリングは「o」であり、開始インデックスが1で、終了インデックスが3の場合、サブストリングは「ni」である。また、文字セットとは、ステップS2での処理対象となる文字列の呼び名である。このステップS105に進む場合、図4(a)の例では、サブストリング「s」が、文字セットに追加される。なお、図6において、S101、S109のsetは設定の意味であり、S105、S106、S107、S108におけるsetは文字セットの意味である。
ステップS106において、サブストリングが文字セット終了条件(set end condition)を満たすかどうかを判定する。図7に、文字セット終了条件の一例を示す。当該文字セット終了条件のテーブルは、データ格納部104に格納されており、変換・検索処理部103から参照される。なお、図7の1行目の「char」は「character」の略である。
図7に示すセット終了条件の1行目のエントリの場合、終了インデックスにおける文字がaiueoの5文字のうちのいずれかに該当し、次の文字がhではない場合に、ステップS106の判定はYesとなる。他のエントリについてもエントリの記載に従って判定される。increment startIndexは、ステップS109で使用される値である。
S106の判定がYesとなる場合のステップS107では、サブストリングをセットに追加することを決定し、ステップS108において、開始インデックスから終了インデックスまでのサブストリング(開始インデックスの次のインデックスが指す文字から、終了インデックスが指す文字までの文字列)をセットに追加する。ステップS109において、開始インデックスを、「終了インデックス+increment startIndex」にする。例えば、開始インデックスが0のときに、終了インデックスが1、increment startIndexが0であれば、開始インデックスは1になる。ステップS109の次にステップS102に進む。
例えば、図4(a)の例で、ステップS109の時点で、開始インデックスが1、終了インデックスが1になり、ステップS102に進んだものとする。この場合、終了インデックス2が指す文字nは、ステップS106の判定でNoとなり、再びステップS102に戻り、このステップS102の時点で、開始インデックスが1、終了インデックスが3になる。この場合、ステップS106の判定がYesとなり、「ni」が得られる。
(ステップS2の詳細処理例)
次に、前述したステップS2における、変換・検索処理部103により実行されるアルファベット文字列のかな文字列への置き換え処理を、図8のフローチャートを参照してより詳細に説明する。本実施の形態において、図8に示す処理は、ステップS1で分割したアルファベット文字列毎(文字セット毎)に行われる。以下の説明でも適宜、図4の例を使用する。また、以下の例において、図9(a)〜(c)に示すテーブルが適宜参照される。これらのテーブルはデータ格納部104に格納されているテーブルである。
ステップS201において、文字セットが空かどうか判定する。ステップS201での判定がYesであればステップS216に進み、置き換えられたかな文字列(候補文字列)を返す。ステップS201での判定がNoであればステップS202に進む。なお、本例では、ある文字セットを構成するアルファベット文字列において、サブセット(例:「ni」における「n」と「i」)毎に、処理が再帰的に実行される。文字セットの中に、未処理のサブセットがない場合に、S201はYesになる。
ここでは、まず、文字セット「o」の処理を行うものとする。ステップS202において、サブセットの長さを1にして、ステップS203でサブセットを取得する。ここでは、文字セットが1文字「o」だけなので、これがサブセットとして取得される。
ステップS204において、当該サブセットが特殊ケーステーブル(special cases table)における条件を満たすか否かを判断する。図9(c)に、特殊ケーステーブルの例を示す。ここで示す特殊ケーステーブルの例は、対象のサブセットが、連続する子音(例:pp)で開始する場合、「っ」を追加するというルールを示す。
この条件に該当する場合、ステップS213に進んでルールに従った処理を行うが、ここでのサブセットの例である「o」については条件に該当せずにステップS205に進む。
ステップS205では、該当のサブセットが最後の文字セットの最後のサブセット(図4(b)の例では「s」)であるかどうかを判断する。「o」については、Noとなり、ステップS208に進む。
ステップS208において、サブセットが変換テーブルに存在するかどうかを判定する。「o」については、図9(a)に示すように存在し、YesとなるのでステップS207に進み、変換テーブルの値「お、おお、おう」を候補配列に加える。
次に、ステップS209〜S212において、対象の文字セットに対して、再帰的に上述した処理を行って、候補を取得する処理を行う。
ただし、ここでの文字セット「o」については、1文字なので、ステップS214に進む。ステップS214においてサブセット長をインクリメント(つまり2にする)して、ステップS215に進む。ステップS215において、サブセット長(2)が文字セット長(1)より長いので(つまり、最大サブセット長より長いので)、ステップS216に進み、候補を返す。つまり、「お、おお、おう」が返される。配列の形式では、[お,おお,おう]が返される。
次に、文字セット「ni」についての処理が行われる。ここでは、ステップS203において、サブセット「n」を取得し、ステップS204〜S205を経てS208まで進み、変換テーブルに該当するので、ステップS207において、候補配列に「ん」が追加される。続いて、再帰的処理(ステップS209〜S212)により、サブセット「i」に対して、「い」が取得され、候補配列に「い」が追加される。これにより、候補配列[ん,い]が得られる。
次に、ステップS214においてサブセット長を2とし、ステップS215を経て、ステップS203で、サブセット「ni」を取得する。ステップS204〜S205を経てステップS208まで進み、変換テーブルに該当するので、ステップS207において、候補配列に「に」が追加される。その後、ステップS214、S215を経て、ステップS216で、候補配列[「に」,[ん,い]]が返される。
次に、文字セット「s」(=サブセット)に対する処理を行う。この場合、ステップS205において、Yesとなり、ステップS206において、サブセット「s」が、「terminus table」にあるかどうかを判断する。当該テーブルは図9(b)に示されるものであり、このテーブルには図9(a)の「conversion table」の情報も含む。ただし、「terminus table」に「conversion table」の情報を含めないこととしてもよい。その場合、ステップS206において、サブセットが、「conversion table」と「terminus table」のどちらかでマッチすればYesとなる。
ここでは、sが「terminus table」に存在するので、ステップS206はYesとなり、ステップS207において、テーブルの値から候補配列に値が追加されて候補配列[さ,し,す,せ,そ]が得られる。その後、ステップS216において[さ,し,す,せ,そ]が返される。その結果、図4(b)に示したように文字セット毎のかな文字列が得られる。
上記のように、入力されたアルファベット文字列の最後の子音が図9(b)のテーブルに登録されている場合、ローマ字表記をした場合に当該子音を頭に持つかな文字が全て取得される。
なお、ステップS1の分割を行わずに、ステップS2の上記処理を行うこととしてもよい。計算量が増加するが、ステップS1の分割を行う場合と同様の結果が得られる。ステップS1の分割を行わない場合でも、ステップS2の処理により、分割に相当する処理は実行されている。
(実施の形態のまとめ)
以上、説明したとおり、本実施の形態により、1つ又は複数の第1文字種の文字からなる第1種文字列の入力に基づいて、データベースに対する検索を行う検索装置であって、第1種文字列毎に、当該第1種文字列に対応付けられた、1つ又は複数の第2文字種の文字からなる第2種文字列を格納する格納部と、第1種文字列の入力を受け付ける入力部と、前記入力部により入力された第1種文字列である入力第1種文字列を要素毎に区切り、区切った要素毎に、当該区切った要素に対応する1つ又は複数の第2種文字列を前記格納部から取得し、取得した第2種文字列を用いて前記データベースを検索し、検索結果を取得する処理部と、前記検索結果を出力する出力部とを備えることを特徴とする検索装置が提供される。
前記格納部は、入力される第1種文字列の終端の文字列となり得る所定の文字列と、当該所定の文字列に対応付けられた複数の第2種文字列とを格納し、前記処理部は、前記区切った要素の1つとしての前記入力第1種文字列の終端の文字列が、前記所定の文字列に該当する場合に、前記複数の第2種文字列を前記格納部から取得し、前記検索に利用することとしてもよい。例えば、前記第1文字種の文字はローマ字であり、前記所定の文字列は子音である。また、例えば、前記第2文字種の文字はかな文字であり、前記複数の第2種文字列は、ローマ字表記で子音を有するかな文字である。また、例えば、前記第1文字種の文字はローマ字であり、前記第2文字種の文字はかな文字であり、前記所定の文字列は子音であり、前記複数の第2種文字列は、ローマ字表記で当該子音を有するかな文字である。
前記出力部は、前記処理部により得られた全ての検索結果を表示し、前記入力部から特定の検索結果を確定することを示す情報が入力された場合に、当該特定の検索結果のみを表示することとしてもよい。特定の検索結果を確定することを示す情報とは、例えば、入力第1種文字列に基づき、かな漢字変換機能により表示された変換後の漢字文字列候補の中から、特定の漢字文字列候補を選択したことを示す情報である。
例えば、前記データベースは、所定の組織における人名のデータベースであり、前記入力部により、当該データベースに含まれる特定の人名の一部のみに該当する第1種文字列が入力された場合でも、前記処理部は、当該特定の人名を含む検索結果を取得することとしてもよい。すなわち、ユーザは、人名をうろ覚えであっても、当該人名の情報を検索することができる。
<付記>
(第1項)
1つ又は複数の第1文字種の文字からなる第1種文字列の入力に基づいて、データベースに対する検索を行う検索装置であって、
第1種文字列毎に、当該第1種文字列に対応付けられた、1つ又は複数の第2文字種の文字からなる第2種文字列を格納する格納部と、
第1種文字列の入力を受け付ける入力部と、
前記入力部により入力された第1種文字列である入力第1種文字列を要素毎に区切り、区切った要素毎に、当該区切った要素に対応する1つ又は複数の第2種文字列を前記格納部から取得し、取得した第2種文字列を用いて前記データベースを検索し、検索結果を取得する処理部と、
前記検索結果を出力する出力部と
を備えることを特徴とする検索装置。
(第2項)
前記格納部は、入力される第1種文字列の終端の文字列となり得る所定の文字列と、当該所定の文字列に対応付けられた複数の第2種文字列とを格納し、
前記処理部は、前記区切った要素の1つとしての前記入力第1種文字列の終端の文字列が、前記所定の文字列に該当する場合に、前記複数の第2種文字列を前記格納部から取得し、前記検索に利用する
ことを特徴とする第1項に記載の検索装置。
(第3項)
前記第1文字種の文字はローマ字であり、前記所定の文字列は子音である
ことを特徴とする第2項に記載の検索装置。
(第4項)
前記第2文字種の文字はかな文字であり、前記複数の第2種文字列は、ローマ字表記で子音を有するかな文字である
ことを特徴とする第2項又は第3項に記載の検索装置。
(第5項)
前記出力部は、前記処理部により得られた全ての検索結果を表示し、前記入力部から特定の検索結果を確定することを示す情報が入力された場合に、当該特定の検索結果のみを表示する
ことを特徴とする第1項ないし第4項のうちいずれか1項に記載の検索装置。
(第6項)
前記データベースは、所定の組織における人名のデータベースであり、前記入力部により、当該データベースに含まれる特定の人名の一部のみに該当する第1種文字列が入力された場合でも、前記処理部は、当該特定の人名を含む検索結果を取得する
ことを特徴とする第1項ないし第5項のうちいずれか1項に記載の検索装置。
(第7項)
1つ又は複数の第1文字種の文字からなる第1種文字列の入力に基づいて、データベースに対する検索を行う検索装置が実行する検索方法であって、
前記検索装置は、第1種文字列毎に、当該第1種文字列に対応付けられた、1つ又は複数の第2文字種の文字からなる第2種文字列を格納する格納部を備え、
第1種文字列の入力を受け付ける入力ステップと、
前記入力ステップにより入力された第1種文字列である入力第1種文字列を要素毎に区切り、区切った要素毎に、当該区切った要素に対応する1つ又は複数の第2種文字列を前記格納部から取得し、取得した第2種文字列を用いて前記データベースを検索し、検索結果を取得する処理ステップと、
前記検索結果を出力する出力ステップと
を備えることを特徴とする検索方法。
(第8項)
コンピュータを、第1項ないし第6項のうちのいずれか1項に記載の検索装置における各部として機能させるためのプログラム。
以上、本実施の形態について説明したが、本発明はかかる特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
100 検索装置
101 入力部
102 表示部
103 変換・検索処理部
104 データ格納部
105 データベース
150 ドライブ装置
151 記録媒体
152 補助記憶装置
153 メモリ装置
154 CPU
155 インタフェース装置
156 表示装置
157 入力装置

Claims (5)

  1. 1つ又は複数の第1文字種の文字からなる第1種文字列の入力に基づいて、データベースに対する検索を行う検索装置であって、
    第1種文字列毎に、当該第1種文字列に対応付けられた、1つ又は複数の第2文字種の文字からなる第2種文字列を格納する格納部と、
    第1種文字列の入力を受け付ける入力部と、
    前記入力部により入力された第1種文字列である入力第1種文字列を要素毎に区切り、区切った要素毎に、当該区切った要素に対応する1つ又は複数の第2種文字列を前記格納部から取得し、取得した第2種文字列を用いて前記データベースを検索し、検索結果を取得する処理部と、
    前記検索結果を出力する出力部とを備え、
    前記第1文字種の文字はローマ字であり、前記第2文字種の文字はかな文字であり、前記処理部は、前記区切った要素の1つとしての前記入力第1種文字列の終端の文字列が子音である場合に、ローマ字表記で子音を有する1以上のかな文字を前記格納部から取得し、前記検索に利用する
    ことを特徴とする検索装置。
  2. 前記出力部は、前記処理部により得られた全ての検索結果を表示し、前記入力部から特定の検索結果を確定することを示す情報が入力された場合に、当該特定の検索結果のみを表示する
    ことを特徴とする請求項1に記載の検索装置。
  3. 前記データベースは、所定の組織における人名のデータベースであり、前記入力部により、当該データベースに含まれる特定の人名の一部のみに該当する第1種文字列が入力された場合でも、前記処理部は、当該特定の人名を含む検索結果を取得する
    ことを特徴とする請求項1又は2に記載の検索装置。
  4. 1つ又は複数の第1文字種の文字からなる第1種文字列の入力に基づいて、データベースに対する検索を行う検索装置が実行する検索方法であって、
    前記検索装置は、第1種文字列毎に、当該第1種文字列に対応付けられた、1つ又は複数の第2文字種の文字からなる第2種文字列を格納する格納部を備え、
    第1種文字列の入力を受け付ける入力ステップと、
    前記入力ステップにより入力された第1種文字列である入力第1種文字列を要素毎に区切り、区切った要素毎に、当該区切った要素に対応する1つ又は複数の第2種文字列を前記格納部から取得し、取得した第2種文字列を用いて前記データベースを検索し、検索結果を取得する処理ステップと、
    前記検索結果を出力する出力ステップとを備え、
    前記第1文字種の文字はローマ字であり、前記第2文字種の文字はかな文字であり、前記処理ステップにおいて、前記区切った要素の1つとしての前記入力第1種文字列の終端の文字列が子音である場合に、ローマ字表記で子音を有する1以上のかな文字を前記格納部から取得し、前記検索に利用する
    ことを特徴とする検索方法。
  5. コンピュータを、請求項1ないしのうちのいずれか1項に記載の検索装置における各部として機能させるためのプログラム。
JP2016245972A 2016-12-19 2016-12-19 検索装置、検索方法、及びプログラム Active JP6811087B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016245972A JP6811087B2 (ja) 2016-12-19 2016-12-19 検索装置、検索方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016245972A JP6811087B2 (ja) 2016-12-19 2016-12-19 検索装置、検索方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2018101224A JP2018101224A (ja) 2018-06-28
JP6811087B2 true JP6811087B2 (ja) 2021-01-13

Family

ID=62715428

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016245972A Active JP6811087B2 (ja) 2016-12-19 2016-12-19 検索装置、検索方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP6811087B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110083687B (zh) * 2019-04-28 2022-01-04 上海盛付通电子支付服务有限公司 一种信息转换方法、设备及存储介质
CN110781209B (zh) * 2019-09-29 2022-04-22 苏州浪潮智能科技有限公司 一种数据快速查询的方法及装置

Also Published As

Publication number Publication date
JP2018101224A (ja) 2018-06-28

Similar Documents

Publication Publication Date Title
JP5362095B2 (ja) インプットメソッドエディタ
CN102449579B (zh) 一体式中文字输入方法
JP5426710B2 (ja) 検索支援装置、検索支援方法およびプログラム
Náplava et al. Diacritics restoration using neural networks
JP2006031228A (ja) 形態素解析装置、方法及びプログラム
JP4266222B2 (ja) 単語翻訳装置およびそのプログラム並びにコンピュータ読み取り可能な記録媒体
JP5678896B2 (ja) 要求抽出システム、要求抽出方法および要求抽出プログラム
JP6811087B2 (ja) 検索装置、検索方法、及びプログラム
JP2005135113A (ja) 電子機器装置、関連語抽出方法及びプログラム
JP6538563B2 (ja) 入力支援装置、入力支援方法及びプログラム
JP4845523B2 (ja) 文字処理装置、方法、プログラムおよび記録媒体
JP4084515B2 (ja) アルファベット文字・日本語読み対応付け装置と方法およびアルファベット単語音訳装置と方法ならびにその処理プログラムを記録した記録媒体
JP4486324B2 (ja) 類似単語検索装置、この方法、このプログラム、および情報検索システム
US11842152B2 (en) Sentence structure vectorization device, sentence structure vectorization method, and storage medium storing sentence structure vectorization program
JP2008059389A (ja) 語彙候補出力システム、語彙候補出力方法及び語彙候補出力プログラム
JP2013205854A (ja) 当て字変換人名入力装置、人名入力方法および人名入力プログラム
JP5097454B2 (ja) データ入力装置、方法、及びプログラム
JP2007171275A (ja) 言語処理装置及び現後処理方法
US20240037129A1 (en) Search device, search method, and recording medium
KR102278288B1 (ko) 음소 기반 텍스트 검색 장치 및 방법
JP7200474B2 (ja) 変換補助装置、変換補助システム、変換補助方法及びコンピュータプログラム
JP2010009294A (ja) 電子機器および電子機器の表示方法
JP5767784B2 (ja) 情報処置装置、文字列候補確定方法及びプログラム
JP5664042B2 (ja) 検索装置、検索方法、検索プログラム及び検索システム
JP5348699B2 (ja) データ分類システム、データ分類方法およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190729

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200529

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200707

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200907

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201201

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201214

R150 Certificate of patent or registration of utility model

Ref document number: 6811087

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250