JP5560105B2 - 文字列選択装置、文字列選択方法およびプログラム - Google Patents
文字列選択装置、文字列選択方法およびプログラム Download PDFInfo
- Publication number
- JP5560105B2 JP5560105B2 JP2010131071A JP2010131071A JP5560105B2 JP 5560105 B2 JP5560105 B2 JP 5560105B2 JP 2010131071 A JP2010131071 A JP 2010131071A JP 2010131071 A JP2010131071 A JP 2010131071A JP 5560105 B2 JP5560105 B2 JP 5560105B2
- Authority
- JP
- Japan
- Prior art keywords
- character string
- character
- characters
- string
- term
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000010187 selection method Methods 0.000 title claims description 8
- 239000011159 matrix material Substances 0.000 claims description 103
- 210000001072 colon Anatomy 0.000 description 73
- 238000012545 processing Methods 0.000 description 65
- 206010028980 Neoplasm Diseases 0.000 description 37
- 201000011510 cancer Diseases 0.000 description 37
- 210000004877 mucosa Anatomy 0.000 description 33
- 238000000034 method Methods 0.000 description 31
- 238000004891 communication Methods 0.000 description 24
- 238000004886 process control Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 9
- 239000007788 liquid Substances 0.000 description 9
- 201000009030 Carcinoma Diseases 0.000 description 8
- 206010009944 Colon cancer Diseases 0.000 description 8
- 208000029742 colonic neoplasm Diseases 0.000 description 8
- 210000000936 intestine Anatomy 0.000 description 8
- 230000000295 complement effect Effects 0.000 description 6
- 210000003097 mucus Anatomy 0.000 description 6
- 210000002429 large intestine Anatomy 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 230000015654 memory Effects 0.000 description 4
- 208000009956 adenocarcinoma Diseases 0.000 description 3
- 230000001174 ascending effect Effects 0.000 description 3
- 201000010879 mucinous adenocarcinoma Diseases 0.000 description 3
- 230000003936 working memory Effects 0.000 description 3
- 206010009887 colitis Diseases 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 210000004379 membrane Anatomy 0.000 description 2
- 208000014081 polyp of colon Diseases 0.000 description 2
- 206010052358 Colorectal cancer metastatic Diseases 0.000 description 1
- 206010027476 Metastases Diseases 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 201000010989 colorectal carcinoma Diseases 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 210000004347 intestinal mucosa Anatomy 0.000 description 1
- 210000000265 leukocyte Anatomy 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000009401 metastasis Effects 0.000 description 1
- 235000013615 non-nutritive sweetener Nutrition 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000002040 relaxant effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 201000002314 small intestine cancer Diseases 0.000 description 1
- 210000000707 wrist Anatomy 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
例えば、コンピュータの表示画面に表示される診断書に病名を入力する際、図12(a)に示すように、ユーザによる「大腸」の入力に対して、コンピュータは、この「大腸」に類似する用語として、「大腸炎」や「大腸癌」など、「大腸」を含む用語を選択し、入力欄の下方近傍に表示する。そして、カーソルキーあるいはマウスを用いてユーザが「大腸ポリープ」を選択すると、コンピュータは、選択された「大腸ポリープ」を入力欄に表示する。
このように、入力された文字列の全部を含む用語に限らず、一部を含む用語も表示することにより、「大腸炎」を誤って「大腸癌」と入力する文字違いや、「転移性大腸癌」を誤って「転移大腸癌」と入力する入力不足など、入力された文字列に誤りがある場合にもユーザの意図する用語を表示し得る。
この方法を、用語候補の選択に用いると、入力済みの文字列と共通の部分文字列を多く含み、入力済みの文字列に文字数が類似し、かつ、入力済みの文字列に対してコストの小さい変換操作を行って得られる文字列を抽出できる。
かかる不都合を回避するために、第1の絞込みを行う段階における絞込み要件を緩和することによって除外する用語の数を少なくすることが考えられる。しかし、第1の絞込みを行う段階で除外する用語の数を少なくすると、第2の絞込みの対象となる用語の数が増大し、処理に要する時間が増大してしまう。ユーザに、用語候補の表示を待つストレスを与えないためには、例えば文字列が入力されてから0.1秒以内に用語候補を表示するなど、高速に用語候補を選択して表示する必要がある(例えば、図12(b)の「癌」が入力された後速やかに、同図(b)に示す用語候補を表示する必要がある)が、処理に要する時間の増大により、高速に用語候補を選択して表示できないおそれがある。
これにより、文字列選択部は、第1の文字列と共通の文字を含まない第2の文字列については、選択の要否を判定することなく第2の文字列を選択できるので、第2の文字列を高速に選択できる。これにより、ユーザの入力したい文字列の候補として、第2の文字列を高速に得られる。
また、文字列選択部は、第1の文字列に含まれる文字に、文字インデックスにて対応付けられた文字列識別情報により識別される第2の文字列を選択することにより、第1の文字列に含まれる文字を含む第2の文字列のみを全て選択できる。この点で、ユーザの入力した文字列の候補として、第2の文字列を適切に得られる。
図1は、本発明の一実施形態における文字列入力支援システムの概略構成を示す構成図である。同図において、文字列入力支援システム1は、文字列入力支援装置(文字列選択装置)100と、端末装置200とを具備する。文字列入力支援装置100は、通信部(取得部)110と、処理部(文字列選択部)120と、記憶部130とを具備する。処理部120は、処理制御部121と、文字インデックス生成部122と、LCS長算出部123と、文字位置情報生成部124と、順位決定部125とを具備する。記憶部130は、用語記憶部(文字列群記憶部)131と、文字インデックス記憶部132と、LCS長行列記憶部133と、文字位置情報行列記憶部134とを具備する。端末装置200は、通信部210と、入力部220と、表示部230とを具備する。
文字列入力支援装置100は、入力文字列を端末装置200から取得し、取得した文字列に基づいて、ユーザが入力したい文字列の候補の各々の順位を決定し、ユーザが入力したい文字列の候補を、決定した順位に従って並べたリストを生成して端末装置200に送信する。
通信部110は、端末装置200との間でデータの送受信を行う。
記憶部130は、ユーザが入力したい文字列の候補である用語を予め記憶する。また、記憶部130は、ユーザが入力したい文字列の候補である用語の順位を、文字列入力支援装置100が決定する際のワーキングメモリとして機能する。記憶部130は、文字列入力支援装置100が具備する記憶装置上に実現される。
図2は、用語記憶部131が記憶する用語リストの例を示す図である。同図に示すように、用語リストの各行に、ユーザが入力したい文字列の候補である用語と、当該用語の識別番号である用語IDとが対応付けて記憶されている。用語リストは、例えば、ある分野の辞書に含まれる用語の各々に用語IDを付して生成される。同図の例では、用語リストは、病名に用語IDを付して生成されている。
用語IDは、各用語を識別する情報であると共に、用語リスト中における各用語の順序を示す情報でもある。
なお、用語リストに記憶される用語の数は、同図に示す7つに限らず、任意の個数であってよい。
図3は、文字インデックス記憶部132が記憶する文字インデックスの例を示す図である。同図に示すように、文字インデックスの各行には、用語リスト中のいずれかの用語に含まれる文字と、当該文字を含む用語を示す用語IDリストとが格納されている。同図の文字インデックスは、図2の用語リスト中の用語に含まれる文字毎に、当該文字を含む用語を用語IDにて示している。例えば、図2の用語リスト中で用語ID「1」に対応付けられた用語「小腸癌」は、文字「小」と「腸」と「癌」とを含む。したがって、図3の文字インデックスの、文字「小」を含む行と、文字「腸」を含む行と、文字「癌」を含む行とのいずれも、用語IDリスト中に用語ID「1」を含んでいる。
以下、図4を参照して、LCS長行列記憶部133が記憶するLCS長行列について説明する。
図4は、LCS長を算出するために用いられる行列の例を示す図である。同図(a)と(b)とは、いずれも、LCS長を算出するために用いられる行列の例を示す。
同図(a)の行列は、入力文字列の文字数+1の行、および、用語記憶部131が記憶する用語の文字数+1の列を有する行列であり、各要素には非負整数が格納される。以下では、図4(a)の行列の最上行(初期値に対応する行)を第0行とし、最左列(初期値に対応する列)を第0列とする。
このように、LCS長は、2つの文字列に共通する文字の数を示すので、2つの文字列の類似度を示す情報として用いることができる。
2つの文字列の末尾の文字が同じ場合は、各文字列から当該末尾の文字を除いた部分文字列のLCSに、当該末尾の文字を加えることによりLCSを得られる。例えば、入力文字列「大腸粘液癌」と用語「大腸粘膜内癌」との末尾の文字は共に「癌」である。そして、「大腸粘液癌」と「大腸粘膜内癌」とのLCS「大腸粘癌」は、入力文字列「大腸粘液癌」から「癌」を除いた「大腸粘液」と、用語「大腸粘膜内癌」から「癌」を除いた「大腸粘膜内」との「大腸粘」に「癌」を加えて得られる。したがって、第5行第6列の要素a156の値「4」(「大腸粘癌」の文字数)は、第4行第5列の要素a145の値「3」(「大腸粘」の文字数)に1(「癌」の文字数)を加えた値となっている。
このため、LCS行列の第4行(文字「液」に対応する行)の値は、上隣の第3行(文字「粘」に対応する行)の値と一致する。
例えば、LCS長行列記憶部133は、図4(a)の行列から、用語に含まれない文字「液」に対応する行を削除した、図4(b)のLCS長行列を記憶する。この行列の最下行最右列の要素a246の値「4」は、入力文字列「大腸粘液癌」と用語「大腸粘膜内癌」とのLCS「大腸粘癌」の文字数、すなわちLCS長を示している。
後述するように、LCS長行列は、文字インデックス記憶部132が記憶する文字インデックスを用いて生成される。
以下、図5を参照して、文字位置情報行列記憶部134が記憶する文字位置情報行列について説明する。
図5は、入力文字列と用語とのLCSが用語中に出現する位置を示す文字位置情報を算出するために用いられる行列の例を示す図である。同図(a)と(b)とは、いずれも、文字位置情報を算出するために用いられる行列の例を示す。
同図(a)の行列は、入力文字列の文字数+1の行数、および、用語記憶部131が記憶する用語の文字数+1の列数を有する行列であり、各要素にはビット列(二進数)が格納される。以下では、図5(a)の行列の最上行(初期値に対応する行)を第0行とし、最左列(初期値に対応する列)を第0列とする。
2つの文字列(入力文字列またはその部分文字列、および、用語またはその部分文字列)の末尾の文字が同じ場合、これらの文字列の文字位置情報は、各文字列から当該末尾の文字を除いた部分文字列の文字位置情報に、当該末尾の文字の位置に対応する桁を1とした数を加算した値となる。例えば、図5(a)の行列の、第5行第6列の要素b156の値「100111」(二進数)は、第4行第5列の要素b145の値「111」(二進数。「00111」の先頭の0が省略されている。以下同様に、文字位置情報の先頭の0の表示を省略する)に、末尾の文字「癌」の位置に対応する右から6桁目が1の「100000」(二進数)を加算した値となっている。
いずれの文字列から末尾の文字を除いてもLCS長が同一の場合は、いずれの文字位置情報と同一としてもよい。本実施形態では、値が小さいほうの文字位置情報と同一とする。後述するように、LCSに含まれる文字が先頭に近い位置に出現する用語を上位とするためである。
このため、図5(a)の行列の第4行(文字「液」に対応する行)の値は、上隣の第3行(文字「粘」に対応する行)の値と一致する。
例えば、文字位置情報行列記憶部134は、図5(a)の行列から、用語に含まれない文字「液」を削除した図5(b)の文字位置情報行列を記憶する。この行列の最下行最右列の要素b246の値「100111」は、入力文字列「大腸粘液癌」と用語「大腸粘膜内癌」とのLCS「大腸粘癌」に含まれる各文字が、用語「大腸粘膜内癌」中に出現する位置を示している。
後述するように、文字列情報行列は、文字インデックス記憶部132が記憶する文字インデックスを用いて生成される。
処理制御部121は、各部を制御して処理を行わせる。文字インデックス生成部122は、用語記憶部131の記憶する用語リストに基づいて文字インデックスを生成する。LCS長算出部123は、入力文字列と、用語記憶部131が記憶する各用語とのLCS長を算出する。文字位置情報生成部124は、入力文字列と、用語記憶部131が記憶する各用語との文字位置情報を生成する。順位決定部125は、LCS長算出部123が算出するLCS長および文字位置情報生成部124が生成する文字位置情報に基づいて、用語記憶部131が記憶する各用語の順位を決定する。
通信部210は、文字列入力支援装置100との間でデータの送受信を行う。
入力部220は、キーボードおよびマウスを備え、ユーザによる文字列の入力を受け付けて、入力された文字列を、通信部210を介して文字列入力支援装置100に送信する。表示部230は、液晶ディスプレイ等の表示画面を備え、文字列の入力欄を表示し、ユーザの入力した文字列を入力欄に表示する。また、表示部230は、順位付けされた用語を、通信部210を介して文字列入力支援装置100から受信し、受信した用語を、その順位に従って入力欄の下方近傍に表示する。
文字列入力支援システム1では、文字列入力支援装置100の文字インデックス生成部122が、用語記憶部131の記憶する用語リストに基づいて、予め文字インデックスを生成し、文字インデックス記憶部132に書き込んでおく。
図6は、文字インデックス生成部122が文字インデックスを生成する処理手順を示すフローチャートである。
文字インデックス生成部122は、まず、用語記憶部131が記憶する用語リストの各行に対する処理を行うループL1の処理を開始する。以下では、ループL1にて処理対象となっている用語を「W」にて表示し、用語Wの用語IDリストを「i」にて表示する(以上、ステップS1)。
そして、文字インデックス生成部122は、文字インデックスの行を示す変数kの値を1に設定する(ステップS3)。
そして、文字インデックス生成部122は、用語リストの全ての行に対してループL1の処理を行ったか否かを判定する。未処理の行があると判定した場合は、ステップS1に戻って、未処理の行に対して引き続きループL1の処理を行う。一方、全ての行に対して処理を行ったと判定した場合は、同図の処理を終了する(以上、ステップS9)。
また、ステップS4において、文字インデックス記憶部132が記憶する文字インデックスに第k行が存在しないと判定した場合(ステップS4:NO)は、文字インデックス記憶部132が記憶する文字インデックスの末尾に、文字Rと、iから成る用語IDリストとを含む行を追加する(書き込む)。
表示部230は、入力部220から出力された入力文字列を入力欄に表示(既に入力文字列を表示しているときは更新)する。また、通信部210は、入力部220から出力された入力文字列を、文字列入力支援装置100の通信部110に送信する。
通信部110は、通信部210からの入力文字列を受信すると、受信した入力文字列を処理部120に出力する。
図7および図8は、処理部120がLCS長を算出し、文字位置情報を生成する処理手順を示すフローチャートである。処理部120は、通信部110から入力文字列が出力されると同図の処理を開始する。
まず、処理部120の処理制御部121は、LCS長行列記憶部133のLCS長行列を初期化するようLCS長算出部123を制御し、文字位置情報行列記憶部134の文字位置情報行列を初期化するよう文字位置情報生成部124を制御する。
また、文字位置情報生成部124は、用語記憶部131が記憶する用語の各々について、文字位置情報行列の行数を入力文字列の文字数+1とし、列数を当該用語の文字数+1とする。そして、最上行(図5の例で、「初期値」に対応する行)の各要素の値と、最左列(図5の例で、「初期値」に対応する列)の各要素の値とを、いずれも「0」とする。他の要素の値は、この時点では未定である(以上、ステップS101)。
次に、処理制御部121は、文字インデックス記憶部132が記憶する文字インデックスの中から、入力文字列の先頭からj番目の文字と同じ行に格納されている用語IDリスト(文字インデックス中に、該当する行が無い場合は空のリスト)を読み出す(ステップS103)。
そして、処理制御部121は、ステップS103で取得した用語IDリストに含まれる用語IDに対応する各用語について処理を行うループL12の処理を開始する。以下では、ループL12にて処理対象となっている用語を「W」にて表示する(以上、ステップS104)。
この閾値は、入力文字列と用語とのLCS長に対する閾値であり、LCS長が閾値以上の用語のみが、ユーザの入力したい文字列の候補として端末装置200の表示部230に表示される。この閾値は、例えばユーザによって予め設定される(以上、ステップS105)。
算出済みのLCS長と、入力文字列に含まれる文字のうち処理が終わっていない文字の数との合計値が、閾値以上であると判定した場合(ステップS105:YES)、処理制御部121は、用語Wの各文字について先頭から順に処理を行うループL13の処理を開始する。以下では、ループL11にて処理対象となっている文字の位置を「k」(先頭から順に、1、2、・・・とする)にて表示する。(以上、ステップS106)。
文字が同一であることを示す信号が処理制御部121から出力されると、LCS長算出部123は、LCS長行列の第j行第k列の要素の値として、第j−1行第k−1列の要素の値+1を書き込む。すなわち、図4で説明したように、左上の要素の値に1を加えた値とする(以上、ステップS111)。
文字が同一であることを示す信号が処理制御部121から出力されると、文字位置情報生成部124は、文字位置情報行列の第j行第k列の要素の値として、第j−1行第k−1列の要素の値+2k−1を書き込む。すなわち、図5で説明したように、左上の要素の値に、用語の末尾の位置に対応する桁を1とした数を加えた値とする(以上、ステップS112)。
この、ループL13の終了時点では、入力文字列の先頭からj文字目までの部分文字列と、用語WとのLCSが算出されている。例えば、入力文字列が「大腸粘膜癌」、用語Wが「大腸粘膜内癌」で、j=2の場合、図4に示したLCS長行列のうち上3行(初期値の行と、入力文字列「大」および「腸」に対応する行)が生成されている。このLCS長行列の最下行最右列の要素の値「2」は、入力文字列の先頭から2文字の部分文字列「大腸」と用語W「大腸粘膜内癌」とのCLS長(CLSは「大腸」であり、CLS長は「2」)を示している(以上、ステップS141)。
そして、処理制御部121は、入力文字列の全ての文字に対してループL11の処理を行ったか否かを判定する。未処理の文字があると判定した場合は、ステップS102に戻って、未処理の文字に対して引き続きループL11の処理を行う。一方、全ての文字に対して処理を行ったと判定した場合は、同図の処理を終了する(以上、ステップS143)。
当該信号が処理制御部121から出力されると、LCS長算出部123は、LCS長行列の第j行第k列の要素の値として、第j−1行第k列の要素の値を書き込む。すなわち、図4で説明したように、左隣の値と、上隣の値とのうち大きいほう(ここでは、上隣の要素)の値と同一(両者の値が等しい場合は、両者の値と同一)とする(以上、ステップS122)。
ステップS123において両者の値が異なると判定した場合(ステップS123:NO)、および、ステップS124において、第j−1行第k列の要素の値が、第j行第k−1列の要素の値以下であると判定した場合(ステップS124:YES)、処理制御部121は、上隣の要素を書き込むよう指示する信号を、文字位置情報生成部124に出力する。
当該信号が処理制御部121から出力されると、文字位置情報生成部124は、文字位置情報行列の第j行第k列の要素の値として、第j−1行第k列の要素の値を書き込む。すなわち、図5で説明したように、左隣の要素の値と、上隣の要素の値とのうち、LCS長が長いほう(ここでは、上隣の要素)の値と同一(両者のLCS長が同一の場合は、値が小さいほうの要素の値と同一。さらに両要素の値が同一の場合は、両要素の値と同一)とする(以上、ステップS125)。
その後、処理制御部121は、ステップS141に進む。
当該信号が処理制御部121から出力されると、LCS長算出部123は、LCS長行列の第j行第k列の要素の値として、第j行第k−1列の要素の値を書き込む。すなわち、図4で説明したように、左隣の値と、上隣の値とのうち大きいほう(ここでは、左隣の要素)の値と同一とする(以上、ステップS131)。
当該信号が処理制御部121から出力されると、文字位置情報生成部124は、文字位置情報行列の第j行第k列の要素の値として、第j行第k−1列の要素の値を書き込む。すなわち、図5で説明したように、左隣の要素の値と、上隣の要素の値とのうち、LCS長が長いほう(ここでは、左隣の要素)の値と同一(両者のLCS長が同一の場合は、値が小さいほうの要素の値と同一)とする(以上、ステップS132)。
その後、処理制御部121は、ステップS141に進む。
順位決定部125は、用語記憶部131の記憶する各用語の、LCS長と、文字位置情報と、用語の長さ(文字数)と、用語リストにおける順序(用語IDの値)とに基づいて、順位を決定し、決定した順位に基づいて並べられた用語のリストを生成する。
図9は、順位決定部125による用語の順位決定の例を示す図である。同図は、入力文字列が「大腸癌」である場合の例であり、図1に示す用語リストに含まれる用語のうちLCS長が3以上の用語と、各用語の順位と、順位を決定する基準となるLCS長と文字位置情報と用語の文字数と用語IDとを示している。
上述したように、LCS長は入力文字列と用語との類似度を示す情報として用いることができる。従って、LCS長が長い用語ほど上位とすることで、入力文字列と類似度の高い用語を上位とすることができ、ユーザが入力したい文字列の候補を適切に提示できる。
また、ユーザは、通常、入力したい文字列の先頭から順に入力する。したがって、入力済みの文字列とのLCSが先頭付近に出現する用語のほうが、末尾付近に出現する用語よりも、ユーザが入力したい文字列の候補として適切である。文字位置情報の値が小さい用語を上位とすることで、入力済みの文字列とのLCSが先頭付近に出現する用語を上位とすることができ、ユーザが入力したい文字列の候補を適切に提示できる。
図10は、順位決定部125が生成する指標の例を示す図である。
同図に示す指標は、LCSの長さ(二進数表示)と、小数点と、文字位置情報(二進数表示)の2の補数と、用語の長さ(二進数表示)の2の補数と、用語ID(二進数表示)の2の補数とが、この順に結合されて生成される。その際、順位決定部125は、文字位置情報(二進数表示)の桁数を、当該用語文字数に揃える。また、用語の長さ(二進数表示)の桁数を、用語記憶部131が記憶する用語のうち最長のものを表現可能な桁数に揃える。また、用語ID(二進数表示)の桁数を、用語記憶部131が記憶する用語IDのうち最大のものを表現可能な桁数に揃える。
「大腸癌」の文字数は「3」であるため、同図に示す指標の整数部分は「11」となっており、また、小数部分は、文字位置情報「100011」の2の補数「011100」と、用語の長さ「6」の二進数表示「0・・・0110」の2の補数「1・・・1001」と、用語ID「5」の二進数表示「0・・・0101」の2の補数「1・・・1010」とを結合した値となっている。2の補数を取ることにより、元となる値が小さいほど大きい値の指標が生成される。
ここで、LCSに含まれる文字が用語に出現する位置のうち、最も後ろ(用語の末尾側)の位置が先頭に近い用語ほど、文字位置情報の値が小さくなる。また、LCSに含まれる文字が用語に出現する位置のうち、最も後ろの出現位置が同一の場合は、後ろから2番目の出現位置が先頭に近い用語ほど、文字位置情報の値が小さくなる。同様に、1〜i−1(iはLCS長以下の正整数)番目の各出現位置が同一の場合は、i番目の出現位置が先頭に近い用語ほど、文字位置情報の値が小さくなる。この点で、文字位置情報生成部124は、LCSに含まれる文字が用語中に出現する位置が先頭に近いほど小さい値を示す文字位置情報を生成する。
端末装置200の通信部210は、順位決定部125からの用語のリストを受信すると、受信したリストを表示部230に出力する。表示部230は、通信部210から出力される用語のリストを、入力欄の下方近傍に表示する。
ユーザが、このリストに含まれる用語のいずれかを、マウスでクリックする等により選択すると、入力部220は、選択された用語を入力文字列として表示部230と通信部210に出力する。以下、各部は上述した処理を行う。
また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含むものとする。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
100 文字列入力支援装置
110 通信部
120 処理部
121 処理制御部
122 文字インデックス生成部
123 LCS長算出部
124 文字位置情報生成部
125 順位決定部
130 記憶部
131 用語記憶部
132 文字インデックス記憶部
133 LCS長行列記憶部
134 文字位置情報行列記憶部
200 端末装置
210 通信部
220 入力部
230 表示部
Claims (4)
- 第1の文字列を取得する取得部と、
1つ以上の第2の文字列の各々と、当該第2の文字列を識別する文字列識別情報とが対応付けられた識別情報付文字列群を記憶する文字列群記憶部と、
前記識別情報付文字列群中の前記第2の文字列に含まれる全ての文字について、異なる前記文字毎に、当該文字と、当該文字を含み前記識別情報付文字列群に含まれる前記第2の文字列の文字列識別情報と、が対応付けられた文字インデックスを記憶する文字インデックス記憶部と、
前記第1の文字列に含まれる文字に、前記文字インデックスにて対応付けられた前記文字列識別情報により識別される前記第2の文字列を選択する文字列選択部と、
を具備し、
前記文字列選択部は、前記第1の文字列と前記第2の文字列との最長共通部分列の文字数を、前記第1の文字列の部分文字列と前記第2の文字列との最長共通部分列の文字数に基づいて再帰的に算出し、前記第1の文字列の部分文字列と前記第2の文字列との最長共通部分列の文字数と、前記第1の文字列から前記部分文字列を除いた残りの文字数との合計値が、予め定められた閾値未満の場合、当該第1の文字列と当該第2の文字列との最長共通部分列の文字数の算出を中止し、前記文字インデックスにて対応付けられた前記文字列識別情報により識別される前記第2の文字列のうち、前記第1の文字列との最長共通部分列の文字数が閾値以上の第2の文字列のみをさらに選択することを特徴とする文字列選択装置。 - 前記文字列選択部は、前記最長共通部分列の文字数を示すLCS長行列として、前記第1の文字列のうち前記第2の文字列に含まれない文字に対応する行を除いたLCS長行列にて示される最長共通部分列の文字数を用いて、前記文字インデックスにて対応付けられた前記文字列識別情報により識別される前記第2の文字列のうち、前記第1の文字列との最長共通部分列の文字数が閾値以上の第2の文字列のみを選択することを特徴とする請求項1に記載の文字列選択装置。
- 1つ以上の第2の文字列の各々と、当該第2の文字列を識別する文字列識別情報とが対応付けられた識別情報付文字列群を記憶する文字列群記憶部と、
前記識別情報付文字列群中の前記第2の文字列に含まれる全ての文字について、異なる前記文字毎に、当該文字と、当該文字を含み前記識別情報付文字列群に含まれる前記第2の文字列の文字列識別情報と、が対応付けられた文字インデックスを記憶する文字インデックス記憶部と、
を具備する文字列選択装置の文字列選択方法であって、
取得部が、第1の文字列を取得する取得ステップと、
文字列選択部が、前記第1の文字列に含まれる文字に、前記文字インデックスにて対応付けられた前記文字列識別情報により識別される前記第2の文字列を選択する文字列選択ステップと、
を具備し、
前記文字列選択ステップでは、前記第1の文字列と前記第2の文字列との最長共通部分列の文字数を、前記第1の文字列の部分文字列と前記第2の文字列との最長共通部分列の文字数に基づいて再帰的に算出し、前記第1の文字列の部分文字列と前記第2の文字列との最長共通部分列の文字数と、前記第1の文字列から前記部分文字列を除いた残りの文字数との合計値が、予め定められた閾値未満の場合、当該第1の文字列と当該第2の文字列との最長共通部分列の文字数の算出を中止し、前記文字インデックスにて対応付けられた前記文字列識別情報により識別される前記第2の文字列のうち、前記第1の文字列との最長共通部分列の文字数が閾値以上の第2の文字列のみをさらに選択することを特徴とする文字列選択方法。 - 1つ以上の第2の文字列の各々と、当該第2の文字列を識別する文字列識別情報とが対応付けられた識別情報付文字列群を記憶する文字列群記憶部と、
前記識別情報付文字列群中の前記第2の文字列に含まれる全ての文字について、異なる前記文字毎に、当該文字と、当該文字を含み前記識別情報付文字列群に含まれる前記第2の文字列の文字列識別情報と、が対応付けられた文字インデックスを記憶する文字インデックス記憶部と、
を具備する文字列選択装置としてのコンピュータに、
第1の文字列を取得する取得ステップと、
前記第1の文字列に含まれる文字に、前記文字インデックスにて対応付けられた前記文字列識別情報により識別される前記第2の文字列を選択する文字列選択ステップと、
を実行させ、
前記文字列選択ステップでは、前記第1の文字列と前記第2の文字列との最長共通部分列の文字数を、前記第1の文字列の部分文字列と前記第2の文字列との最長共通部分列の文字数に基づいて再帰的に算出させ、前記第1の文字列の部分文字列と前記第2の文字列との最長共通部分列の文字数と、前記第1の文字列から前記部分文字列を除いた残りの文字数との合計値が、予め定められた閾値未満の場合、当該第1の文字列と当該第2の文字列との最長共通部分列の文字数の算出を中止させ、前記文字インデックスにて対応付けられた前記文字列識別情報により識別される前記第2の文字列のうち、前記第1の文字列との最長共通部分列の文字数が閾値以上の第2の文字列のみをさらに選択させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010131071A JP5560105B2 (ja) | 2010-06-08 | 2010-06-08 | 文字列選択装置、文字列選択方法およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010131071A JP5560105B2 (ja) | 2010-06-08 | 2010-06-08 | 文字列選択装置、文字列選択方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011257921A JP2011257921A (ja) | 2011-12-22 |
JP5560105B2 true JP5560105B2 (ja) | 2014-07-23 |
Family
ID=45474051
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010131071A Expired - Fee Related JP5560105B2 (ja) | 2010-06-08 | 2010-06-08 | 文字列選択装置、文字列選択方法およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5560105B2 (ja) |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4721344B2 (ja) * | 2005-12-26 | 2011-07-13 | 株式会社リコー | 単語検索装置、単語検索方法及びプログラム |
-
2010
- 2010-06-08 JP JP2010131071A patent/JP5560105B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2011257921A (ja) | 2011-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3672242B2 (ja) | パターン検索方法、パターン検索装置、コンピュータプログラム及び記憶媒体 | |
CN104272222B (zh) | 输入文本的系统和输入文本的方法 | |
CN103927329B (zh) | 一种即时搜索方法和系统 | |
CN107704102B (zh) | 一种文本输入方法及装置 | |
JP5985040B2 (ja) | データ解析装置、及びその方法 | |
WO2020040253A1 (ja) | 予測解釈装置、及び予測解釈方法 | |
CN103927330A (zh) | 一种在搜索引擎中确定形近字的方法和装置 | |
JP2013196358A (ja) | 検索支援装置および検索支援方法 | |
US20210183466A1 (en) | Identification method, information processing device, and recording medium | |
CN115713078A (zh) | 知识图谱构建方法、装置、存储介质及电子设备 | |
JP5930228B2 (ja) | 情報処理装置、方法及びプログラム | |
JP5980520B2 (ja) | 効率的にクエリを処理する方法及び装置 | |
JP2013172709A (ja) | 塩基配列分析のための参照配列処理システム及び方法 | |
JP2009059140A (ja) | 電子辞書、電子辞書の検索方法及び電子辞書の検索プログラム | |
JP5560105B2 (ja) | 文字列選択装置、文字列選択方法およびプログラム | |
JP5586334B2 (ja) | 文字列入力支援装置、文字列入力支援方法およびプログラム | |
WO2012015021A1 (en) | Stroke and structure input method and system | |
JP6653628B2 (ja) | Dna配列解析装置、dna配列解析方法及びdna配列解析システム | |
JPH0454564A (ja) | 重み学習型テキストベース検索装置 | |
CN115700527A (zh) | 字符串相似度确定 | |
JP2006318225A (ja) | 病名特定装置 | |
JP2008129711A (ja) | 入力文字変換システム | |
JP6181890B2 (ja) | 文献解析装置、文献解析方法およびプログラム | |
Sandnes | Directional bias in scrolling tasks: A study of users' scrolling behaviour using a mobile text-entry strategy | |
CN114675750B (zh) | 输入方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130319 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20130515 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20130816 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131203 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131206 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140124 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140218 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140421 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140513 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140609 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5560105 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |