JP5337559B2 - 文字列入力装置、文字列入力方法、および、プログラム - Google Patents
文字列入力装置、文字列入力方法、および、プログラム Download PDFInfo
- Publication number
- JP5337559B2 JP5337559B2 JP2009085258A JP2009085258A JP5337559B2 JP 5337559 B2 JP5337559 B2 JP 5337559B2 JP 2009085258 A JP2009085258 A JP 2009085258A JP 2009085258 A JP2009085258 A JP 2009085258A JP 5337559 B2 JP5337559 B2 JP 5337559B2
- Authority
- JP
- Japan
- Prior art keywords
- node
- dictionary data
- character string
- conversion
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 94
- 238000006243 chemical reaction Methods 0.000 claims abstract description 154
- 230000000295 complement effect Effects 0.000 claims abstract description 52
- 238000012545 processing Methods 0.000 claims abstract description 21
- 238000000605 extraction Methods 0.000 claims description 46
- 239000000284 extract Substances 0.000 abstract description 6
- 238000012986 modification Methods 0.000 abstract 1
- 230000004048 modification Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 19
- 230000006870 function Effects 0.000 description 12
- 230000004044 response Effects 0.000 description 11
- 238000012790 confirmation Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 3
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 239000013589 supplement Substances 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 238000000547 structure data Methods 0.000 description 1
- 238000012559 user support system Methods 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
を含むことを特徴とする文字列入力方法である。
を行い、変換候補を抽出するステップと、を実行させ、更に、前記変換候補を抽出するステップは、前記検索キー生成部により生成された検索キーから係り側ノードXを削除した余りキーαを特定するステップと、前記受け側ノード列Yを構成するノードであるノードY1を含む前記特定した余りキーαについて、前記余りキーαから更に前記ノードY1を削除した余りキーβを特定するステップと、前記特定した余りキーβと、前記受け側ノード列Yを構成する前記ノードY1以外のノードであるノードY2または当該ノードY2に対応する前記読み補完辞書手段の読み補完辞書データのノードy2とを比較するステップと、前記比較の結果、前記余りキーβと前記ノードY2または前記ノードy2とが部分一致または完全一致する場合に、前記係り側ノードXと前記受け側ノード列Yの結合を変換候補として抽出するステップと、を実行させることを特徴とするプログラムである。
図示するように、読み補完辞書データ431Aは、辞書の要素である単語の「読み」を結節点(ノード)とした、樹状の階層構造(木構造)のバイナリデータによって構成されている。そして、主語となる係り側の単語(ノード)のそれぞれに、係り受けの関係の受け側となる文節を構成する助詞と述語を示す単語(ノード)とが連結された構成(ノード列)となっている。この構成により、文法的に互いに係り受け関係にある単語が、相関的な位置で連結されている状態を示すデータによって辞書が構築される。ここで、読み補完辞書データ431Aは、入力される単語の「読み」に基づく辞書であるので、各ノードには、読みを表すひらがなによって見出し語が示されている。
次に、検索キーの未確定部の右側に確定文字列がある場合には、検索キーから削除(除外)する(S203)。その例を図9(c)に示す。
(1)確定部のみ
(2)確定部+未確定部
(3)確定部+未確定部+確定部
(4)未確定部のみ
(5)未確定部+確定部
最後に、検索キー生成部120は、「前回確定部」と「未確定部」とを結合する(S206)。この結果、上記例の場合、図9(d)に示す文字列が検索キーとして出力される。
検索キー ⊂ ノードx 部分一致
検索キー = ノードx 完全一致
検索キー ⊃ ノードx 余剰一致
なお、前方一致とは検索キーとノードxとの一致判断にあたり、常に先頭部分(文字列左端)の一致を条件とすることをいう。部分一致だが前方一致ではない例と、余剰一致だが前方一致ではない例とを、図12(b)に示す。
一方、比較すべきノードが残っていない場合(S506:Yes)は、当該先頭未確定処理を終了する。
そして、部分一致の場合(S504:Yes)、変換候補抽出部130は、ノードXを結果テーブル450に追加する(S505)。その例を図12(c)に示す。
その後、比較すべき候補がまだ残っていれば(S506:No)、S501へ戻る。全てのノードxについて比較が終了していれば(S506:Yes)、当該先頭未確定処理を終了する。
その後、比較すべき候補がまだ残っていれば(S506:No)、S501へ戻る。全てのノードxについて比較が終了していれば(S506:Yes)、先頭未確定処理を終了する。
その後、比較すべき受け側ノード列候補がまだ残っていれば(S513:No)、S509へ戻る。全てのノード列yについて比較が終了していれば(S513:Yes)、S506へ進む。
このフローで処理される検索キーには、「確定部のみ」の場合と「確定部+未確定部」の場合とがある。変換候補抽出部130は、綴り補完辞書から係り側ノードXを1つ取得する(S601)。係り側ノードXと検索キーとの間の包含関係の定義は、「先頭未確定処理」の場合と同様である。
検索キー ⊂ ノードX 部分一致
検索キー = ノードX 完全一致
検索キー ⊃ ノードX 余剰一致
一方、部分一致の場合には(S604:Yes)、変換候補抽出部130は、ノードXを結果テーブル450に追加する。その例を図14(b)に示す。すなわち、検索キー「携」に対して、「携帯」、「携帯電話」が結果テーブル450に追加される。
そして、比較すべき候補がまだ残っていれば(S606:No)、S601へ戻る。全てのノードXについて比較が終了していれば(S606:Yes)、当該先頭確定処理を終了する。
次いで、変換候補抽出部130は綴り補完辞書に比較すべきノードが残っていないか確認する(S606)。比較すべきノードが残っていれば(S606:No)、S601へ戻る。一方、比較すべきノードが残っていない場合には(S606:Yes)、当該先頭確定処理を終了する。
ここで、図15を参照して余剰一致処理について説明する。変換候補抽出部130は、まず、ノードXの受け側ノード列Y(Y1+Y2)を一組取得する(S701)。その例を図16(a)に示す。
次いで、変換候補抽出部130は、検索キーから係り側ノードXを削除した余りキーαが「ひらがなのみ」からなる「未確定部」であるか否か判断する(S702)。ここで、図16(b)にS702がYesの例を示し、図16(c)にS702がNoの例を示す。
その後、比較すべき受け側ノード列Yがまだ残っていれば(S706:No)、S701へ戻る。一方、全てのノード列Yについて比較が終了していれば(S706:Yes)、当該余剰一致処理を終了する。
余りキーβがひらがなのみからなる未確定部である場合(S710:Yes)、変換候補抽出部130は、Y2と対応するノードy2を読み補完辞書から取得し(S711)、余りキーβがノードy2と部分一致または完全一致するか判定する(S712)。そして、余りキーβがノードy2と部分一致または完全一致する場合(S712:Yes)、変換候補抽出部130は、ノードX+ノードYを結果テーブル450に追加する(S713)。その例を図16(h)に示す。その後、S706へ進む。
その後、比較すべき受け側ノード列Yがまだ残っていれば(S706:No)、S701へ戻る。一方、全てのノード列Yについて比較が終了していれば(S706:Yes)、当該余剰一致処理を終了する。
そして、当該余剰一致処理を終了した変換候補抽出部130は、図11のS606に戻り、全てのノードXについて比較が終了していれば(S606:Yes)、当該先頭確定処理を終了する。
変換候補出力部140は、まず、結果テーブル450の文字列から、検索キーの「確定部」を削除する(S401)。次に、削除した結果、検索キーの「未確定部」と一致することになったノードがあるか判定する(S402)。この例では、検索キーに「未確定部」を含まないので、S402は自動的にNoとなる。この結果、図18(a)に示すような出力が得られる(S404)。また、このように整形された候補語の画面表示例を図19(a)に示す。
変換候補出力部140は、まず、結果テーブル450の文字列から検索キーの「確定部」を削除する(S401)。さらに、確定部削除の結果、出力候補語の中に検索キーの未確定部と一致するノードがある場合(S402:Yes)、当該一致するノードを結果テーブル450の候補語から削除する(S403)。
例外的に、綴り補完辞書に、ひらがなのみからなるノードがあり、当該ノードが候補語となった場合には、S402でYesとなり、一致したノードが候補語から削除される(S403)。この例を図18(f)に示す。
例えば、上記実施の形態では、一対の読み補完辞書データと綴り補完辞書データとを入力エリアと対応づけることで、入力内容別の辞書データを構築したが、入力内容に応じて選択可能であれば、対応づけるものは入力エリアに限られない。例えば、文字列入力をおこなう入力画面や使用するアプリケーションと辞書データとを対応づけてもよい。
100 制御部
200 入力制御装置
210 入力装置
211 キーボード
212 ポインティングデバイス
300 出力制御装置
310 出力装置
311 ディスプレイ装置
400 記憶部
410 辞書格納領域
420 基本辞書領域
430 入力内容別辞書領域
431 応対入力辞書データ(A1)
431A 読み補完辞書データ
431B 綴り補完辞書データ
432 住所入力辞書データ(A2)
432A 読み補完辞書データ
432B 綴り補完辞書データ
440 プログラム格納領域
450 結果テーブル
Claims (3)
- 入力された文字列に応じた変換候補を検索して提示し、提示された変換候補を選択することで文字列入力を行う文字列入力装置であって、
入力される文字列を変換処理する前の読みが単語として記録された辞書であって、互いに係り受け関係にある単語を、ノードとして木構造に構成した読み補完辞書データを記憶する読み補完辞書手段と、
前記読み補完辞書データに含まれる各単語が漢字等に変換された単語として記録された辞書であって、変換処理前と後の単語をノードとして対応付けて、前記読み補完辞書データの木構造と合致した木構造に構成した綴り補完辞書データを記憶する綴り補完辞書手段と、
変換処理が完了した確定部文字列と変換処理が完了する前の未確定ひらがな部文字列とが連結された検索キーを生成する検索キー生成部と、
前記検索キー生成部により生成された検索キーと、前記読み補完辞書手段に記憶されている読み補完辞書データと、前記綴り補完辞書手段に記憶されている綴り補完辞書データとに基づいて、変換候補を抽出する変換候補抽出部とを備え、
前記変換候補抽出部は、
前記変換処理が完了した確定部文字列に基づいて、前記綴り補完辞書手段の綴り補完辞書データの係り受け関係にある受け側ノード列Yを特定し、
前記受け側ノード列Yに対応する、前記読み補完辞書手段の読み補完辞書データの係り受け関係にある受け側ノード列yを特定し、
前記変換処理が完了する前の未確定部ひらがな部文字列と前記受け側ノード列yとの一致判断を行い、変換候補を抽出し、
更に、前記変換候補抽出部は、
前記検索キー生成部により生成された検索キーから係り側ノードXを削除した余りキーαを特定し、
前記受け側ノード列Yを構成するノードであるノードY1を含む前記特定した余りキーαについて、前記余りキーαから更に前記ノードY1を削除した余りキーβを特定し、
前記特定した余りキーβと、前記受け側ノード列Yを構成する前記ノードY1以外のノードであるノードY2または当該ノードY2に対応する前記読み補完辞書手段の読み補完辞書データのノードy2とを比較し、
前記比較の結果、前記余りキーβと前記ノードY2または前記ノードy2とが部分一致または完全一致する場合に、前記係り側ノードXと前記受け側ノード列Yの結合を変換候補として抽出する
ことを特徴とする文字列入力装置。 - 入力された文字列に応じた変換候補を検索して提示し、提示された変換候補を選択することで文字列入力を行う文字列入力方法であって、
読み補完辞書手段が、入力される文字列を変換処理する前の読みが単語として記録され、互いに係り受け関係にある単語を、ノードとして木構造に構成した読み補完辞書データを記憶するステップと、
綴り補完辞書手段が、前記読み補完辞書データに含まれる各単語が漢字等に変換された単語として記録され、変換処理前と後の単語をノードとして対応付けて、前記読み補完辞書データの木構造と合致した木構造に構成した綴り補完辞書データを記憶するステップと、
検索キー生成部が、変換処理が完了した確定部文字列と変換処理が完了する前の未確定ひらがな部文字列とが連結された検索キーを生成するステップと、
変換候補抽出部が、前記生成された検索キーと、前記読み補完辞書データと、前記綴り補完辞書データとに基づいて、変換候補を抽出するステップと
を含み、
前記変換候補抽出部が、前記変換候補を抽出するステップは、
前記変換処理が完了した確定部文字列に基づいて、前記綴り補完辞書データの係り受け関係にある受け側ノード列Yを特定するステップと、
前記受け側ノード列Yに対応する、前記読み補完辞書データの係り受け関係にある受け側ノード列yを特定するステップと、
前記変換処理が完了する前の未確定部ひらがな部文字列と前記受け側ノード列yとの一致判断を行い、変換候補を抽出するステップと、
を含み、
更に、前記変換候補抽出部が、前記変換候補を抽出するステップは、
前記検索キー生成部により生成された検索キーから係り側ノードXを削除した余りキーαを特定するステップと、
前記受け側ノード列Yを構成するノードであるノードY1を含む前記特定した余りキーαについて、前記余りキーαから更に前記ノードY1を削除した余りキーβを特定するステップと、
前記特定した余りキーβと、前記受け側ノード列Yを構成する前記ノードY1以外のノードであるノードY2または当該ノードY2に対応する前記読み補完辞書手段の読み補完辞書データのノードy2とを比較するステップと、
前記比較の結果、前記余りキーβと前記ノードY2または前記ノードy2とが部分一致または完全一致する場合に、前記係り側ノードXと前記受け側ノード列Yの結合を変換候補として抽出するステップと、
を含むことを特徴とする文字列入力方法。 - 入力された文字列に応じた変換候補を検索して提示し、提示された変換候補を選択することで文字列入力を行う文字列入力装置のコンピュータに、
入力される文字列を変換処理する前の読みが単語として記録される読み補完辞書記憶部に、互いに係り受け関係にある単語を、ノードとして木構造に構成した読み補完辞書データを記憶するステップと、
前記読み補完辞書データに含まれる各単語が漢字等に変換された単語として記録される綴り補完辞書部に、変換処理前と後の単語をノードとして対応付けて、前記読み補完辞書データの木構造と合致した木構造に構成した綴り補完辞書データを記憶するステップと、
変換処理が完了した確定部文字列と変換処理が完了する前の未確定ひらがな部文字列とが連結された検索キーを生成するステップと、
前記生成された検索キーと、前記読み補完辞書データと、前記綴り補完辞書データとに基づいて、変換候補を抽出するステップと
を含み、
前記変換候補を抽出するステップは、
前記変換処理が完了した確定部文字列に基づいて、前記綴り補完辞書データの係り受け関係にある受け側ノード列Yを特定するステップと、
前記受け側ノード列Yに対応する、前記読み補完辞書データの係り受け関係にある受け側ノード列yを特定するステップと、
前記変換処理が完了する前の未確定部ひらがな部文字列と前記受け側ノード列yとの一致判断を行い、変換候補を抽出するステップと、を実行させ、
更に、前記変換候補を抽出するステップは、
前記検索キー生成部により生成された検索キーから係り側ノードXを削除した余りキーαを特定するステップと、
前記受け側ノード列Yを構成するノードであるノードY1を含む前記特定した余りキーαについて、前記余りキーαから更に前記ノードY1を削除した余りキーβを特定するステップと、
前記特定した余りキーβと、前記受け側ノード列Yを構成する前記ノードY1以外のノードであるノードY2または当該ノードY2に対応する前記読み補完辞書手段の読み補完辞書データのノードy2とを比較するステップと、
前記比較の結果、前記余りキーβと前記ノードY2または前記ノードy2とが部分一致または完全一致する場合に、前記係り側ノードXと前記受け側ノード列Yの結合を変換候補として抽出するステップと、
を実行させることを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009085258A JP5337559B2 (ja) | 2009-03-31 | 2009-03-31 | 文字列入力装置、文字列入力方法、および、プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009085258A JP5337559B2 (ja) | 2009-03-31 | 2009-03-31 | 文字列入力装置、文字列入力方法、および、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010237963A JP2010237963A (ja) | 2010-10-21 |
JP5337559B2 true JP5337559B2 (ja) | 2013-11-06 |
Family
ID=43092218
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009085258A Active JP5337559B2 (ja) | 2009-03-31 | 2009-03-31 | 文字列入力装置、文字列入力方法、および、プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5337559B2 (ja) |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4769559B2 (ja) * | 2005-11-30 | 2011-09-07 | 富士ソフト株式会社 | Ai予測システム |
JP2007334534A (ja) * | 2006-06-14 | 2007-12-27 | Ntt Data Corp | 文字列入力装置、文字列入力方法、および、プログラム |
-
2009
- 2009-03-31 JP JP2009085258A patent/JP5337559B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2010237963A (ja) | 2010-10-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101435265B1 (ko) | 언어 변환에 있어서 다중 리딩 모호성 해결을 위한 방법 | |
US7769804B2 (en) | Server side search with multi-word word wheeling and wildcard expansion | |
JP2013117978A (ja) | タイピング効率向上のためのタイピング候補の生成方法 | |
JP2007334534A (ja) | 文字列入力装置、文字列入力方法、および、プログラム | |
JP2020516980A (ja) | コンテキストディープブックマーキング | |
JP2015022590A (ja) | 文字入力装置、文字入力方法、及び文字入力プログラム | |
JP5323652B2 (ja) | 類似語決定方法およびシステム | |
KR20150083961A (ko) | 다국어 통합 자음 패턴 검색 방법, 자음 문자 입력을 위한 문자 입력부를 생성하는 방법 및 그 장치 | |
JP2019185478A (ja) | 分類プログラム、分類方法、および情報処理装置 | |
JP2004318510A (ja) | 対訳情報作成装置、対訳情報作成用プログラム、対訳情報作成方法、対訳情報検索装置、対訳情報検索用プログラム及び対訳情報検索方法 | |
CN118114660A (zh) | 文本检测方法、系统及计算机可读存储介质 | |
JP5481095B2 (ja) | 文字列入力装置、文字列入力方法、およびプログラム | |
WO2015075920A1 (ja) | 入力支援装置、入力支援方法及び記録媒体 | |
JP5337559B2 (ja) | 文字列入力装置、文字列入力方法、および、プログラム | |
JP5542368B2 (ja) | 文字列入力装置、文字列入力方法、およびプログラム | |
JP5481094B2 (ja) | 文字列入力装置、文字列入力方法、および、プログラム | |
JP2006235916A (ja) | テキスト解析装置およびテキスト解析方法ならびに音声合成装置 | |
JP5557469B2 (ja) | 文字検索装置、文字検索システム、文字検索方法、入力端末装置、検索サーバおよびプログラム | |
JP2005158044A (ja) | 情報検索プログラム、当該プログラムを格納するコンピュータ読み取り可能な記録媒体、情報検索方法、および情報検索装置 | |
JP4514826B1 (ja) | 文字列入力装置及び文字列入力方法 | |
JP2006209399A (ja) | 文書検索装置および方法 | |
JP4765107B2 (ja) | 文字列入力装置、および、プログラム | |
JP2013068983A (ja) | 情報処理装置及び情報処理プログラム | |
JP2001109740A (ja) | 中国語文書作成装置及び中国語文書作成方法 | |
JP2010266950A (ja) | 文字列入力装置、文字列入力方法、および、プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20111205 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130416 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20130515 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130617 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130709 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130805 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5337559 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |