JP2010266950A - 文字列入力装置、文字列入力方法、および、プログラム - Google Patents
文字列入力装置、文字列入力方法、および、プログラム Download PDFInfo
- Publication number
- JP2010266950A JP2010266950A JP2009115801A JP2009115801A JP2010266950A JP 2010266950 A JP2010266950 A JP 2010266950A JP 2009115801 A JP2009115801 A JP 2009115801A JP 2009115801 A JP2009115801 A JP 2009115801A JP 2010266950 A JP2010266950 A JP 2010266950A
- Authority
- JP
- Japan
- Prior art keywords
- search key
- hiragana
- character string
- input
- conversion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
【解決手段】制御部100は、変換処理が完了した確定部文字列と変換処理が完了する前の未確定ひらがな部文字列とを分離し、未確定部の半角カタカナを全角カタカナに、全角英数字を半角英数字に変換した第1の検索キー、第1の検索キーの全角カタカナをひらがなに変換した第2の検索キー、さらに第2の検索キーの全てのひらがなを、ひらがな変換テーブルに基づいて、ローマ字に変換した第3の検索キーからなる未確定部キーリストを生成する。さらに、前回確定部と未確定部キーリストとを結合して検索キーリストを生成し、該検索キーと読み補完辞書データと綴り補完辞書データとに基づいて、変換候補を抽出する。
【選択図】図1
Description
しかしながら、既知の方法と特開2007−334534号公報などに開示された日本語入力装置は、辞書構造が大きく異なるため、適用できないという問題があった。
図示するように、読み補完辞書データ431Aは、辞書の要素である単語の「読み」を結節点(ノード)とした、樹状の階層構造(木構造)のバイナリデータによって構成されている。そして、主語となる係り側の単語(ノード)のそれぞれに、係り受けの関係の受け側となる文節を構成する助詞と述語を示す単語(ノード)とが連結された構成(ノード列)となっている。この構成により、文法的に互いに係り受け関係にある単語が、相関的な位置で連結されている状態を示すデータによって辞書が構築される。ここで、読み補完辞書データ431Aは、入力される単語の「読み」に基づく辞書であるので、各ノードには、読みを表すひらがなによって見出し語が示されている。
(1)確定部のみ
(2)確定部+未確定部
(3)確定部+未確定部+確定部
(4)未確定部のみ
(5)未確定部+確定部
↓
NTTデータ(「NTT」が半角、「データ」が全角)
となる。なお、変換後の文字列をx1とする。
すなわち、綴り補完辞書に「NTTdata」を有するとき、オペレータが「NTT」まで入力すれば補完機能が働いて、候補語「NTTdata」を提示することができるが、勢いあまって「da」までタイプしてしまうと、入力エリアには、かな漢字変換機能ONの場合、「NTTだ」と表示されてしまう。ここまで入力が進んでしまうと、もはや「NTTdata」を候補語として表示することはできなかった。これに対して、上述した本実施形態によるローマ字変換処理によれば、「NTTだ」のみならず、「NTTda」も検索キーとして変換候補抽出部130へ渡すことが可能となる。
x6[4]は「で」である。この場合、rome2hira辞書によるアルファベットの読み検索は不成功に終わる(S1004:NO)。この場合、a4[1]には、「で」をそのまま格納する(S1006)。したがって、a5[1]には「ー」が、a6[1]には「た」が格納される。
検索キー ⊂ ノードx 部分一致
検索キー = ノードx 完全一致
検索キー ⊃ ノードx 余剰一致
その例を図15(d)に示す。
その後、比較すべき受け側ノード列候補がまだ残っていれば(S513:NO)、S509へ戻る。全てのノード列yについて比較が終了していれば(S513:YES)、S506へ進む。
このフローで処理される検索キーには、「確定部のみ」の場合と「確定部+未確定部」の場合とがある。変換候補抽出部130は、綴り補完辞書から係り側ノードXを1つ取得する(S601)。係り側ノードXと検索キーとの間の包含関係の定義は、「先頭未確定処理」の場合と同様である。
検索キー ⊂ ノードX 部分一致
検索キー = ノードX 完全一致
検索キー ⊃ ノードX 余剰一致
その例を図17(c)に示す。
ここで、図18を参照して余剰一致処理について説明する。変換候補抽出部130は、まず、ノードXの受け側ノード列Y(Y1+Y2)を一組取得する(S701)。その例を図19(a)に示す。
変換候補出力部140は、まず、結果テーブル450の文字列から、検索キーの「確定部」を削除する(S401)。次に、削除した結果、検索キーの「未確定部」と一致することになった出力候補語があるか判定する(S402)。この例では、検索キーに「未確定部」を含まないので、S402は自動的にNOとなる。この結果、図21(a)に示すような出力が得られる(S404)。また、このように整形された候補語の画面表示例を図22(a)に示す。
変換候補出力部140は、まず、結果テーブル450の文字列から検索キーの「確定部」を削除する(S401)。さらに、確定部削除の結果、出力候補語の中に検索キーの未確定部と完全一致する出力候補語がある場合(S402:YES)、当該一致する出力候補語を結果テーブル450から削除する(S403)。
このようなプログラムの提供方法は任意であり、例えば、CD−ROMなどの記憶媒体に格納して配布可能であることはもとより、プログラムデータを搬送波に重畳することで、所定の通信媒体(例えば、インターネットなど)を介して配布することもできる。
100 制御部
200 入力制御装置
210 入力装置
211 キーボード
212 ポインティングデバイス
300 出力制御装置
310 出力装置
311 ディスプレイ装置
400 記憶部
410 辞書格納領域
420 基本辞書領域
430 入力内容別辞書領域
431 応対入力辞書データ(A1)
431A 読み補完辞書データ
431B 綴り補完辞書データ
432 住所入力辞書データ(A2)
432A 読み補完辞書データ
432B 綴り補完辞書データ
440 プログラム格納領域
450 結果テーブル
460 未確定部キーリスト
470 検索キーリスト
Claims (6)
- 入力された文字列に応じた変換候補を検索して提示し、提示された変換候補を選択することで文字列入力を行う文字列入力装置であって、
入力される文字列を変換処理する前の読みが単語として記録された辞書であって、互いに係り受け関係にある単語を、ノードとして木構造に構成した読み補完辞書データを記憶する読み補完辞書手段と、
前記読み補完辞書データに含まれる各単語が漢字等に変換された単語として記録された辞書であって、変換処理前と後の単語をノードとして対応付けて、前記読み補完辞書手段の木構造と合致した木構造に構成した綴り補完辞書データを記憶する綴り補完辞書手段と、
少なくとも1文字以上のひらがなを含むひらがな列とそのローマ字表現とを対応付けて記憶するひらがな変換テーブルと、
入力された文字列の未確定部の半角カタカナを全角カタカナに、全角英数字を半角英数字に変換して第1の検索キーを生成し、前記第1の検索キーの前記全角カタカナをひらがなに変換して第2の検索キーを生成し、さらに前記第2の検索キーの全てのひらがなを、前記ひらがな変換テーブルに基づいて、ローマ字に変換して第3の検索キーを生成する検索キー生成手段と、
前記検索キー生成手段により生成された前記第1の検索キー、前記第2の検索キー及び前記第3の検索キーと、前記読み補完辞書手段に記憶されている読み補完辞書データと、前記綴り補完辞書手段に記憶されている綴り補完辞書データとに基づいて、入力された文字列の変換候補を抽出する変換候補抽出手段と
を備えることを特徴とする文字列入力装置。 - 前記検索キー生成手段は、
前記第3の検索キーに含まれるひらがな文字列が前記ひらがな変換テーブルに記憶されている前記ひらがな列のいずれとも合致しない場合、前記ひらがな文字列を端部から短縮していき、該短縮したひらがな文字列が前記ひらがな変換テーブルに記憶されている前記ひらがな列に合致するか判定し、
前記短縮したひらがな文字列が前記ひらがな列に合致する場合、前記ひらがな変換テーブルから前記ひらがな列に対応するローマ字表現を取得し、
前記第3の検索キーに含まれるひらがな文字列から前記合致したひらがな列を削除して新たなひらがな文字列とすることを繰り返すことで、前記第3の検索キーのひらがな文字列をローマ字に変換する
ことを特徴とする請求項1に記載の文字列入力装置。 - 前記ひらがな変換テーブルは、
清音、濁音、半濁音、拗音、促音を1ないし3文字組み合わせてなるひらがな列と、1文字のアルファベット母音と1ないし3文字のアルファベット子音とを組合せてなるローマ字表現とを対応付けて記憶する
ことを特徴とする請求項1または2に記載の文字列入力装置。 - 一文字のローマ字と、そのひらがな読みとを対応付けて記憶するローマ字変換テーブルを更に備え、
前記検索キー生成手段は、
前記第1の検索キーまたは前記第2の検索キーに含まれる半角英数字を、前記ローマ字変換テーブルに基づいて、ひらがな読みに変換して第4の検索キーを生成し、
前記変換候補抽出手段は、
前記検索キー生成手段により生成された前記第1の検索キー、前記第2の検索キー前記第3の検索キー及び前記第4の検索キーと、前記読み補完辞書手段に記憶されている読み補完辞書データと、前記綴り補完辞書手段に記憶されている綴り補完辞書データとに基づいて、入力された文字列の変換候補を抽出する
ことを特徴とする請求項1乃至3のいずれかに記載の文字列入力装置。 - 入力された文字列に応じた変換候補を検索して提示し、提示された変換候補を選択することで文字列入力を行う文字列入力方法であって、
入力される文字列を変換処理する前の読みが単語として記録された辞書に、互いに係り受け関係にある単語を、ノードとして木構造に構成した読み補完辞書データを記憶するステップと、
前記読み補完辞書データに含まれる各単語が漢字等に変換された単語として記録された辞書に、変換処理前と後の単語をノードとして対応付けて、前記読み補完辞書データの木構造と合致した木構造に構成した綴り補完辞書データを記憶するステップと、
少なくとも1文字以上のひらがなを含むひらがな列とそのローマ字表現とを対応付けて記憶するステップと、
入力された文字列の未確定部の半角カタカナを全角カタカナに、全角英数字を半角英数字に変換して第1の検索キーを生成し、前記第1の検索キーの前記全角カタカナをひらがなに変換して第2の検索キーを生成し、さらに前記第2の検索キーの全てのひらがなを、前記ひらがな変換テーブルに基づいて、ローマ字に変換して第3の検索キーを生成するステップと、
前記第1の検索キー、前記第2の検索キー及び前記第3の検索キーと、前記読み補完辞書データと、前記綴り補完辞書データとに基づいて、入力された文字列の変換候補を抽出するステップと
を備えることを特徴とする文字列入力方法。 - 入力された文字列に応じた変換候補を検索して提示し、提示された変換候補を選択することで文字列入力を行う文字列入力装置のコンピュータに、
入力される文字列を変換処理する前の読みが単語として記録された辞書に、互いに係り受け関係にある単語を、ノードとして木構造に構成した読み補完辞書データを記憶するステップと、
前記読み補完辞書データに含まれる各単語が漢字等に変換された単語として記録された辞書に、変換処理前と後の単語をノードとして対応付けて、前記読み補完辞書データの木構造と合致した木構造に構成した綴り補完辞書データを記憶するステップと、
少なくとも1文字以上のひらがなを含むひらがな列とそのローマ字表現とを対応付けて記憶するステップと、
入力された文字列の未確定部の半角カタカナを全角カタカナに、全角英数字を半角英数字に変換して第1の検索キーを生成し、前記第1の検索キーの前記全角カタカナをひらがなに変換して第2の検索キーを生成し、さらに前記第2の検索キーの全てのひらがなを、前記ひらがな変換テーブルに基づいて、ローマ字に変換して第3の検索キーを生成するステップと、
前記第1の検索キー、前記第2の検索キー及び前記第3の検索キーと、前記読み補完辞書データと、前記綴り補完辞書データとに基づいて、入力された文字列の変換候補を抽出するステップと
を実行させることを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009115801A JP2010266950A (ja) | 2009-05-12 | 2009-05-12 | 文字列入力装置、文字列入力方法、および、プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009115801A JP2010266950A (ja) | 2009-05-12 | 2009-05-12 | 文字列入力装置、文字列入力方法、および、プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010266950A true JP2010266950A (ja) | 2010-11-25 |
Family
ID=43363899
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009115801A Pending JP2010266950A (ja) | 2009-05-12 | 2009-05-12 | 文字列入力装置、文字列入力方法、および、プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2010266950A (ja) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06332949A (ja) * | 1993-05-19 | 1994-12-02 | Ricoh Co Ltd | 電子ファイリング装置 |
JP2001125915A (ja) * | 1999-10-28 | 2001-05-11 | Fujitsu Ltd | 情報検索装置 |
JP2004094916A (ja) * | 2002-07-08 | 2004-03-25 | Cannac:Kk | 問題解決支援システム、問題解決支援方法、及びプログラム |
JP2006138743A (ja) * | 2004-11-12 | 2006-06-01 | Aisin Aw Co Ltd | ナビゲーション装置及び記憶媒体 |
JP2007334534A (ja) * | 2006-06-14 | 2007-12-27 | Ntt Data Corp | 文字列入力装置、文字列入力方法、および、プログラム |
-
2009
- 2009-05-12 JP JP2009115801A patent/JP2010266950A/ja active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06332949A (ja) * | 1993-05-19 | 1994-12-02 | Ricoh Co Ltd | 電子ファイリング装置 |
JP2001125915A (ja) * | 1999-10-28 | 2001-05-11 | Fujitsu Ltd | 情報検索装置 |
JP2004094916A (ja) * | 2002-07-08 | 2004-03-25 | Cannac:Kk | 問題解決支援システム、問題解決支援方法、及びプログラム |
JP2006138743A (ja) * | 2004-11-12 | 2006-06-01 | Aisin Aw Co Ltd | ナビゲーション装置及び記憶媒体 |
JP2007334534A (ja) * | 2006-06-14 | 2007-12-27 | Ntt Data Corp | 文字列入力装置、文字列入力方法、および、プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20020126097A1 (en) | Alphanumeric data entry method and apparatus using reduced keyboard and context related dictionaries | |
JP2005530272A (ja) | 曖昧なテキスト入力の明確な文字フィルタリング | |
JP2013117978A (ja) | タイピング効率向上のためのタイピング候補の生成方法 | |
JP2009251292A (ja) | 学習コンテンツ生成装置、学習コンテンツの生成方法、学習コンテンツ生成装置としてコンピュータを機能させるためのプログラム、および当該プログラムを格納したコンピュータ読み取り可能な記録媒体 | |
US20130073572A1 (en) | Method of learning character segments from received text, and associated handheld electronic device | |
US20080002885A1 (en) | Method of learning a context of a segment of text, and associated handheld electronic device | |
JP3664383B2 (ja) | 日本語入力システム、日本語入力方法、および、記録媒体 | |
JP4263627B2 (ja) | 通信端末装置、受信装置、及び、プログラム | |
JP2002207728A (ja) | 表音文字生成装置及びそれを実現するためのプログラムを記録した記録媒体 | |
JP6619932B2 (ja) | 形態素解析装置およびプログラム | |
JP2013205854A (ja) | 当て字変換人名入力装置、人名入力方法および人名入力プログラム | |
JP5481095B2 (ja) | 文字列入力装置、文字列入力方法、およびプログラム | |
JP2010266950A (ja) | 文字列入力装置、文字列入力方法、および、プログラム | |
JP5542368B2 (ja) | 文字列入力装置、文字列入力方法、およびプログラム | |
JP5317460B2 (ja) | 携帯端末および文字入力システム | |
KR100804316B1 (ko) | 키패드에서의 알파벳 입력장치 및 그 방법 | |
JP5337559B2 (ja) | 文字列入力装置、文字列入力方法、および、プログラム | |
JP5481094B2 (ja) | 文字列入力装置、文字列入力方法、および、プログラム | |
CA2658586C (en) | Learning character segments from received text | |
JP2007310504A (ja) | 携帯情報端末 | |
JP4514826B1 (ja) | 文字列入力装置及び文字列入力方法 | |
Singh et al. | Hybrid CNN-LSTM Architecture for Bilingual Next-Word Prediction in Punjabi-English Social Media Texts | |
KR20160014514A (ko) | 키보드를 이용한 문자 입력 방법 | |
WO2007132287A2 (en) | Text composition | |
JP2004127195A (ja) | 数字キーを用いた中国語入力方法および装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20111215 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130514 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20130515 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130716 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20130716 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20130816 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20140121 |