明 細 書 スペースの自動生成によって文章入力を支援するシステム 技術分野
この発明は、 英語やフランス語の文章のようにスペースで区切られた 複数の単語からなる文章を入力する際に、 作業者が小文字を連続入力す るだけでスペースを含む正しい文章に自動変換する文章入力支援システ ムに関する。 背景技術
近年、 コンピュータ技術の進展に伴い、 文章をコンピュータ (ワード プロセッサ専用機を含む) を用いて入力する機会が多くなつてきている, このような文章入力は、 複数のキースィツチが所定の規則に沿って配列 されたキーボードを用いて行われることが多い。 このキーボード配列の 基本は英文タイプライターの配列に遡ることができ、 コンピュータを用 いた英語ゃフランス語等の文章入力も基本的には英文タイプの入力方法 が踏襲されている。
つまり、 単語のスペルにしたがってキーボード上の対応する文字のキ 一を順次押下し、 単語と単語の間にはスペースキーを押下する。 また、 文章の始まりや固有名詞 (ドイツ語では全ての名詞) の先頭の文字を大 文字にするためにシフトキーを文字キーと共に押下する。 更に、 必要に 応じてカンマ、 ピリオド (終止符)、 クォーテーションマーク (引用 符) 等の符号キーを押下する。
日本語ヮードプロセッサにあっては、 上記のようなキーボードを用い て仮名及び漢字を含む文章を入力するために、 ローマ字変換や仮名漢字
変換等の入力方法が開発され広く用いられている。 このような日本語入 力の支援に特化したプログラムを日本語フロントェンドプロセッサ (F E P ) と呼ぶことがある。
一方、 欧米の言語、 特に英語の入力は原則としてキーボード上の英数 字に対応するキーを用いて変換処理を行うことなく文章を入力すること ができる。 ドイツ語やフランス語等で使用される特殊文字は、 複数キー の組合せで入力し、 又は、 文字一覧表から選択して入力することが多い, このため、 欧米の言語のワードプロセッサでは、 日本語フロントエンド プロセッサのような文字列の変換を含む文章入力支援プログラムの必要 性が少ない。
しかし、 キーボードを用いた英語やフランス語等の文章入力を学習す る人にとって、 上記のような大文字と小文字との区別やスペースの入力 は余計な労力に感じられることがある。 つまり、 口頭で文章を生成する ときのように、 大文字と小文字の区別やスペース (単語の区切り) を意 識することなく、 小文字を連続して入力すれば正しい文章に変換してく れる支援システムがあれば便利である。 このような文章入力支援システ ムは、 例えば上記の日本語フロントェンドプロセッサが起動している状 態で英文等の入力を行う場合にも便利な機能となるであろう。
また、 最近は携帯電話や携帯端末の普及に伴い、 従来から用いられて いるキーボードとは異なる配列及び少ないキー数のキーボードゃダイヤ ル等の新たな文字入力手段を用いて文章を入力する機会が増えつつある, このような入力手段を用いて、 キーボードに慣れていない作業者が英語 ゃフランス語等の文章入力を行う際にも、 大文字と小文字の区別ゃスぺ ースを意識させない文章入力支援システムが役立つであろう。
本発明は、 上記のような課題を考慮し、 英語やフランス語の文章のよ うにスペースで区切られた複数の単語からなる文章を入力する際に、 作
業者が小文字を連続入力するだけでスペースを含む文章に自動変換する 文章入力支援システムを提供することを目的とする。 発明の開示
本発明による文章入力支援システムは、 文章入力に用いられるキーボ ードと、 入力された文字列及び文章を表示するための表示装置と、 プロ グラム及びデータを記憶するための記憶装置と、 キーボードを用いて入 力された文字列をプログラムにしたがって処理する処理装置とを備え、 スペースで区切られた複数の単語からなる文章の入力を支援する文章入 力支援システムにおいて、 文章入力に使用できる全ての単語が登録され た辞書がデータとして記憶装置に記憶され、 処理装置は、 入力された文 字列と辞書に登録されている各単語とを先頭文字から順次照合して一致 した単語を記憶しておき、 入力された文字列が辞書に登録されているい ずれの単語とも一致する可能性が無くなったときに、 最後に一致した単 語を確定文字列とすると共にその後にスペースを付加して後続の入力文 字列と切り分けることを特徴とする。
このような文章入力支援システムを利用すれば、 作業者は小文字を連 続入力するだけでよく、 システムが単語の区切りを判断してスペースを 自動生成する。 なお、 文頭の文字を大文字にする処理は公知であり、 こ の処理を本システムの処理と組み合わせることによって、 作業者は大文 字と小文字の区別やスペースを意識せずに英語やフランス語等の文章入 力を行うことができる。
好ましくは、 カンマ、 ピリオド、 クォーテーションマーク等の符号が 入力された場合に、 処理装置は、 符号を除く入力文字列を確定文字列と し、 該確定文字列に続けて符号を表示する。 このような処理を行うこと 'により、 符号が入力された場合は辞書を参照せずに確定文字列を決定す
ることができる。 また、 文字と符号とを組み合わせた単語を辞書に登録 する必要がなくなるので、 辞書の記憶に必要なメモリ容量が少なくなる また、 辞書は登録単語のブイールドと変換単語のフィールドとを有し. 処理装置は、 確定文字列を登録単語に対応する変換単語で置き換える処 理を行う。 例えば、 登録単語" Chri st "に対応する変換単語" Chri st " が登録されている。 上記の処理により、 固有名詞のように大文字を含む 単語に関しても、 小文字のみの文字列 (登録単語) を入力すれば大文字 を含む正しい文字列 (変換単語) に自動変換される。
更に、 登録単語に対応して表記の異なる複数の変換単語がある場合に. 処理装置は、 1つの変換単語を確定文字列とすると共に他の変換単語を 他候補として作業者が選択できるように表示装置に表示し、 作業者が他 候補を選択した場合は、 確定文字列を他候補で置き換えることが好まし レ、。 例えば、 登録単語" may "に対して 2つの変換単語" may"と" May"が ある場合がこれに該当する。 作業者の選択を併用することにより、 生成 する文章の正確さを期すことができる。
また、 確定文字列の中に、 辞書に登録された他の単語が内包されてい る場合に、 処理装置は、 その内包されている単語を他候補として作業者 が選択できるように表示装置に表示し、 作業者が他候補を選択した場合 は、 確定文字列の確定とその後のスペースを取り消し、 他候補を新たな 確定文字列とすると共にその後にスペースを付加して後続の入力文字列 と切り分ける。 例えば、 確定文字列' ' advisedly"が他の登録された単 語" advi sed "を内包している場合がこれに該当する。 この場合も作業 者の選択を併用することにより、 生成する文章の正確さを期すことがで きる。
上記のような本発明の文章入力支援システムは、 例えば一般的なコン ピュータシステム (パーソナルコンピュータやワークステーション等)
に、 上述のような処理を行わせるソフトウェアプログラム (文章入力支 援プログラム) をインス トールすることによって実現される。 また、 そ のようなプログラムは、 C D— R O M、 F D、 メモリカード等の記憶媒 体に記憶して流通させ、 コンピュータシステムへのインス トールを行う ことができる。 図面の簡単な説明
図 1は、 本発明の実施形態に係る文章入力支援システムの概略構成を 示すブロック図である。
図 2は、 文章入力支援システムに使用される辞書の一部を例示する図 表である。
図 3は、 キーボードから文字又は符号が入力されるたびに実行される 文章入力支援プログラムのメインルーチンの例を示すフローチヤ一トで ある。
図 4は、 図 3のメインルーチン中の符号入力処理サブルーチンを示す フローチヤ一トである。
図 5は、 図 3のメインルーチン中の複数表記処理サブルーチンを示す フローチヤ一トである。
図 6は、 図 3のメインルーチン中の内包単語処理サブルーチンを示す フローチャートである。
発明を実施するための最良の形態
添付の図面に従って、 本発明をより詳細に説明する。
まず、 本発明の実施形態に係る文章入力支援システムの概略構成を図 1のブロック図に沿って説明する。 文章入力支援システム 1は、 表示装 置 1 1、 キーボード 1 2、 マウス 1 3、 プリンタ 1 4、 処理装置 1 5、
主メモリ 1 6、 固定ディスク装置 1 7、 及びリムーバブルディスク装置 1 8を備えている。
表示装置 1 1は、 C R T (陰極線管)、 L C D (液晶ディスプレイ) 等で構成され、 入力された文字列や文章等の画面表示に用いられる。 キ 一ボード 1 2は、 文章 (文字列) の入力等に用いられる。 マウス 1 3は, 文章入力や変換候補の選択等に補助的に用いられるが、 文章入力支援シ ステム 1に必須ではない。 キーボード 1 2があれば十分である。 プリン タ 1 4は、 作成された文章の印字出力等に用いられる。 処理装置 1 5は, この文章入力支援システムに関して言えば、 入力された文字列を後述す る文章入力支援プログラムにしたがって処理し、 所定の文章を生成する c また、 文章入力支援システム 1の全体の制御についても、 処理装置 1 5 が主として司る。
主メモリ 1 6は半導体メモリであり、 処理装置 1 5が実行するプログ ラムのロードやデータの一時記憶等に用いられる。 固定ディスク装置 1 7及びリムーバブルディスク装置 1 8はいわゆる補助記憶装置である。 固定ディスク装置 1 7はプログラムやデータの保存に用いられる。 リム 一バブルディスク装置 1 8は、 主としてプログラムのィンス トールゃデ ータのバックアップ等に用いられ、 光ディスク装置又は光磁気ディスク 装置で構成される。
上記のような文章入力支援システム 1は、 一般的なコンピュータシス テム (特にパーソナルコンピュータシステム) と、 専用の文章入力支援 プログラム (ソフトウェア) によって構成することができる。 文章入力 支援プログラムは、 例えば C D— R O Mのような記憶媒体 1 9に記録さ れて提供され、 リムーバブルディスク装置 1 8を介して固定ディスク装 置 1 7にインス トールされる。 但し、 そのようなインス トール方法に限 るわけではなく、 例えば、 コンピュータシステムに備えられた通信装置
を介して接続された他のコンピュータ又はネットワークのサーバから所 定の文章入力支援プログラムをダウンロードして、 固定ディスク装置 1 7にインス トールする方法も可能である。
次に、 固定ディスク装置 1 7に記憶されるデータの一つとして、 この 文章入力支援システム 1で使用される辞書について説明する。 以下の説 明においては、 英語の文章入力を例にとる。 この辞書には、 文章入力に 使用できる全ての単語が登録されている。 動詞の変化形や名詞の複数形 も辞書に登録されている。 例えば、 "boo k"が登録されていれば、 その 複数形" boo ks "も登録されている。 辞書の一部を図 2に例示する。
辞書は登録単語のフィールドと変換単語のフィールドとを有する。 登 録単語は小文字ばかりの文字列であり、 変換文字は大文字が混じる場合 がある。 例えば、 人名や地名のような固有名詞の場合は、 先頭の文字を 大文字で表記したものが変換文字として登録されている。 具体的な例と して、 登録単語" Chi cago "に対応して変換単語" Chicago "が登録され ている。 普通名詞や他の品詞の単語のように、 ほとんどの単語では登録 単語と確定単語が同じである。
この辞書では、 全ての登録単語がアルファべッ ト順に並べられている, 後述するアルゴリズムによって、 入力された文字列 (以下、 入力文字列 という) と一致する登録単語を辞書から見つける処理 (すなわち、 マツ チング処理) を行う際に、 最も長い文字列が優先的に選択されて確定文 字列となる。 確定文字列が決まると、 その登録単語に対応する変換単語 に置き換えられる。 カンマやピリオドのように、 アルファベッ ト以外の 符号が入力された場合は、 辞書を参照することなく、 それまでの入力文 字列がそのまま確定し、 確定文字列に続いてその符合が表示される。
また、 例えば登録単語" may "は、 表記の異なる 2つの変換単語" may" 及び" May "を有する。 このような場合は、 前者が第 1候補として、 後者
が第 2候補として変換単語のフィールドに登録されている。 3つ以上の 変換単語がある場合は、 第 3候補以降も登録されている。 図 2に示すよ うに、 表記の異なる複数の変換単語があるか否かを示す複数表記フィー ルドが辞書に設けられている。 例えば変換単語" may"のレコードでは複 数表記フィールドが 「有り」 となっている。 変換単語" Chicago"のレ コードでは複数表記フィールドが 「無し」 となっている。
上記のように複数の候補が変換単語として登録されている場合は、 い ずれかの候補がデフォルトの確定文字列として採用される。 また他の候 補は、 作業者が選択できるように表示装置 1 1に表示される。 作業者が 他の候補を選択すれば、 確定文字列が他の候補に置き換えられる。 上記 の例では、 小文字のみの文字列'' may' 'がデフオルトの確定文字列となり "May"が他の候補として表示される。
また、 例えば登録単語" advised"は、 その中に他の登録単語
"advise"を内包してレヽる。 つまり、 "advised"は、 "advise"と', d" に分かれる可能性がある。 このような場合は、 登録単語" advised"の 変換単語の第 1候補として" advised"が登録され、 第 2候補として "advise"が登録されている。 同様に登録単語" advisedly"の場合は. 変換単語として第 1候補" advisedly"と第 2候補" advised"が登録さ れている。
このように登録単語に内包される単語 (以下、 内包単語という) があ る場合にも、 デフオルト候補以外の他候補は作業者が選択できるように 表示装置 1 1に表示される。 作業者が他の候補を選択すれば、 確定文字 列が他の候補に置き換わる。 上記の例では、 最も長い第 1候補
"advisedly"がデフォルトの確定文字列となる。
また、 例えば登録単語" afield"の場合は、 その中に他の登録単語
"a"及び" field"を内包している。 この場合も、 変換単語として第 1候
補'' afield"及ぴ第 2候補" a"を登録しておけば、 前から順番に一単語 ずつ確定していくことができる。 第 2候補 "a"を確定した場合の残りの "field"については新たな入力文字列として処理すればよい。 図 2に 示すように、 内包単語があるか否かを示す内包単語フィールドが辞書に 設けられている。 例えば変換単語" advise"のレコードでは内包単語フ ィールドが 「無し」 となっており、 変換単語" advised"のレコードで は内包単語フィールドが 「有り」 となっている。
なお、 デフォルトの確定文字列を上記のように決めるのは一例に過ぎ ない。 例えば、 使用頻度の高い文字列をデフォルトの確定文字列として 採用するようにアルゴリズムを構成することも可能である。
以下、 図 3〜 5のフローチャートに基づいて、 この実施形態における 文章入力支援プログラムのアルゴリズムを説明する。 まず、 図 3はキー ボードから文字又は符号が入力されるたびに実行される文章入力支援プ ログラムのメインノレーチンの例を示すフローチヤ一トである。 図 3のス テツプ # 1において、 符号の入力か文字の入力かを判断する。 符号の入 力である場合 (ステップ # 1の Y e s) は、 ステップ # 2の符号入力処 理のサブルーチン (図 4を参照して後述する) を実行した後にステップ # 1 2へ移行する。
符号の入力でない場合、 すなわち文字の入力である場合 (ステップ # 1の No) は、 現在までの入力文字列と辞書の登録単語との照合を行う (ステップ # 3)。 入力文字列と一致する登録単語 (以下、 一致単語と いう) がある場合 (ステップ # 4の Y e s ) は、 一致単語を記憶 (記憶 更新) して (ステップ # 5) 処理ルーチンを終了する。 例えば、 現在ま での入力文字列が" advise"である場合は一致単語" advise"が記憶さ れるが、 これで文字列が確定するわけではない。 次に文字" d"が入力さ れた場合は、 一致単語の記憶が' 'advised"に更新される。 つまり、 最
後に一致した登録単語 (最後の一致単語) が記憶されることになる。 続いて文字" _ "が入力されたときに現在までの入力文字列
"advisedl"に一致する登録単語は無いが、 次に文字" y"が入力されれ ば登録単語" advisedly"に一致する。 つまり、 文字" 1"が入力された 時点では一致する登録単語は無いが、 次回以降の文字入力で登録単語に 一致する可能性が残っている。 この場合はステップ # 4の Noからステ ップ # 6の N oを経て処理ルーチンを終了する。
文字'' 1"の入力に続いて文字" y"以外の文字が入力された場合は、 次 回以降の文字入力でも登録単語に一致する可能性が無くなる。 この場合 はステップ # 4の Noからステップ # 6の Y e sを経てステップ # 7に 移行する。 ステップ # 7では、 最後に一致した登録単語 (最後の一致単 語) の記憶を読み出して、 これを確定文字列とする。 上記の例では、 "advised"力 S確定文字歹 IJとなる。
次のステップ # 8において、 辞書にしたがって登録単語 "advised" に対応する変換単語" advised"を確定文字列として置き換える。 確定 文字列 " advi sed"の例では変化が無いが、 例えば確定文字列が
"Chicago"の場合 fま変換単語" Chicago"に置き換えられる。
続くステップ # 9において複数表記処理のサブルーチンを実行する。 このサブルーチンについては、 図 5を参照して後述する。 そして、 ステ ップ # 1 0において確定文字列の後にスペースが付加され、 後続の入力 文字列と切り分けられる。 続いて、 ステップ # 1 1で内包単語処理のサ ブルーチンを実行した後、 ステップ # 1 2へ移行する。 このサブルーチ ンについては、 図 6を参照して後述する。
ステップ # 1 2では、 確定文字列が文の先頭の文字列か否かを判断す る。 これは、 例えば、 ピリオド (終止符) やクエスチョンマーク (疑問 符) のように、 文章の末尾に入力される符号 (以下、 文章終端符号とい
う) が入力された時点でフラグをセッ トすることによって判断すること ができる。 文章入力開始時にもこのフラグをセッ トする。 確定文字列が 文の先頭の文字列でない場合は何もせずに処理ルーチンを終了するが、 先頭の文字列である場合はステップ # 1 3で先頭文字を大文字にする。 この際、 上記のフラグはリセットされる。 そして処理ルーチンを終了す る。
図 4は、 図 3のステップ # 2における符号入力処理のサブルーチンを 示すフローチャートである。 まず、 ステップ # 1 0 1において、 入力さ れた符号を除く (符号より前の) 入力文字列を確定文字列とする。 次の ステップ # 1 02において、 確定文字列に続けて符号を表示する。 次のステップ # 1 0 3からステップ # 1 06までの処理は、 入力され た符号の後に必要に応じてスペースを付加する処理を行っている。 この 例では、 文章と文章との間、 すなわち文章終端符号の後はダブルスぺー スを付し、 文章の途中の区切り、 すなわちカンマ等の後にはシングルス ペースを付している。
つまり、 入力された符号が終止符や疑問符のような文章終端符号であ る場合 (ステップ # 1 03の Y e s) は、 ステップ # 1 04においてス ペースを付加し、 更にステップ # 1 06でスペースを付加する。 入力さ れた符号がカンマ、 セミコロン等の文章の途中を区切る符号である場合 (ステップ # 1 03の Noからステップ # 1 05の Y e s ) は、 ステツ プ # 1 06でスペースを付加する。 それ以外の符号、 例えばアポス トロ フィ等の場合はスペースを付加することなくメインルーチンに戻る。 なお、 段落を変えるための改行は、 作業者が改行キーを押下すること によって行うが、 このときは、 文章終端符号の後に挿入されたダブルス ペースは削除される。 文章入力を終了した場合も同様に、 最後の文章終 端符号の後に挿入されたダブルスぺースは削除される。
また、 段落の先頭にタブ又は所定数のスペースを挿入する処理を必要 に応じて行ってもよい。 ヮ一ドラップ処理や禁則処理についても同様に 必要に応じて、 又は設定にしたがって実行すればよい。 ワードラップ処 理は、 一つの単語の途中で行が終了する場合に、 その単語を次の行に送 る処理を意味する。 禁則処理は、 行の始めがピリオドやカンマ等の符号 になることを避けて、 前の行の最後に規定の文字数を超えてそれらの符 号を表示する処理を意味する。 これらの処理は公知の技術であり、 本発 明と直接の関係は無いので詳細な説明は割愛する。
図 5は、 図 3のステップ # 9における複数表記処理のサブルーチンを 示すフローチャートである。 まず、 ステップ # 2 0 1において辞書の複 数表記フィールドを参照し、 複数表記の有無をチェックする。 複数表記 有りの場合は、 ステップ # 2 0 2でデフォルト候補を確定文字列とし、 ステップ # 2 0 3で他候補を選択可能に表示する。 例えば登録単語 "may "に対応する変換単語の第 1候補" may"を確定文字列とし、 第 2候 補 "May"を選択可能に表示する。
ここでいう 「選択可能に表示」 は、 表示装置 1 1の画面上において、 他候補 (他の表記) があることが分かるように表示すれば十分である。 例えば入力文章中に表示されるデフオルト候補に近接して他候補を表示 してもよいし、 離れた場所に表示してもよい。 他候補の選択は例えば特 別のキー (例えばスペースキー) を押下することによって行われる。 2 つ以上の他候補がある場合は、 そのキーを複数回押下することによって 選択対象の他候補が変わるようにすればよい。
他候補選択のためのキー (例えばスペースキー) を押下しないで他の キー (文字や符号を入力するキー) が押下されれば、 他候補が選択され なかったことになる。 他候補が選択されなかった場合 (ステップ # 2 0 4の N o ) は、 デフォルト候補が確定文字列とされたままでメインルー
チンに戻る。 他候補が選択された場合 (ステップ # 2 0 4の Y e s ) は. 確定文字列 ("may" ) が他候補 ("May" ) で置き換えられ (ステップ # 2 0 5 )、 メインルーチンに戻る。
図 6は、 ステップ # 1 1における内包単語処理のサブルーチンを示す フローチャートである。 まず、 ステップ # 3 0 1において辞書の内包単 語フィールドを参照し、 内包単語の有無をチェックする。 内包単語有り の場合は、 ステップ # 3 0 2で内包単語を他候補として選択可能に表示 する。 例えば登録単語" advised"に対応する変換単語の第 1候補
" advised"が確定文字列として表示されているときに、 内包単語であ る第 2候補" advise "を選択可能に表示する。
ここでいう 「選択可能に表示」 は、 表示装置 1 1の画面上において、 他候補 (内包単語) があることが分かるように表示すれば十分である。 例えば入力文章中に表示されるデフォルト候補に近接して他候補を表示 してもよいし、 離れた場所に表示してもよい。 他候補の選択は例えば特 別のキー (例えばスペースキー) を押下することによって行われる。 2 つ以上の他候補がある場合は、 そのキーを複数回押下することによって 選択対象の他候補が変わるようにすればよい。
他候補選択のためのキー (例えばスペースキー) を押下しないで他の キー (文字や符号を入力するキー) が押下されれば、 他候補が選択され なかったことになる。 他候補が選択されなかった場合 (ステップ # 3 0 3の N o ) は、 そのままメインルーチンに戻る。 他候補が選択された場 合 (ステップ # 3 0 3の Y e s ) は、 ステップ # 3 0 4で確定文字列の 確定とその後のスペース (例えば" advised ") が取り消される。 そし て、 他候補 (例えば" advise " ) を新たな確定文字列とし (ステップ # 3 0 5 )、 その後にスペースを付加して (ステップ # 3 0 6 ) メインル 一チンに戻る。 この例では、 スペースで切り分けられた後続の入力文字
列はすでに入力されている" d"から始まることになる。
次に、 具体的な文章入力を例にとって説明を加える。 文章の一例とし 、 英文" This is the first time I have listened to jazz
It is fantastic!"を入力する場合を考える。 本発明の文章入力支 援システムを用いる場合に作業者はキーボードから
" thisisthef xrstt imeihavelistenedto j azz.itisfantastic!
"と入力すればよい。
なお、 説明を簡単にするために以下の条件を設定する。 ただし、 この 条件は自由に設定可能である。 一行当たり入力可能な文字数は小文字 3 0個に相当する。 文字以外の符号は小文字と同じく 1文字分の幅に相当 し、 大文字は小文字 2個分の幅を占有する。 文字ごとに幅を変えるプロ ポーショナルフォントは考慮しないで、 全ての文字及び符号について上 記の条件を満たすものとする。 また、 前述のワードラップ処理を実行し. 段落の先頭にタブ (又はスペース) を挿入する処理は実行しないものと する。
作業者が" t"から入力を始めて、 "this"まで入力した時点で辞書の 登録単語" this"と一致し、 一致単語" this"が記憶される (図 3のス テツプ # 5)。 続いて'' i"が入力されると、 それまでの入力文字列
"thisi"で始まる登録単語が無いので、 次回以降の文字入力でも登録 単語に一致する可能性が無くなる。 この時点で最後に一致した登録単語 "this"が読み出されて確定文字列となる (図 3のステップ # 7)。 そ して、 登録単語" this"に複数表記は無いので確定文字列'' this"が最 終的に確定し、 その後にスペースが付加される (図 3のステップ # 1 0)。
また、 登録単語" this"は内包単語も無いので、 確定文字列" this" 及びその後に付加されたスペースは変更されない (最終確定する)。 そ
して、 文の先頭であることが前述のようにして判別されるので、 先頭文 字が大文字にされる (図 3のステップ # 1 3)。 ここまでの入力文章は, "This i"であり、 "i"で始まる入力文字列に処理対象が移行する。 こ のとき、 一致単語の記憶領域はクリアされる。
登録単語" i"が一致単語として記憶され、 更に "s"が入力されると、 入力文字列" is"に一致する登録単語が辞書で見つかるので、 一致単語 の記憶が" is"に更新される。 この後、 "isthe"まで入力された時点で 登録単語に一致する可能性が無くなる。 したがって、 一致単語 "is"が 確定文字列となり、 その後にスペースが付加される。 この時点での入力 文章は、 "This is the"となっているが、 処理対象の入力文字列はま だ "is"である。 登録単語 "is"は内包単語" i"を有するので、 確定文字 列 "is"の他候補として" i"が選択可能に表示される (図 6のステップ # 3 0 2)。
作業者が" i"を選択せずに (無視して) 次の文字" f"を入力すると、 処理対象の入力文字列が" the"に移り、 一致単語" the"が記憶されると 共に入力文字列が" thef"になる。 更に" i"が入力されて入力文字列が "thefi"になった時点で登録単語に一致する可能性が無くなる。 した がって、 一致単語" the"が確定文字列となり、 その後にスペースが付加 される。 登録単語" the"は内包単語が無いので、 処理対象の入力文字列 力 S"fi"に移行し、 一致単語の記憶領域がクリアされる。 この時点での 入力文章は、 "This is the fi"となっている。
同様の処理力 S繰り返されて、 "This is the first time i"まで の文章が入力され、 現在の処理対象が" i"から始まる入力文字列にある とする。 登録単語" i"がー致単語として記憶された後、 入力文字列が "iha"まで入力された時点で登録単語に一致する可能性が無くなる。 し たがって一致単語" i"が確定文字列となり、 辞書の変換単語" I"に置き
換えられた後、 スペースが付加される。 この時点での入力文章は、 "This is the first time I ha"であり、 処理対象の入力文字歹 'J は" ha"となっている。
入力文字列が " ha ve "になつた時点で一致単語" ha ve "が記憶される, 更に入力文字列が" havelis"になった時点で登録単語に一致する可能 性が無くなるので、 一致単語" have"が確定文字列となり、 スペースが 付カ卩される。 この時点での入力文章は、 "This is the first time I have lis"であり、 処理対象の入力文字列は" lis"となっている。 このとき、 前述の条件として設定した 1行当たりの文字数 3 0を超える ので、 ワードラップ処理により、 入力文字列 "lis"以降の表示は 2行目 に移される。
同様の処理力 S繰り返されて、 "This is the first time I have (改行) listened to jazz"までの文章が入力され、 現在の処理対 象の入力文字列が" jazz"であるとする。 次に終止符 (ピリオド) が入 力されると、 "jazz"はそのまま確定文字列となり (図 4のステップ # 1 0 1 )、 続けて終止符が表示される (図 4のステップ # 1 0 2)。 さら に、 スペースが 2個自動的に付加される (図 4のステップ # 1 0 4及び # 1 0 6)。 この時点での入力文章は" This is the first time I have (改行) listened to jazz . "である。 前述のように、 次の 入力文字列が文頭であることを示すフラグがセッ トされる。
次の文章についても同様の入力支援処理が行われ、 "This is the first time I have 、改?T) listened to jazz. It is fanta"まで入力された時点で、 2行目が 1行当たりの文字数 3 0を超 えるので、 現在の処理対象である入力文字列" fanta"が 3行目に移行 する。 また、 "fan"まで入力された時点で登録単語 "have"がー致単語 として記憶され、 "fantast"まで入力された時点で一致単語の記憶が
登録単語' 'fantast"tこ更新される。 更 " fantastic"まで人力された 時点で一致単語の記憶が登録単語" fantastic"に更新される。
この例では、 次の感嘆符 ( !) が入力された時点で、 感嘆符 ( !) を 除く入力文字列" fantastic"が確定し、 その後に感嘆符 ( !) が表示 される (図 4のステップ # 1 0 1及び # 1 0 2)。 なお、 この例と異な るが、 入力文字列" fantastic"の後に文字入力が続く場合は、 登録単 語に一致する可能性が無くなった時点で最後の一致単語 "fantastic" が読み出されて確定文字列となると共に、 内包単語" fan"及び
"fantast"が他候補として選択可能に表示されることになる。
確定文字列" fantastic"の後に感嘆符 (!) が表示されたのち、 ダ ブルスペースが自動的に付加される (図 4のステップ # 1 0 4及び # 1 0 6) 力 前述のように文章入力が終了したときに最後のダブルスぺー スは削除される。 こうして、 作業者がキーボードから入力した文字列 " thisisthef irsttimeihavelistenedto j azz.itisfantastic! "力 所定开式の文章" This is the first time I have (改行) listened to jazz . It is (改行) fantastic 'に変換され、 表示装置 1 1の画面上に表示される。
以上に説明したように、 本発明の文章入力支援システムでは、 スぺー スなしで連続入力された文字列を辞書の登録単語と照合することによつ て単語の切れ目を判断してスペースを自動挿入する。 このとき、 最も長 い単語をデフォルトの確定文字列 (単語) として採用する。 そして、 確 定文字列に短い登録単語 (内包単語) が含まれる場合は、 内包単語を他 候補として選択可能に表示して、 作業者の選択又は非選択を待って確定 文字列の最終的な確定を行う。
しかし、 確定文字列に内包単語がある場合の変換候補の選択を、 ある 程度自動的に行うことも可能である。 一例として、 後続の入力文字列と
の関係で内包単語を含む変換候補の中から適切な候補を自動的に選択す る方法を簡単に説明する。
伊 Jえば、 "our section"を意識して' 'oursection"とレヽぅ文字歹 Uを 入力する場合に、 "oursec"まで入力された時点で登録単語に一致する 可能性が無くなり、 "ours"が確定する。 この確定文字列" ours"は内 包単語 "our"を有する。 そこで、 後続の入力文字列を処理する際に、 " ours"で区切られた場合の" ec"で始まる入力文字列だけでなく、 "our"で区切られた場合の'' sec"で始まる入力文字列についても並行し て評価する。 その結果、 前者の" ec' 'で始まる場合は、 "ecti"まで入力 した時点で登録単語に一致する可能性が無くなり、 一致単語が記憶され ていないのでエラーになってしまう。 後者の" sec"で始まる場合は、 登 録単語' 'section"力 S辞書に見つ力 る。 こう して、 "our section"力 適切な区切りとして最終的に確定する。
上記の方法の場合に、 例えば" our sport"を意識して" oursport" という文字列を入力する場合は、 "ours port"が正しい区切りとして 認識されることになる。 このような場合に、 後の文字列が長いほうを優 先して選択するようにしてもよい。 つまり、 "ours port"ではなく、 "our sport"を適切な区切りとして自動選択する。 一般に、 後の文字 列が長いほうを優先して選択するほうが正しい区切りになる確率が高い ことが分かっている。
その他の方法として、 辞書に登録単語の品詞や他の単語との結合の情 報を登録しておき、 直前又はそれ以前の確定文字列との関係に基づいて 内包単語を含む変換候補の中から適切な候補を自動的に選択するように してもよレ、。
また、 上記実施例では、 作業者がタイプミスをした場合のエラーにつ いては触れなかった。 例えば、 一致単語が記憶されていない (入力文字
列の処理に先立ってクリアされたまま) の状態で、 登録単語に一致する 可能性が無くなったときは、 タイプミスと判断して、 エラー表示を行う ことが可能である。 ブザーや音声でタイプミスを知らせてもよい。 作業 者の選択を求める表示に際してもブザーによる報知を行ってもよい。 なお、 本発明は上記実施形態に限らず、 種々の形態で実施することが 可能である。 特に、 文章入力支援システムのハードウェア構成について は、 標準キーボードを備えたコンピュータに限らず、 ワードプロセッサ 専用機であってもよいし、 専用キーボードを備えた携帯端末等、 文章入 力が可能な任意の装置に本発明を適用することができる。
また、 上記の実施形態では英語の文章入力を例にとって説明したが、 本発明は英語に限らずドイツ語やフランス語等の種々の文章入力に適用 することができる。 要は、 スペースで区切られた複数の単語からなる文 章の入力であれば、 本発明を適用可能である。 産業上の利用可能性
以上のように、 本発明に係る文章入力支援システムはヮードプロセッ サ等の文章入力機器に利用することができる。 そして、 英語やフランス 語の文章のようにスペースで区切られた複数の単語からなる文章の入力 に際して作業者が小文字を連続入力すれば、 文章入力支援システムがス ペースを自動生成し、 適切な文章に変換する。