JP4048169B2 - スペースの自動生成によって文章入力を支援するシステム - Google Patents

スペースの自動生成によって文章入力を支援するシステム Download PDF

Info

Publication number
JP4048169B2
JP4048169B2 JP2003504270A JP2003504270A JP4048169B2 JP 4048169 B2 JP4048169 B2 JP 4048169B2 JP 2003504270 A JP2003504270 A JP 2003504270A JP 2003504270 A JP2003504270 A JP 2003504270A JP 4048169 B2 JP4048169 B2 JP 4048169B2
Authority
JP
Japan
Prior art keywords
character string
word
input
registered
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003504270A
Other languages
English (en)
Other versions
JPWO2002101578A1 (ja
Inventor
博 石倉
Original Assignee
博 石倉
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 博 石倉 filed Critical 博 石倉
Publication of JPWO2002101578A1 publication Critical patent/JPWO2002101578A1/ja
Application granted granted Critical
Publication of JP4048169B2 publication Critical patent/JP4048169B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/274Converting codes to words; Guess-ahead of partial word inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)
  • Input From Keyboards Or The Like (AREA)

Description

【0001】
技術分野
この発明は、英語やフランス語の文章のようにスペースで区切られた複数の単語からなる文章を入力する際に、作業者が小文字を連続入力するだけでスペースを含む正しい文章に自動変換する文章入力支援システムに関する。
【0002】
背景技術
近年、コンピュータ技術の進展に伴い、文章をコンピュータ(ワードプロセッサ専用機を含む)を用いて入力する機会が多くなってきている。このような文章入力は、複数のキースイッチが所定の規則に沿って配列されたキーボードを用いて行われることが多い。このキーボード配列の基本は英文タイプライターの配列に遡ることができ、コンピュータを用いた英語やフランス語等の文章入力も基本的には英文タイプの入力方法が踏襲されている。
つまり、単語のスペルにしたがってキーボード上の対応する文字のキーを順次押下し、単語と単語の間にはスペースキーを押下する。また、文章の始まりや固有名詞(ドイツ語では全ての名詞)の先頭の文字を大文字にするためにシフトキーを文字キーと共に押下する。更に、必要に応じてカンマ、ピリオド(終止符)、クォーテーションマーク(引用符)等の符号キーを押下する。
日本語ワードプロセッサにあっては、上記のようなキーボードを用いて仮名及び漢字を含む文章を入力するために、ローマ字変換や仮名漢字変換等の入力方法が開発され広く用いられている。このような日本語入力の支援に特化したプログラムを日本語フロントエンドプロセッサ(FEP)と呼ぶことがある。
一方、欧米の言語、特に英語の入力は原則としてキーボード上の英数字に対応するキーを用いて変換処理を行うことなく文章を入力することができる。ドイツ語やフランス語等で使用される特殊文字は、複数キーの組合せで入力し、又は、文字一覧表から選択して入力することが多い。このため、欧米の言語のワードプロセッサでは、日本語フロントエンドプロセッサのような文字列の変換を含む文章入力支援プログラムの必要性が少ない。
【0003】
しかし、キーボードを用いた英語やフランス語等の文章入力を学習する人にとって、上記のような大文字と小文字との区別やスペースの入力は余計な労力に感じられることがある。つまり、口頭で文章を生成するときのように、大文字と小文字の区別やスペース(単語の区切り)を意識することなく、小文字を連続して入力すれば正しい文章に変換してくれる支援システムがあれば便利である。このような文章入力支援システムは、例えば上記の日本語フロントエンドプロセッサが起動している状態で英文等の入力を行う場合にも便利な機能となるであろう。
また、最近は携帯電話や携帯端末の普及に伴い、従来から用いられているキーボードとは異なる配列及び少ないキー数のキーボードやダイヤル等の新たな文字入力手段を用いて文章を入力する機会が増えつつある。このような入力手段を用いて、キーボードに慣れていない作業者が英語やフランス語等の文章入力を行う際にも、大文字と小文字の区別やスペースを意識させない文章入力支援システムが役立つであろう。
本発明は、上記のような課題を考慮し、英語やフランス語の文章のようにスペースで区切られた複数の単語からなる文章を入力する際に、作業者が小文字を連続入力するだけでスペースを含む文章に自動変換する文章入力支援システムを提供することを目的とする。
【0004】
発明の開示
本発明による文章入力支援システムは、文章入力に用いられるキーボードと、入力された文字列及び文章を表示するための表示装置と、プログラム及びデータを記憶するための記憶装置と、キーボードを用いて入力された文字列をプログラムにしたがって処理する処理装置とを備え、スペースで区切られた複数の単語からなる文章の入力を支援する文章入力支援システムにおいて、文章入力に使用できる全ての単語が登録された辞書がデータとして記憶装置に記憶され、処理装置は、入力された文字列と辞書に登録されている各単語とを先頭文字から順次照合して一致した単語を記憶しておき、入力された文字列が辞書に登録されているいずれの単語とも一致する可能性が無くなったときに、最後に一致した単語を確定文字列とすると共にその後にスペースを付加して後続の入力文字列と切り分ける処理を行い、かつ、前記辞書の各レコードは、登録単語のフィールドと、前記登録単語から変換される変換単語のフィールドと、前記登録単語が内包単語を有するか否かを示すフィールドとを備え、前記登録単語が前記内包単語を有するレコードの前記変換単語のフィールドには前記内包単語を含む複数の候補の単語が登録されており、前記処理装置は、前記確定文字列が前記内包単語を有する場合は、前記確定文字列を仮の確定文字列として処理することを特徴とする。
このような文章入力支援システムを利用すれば、作業者は小文字を連続入力するだけでよく、システムが単語の区切りを判断してスペースを自動生成する。なお、文頭の文字を大文字にする処理は公知であり、この処理を本システムの処理と組み合わせることによって、作業者は大文字と小文字の区別やスペースを意識せずに英語やフランス語等の文章入力を行うことができる。
【0005】
好ましい実施形態において、前記処理装置は、前記確定文字列を仮の確定文字列と判断したときは、前記仮の確定文字列の前記内包単語を前記辞書から取得し、前記内包単語を他候補として作業者が選択できるように前記表示装置に表示し、作業者が前記他候補を選択した場合は、前記仮の確定文字列とその後のスペースを取り消し、前記他候補を新たな確定文字列とすると共にその後にスペースを付加して後続の入力文字列と切り分ける。例えば、確定文字列"advisedly"が他の登録された単語"advised"を内包している場合がこれに該当する。この場合も作業者の選択を併用することにより、生成する文章の正確さを期すことができる。
別の実施形態として、前記処理装置は、前記確定文字列を仮の確定文字列と判断したときは、前記辞書の前記変換単語のフィールドに登録された前記内包単語の後続文字列の前記辞書との照合による切り分け処理を、前記仮の確定文字列の後続文字列の切り分け処理と並行して行い、前記仮の確定文字列の後続文字列の切り分け処理がエラーになる場合は、 前記仮の確定文字列とその後のスペースを取り消し、前記内包単語を新たな確定文字列とすると共にその後にスペースを付加して後続の入力文字列と切り分ける。この場合は、上記のように作業者に選択させる代わりに、処理装置が正しい(と判断した)切り分けを自動的に選択することができる。
【0006】
また、カンマ、ピリオド、クォーテーションマーク等の符号が入力された場合に、処理装置は、符号を除く入力文字列を確定文字列とし、該確定文字列に続けて符号を表示する。このような処理を行うことにより、符号が入力された場合は辞書を参照せずに確定文字列を決定することができる。また、文字と符号とを組み合わせた単語を辞書に登録する必要がなくなるので、辞書の記憶に必要なメモリ容量が少なくなる。
また、前記辞書の各レコードは、前記登録単語に対応して表記の異なる複数の変換単語が有るか否かを示す複数表記のフィールドを更に備え、前記処理装置は、前記登録単語に対応して表記の異なる複数の変換単語がある場合は、前記辞書から取得した複数の変換単語のうちの1つを確定文字列とすると共に他の変換単語を他候補として作業者が選択できるように表示装置に表示し、作業者が他候補を選択した場合は、確定文字列を他候補で置き換えることが好ましい。例えば、登録単語"may"に対して2つの変換単語"may"と"May"がある場合がこれに該当する。作業者の選択を併用することにより、生成する文章の正確さを期すことができる。
【0007】
上記のような本発明の文章入力支援システムは、例えば一般的なコンピュータシステム(パーソナルコンピュータやワークステーション等)に、上述のような処理を行わせるソフトウェアプログラム(文章入力支援プログラム)をインストールすることによって実現される。また、そのようなプログラムは、CD−ROM、FD、メモリカード等の記憶媒体に記憶して流通させ、コンピュータシステムへのインストールを行うことができる。
【0008】
発明を実施するための最良の形態
添付の図面に従って、本発明をより詳細に説明する。
まず、本発明の実施形態に係る文章入力支援システムの概略構成を図1のブロック図に沿って説明する。文章入力支援システム1は、表示装置11、キーボード12、マウス13、プリンタ14、処理装置15、主メモリ16、固定ディスク装置17、及びリムーバブルディスク装置18を備えている。
表示装置11は、CRT(陰極線管)、LCD(液晶ディスプレイ)等で構成され、入力された文字列や文章等の画面表示に用いられる。キーボード12は、文章(文字列)の入力等に用いられる。マウス13は、文章入力や変換候補の選択等に補助的に用いられるが、文章入力支援システム1に必須ではない。キーボード12があれば十分である。プリンタ14は、作成された文章の印字出力等に用いられる。処理装置15は、この文章入力支援システムに関して言えば、入力された文字列を後述する文章入力支援プログラムにしたがって処理し、所定の文章を生成する。また、文章入力支援システム1の全体の制御についても、処理装置15が主として司る。
主メモリ16は半導体メモリであり、処理装置15が実行するプログラムのロードやデータの一時記憶等に用いられる。固定ディスク装置17及びリムーバブルディスク装置18はいわゆる補助記憶装置である。固定ディスク装置17はプログラムやデータの保存に用いられる。リムーバブルディスク装置18は、主としてプログラムのインストールやデータのバックアップ等に用いられ、光ディスク装置又は光磁気ディスク装置で構成される。
【0009】
上記のような文章入力支援システム1は、一般的なコンピュータシステム(特にパーソナルコンピュータシステム)と、専用の文章入力支援プログラム(ソフトウエア)によって構成することができる。文章入力支援プログラムは、例えばCD−ROMのような記憶媒体19に記録されて提供され、リムーバブルディスク装置18を介して固定ディスク装置17にインストールされる。但し、そのようなインストール方法に限るわけではなく、例えば、コンピュータシステムに備えられた通信装置を介して接続された他のコンピュータ又はネットワークのサーバから所定の文章入力支援プログラムをダウンロードして、固定ディスク装置17にインストールする方法も可能である。
次に、固定ディスク装置17に記憶されるデータの一つとして、この文章入力支援システム1で使用される辞書について説明する。以下の説明においては、英語の文章入力を例にとる。この辞書には、文章入力に使用できる全ての単語が登録されている。動詞の変化形や名詞の複数形も辞書に登録されている。例えば、"book"が登録されていれば、その複数形"books"も登録されている。辞書の一部を図2に例示する。
【0010】
辞書は登録単語のフィールドと変換単語のフィールドとを有する。登録単語は小文字ばかりの文字列であり、変換文字は大文字が混じる場合がある。例えば、人名や地名のような固有名詞の場合は、先頭の文字を大文字で表記したものが変換文字として登録されている。具体的な例として、登録単語"chicago"に対応して変換単語"Chicago"が登録されている。普通名詞や他の品詞の単語のように、ほとんどの単語では登録単語と確定単語が同じである。
この辞書では、全ての登録単語がアルファベット順に並べられている。後述するアルゴリズムによって、入力された文字列(以下、入力文字列という)と一致する登録単語を辞書から見つける処理(すなわち、マッチング処理)を行う際に、最も長い文字列が優先的に選択されて確定文字列となる。確定文字列が決まると、その登録単語に対応する変換単語に置き換えられる。カンマやピリオドのように、アルファベット以外の符号が入力された場合は、辞書を参照することなく、それまでの入力文字列がそのまま確定し、確定文字列に続いてその符合が表示される。
【0011】
また、例えば登録単語"may"は、表記の異なる2つの変換単語"may"及び"May"を有する。このような場合は、前者が第1候補として、後者が第2候補として変換単語のフィールドに登録されている。3つ以上の変換単語がある場合は、第3候補以降も登録されている。図2に示すように、表記の異なる複数の変換単語があるか否かを示す複数表記フィールドが辞書に設けられている。例えば変換単語"may"のレコードでは複数表記フィールドが「有り」となっている。変換単語"chicago"のレコードでは複数表記フィールドが「無し」となっている。
上記のように複数の候補が変換単語として登録されている場合は、いずれかの候補がデフォルトの確定文字列として採用される。また他の候補は、作業者が選択できるように表示装置11に表示される。作業者が他の候補を選択すれば、確定文字列が他の候補に置き換えられる。上記の例では、小文字のみの文字列"may"がデフォルトの確定文字列となり、"May"が他の候補として表示される。
【0012】
また、例えば登録単語"advised"は、その中に他の登録単語"advise"を内包している。つまり、"advised"は、"advise"と"d"に分かれる可能性がある。このような場合は、登録単語"advised"の変換単語の第1候補として"advised"が登録され、第2候補として"advise"が登録されている。同様に登録単語"advisedly"の場合は、変換単語として第1候補"advisedly"と第2候補"advised"が登録されている。
このように登録単語に内包される単語(以下、内包単語という)がある場合にも、デフォルト候補以外の他候補は作業者が選択できるように表示装置11に表示される。作業者が他の候補を選択すれば、確定文字列が他の候補に置き換わる。上記の例では、最も長い第1候補"advisedly"がデフォルトの確定文字列となる。
【0013】
また、例えば登録単語"afield"の場合は、その中に他の登録単語"a"及び"field"を内包している。この場合も、変換単語として第1候補"afield"及び第2候補"a"を登録しておけば、前から順番に一単語ずつ確定していくことができる。第2候補"a"を確定した場合の残りの"field"については新たな入力文字列として処理すればよい。図2に示すように、内包単語があるか否かを示す内包単語フィールドが辞書に設けられている。例えば変換単語"advise"のレコードでは内包単語フィールドが「無し」となっており、変換単語"advised"のレコードでは内包単語フィールドが「有り」となっている。
なお、デフォルトの確定文字列を上記のように決めるのは一例に過ぎない。例えば、使用頻度の高い文字列をデフォルトの確定文字列として採用するようにアルゴリズムを構成することも可能である。
【0014】
以下、図3〜5のフローチャートに基づいて、この実施形態における文章入力支援プログラムのアルゴリズムを説明する。まず、図3はキーボードから文字又は符号が入力されるたびに実行される文章入力支援プログラムのメインルーチンの例を示すフローチャートである。図3のステップ#1において、符号の入力か文字の入力かを判断する。符号の入力である場合(ステップ#1のYes)は、ステップ#2の符号入力処理のサブルーチン(図4を参照して後述する)を実行した後にステップ#12へ移行する。
符号の入力でない場合、すなわち文字の入力である場合(ステップ#1のNo)は、現在までの入力文字列と辞書の登録単語との照合を行う(ステップ#3)。入力文字列と一致する登録単語(以下、一致単語という)がある場合(ステップ#4のYes)は、一致単語を記憶(記憶更新)して(ステップ#5)処理ルーチンを終了する。例えば、現在までの入力文字列が"advise"である場合は一致単語"advise"が記憶されるが、これで文字列が確定するわけではない。次に文字"d"が入力された場合は、一致単語の記憶が"advised"に更新される。つまり、最後に一致した登録単語(最後の一致単語)が記憶されることになる。
【0015】
続いて文字"l"が入力されたときに現在までの入力文字列"advisedl"に一致する登録単語は無いが、次に文字"y"が入力されれば登録単語"advisedly"に一致する。つまり、文字"l"が入力された時点では一致する登録単語は無いが、次回以降の文字入力で登録単語に一致する可能性が残っている。この場合はステップ#4のNoからステップ#6のNoを経て処理ルーチンを終了する。
文字"l"の入力に続いて文字"y"以外の文字が入力された場合は、次回以降の文字入力でも登録単語に一致する可能性が無くなる。この場合はステップ#4のNoからステップ#6のYesを経てステップ#7に移行する。ステップ#7では、最後に一致した登録単語(最後の一致単語)の記憶を読み出して、これを確定文字列とする。上記の例では、"advised"が確定文字列となる。
次のステップ#8において、辞書にしたがって登録単語"advised"に対応する変換単語"advised"を確定文字列として置き換える。確定文字列"advised"の例では変化が無いが、例えば確定文字列が"chicago"の場合は変換単語"Chicago"に置き換えられる。
【0016】
続くステップ#9において複数表記処理のサブルーチンを実行する。このサブルーチンについては、図5を参照して後述する。そして、ステップ#10において確定文字列の後にスペースが付加され、後続の入力文字列と切り分けられる。続いて、ステップ#11で内包単語処理のサブルーチンを実行した後、ステップ#12へ移行する。このサブルーチンについては、図6を参照して後述する。
ステップ#12では、確定文字列が文の先頭の文字列か否かを判断する。これは、例えば、ピリオド(終止符)やクエスチョンマーク(疑問符)のように、文章の末尾に入力される符号(以下、文章終端符号という)が入力された時点でフラグをセットすることによって判断することができる。文章入力開始時にもこのフラグをセットする。確定文字列が文の先頭の文字列でない場合は何もせずに処理ルーチンを終了するが、先頭の文字列である場合はステップ#13で先頭文字を大文字にする。この際、上記のフラグはリセットされる。そして処理ルーチンを終了する。
【0017】
図4は、図3のステップ#2における符号入力処理のサブルーチンを示すフローチャートである。まず、ステップ#101において、入力された符号を除く(符号より前の)入力文字列を確定文字列とする。次のステップ#102において、確定文字列に続けて符号を表示する。
次のステップ#103からステップ#106までの処理は、入力された符号の後に必要に応じてスペースを付加する処理を行っている。この例では、文章と文章との間、すなわち文章終端符号の後はダブルスペースを付し、文章の途中の区切り、すなわちカンマ等の後にはシングルスペースを付している。
つまり、入力された符号が終止符や疑問符のような文章終端符号である場合(ステップ#103のYes)は、ステップ#104においてスペースを付加し、更にステップ#106でスペースを付加する。入力された符号がカンマ、セミコロン等の文章の途中を区切る符号である場合(ステップ#103のNoからステップ#105のYes)は、ステップ#106でスペースを付加する。それ以外の符号、例えばアポストロフィ等の場合はスペースを付加することなくメインルーチンに戻る。
なお、段落を変えるための改行は、作業者が改行キーを押下することによって行うが、このときは、文章終端符号の後に挿入されたダブルスペースは削除される。文章入力を終了した場合も同様に、最後の文章終端符号の後に挿入されたダブルスペースは削除される。また、段落の先頭にタブ又は所定数のスペースを挿入する処理を必要に応じて行ってもよい。ワードラップ処理や禁則処理についても同様に、必要に応じて、又は設定にしたがって実行すればよい。ワードラップ処理は、一つの単語の途中で行が終了する場合に、その単語を次の行に送る処理を意味する。禁則処理は、行の始めがピリオドやカンマ等の符号になることを避けて、前の行の最後に規定の文字数を超えてそれらの符号を表示する処理を意味する。これらの処理は公知の技術であり、本発明と直接の関係は無いので詳細な説明は割愛する。
【0018】
図5は、図3のステップ#9における複数表記処理のサブルーチンを示すフローチャートである。まず、ステップ#201において辞書の複数表記フィールドを参照し、複数表記の有無をチェックする。複数表記有りの場合は、ステップ#202でデフォルト候補を確定文字列とし、ステップ#203で他候補を選択可能に表示する。例えば登録単語"may"に対応する変換単語の第1候補"may"を確定文字列とし、第2候補"May"を選択可能に表示する。
ここでいう「選択可能に表示」は、表示装置11の画面上において、他候補(他の表記)があることが分かるように表示すれば十分である。例えば入力文章中に表示されるデフォルト候補に近接して他候補を表示してもよいし、離れた場所に表示してもよい。他候補の選択は例えば特別のキー(例えばスペースキー)を押下することによって行われる。2つ以上の他候補がある場合は、そのキーを複数回押下することによって選択対象の他候補が変わるようにすればよい。
他候補選択のためのキー(例えばスペースキー)を押下しないで他のキー(文字や符号を入力するキー)が押下されれば、他候補が選択されなかったことになる。他候補が選択されなかった場合(ステップ#204のNo)は、デフォルト候補が確定文字列とされたままでメインルーチンに戻る。他候補が選択された場合(ステップ#204のYes)は、確定文字列("may")が他候補("May")で置き換えられ(ステップ#205)、メインルーチンに戻る。
【0019】
図6は、ステップ#11における内包単語処理のサブルーチンを示すフローチャートである。まず、ステップ#301において辞書の内包単語フィールドを参照し、内包単語の有無をチェックする。内包単語有りの場合は、ステップ#302で内包単語を他候補として選択可能に表示する。例えば登録単語"advised"に対応する変換単語の第1候補"advised"が確定文字列として表示されているときに、内包単語である第2候補"advise"を選択可能に表示する。
ここでいう「選択可能に表示」は、表示装置11の画面上において、他候補(内包単語)があることが分かるように表示すれば十分である。例えば入力文章中に表示されるデフォルト候補に近接して他候補を表示してもよいし、離れた場所に表示してもよい。他候補の選択は例えば特別のキー(例えばスペースキー)を押下することによって行われる。2つ以上の他候補がある場合は、そのキーを複数回押下することによって選択対象の他候補が変わるようにすればよい。
【0020】
他候補選択のためのキー(例えばスペースキー)を押下しないで他のキー(文字や符号を入力するキー)が押下されれば、他候補が選択されなかったことになる。他候補が選択されなかった場合(ステップ#303のNo)は、そのままメインルーチンに戻る。他候補が選択された場合(ステップ#303のYes)は、ステップ#304で確定文字列の確定とその後のスペース(例えば"advised")が取り消される。そして、他候補(例えば"advise")を新たな確定文字列とし(ステップ#305)、その後にスペースを付加して(ステップ#306)メインルーチンに戻る。この例では、スペースで切り分けられた後続の入力文字列はすでに入力されている"d"から始まることになる。
次に、具体的な文章入力を例にとって説明を加える。文章の一例として、英文"Thisis the first time I have listened to jazz.It is fantastic!"を入力する場合を考える。本発明の文章入力支援システムを用いる場合に作業者はキーボードから"thisisthefirsttimeihavelistenedtojazz.itisfantastic!"と入力すればよい。
なお、説明を簡単にするために以下の条件を設定する。ただし、この条件は自由に設定可能である。一行当たり入力可能な文字数は小文字30個に相当する。文字以外の符号は小文字と同じく1文字分の幅に相当し、大文字は小文字2個分の幅を占有する。文字ごとに幅を変えるプロポーショナルフォントは考慮しないで、全ての文字及び符号について上記の条件を満たすものとする。また、前述のワードラップ処理を実行し、段落の先頭にタブ(又はスペース)を挿入する処理は実行しないものとする。
【0021】
作業者が"t"から入力を始めて、"this"まで入力した時点で辞書の登録単語"this"と一致し、一致単語"this"が記憶される(図3のステップ#5)。続いて"i"が入力されると、それまでの入力文字列"thisi"で始まる登録単語が無いので、次回以降の文字入力でも登録単語に一致する可能性が無くなる。この時点で最後に一致した登録単語"this"が読み出されて確定文字列となる(図3のステップ#7)。そして、登録単語"this"に複数表記は無いので確定文字列"this"が最終的に確定し、その後にスペースが付加される(図3のステップ#10)。
また、登録単語"this"は内包単語も無いので、確定文字列"this"及びその後に付加されたスペースは変更されない(最終確定する)。そして、文の先頭であることが前述のようにして判別されるので、先頭文字が大文字にされる(図3のステップ#13)。ここまでの入力文章は、"This i"であり、"i"で始まる入力文字列に処理対象が移行する。このとき、一致単語の記憶領域はクリアされる。
登録単語"i"が一致単語として記憶され、更に"s"が入力されると、入力文字列"is"に一致する登録単語が辞書で見つかるので、一致単語の記憶が"is"に更新される。この後、"isthe"まで入力された時点で登録単語に一致する可能性が無くなる。したがって、一致単語"is"が確定文字列となり、その後にスペースが付加される。この時点での入力文章は、"This is the"となっているが、処理対象の入力文字列はまだ"is"である。登録単語"is"は内包単語"i"を有するので、確定文字列"is"の他候補として"i"が選択可能に表示される(図6のステップ#302)。
【0022】
作業者が"i"を選択せずに(無視して)次の文字"f"を入力すると、処理対象の入力文字列が"the"に移り、一致単語"the"が記憶されると共に入力文字列が"thef"になる。更に"i"が入力されて入力文字列が"thefi"になった時点で登録単語に一致する可能性が無くなる。したがって、一致単語"the"が確定文字列となり、その後にスペースが付加される。登録単語"the"は内包単語が無いので、処理対象の入力文字列が"fi"に移行し、一致単語の記憶領域がクリアされる。この時点での入力文章は、"This is the fi"となっている。
同様の処理が繰り返されて、"This is the first time i"までの文章が入力され、現在の処理対象が"i"から始まる入力文字列にあるとする。登録単語"i"が一致単語として記憶された後、入力文字列が"iha"まで入力された時点で登録単語に一致する可能性が無くなる。したがって一致単語"i"が確定文字列となり、辞書の変換単語"I"に置き換えられた後、スペースが付加される。この時点での入力文章は、"This is the first time I ha"であり、処理対象の入力文字列は"ha"となっている。
入力文字列が"have"になった時点で一致単語"have"が記憶される。更に入力文字列が"havelis"になった時点で登録単語に一致する可能性が無くなるので、一致単語"have"が確定文字列となり、スペースが付加される。この時点での入力文章は、"This is the first time I have lis"であり、処理対象の入力文字列は"lis"となっている。このとき、前述の条件として設定した1行当たりの文字数30を超えるので、ワードラップ処理により、入力文字列"lis"以降の表示は2行目に移される。
【0023】
同様の処理が繰り返されて、"This is the first time I have(改行)listened to jazz"までの文章が入力され、現在の処理対象の入力文字列が"jazz"であるとする。次に終止符(ピリオド)が入力されると、"jazz"はそのまま確定文字列となり(図4のステップ#101)、続けて終止符が表示される(図4のステップ#102)。さらに、スペースが2個自動的に付加される(図4のステップ#104及び#106)。この時点での入力文章は"This is the first time I have(改行)listened to jazz."である。前述のように、次の入力文字列が文頭であることを示すフラグがセットされる。
次の文章についても同様の入力支援処理が行われ、"This is the firsttime I have(改行)listened to jazz. It is fanta"まで入力された時点で、2行目が1行当たりの文字数30を超えるので、現在の処理対象である入力文字列"fanta"が3行目に移行する。また、"fan"まで入力された時点で登録単語"have"が一致単語として記憶され、"fantast"まで入力された時点で一致単語の記憶が登録単語"fantast"に更新される。更に"fantastic"まで入力された時点で一致単語の記憶が登録単語"fantastic"に更新される。
【0024】
この例では、次の感嘆符(!)が入力された時点で、感嘆符(!)を除く入力文字列"fantastic"が確定し、その後に感嘆符(!)が表示される(図4のステップ#101及び#102)。なお、この例と異なるが、入力文字列"fantastic"の後に文字入力が続く場合は、登録単語に一致する可能性が無くなった時点で最後の一致単語"fantastic"が読み出されて確定文字列となると共に、内包単語"fan"及び"fantast"が他候補として選択可能に表示されることになる。
確定文字列"fantastic"の後に感嘆符(!)が表示されたのち、ダブルスペースが自動的に付加される(図4のステップ#104及び#106)が、前述のように文章入力が終了したときに最後のダブルスペースは削除される。こうして、作業者がキーボードから入力した文字列"thisisthefirsttimeihavelistenedtojazz.itisfantastic!"が、所定形式の文章"This is the first time I have(改行)listened to jazz. It is(改行)fantastic!"に変換され、表示装置11の画面上に表示される。
以上に説明したように、本発明の文章入力支援システムでは、スペースなしで連続入力された文字列を辞書の登録単語と照合することによって単語の切れ目を判断してスペースを自動挿入する。このとき、最も長い単語をデフォルトの確定文字列(単語)として採用する。そして、確定文字列に短い登録単語(内包単語)が含まれる場合は、内包単語を他候補として選択可能に表示して、作業者の選択又は非選択を待って確定文字列の最終的な確定を行う。
【0025】
しかし、確定文字列に内包単語がある場合の変換候補の選択を、ある程度自動的に行うことも可能である。一例として、後続の入力文字列との関係で内包単語を含む変換候補の中から適切な候補を自動的に選択する方法を簡単に説明する。
例えば、"our section"を意識して"oursection"という文字列を入力する場合に、"oursec"まで入力された時点で登録単語に一致する可能性が無くなり、"ours"が確定する。この確定文字列"ours"は内包単語"our"を有する。そこで、後続の入力文字列を処理する際に、"ours"で区切られた場合の"ec"で始まる入力文字列だけでなく、"our"で区切られた場合の"sec"で始まる入力文字列についても並行して評価する。その結果、前者の"ec"で始まる場合は、"ecti"まで入力した時点で登録単語に一致する可能性が無くなり、一致単語が記憶されていないのでエラーになってしまう。後者の"sec"で始まる場合は、登録単語"section"が辞書に見つかる。こうして、"our section"が適切な区切りとして最終的に確定する。上記の方法の場合に、例えば"our sport"を意識して"oursport"という文字列を入力する場合は、"ours port"が正しい区切りとして認識されることになる。このような場合に、後の文字列が長いほうを優先して選択するようにしてもよい。つまり、"ours port"ではなく、"our sport"を適切な区切りとして自動選択する。一般に、後の文字列が長いほうを優先して選択するほうが正しい区切りになる確率が高いことが分かっている。
【0026】
その他の方法として、辞書に登録単語の品詞や他の単語との結合の情報を登録しておき、直前又はそれ以前の確定文字列との関係に基づいて内包単語を含む変換候補の中から適切な候補を自動的に選択するようにしてもよい。
また、上記実施例では、作業者がタイプミスをした場合のエラーについては触れなかった。例えば、一致単語が記憶されていない(入力文字列の処理に先立ってクリアされたまま)の状態で、登録単語に一致する可能性が無くなったときは、タイプミスと判断して、エラー表示を行うことが可能である。ブザーや音声でタイプミスを知らせてもよい。作業者の選択を求める表示に際してもブザーによる報知を行ってもよい。
なお、本発明は上記実施形態に限らず、種々の形態で実施することが可能である。特に、文章入力支援システムのハードウエア構成については、標準キーボードを備えたコンピュータに限らず、ワードプロセッサ専用機であってもよいし、専用キーボードを備えた携帯端末等、文章入力が可能な任意の装置に本発明を適用することができる。
また、上記の実施形態では英語の文章入力を例にとって説明したが、本発明は英語に限らずドイツ語やフランス語等の種々の文章入力に適用することができる。要は、スペースで区切られた複数の単語からなる文章の入力であれば、本発明を適用可能である。
【0027】
産業上の利用可能性
以上のように、本発明に係る文章入力支援システムはワードプロセッサ等の文章入力機器に利用することができる。そして、英語やフランス語の文章のようにスペースで区切られた複数の単語からなる文章の入力に際して作業者が小文字を連続入力すれば、文章入力支援システムがスペースを自動生成し、適切な文章に変換する。
【0028】
【図面の簡単な説明】
図1は、本発明の実施形態に係る文章入力支援システムの概略構成を示すブロック図である。
図2は、文章入力支援システムに使用される辞書の一部を例示する図表である。
図3は、キーボードから文字又は符号が入力されるたびに実行される文章入力支援プログラムのメインルーチンの例を示すフローチャートである。
図4は、図3のメインルーチン中の符号入力処理サブルーチンを示すフローチャートである。
図5は、図3のメインルーチン中の複数表記処理サブルーチンを示すフローチャートである。
図6は、図3のメインルーチン中の内包単語処理サブルーチンを示すフローチャートである。

Claims (7)

  1. 文章入力に用いられるキーボードと、入力された文字列及び文章を表示するための表示装置と、プログラム及びデータを記憶するための記憶装置と、前記キーボードを用いて入力された文字列を前記プログラムにしたがって処理する処理装置とを備え、スペースで区切られた複数の単語からなる文章の入力を支援する文章入力支援システムであって、
    文章入力に使用できる全ての単語が登録された辞書が前記データとして前記記憶装置に記憶され、前記処理装置は、入力された文字列と前記辞書に登録されている各単語とを先頭文字から順次照合して一致した単語を記憶しておき、入力された文字列が前記辞書に登録されているいずれの単語とも一致する可能性が無くなったときに、最後に一致した単語を確定文字列とすると共にその後にスペースを付加して後続の入力文字列と切り分ける処理を行い、かつ、
    前記辞書の各レコードは、登録単語のフィールドと、前記登録単語から変換される変換単語のフィールドと、前記登録単語が内包単語を有するか否かを示すフィールドとを備え、前記登録単語が前記内包単語を有するレコードの前記変換単語のフィールドには前記内包単語を含む複数の候補の単語が登録されており、
    前記処理装置は、前記確定文字列が前記内包単語を有する場合は、前記確定文字列を仮の確定文字列として処理することを特徴とする文章入力支援システム。
  2. 前記処理装置は、前記確定文字列を仮の確定文字列と判断したときは、前記仮の確定文字列の前記内包単語を前記辞書から取得し、前記内包単語を他候補として作業者が選択できるように前記表示装置に表示し、作業者が前記他候補を選択した場合は、前記仮の確定文字列とその後のスペースを取り消し、前記他候補を新たな確定文字列とすると共にその後にスペースを付加して後続の入力文字列と切り分けることを特徴とする請求項1記載の文章入力支援システム。
  3. 前記処理装置は、前記確定文字列を仮の確定文字列と判断したときは、前記辞書の前記変換単語のフィールドに登録された前記内包単語の後続文字列の前記辞書との照合による切り分け処理を、前記仮の確定文字列の後続文字列の切り分け処理と並行して行い、前記仮の確定文字列の後続文字列の切り分け処理がエラーになる場合は、前記仮の確定文字列とその後のスペースを取り消し、前記内包単語を新たな確定文字列とすると共にその後にスペースを付加して後続の入力文字列と切り分けることを特徴とする請求項1記載の文章入力支援システム。
  4. 符号が入力された場合に、前記処理装置は、前記符号を除く入力文字列を確定文字列とし、該確定文字列に続けて前記符号を表示することを特徴とする請求項1、2又は3記載の文章入力支援システム。
  5. 前記辞書の各レコードは、前記登録単語に対応して表記の異なる複数の変換単語が有るか否かを示す複数表記のフィールドを更に備え、
    前記処理装置は、前記登録単語に対応して表記の異なる複数の変換単語がある場合は、前記辞書から取得した複数の変換単語のうちの1つを確定文字列とすると共に、他の変換単語を他候補として作業者が選択できるように前記表示装置に表示し、作業者が前記他候補を選択した場合は、前記確定文字列を前記他候補で置き換えることを特徴とする請求項1、2、3又は4記載の文章入力支援システム。
  6. 文章入力に用いられるキーボードと、入力された文字列及び文章を表示するための表示装置と、プログラム及びデータを記憶するための記憶装置とを備えたコンピュータに、スペースで区切られた複数の単語からなる文章の入力を支援する処理を実行させるためのコン ピュータプログラムであって、
    文章入力に使用できる全ての単語が登録された辞書が前記データとして前記記憶装置に記憶され、前記辞書の各レコードは、登録単語のフィールドと、前記登録単語から変換される変換単語のフィールドと、前記登録単語が内包単語を有するか否かを示すフィールドとを備え、前記登録単語が前記内包単語を有するレコードの前記変換単語のフィールドには前記内包単語を含む複数の候補の単語が登録されており、前記コンピュータプログラムは、
    入力された文字列前記辞書に登録されている各単語とを先頭文字から順次照合して一致した単語を記憶しておくステップと、
    入力された文字列が前記辞書に登録されているいずれの単語とも一致する可能性が無くなったときに、最後に一致した単語を確定文字列とすると共にその後にスペースを付加して前記表示装置に表示するステップと
    前記確定文字列が前記内包単語を有する場合は、前記確定文字列を仮の確定文字列として処理するステップと
    を前記コンピュータに実行させることを特徴とするコンピュータプログラム。
  7. 文章入力に用いられるキーボードと、入力された文字列及び文章を表示するための表示装置と、プログラム及びデータを記憶するための記憶装置とを備えたコンピュータに、スペースで区切られた複数の単語からなる文章の入力を支援する処理を実行させるためのコンピュータプログラムが記憶されたコンピュータ読み取り可能な記憶媒体であって、請求項6記載のコンピュータプログラムが記録されていることを特徴とする記憶媒体。
JP2003504270A 2001-06-11 2001-06-11 スペースの自動生成によって文章入力を支援するシステム Expired - Fee Related JP4048169B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2001/004952 WO2002101578A1 (fr) 2001-06-11 2001-06-11 Systeme destine a assister la saisie de texte par production automatique d'espaces

Publications (2)

Publication Number Publication Date
JPWO2002101578A1 JPWO2002101578A1 (ja) 2004-09-30
JP4048169B2 true JP4048169B2 (ja) 2008-02-13

Family

ID=11737419

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003504270A Expired - Fee Related JP4048169B2 (ja) 2001-06-11 2001-06-11 スペースの自動生成によって文章入力を支援するシステム

Country Status (4)

Country Link
US (1) US7475009B2 (ja)
EP (1) EP1411442A4 (ja)
JP (1) JP4048169B2 (ja)
WO (1) WO2002101578A1 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7702560B1 (en) 2000-11-16 2010-04-20 International Business Machines Corporation System and method for interactive offer system
US8103574B2 (en) * 2000-11-29 2012-01-24 International Business Machines Corporation Online offer and bid management with sealed bids
US7475025B2 (en) * 2001-03-08 2009-01-06 International Business Machines Corporation Read-only user access for web based auction
US7801793B2 (en) 2001-03-29 2010-09-21 International Business Machines Corporation User-specified time-based proxy firing in online auctions
US7818304B2 (en) 2005-02-24 2010-10-19 Business Integrity Limited Conditional text manipulation
GB2423612A (en) * 2005-02-24 2006-08-30 Business Integrity Ltd Conditional text manipulation
KR100735308B1 (ko) 2005-08-30 2007-07-03 경북대학교 산학협력단 단문 메시지에 대한 자동 띄어쓰기 프로그램이 기록된 기록매체
JP5438909B2 (ja) 2008-03-14 2014-03-12 ソニーモバイルコミュニケーションズ株式会社 文字入力装置、文字入力支援方法及び文字入力支援プログラム
WO2012047955A1 (en) * 2010-10-05 2012-04-12 Infraware, Inc. Language dictation recognition systems and methods for using the same
US8843845B2 (en) 2012-10-16 2014-09-23 Google Inc. Multi-gesture text input prediction
US8832589B2 (en) 2013-01-15 2014-09-09 Google Inc. Touch keyboard using language and spatial models
US10572586B2 (en) * 2018-02-27 2020-02-25 International Business Machines Corporation Technique for automatically splitting words
JP7481999B2 (ja) * 2020-11-05 2024-05-13 株式会社東芝 辞書編集装置、辞書編集方法及び辞書編集プログラム

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5262948A (en) * 1984-07-18 1993-11-16 Canon Kabushiki Kaisha Word processor
US5369577A (en) * 1991-02-01 1994-11-29 Wang Laboratories, Inc. Text searching system
JPH0540750A (ja) 1991-08-06 1993-02-19 Sharp Corp 自動単語区切り挿入回路
JPH06168243A (ja) 1992-11-30 1994-06-14 Matsushita Electric Ind Co Ltd 綴り誤り訂正方法および綴り誤り訂正装置
US5448474A (en) * 1993-03-03 1995-09-05 International Business Machines Corporation Method for isolation of Chinese words from connected Chinese text
DE69429643T2 (de) * 1993-08-31 2002-09-12 Mitsuhiro Aida Verfahren zur Texteingabe
JPH0877173A (ja) * 1994-09-01 1996-03-22 Fujitsu Ltd 文字列修正システムとその方法
US5806021A (en) * 1995-10-30 1998-09-08 International Business Machines Corporation Automatic segmentation of continuous text using statistical approaches
JP2001505330A (ja) * 1996-08-22 2001-04-17 ルノー・アンド・オスピー・スピーチ・プロダクツ・ナームローゼ・ベンノートシャープ テキストストリーム中の単語の切れ目を与える方法及び装置
JP2806452B2 (ja) 1996-12-19 1998-09-30 オムロン株式会社 かな漢字変換装置および方法、並びに記録媒体
JPH1153384A (ja) * 1997-08-05 1999-02-26 Mitsubishi Electric Corp キーワード抽出装置及びキーワード抽出方法並びにキーワード抽出プログラムを格納したコンピュータ読み取り可能な記録媒体

Also Published As

Publication number Publication date
JPWO2002101578A1 (ja) 2004-09-30
US20040123248A1 (en) 2004-06-24
EP1411442A1 (en) 2004-04-21
WO2002101578A1 (fr) 2002-12-19
US7475009B2 (en) 2009-01-06
EP1411442A4 (en) 2010-03-03

Similar Documents

Publication Publication Date Title
KR100641838B1 (ko) 심벌문자를 이용한 다국언어 문자 입력 방법 및 문자 입력시스템
US8726148B1 (en) Method and apparatus for processing text and character data
US4459049A (en) Abbreviated typing with special form display
JP4048169B2 (ja) スペースの自動生成によって文章入力を支援するシステム
JPH113338A (ja) 多言語入力システム、多言語入力方法及び多言語入力プログラムを記録した記録媒体
CN103026318A (zh) 输入法编辑器
JP2013117978A (ja) タイピング効率向上のためのタイピング候補の生成方法
KR100947401B1 (ko) 전자 통신 장치로의 텍스트 입력
US5890183A (en) Method, apparatus, electronic dictionary and recording medium for converting converted output into character code set accetpable for re-retrieval as original input
JP4787803B2 (ja) 情報処理装置と情報処理方法とプログラム
EP2031490A2 (en) Electronic dictionary, search method for and electronic dictionary, and search program for an alectronic dictionary
JP6720274B2 (ja) 入力支援プログラム、入力支援方法および入力支援装置
US20080131031A1 (en) Handheld electronic device with diacritical selection and text disambiguation
JP4050745B2 (ja) 文章入力システム
JP2002207728A (ja) 表音文字生成装置及びそれを実現するためのプログラムを記録した記録媒体
JP7554531B1 (ja) 新規呼出文字列登録プログラム、新規呼出文字列登録装置および新規呼出文字列登録方法
JPH045224B2 (ja)
JPH10320399A (ja) 言語識別装置,言語識別方法および言語識別のプログラムを記録した記録媒体
JP3814000B2 (ja) 文字列変換装置および文字列変換方法
JPH1166061A (ja) 情報処理装置および情報処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2006012188A (ja) 文書処理方法及び装置
JP2001109740A (ja) 中国語文書作成装置及び中国語文書作成方法
JPH10198664A (ja) 日本語入力システム及び日本語入力プログラムを記録した媒体
JP2002082940A (ja) 韓国語の入力支援方法およびその方法を用いた韓国語入力用のプログラム記録媒体
JP2702443B2 (ja) 日本語入力装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050519

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20051003

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20051004

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20051003

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20060112

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20060113

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070904

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071015

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20071120

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20071126

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101130

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101130

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111130

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111130

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111130

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121130

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121130

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121130

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121130

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131130

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R255 Notification that request for automated payment was rejected

Free format text: JAPANESE INTERMEDIATE CODE: R2525

LAPS Cancellation because of no payment of annual fees