WO2002101578A1 - Systeme destine a assister la saisie de texte par production automatique d'espaces - Google Patents

Systeme destine a assister la saisie de texte par production automatique d'espaces Download PDF

Info

Publication number
WO2002101578A1
WO2002101578A1 PCT/JP2001/004952 JP0104952W WO02101578A1 WO 2002101578 A1 WO2002101578 A1 WO 2002101578A1 JP 0104952 W JP0104952 W JP 0104952W WO 02101578 A1 WO02101578 A1 WO 02101578A1
Authority
WO
WIPO (PCT)
Prior art keywords
character string
input
word
registered
text
Prior art date
Application number
PCT/JP2001/004952
Other languages
English (en)
French (fr)
Inventor
Hiroshi Ishikura
Original Assignee
Hiroshi Ishikura
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hiroshi Ishikura filed Critical Hiroshi Ishikura
Priority to EP01936967A priority Critical patent/EP1411442A4/en
Priority to JP2003504270A priority patent/JP4048169B2/ja
Priority to PCT/JP2001/004952 priority patent/WO2002101578A1/ja
Priority to US10/467,212 priority patent/US7475009B2/en
Publication of WO2002101578A1 publication Critical patent/WO2002101578A1/ja

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/274Converting codes to words; Guess-ahead of partial word inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Definitions

  • This invention is designed to automatically convert a sentence consisting of multiple words separated by spaces, such as English or French sentences, into a correct sentence containing spaces by simply inputting lowercase letters. It relates to an input support system. Background art
  • the Japanese language code processor uses a keyboard such as the one described above to enter kana and kanji-containing sentences, using romaji conversion and kana kanji. Input methods such as conversion have been developed and widely used. Such a program specializing in Japanese input support is sometimes called a Japanese front-end processor (FEP).
  • FEP Japanese front-end processor
  • the present invention takes into consideration the above-mentioned problems, and when inputting a sentence composed of a plurality of words separated by spaces, such as an English or French sentence, It is an object of the present invention to provide a text input support system that automatically converts a text into a text containing a space by simply inputting lowercase letters by a trader. Disclosure of the invention
  • a text input support system includes a keyboard used for text input, a display device for displaying an input character string and text, a storage device for storing programs and data, and a keyboard. And a processing device that processes the input character string according to a program in accordance with a program.
  • a text input support system that supports input of a text composed of a plurality of words separated by spaces, all of the text input support that can be used for text input are provided.
  • the dictionary in which the words are registered is stored in the storage device as data, and the processing device sequentially matches the input character string with each word registered in the dictionary from the first character and stores the matched word. When there is no longer any possibility that the input character string matches any of the words registered in the dictionary, the last matching word is regarded as the confirmed character string. It is characterized by adding a space after it and separating it from the subsequent input character string.
  • the processing device sets the input character string excluding the code as a determined character string, and displays the code following the determined character string.
  • a code such as a comma, a period, or a quotation mark
  • the processing device sets the input character string excluding the code as a determined character string, and displays the code following the determined character string.
  • a code is input, a fixed character string is determined without referring to the dictionary.
  • the dictionary has a field for registered words and a field for converted words. The device performs a process of replacing the determined character string with a converted word corresponding to the registered word.
  • the processing device makes one conversion word a definitive character string and allows the operator to select another conversion word as another candidate. It is displayed on the display device, and when the operator selects another candidate, it is preferable to replace the confirmed character string with another candidate. For example, this corresponds to the case where there are two conversion words “may” and “May” for the registered word “may”. By using the operator's selection together, the accuracy of the generated text can be expected.
  • the processing device displays the included word on the display device so that the worker can select the word as another candidate.
  • the operator selects another candidate, the finalized character string and the space after it are canceled, the other candidate becomes a new finalized character string, and a space is added after that to separate it from the subsequent input character string. .
  • this corresponds to the case where the confirmed character string '' advisedly 'includes another registered word' advised '. In this case, too, by using the operator's selection together, Accuracy can be assured.
  • the text input support system of the present invention as described above is, for example, a general computer system (personal computer, workstation, etc.) Then, it is realized by installing a software program (text input support program) that performs the above processing. Further, such a program can be stored in a storage medium such as a CD-ROM, an FD, a memory card and the like, distributed, and installed in a computer system.
  • FIG. 1 is a block diagram showing a schematic configuration of a text input support system according to an embodiment of the present invention.
  • FIG. 2 is a chart exemplifying a part of a dictionary used in the text input support system.
  • FIG. 3 is a flowchart showing an example of a main routine of the text input support program executed each time a character or code is input from the keyboard.
  • FIG. 4 is a flowchart showing a code input processing subroutine in the main routine of FIG.
  • FIG. 5 is a flowchart showing a multiple notation processing subroutine in the main routine of FIG.
  • FIG. 6 is a flowchart showing an included word processing subroutine in the main routine of FIG.
  • the text input support system 1 is composed of a display device 11, a keyboard 12, a mouse 13, a printer 14, a processing device 15, A main memory 16, a fixed disk device 17, and a removable disk device 18 are provided.
  • the display device 11 is composed of a CRT (cathode ray tube), an LCD (liquid crystal display), and the like, and is used for displaying a screen such as an input character string or text.
  • the key board 12 is used for inputting sentences (character strings).
  • the mouse 13 is used to assist in inputting a sentence and selecting a conversion candidate, but is not essential to the sentence input support system 1.
  • a keyboard 1 2 is enough.
  • the printer 14 is used for, for example, printing out the prepared text.
  • Processor 1 5 with respect to this sentence input support system, and processed according to the text input support program that later the input character string, also c generates a predetermined sentence, the entire sentence input support system 1
  • the processor 15 is also mainly responsible for control.
  • the main memory 16 is a semiconductor memory, and is used for loading a program executed by the processor 15 and temporarily storing data.
  • the fixed disk device 17 and the removable disk device 18 are so-called auxiliary storage devices.
  • the fixed disk device 17 is used for storing programs and data.
  • the removable disk device 18 is mainly used for backup of program installation and data, and is constituted by an optical disk device or a magneto-optical disk device.
  • the text input support system 1 as described above can be composed of a general computer system (particularly a personal computer system) and a dedicated text input support program (software).
  • the sentence input support program is provided by being recorded in a storage medium 19 such as a CD-ROM, for example, and is installed in a fixed disk device 17 via a removable disk device 18.
  • a storage medium 19 such as a CD-ROM, for example
  • a communication device provided in a computer system
  • a method is also possible in which a predetermined text input support program is downloaded from another computer or a network server connected via the PC and installed on the fixed disk device 17.
  • a dictionary used in the text input support system 1 will be described as one of data stored in the fixed disk device 17.
  • English text input is used as an example.
  • This dictionary contains all words that can be used for text input. Variations of verbs and plural forms of nouns are also registered in the dictionary. For example, if "boo k" is registered, its plural form “boo ks" is also registered.
  • Fig. 2 shows a part of the dictionary.
  • the dictionary has a registered word field and a converted word field.
  • the registered word is a character string consisting only of lowercase letters, and the converted characters may be mixed with uppercase letters.
  • the first letter in uppercase is registered as a conversion character.
  • a conversion word “Chicago” is registered corresponding to the registered word “Chi cago”.
  • the registered word “may” has two conversion words “may” and “May” having different notations.
  • the former is the first candidate and the latter is Is registered in the conversion word field as a second candidate. If there are three or more conversion words, the third and subsequent candidates are also registered.
  • the dictionary has a plurality of notation fields indicating whether there are a plurality of conversion words having different notations. For example, in the record of the conversion word "may”, the multiple notation field is "Yes”. In the record for the conversion word "Chicago”, the multiple notation field is "None".
  • one of the candidates is adopted as a default confirmed character string.
  • Other candidates are displayed on the display device 11 so that the operator can select them. If the operator selects another candidate, the confirmed character string is replaced with another candidate.
  • the lowercase character string "may” is the default confirmed character string and "May” is displayed as another candidate.
  • the registered word "advised” contains other registered words in it.
  • Determining the default confirmed character string as described above is only an example.
  • the algorithm can be configured to adopt a frequently used character string as a default confirmed character string.
  • FIG. 3 is a flowchart showing an example of a main no-retin of a text input support program executed each time a character or code is input from the keyboard.
  • step # 1 of FIG. 3 it is determined whether to input a code or a character. If it is a sign input (Yes in step # 1), the subroutine for sign input processing in step # 2 (described later with reference to FIG. 4) is executed, and then the process proceeds to step # 12.
  • Step # 3 If it is not a sign input, that is, if it is a character input (No in Step # 1), the input character string so far is compared with the registered words in the dictionary (Step # 3). If there is a registered word that matches the input character string (hereinafter referred to as “matching word”) (Yes in step # 4), the matching word is stored (updated) (step # 5) and the processing routine ends. For example, if the input string so far is "advise”, the matching word "advise” is stored, but this does not mean that the string is determined. The next time the letter "d" is entered, the memory of the matched word is updated to '' advised '. The registered word that matches later (the last matching word) will be stored. When the character "_" is subsequently input, the input string up to the present
  • step # 6 If a character other than the character "y" is entered following the input of the character "1", there is no possibility that the registered word will match in the next and subsequent character inputs. After proceeding to Yes in step # 6, proceed to step # 7 In step # 7, the memory of the last registered word (last matching word) is read out and used as a confirmed character string. Then, the "advised" power S becomes the determined character system IJ.
  • the conversion word "advised” corresponding to the registered word “advised” is replaced as a confirmed character string.
  • the fixed string “advi sed” there is no change.
  • step # 9 a subroutine for multiple notation processing is executed. This subroutine will be described later with reference to FIG. Then, in step # 10, a space is added after the confirmed character string to separate it from the subsequent input character string. Subsequently, after executing the subroutine of the inclusive word processing in step # 11, the process proceeds to step # 12. This subroutine will be described later with reference to FIG.
  • step # 12 it is determined whether or not the final character string is the first character string of the sentence. This is a code that is entered at the end of the sentence (such as a terminator or a question mark). Can be determined by setting a flag at the point when is input. This flag is also set at the start of text input. If the final character string is not the first character string of the sentence, the processing routine ends without doing anything. If the final character string is the first character string, the first character is capitalized in step # 13. At this time, the above flag is reset. Then, the processing routine ends.
  • FIG. 4 is a flowchart showing a subroutine of the code input process in step # 2 of FIG.
  • the input character string excluding the input sign is defined as a confirmed character string.
  • a sign is displayed following the confirmed character string.
  • processing for adding a space after the input code as necessary is performed.
  • a double space is added between sentences, that is, after a terminating code, and a single space is added after a break in the middle of the sentence, that is, after a comma or the like.
  • the entered code is a sentence terminator such as a terminator or question mark (Yes in step # 103)
  • the input code is a code that separates the middle of the sentence such as a comma or a semicolon (No in Step # 103 to Yes in Step # 105)
  • the process returns to the main routine without adding a space.
  • a line break to change a paragraph is performed by the operator pressing the line feed key. In this case, the double space inserted after the end of the sentence is deleted.
  • Word wrapping is the process of sending a word to the next line when the line ends in the middle of one word.
  • Prohibition processing refers to the process of avoiding the beginning of a line with a character such as a period or a comma, and displaying those characters beyond the specified number of characters at the end of the previous line.
  • FIG. 5 is a flowchart showing a subroutine of plural notation processing in step # 9 of FIG.
  • step # 201 the presence or absence of multiple notations is checked by referring to the multiple notation field of the dictionary. If there is more than one notation, the default candidate is set as a fixed character string in step # 202, and other candidates are displayed as selectable in step # 203. For example, the first candidate "may" of the conversion word corresponding to the registered word "may” is set as a confirmed character string, and the second candidate "May” is displayed so as to be selectable.
  • the “selectable display” here is sufficient if it is displayed on the screen of the display device 11 so that it can be understood that there is another candidate (other notation). For example, another candidate may be displayed close to the default candidate displayed in the input text, or may be displayed at a remote place. Selection of another candidate is performed by, for example, pressing a special key (for example, a space key). If there are two or more alternatives, pressing the key multiple times will change the alternatives to be selected.
  • a special key for example, a space key
  • step # 204 If another key (key for inputting a character or a sign) is pressed without pressing a key for selecting another candidate (for example, a space key), it means that another candidate was not selected. If no other candidate is selected (No in step # 204), the main rule is left with the default candidate as the fixed character string. Return to Chin. If another candidate is selected (Yes in step # 204), the confirmed character string ("may") is replaced by another candidate (" May") (step # 205) and the process returns to the main routine. .
  • FIG. 6 is a flowchart showing a subroutine of the inclusive word processing in step # 11.
  • the inclusion word field of the dictionary is referenced to check for inclusion words. If there is an inclusive word, in step # 302, the inclusive word is displayed so that it can be selected as another candidate. For example, the first candidate of the conversion word corresponding to the registered word "advised"
  • “selectable display” here on the screen of the display device 11 so that it is possible to recognize that there is another candidate (inclusive word).
  • another candidate may be displayed close to the default candidate displayed in the input text, or may be displayed at a remote place.
  • Selection of another candidate is performed by, for example, pressing a special key (for example, a space key). If there are two or more alternatives, pressing the key multiple times will change the alternatives to be selected.
  • step # 303 If another key (key for inputting a character or a sign) is pressed without pressing a key for selecting another candidate (for example, a space key), it means that another candidate was not selected. If no other candidate is selected (No in step # 303), the process returns to the main routine. If another candidate is selected (Yes in step # 303), the confirmation of the confirmed string and the space after it (such as "advised") are canceled in step # 304. Then, another candidate (for example, "advise”) is set as a new confirmed character string (step # 305), followed by a space (step # 306) to return to the main routine.
  • the following input characters are separated by spaces: The columns will start with the already entered "d".
  • the following conditions are set to simplify the explanation. However, this condition can be set freely.
  • the number of characters that can be entered per line is equivalent to 30 lowercase characters. Codes other than letters correspond to the width of one character as in lowercase letters, and uppercase letters occupy the width of two lowercase letters.
  • the above conditions shall be satisfied for all characters and signs, without taking into account a proportional font that changes the width for each character.
  • the word wrapping process described above is executed. The process of inserting a tab (or space) at the beginning of a paragraph is not executed.
  • a character string continuously input without a space is compared with a registered word in a dictionary to determine a break between words, and a space is automatically determined. insert. At this time, the longest word is adopted as the default confirmed character string (word). If the confirmed character string contains a short registered word (inclusive word), the inclusive word is displayed as another candidate so that it can be selected. Make a decision.
  • the error when the operator makes a typo was not mentioned. For example, if the matching word is not stored (input characters If it is no longer possible to match a registered word in the state (cleared before processing the column), it is possible to judge it as a typo and display an error.
  • the typo may be notified by a buzzer or voice.
  • a buzzer may also be used to notify the operator of the selection.
  • the present invention is not limited to the above embodiment, but can be implemented in various forms.
  • the hardware configuration of the text input support system is not limited to a computer equipped with a standard keyboard, but may be a dedicated word processor or a mobile terminal equipped with a dedicated keyboard.
  • the present invention can be applied to an apparatus.
  • the present invention is not limited to English, but can be applied to input of various sentences such as German and French.
  • the point is that the present invention can be applied to the input of a sentence composed of a plurality of words separated by spaces.
  • the text input support system can be used for a text input device such as a card processor. Then, when inputting sentences consisting of multiple words separated by spaces, such as English or French sentences, if the operator continuously inputs lowercase letters, the sentence input support system automatically generates a space, and an appropriate sentence is created. Convert to

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)
  • Input From Keyboards Or The Like (AREA)

Description

明 細 書 スペースの自動生成によって文章入力を支援するシステム 技術分野
この発明は、 英語やフランス語の文章のようにスペースで区切られた 複数の単語からなる文章を入力する際に、 作業者が小文字を連続入力す るだけでスペースを含む正しい文章に自動変換する文章入力支援システ ムに関する。 背景技術
近年、 コンピュータ技術の進展に伴い、 文章をコンピュータ (ワード プロセッサ専用機を含む) を用いて入力する機会が多くなつてきている, このような文章入力は、 複数のキースィツチが所定の規則に沿って配列 されたキーボードを用いて行われることが多い。 このキーボード配列の 基本は英文タイプライターの配列に遡ることができ、 コンピュータを用 いた英語ゃフランス語等の文章入力も基本的には英文タイプの入力方法 が踏襲されている。
つまり、 単語のスペルにしたがってキーボード上の対応する文字のキ 一を順次押下し、 単語と単語の間にはスペースキーを押下する。 また、 文章の始まりや固有名詞 (ドイツ語では全ての名詞) の先頭の文字を大 文字にするためにシフトキーを文字キーと共に押下する。 更に、 必要に 応じてカンマ、 ピリオド (終止符)、 クォーテーションマーク (引用 符) 等の符号キーを押下する。
日本語ヮードプロセッサにあっては、 上記のようなキーボードを用い て仮名及び漢字を含む文章を入力するために、 ローマ字変換や仮名漢字 変換等の入力方法が開発され広く用いられている。 このような日本語入 力の支援に特化したプログラムを日本語フロントェンドプロセッサ (F E P ) と呼ぶことがある。
一方、 欧米の言語、 特に英語の入力は原則としてキーボード上の英数 字に対応するキーを用いて変換処理を行うことなく文章を入力すること ができる。 ドイツ語やフランス語等で使用される特殊文字は、 複数キー の組合せで入力し、 又は、 文字一覧表から選択して入力することが多い, このため、 欧米の言語のワードプロセッサでは、 日本語フロントエンド プロセッサのような文字列の変換を含む文章入力支援プログラムの必要 性が少ない。
しかし、 キーボードを用いた英語やフランス語等の文章入力を学習す る人にとって、 上記のような大文字と小文字との区別やスペースの入力 は余計な労力に感じられることがある。 つまり、 口頭で文章を生成する ときのように、 大文字と小文字の区別やスペース (単語の区切り) を意 識することなく、 小文字を連続して入力すれば正しい文章に変換してく れる支援システムがあれば便利である。 このような文章入力支援システ ムは、 例えば上記の日本語フロントェンドプロセッサが起動している状 態で英文等の入力を行う場合にも便利な機能となるであろう。
また、 最近は携帯電話や携帯端末の普及に伴い、 従来から用いられて いるキーボードとは異なる配列及び少ないキー数のキーボードゃダイヤ ル等の新たな文字入力手段を用いて文章を入力する機会が増えつつある, このような入力手段を用いて、 キーボードに慣れていない作業者が英語 ゃフランス語等の文章入力を行う際にも、 大文字と小文字の区別ゃスぺ ースを意識させない文章入力支援システムが役立つであろう。
本発明は、 上記のような課題を考慮し、 英語やフランス語の文章のよ うにスペースで区切られた複数の単語からなる文章を入力する際に、 作 業者が小文字を連続入力するだけでスペースを含む文章に自動変換する 文章入力支援システムを提供することを目的とする。 発明の開示
本発明による文章入力支援システムは、 文章入力に用いられるキーボ ードと、 入力された文字列及び文章を表示するための表示装置と、 プロ グラム及びデータを記憶するための記憶装置と、 キーボードを用いて入 力された文字列をプログラムにしたがって処理する処理装置とを備え、 スペースで区切られた複数の単語からなる文章の入力を支援する文章入 力支援システムにおいて、 文章入力に使用できる全ての単語が登録され た辞書がデータとして記憶装置に記憶され、 処理装置は、 入力された文 字列と辞書に登録されている各単語とを先頭文字から順次照合して一致 した単語を記憶しておき、 入力された文字列が辞書に登録されているい ずれの単語とも一致する可能性が無くなったときに、 最後に一致した単 語を確定文字列とすると共にその後にスペースを付加して後続の入力文 字列と切り分けることを特徴とする。
このような文章入力支援システムを利用すれば、 作業者は小文字を連 続入力するだけでよく、 システムが単語の区切りを判断してスペースを 自動生成する。 なお、 文頭の文字を大文字にする処理は公知であり、 こ の処理を本システムの処理と組み合わせることによって、 作業者は大文 字と小文字の区別やスペースを意識せずに英語やフランス語等の文章入 力を行うことができる。
好ましくは、 カンマ、 ピリオド、 クォーテーションマーク等の符号が 入力された場合に、 処理装置は、 符号を除く入力文字列を確定文字列と し、 該確定文字列に続けて符号を表示する。 このような処理を行うこと 'により、 符号が入力された場合は辞書を参照せずに確定文字列を決定す ることができる。 また、 文字と符号とを組み合わせた単語を辞書に登録 する必要がなくなるので、 辞書の記憶に必要なメモリ容量が少なくなる また、 辞書は登録単語のブイールドと変換単語のフィールドとを有し. 処理装置は、 確定文字列を登録単語に対応する変換単語で置き換える処 理を行う。 例えば、 登録単語" Chri st "に対応する変換単語" Chri st " が登録されている。 上記の処理により、 固有名詞のように大文字を含む 単語に関しても、 小文字のみの文字列 (登録単語) を入力すれば大文字 を含む正しい文字列 (変換単語) に自動変換される。
更に、 登録単語に対応して表記の異なる複数の変換単語がある場合に. 処理装置は、 1つの変換単語を確定文字列とすると共に他の変換単語を 他候補として作業者が選択できるように表示装置に表示し、 作業者が他 候補を選択した場合は、 確定文字列を他候補で置き換えることが好まし レ、。 例えば、 登録単語" may "に対して 2つの変換単語" may"と" May"が ある場合がこれに該当する。 作業者の選択を併用することにより、 生成 する文章の正確さを期すことができる。
また、 確定文字列の中に、 辞書に登録された他の単語が内包されてい る場合に、 処理装置は、 その内包されている単語を他候補として作業者 が選択できるように表示装置に表示し、 作業者が他候補を選択した場合 は、 確定文字列の確定とその後のスペースを取り消し、 他候補を新たな 確定文字列とすると共にその後にスペースを付加して後続の入力文字列 と切り分ける。 例えば、 確定文字列' ' advisedly"が他の登録された単 語" advi sed "を内包している場合がこれに該当する。 この場合も作業 者の選択を併用することにより、 生成する文章の正確さを期すことがで きる。
上記のような本発明の文章入力支援システムは、 例えば一般的なコン ピュータシステム (パーソナルコンピュータやワークステーション等) に、 上述のような処理を行わせるソフトウェアプログラム (文章入力支 援プログラム) をインス トールすることによって実現される。 また、 そ のようなプログラムは、 C D— R O M、 F D、 メモリカード等の記憶媒 体に記憶して流通させ、 コンピュータシステムへのインス トールを行う ことができる。 図面の簡単な説明
図 1は、 本発明の実施形態に係る文章入力支援システムの概略構成を 示すブロック図である。
図 2は、 文章入力支援システムに使用される辞書の一部を例示する図 表である。
図 3は、 キーボードから文字又は符号が入力されるたびに実行される 文章入力支援プログラムのメインルーチンの例を示すフローチヤ一トで ある。
図 4は、 図 3のメインルーチン中の符号入力処理サブルーチンを示す フローチヤ一トである。
図 5は、 図 3のメインルーチン中の複数表記処理サブルーチンを示す フローチヤ一トである。
図 6は、 図 3のメインルーチン中の内包単語処理サブルーチンを示す フローチャートである。
発明を実施するための最良の形態
添付の図面に従って、 本発明をより詳細に説明する。
まず、 本発明の実施形態に係る文章入力支援システムの概略構成を図 1のブロック図に沿って説明する。 文章入力支援システム 1は、 表示装 置 1 1、 キーボード 1 2、 マウス 1 3、 プリンタ 1 4、 処理装置 1 5、 主メモリ 1 6、 固定ディスク装置 1 7、 及びリムーバブルディスク装置 1 8を備えている。
表示装置 1 1は、 C R T (陰極線管)、 L C D (液晶ディスプレイ) 等で構成され、 入力された文字列や文章等の画面表示に用いられる。 キ 一ボード 1 2は、 文章 (文字列) の入力等に用いられる。 マウス 1 3は, 文章入力や変換候補の選択等に補助的に用いられるが、 文章入力支援シ ステム 1に必須ではない。 キーボード 1 2があれば十分である。 プリン タ 1 4は、 作成された文章の印字出力等に用いられる。 処理装置 1 5は, この文章入力支援システムに関して言えば、 入力された文字列を後述す る文章入力支援プログラムにしたがって処理し、 所定の文章を生成する c また、 文章入力支援システム 1の全体の制御についても、 処理装置 1 5 が主として司る。
主メモリ 1 6は半導体メモリであり、 処理装置 1 5が実行するプログ ラムのロードやデータの一時記憶等に用いられる。 固定ディスク装置 1 7及びリムーバブルディスク装置 1 8はいわゆる補助記憶装置である。 固定ディスク装置 1 7はプログラムやデータの保存に用いられる。 リム 一バブルディスク装置 1 8は、 主としてプログラムのィンス トールゃデ ータのバックアップ等に用いられ、 光ディスク装置又は光磁気ディスク 装置で構成される。
上記のような文章入力支援システム 1は、 一般的なコンピュータシス テム (特にパーソナルコンピュータシステム) と、 専用の文章入力支援 プログラム (ソフトウェア) によって構成することができる。 文章入力 支援プログラムは、 例えば C D— R O Mのような記憶媒体 1 9に記録さ れて提供され、 リムーバブルディスク装置 1 8を介して固定ディスク装 置 1 7にインス トールされる。 但し、 そのようなインス トール方法に限 るわけではなく、 例えば、 コンピュータシステムに備えられた通信装置 を介して接続された他のコンピュータ又はネットワークのサーバから所 定の文章入力支援プログラムをダウンロードして、 固定ディスク装置 1 7にインス トールする方法も可能である。
次に、 固定ディスク装置 1 7に記憶されるデータの一つとして、 この 文章入力支援システム 1で使用される辞書について説明する。 以下の説 明においては、 英語の文章入力を例にとる。 この辞書には、 文章入力に 使用できる全ての単語が登録されている。 動詞の変化形や名詞の複数形 も辞書に登録されている。 例えば、 "boo k"が登録されていれば、 その 複数形" boo ks "も登録されている。 辞書の一部を図 2に例示する。
辞書は登録単語のフィールドと変換単語のフィールドとを有する。 登 録単語は小文字ばかりの文字列であり、 変換文字は大文字が混じる場合 がある。 例えば、 人名や地名のような固有名詞の場合は、 先頭の文字を 大文字で表記したものが変換文字として登録されている。 具体的な例と して、 登録単語" Chi cago "に対応して変換単語" Chicago "が登録され ている。 普通名詞や他の品詞の単語のように、 ほとんどの単語では登録 単語と確定単語が同じである。
この辞書では、 全ての登録単語がアルファべッ ト順に並べられている, 後述するアルゴリズムによって、 入力された文字列 (以下、 入力文字列 という) と一致する登録単語を辞書から見つける処理 (すなわち、 マツ チング処理) を行う際に、 最も長い文字列が優先的に選択されて確定文 字列となる。 確定文字列が決まると、 その登録単語に対応する変換単語 に置き換えられる。 カンマやピリオドのように、 アルファベッ ト以外の 符号が入力された場合は、 辞書を参照することなく、 それまでの入力文 字列がそのまま確定し、 確定文字列に続いてその符合が表示される。
また、 例えば登録単語" may "は、 表記の異なる 2つの変換単語" may" 及び" May "を有する。 このような場合は、 前者が第 1候補として、 後者 が第 2候補として変換単語のフィールドに登録されている。 3つ以上の 変換単語がある場合は、 第 3候補以降も登録されている。 図 2に示すよ うに、 表記の異なる複数の変換単語があるか否かを示す複数表記フィー ルドが辞書に設けられている。 例えば変換単語" may"のレコードでは複 数表記フィールドが 「有り」 となっている。 変換単語" Chicago"のレ コードでは複数表記フィールドが 「無し」 となっている。
上記のように複数の候補が変換単語として登録されている場合は、 い ずれかの候補がデフォルトの確定文字列として採用される。 また他の候 補は、 作業者が選択できるように表示装置 1 1に表示される。 作業者が 他の候補を選択すれば、 確定文字列が他の候補に置き換えられる。 上記 の例では、 小文字のみの文字列'' may' 'がデフオルトの確定文字列となり "May"が他の候補として表示される。
また、 例えば登録単語" advised"は、 その中に他の登録単語
"advise"を内包してレヽる。 つまり、 "advised"は、 "advise"と', d" に分かれる可能性がある。 このような場合は、 登録単語" advised"の 変換単語の第 1候補として" advised"が登録され、 第 2候補として "advise"が登録されている。 同様に登録単語" advisedly"の場合は. 変換単語として第 1候補" advisedly"と第 2候補" advised"が登録さ れている。
このように登録単語に内包される単語 (以下、 内包単語という) があ る場合にも、 デフオルト候補以外の他候補は作業者が選択できるように 表示装置 1 1に表示される。 作業者が他の候補を選択すれば、 確定文字 列が他の候補に置き換わる。 上記の例では、 最も長い第 1候補
"advisedly"がデフォルトの確定文字列となる。
また、 例えば登録単語" afield"の場合は、 その中に他の登録単語
"a"及び" field"を内包している。 この場合も、 変換単語として第 1候 補'' afield"及ぴ第 2候補" a"を登録しておけば、 前から順番に一単語 ずつ確定していくことができる。 第 2候補 "a"を確定した場合の残りの "field"については新たな入力文字列として処理すればよい。 図 2に 示すように、 内包単語があるか否かを示す内包単語フィールドが辞書に 設けられている。 例えば変換単語" advise"のレコードでは内包単語フ ィールドが 「無し」 となっており、 変換単語" advised"のレコードで は内包単語フィールドが 「有り」 となっている。
なお、 デフォルトの確定文字列を上記のように決めるのは一例に過ぎ ない。 例えば、 使用頻度の高い文字列をデフォルトの確定文字列として 採用するようにアルゴリズムを構成することも可能である。
以下、 図 3〜 5のフローチャートに基づいて、 この実施形態における 文章入力支援プログラムのアルゴリズムを説明する。 まず、 図 3はキー ボードから文字又は符号が入力されるたびに実行される文章入力支援プ ログラムのメインノレーチンの例を示すフローチヤ一トである。 図 3のス テツプ # 1において、 符号の入力か文字の入力かを判断する。 符号の入 力である場合 (ステップ # 1の Y e s) は、 ステップ # 2の符号入力処 理のサブルーチン (図 4を参照して後述する) を実行した後にステップ # 1 2へ移行する。
符号の入力でない場合、 すなわち文字の入力である場合 (ステップ # 1の No) は、 現在までの入力文字列と辞書の登録単語との照合を行う (ステップ # 3)。 入力文字列と一致する登録単語 (以下、 一致単語と いう) がある場合 (ステップ # 4の Y e s ) は、 一致単語を記憶 (記憶 更新) して (ステップ # 5) 処理ルーチンを終了する。 例えば、 現在ま での入力文字列が" advise"である場合は一致単語" advise"が記憶さ れるが、 これで文字列が確定するわけではない。 次に文字" d"が入力さ れた場合は、 一致単語の記憶が' 'advised"に更新される。 つまり、 最 後に一致した登録単語 (最後の一致単語) が記憶されることになる。 続いて文字" _ "が入力されたときに現在までの入力文字列
"advisedl"に一致する登録単語は無いが、 次に文字" y"が入力されれ ば登録単語" advisedly"に一致する。 つまり、 文字" 1"が入力された 時点では一致する登録単語は無いが、 次回以降の文字入力で登録単語に 一致する可能性が残っている。 この場合はステップ # 4の Noからステ ップ # 6の N oを経て処理ルーチンを終了する。
文字'' 1"の入力に続いて文字" y"以外の文字が入力された場合は、 次 回以降の文字入力でも登録単語に一致する可能性が無くなる。 この場合 はステップ # 4の Noからステップ # 6の Y e sを経てステップ # 7に 移行する。 ステップ # 7では、 最後に一致した登録単語 (最後の一致単 語) の記憶を読み出して、 これを確定文字列とする。 上記の例では、 "advised"力 S確定文字歹 IJとなる。
次のステップ # 8において、 辞書にしたがって登録単語 "advised" に対応する変換単語" advised"を確定文字列として置き換える。 確定 文字列 " advi sed"の例では変化が無いが、 例えば確定文字列が
"Chicago"の場合 fま変換単語" Chicago"に置き換えられる。
続くステップ # 9において複数表記処理のサブルーチンを実行する。 このサブルーチンについては、 図 5を参照して後述する。 そして、 ステ ップ # 1 0において確定文字列の後にスペースが付加され、 後続の入力 文字列と切り分けられる。 続いて、 ステップ # 1 1で内包単語処理のサ ブルーチンを実行した後、 ステップ # 1 2へ移行する。 このサブルーチ ンについては、 図 6を参照して後述する。
ステップ # 1 2では、 確定文字列が文の先頭の文字列か否かを判断す る。 これは、 例えば、 ピリオド (終止符) やクエスチョンマーク (疑問 符) のように、 文章の末尾に入力される符号 (以下、 文章終端符号とい う) が入力された時点でフラグをセッ トすることによって判断すること ができる。 文章入力開始時にもこのフラグをセッ トする。 確定文字列が 文の先頭の文字列でない場合は何もせずに処理ルーチンを終了するが、 先頭の文字列である場合はステップ # 1 3で先頭文字を大文字にする。 この際、 上記のフラグはリセットされる。 そして処理ルーチンを終了す る。
図 4は、 図 3のステップ # 2における符号入力処理のサブルーチンを 示すフローチャートである。 まず、 ステップ # 1 0 1において、 入力さ れた符号を除く (符号より前の) 入力文字列を確定文字列とする。 次の ステップ # 1 02において、 確定文字列に続けて符号を表示する。 次のステップ # 1 0 3からステップ # 1 06までの処理は、 入力され た符号の後に必要に応じてスペースを付加する処理を行っている。 この 例では、 文章と文章との間、 すなわち文章終端符号の後はダブルスぺー スを付し、 文章の途中の区切り、 すなわちカンマ等の後にはシングルス ペースを付している。
つまり、 入力された符号が終止符や疑問符のような文章終端符号であ る場合 (ステップ # 1 03の Y e s) は、 ステップ # 1 04においてス ペースを付加し、 更にステップ # 1 06でスペースを付加する。 入力さ れた符号がカンマ、 セミコロン等の文章の途中を区切る符号である場合 (ステップ # 1 03の Noからステップ # 1 05の Y e s ) は、 ステツ プ # 1 06でスペースを付加する。 それ以外の符号、 例えばアポス トロ フィ等の場合はスペースを付加することなくメインルーチンに戻る。 なお、 段落を変えるための改行は、 作業者が改行キーを押下すること によって行うが、 このときは、 文章終端符号の後に挿入されたダブルス ペースは削除される。 文章入力を終了した場合も同様に、 最後の文章終 端符号の後に挿入されたダブルスぺースは削除される。 また、 段落の先頭にタブ又は所定数のスペースを挿入する処理を必要 に応じて行ってもよい。 ヮ一ドラップ処理や禁則処理についても同様に 必要に応じて、 又は設定にしたがって実行すればよい。 ワードラップ処 理は、 一つの単語の途中で行が終了する場合に、 その単語を次の行に送 る処理を意味する。 禁則処理は、 行の始めがピリオドやカンマ等の符号 になることを避けて、 前の行の最後に規定の文字数を超えてそれらの符 号を表示する処理を意味する。 これらの処理は公知の技術であり、 本発 明と直接の関係は無いので詳細な説明は割愛する。
図 5は、 図 3のステップ # 9における複数表記処理のサブルーチンを 示すフローチャートである。 まず、 ステップ # 2 0 1において辞書の複 数表記フィールドを参照し、 複数表記の有無をチェックする。 複数表記 有りの場合は、 ステップ # 2 0 2でデフォルト候補を確定文字列とし、 ステップ # 2 0 3で他候補を選択可能に表示する。 例えば登録単語 "may "に対応する変換単語の第 1候補" may"を確定文字列とし、 第 2候 補 "May"を選択可能に表示する。
ここでいう 「選択可能に表示」 は、 表示装置 1 1の画面上において、 他候補 (他の表記) があることが分かるように表示すれば十分である。 例えば入力文章中に表示されるデフオルト候補に近接して他候補を表示 してもよいし、 離れた場所に表示してもよい。 他候補の選択は例えば特 別のキー (例えばスペースキー) を押下することによって行われる。 2 つ以上の他候補がある場合は、 そのキーを複数回押下することによって 選択対象の他候補が変わるようにすればよい。
他候補選択のためのキー (例えばスペースキー) を押下しないで他の キー (文字や符号を入力するキー) が押下されれば、 他候補が選択され なかったことになる。 他候補が選択されなかった場合 (ステップ # 2 0 4の N o ) は、 デフォルト候補が確定文字列とされたままでメインルー チンに戻る。 他候補が選択された場合 (ステップ # 2 0 4の Y e s ) は. 確定文字列 ("may" ) が他候補 ("May" ) で置き換えられ (ステップ # 2 0 5 )、 メインルーチンに戻る。
図 6は、 ステップ # 1 1における内包単語処理のサブルーチンを示す フローチャートである。 まず、 ステップ # 3 0 1において辞書の内包単 語フィールドを参照し、 内包単語の有無をチェックする。 内包単語有り の場合は、 ステップ # 3 0 2で内包単語を他候補として選択可能に表示 する。 例えば登録単語" advised"に対応する変換単語の第 1候補
" advised"が確定文字列として表示されているときに、 内包単語であ る第 2候補" advise "を選択可能に表示する。
ここでいう 「選択可能に表示」 は、 表示装置 1 1の画面上において、 他候補 (内包単語) があることが分かるように表示すれば十分である。 例えば入力文章中に表示されるデフォルト候補に近接して他候補を表示 してもよいし、 離れた場所に表示してもよい。 他候補の選択は例えば特 別のキー (例えばスペースキー) を押下することによって行われる。 2 つ以上の他候補がある場合は、 そのキーを複数回押下することによって 選択対象の他候補が変わるようにすればよい。
他候補選択のためのキー (例えばスペースキー) を押下しないで他の キー (文字や符号を入力するキー) が押下されれば、 他候補が選択され なかったことになる。 他候補が選択されなかった場合 (ステップ # 3 0 3の N o ) は、 そのままメインルーチンに戻る。 他候補が選択された場 合 (ステップ # 3 0 3の Y e s ) は、 ステップ # 3 0 4で確定文字列の 確定とその後のスペース (例えば" advised ") が取り消される。 そし て、 他候補 (例えば" advise " ) を新たな確定文字列とし (ステップ # 3 0 5 )、 その後にスペースを付加して (ステップ # 3 0 6 ) メインル 一チンに戻る。 この例では、 スペースで切り分けられた後続の入力文字 列はすでに入力されている" d"から始まることになる。
次に、 具体的な文章入力を例にとって説明を加える。 文章の一例とし 、 英文" This is the first time I have listened to jazz
It is fantastic!"を入力する場合を考える。 本発明の文章入力支 援システムを用いる場合に作業者はキーボードから
" thisisthef xrstt imeihavelistenedto j azz.itisfantastic!
"と入力すればよい。
なお、 説明を簡単にするために以下の条件を設定する。 ただし、 この 条件は自由に設定可能である。 一行当たり入力可能な文字数は小文字 3 0個に相当する。 文字以外の符号は小文字と同じく 1文字分の幅に相当 し、 大文字は小文字 2個分の幅を占有する。 文字ごとに幅を変えるプロ ポーショナルフォントは考慮しないで、 全ての文字及び符号について上 記の条件を満たすものとする。 また、 前述のワードラップ処理を実行し. 段落の先頭にタブ (又はスペース) を挿入する処理は実行しないものと する。
作業者が" t"から入力を始めて、 "this"まで入力した時点で辞書の 登録単語" this"と一致し、 一致単語" this"が記憶される (図 3のス テツプ # 5)。 続いて'' i"が入力されると、 それまでの入力文字列
"thisi"で始まる登録単語が無いので、 次回以降の文字入力でも登録 単語に一致する可能性が無くなる。 この時点で最後に一致した登録単語 "this"が読み出されて確定文字列となる (図 3のステップ # 7)。 そ して、 登録単語" this"に複数表記は無いので確定文字列'' this"が最 終的に確定し、 その後にスペースが付加される (図 3のステップ # 1 0)。
また、 登録単語" this"は内包単語も無いので、 確定文字列" this" 及びその後に付加されたスペースは変更されない (最終確定する)。 そ して、 文の先頭であることが前述のようにして判別されるので、 先頭文 字が大文字にされる (図 3のステップ # 1 3)。 ここまでの入力文章は, "This i"であり、 "i"で始まる入力文字列に処理対象が移行する。 こ のとき、 一致単語の記憶領域はクリアされる。
登録単語" i"が一致単語として記憶され、 更に "s"が入力されると、 入力文字列" is"に一致する登録単語が辞書で見つかるので、 一致単語 の記憶が" is"に更新される。 この後、 "isthe"まで入力された時点で 登録単語に一致する可能性が無くなる。 したがって、 一致単語 "is"が 確定文字列となり、 その後にスペースが付加される。 この時点での入力 文章は、 "This is the"となっているが、 処理対象の入力文字列はま だ "is"である。 登録単語 "is"は内包単語" i"を有するので、 確定文字 列 "is"の他候補として" i"が選択可能に表示される (図 6のステップ # 3 0 2)。
作業者が" i"を選択せずに (無視して) 次の文字" f"を入力すると、 処理対象の入力文字列が" the"に移り、 一致単語" the"が記憶されると 共に入力文字列が" thef"になる。 更に" i"が入力されて入力文字列が "thefi"になった時点で登録単語に一致する可能性が無くなる。 した がって、 一致単語" the"が確定文字列となり、 その後にスペースが付加 される。 登録単語" the"は内包単語が無いので、 処理対象の入力文字列 力 S"fi"に移行し、 一致単語の記憶領域がクリアされる。 この時点での 入力文章は、 "This is the fi"となっている。
同様の処理力 S繰り返されて、 "This is the first time i"まで の文章が入力され、 現在の処理対象が" i"から始まる入力文字列にある とする。 登録単語" i"がー致単語として記憶された後、 入力文字列が "iha"まで入力された時点で登録単語に一致する可能性が無くなる。 し たがって一致単語" i"が確定文字列となり、 辞書の変換単語" I"に置き 換えられた後、 スペースが付加される。 この時点での入力文章は、 "This is the first time I ha"であり、 処理対象の入力文字歹 'J は" ha"となっている。
入力文字列が " ha ve "になつた時点で一致単語" ha ve "が記憶される, 更に入力文字列が" havelis"になった時点で登録単語に一致する可能 性が無くなるので、 一致単語" have"が確定文字列となり、 スペースが 付カ卩される。 この時点での入力文章は、 "This is the first time I have lis"であり、 処理対象の入力文字列は" lis"となっている。 このとき、 前述の条件として設定した 1行当たりの文字数 3 0を超える ので、 ワードラップ処理により、 入力文字列 "lis"以降の表示は 2行目 に移される。
同様の処理力 S繰り返されて、 "This is the first time I have (改行) listened to jazz"までの文章が入力され、 現在の処理対 象の入力文字列が" jazz"であるとする。 次に終止符 (ピリオド) が入 力されると、 "jazz"はそのまま確定文字列となり (図 4のステップ # 1 0 1 )、 続けて終止符が表示される (図 4のステップ # 1 0 2)。 さら に、 スペースが 2個自動的に付加される (図 4のステップ # 1 0 4及び # 1 0 6)。 この時点での入力文章は" This is the first time I have (改行) listened to jazz . "である。 前述のように、 次の 入力文字列が文頭であることを示すフラグがセッ トされる。
次の文章についても同様の入力支援処理が行われ、 "This is the first time I have 、改?T) listened to jazz. It is fanta"まで入力された時点で、 2行目が 1行当たりの文字数 3 0を超 えるので、 現在の処理対象である入力文字列" fanta"が 3行目に移行 する。 また、 "fan"まで入力された時点で登録単語 "have"がー致単語 として記憶され、 "fantast"まで入力された時点で一致単語の記憶が 登録単語' 'fantast"tこ更新される。 更 " fantastic"まで人力された 時点で一致単語の記憶が登録単語" fantastic"に更新される。
この例では、 次の感嘆符 ( !) が入力された時点で、 感嘆符 ( !) を 除く入力文字列" fantastic"が確定し、 その後に感嘆符 ( !) が表示 される (図 4のステップ # 1 0 1及び # 1 0 2)。 なお、 この例と異な るが、 入力文字列" fantastic"の後に文字入力が続く場合は、 登録単 語に一致する可能性が無くなった時点で最後の一致単語 "fantastic" が読み出されて確定文字列となると共に、 内包単語" fan"及び
"fantast"が他候補として選択可能に表示されることになる。
確定文字列" fantastic"の後に感嘆符 (!) が表示されたのち、 ダ ブルスペースが自動的に付加される (図 4のステップ # 1 0 4及び # 1 0 6) 力 前述のように文章入力が終了したときに最後のダブルスぺー スは削除される。 こうして、 作業者がキーボードから入力した文字列 " thisisthef irsttimeihavelistenedto j azz.itisfantastic! "力 所定开式の文章" This is the first time I have (改行) listened to jazz . It is (改行) fantastic 'に変換され、 表示装置 1 1の画面上に表示される。
以上に説明したように、 本発明の文章入力支援システムでは、 スぺー スなしで連続入力された文字列を辞書の登録単語と照合することによつ て単語の切れ目を判断してスペースを自動挿入する。 このとき、 最も長 い単語をデフォルトの確定文字列 (単語) として採用する。 そして、 確 定文字列に短い登録単語 (内包単語) が含まれる場合は、 内包単語を他 候補として選択可能に表示して、 作業者の選択又は非選択を待って確定 文字列の最終的な確定を行う。
しかし、 確定文字列に内包単語がある場合の変換候補の選択を、 ある 程度自動的に行うことも可能である。 一例として、 後続の入力文字列と の関係で内包単語を含む変換候補の中から適切な候補を自動的に選択す る方法を簡単に説明する。
伊 Jえば、 "our section"を意識して' 'oursection"とレヽぅ文字歹 Uを 入力する場合に、 "oursec"まで入力された時点で登録単語に一致する 可能性が無くなり、 "ours"が確定する。 この確定文字列" ours"は内 包単語 "our"を有する。 そこで、 後続の入力文字列を処理する際に、 " ours"で区切られた場合の" ec"で始まる入力文字列だけでなく、 "our"で区切られた場合の'' sec"で始まる入力文字列についても並行し て評価する。 その結果、 前者の" ec' 'で始まる場合は、 "ecti"まで入力 した時点で登録単語に一致する可能性が無くなり、 一致単語が記憶され ていないのでエラーになってしまう。 後者の" sec"で始まる場合は、 登 録単語' 'section"力 S辞書に見つ力 る。 こう して、 "our section"力 適切な区切りとして最終的に確定する。
上記の方法の場合に、 例えば" our sport"を意識して" oursport" という文字列を入力する場合は、 "ours port"が正しい区切りとして 認識されることになる。 このような場合に、 後の文字列が長いほうを優 先して選択するようにしてもよい。 つまり、 "ours port"ではなく、 "our sport"を適切な区切りとして自動選択する。 一般に、 後の文字 列が長いほうを優先して選択するほうが正しい区切りになる確率が高い ことが分かっている。
その他の方法として、 辞書に登録単語の品詞や他の単語との結合の情 報を登録しておき、 直前又はそれ以前の確定文字列との関係に基づいて 内包単語を含む変換候補の中から適切な候補を自動的に選択するように してもよレ、。
また、 上記実施例では、 作業者がタイプミスをした場合のエラーにつ いては触れなかった。 例えば、 一致単語が記憶されていない (入力文字 列の処理に先立ってクリアされたまま) の状態で、 登録単語に一致する 可能性が無くなったときは、 タイプミスと判断して、 エラー表示を行う ことが可能である。 ブザーや音声でタイプミスを知らせてもよい。 作業 者の選択を求める表示に際してもブザーによる報知を行ってもよい。 なお、 本発明は上記実施形態に限らず、 種々の形態で実施することが 可能である。 特に、 文章入力支援システムのハードウェア構成について は、 標準キーボードを備えたコンピュータに限らず、 ワードプロセッサ 専用機であってもよいし、 専用キーボードを備えた携帯端末等、 文章入 力が可能な任意の装置に本発明を適用することができる。
また、 上記の実施形態では英語の文章入力を例にとって説明したが、 本発明は英語に限らずドイツ語やフランス語等の種々の文章入力に適用 することができる。 要は、 スペースで区切られた複数の単語からなる文 章の入力であれば、 本発明を適用可能である。 産業上の利用可能性
以上のように、 本発明に係る文章入力支援システムはヮードプロセッ サ等の文章入力機器に利用することができる。 そして、 英語やフランス 語の文章のようにスペースで区切られた複数の単語からなる文章の入力 に際して作業者が小文字を連続入力すれば、 文章入力支援システムがス ペースを自動生成し、 適切な文章に変換する。

Claims

請 求 の 範 囲
1 . 文章入力に用いられるキーボードと、 入力された文字列及び文章を 表示するための表示装置と、 プログラム及びデータを記憶するための記 憶装置と、 前記キーボードを用いて入力された文字列を前記プログラム にしたがって処理する処理装置とを備え、 スペースで区切られた複数の 単語からなる文章の入力を支援する文章入力支援システムであって、 文章入力に使用できる全ての単語が登録された辞書が前記データとし て前記記憶装置に記憶され、 前記処理装置は、 入力された文字列と前記 辞書に登録されている各単語とを先頭文字から順次照合して一致した単 語を記憶しておき、 入力された文字列が前記辞書に登録されているいず れの単語とも一致する可能性が無くなったときに、 最後に一致した単語 を確定文字列とすると共にその後にスペースを付加して後続の入力文字 列と切り分けることを特徴とする文章入力支援システム。
2 . 符号が入力された場合に、 前記処理装置は、 前記符号を除く入力文 字列を確定文字列とし、 該確定文字列に続けて前記符号を表示すること を特徴とする請求項 1記載の文章入力支援システム。
3 . 前記辞書は登録単語のフィールドと変換単語のブイールドとを有し. 前記処理装置は、 前記確定文字列を前記登録単語に対応する前記変換単 語で置き換える処理を行うことを特徴とする請求項 1記載の文章入力支 援システム。
4 . 前記登録単語に対応して表記の異なる複数の変換単語がある場合に. 前記処理装置は、 1つの変換単語を確定文字列とすると共に他の変換単 語を他候補として作業者が選択できるように前記表示装置に表示し、 作 業者が前記他候補を選択した場合は、 前記確定文字列を前記他候補で置 き換えることを特徴とする請求項 3記載の文章入力支援システム。
5 . 前記確定文字列の中に、 前記辞書に登録された他の単語が内包され ている場合に、 前記処理装置は、 その內包されている単語を他候補とし て作業者が選択できるように前記表示装置に表示し、 作業者が前記他候 補を選択した場合は、 前記確定文字列の確定とその後のスペースを取り 消し、 前記他候補を新たな確定文字列とすると共にその後にスペースを 付加して後続の入力文字列と切り分けることを特徴とする請求項 1記載 の文章入力支援システム。
6 . 文章入力に用いられるキーボードと、 入力された文字列及び文章を 表示するための表示装置と、 プログラム及びデータを記憶するための記 憶装置とを備えたコンピュータに、 スペースで区切られた複数の単語か らなる文章の入力を支援する処理を実行させるための文章入力支援プロ グラムであって、
文章入力に使用できる全ての単語が登録された辞書が前記データとし て前記記憶装置に記憶され、 前記文章入力支援プログラムは、 入力され た文字列を前記辞書に登録されている各単語とを先頭文字から順次照合 して一致した単語を記憶しておくステップと、 入力された文字列が前記 辞書に登録されているいずれの単語とも一致する可能性が無くなったと きに、 最後に一致した単語を確定文字列とすると共にその後にスペース を付加して前記表示装置に表示するステップとを有することを特徴とす る文章入力支援プログラム。
7 . 文章入力に用いられるキーボードと、 入力された文字列及び文章を 表示するための表示装置と、 プログラム及びデータを記憶するための記 憶装置とを備えたコンピュータに、 スペースで区切られた複数の単語か らなる文章の入力を支援する処理を実行させるためのプログラムが記憶 されたコンピュータ読み取り可能な記憶媒体であって、 前記プログラム は、 入力された文字列を前記辞書に登録されている各単語とを先頭文字 から順次照合して一致した単語を記憶しておくステップと、 入力された 文字列が前記辞書に登録されているいずれの単語とも一致する可能性が 無くなったときに、 最後に一致した単語を確定文字列とすると共にその 後にスペースを付加して前記表示装置に表示するステップとを有するこ とを特徴とする記憶媒体。
PCT/JP2001/004952 2001-06-11 2001-06-11 Systeme destine a assister la saisie de texte par production automatique d'espaces WO2002101578A1 (fr)

Priority Applications (4)

Application Number Priority Date Filing Date Title
EP01936967A EP1411442A4 (en) 2001-06-11 2001-06-11 SYSTEM FOR SUPPORTING THE ENTERMENT OF TEXT BY AUTOMATIC PRODUCTION OF BLANK
JP2003504270A JP4048169B2 (ja) 2001-06-11 2001-06-11 スペースの自動生成によって文章入力を支援するシステム
PCT/JP2001/004952 WO2002101578A1 (fr) 2001-06-11 2001-06-11 Systeme destine a assister la saisie de texte par production automatique d'espaces
US10/467,212 US7475009B2 (en) 2001-06-11 2001-06-11 Text input support system and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2001/004952 WO2002101578A1 (fr) 2001-06-11 2001-06-11 Systeme destine a assister la saisie de texte par production automatique d'espaces

Publications (1)

Publication Number Publication Date
WO2002101578A1 true WO2002101578A1 (fr) 2002-12-19

Family

ID=11737419

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2001/004952 WO2002101578A1 (fr) 2001-06-11 2001-06-11 Systeme destine a assister la saisie de texte par production automatique d'espaces

Country Status (4)

Country Link
US (1) US7475009B2 (ja)
EP (1) EP1411442A4 (ja)
JP (1) JP4048169B2 (ja)
WO (1) WO2002101578A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8447584B2 (en) 2008-03-14 2013-05-21 Sony Corporation Character input apparatus, character input assist method, and character input assist program

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7702560B1 (en) 2000-11-16 2010-04-20 International Business Machines Corporation System and method for interactive offer system
US8103574B2 (en) * 2000-11-29 2012-01-24 International Business Machines Corporation Online offer and bid management with sealed bids
US7475025B2 (en) 2001-03-08 2009-01-06 International Business Machines Corporation Read-only user access for web based auction
US7801793B2 (en) 2001-03-29 2010-09-21 International Business Machines Corporation User-specified time-based proxy firing in online auctions
GB2423612A (en) * 2005-02-24 2006-08-30 Business Integrity Ltd Conditional text manipulation
US7818304B2 (en) 2005-02-24 2010-10-19 Business Integrity Limited Conditional text manipulation
KR100735308B1 (ko) 2005-08-30 2007-07-03 경북대학교 산학협력단 단문 메시지에 대한 자동 띄어쓰기 프로그램이 기록된 기록매체
US9377373B2 (en) * 2010-10-05 2016-06-28 Infraware, Inc. System and method for analyzing verbal records of dictation using extracted verbal features
US8843845B2 (en) 2012-10-16 2014-09-23 Google Inc. Multi-gesture text input prediction
US8832589B2 (en) 2013-01-15 2014-09-09 Google Inc. Touch keyboard using language and spatial models
US10572586B2 (en) * 2018-02-27 2020-02-25 International Business Machines Corporation Technique for automatically splitting words
JP7481999B2 (ja) * 2020-11-05 2024-05-13 株式会社東芝 辞書編集装置、辞書編集方法及び辞書編集プログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0540750A (ja) * 1991-08-06 1993-02-19 Sharp Corp 自動単語区切り挿入回路
JPH06168243A (ja) * 1992-11-30 1994-06-14 Matsushita Electric Ind Co Ltd 綴り誤り訂正方法および綴り誤り訂正装置
JPH10232863A (ja) * 1996-12-19 1998-09-02 Omron Corp かな漢字変換装置および方法、並びに記録媒体
US5806021A (en) * 1995-10-30 1998-09-08 International Business Machines Corporation Automatic segmentation of continuous text using statistical approaches

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5262948A (en) * 1984-07-18 1993-11-16 Canon Kabushiki Kaisha Word processor
US5369577A (en) * 1991-02-01 1994-11-29 Wang Laboratories, Inc. Text searching system
US5448474A (en) * 1993-03-03 1995-09-05 International Business Machines Corporation Method for isolation of Chinese words from connected Chinese text
DE69429643T2 (de) * 1993-08-31 2002-09-12 Mitsuhiro Aida Verfahren zur Texteingabe
JPH0877173A (ja) * 1994-09-01 1996-03-22 Fujitsu Ltd 文字列修正システムとその方法
US6035268A (en) * 1996-08-22 2000-03-07 Lernout & Hauspie Speech Products N.V. Method and apparatus for breaking words in a stream of text
JPH1153384A (ja) * 1997-08-05 1999-02-26 Mitsubishi Electric Corp キーワード抽出装置及びキーワード抽出方法並びにキーワード抽出プログラムを格納したコンピュータ読み取り可能な記録媒体

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0540750A (ja) * 1991-08-06 1993-02-19 Sharp Corp 自動単語区切り挿入回路
JPH06168243A (ja) * 1992-11-30 1994-06-14 Matsushita Electric Ind Co Ltd 綴り誤り訂正方法および綴り誤り訂正装置
US5806021A (en) * 1995-10-30 1998-09-08 International Business Machines Corporation Automatic segmentation of continuous text using statistical approaches
JPH10232863A (ja) * 1996-12-19 1998-09-02 Omron Corp かな漢字変換装置および方法、並びに記録媒体

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP1411442A4 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8447584B2 (en) 2008-03-14 2013-05-21 Sony Corporation Character input apparatus, character input assist method, and character input assist program
US9342140B2 (en) 2008-03-14 2016-05-17 Sony Corporation Character input apparatus, character input assist method, and character input assist program
US10311142B2 (en) 2008-03-14 2019-06-04 Sony Corporation Character input apparatus, character input assist method, and character input assist program

Also Published As

Publication number Publication date
EP1411442A4 (en) 2010-03-03
EP1411442A1 (en) 2004-04-21
JP4048169B2 (ja) 2008-02-13
JPWO2002101578A1 (ja) 2004-09-30
US20040123248A1 (en) 2004-06-24
US7475009B2 (en) 2009-01-06

Similar Documents

Publication Publication Date Title
US4459049A (en) Abbreviated typing with special form display
US7403889B2 (en) Electronic dictionary with example sentences
US5418718A (en) Method for providing linguistic functions of English text in a mixed document of single-byte characters and double-byte characters
JPH113338A (ja) 多言語入力システム、多言語入力方法及び多言語入力プログラムを記録した記録媒体
EP0978054A1 (en) Method and system for verifying accuracy of spelling and grammatical composition of a document
CN103026318A (zh) 输入法编辑器
JPS61217863A (ja) 電子辞書
JP4502615B2 (ja) 類似文検索装置、類似文検索方法、およびプログラム
WO2002101578A1 (fr) Systeme destine a assister la saisie de texte par production automatique d'espaces
US5623682A (en) Apparatus for processing documentary information
US5890183A (en) Method, apparatus, electronic dictionary and recording medium for converting converted output into character code set accetpable for re-retrieval as original input
US20070277118A1 (en) Providing suggestion lists for phonetic input
EP2031490A2 (en) Electronic dictionary, search method for and electronic dictionary, and search program for an alectronic dictionary
JP6720274B2 (ja) 入力支援プログラム、入力支援方法および入力支援装置
JP4050745B2 (ja) 文章入力システム
US20240265201A1 (en) Determining apparatus, determining method, and program
JPH081639B2 (ja) ワードプロセッサ
JP2702443B2 (ja) 日本語入力装置
JPH07105217A (ja) 入力文字自動補正装置
US20070213971A1 (en) Method For Operating an Output Device
JPH0531186B2 (ja)
JPH10198664A (ja) 日本語入力システム及び日本語入力プログラムを記録した媒体
JP2002082940A (ja) 韓国語の入力支援方法およびその方法を用いた韓国語入力用のプログラム記録媒体
JPH08272780A (ja) 中国語入力処理装置及び中国語入力処理方法及び言語処理装置及び言語処理方法
JP2023052750A (ja) 自動翻訳装置及び自動翻訳プログラム

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BY BZ CA CH CN CR CU CZ DE DK DM DZ EE ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NO NZ PL PT RO RU SD SE SG SI SK SL TJ TM TR TT TZ UA UG US UZ VN YU ZA ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): GH GM KE LS MW MZ SD SL SZ TZ UG ZW AM AZ BY KG KZ MD RU TJ TM AT BE CH CY DE DK ES FI FR GB GR IE IT LU MC NL PT SE TR BF BJ CF CG CI CM GA GN GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 2001936967

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 10467212

Country of ref document: US

WWP Wipo information: published in national office

Ref document number: 2001936967

Country of ref document: EP

REG Reference to national code

Ref country code: DE

Ref legal event code: 8642