JP2006012188A - Document processing method and apparatus - Google Patents

Document processing method and apparatus Download PDF

Info

Publication number
JP2006012188A
JP2006012188A JP2005235573A JP2005235573A JP2006012188A JP 2006012188 A JP2006012188 A JP 2006012188A JP 2005235573 A JP2005235573 A JP 2005235573A JP 2005235573 A JP2005235573 A JP 2005235573A JP 2006012188 A JP2006012188 A JP 2006012188A
Authority
JP
Japan
Prior art keywords
kana
character string
conversion
input
english
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005235573A
Other languages
Japanese (ja)
Inventor
Hiroki Amo
博喜 阿望
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JustSystems Corp
Original Assignee
JustSystems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JustSystems Corp filed Critical JustSystems Corp
Priority to JP2005235573A priority Critical patent/JP2006012188A/en
Publication of JP2006012188A publication Critical patent/JP2006012188A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

【課題】日本語、外国語のミックスした文章を効率良くかな入力して文書変換する。
【解決手段】ローマ字入力又はかな文字入力が可能な入力手段と、この入力手段から入力されるかな文字列をかな文書変換辞書を介して文書文字列に変換するかな文書変換手段とを具えた文書処理装置において、前記かな文字列を逆ローマ字規則により英文字列に変換するかな英字変換手段を設け、前記かな文書変換辞書の単語変換候補に、前記逆ローマ字規則により生成した英文字列を追加して提示/選択できるようにすることによって上記目的は達成される。
【選択図】図5
[PROBLEMS] To efficiently convert a document by inputting a mixed sentence of Japanese and foreign languages.
A document comprising input means capable of inputting Roman characters or Kana characters, and Kana document conversion means for converting a Kana character string input from the input means into a document character string via a Kana document conversion dictionary. In the processing device, there is provided a Kana alphabet conversion means for converting the Kana character string into an English character string according to a reverse Roman character rule, and an English character string generated according to the reverse Roman character rule is added to a word conversion candidate of the Kana document conversion dictionary. The above object can be achieved by making it possible to present / select.
[Selection] Figure 5

Description

この発明は、かな入力又は/及びローマ字入力式の文書処理方法及び装置に関し、特に、日本語と英語、ドイツ語、フランス語等の外国語とが混在した文書を作成する場合に有効な文書処理方法及び装置に関する。   BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a kana input and / or Roman character input type document processing method and apparatus, and more particularly to a document processing method effective for creating a document in which Japanese and foreign languages such as English, German and French are mixed. And an apparatus.

従来、ワードプロセッサ、パーソナルコンピュータ、ワークステーション等の日本語に関係した文書処理方法及び装置においては、ローマ字漢字変換又はかな漢字変換による日本語入力方法が広く用いられている。しかしながら、今日では技術の進歩が激しく新しい専門用語が次々と生まれると共に、情報の国際化が非常に進んでいるので、日本語文章の中に、日本語の単語、文章ばかりでなく、フランス語、ドイツ語、スペイン語、イタリア語、英語等の外国語の単語又は文章をカタカナ表記ではなく、オリジナルの語源の綴り又は発音ローマ字の綴りのままで日本語の文章の中に混在させて使用することが少なくない。特に、コンピュータ関係の専門用語や会社名、氏名等はマニュアル、学会誌、契約書等において、日本語本文中にそのままアルファベット、略語等を用いて記載される傾向にある。   2. Description of the Related Art Conventionally, in Japanese word processing, personal computers, workstations, and other document processing methods and apparatuses related to Japanese, a Japanese input method using Roman-Kanji conversion or Kana-Kanji conversion has been widely used. Today, however, technological advances are so strong that new technical terms are born one after another, and the internationalization of information is very advanced. Therefore, not only Japanese words and sentences but also French and German are included in Japanese sentences. Foreign language words or sentences such as Japanese, Spanish, Italian, English, etc. may be used in Japanese sentences without spelling the original etymology or pronunciation Roman letters, rather than katakana notation. Not a few. In particular, computer-related technical terms, company names, names, etc. tend to be written as they are in alphabets, abbreviations, etc. in the Japanese text in manuals, academic journals, contracts, etc.

かかる事態に対応するため、ローマ字入力モードにおいてキー入力装置等から入力されたローマ字文字列を、特別の操作を必要とすることなしに、かな漢字文字列と外国語文字列の混在した文字列に変換することのできるかな漢字変換装置が特開平4−75162号公報に紹介されている。更に、入力されたローマ字文字列中に現れる諸文字の隣接関係の特徴を利用することにより、ユーザの負担の少ない日本語入力が可能なローマ字漢字変換装置も特公平5−85055号公報に記載されている。   To cope with such a situation, the Romaji character string input from the key input device etc. in the Romaji input mode is converted to a mixed character string of Kana-Kanji character strings and foreign language character strings without requiring any special operation. A kana-kanji conversion device that can do this is introduced in Japanese Patent Laid-Open No. 4-75162. Furthermore, Japanese Patent Publication No. 5-85055 discloses a Romaji-Kanji conversion device that can input Japanese characters with less burden on the user by utilizing the characteristics of adjacent relations of characters appearing in the inputted Romaji character string. ing.

かかる従来のローマ字入力式日本語文書処理装置にあっては、ローマ字入力文字列を先ずひらがなに変換し、ひらがなに変換できない文字列は日本語とはみなされず、副言語又は英単語等とみなされ、日本語とは区別した英単語辞書/副言語辞書等により辞書変換処理が行なわれるようになっていた。すなわち、従来は、入力文字列の中でひらがなに変換できる文字列は日本語辞書で、ひらがなに変換できない文字列は副言語辞書へと装置側で勝手に自動分類して変換処理してしまうので、例えば、日付を示す「DATE」のような単語は「だて」と読み入力した文字の変換対象候補としてユーザに表示し提示されないという問題点があった。また「book(英小文字、全角モードでキー入力)」という単語を副言語辞書に登録しただけでは「BOOK」、「Book」等でキー入力した場合、正しく辞書変換されず、その都度、これらの単語を辞書登録する操作をユーザに要求することとなり、日本語文書処理の中で外国語の単語を編集処理することは大変煩わしいという問題点もあった。   In such a conventional romaji input type Japanese document processing device, a romaji input character string is first converted into hiragana, and a character string that cannot be converted into hiragana is not regarded as Japanese but is regarded as a sub-language or English word. Dictionary conversion processing is performed by an English word dictionary / sublanguage dictionary that is distinguished from Japanese. In other words, conventionally, the character string that can be converted into hiragana in the input character string is a Japanese dictionary, and the character string that cannot be converted into hiragana is automatically classified and converted into a sub-language dictionary on the device side. For example, there is a problem that a word such as “DATE” indicating a date is not displayed and presented to the user as a candidate for conversion of a character read and input as “date”. Also, just registering the word “book (key input in lowercase, full-width mode)” in the sub-language dictionary will result in incorrect dictionary conversion when key-input is made with “BOOK”, “Book”, etc. This requires the user to register the word in the dictionary, and there is a problem that it is very troublesome to edit the foreign language word in the Japanese document processing.

この発明は上述のような事情から成されたものであり、この発明の目的は、ローマ字入力又はかな入力の文書処理装置において、入力文字列を英文字/記号、数字等も含めて全て日本語と同等に扱い、外国語と日本語と区別することなくキー入力操作すると共に、アルファベットで表記した文字列が辞書に登録されておらず、逆ローマ字規則でユーザに提示し選択された場合には、当該逆ローマ字文字列を前記辞書に自動登録し、日本語と外国語と区別することなく文書処理できるようにした汎用文書処理方法及び装置を提供することにある。   The present invention has been made for the above-mentioned circumstances, and an object of the present invention is to use an input character string including English letters / symbols, numbers, etc. in a Roman character input or Kana input document processing apparatus. When the key input operation is performed without distinguishing between foreign language and Japanese, the character string written in alphabet is not registered in the dictionary, and it is presented to the user with the reverse Roman alphabet rule and selected. Another object of the present invention is to provide a general-purpose document processing method and apparatus that automatically registers the reverse Roman character string in the dictionary and allows document processing without distinguishing between Japanese and foreign languages.

この発明は少なくともかな文字入力が可能な入力手段と、この入力手段から入力されるかな文字列をかな文書変換辞書を介して文書文字列に変換するかな文書変換手段とを具えたかな入力式文書処理装置に関するものであり、この発明の上記目的は、前記かな文字列を逆ローマ字規則により英文字列に変換するかな英字変換手段を設け、前記かな文書変換辞書の単語変換候補に、前記逆ローマ字規則により生成した英文字列を追加して提示/選択できるようにすることによって達成される。   The present invention is a kana input expression document comprising at least input means capable of inputting kana characters and kana document conversion means for converting a kana character string input from the input means into a document character string via a kana document conversion dictionary. The above object of the present invention is to provide a kana-alphabetic conversion means for converting the kana character string into an English character string according to a reverse romaji rule, and to the word conversion candidate of the kana document conversion dictionary, the reverse roman character This is achieved by allowing an English character string generated by a rule to be additionally presented / selected.

また、この発明は、かな入力式文書処理方法にも関し、この発明の上記目的は少なくともかな文字入力が可能な入力手段を介してかな文字列を入力するかな文字列入力工程と、このかな文字列をかな文書変換辞書を介して文書文字列に変換するかな文書変換工程とを含み、更に、このかな文書変換工程の中に、かな文書変換の単語候補として変換対象かな文字列を逆ローマ字規則を適用して英文字列に変換し、生成された英文字列をユーザに提示することが可能な逆ローマ字変換工程とを設けることによっても達成される。   The present invention also relates to a kana input type document processing method. The above object of the present invention is to input a kana character string through an input means capable of inputting at least kana characters, and a kana character input process. A kana document conversion step for converting a string into a document character string via a kana document conversion dictionary, and further, in this kana document conversion step, a kana character string to be converted as a word candidate for kana document conversion This is also achieved by providing a reverse Romaji conversion step capable of converting to an English character string by applying, and presenting the generated English character string to the user.

更に、この発明はローマ字入力式文書処理装置にも関し、この発明の上記目的は、少なくとも英文字入力が可能な入力手段と、この入力手段から入力される英文字列をローマ字規則によりかな混じり文字列に変換する英字かな変換手段と、この英字かな変換手段により変換されたかな混じり文字列をかな文書変換辞書を介して文書文字列に変換するかな文書変換手段とを具えることによっても達成される。   Furthermore, the present invention relates to a Roman character input type document processing apparatus, and the above object of the present invention is to provide an input means capable of inputting at least an English character and an English character string input from the input means according to a Roman character rule. It is also achieved by comprising an alphabetic kana conversion means for converting into a string and a kana document conversion means for converting a kana mixed character string converted by the alphabetic kana conversion means into a document character string via a kana document conversion dictionary. The

更にまた、この発明はローマ字入力式文書処理方法にも関し、この発明の上記目的は、少なくとも英文字入力が可能な入力手段を介して英文字列を入力する英文字列入力工程と、この入力される英文字列をローマ字規則によりかな混じり文字列に変換して表示する英字かな変換工程と、この英字かな変換工程で生成されたかな混じり文字列をかな文書変換辞書を介して文書文字列に変換するかな文書変換工程とを設けることによっても達成される。   Furthermore, the present invention also relates to a Roman character input type document processing method. The above object of the present invention is to input an English character string through an input means capable of inputting at least English characters, The Kana conversion process to display the converted English character string into a Kana mixed character string according to the Roman rules, and the Kana mixed character string generated by this Kana Kana conversion process into the document character string via the Kana document conversion dictionary This can also be achieved by providing a kana document conversion process.

この発明では、ローマ字入力された文字列を日本語と英語/アルファベットとに区別することなく、同一の文字列として扱い文書処理するので、入力文字列を日本語と他の言語とに区別する必要が一切ない。従って、ローマ字入力では和文モードと英文入力モードのモード切替操作等は一切必要とせず、文書のキー入力が可能である。また、英大文字入力キー、英小文字入力キーを操作することもなく、通常の英文キー入力の感覚で日本語とローマ字/英語等の単語を同時にキー入力することができる。また、逆ローマ字変換してユーザに提示した英文字列が選択されて変換対象単語の表記として確定した場合には、文書処理装置の内部でこのことが自動的に検出できるので、この新しい表記形式をかな文書変換辞書にユーザの操作を一切必要とせず、自動追加登録することができ、2回目以後同様のかな文字列が入力された場合、自動的にかな文字列を英文字列に変換した英文字混じりの日本語文章を効率良く作成/編集することができる。   In the present invention, the character string input in Roman characters is treated as the same character string without distinguishing between Japanese and English / alphabet, so the input character string must be distinguished between Japanese and another language. There is no. Therefore, the Roman character input does not require any mode switching operation between the Japanese text mode and the English text input mode, and the key input of the document is possible. In addition, it is possible to simultaneously input words such as Japanese and Roman characters / English in the sense of normal English key input without operating the English uppercase input key and English lowercase input key. In addition, when an English character string presented to the user after reverse romaji conversion is selected and confirmed as the notation of the conversion target word, this can be automatically detected within the document processing apparatus, so this new notation format The Kana document conversion dictionary does not require any user operation and can be automatically added and registered. When the same Kana character string is input after the second time, the Kana character string is automatically converted to an English character string. Efficiently create / edit Japanese sentences mixed with English characters.

本発明にかかる文書処理方法及び装置によれば、逆ローマ字変換部を表記選択部内に設けることにより、日本語と外国語とを混在させた文章を効率良く作成することができる。また、「特許 太郎」,「TOKKYOTARO」といった日本人の住所、氏名等を日本語とローマ字でそれぞれ並記した文章を作成する場合にも、ローマ字でかな入力して次候補のリクエストをするだけでローマ字変換できるので大変便利であり、更に、このローマ字変換された単語は辞書に環境設定パラメータに対応して自動登録できるので、いわゆるユーザの辞書登録操作からユーザが開放され、外国語を日本語と区別することなく統合して処理することができる。   According to the document processing method and apparatus according to the present invention, it is possible to efficiently create a sentence in which Japanese and a foreign language are mixed by providing a reverse Roman character conversion section in the notation selection section. In addition, when creating sentences that include Japanese addresses and names in Japanese and Roman characters, such as “Patent Taro” and “TOKYOTARO”, just input the kana in Roman characters and request the next candidate. Romaji conversion is very convenient because it can be converted automatically, and words that have been converted to Romaji can be automatically registered in the dictionary in accordance with the environment setting parameters. It can be integrated and processed without distinction.

以下に添付図面を参照して、この発明にかかる文書処理方法及び装置の好適な実施の形態を詳細に説明する。   Exemplary embodiments of a document processing method and apparatus according to the present invention will be explained below in detail with reference to the accompanying drawings.

(実施の形態)
図1はこの発明の文書処理装置のハードウェアの概略構成の一例を示すブロック図であり、MPU(マイクロプロセッサ)2により文書処理装置の各種処理が実行され、キーボード4又はマウス5により、読み文字列の入力や変換指示、確定指示等の各種のユーザ入力操作が行なわれるようになっている。CRTや液晶等の表示手段6には、入力中の文書や、かな漢字変換候補、操作ガイドメッセージ等が表示され、ROM10にはMPU2が実行する各種の制御プログラムや実行プログラムが使用する共通データ等が格納されている一方、ハードディスク、光ディスク、フラッシュメモリ等の記憶手段12には、文書処理プログラムや、かな文書変換辞書14a,数式変換辞書14b、化学式変換辞書14c,郵便番号辞書14d,同類語辞書14e,…,医学用語辞書14x等の各種辞書類が格納されており、かな文書変換処理で適宜参照されるようになっている。また、RAM20にはMPU2が各種の処理を実行するための作業エリアや、記憶手段12から読出されたかな文書変換部22、辞書14a〜14x等が装置の起動時に適宜設定されるようになっている。更に、かな文書変換部22には、かな漢字変換やかなローマ字変換(これらの変換処理を以下かな文書変換と呼ぶ。)処理のための入出力制御部30及びかな文書変換を実行する変換エンジン部70a等が設けられていると共に、上述の各部はバス8を介して相互にデータの授受を行なうようになっている。
(Embodiment)
FIG. 1 is a block diagram showing an example of a schematic configuration of hardware of a document processing apparatus according to the present invention. Various processes of the document processing apparatus are executed by an MPU (microprocessor) 2, and reading characters are read by a keyboard 4 or a mouse 5. Various user input operations such as column input, conversion instruction, and confirmation instruction are performed. The display means 6 such as a CRT or liquid crystal displays a document being input, Kana-Kanji conversion candidates, operation guide messages, and the like, and the ROM 10 contains various control programs executed by the MPU 2 and common data used by the execution programs. On the other hand, the storage means 12, such as a hard disk, an optical disk, or a flash memory, stores a document processing program, a kana document conversion dictionary 14a, a mathematical expression conversion dictionary 14b, a chemical expression conversion dictionary 14c, a postal code dictionary 14d, and a synonym dictionary 14e. ,..., Various medical dictionaries such as a medical term dictionary 14x are stored, and are appropriately referred to in the kana document conversion process. Further, the RAM 20 is appropriately set with a work area for the MPU 2 to execute various processes, a kana document conversion unit 22 read from the storage means 12, and the dictionaries 14a to 14x when the apparatus is started up. Yes. Further, the kana document conversion unit 22 includes an input / output control unit 30 for kana-kanji conversion and romaji conversion (these conversion processes are hereinafter referred to as kana document conversion) and a conversion engine section 70a for executing kana document conversion. The above-described units exchange data with each other via the bus 8.

図2はかな文書変換部22(入出力制御30及び変換エンジン部70a)と辞書14a〜14xの関係を示すソフトウエアの機能ブロック図であり、かな漢字変換処理等を含む文書処理プログラム実行部23から出力されるキー操作情報を入出力制御部30が受信すると、入出力制御部30内の判定処理部40により、受信したキー操作情報がキーボード4から出力された読み文字列用のデータキー情報なのか、キーボード4又はマウス5から出力された変換指示、確定指示、メニュー表示指示等の指示情報入力なのか判定され、読み文字列用データキー情報の場合はデータキー処理部42の中のかな入力処理部44又はローマ字入力処理部46で処理されて格納部50の内部に設けられている読み文字列バッファ52へ順次書込まれるようになっている。尚、ローマ字入力処理部46の内部には、ローマ字かな変換部48が設けられており、特定のローマ字文字列が入力された場合、ローマ字かな変換テーブル又は連続子音文字入力時の規則等に従って、かな変換できるローマ字文字列を順次かな文字に変換するようになっている。   FIG. 2 is a functional block diagram of software showing the relationship between the kana document conversion unit 22 (input / output control 30 and conversion engine unit 70a) and the dictionaries 14a to 14x. From the document processing program execution unit 23 including the kana-kanji conversion processing and the like. When the input / output control unit 30 receives the output key operation information, the received key operation information is the data key information for the read character string output from the keyboard 4 by the determination processing unit 40 in the input / output control unit 30. Or the instruction information input such as conversion instruction, confirmation instruction, menu display instruction, etc. output from the keyboard 4 or mouse 5, and in the case of reading character string data key information, the kana input in the data key processing unit 42 It is processed by the processing unit 44 or the Romaji input processing unit 46 and is sequentially written into the reading character string buffer 52 provided in the storage unit 50. Going on. Note that a Roman character Kana conversion unit 48 is provided inside the Roman character input processing unit 46, and when a specific Roman character string is input, the Kana conversion table or the rules for inputting continuous consonant characters are used. Romaji character strings that can be converted are sequentially converted to Kana characters.

一方、指示情報入力の場合には、判定処理部40で指示内容がチェックされ、例えばかな文書変換指示の場合には、判定処理部40から変換エンジン部70a等へかな文書変換指令が出力され、読み文字列バッファ52から変換対象文字列が取出されて、変換エンジン部70aにより、かな漢字変換又はかなローマ字変換等のかな文書変換処理が適宜実行され、変換結果が格納部50内の表示文字列バッファ54に書込まれて、表示部60の制御のもとに表示手段6に表示されるようになっている。尚、変換エンジン部70aは、それぞれ辞書14a〜14xに記憶されている文法情報90や単語情報92を参照して文節の区切り位置を推定する基本解析部72と、基本解析部72から出力される文節区切り候補に対して文法/単語情報のチェックをすると共に共起用例情報94を参照して同音語選択処理等を行ない、更に文節区切り候補の絞り込みを行なう文節区切り処理部74と、文節区切り処理部74の処理では表記が未決定の文節に対して表記の決定を行なう表記選択部80と、表記選択部80で決定された単語が辞書14a等に登録されていない単語の場合、この単語の読み、表記、品詞等の情報を辞書14a等に自動登録する自動辞書登録部76等から構成されており、表記選択部80の内部には、この発明の特徴である切出された文節の単語部分をかな文字からローマ字文字に変換すると共に、表示文字サイズも変更可能な逆ローマ字変換部82が更に設けられている。   On the other hand, in the case of instruction information input, the instruction content is checked by the determination processing unit 40. For example, in the case of a kana document conversion instruction, a kana document conversion command is output from the determination processing unit 40 to the conversion engine unit 70a, etc. A conversion target character string is extracted from the reading character string buffer 52, and a kana document conversion process such as kana-kanji conversion or kana romaji conversion is appropriately executed by the conversion engine unit 70a, and the conversion result is displayed in the display character string buffer in the storage unit 50. 54 and displayed on the display means 6 under the control of the display unit 60. The conversion engine unit 70a outputs the basic analysis unit 72 that estimates the segment break position by referring to the grammatical information 90 and the word information 92 stored in the dictionaries 14a to 14x, and the basic analysis unit 72, respectively. Grammar / word information is checked for phrase break candidates, a homophone selection process is performed with reference to the co-occurrence example information 94, and a phrase break processing unit 74 that further narrows down the phrase break candidates, and a phrase break process In the processing of the part 74, when the notation selection unit 80 that determines the notation for a phrase whose notation is not yet determined and the word determined by the notation selection unit 80 is a word that is not registered in the dictionary 14a or the like, An automatic dictionary registration unit 76 that automatically registers information such as readings, notations, parts of speech, etc. in the dictionary 14a, etc. Converts the-word portion of the clauses from kana characters into Roman characters characters, display character sizes alterable inverse romaji conversion portion 82 is further provided.

また、辞書14a〜14xには、文法情報90、単語情報92、共起用例情報94、学習情報96等が格納されており、文法情報90には単語間の文法的な結びつきの正否に関する情報や、その結びつきの強さに関する情報等がある。例えば、「名詞(助詞なし)+接尾語は結びつきが強い、名詞(助詞なし)+名詞は結びつきが強い」等の情報が格納されている。   The dictionaries 14a to 14x store grammatical information 90, word information 92, co-occurrence example information 94, learning information 96, and the like. The grammatical information 90 includes information on correctness of grammatical links between words, , Information on the strength of the connection. For example, information such as “noun (no particle) + suffix is strong, noun (no particle) + noun is strong” is stored.

単語情報92には、各々の単語の読み文字列、表記文字列、品詞情報及び活用情報等がある。   The word information 92 includes reading character strings, notation character strings, part-of-speech information, utilization information, and the like of each word.

共起用例情報94とは、意味的な結びつきの強い単語間の2項関係情報である。そして、この共起用例情報94とは単に2つの結びつきの他に、「人」,[花」等の属性単位の共起用例や、付加的な制限情報を含むものである。付加的な制限情報としては、例えば、「を」,「が」等の助詞情報、成立する向きの情報等がある。共起用例の例を示すと、「暑い−夏」,「厚い−本」,「熱い−お湯」…(単語の結びつき)
「人(彼,彼女,先生,恋人,等)に−会う」…(属性単位の共起用例)
「花(チューリップ,菊,等)が−咲く」…(属性単位の共起用例)
「話を−聞く」,「薬が−効く」,「機転が−利く」…(助詞の制限情報)
「家庭−教育」,「教育−過程」…(向きの制限情報)
というようになる。以上のような共起用例情報94は、意味情報であり、これを用いることにより同音語の多義性が解消される。
The co-occurrence example information 94 is binary relation information between words having strong semantic connection. The co-occurrence example information 94 includes co-occurrence examples of attribute units such as “person” and “flower” and additional restriction information in addition to the two connections. Additional restriction information includes, for example, particle information such as “O” and “GA”, information on the direction in which it is established, and the like. Examples of co-occurrence examples are "hot-summer", "thick-book", "hot-hot water" ... (word connection)
"Meet people (he, girlfriend, teacher, lover, etc.)" ... (example of co-occurrence in attribute units)
"Flowers (tulips, chrysanthemums, etc.) bloom" ... (example of co-occurrence in attribute units)
"Speak-listen", "medicine-works", "promotion-works" ... (participant restriction information)
"Home-education", "Education-process" ... (direction restriction information)
And so on. The co-occurrence example information 94 as described above is semantic information, and the use of this information eliminates the ambiguity of homophones.

例えば、共起用例情報94による同音語の一例を示すと、「あつい/ほん」という読みに対して変換処理を行なう際に、共起用例情報94における「厚い−本」という結びつきの情報から「厚い」が選択され、「熱い,暑い」等は選択されない。従って、「厚い/本」という変換結果が即座に得られる。このように、共起用例情報94を用いることにより変換効率の向上が図れる。   For example, when an example of a homophone using the co-occurrence example information 94 is shown, when the conversion process is performed on the reading “hot / hon”, the “thick-book” information in the co-occurrence example information 94 indicates “ “Thick” is selected, and “hot, hot” or the like is not selected. Therefore, the conversion result of “thick / book” is obtained immediately. Thus, the conversion efficiency can be improved by using the co-occurrence example information 94.

学習情報96は、最も最近に使用された表記を優先して採用する場合等で使用されるようになっている。   The learning information 96 is used when, for example, the most recently used notation is preferentially adopted.

更に、入出力制御部30には、環境設定部62が設けられており、キーボード4からデータキー入力する場合、かな文字として入力するのか、ローマ字入力するのかを切替えて設定する入力モード設定機能や、ローマ字かな変換テーブルデータの変更処理、連文節/単文節等の変換モード設定、JIS/シフトJIS等のコード体系等が適宜選択できるようになっている。   Further, the input / output control unit 30 is provided with an environment setting unit 62. When inputting data keys from the keyboard 4, an input mode setting function for switching between input as kana characters or input in Roman characters, Further, it is possible to appropriately select a romaji-kana conversion table data changing process, a conversion mode setting such as a continuous phrase / single phrase, and a code system such as JIS / shift JIS.

かかる構成において、その動作を説明する。先ず、文書処理の動作原理を図3を参照して簡単に説明すると、表示手段6に表示された文書処理の編集画面100には、文章を表示するエリアの他に各種メセージや状態を表示したり、同音異義語の候補を表示するエリア110が画面下方に設けられている。エリア110を拡大して示したのが同図の右側部分であり、エリア110の中のエリア120は次候補群表示のための指示が与えられたとき、それらの単語候補を表示する領域として主に使用される。   In this configuration, the operation will be described. First, the operation principle of document processing will be briefly described with reference to FIG. 3. The document processing editing screen 100 displayed on the display means 6 displays various messages and states in addition to the text display area. Or an area 110 for displaying candidates for homonyms is provided at the bottom of the screen. The area 110 is shown in an enlarged manner on the right side of the figure, and the area 120 in the area 110 is a main area for displaying those word candidates when an instruction for displaying the next candidate group is given. Used for.

ここで、“挿入”というのはキーボード4から入力された文字列をカーソル102の直前に挿入することを意味しており、“確定”はかな漢字変換等のかな文書変換をしてユーザが選択した単語を後で再度読みに戻すことをしないモードになっていることを意味する。“連カナ漢”はかな漢字変換モードが連文節でって、カナ入力であることを示している。尚、上述の“挿入”及び“カナ漢”は、所定の制御キーを操作することにより、“挿入”と“上書”、及び“カナ漢”とローマ字入力の“R漢”が相互に適宜変更可能になっている。   Here, “insert” means that the character string input from the keyboard 4 is inserted immediately before the cursor 102, and “confirm” is selected by the user after performing kana-kanji conversion such as kana-kanji conversion. This means that you are in a mode where you do not want to read the word again later. “Kana-Kana” indicates that the Kana-Kanji conversion mode is continuous phrase and Kana input. The above-mentioned “Insert” and “Kana Han” can be appropriately changed between “Insert” and “Overwrite”, and “Kana Han” and “R Han” for Roman input by operating the predetermined control keys. It has become.

さて、図3の画面において、ユーザはキーボード4より読みを入力することになるが、必要に応じて変換キーを押下することでそれまで入力した読みに対するかな文書変換処理を実行する。この結果、画面のカーソル102の位置に、各々の読みで変換された優先度の高い単語からなる文(もしくは文節)が未確定の状態で表示される。このとき、次候補キーを押下すると、表示された未確定単語のうち、先頭の文節の候補群がエリア120に表示される。   Now, in the screen of FIG. 3, the user inputs a reading from the keyboard 4, but if necessary, the conversion key is pressed to execute a kana document conversion process for the reading input so far. As a result, a sentence (or phrase) consisting of a high-priority word converted by each reading is displayed in an undetermined state at the position of the cursor 102 on the screen. At this time, when the next candidate key is pressed, a candidate group of the first phrase among the displayed unconfirmed words is displayed in the area 120.

尚、この実施の形態ではかな文書変換キー及び次候補キーともスペースキーが対応している。すなわち、読みを入力した直後にスペースキーが押下された時は、かな文書変換キーとして判断し、続けてスペースキーが入力したときには次候補キーとして処理される。また、読みを入力せず、単にスペースキーが入力されたとき又はコントロールキーとシフトキーとスペースキーとが同時に押下された時には本来の空白文字の入力として処理される。そして、候補の確定は変換キーを押下したときの状態(第1候補)で良ければその時点でリターンキーを押下するか、もしくは続いて読みキーを押下することでなされる。また、次候補キーを押下して候補群をエリア120に表示した時にはその候補のいずれかを選択(候補群には番号が付されていて、その番号を入力)したのち、リターンキー(確定キー)を押下することで確定する。
[かな入力モードでのかな文書変換処理の説明]以下、図4のフローチャート及び図5の編集画面例を参照して、この発明の文書処理動作を詳細に説明する。尚、説明に先立ち、この実施の形態におけるかな文書変換処理、次候補表示処理は共にスペースキーによって実行される。次候補表示処理か否かは、スペースキーが押下されたとき、直前の文字が未確定状態か否かを判断し処理すれば良い。また、未確定の候補が確定するのは、未確定状態で確定キー(リターンキー)を押下するか、もしくは未確定状態で新たな読みキー(読み文字を入力するためのキー)が入力されたときである。また、読みが確定している時に入力したリターンキーは文字どおり改行キーを示す。また、図2に示す環境設定部62を起動して、データキー処理部42はかな入力処理部44がアクティブ状態となり、ローマ字入力処理部46は休止状態となっているものとする。
In this embodiment, the space key corresponds to the kana document conversion key and the next candidate key. That is, when the space key is pressed immediately after inputting a reading, it is determined as a kana document conversion key, and when the space key is subsequently input, it is processed as the next candidate key. Further, when a space key is simply input without inputting a reading, or when the control key, the shift key, and the space key are simultaneously pressed, the input is processed as an original blank character input. If the candidate is confirmed in the state (first candidate) when the conversion key is pressed, the return key is pressed at that time, or the reading key is subsequently pressed. When the candidate group is displayed in the area 120 by pressing the next candidate key, one of the candidates is selected (the candidate group is numbered and the number is input), and then the return key (confirmation key) is selected. ) To confirm.
[Description of Kana Document Conversion Processing in Kana Input Mode] The document processing operation of the present invention will be described in detail below with reference to the flowchart of FIG. 4 and the editing screen example of FIG. Prior to the description, both the kana document conversion process and the next candidate display process in this embodiment are executed by the space key. Whether or not the next candidate display process is performed may be determined by determining whether or not the immediately preceding character is in an unconfirmed state when the space key is pressed. Also, the unconfirmed candidate is confirmed when the confirm key (return key) is pressed in the unconfirmed state, or a new reading key (key for inputting the reading character) is input in the unconfirmed state. Is the time. Also, the return key entered when the reading is confirmed literally indicates a line feed key. Further, it is assumed that the environment setting unit 62 shown in FIG. 2 is activated, and the data key processing unit 42 is in the active state of the kana input processing unit 44 and the Roman character input processing unit 46 is in a paused state.

さて、キーボード4をかな入力モードで入力操作して図5(B)に示すような文字列を入力すると、各キーが文字入力か否か判定され(図4のステップS2)、今回は文字入力であるので、これらのかな文字が読み文字列バッファ52へ順次格納される(図4のステップS4)。尚、図5(B)の例ではかな文字列として全てかな文字から構成された文字列を示したが、かな文字を拡張して英文字混じりのかな文字列(例えばCおMぱQ,いんてL,GM,げ,いBM,どS等)に対しても以下の処理が適用できることは当業者に明らかである。次に、図5(B)の文字列を全てキー入力し終った時点で、変換指示を示すスペースキーを押下すると、判定処理部4により、このスペースキーが変換指示と解釈され(図4のステップS6)、変換エンジン部70aへかな文書変換指令が出力される。   When the keyboard 4 is input in the kana input mode and a character string as shown in FIG. 5B is input, it is determined whether or not each key is a character input (step S2 in FIG. 4). Therefore, these kana characters are sequentially stored in the read character string buffer 52 (step S4 in FIG. 4). In the example of FIG. 5B, a character string composed of all kana characters is shown as the kana character string. However, the kana character is expanded to include a kana character string mixed with English characters (for example, C O Mpa Q, In It will be apparent to those skilled in the art that the following processing can be applied to L, GM, Ge, BM, DoS, etc. Next, when the space key indicating the conversion instruction is pressed when all the character strings in FIG. 5B have been entered, the determination processing unit 4 interprets the space key as the conversion instruction (see FIG. 4). In step S6), a kana document conversion command is output to the conversion engine unit 70a.

かくして、変換エンジン部70aが起動されると、読み文字列バッファ52から図5(B)に示す変換対象の読み文字列が変換エンジン部70aに読込まれ、辞書14aを参照してかな文書変換処理が実行される(図4のステップS8)。この変換処理では、かな漢字辞書をベースにした辞書14aを参照した日本語変換処理が先ず実行され、基本解析部72により読込んだ読み文字列の文節候補が抽出され、抽出された文節候補が文節区切り処理部74により文法的、意味的にチェックされて文節候補が絞り込まれ、文節区切り処理され、かな漢字変換された文書文字列が未確定な状態で表記選択部80に渡されると共に、表示文字列バッファ54にも書込まれ表示手段6に図5(C)のような状態で表示される(図4のステップS10)。但し、辞書14aには読みは「いんてL」、表記は「INTEL」の単語や、読みは「げ」表記「GE」の単語、また、読みは「どS」表記「DOS」等の単語が登録可能であり、これらの読みが辞書14aに予め登録されていれば、登録済みの単語が優先的に処理されて文節処理されるようになっている。   Thus, when the conversion engine unit 70a is activated, the reading character string to be converted shown in FIG. 5B is read from the reading character string buffer 52 into the conversion engine unit 70a, and the kana document conversion process is performed with reference to the dictionary 14a. Is executed (step S8 in FIG. 4). In this conversion processing, Japanese conversion processing with reference to the dictionary 14a based on the Kana-Kanji dictionary is first executed, and the phrase candidate of the read character string read by the basic analysis unit 72 is extracted, and the extracted phrase candidate is the phrase. The delimiter processing unit 74 checks grammatically and semantically to narrow down the phrase candidates, performs the phrase delimiter processing, and passes the kana-kanji converted document character string to the notation selection unit 80 in an indeterminate state, as well as the display character string It is also written in the buffer 54 and displayed on the display means 6 in a state as shown in FIG. 5C (step S10 in FIG. 4). However, in the dictionary 14a, the word “Intel L” is used for reading, the word “INTEL” is used for reading, the word “GE” is used for reading, and the word “DOS” is used for reading. Can be registered, and if these readings are registered in the dictionary 14a in advance, the registered word is processed preferentially and the phrase processing is performed.

この変換結果が正しければ、続けて確定指示のリターンキーを押下すれば良いが、図5(C)の例では所望の結果が得られなかったので、次候補キーとしてスペースキーを押下すると(図4のステップS12)、表記選択部80の内部に設けられた逆ローマ字変換部82が起動され、この例では「だて」を図7に示すような変換テーブルを利用してローマ字「DATE」に変換し全角サイズで表記した第1候補と、ローマ字「date」に変換し半角サイズで表記した第2候補と、辞書14aから読み出した第3乃至第7の候補とが合成されて図5(D)に示すような形式で候補表示エリア120に提示される。すなわち、辞書14aに登録されていない候補が登録されている候補と同時に表示され、ユーザの選択対象として提示される(図4のステップS10)。   If this conversion result is correct, it is sufficient to continuously press the return key of the confirmation instruction. However, in the example of FIG. 5C, the desired result was not obtained, so when the space key is pressed as the next candidate key (FIG. 4, the reverse romaji conversion unit 82 provided in the notation selection unit 80 is activated, and in this example, “date” is converted into the roman character “DATE” using a conversion table as shown in FIG. The first candidate converted and expressed in full-width size, the second candidate converted to Roman “date” and expressed in half-width size, and the third to seventh candidates read out from the dictionary 14a are combined and combined as shown in FIG. ) Is presented in the candidate display area 120 in the format shown in FIG. That is, a candidate that is not registered in the dictionary 14a is displayed at the same time as a registered candidate and presented as a user selection target (step S10 in FIG. 4).

かくしてエリア120に提示された次候補の中から、例えば数字1キー又はスペースキーを更に押して「1.DATE」を選択すると、エリア120の表示は図5(E)のように変化し、文章は図5(F)のように変更される(図4のステップS8及びS10)。この時点で所望の変換結果が得られたので、確定指示のため次のかな文字入力キーを押すか、リターンキーを押すと、判定処理部40により確定指示が入力されたと判定され(図4のステップS12)、変換結果が文書処理プログラム実行部23へ転送される(図4のステップS14)と共に、判定処理部40から表記選択部80へ逆ローマ字変換し、辞書14aに登録されていない単語が選択されたか否か問い合せ指令が出力され、今回は辞書登録されていない単語「DATE」が採用されたので、表記選択部80から判定処理部40に未登録単語有りのメッセージが返されると(図4のステップS16)、続いて判定処理部40から変換エンジン部70aの自動辞書登録部76に逆ローマ字変換された単語の自動辞書登録指令が出力される。   Thus, when the number 1 key or the space key is further pressed to select “1.DATE” from among the next candidates presented in the area 120, the display of the area 120 changes as shown in FIG. Changes are made as shown in FIG. 5F (steps S8 and S10 in FIG. 4). Since a desired conversion result is obtained at this point, when the next kana character input key is pressed for a confirmation instruction or the return key is depressed, it is determined that the confirmation instruction is input by the determination processing unit 40 (FIG. 4). In step S12), the conversion result is transferred to the document processing program execution unit 23 (step S14 in FIG. 4), and at the same time, the conversion processing from the determination processing unit 40 to the notation selection unit 80 is performed, and words not registered in the dictionary 14a are converted. An inquiry command is output as to whether or not it has been selected, and since the word “DATE” that is not registered in the dictionary is adopted this time, when a message with an unregistered word is returned from the notation selection unit 80 to the determination processing unit 40 (FIG. 4, and the automatic dictionary registration command for the words converted into the reverse Roman alphabet is output from the determination processing unit 40 to the automatic dictionary registration unit 76 of the conversion engine unit 70 a. .

すると、自動辞書登録部76では表記選択部80から逆ローマ字変換され確定した表記文字列D100及び読み文字列D102を図6に示すように受け取り、通常、品詞欄D104は一般名詞に設定して辞書14aの単語情報92にこの未登録単語を追加登録し、学習情報96を更新する(図4のステップS18)。かくしてユーザの辞書登録操作を一切要求することなく、自動的に辞書14aに新しい単語が登録できた。従って、例えば、次にユーザが「ひづけのかくにんには、だてとにゅうりょくする。」とかな入力して変換キーを押すと「日付の確認には、DATEと入力する。」と一回で正しくかな文書変換ができる。すなわち、日英辞書や英日辞書等を特別用意しておかなくても、外国語の単語をオリジナルのまま入力してかな漢字混じり文章の中に混在させることが可能となり、新規単語をユーザの操作により新規登録する必要もない。   Then, the automatic dictionary registration unit 76 receives the notation character string D100 and the reading character string D102 confirmed by reverse Romaji conversion from the notation selection unit 80, as shown in FIG. The unregistered word is additionally registered in the word information 92 of 14a, and the learning information 96 is updated (step S18 in FIG. 4). Thus, a new word could be automatically registered in the dictionary 14a without requiring any user dictionary registration operation. Therefore, for example, when the user next inputs “Kanato ni te ni te ni te ni ku” and presses the conversion key, for example, “DATE is entered for date confirmation”. ”And correct document conversion can be performed at once. In other words, even if you do not prepare a Japanese-English dictionary or English-Japanese dictionary, you can enter foreign words as they are and mix them in kana-kanji mixed text. There is no need for new registration.

尚、上述の新規単語の自動辞書登録動作では全て自動で辞書登録する動作を説明したが、品詞の設定は様々な種類があるので、ユーザが確認選択できるモードがあると更に便利である。すなわち、品詞登録条件は、例えば、次式に示すような3つのモードを用意しておき環境設定部62によりこれらのモードを適宜選択できるようにすると良い。
品詞登録条件モード1:品詞固定で「一般名詞」とする。
モード2:ユーザ選択可能な固定品詞[固有人名,固有企業名,名詞サ変…]
モード3:簡易対話式設定「登録します。よろしいですか?y/n」
「読み:cおmぱq」
「表記:COMPAQ」
「品詞:一般名詞,固有人名,固有企業名,名詞サ変,…」
すなわち、モード1及びモード2の自動登録では全て自動登録することができる。また、モード3では、品詞候補を自動辞書登録部76から提示し、ユーザがこれらの候補の中から所望の候補を選択し、登録のYes/Noを確認して辞書登録するようになっている。但し、単語の読み、表記に関してはユーザ入力する必要がない。
[ローマ字入力モードでのかな文書変換処理の説明]次に、図4のフローチャート及び図5の編集画面を参照して、この発明のローマ字入力モードでの文書処理動作を詳細に説明する。尚、リターンキー、変換キー、次候補キー等の操作はかな入力モードでの操作と同一である。また、図2に示す環境設定部62を操作して、データキー処理部42はかな入力処理部44が休止状態に、ローマ字入力処理部46がアクティブ状態に設定されているものとする。
In the above-described automatic dictionary registration operation for new words, the operation of automatically registering a dictionary has been described. However, since there are various types of part of speech settings, it is more convenient if there is a mode in which the user can confirm and select. In other words, the part-of-speech registration condition may be prepared, for example, by preparing three modes as shown in the following formula so that the environment setting unit 62 can select these modes as appropriate.
Part-of-speech registration condition mode 1: The part-of-speech is fixed and “general noun” is set.
Mode 2: Fixed part-of-speech that can be selected by the user [proprietary name, unique company name, noun change ...]
Mode 3: Simple interactive setting “Register. Are you sure? Y / n”
"Reading: c ompa q"
"Notation: COMPAQ"
“Part of speech: general noun, proper person name, proper company name, noun change,…”
In other words, all automatic registrations in mode 1 and mode 2 can be performed automatically. In mode 3, the part-of-speech candidates are presented from the automatic dictionary registration unit 76, and the user selects a desired candidate from these candidates, confirms Yes / No of registration, and registers the dictionary. . However, there is no need for user input for reading and writing of words.
[Description of Kana Document Conversion Processing in Roman Character Input Mode] Next, the document processing operation in the Roman character input mode of the present invention will be described in detail with reference to the flowchart of FIG. 4 and the editing screen of FIG. The operations of the return key, conversion key, next candidate key, etc. are the same as those in the kana input mode. Further, by operating the environment setting unit 62 shown in FIG. 2, it is assumed that the data key processing unit 42 is set to the kana input processing unit 44 in the paused state and the Roman character input processing unit 46 to the active state.

かかる初期状態において、キーボード4からローマ字入力モードで図5(A)に示すローマ字をキー入力すると、ローマ字入力処理部46により、これらのローマ字が次の規則によりかな変換できる場合にはローマ字かな変換部48によりかな変換されて読み文字列バッファ52へ順次書込まれる。また、かな変換できない英字、数字、記号キーの場合にはそのまま読み文字列バッファ52へ書込まれる。
ローマ字かな変換規則規則1:ローマ字文字列がローマ字かな変換部48に設けられたローマ字かな変換テーブルに登録されている文字列の場合には、優先して該当するローマ字文字列をかな文字に変換する。
規則2:英子音文字が連続して入力された場合は、最初の英子音文字を「っ」に変換し、以後規則1を繰り返す。
図5(A)に示す文字列に対して、上述のローマ字かな変換規則を適用すると、図5(B)のよな読み文字列に変換されて読み文字列バッファ52に書込まれる(図4のステップS2及びS4)。以後、スペースキーを押して変換指示入力し(ステップS6)、変換候補「DATE」を選択し、確定指示すると、未登録単語「DATE」が辞書14aに自動登録される過程は上述のかな入力モードでの操作及び動作説明と全く同一である。
In such an initial state, when the romaji shown in FIG. 5A is key-inputted from the keyboard 4 in the romaji input mode, the romaji input processing unit 46 can convert these romaji characters according to the following rules. 48 is converted into kana and sequentially written into the read character string buffer 52. In the case of English letters, numbers, and symbol keys that cannot be converted, they are read and written to the character string buffer 52 as they are.
Romaji-kana conversion rule rule 1: If the Romaji-character string is a character string registered in the Romaji-kana conversion table provided in the Romaji-kana conversion unit 48, the corresponding Romaji-character string is preferentially converted to a Kana character. .
Rule 2: When English consonant characters are continuously input, the first English character is converted to “”, and then Rule 1 is repeated.
When the above-described Roman Kana conversion rule is applied to the character string shown in FIG. 5A, the character string is converted into a reading character string as shown in FIG. 5B and written into the reading character string buffer 52 (FIG. 4). Steps S2 and S4). Thereafter, when the space key is pressed to input a conversion instruction (step S6), the conversion candidate “DATE” is selected and confirmed, the unregistered word “DATE” is automatically registered in the dictionary 14a in the above-described kana input mode. This is exactly the same as the operation and operation description.

そこで、次に図8(A)に示すようなローマ字入力を行なうと、これらのローマ字がかな変換されて図8(B)に示すような英子音混じりのかな文字列として読み文字列バッファ52に格納され、表示手段6に表示される(図4のステップS2及びS4)。この時点で、変換指示のためスペースキーを押すと(図4のステップS6)、判定処理部40から変換エンジン部70aにかな文書変換指令が出力され、辞書14aを参照しながら基本解析部72により文節候補が切り出され、切り出された文節候補が文節区切り処理部74により文法的、意味的にチェックされて絞り込まれ、最も確からしい日本文として図8(C)に示すような表記文字列に変換されて表記選択部80に渡される(図4のステップS8及びS10)。すなわち、辞書14aに登録されている単語が検出された場合には優先してこれらの単語処理を行ない、辞書14aに登録されていない場合には、変換候補として先ず、表記選択部80内に設けられた逆ローマ字変換部82により、これらのかな文字列を元のキー入力時のローマ字文字列に逆変換して、大文字全角、小文字半角、大文字半角、小文字全角等に変換し、ユーザに次候補の1つとして提示する。さらに、元のかな文字列のまま表示した文字列やひらがなをカタカナに変換した文字列を次候補の1つとして提示するとユーザの選択範囲を拡大することができる。また、次候補の提示の順番は逆ローマ字変換した文字列を優先的に提示するようにすると、日本語と外国語をより区別することなくユーザが取扱えるようになる。更に、逆ローマ字変換の英大文字への変換が先か英小文字への変換が先か、或いは全角表記が先か、半角表記文字列も次候補の1つとして表示するか等は、ユーザの選択によりカスタマイズできるようにしておくと、ユーザが逆ローマ字変換をより利用しやすくなる。   Then, when the romaji input as shown in FIG. 8A is performed next, these roman characters are converted into kana and read into the character string buffer 52 as a kana character string mixed with English sound as shown in FIG. 8B. It is stored and displayed on the display means 6 (steps S2 and S4 in FIG. 4). At this point, when the space key is pressed for a conversion instruction (step S6 in FIG. 4), a kana document conversion command is output from the determination processing unit 40 to the conversion engine unit 70a, and the basic analysis unit 72 refers to the dictionary 14a. Phrase candidates are extracted, and the extracted phrase candidates are grammatically and semantically checked and narrowed down by the phrase delimiter processing unit 74, and converted into a notation character string as shown in FIG. 8C as the most probable Japanese sentence. And passed to the notation selection unit 80 (steps S8 and S10 in FIG. 4). That is, when a word registered in the dictionary 14a is detected, these word processes are preferentially performed. When the word is not registered in the dictionary 14a, a conversion candidate is first provided in the notation selection unit 80. The reverse roman character conversion unit 82 converts these kana character strings back to romaji character strings at the time of key input and converts them to upper case full-width, lower case half-width, upper case half-width, lower case full-width, etc. It is presented as one of Furthermore, when a character string displayed as the original kana character string or a character string obtained by converting hiragana into katakana is presented as one of the next candidates, the user's selection range can be expanded. In addition, if the next candidate is presented with priority given to a character string that has been subjected to reverse Roman alphabet conversion, the user can handle Japanese and foreign languages without further distinction. Furthermore, the user can select whether reverse Roman alphabet conversion is first or lower case, full-width notation first, half-width notation character string is displayed as one of the next candidates, etc. By making it possible to customize it, it becomes easier for the user to use reverse romaji conversion.

図8(C)の例では英大文字全角サイズでの表記を第1の次候補として表示しており、この例の場合には、この表記変換結果が望む変換結果なので、次にリターンキーを押すか他のローマ字キーを入力すると確定指示が入力され(図4のステップS12)、変換結果が文書処理プログラム実行部23に出力される(図4のステップs14)。その後、判定処理部40から表記選択部80へ逆ローマ字変換部82で変換された次候補文字列が確定単語として採用されたか否か問い合せ信号が出力され、今回は「COMPAQ」が辞書14aには登録されていないが、新単語として採用された旨の応答とがあると、(図4のステップS16)さらに、判定処理部40から自動辞書登録部76へ単語「COMPAQ」を読み「CおMぱQ」品詞「一般名詞」で登録するように自動登録指令が出力され、辞書14aの単語情報92等へ単語「COMPAQ」が自動登録される(図4のステップS18)。かくして、逆ローマ字変換された候補文字列だけをその候補文字列が採用された場合、辞書14aに順次自動登録することが可能となり、この機能は日本語と外国語とを混在させた日本語文章を作成する場合、モード変換キーや辞書登録操作をユーザに一切要求しないで新規外国語を辞書登録できるので、大変便利である。   In the example of FIG. 8C, a notation in English capital full-width size is displayed as the first next candidate. In this example, since this notation conversion result is the desired conversion result, the return key is pressed next. When another Romaji key is input, a confirmation instruction is input (step S12 in FIG. 4), and the conversion result is output to the document processing program execution unit 23 (step s14 in FIG. 4). Thereafter, an inquiry signal is output from the determination processing unit 40 to the notation selection unit 80 as to whether or not the next candidate character string converted by the reverse Romaji conversion unit 82 has been adopted as a confirmed word, and this time “COMPAQ” is stored in the dictionary 14a. If there is a response indicating that it has not been registered but has been adopted as a new word (step S16 in FIG. 4), the determination processing unit 40 further reads the word “COMPAQ” to the automatic dictionary registration unit 76 and reads “COM”. An automatic registration command is output so as to register with “PQ” part-of-speech “general noun”, and the word “COMPAQ” is automatically registered in the word information 92 and the like of the dictionary 14a (step S18 in FIG. 4). Thus, if only candidate character strings that have been converted to reverse Roman characters are adopted, it is possible to automatically register them sequentially in the dictionary 14a, and this function is a Japanese sentence that is a mixture of Japanese and foreign languages. This is very convenient because a new foreign language can be registered in the dictionary without requiring the user to perform any mode conversion key or dictionary registration operation.

なお、本実施の形態で説明した文書処理方法は、予め用意されたプログラムをパーソナル・コンピュータやワークステーション等のコンピュータで実行することにより実現することができる。このプログラムは、ハードディスク、フレキシブルディスク、CD−ROM、MO、DVD等のコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。またこのプログラムは、インターネット等のネットワークを介して配布することが可能な伝送媒体であってもよい。   The document processing method described in this embodiment can be realized by executing a program prepared in advance on a computer such as a personal computer or a workstation. This program is recorded on a computer-readable recording medium such as a hard disk, a flexible disk, a CD-ROM, an MO, and a DVD, and is executed by being read from the recording medium by the computer. Further, this program may be a transmission medium that can be distributed via a network such as the Internet.

この発明のハードウェア構成の一実施例を示すブロック図である。It is a block diagram which shows one Example of the hardware constitutions of this invention. この発明のソフトウェアの機能構成の一実施例を示す図である。It is a figure which shows one Example of the function structure of the software of this invention. この発明で使用する文書編集画面の表示の一例を示す図である。It is a figure which shows an example of a display of the document edit screen used by this invention. この発明の動作を説明するためのフローチャートである。It is a flowchart for demonstrating operation | movement of this invention. この発明のかな文書変換過程の一例を示す図である。It is a figure which shows an example of the kana document conversion process of this invention. 自動辞書登録する単語のパラメータ構成の一例を示す図である。It is a figure which shows an example of the parameter structure of the word registered into an automatic dictionary. かなローマ字変換用テーブルの一例である。It is an example of a Kana romaji conversion table. ローマ字入力された読み文字列のかな文書変換過程の一例を示す図である。It is a figure which shows an example of the kana document conversion process of the reading character string input into the Roman character.

符号の説明Explanation of symbols

2 MPU
4 キーボード
5 マウス
6 表示手段
10 ROM
12 記憶手段
14a,…,14x 辞書
20 RAM
22 かな文書変換部
30 入出力制御部
40 判定処理部
44 かな入力処理部
46 ローマ字入力処理部
52 読み文字列バッファ
54 表示文字列バッファ
62 環境設定部
70a,…,70x 変換エンジン部
76 自動辞書登録部
80 表記選択部
82 逆ローマ字変換部
2 MPU
4 Keyboard 5 Mouse 6 Display means 10 ROM
12 storage means 14a, ..., 14x dictionary 20 RAM
22 Kana document conversion unit 30 Input / output control unit 40 Determination processing unit 44 Kana input processing unit 46 Roman character input processing unit 52 Reading character string buffer 54 Displayed character string buffer 62 Environment setting unit 70a, ..., 70x Conversion engine unit 76 Automatic dictionary registration Part 80 Notation selection part 82 Reverse Roman character conversion part

Claims (24)

少なくともかな文字入力が可能な入力手段と、この入力手段から入力されるかな文字列をかな文書変換辞書を介して文書文字列に変換するかな文書変換手段とを具えたかな入力式文書処理装置において、前記かな文字列を逆ローマ字規則により英文字列に変換するかな英字変換手段を設け、前記かな文書変換辞書の単語変換候補に、前記逆ローマ字規則により生成した英文字列を追加して提示/選択できるようにしたかな入力式文書処理装置。   In a kana input type document processing apparatus comprising at least an input means capable of inputting kana characters and a kana document conversion means for converting a kana character string input from the input means into a document character string via a kana document conversion dictionary The Kana character string conversion means for converting the Kana character string into an English character string according to the reverse Roman character rule is provided, and the English character string generated according to the reverse Roman character rule is added to the word conversion candidate of the Kana document conversion dictionary. Kana input type document processing device that can be selected. 前記かな文字列に英文字または英記号を含む請求項1に記載のかな入力式文書処理装置。   The kana input type document processing apparatus according to claim 1, wherein the kana character string includes English characters or English symbols. 前記逆ローマ字規則により生成した英文字列が変換単語として選択され確定した場合には、この新単語を以下の条件で前記かな文書変換辞書に自動登録するようした請求項1又は2に記載のかな入力式文書処理装置。
登録条件
当該単語の読み:かな文字列
当該単語の表記:かな文字列を逆ローマ字規則により変換した英文字列
The kana according to claim 1 or 2, wherein when an English character string generated by the reverse Roman character rule is selected and confirmed as a conversion word, the new word is automatically registered in the kana document conversion dictionary under the following conditions. Input-type document processing device.
Registration conditions Reading of the word: Kana character string Notation of the word: English character string converted from the Kana character string using the reverse Roman alphabet rule
前記英文字列を単語候補としてユーザに提示する場合、表示文字サイズを切替えて大きさの異なる複数のサイズの英文字列をユーザに提示することが可能な請求項1乃至3に記載のかな入力式文書処理装置。   The kana input according to any one of claims 1 to 3, wherein when the English character string is presented to a user as a word candidate, an English character string of a plurality of sizes having different sizes can be presented to the user by switching a display character size. Formula document processing device. 前記英文字列を単語候補としてユーザに提示する場合、他のかな文書変換候補より優先してユーザに提示することが可能な請求項1乃至4に記載のかな入力式文書処理装置。   5. The kana input-type document processing apparatus according to claim 1, wherein when the English character string is presented to a user as a word candidate, it can be presented to the user in preference to other kana document conversion candidates. 少なくともかな文字入力が可能な入力手段を介してかな文字列を入力するかな文字列入力工程と、このかな文字列をかな文書変換辞書を介して文書文字列に変換するかな文書変換工程とを含み、更に、このかな文書変換工程の中に、かな文書変換の単語候補として変換対象かな文字列を逆ローマ字規則を適用して英文字列に変換し、生成された英文字列をユーザに提示することが可能な逆ローマ字変換工程を含むことを特徴とするかな入力式文書処理方法。   A kana character string input step for inputting a kana character string via an input means capable of inputting at least kana characters, and a kana document conversion step for converting the kana character string into a document character string via a kana document conversion dictionary. Furthermore, in this Kana document conversion process, the Kana character string to be converted is converted into an English character string by applying the reverse Roman alphabet rule as a word candidate for Kana document conversion, and the generated English character string is presented to the user. A kana input-type document processing method characterized by including a reverse romaji conversion step. 前記かな文字列に英文字または英記号を含む請求項6に記載のかな入力式文書処理方法。   The kana input-type document processing method according to claim 6, wherein the kana character string includes English characters or English symbols. 前記逆ローマ字変換工程で生成された英文字列が採用され確定した場合には、この新単語を以下の条件で前記かな文書変換辞書に自動登録するようにした請求項6又は7に記載のかな入力式文書処理方法。
登録条件
当該単語の読み:かな文字列
当該単語の表記:かな文字列を逆ローマ字規則により変換した英文字列
8. The kana according to claim 6, wherein when the English character string generated in the reverse Roman alphabet conversion step is adopted and confirmed, the new word is automatically registered in the Kana document conversion dictionary under the following conditions. Input type document processing method.
Registration conditions Reading of the word: Kana character string Notation of the word: English character string converted from the Kana character string using the reverse Roman alphabet rule
前記英文字列を単語候補としてユーザに提示する場合、表示文字サイズを切替えて大きさの異なる複数のサイズの英文字列をユーザに提示することが可能な請求項6乃至8に記載のかな入力式文書処理方法。   The kana input according to any one of claims 6 to 8, wherein when the English character string is presented to a user as a word candidate, an English character string having a plurality of different sizes can be presented to the user by switching a display character size. Formula document processing method. 前記英文字列を単語候補としてユーザに提示する場合、他のかな文書変換候補より優先してユーザに提示することが可能な請求項6乃至9に記載のかな入力式文書処理方法。   10. The kana input-type document processing method according to claim 6, wherein when the English character string is presented to the user as a word candidate, the English character string can be presented to the user with priority over other kana document conversion candidates. 少なくとも英文字入力が可能な入力手段と、この入力手段から入力される英文字列をローマ字規則によりかな混じり文字列に変換する英字かな変換手段と、この英字かな変換手段により変換されたかな混じり文字列をかな文書変換辞書を介して文書文字列に変換するかな文書変換手段とを具えたローマ字入力式文書処理装置において、前記かな混じり文字列を文書文字列に変換する場合、仮に確定したかな文書変換の単語の候補に、前記ローマ字規則を逆変換して前記入力手段から入力した英文字列を無変換で並べた無変換英文字列を追加して提示することが可能な逆ローマ字変換部を設けたことを特徴とするローマ字入力式文書処理装置。   At least an input means that can input English characters, an English character kana conversion means that converts an English character string input from this input means into a character string according to the Roman alphabet rules, and a kana mixed character converted by this English character kana conversion means In a Roman character input type document processing device comprising kana document conversion means for converting a string into a document character string via a kana document conversion dictionary, when the kana mixed character string is converted into a document character string, a kana document that has been temporarily determined A reverse Roman alphabet conversion unit capable of adding and presenting an unconverted English character string in which English character strings input from the input means are reversely converted and arranged without conversion to candidates for conversion. A Roman character input type document processing apparatus characterized by being provided. 前記かな混じり文字列を文書文字列に変換する場合、前記かな文書変換辞書に登録されていない未確定かな文字列に対しては、前記かな文書変換の単語の候補に、前記ローマ字規則を逆変換して前記入力手段から入力した英文字列を無変換で並べた無変換英文字列を提示することが可能な逆ローマ字変換部を設けたことを特徴とする請求項11に記載のローマ字入力式文書処理装置。   When converting the kana-mixed character string into a document character string, the romaji rule is inversely converted to the kana document conversion word candidate for an unconfirmed kana character string that is not registered in the kana document conversion dictionary. 12. The Roman character input expression according to claim 11, further comprising a reverse Roman character conversion unit capable of presenting a non-converted English character string in which English character strings input from the input means are arranged without conversion. Document processing device. 前記無変換英文字列の語尾の英文字列がかな変換可能で日本語の助詞、接続詞等に変換しても仮確定済みの他の日本語文書文字列と矛盾しない場合には、前記語尾の英文字列だけ再びかな変換してユーザに提示することが可能な請求項12に記載のローマ字入力式文書処理装置。   If the English character string at the end of the unconverted English character string is kana-convertible and does not conflict with other Japanese document character strings that have been provisionally confirmed even if converted to Japanese particles, conjunctions, etc., The Roman character input type document processing apparatus according to claim 12, wherein only the English character string can be converted again and presented to the user. 前記かな文書変換の単語の候補に、前記ローマ字規則を逆変換して前記入力手段から入力した英文字列を無変換で並べた無変換英文字列を提示し、この無変換英文字列が採用され確定した場合には、前記かな文書変換辞書に、前記無変換英文字列を新しい単語として自動的に次の条件で追加登録するようにした請求項11乃至13に記載のローマ字入力式文書処理装置。
登録条件
当該無変換英文字列の読み:前記ローマ字規則を適用したかな混じり読み文字列
当該無変換英文字列の出力形式:選択された表示サイズの無変換英文字列
The Kana document conversion word candidate presents a non-converted English character string obtained by reverse-converting the Roman rule and arranging the English character strings input from the input means without conversion, and this non-converted English character string is adopted. The Roman character input type document processing according to any one of claims 11 to 13, wherein, when confirmed, the non-converted English character string is automatically registered as a new word in the kana document conversion dictionary under the following conditions. apparatus.
Registration condition Reading of the unconverted English character string: Kana mixed reading character string applying the above-mentioned Roman alphabet rules Output format of the unconverted English character string: Unconverted English character string of the selected display size
前記無変換英文字列を単語候補としてユーザに提示する場合、他のかな文書変換候補より優先してユーザに提示することが可能な請求項11乃至14に記載のローマ字入力式文書処理装置。   15. The Roman character input type document processing apparatus according to claim 11, wherein when the non-converted English character string is presented to the user as a word candidate, it can be presented to the user with priority over other kana document conversion candidates. 前記無変換英文字列を単語候補としてユーザに提示する場合、表示文字サイズを切替えて大きさの異なる複数の英文字列をユーザに提示することが可能な請求項11乃至15に記載のローマ字入力式文書処理装置。   The Roman character input according to any one of claims 11 to 15, wherein when the non-converted English character string is presented to a user as a word candidate, a plurality of English character strings having different sizes can be presented to the user by switching a display character size. Formula document processing device. 前記かな文書変換辞書がかな英字変換辞書及び/又はかな漢字変換辞書を含む請求項11又は16に記載のローマ字入力式文書処理装置。   The Roman character input type document processing device according to claim 11 or 16, wherein the kana document conversion dictionary includes a kana-English character conversion dictionary and / or a kana-kanji conversion dictionary. 少なくとも英文字入力が可能な入力手段を介して英文字列を入力する英文字列入力工程と、この入力される英文字列をローマ字規則によりかな混じり文字列に変換して表示する英字かな変換工程と、この英字かな変換工程で生成されたかな混じり文字列をかな文書変換辞書を介して文書文字列に変換するかな文書変換工程と、前記かな文書変換工程に更に、仮に確定したかな文書変換の単語の候補に、前記ローマ字規則を逆変換して当該単語の入力英文字列を無変換で並べた無変換英文字列を追加して提示することが可能な逆ローマ字変換工程とを含むことを特徴とするローマ字入力式文書処理方法。   An English character string input step of inputting an English character string through an input means capable of inputting at least English characters, and an English character Kana conversion step of converting the displayed English character string into a character string mixed according to Roman alphabet rules and displaying it A kana document conversion step of converting the kana mixed character string generated in the kana conversion step into a document character string via the kana document conversion dictionary, and the kana document conversion step A reverse romaji conversion step of adding a non-converted English character string obtained by reverse-converting the Roman rule to a word candidate and arranging the input English character strings of the word without conversion. Characteristic Roman character input type document processing method. 前記かな文書変換工程に更に、前記かな文書変換辞書に登録されていない未確定かな文字列に対しては、前記かな文書変換の単語の候補に、前記ローマ字規則を逆変換して入力英文字列を無変換で並べた無変換英文字列を提示することが可能な逆ローマ字変換工程を含む請求項18に記載のローマ字入力式文書処理方法。   In addition to the kana document conversion step, for an unconfirmed kana character string that is not registered in the kana document conversion dictionary, the Roman alphabet rule is reverse-converted into a word candidate for the kana document conversion and the input English character string The Roman character input type document processing method according to claim 18, further comprising a reverse Roman character conversion step capable of presenting an unconverted English character string arranged in a non-converted manner. 前記無変換英文字列の語尾の英文字列が前記ローマ字規則によりかな変換可能で、日本語の助詞、接続詞等に変換しても仮確定済みの他の日本語文書文字列と矛盾しない場合には、前記語尾の英文字列だけ再度かな変換してユーザに提示することが可能な請求項19に記載のローマ字入力式文書処理方法。   When the English character string at the end of the non-converted English character string can be converted to Kana by the Romaji rules, and even if converted into Japanese particles, conjunctions, etc., it does not conflict with other Japanese document character strings that have been provisionally confirmed 20. The Roman character input type document processing method according to claim 19, wherein only the English character string at the end of the word can be kana converted again and presented to the user. 前記かな文書変換工程において、かな文書変換の単語の候補に、入力英文字列を無変換で並べた無変換英文字列を提示し、この無変換英文字列が採用され確定した場合には、前記かな文書変換辞書に当該無変換英文字列を新しい単語として自動的に次の条件で追加登録するようにした請求項18乃至20に記載のローマ字入力式文書処理方法。
登録条件
当該無変換英文字列の読み:前記ローマ字規則を適用したかな混じり読み文字列
当該無変換英文字列の出力形式:選択された表示サイズの無変換英文字列
In the kana document conversion step, a kana document conversion word candidate is presented as a non-converted English character string in which input English character strings are arranged without conversion, and when this non-converted English character string is adopted and confirmed, 21. The Roman character input type document processing method according to claim 18, wherein the non-converted English character string is automatically registered as a new word in the Kana document conversion dictionary under the following conditions.
Registration condition Reading of the unconverted English character string: Kana mixed reading character string applying the above-mentioned Roman alphabet rules Output format of the unconverted English character string: Unconverted English character string of the selected display size
前記無変換英文字列を単語候補としてユーザに提示する場合、表示文字サイズを切替えて大きさの異なる複数の英文字列をユーザに提示することが可能な請求項18乃至21に記載のローマ字入力式文書処理方法。   The Roman character input according to any one of claims 18 to 21, wherein when the non-converted English character string is presented to the user as a word candidate, a plurality of English character strings having different sizes can be presented to the user by switching a display character size. Formula document processing method. 前記無変換英文字列を単語候補としてユーザに提示する場合、他のかな文書変換候補より優先してユーザに提示することが可能な請求項18乃至22に記載のローマ字入力式文書処理方法。   23. The Roman character input type document processing method according to claim 18, wherein when the non-converted English character string is presented to the user as a word candidate, it can be presented to the user with priority over other kana document conversion candidates. 前記かな文書変換辞書がかな英字変換辞書又はかな漢字変換辞書を含む請求項18乃至23に記載のローマ字入力式文書処理方法。

The Roman character input type document processing method according to any one of claims 18 to 23, wherein the kana document conversion dictionary includes a kana-English character conversion dictionary or a kana-kanji conversion dictionary.

JP2005235573A 2005-08-15 2005-08-15 Document processing method and apparatus Pending JP2006012188A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005235573A JP2006012188A (en) 2005-08-15 2005-08-15 Document processing method and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005235573A JP2006012188A (en) 2005-08-15 2005-08-15 Document processing method and apparatus

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP6263136A Division JPH08106461A (en) 1994-10-03 1994-10-03 Document processing method and apparatus

Publications (1)

Publication Number Publication Date
JP2006012188A true JP2006012188A (en) 2006-01-12

Family

ID=35779291

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005235573A Pending JP2006012188A (en) 2005-08-15 2005-08-15 Document processing method and apparatus

Country Status (1)

Country Link
JP (1) JP2006012188A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010277219A (en) * 2009-05-27 2010-12-09 Kyocera Corp Character input device, character display system, character display device, and character conversion method
JP2013533996A (en) * 2010-05-31 2013-08-29 バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド Method and apparatus used for mixed input of English and other characters

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010277219A (en) * 2009-05-27 2010-12-09 Kyocera Corp Character input device, character display system, character display device, and character conversion method
JP2013533996A (en) * 2010-05-31 2013-08-29 バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド Method and apparatus used for mixed input of English and other characters

Similar Documents

Publication Publication Date Title
JP5021802B2 (en) Language input device
KR900008402B1 (en) Machine Translation Device
JP2006012188A (en) Document processing method and apparatus
JPH08106461A (en) Document processing method and apparatus
JP2839448B2 (en) Input and conversion device for characters etc. in word processors etc.
JP3814000B2 (en) Character string conversion apparatus and character string conversion method
JP2008217770A (en) Language data display system, language data display method, and language data display program
JP3069532B2 (en) Kana-kanji conversion method and device, and computer-readable recording medium storing a program for causing a computer to execute the kana-kanji conversion method
JP3612351B2 (en) Document processing device
JPH0350668A (en) character processing device
JP2737160B2 (en) Sentence processing equipment
JP3055538U (en) Input and conversion device for characters etc. in word processors etc.
JPH10198664A (en) Japanese language input system and medium for recorded with japanese language input program
JP2509554B2 (en) Character processing method
JPH04305769A (en) Machine translation system
JP2002183135A (en) Registering and converting word processing device for language for world word candidate, and used software system and/or registering and converting method
JPH0827794B2 (en) Character processor
JPH04148367A (en) Japanese word processor
JPH04363755A (en) Wordprocessor
JPH08241315A (en) Document processing device word registration mechanism
JPH06236399A (en) Word processor with translation function
JPH0236462A (en) Japanese sentence preparing device
JPH05266009A (en) Method and device for production of document
JPH11175528A (en) Electronic dictionary
JPS5840650A (en) Japanese input system

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070419

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070424

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070625

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070724