JP2006012188A - Document processing method and apparatus - Google Patents
Document processing method and apparatus Download PDFInfo
- Publication number
- JP2006012188A JP2006012188A JP2005235573A JP2005235573A JP2006012188A JP 2006012188 A JP2006012188 A JP 2006012188A JP 2005235573 A JP2005235573 A JP 2005235573A JP 2005235573 A JP2005235573 A JP 2005235573A JP 2006012188 A JP2006012188 A JP 2006012188A
- Authority
- JP
- Japan
- Prior art keywords
- kana
- character string
- conversion
- input
- english
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
【課題】日本語、外国語のミックスした文章を効率良くかな入力して文書変換する。
【解決手段】ローマ字入力又はかな文字入力が可能な入力手段と、この入力手段から入力されるかな文字列をかな文書変換辞書を介して文書文字列に変換するかな文書変換手段とを具えた文書処理装置において、前記かな文字列を逆ローマ字規則により英文字列に変換するかな英字変換手段を設け、前記かな文書変換辞書の単語変換候補に、前記逆ローマ字規則により生成した英文字列を追加して提示/選択できるようにすることによって上記目的は達成される。
【選択図】図5[PROBLEMS] To efficiently convert a document by inputting a mixed sentence of Japanese and foreign languages.
A document comprising input means capable of inputting Roman characters or Kana characters, and Kana document conversion means for converting a Kana character string input from the input means into a document character string via a Kana document conversion dictionary. In the processing device, there is provided a Kana alphabet conversion means for converting the Kana character string into an English character string according to a reverse Roman character rule, and an English character string generated according to the reverse Roman character rule is added to a word conversion candidate of the Kana document conversion dictionary. The above object can be achieved by making it possible to present / select.
[Selection] Figure 5
Description
この発明は、かな入力又は/及びローマ字入力式の文書処理方法及び装置に関し、特に、日本語と英語、ドイツ語、フランス語等の外国語とが混在した文書を作成する場合に有効な文書処理方法及び装置に関する。 BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a kana input and / or Roman character input type document processing method and apparatus, and more particularly to a document processing method effective for creating a document in which Japanese and foreign languages such as English, German and French are mixed. And an apparatus.
従来、ワードプロセッサ、パーソナルコンピュータ、ワークステーション等の日本語に関係した文書処理方法及び装置においては、ローマ字漢字変換又はかな漢字変換による日本語入力方法が広く用いられている。しかしながら、今日では技術の進歩が激しく新しい専門用語が次々と生まれると共に、情報の国際化が非常に進んでいるので、日本語文章の中に、日本語の単語、文章ばかりでなく、フランス語、ドイツ語、スペイン語、イタリア語、英語等の外国語の単語又は文章をカタカナ表記ではなく、オリジナルの語源の綴り又は発音ローマ字の綴りのままで日本語の文章の中に混在させて使用することが少なくない。特に、コンピュータ関係の専門用語や会社名、氏名等はマニュアル、学会誌、契約書等において、日本語本文中にそのままアルファベット、略語等を用いて記載される傾向にある。 2. Description of the Related Art Conventionally, in Japanese word processing, personal computers, workstations, and other document processing methods and apparatuses related to Japanese, a Japanese input method using Roman-Kanji conversion or Kana-Kanji conversion has been widely used. Today, however, technological advances are so strong that new technical terms are born one after another, and the internationalization of information is very advanced. Therefore, not only Japanese words and sentences but also French and German are included in Japanese sentences. Foreign language words or sentences such as Japanese, Spanish, Italian, English, etc. may be used in Japanese sentences without spelling the original etymology or pronunciation Roman letters, rather than katakana notation. Not a few. In particular, computer-related technical terms, company names, names, etc. tend to be written as they are in alphabets, abbreviations, etc. in the Japanese text in manuals, academic journals, contracts, etc.
かかる事態に対応するため、ローマ字入力モードにおいてキー入力装置等から入力されたローマ字文字列を、特別の操作を必要とすることなしに、かな漢字文字列と外国語文字列の混在した文字列に変換することのできるかな漢字変換装置が特開平4−75162号公報に紹介されている。更に、入力されたローマ字文字列中に現れる諸文字の隣接関係の特徴を利用することにより、ユーザの負担の少ない日本語入力が可能なローマ字漢字変換装置も特公平5−85055号公報に記載されている。 To cope with such a situation, the Romaji character string input from the key input device etc. in the Romaji input mode is converted to a mixed character string of Kana-Kanji character strings and foreign language character strings without requiring any special operation. A kana-kanji conversion device that can do this is introduced in Japanese Patent Laid-Open No. 4-75162. Furthermore, Japanese Patent Publication No. 5-85055 discloses a Romaji-Kanji conversion device that can input Japanese characters with less burden on the user by utilizing the characteristics of adjacent relations of characters appearing in the inputted Romaji character string. ing.
かかる従来のローマ字入力式日本語文書処理装置にあっては、ローマ字入力文字列を先ずひらがなに変換し、ひらがなに変換できない文字列は日本語とはみなされず、副言語又は英単語等とみなされ、日本語とは区別した英単語辞書/副言語辞書等により辞書変換処理が行なわれるようになっていた。すなわち、従来は、入力文字列の中でひらがなに変換できる文字列は日本語辞書で、ひらがなに変換できない文字列は副言語辞書へと装置側で勝手に自動分類して変換処理してしまうので、例えば、日付を示す「DATE」のような単語は「だて」と読み入力した文字の変換対象候補としてユーザに表示し提示されないという問題点があった。また「book(英小文字、全角モードでキー入力)」という単語を副言語辞書に登録しただけでは「BOOK」、「Book」等でキー入力した場合、正しく辞書変換されず、その都度、これらの単語を辞書登録する操作をユーザに要求することとなり、日本語文書処理の中で外国語の単語を編集処理することは大変煩わしいという問題点もあった。 In such a conventional romaji input type Japanese document processing device, a romaji input character string is first converted into hiragana, and a character string that cannot be converted into hiragana is not regarded as Japanese but is regarded as a sub-language or English word. Dictionary conversion processing is performed by an English word dictionary / sublanguage dictionary that is distinguished from Japanese. In other words, conventionally, the character string that can be converted into hiragana in the input character string is a Japanese dictionary, and the character string that cannot be converted into hiragana is automatically classified and converted into a sub-language dictionary on the device side. For example, there is a problem that a word such as “DATE” indicating a date is not displayed and presented to the user as a candidate for conversion of a character read and input as “date”. Also, just registering the word “book (key input in lowercase, full-width mode)” in the sub-language dictionary will result in incorrect dictionary conversion when key-input is made with “BOOK”, “Book”, etc. This requires the user to register the word in the dictionary, and there is a problem that it is very troublesome to edit the foreign language word in the Japanese document processing.
この発明は上述のような事情から成されたものであり、この発明の目的は、ローマ字入力又はかな入力の文書処理装置において、入力文字列を英文字/記号、数字等も含めて全て日本語と同等に扱い、外国語と日本語と区別することなくキー入力操作すると共に、アルファベットで表記した文字列が辞書に登録されておらず、逆ローマ字規則でユーザに提示し選択された場合には、当該逆ローマ字文字列を前記辞書に自動登録し、日本語と外国語と区別することなく文書処理できるようにした汎用文書処理方法及び装置を提供することにある。 The present invention has been made for the above-mentioned circumstances, and an object of the present invention is to use an input character string including English letters / symbols, numbers, etc. in a Roman character input or Kana input document processing apparatus. When the key input operation is performed without distinguishing between foreign language and Japanese, the character string written in alphabet is not registered in the dictionary, and it is presented to the user with the reverse Roman alphabet rule and selected. Another object of the present invention is to provide a general-purpose document processing method and apparatus that automatically registers the reverse Roman character string in the dictionary and allows document processing without distinguishing between Japanese and foreign languages.
この発明は少なくともかな文字入力が可能な入力手段と、この入力手段から入力されるかな文字列をかな文書変換辞書を介して文書文字列に変換するかな文書変換手段とを具えたかな入力式文書処理装置に関するものであり、この発明の上記目的は、前記かな文字列を逆ローマ字規則により英文字列に変換するかな英字変換手段を設け、前記かな文書変換辞書の単語変換候補に、前記逆ローマ字規則により生成した英文字列を追加して提示/選択できるようにすることによって達成される。 The present invention is a kana input expression document comprising at least input means capable of inputting kana characters and kana document conversion means for converting a kana character string input from the input means into a document character string via a kana document conversion dictionary. The above object of the present invention is to provide a kana-alphabetic conversion means for converting the kana character string into an English character string according to a reverse romaji rule, and to the word conversion candidate of the kana document conversion dictionary, the reverse roman character This is achieved by allowing an English character string generated by a rule to be additionally presented / selected.
また、この発明は、かな入力式文書処理方法にも関し、この発明の上記目的は少なくともかな文字入力が可能な入力手段を介してかな文字列を入力するかな文字列入力工程と、このかな文字列をかな文書変換辞書を介して文書文字列に変換するかな文書変換工程とを含み、更に、このかな文書変換工程の中に、かな文書変換の単語候補として変換対象かな文字列を逆ローマ字規則を適用して英文字列に変換し、生成された英文字列をユーザに提示することが可能な逆ローマ字変換工程とを設けることによっても達成される。 The present invention also relates to a kana input type document processing method. The above object of the present invention is to input a kana character string through an input means capable of inputting at least kana characters, and a kana character input process. A kana document conversion step for converting a string into a document character string via a kana document conversion dictionary, and further, in this kana document conversion step, a kana character string to be converted as a word candidate for kana document conversion This is also achieved by providing a reverse Romaji conversion step capable of converting to an English character string by applying, and presenting the generated English character string to the user.
更に、この発明はローマ字入力式文書処理装置にも関し、この発明の上記目的は、少なくとも英文字入力が可能な入力手段と、この入力手段から入力される英文字列をローマ字規則によりかな混じり文字列に変換する英字かな変換手段と、この英字かな変換手段により変換されたかな混じり文字列をかな文書変換辞書を介して文書文字列に変換するかな文書変換手段とを具えることによっても達成される。 Furthermore, the present invention relates to a Roman character input type document processing apparatus, and the above object of the present invention is to provide an input means capable of inputting at least an English character and an English character string input from the input means according to a Roman character rule. It is also achieved by comprising an alphabetic kana conversion means for converting into a string and a kana document conversion means for converting a kana mixed character string converted by the alphabetic kana conversion means into a document character string via a kana document conversion dictionary. The
更にまた、この発明はローマ字入力式文書処理方法にも関し、この発明の上記目的は、少なくとも英文字入力が可能な入力手段を介して英文字列を入力する英文字列入力工程と、この入力される英文字列をローマ字規則によりかな混じり文字列に変換して表示する英字かな変換工程と、この英字かな変換工程で生成されたかな混じり文字列をかな文書変換辞書を介して文書文字列に変換するかな文書変換工程とを設けることによっても達成される。 Furthermore, the present invention also relates to a Roman character input type document processing method. The above object of the present invention is to input an English character string through an input means capable of inputting at least English characters, The Kana conversion process to display the converted English character string into a Kana mixed character string according to the Roman rules, and the Kana mixed character string generated by this Kana Kana conversion process into the document character string via the Kana document conversion dictionary This can also be achieved by providing a kana document conversion process.
この発明では、ローマ字入力された文字列を日本語と英語/アルファベットとに区別することなく、同一の文字列として扱い文書処理するので、入力文字列を日本語と他の言語とに区別する必要が一切ない。従って、ローマ字入力では和文モードと英文入力モードのモード切替操作等は一切必要とせず、文書のキー入力が可能である。また、英大文字入力キー、英小文字入力キーを操作することもなく、通常の英文キー入力の感覚で日本語とローマ字/英語等の単語を同時にキー入力することができる。また、逆ローマ字変換してユーザに提示した英文字列が選択されて変換対象単語の表記として確定した場合には、文書処理装置の内部でこのことが自動的に検出できるので、この新しい表記形式をかな文書変換辞書にユーザの操作を一切必要とせず、自動追加登録することができ、2回目以後同様のかな文字列が入力された場合、自動的にかな文字列を英文字列に変換した英文字混じりの日本語文章を効率良く作成/編集することができる。 In the present invention, the character string input in Roman characters is treated as the same character string without distinguishing between Japanese and English / alphabet, so the input character string must be distinguished between Japanese and another language. There is no. Therefore, the Roman character input does not require any mode switching operation between the Japanese text mode and the English text input mode, and the key input of the document is possible. In addition, it is possible to simultaneously input words such as Japanese and Roman characters / English in the sense of normal English key input without operating the English uppercase input key and English lowercase input key. In addition, when an English character string presented to the user after reverse romaji conversion is selected and confirmed as the notation of the conversion target word, this can be automatically detected within the document processing apparatus, so this new notation format The Kana document conversion dictionary does not require any user operation and can be automatically added and registered. When the same Kana character string is input after the second time, the Kana character string is automatically converted to an English character string. Efficiently create / edit Japanese sentences mixed with English characters.
本発明にかかる文書処理方法及び装置によれば、逆ローマ字変換部を表記選択部内に設けることにより、日本語と外国語とを混在させた文章を効率良く作成することができる。また、「特許 太郎」,「TOKKYOTARO」といった日本人の住所、氏名等を日本語とローマ字でそれぞれ並記した文章を作成する場合にも、ローマ字でかな入力して次候補のリクエストをするだけでローマ字変換できるので大変便利であり、更に、このローマ字変換された単語は辞書に環境設定パラメータに対応して自動登録できるので、いわゆるユーザの辞書登録操作からユーザが開放され、外国語を日本語と区別することなく統合して処理することができる。 According to the document processing method and apparatus according to the present invention, it is possible to efficiently create a sentence in which Japanese and a foreign language are mixed by providing a reverse Roman character conversion section in the notation selection section. In addition, when creating sentences that include Japanese addresses and names in Japanese and Roman characters, such as “Patent Taro” and “TOKYOTARO”, just input the kana in Roman characters and request the next candidate. Romaji conversion is very convenient because it can be converted automatically, and words that have been converted to Romaji can be automatically registered in the dictionary in accordance with the environment setting parameters. It can be integrated and processed without distinction.
以下に添付図面を参照して、この発明にかかる文書処理方法及び装置の好適な実施の形態を詳細に説明する。 Exemplary embodiments of a document processing method and apparatus according to the present invention will be explained below in detail with reference to the accompanying drawings.
(実施の形態)
図1はこの発明の文書処理装置のハードウェアの概略構成の一例を示すブロック図であり、MPU(マイクロプロセッサ)2により文書処理装置の各種処理が実行され、キーボード4又はマウス5により、読み文字列の入力や変換指示、確定指示等の各種のユーザ入力操作が行なわれるようになっている。CRTや液晶等の表示手段6には、入力中の文書や、かな漢字変換候補、操作ガイドメッセージ等が表示され、ROM10にはMPU2が実行する各種の制御プログラムや実行プログラムが使用する共通データ等が格納されている一方、ハードディスク、光ディスク、フラッシュメモリ等の記憶手段12には、文書処理プログラムや、かな文書変換辞書14a,数式変換辞書14b、化学式変換辞書14c,郵便番号辞書14d,同類語辞書14e,…,医学用語辞書14x等の各種辞書類が格納されており、かな文書変換処理で適宜参照されるようになっている。また、RAM20にはMPU2が各種の処理を実行するための作業エリアや、記憶手段12から読出されたかな文書変換部22、辞書14a〜14x等が装置の起動時に適宜設定されるようになっている。更に、かな文書変換部22には、かな漢字変換やかなローマ字変換(これらの変換処理を以下かな文書変換と呼ぶ。)処理のための入出力制御部30及びかな文書変換を実行する変換エンジン部70a等が設けられていると共に、上述の各部はバス8を介して相互にデータの授受を行なうようになっている。
(Embodiment)
FIG. 1 is a block diagram showing an example of a schematic configuration of hardware of a document processing apparatus according to the present invention. Various processes of the document processing apparatus are executed by an MPU (microprocessor) 2, and reading characters are read by a keyboard 4 or a mouse 5. Various user input operations such as column input, conversion instruction, and confirmation instruction are performed. The display means 6 such as a CRT or liquid crystal displays a document being input, Kana-Kanji conversion candidates, operation guide messages, and the like, and the
図2はかな文書変換部22(入出力制御30及び変換エンジン部70a)と辞書14a〜14xの関係を示すソフトウエアの機能ブロック図であり、かな漢字変換処理等を含む文書処理プログラム実行部23から出力されるキー操作情報を入出力制御部30が受信すると、入出力制御部30内の判定処理部40により、受信したキー操作情報がキーボード4から出力された読み文字列用のデータキー情報なのか、キーボード4又はマウス5から出力された変換指示、確定指示、メニュー表示指示等の指示情報入力なのか判定され、読み文字列用データキー情報の場合はデータキー処理部42の中のかな入力処理部44又はローマ字入力処理部46で処理されて格納部50の内部に設けられている読み文字列バッファ52へ順次書込まれるようになっている。尚、ローマ字入力処理部46の内部には、ローマ字かな変換部48が設けられており、特定のローマ字文字列が入力された場合、ローマ字かな変換テーブル又は連続子音文字入力時の規則等に従って、かな変換できるローマ字文字列を順次かな文字に変換するようになっている。
FIG. 2 is a functional block diagram of software showing the relationship between the kana document conversion unit 22 (input /
一方、指示情報入力の場合には、判定処理部40で指示内容がチェックされ、例えばかな文書変換指示の場合には、判定処理部40から変換エンジン部70a等へかな文書変換指令が出力され、読み文字列バッファ52から変換対象文字列が取出されて、変換エンジン部70aにより、かな漢字変換又はかなローマ字変換等のかな文書変換処理が適宜実行され、変換結果が格納部50内の表示文字列バッファ54に書込まれて、表示部60の制御のもとに表示手段6に表示されるようになっている。尚、変換エンジン部70aは、それぞれ辞書14a〜14xに記憶されている文法情報90や単語情報92を参照して文節の区切り位置を推定する基本解析部72と、基本解析部72から出力される文節区切り候補に対して文法/単語情報のチェックをすると共に共起用例情報94を参照して同音語選択処理等を行ない、更に文節区切り候補の絞り込みを行なう文節区切り処理部74と、文節区切り処理部74の処理では表記が未決定の文節に対して表記の決定を行なう表記選択部80と、表記選択部80で決定された単語が辞書14a等に登録されていない単語の場合、この単語の読み、表記、品詞等の情報を辞書14a等に自動登録する自動辞書登録部76等から構成されており、表記選択部80の内部には、この発明の特徴である切出された文節の単語部分をかな文字からローマ字文字に変換すると共に、表示文字サイズも変更可能な逆ローマ字変換部82が更に設けられている。
On the other hand, in the case of instruction information input, the instruction content is checked by the
また、辞書14a〜14xには、文法情報90、単語情報92、共起用例情報94、学習情報96等が格納されており、文法情報90には単語間の文法的な結びつきの正否に関する情報や、その結びつきの強さに関する情報等がある。例えば、「名詞(助詞なし)+接尾語は結びつきが強い、名詞(助詞なし)+名詞は結びつきが強い」等の情報が格納されている。
The dictionaries 14a to 14x store
単語情報92には、各々の単語の読み文字列、表記文字列、品詞情報及び活用情報等がある。
The
共起用例情報94とは、意味的な結びつきの強い単語間の2項関係情報である。そして、この共起用例情報94とは単に2つの結びつきの他に、「人」,[花」等の属性単位の共起用例や、付加的な制限情報を含むものである。付加的な制限情報としては、例えば、「を」,「が」等の助詞情報、成立する向きの情報等がある。共起用例の例を示すと、「暑い−夏」,「厚い−本」,「熱い−お湯」…(単語の結びつき)
「人(彼,彼女,先生,恋人,等)に−会う」…(属性単位の共起用例)
「花(チューリップ,菊,等)が−咲く」…(属性単位の共起用例)
「話を−聞く」,「薬が−効く」,「機転が−利く」…(助詞の制限情報)
「家庭−教育」,「教育−過程」…(向きの制限情報)
というようになる。以上のような共起用例情報94は、意味情報であり、これを用いることにより同音語の多義性が解消される。
The
"Meet people (he, girlfriend, teacher, lover, etc.)" ... (example of co-occurrence in attribute units)
"Flowers (tulips, chrysanthemums, etc.) bloom" ... (example of co-occurrence in attribute units)
"Speak-listen", "medicine-works", "promotion-works" ... (participant restriction information)
"Home-education", "Education-process" ... (direction restriction information)
And so on. The
例えば、共起用例情報94による同音語の一例を示すと、「あつい/ほん」という読みに対して変換処理を行なう際に、共起用例情報94における「厚い−本」という結びつきの情報から「厚い」が選択され、「熱い,暑い」等は選択されない。従って、「厚い/本」という変換結果が即座に得られる。このように、共起用例情報94を用いることにより変換効率の向上が図れる。
For example, when an example of a homophone using the
学習情報96は、最も最近に使用された表記を優先して採用する場合等で使用されるようになっている。
The learning
更に、入出力制御部30には、環境設定部62が設けられており、キーボード4からデータキー入力する場合、かな文字として入力するのか、ローマ字入力するのかを切替えて設定する入力モード設定機能や、ローマ字かな変換テーブルデータの変更処理、連文節/単文節等の変換モード設定、JIS/シフトJIS等のコード体系等が適宜選択できるようになっている。
Further, the input /
かかる構成において、その動作を説明する。先ず、文書処理の動作原理を図3を参照して簡単に説明すると、表示手段6に表示された文書処理の編集画面100には、文章を表示するエリアの他に各種メセージや状態を表示したり、同音異義語の候補を表示するエリア110が画面下方に設けられている。エリア110を拡大して示したのが同図の右側部分であり、エリア110の中のエリア120は次候補群表示のための指示が与えられたとき、それらの単語候補を表示する領域として主に使用される。
In this configuration, the operation will be described. First, the operation principle of document processing will be briefly described with reference to FIG. 3. The document
ここで、“挿入”というのはキーボード4から入力された文字列をカーソル102の直前に挿入することを意味しており、“確定”はかな漢字変換等のかな文書変換をしてユーザが選択した単語を後で再度読みに戻すことをしないモードになっていることを意味する。“連カナ漢”はかな漢字変換モードが連文節でって、カナ入力であることを示している。尚、上述の“挿入”及び“カナ漢”は、所定の制御キーを操作することにより、“挿入”と“上書”、及び“カナ漢”とローマ字入力の“R漢”が相互に適宜変更可能になっている。
Here, “insert” means that the character string input from the keyboard 4 is inserted immediately before the
さて、図3の画面において、ユーザはキーボード4より読みを入力することになるが、必要に応じて変換キーを押下することでそれまで入力した読みに対するかな文書変換処理を実行する。この結果、画面のカーソル102の位置に、各々の読みで変換された優先度の高い単語からなる文(もしくは文節)が未確定の状態で表示される。このとき、次候補キーを押下すると、表示された未確定単語のうち、先頭の文節の候補群がエリア120に表示される。
Now, in the screen of FIG. 3, the user inputs a reading from the keyboard 4, but if necessary, the conversion key is pressed to execute a kana document conversion process for the reading input so far. As a result, a sentence (or phrase) consisting of a high-priority word converted by each reading is displayed in an undetermined state at the position of the
尚、この実施の形態ではかな文書変換キー及び次候補キーともスペースキーが対応している。すなわち、読みを入力した直後にスペースキーが押下された時は、かな文書変換キーとして判断し、続けてスペースキーが入力したときには次候補キーとして処理される。また、読みを入力せず、単にスペースキーが入力されたとき又はコントロールキーとシフトキーとスペースキーとが同時に押下された時には本来の空白文字の入力として処理される。そして、候補の確定は変換キーを押下したときの状態(第1候補)で良ければその時点でリターンキーを押下するか、もしくは続いて読みキーを押下することでなされる。また、次候補キーを押下して候補群をエリア120に表示した時にはその候補のいずれかを選択(候補群には番号が付されていて、その番号を入力)したのち、リターンキー(確定キー)を押下することで確定する。
[かな入力モードでのかな文書変換処理の説明]以下、図4のフローチャート及び図5の編集画面例を参照して、この発明の文書処理動作を詳細に説明する。尚、説明に先立ち、この実施の形態におけるかな文書変換処理、次候補表示処理は共にスペースキーによって実行される。次候補表示処理か否かは、スペースキーが押下されたとき、直前の文字が未確定状態か否かを判断し処理すれば良い。また、未確定の候補が確定するのは、未確定状態で確定キー(リターンキー)を押下するか、もしくは未確定状態で新たな読みキー(読み文字を入力するためのキー)が入力されたときである。また、読みが確定している時に入力したリターンキーは文字どおり改行キーを示す。また、図2に示す環境設定部62を起動して、データキー処理部42はかな入力処理部44がアクティブ状態となり、ローマ字入力処理部46は休止状態となっているものとする。
In this embodiment, the space key corresponds to the kana document conversion key and the next candidate key. That is, when the space key is pressed immediately after inputting a reading, it is determined as a kana document conversion key, and when the space key is subsequently input, it is processed as the next candidate key. Further, when a space key is simply input without inputting a reading, or when the control key, the shift key, and the space key are simultaneously pressed, the input is processed as an original blank character input. If the candidate is confirmed in the state (first candidate) when the conversion key is pressed, the return key is pressed at that time, or the reading key is subsequently pressed. When the candidate group is displayed in the
[Description of Kana Document Conversion Processing in Kana Input Mode] The document processing operation of the present invention will be described in detail below with reference to the flowchart of FIG. 4 and the editing screen example of FIG. Prior to the description, both the kana document conversion process and the next candidate display process in this embodiment are executed by the space key. Whether or not the next candidate display process is performed may be determined by determining whether or not the immediately preceding character is in an unconfirmed state when the space key is pressed. Also, the unconfirmed candidate is confirmed when the confirm key (return key) is pressed in the unconfirmed state, or a new reading key (key for inputting the reading character) is input in the unconfirmed state. Is the time. Also, the return key entered when the reading is confirmed literally indicates a line feed key. Further, it is assumed that the
さて、キーボード4をかな入力モードで入力操作して図5(B)に示すような文字列を入力すると、各キーが文字入力か否か判定され(図4のステップS2)、今回は文字入力であるので、これらのかな文字が読み文字列バッファ52へ順次格納される(図4のステップS4)。尚、図5(B)の例ではかな文字列として全てかな文字から構成された文字列を示したが、かな文字を拡張して英文字混じりのかな文字列(例えばCおMぱQ,いんてL,GM,げ,いBM,どS等)に対しても以下の処理が適用できることは当業者に明らかである。次に、図5(B)の文字列を全てキー入力し終った時点で、変換指示を示すスペースキーを押下すると、判定処理部4により、このスペースキーが変換指示と解釈され(図4のステップS6)、変換エンジン部70aへかな文書変換指令が出力される。 When the keyboard 4 is input in the kana input mode and a character string as shown in FIG. 5B is input, it is determined whether or not each key is a character input (step S2 in FIG. 4). Therefore, these kana characters are sequentially stored in the read character string buffer 52 (step S4 in FIG. 4). In the example of FIG. 5B, a character string composed of all kana characters is shown as the kana character string. However, the kana character is expanded to include a kana character string mixed with English characters (for example, C O Mpa Q, In It will be apparent to those skilled in the art that the following processing can be applied to L, GM, Ge, BM, DoS, etc. Next, when the space key indicating the conversion instruction is pressed when all the character strings in FIG. 5B have been entered, the determination processing unit 4 interprets the space key as the conversion instruction (see FIG. 4). In step S6), a kana document conversion command is output to the conversion engine unit 70a.
かくして、変換エンジン部70aが起動されると、読み文字列バッファ52から図5(B)に示す変換対象の読み文字列が変換エンジン部70aに読込まれ、辞書14aを参照してかな文書変換処理が実行される(図4のステップS8)。この変換処理では、かな漢字辞書をベースにした辞書14aを参照した日本語変換処理が先ず実行され、基本解析部72により読込んだ読み文字列の文節候補が抽出され、抽出された文節候補が文節区切り処理部74により文法的、意味的にチェックされて文節候補が絞り込まれ、文節区切り処理され、かな漢字変換された文書文字列が未確定な状態で表記選択部80に渡されると共に、表示文字列バッファ54にも書込まれ表示手段6に図5(C)のような状態で表示される(図4のステップS10)。但し、辞書14aには読みは「いんてL」、表記は「INTEL」の単語や、読みは「げ」表記「GE」の単語、また、読みは「どS」表記「DOS」等の単語が登録可能であり、これらの読みが辞書14aに予め登録されていれば、登録済みの単語が優先的に処理されて文節処理されるようになっている。
Thus, when the conversion engine unit 70a is activated, the reading character string to be converted shown in FIG. 5B is read from the reading
この変換結果が正しければ、続けて確定指示のリターンキーを押下すれば良いが、図5(C)の例では所望の結果が得られなかったので、次候補キーとしてスペースキーを押下すると(図4のステップS12)、表記選択部80の内部に設けられた逆ローマ字変換部82が起動され、この例では「だて」を図7に示すような変換テーブルを利用してローマ字「DATE」に変換し全角サイズで表記した第1候補と、ローマ字「date」に変換し半角サイズで表記した第2候補と、辞書14aから読み出した第3乃至第7の候補とが合成されて図5(D)に示すような形式で候補表示エリア120に提示される。すなわち、辞書14aに登録されていない候補が登録されている候補と同時に表示され、ユーザの選択対象として提示される(図4のステップS10)。
If this conversion result is correct, it is sufficient to continuously press the return key of the confirmation instruction. However, in the example of FIG. 5C, the desired result was not obtained, so when the space key is pressed as the next candidate key (FIG. 4, the reverse
かくしてエリア120に提示された次候補の中から、例えば数字1キー又はスペースキーを更に押して「1.DATE」を選択すると、エリア120の表示は図5(E)のように変化し、文章は図5(F)のように変更される(図4のステップS8及びS10)。この時点で所望の変換結果が得られたので、確定指示のため次のかな文字入力キーを押すか、リターンキーを押すと、判定処理部40により確定指示が入力されたと判定され(図4のステップS12)、変換結果が文書処理プログラム実行部23へ転送される(図4のステップS14)と共に、判定処理部40から表記選択部80へ逆ローマ字変換し、辞書14aに登録されていない単語が選択されたか否か問い合せ指令が出力され、今回は辞書登録されていない単語「DATE」が採用されたので、表記選択部80から判定処理部40に未登録単語有りのメッセージが返されると(図4のステップS16)、続いて判定処理部40から変換エンジン部70aの自動辞書登録部76に逆ローマ字変換された単語の自動辞書登録指令が出力される。
Thus, when the number 1 key or the space key is further pressed to select “1.DATE” from among the next candidates presented in the
すると、自動辞書登録部76では表記選択部80から逆ローマ字変換され確定した表記文字列D100及び読み文字列D102を図6に示すように受け取り、通常、品詞欄D104は一般名詞に設定して辞書14aの単語情報92にこの未登録単語を追加登録し、学習情報96を更新する(図4のステップS18)。かくしてユーザの辞書登録操作を一切要求することなく、自動的に辞書14aに新しい単語が登録できた。従って、例えば、次にユーザが「ひづけのかくにんには、だてとにゅうりょくする。」とかな入力して変換キーを押すと「日付の確認には、DATEと入力する。」と一回で正しくかな文書変換ができる。すなわち、日英辞書や英日辞書等を特別用意しておかなくても、外国語の単語をオリジナルのまま入力してかな漢字混じり文章の中に混在させることが可能となり、新規単語をユーザの操作により新規登録する必要もない。
Then, the automatic
尚、上述の新規単語の自動辞書登録動作では全て自動で辞書登録する動作を説明したが、品詞の設定は様々な種類があるので、ユーザが確認選択できるモードがあると更に便利である。すなわち、品詞登録条件は、例えば、次式に示すような3つのモードを用意しておき環境設定部62によりこれらのモードを適宜選択できるようにすると良い。
品詞登録条件モード1:品詞固定で「一般名詞」とする。
モード2:ユーザ選択可能な固定品詞[固有人名,固有企業名,名詞サ変…]
モード3:簡易対話式設定「登録します。よろしいですか?y/n」
「読み:cおmぱq」
「表記:COMPAQ」
「品詞:一般名詞,固有人名,固有企業名,名詞サ変,…」
すなわち、モード1及びモード2の自動登録では全て自動登録することができる。また、モード3では、品詞候補を自動辞書登録部76から提示し、ユーザがこれらの候補の中から所望の候補を選択し、登録のYes/Noを確認して辞書登録するようになっている。但し、単語の読み、表記に関してはユーザ入力する必要がない。
[ローマ字入力モードでのかな文書変換処理の説明]次に、図4のフローチャート及び図5の編集画面を参照して、この発明のローマ字入力モードでの文書処理動作を詳細に説明する。尚、リターンキー、変換キー、次候補キー等の操作はかな入力モードでの操作と同一である。また、図2に示す環境設定部62を操作して、データキー処理部42はかな入力処理部44が休止状態に、ローマ字入力処理部46がアクティブ状態に設定されているものとする。
In the above-described automatic dictionary registration operation for new words, the operation of automatically registering a dictionary has been described. However, since there are various types of part of speech settings, it is more convenient if there is a mode in which the user can confirm and select. In other words, the part-of-speech registration condition may be prepared, for example, by preparing three modes as shown in the following formula so that the
Part-of-speech registration condition mode 1: The part-of-speech is fixed and “general noun” is set.
Mode 2: Fixed part-of-speech that can be selected by the user [proprietary name, unique company name, noun change ...]
Mode 3: Simple interactive setting “Register. Are you sure? Y / n”
"Reading: c ompa q"
"Notation: COMPAQ"
“Part of speech: general noun, proper person name, proper company name, noun change,…”
In other words, all automatic registrations in mode 1 and mode 2 can be performed automatically. In mode 3, the part-of-speech candidates are presented from the automatic
[Description of Kana Document Conversion Processing in Roman Character Input Mode] Next, the document processing operation in the Roman character input mode of the present invention will be described in detail with reference to the flowchart of FIG. 4 and the editing screen of FIG. The operations of the return key, conversion key, next candidate key, etc. are the same as those in the kana input mode. Further, by operating the
かかる初期状態において、キーボード4からローマ字入力モードで図5(A)に示すローマ字をキー入力すると、ローマ字入力処理部46により、これらのローマ字が次の規則によりかな変換できる場合にはローマ字かな変換部48によりかな変換されて読み文字列バッファ52へ順次書込まれる。また、かな変換できない英字、数字、記号キーの場合にはそのまま読み文字列バッファ52へ書込まれる。
ローマ字かな変換規則規則1:ローマ字文字列がローマ字かな変換部48に設けられたローマ字かな変換テーブルに登録されている文字列の場合には、優先して該当するローマ字文字列をかな文字に変換する。
規則2:英子音文字が連続して入力された場合は、最初の英子音文字を「っ」に変換し、以後規則1を繰り返す。
図5(A)に示す文字列に対して、上述のローマ字かな変換規則を適用すると、図5(B)のよな読み文字列に変換されて読み文字列バッファ52に書込まれる(図4のステップS2及びS4)。以後、スペースキーを押して変換指示入力し(ステップS6)、変換候補「DATE」を選択し、確定指示すると、未登録単語「DATE」が辞書14aに自動登録される過程は上述のかな入力モードでの操作及び動作説明と全く同一である。
In such an initial state, when the romaji shown in FIG. 5A is key-inputted from the keyboard 4 in the romaji input mode, the romaji
Romaji-kana conversion rule rule 1: If the Romaji-character string is a character string registered in the Romaji-kana conversion table provided in the Romaji-
Rule 2: When English consonant characters are continuously input, the first English character is converted to “”, and then Rule 1 is repeated.
When the above-described Roman Kana conversion rule is applied to the character string shown in FIG. 5A, the character string is converted into a reading character string as shown in FIG. 5B and written into the reading character string buffer 52 (FIG. 4). Steps S2 and S4). Thereafter, when the space key is pressed to input a conversion instruction (step S6), the conversion candidate “DATE” is selected and confirmed, the unregistered word “DATE” is automatically registered in the dictionary 14a in the above-described kana input mode. This is exactly the same as the operation and operation description.
そこで、次に図8(A)に示すようなローマ字入力を行なうと、これらのローマ字がかな変換されて図8(B)に示すような英子音混じりのかな文字列として読み文字列バッファ52に格納され、表示手段6に表示される(図4のステップS2及びS4)。この時点で、変換指示のためスペースキーを押すと(図4のステップS6)、判定処理部40から変換エンジン部70aにかな文書変換指令が出力され、辞書14aを参照しながら基本解析部72により文節候補が切り出され、切り出された文節候補が文節区切り処理部74により文法的、意味的にチェックされて絞り込まれ、最も確からしい日本文として図8(C)に示すような表記文字列に変換されて表記選択部80に渡される(図4のステップS8及びS10)。すなわち、辞書14aに登録されている単語が検出された場合には優先してこれらの単語処理を行ない、辞書14aに登録されていない場合には、変換候補として先ず、表記選択部80内に設けられた逆ローマ字変換部82により、これらのかな文字列を元のキー入力時のローマ字文字列に逆変換して、大文字全角、小文字半角、大文字半角、小文字全角等に変換し、ユーザに次候補の1つとして提示する。さらに、元のかな文字列のまま表示した文字列やひらがなをカタカナに変換した文字列を次候補の1つとして提示するとユーザの選択範囲を拡大することができる。また、次候補の提示の順番は逆ローマ字変換した文字列を優先的に提示するようにすると、日本語と外国語をより区別することなくユーザが取扱えるようになる。更に、逆ローマ字変換の英大文字への変換が先か英小文字への変換が先か、或いは全角表記が先か、半角表記文字列も次候補の1つとして表示するか等は、ユーザの選択によりカスタマイズできるようにしておくと、ユーザが逆ローマ字変換をより利用しやすくなる。
Then, when the romaji input as shown in FIG. 8A is performed next, these roman characters are converted into kana and read into the
図8(C)の例では英大文字全角サイズでの表記を第1の次候補として表示しており、この例の場合には、この表記変換結果が望む変換結果なので、次にリターンキーを押すか他のローマ字キーを入力すると確定指示が入力され(図4のステップS12)、変換結果が文書処理プログラム実行部23に出力される(図4のステップs14)。その後、判定処理部40から表記選択部80へ逆ローマ字変換部82で変換された次候補文字列が確定単語として採用されたか否か問い合せ信号が出力され、今回は「COMPAQ」が辞書14aには登録されていないが、新単語として採用された旨の応答とがあると、(図4のステップS16)さらに、判定処理部40から自動辞書登録部76へ単語「COMPAQ」を読み「CおMぱQ」品詞「一般名詞」で登録するように自動登録指令が出力され、辞書14aの単語情報92等へ単語「COMPAQ」が自動登録される(図4のステップS18)。かくして、逆ローマ字変換された候補文字列だけをその候補文字列が採用された場合、辞書14aに順次自動登録することが可能となり、この機能は日本語と外国語とを混在させた日本語文章を作成する場合、モード変換キーや辞書登録操作をユーザに一切要求しないで新規外国語を辞書登録できるので、大変便利である。
In the example of FIG. 8C, a notation in English capital full-width size is displayed as the first next candidate. In this example, since this notation conversion result is the desired conversion result, the return key is pressed next. When another Romaji key is input, a confirmation instruction is input (step S12 in FIG. 4), and the conversion result is output to the document processing program execution unit 23 (step s14 in FIG. 4). Thereafter, an inquiry signal is output from the
なお、本実施の形態で説明した文書処理方法は、予め用意されたプログラムをパーソナル・コンピュータやワークステーション等のコンピュータで実行することにより実現することができる。このプログラムは、ハードディスク、フレキシブルディスク、CD−ROM、MO、DVD等のコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。またこのプログラムは、インターネット等のネットワークを介して配布することが可能な伝送媒体であってもよい。 The document processing method described in this embodiment can be realized by executing a program prepared in advance on a computer such as a personal computer or a workstation. This program is recorded on a computer-readable recording medium such as a hard disk, a flexible disk, a CD-ROM, an MO, and a DVD, and is executed by being read from the recording medium by the computer. Further, this program may be a transmission medium that can be distributed via a network such as the Internet.
2 MPU
4 キーボード
5 マウス
6 表示手段
10 ROM
12 記憶手段
14a,…,14x 辞書
20 RAM
22 かな文書変換部
30 入出力制御部
40 判定処理部
44 かな入力処理部
46 ローマ字入力処理部
52 読み文字列バッファ
54 表示文字列バッファ
62 環境設定部
70a,…,70x 変換エンジン部
76 自動辞書登録部
80 表記選択部
82 逆ローマ字変換部
2 MPU
4 Keyboard 5 Mouse 6 Display means 10 ROM
12 storage means 14a, ...,
22 Kana
Claims (24)
登録条件
当該単語の読み:かな文字列
当該単語の表記:かな文字列を逆ローマ字規則により変換した英文字列 The kana according to claim 1 or 2, wherein when an English character string generated by the reverse Roman character rule is selected and confirmed as a conversion word, the new word is automatically registered in the kana document conversion dictionary under the following conditions. Input-type document processing device.
Registration conditions Reading of the word: Kana character string Notation of the word: English character string converted from the Kana character string using the reverse Roman alphabet rule
登録条件
当該単語の読み:かな文字列
当該単語の表記:かな文字列を逆ローマ字規則により変換した英文字列 8. The kana according to claim 6, wherein when the English character string generated in the reverse Roman alphabet conversion step is adopted and confirmed, the new word is automatically registered in the Kana document conversion dictionary under the following conditions. Input type document processing method.
Registration conditions Reading of the word: Kana character string Notation of the word: English character string converted from the Kana character string using the reverse Roman alphabet rule
登録条件
当該無変換英文字列の読み:前記ローマ字規則を適用したかな混じり読み文字列
当該無変換英文字列の出力形式:選択された表示サイズの無変換英文字列 The Kana document conversion word candidate presents a non-converted English character string obtained by reverse-converting the Roman rule and arranging the English character strings input from the input means without conversion, and this non-converted English character string is adopted. The Roman character input type document processing according to any one of claims 11 to 13, wherein, when confirmed, the non-converted English character string is automatically registered as a new word in the kana document conversion dictionary under the following conditions. apparatus.
Registration condition Reading of the unconverted English character string: Kana mixed reading character string applying the above-mentioned Roman alphabet rules Output format of the unconverted English character string: Unconverted English character string of the selected display size
登録条件
当該無変換英文字列の読み:前記ローマ字規則を適用したかな混じり読み文字列
当該無変換英文字列の出力形式:選択された表示サイズの無変換英文字列 In the kana document conversion step, a kana document conversion word candidate is presented as a non-converted English character string in which input English character strings are arranged without conversion, and when this non-converted English character string is adopted and confirmed, 21. The Roman character input type document processing method according to claim 18, wherein the non-converted English character string is automatically registered as a new word in the Kana document conversion dictionary under the following conditions.
Registration condition Reading of the unconverted English character string: Kana mixed reading character string applying the above-mentioned Roman alphabet rules Output format of the unconverted English character string: Unconverted English character string of the selected display size
The Roman character input type document processing method according to any one of claims 18 to 23, wherein the kana document conversion dictionary includes a kana-English character conversion dictionary or a kana-kanji conversion dictionary.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2005235573A JP2006012188A (en) | 2005-08-15 | 2005-08-15 | Document processing method and apparatus |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2005235573A JP2006012188A (en) | 2005-08-15 | 2005-08-15 | Document processing method and apparatus |
Related Parent Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP6263136A Division JPH08106461A (en) | 1994-10-03 | 1994-10-03 | Document processing method and apparatus |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2006012188A true JP2006012188A (en) | 2006-01-12 |
Family
ID=35779291
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2005235573A Pending JP2006012188A (en) | 2005-08-15 | 2005-08-15 | Document processing method and apparatus |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2006012188A (en) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2010277219A (en) * | 2009-05-27 | 2010-12-09 | Kyocera Corp | Character input device, character display system, character display device, and character conversion method |
| JP2013533996A (en) * | 2010-05-31 | 2013-08-29 | バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド | Method and apparatus used for mixed input of English and other characters |
-
2005
- 2005-08-15 JP JP2005235573A patent/JP2006012188A/en active Pending
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2010277219A (en) * | 2009-05-27 | 2010-12-09 | Kyocera Corp | Character input device, character display system, character display device, and character conversion method |
| JP2013533996A (en) * | 2010-05-31 | 2013-08-29 | バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド | Method and apparatus used for mixed input of English and other characters |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP5021802B2 (en) | Language input device | |
| KR900008402B1 (en) | Machine Translation Device | |
| JP2006012188A (en) | Document processing method and apparatus | |
| JPH08106461A (en) | Document processing method and apparatus | |
| JP2839448B2 (en) | Input and conversion device for characters etc. in word processors etc. | |
| JP3814000B2 (en) | Character string conversion apparatus and character string conversion method | |
| JP2008217770A (en) | Language data display system, language data display method, and language data display program | |
| JP3069532B2 (en) | Kana-kanji conversion method and device, and computer-readable recording medium storing a program for causing a computer to execute the kana-kanji conversion method | |
| JP3612351B2 (en) | Document processing device | |
| JPH0350668A (en) | character processing device | |
| JP2737160B2 (en) | Sentence processing equipment | |
| JP3055538U (en) | Input and conversion device for characters etc. in word processors etc. | |
| JPH10198664A (en) | Japanese language input system and medium for recorded with japanese language input program | |
| JP2509554B2 (en) | Character processing method | |
| JPH04305769A (en) | Machine translation system | |
| JP2002183135A (en) | Registering and converting word processing device for language for world word candidate, and used software system and/or registering and converting method | |
| JPH0827794B2 (en) | Character processor | |
| JPH04148367A (en) | Japanese word processor | |
| JPH04363755A (en) | Wordprocessor | |
| JPH08241315A (en) | Document processing device word registration mechanism | |
| JPH06236399A (en) | Word processor with translation function | |
| JPH0236462A (en) | Japanese sentence preparing device | |
| JPH05266009A (en) | Method and device for production of document | |
| JPH11175528A (en) | Electronic dictionary | |
| JPS5840650A (en) | Japanese input system |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070419 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070424 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070625 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070724 |