JPH11328166A - Character input device and computer-readable recording medium where character input processing program is recorded - Google Patents

Character input device and computer-readable recording medium where character input processing program is recorded

Info

Publication number
JPH11328166A
JPH11328166A JP10134030A JP13403098A JPH11328166A JP H11328166 A JPH11328166 A JP H11328166A JP 10134030 A JP10134030 A JP 10134030A JP 13403098 A JP13403098 A JP 13403098A JP H11328166 A JPH11328166 A JP H11328166A
Authority
JP
Japan
Prior art keywords
character string
abbreviation
original
procedure
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10134030A
Other languages
Japanese (ja)
Inventor
Akiko Matsumoto
明子 松本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP10134030A priority Critical patent/JPH11328166A/en
Publication of JPH11328166A publication Critical patent/JPH11328166A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To provide a character input device which edits and inputted document in an easy-to-read state without imposing any load on a user by automatically detecting and extracting a long word or phrase appearing frequency at the time of document input and automatically abbreviating it. SOLUTION: A character string is inputted (S100) from an input device for inputting character strings and is divided into words while KANA(Japanese syllabary)-KANJI(Chinese character) conversion is performed (S120) by taking a morpheme analysis (S110) through retrieval from a basic dictionary containing index words and grammatic information. A word string wherein a specified number of words of specified part of speech such as nouns continue is extracted as an original character string from the divided character strings. The extracted original character string has some of its characters abbreviated according to a certain rule to automatically generate an abbreviated word (S130). After editing (S150: NO), this character string is displayed (S160).

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、文字入力装置及び
文字入力処理プログラムを記録した記録媒体に関し、詳
しくは、入力された文字列から所定の条件を満たす文字
列を自動的に略語化する技術に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character input device and a recording medium on which a character input processing program is recorded, and more particularly to a technology for automatically abbreviation of a character string satisfying a predetermined condition from an input character string. About.

【0002】[0002]

【従来の技術】従来、文章を入力する作業を行うとき
に、入力中の文書中に何度も現れる一定以上の長さの複
合語やアルファベットの文字列があった場合、これらを
正確に入力すると却って文章が見にくくなることがあっ
た。例えば、「機械翻訳システム開発」や「機械翻訳シ
ステム開発グループ」という語句のような場合、前者は
開発の種類を表わす語句であり、後者はグループの種類
を表わす語句であるが、文章を最初から読んでいく場
合、最後の「開発」や「グループ」という文字を読むま
でいずれの語句を表わすのか判断がつかず、そのため読
みにくくなるような場合、これらの語句を短く且つ意味
が分かり易いように省略すれば、文章を読みやすくする
ことができる場合があった。
2. Description of the Related Art Conventionally, when performing a text input operation, if a compound word or a character string of a certain length or more that appears many times in a document being input is input correctly. Then, on the contrary, the sentences sometimes became difficult to see. For example, in the case of a phrase such as "machine translation system development" or "machine translation system development group", the former is a phrase that indicates the type of development, and the latter is a phrase that indicates the type of group. When reading, it is difficult to judge which word is used until the last word "development" or "group" is read, so if it becomes difficult to read, shorten these words and make them easy to understand the meaning. Omissions could make the text easier to read.

【0003】このような場合、長い複合語を省略した略
語にしてユーザ辞書に登録して、入力時に変換したり、
或いは入力後に編集機能の一括変換で省略するようなこ
とが行われていた。このユーザ辞書に登録するには、あ
らかじめどのような語句があるのか分かっているような
場合でしか登録しておくことができなかった。また、編
集機能の一括変換を利用するような場合も同様に、入力
後にしか一括変換できなかった。
In such a case, a long compound word is abbreviated as an abbreviation, registered in a user dictionary, converted at the time of input,
Alternatively, it has been performed to omit the batch conversion of the editing function after the input. To subscribe to the user dictionary, it could not be registered only in cases such as that found what phrase is located in advance. Similarly, when batch conversion of the editing function is used, batch conversion can be performed only after inputting.

【0004】[0004]

【発明が解決しようとする課題】しかしながら、新たな
文章を入力する場合は、どのような語句が出てくるかが
分からない。長い語句が出てくるたびにユーザがユーザ
辞書に登録すると、一度や二度しか出てこない語句まで
をわざわざ省略してユーザ辞書に登録することになり、
極めてわずらわしく、入力に手間がかかる割には余り読
みやすくはならないという問題があった。
However, when inputting a new sentence, it is not known what words or phrases appear. If the user registers in the user dictionary every time a long phrase appears, the phrase that appears only once or twice is bothersomely omitted and registered in the user dictionary.
There is a problem in that it is not very easy to read, although it is extremely troublesome and time-consuming to input.

【0005】一方、文中に頻出する長い単語について
は、短く省略することで文章が大変読みやすくなるが、
これらをいちいち入力時にユーザが判断して適当な略語
を考えてユーザ辞書に登録するためには何度も文章を読
み返すことになり手間がかかるという問題があった。
On the other hand, for a long word that frequently appears in a sentence, the sentence becomes very easy to read by abbreviating it shortly.
In order for the user to judge these and input appropriate abbreviations and register them in the user dictionary, there is a problem in that the text must be reread many times, which is troublesome.

【0006】また編集機能の一括変換を行う場合も、文
章を読み返し、どの語句がどのくらいの頻度で現れるの
か判断して、その上で適当な略語を考えて一括変換する
のも同様に手間がかかるという問題があった。
Also, when performing batch conversion of editing functions, it is time-consuming to read back a sentence, determine which words appear at what frequency, and consider appropriate abbreviations to perform batch conversion. There was a problem.

【0007】この発明は上記課題を解決するものであ
り、文字入力をしようとするユーザが、文章を読み返す
ようなことをしないでも、文書の入力時に頻出する長い
語句を自動的に検出し抽出して、これを自動的に略語化
することにより、ユーザに負担をかけずに、入力された
文章が読みやすく編集されるような文字入力装置を提供
することを目的とする。
The present invention solves the above-mentioned problem, and automatically detects and extracts a long phrase frequently appearing when inputting a document, even if a user who tries to input characters does not read back the text. It is another object of the present invention to provide a character input device in which an input sentence can be easily read and edited without burdening the user by automatically converting the abbreviation into an abbreviation.

【0008】さらにこのような文字入力処理をコンピュ
ータに実行させる文字入力処理プログラムを記録した記
録媒体を提供することを目的とする。
It is another object of the present invention to provide a recording medium storing a character input processing program for causing a computer to execute such a character input processing.

【0009】[0009]

【課題を解決するための手段】この目的を達成するため
に、請求項1に係る発明の文字入力装置では、文字列を
入力する文字列入力手段と、見出し語と、文法情報とを
含む辞書と、前記文字列入力手段により入力された文字
列を前記辞書を検索することにより形態素解析を行って
単語に分割し、前記辞書の文法情報を前記分割された単
語に付与する形態素解析手段と、前記形態素解析手段に
より分割された文字列から、所定の条件を満たす単語が
所定数連続した単語列を原文字列として抽出する原文字
列抽出手段と、前記原文字列抽出手段により抽出した原
文字列を、その一部の文字を一定の規則の下で省略して
略語を形成する略語化手段と、前記略語化手段により形
成された略語を表示する略語表示手段とを備える。
In order to achieve this object, a character input device according to the first aspect of the present invention provides a character string input means for inputting a character string, a dictionary including a headword and grammatical information. A morphological analysis unit that performs morphological analysis by searching the dictionary for the character string input by the character string input unit to divide the words into words, and adds grammatical information of the dictionary to the divided words. Original character string extracting means for extracting, as an original character string, a word string in which words satisfying a predetermined condition are repeated a predetermined number of times from the character string divided by the morphological analysis means, and original character strings extracted by the original character string extracting means An abbreviation means for forming an abbreviation by omitting a part of characters of the column under a certain rule, and an abbreviation display means for displaying the abbreviation formed by the abbreviation means.

【0010】この構成に係る文字入力装置では、ユーザ
が通常に文字入力するだけで、文書の入力時に頻出する
長い語句を自動的に検出し抽出して、これを自動的に略
語化するため、文字入力をしようとするユーザが、文章
を読み返すようなことをしないでも略語の生成ができ、
ユーザに負担をかけずに入力された文章が読みやすく編
集される。
[0010] In the character input device according to this configuration, the user simply inputs characters normally, and automatically detects and extracts long phrases frequently appearing in the input of a document, and automatically abbrevates them. The abbreviation can be generated without the user trying to enter characters without having to read back the text,
The input text is edited in a legible manner without burdening the user.

【0011】請求項2に係る発明の文字入力装置では、
請求項1に記載の文字入力装置の構成に加え、前記原文
字列抽出手段により抽出された原文字列を、前記略語化
手段により形成された略語に置換えて表示する置換え表
示手段を備えたことを特徴とする。
In the character input device according to the second aspect of the present invention,
In addition to the configuration of the character input device according to claim 1, further comprising replacement display means for replacing and displaying the original character string extracted by the original character string extraction means with the abbreviation formed by the abbreviation means. It is characterized by.

【0012】この構成に係る文字入力装置では、文書の
入力時に頻出する長い語句を、自動的に生成された略語
に置換えるため、ユーザがいちいち生成された略語とお
きかえる必要がない。
[0012] In the character input device according to this configuration, long words frequently appearing when inputting a document are replaced with automatically generated abbreviations, so that it is not necessary for the user to replace them with abbreviations generated one by one.

【0013】請求項3に係る発明の文字入力装置では、
請求項1又は請求項2に記載の文字入力装置の構成に加
え、略語化される前の前記原文字列を、当該文字列が略
語化されて形成された略語とに関係づけて表示する原文
字列表示手段を備えることを特徴とする。
In the character input device according to the third aspect of the present invention,
In addition to the configuration of the character input device according to claim 1 or 2, an original character string before being abbreviated is displayed in association with an abbreviation formed by abbreviating the character string. It is characterized by comprising a character string display means.

【0014】この構成に係る文字入力装置では、自動的
に略語化された元の文字列が何であったかを目で対比し
て確認でき、元の文字列を忘れてしまった時の確認や、
略語生成の適否の検討がしやすくなる。
In the character input device according to this configuration, it is possible to visually confirm what the original abbreviation character string was, to confirm when the original character string has been forgotten,
It is easier to determine whether abbreviations are appropriate.

【0015】請求項4に係る発明の文字入力装置では、
請求項1乃至請求項3のいずれかに記載の文字入力装置
の構成に加え、前記略語を編集する略語編集手段を備え
たことを特徴とする。
In the character input device according to the invention according to claim 4,
An abbreviation editing means for editing the abbreviation is provided, in addition to the configuration of the character input device according to any one of claims 1 to 3.

【0016】この構成に係る文字入力装置では、自動的
に生成された略語が適当でないと考えたときに、略語の
修正が容易にできる。
In the character input device according to this configuration, when the automatically generated abbreviation is considered inappropriate, the abbreviation can be easily corrected.

【0017】請求項5に係る発明の文字入力装置では、
請求項1乃至請求項4のいずれかに記載の文字入力装置
の構成に加え、前記文字列中の前記略語を原文字列に復
帰させる原文字列復帰手段を備えたことを特徴とする。
In the character input device of the invention according to claim 5,
In addition to the configuration of the character input device according to any one of claims 1 to 4, an original character string restoring means for returning the abbreviation in the character string to an original character string is provided.

【0018】 この構成に係る文字入力装置では、略語
化した文字列を、容易にもとの文字列に復帰でき、最初
の文章に復帰できるため、略語化が適当ではないと考え
た場合や、編集のみを略語化した文字列で行いたいよう
な場合に便利である。
In the character input device according to this configuration, the abbreviation character string can be easily returned to the original character string and can be restored to the first sentence. This is convenient when you want to edit only with an abbreviated character string.

【0019】 請求項6に係る発明の文字入力装置で
は、請求項1乃至請求項5のいずれかに記載の文字入力
装置の構成に加え、前記原文字列抽出手段において、前
記単語の所定の条件は、名詞を含む特定の品詞であると
することを特徴とする。
According to a sixth aspect of the present invention, in addition to the configuration of the character input device according to any one of the first to fifth aspects, the original character string extracting means includes a predetermined condition of the word. Is a specific part of speech including a noun.

【0020】この構成に係る文字入力装置では、品詞を
基準に判断することにより、略語化する文字の対象を適
切に選択できる。請求項7に係る発明の文字入力装置で
は、請求項1乃至請求項6のいずれかに記載の文字入力
装置の構成に加え、前記略語化手段において、前記略語
を形成する規則は、前記原文字列を構成する各単語の先
頭の文字を抽出することであることを特徴とする。
In the character input device according to this configuration, the object of the character to be abbreviated can be appropriately selected by making a determination based on the part of speech. In the character input device of the invention according to claim 7, in addition to the configuration of the character input device according to any one of claims 1 to 6, the rule for forming the abbreviation in the abbreviation unit is the same as that of the original character. It is characterized in that the first character of each word constituting the column is extracted.

【0021】この構成に係る文字入力装置では、複合語
を形成するすべての単語の1文字を用いているため、略
語化前の原文字列を構成する単語が何であったか理解し
やすく、且つ短く略語化できる。
In the character input device according to this configuration, since one character of all the words forming the compound word is used, it is easy to understand what the word constituting the original character string before the abbreviation was, and the short abbreviation was used. Can be

【0022】請求項8に係る発明の文字入力装置では、
請求項1乃至請求項6のいずれかに記載の文字入力装置
の構成に加え、前記略語化手段において、前記略語を形
成する規則は、前記原文字列を構成する末尾の単語はそ
のすべての文字を抽出し、その他の前記原文字列を構成
する単語は先頭の文字を抽出することであることを特徴
とする。
In the character input device of the invention according to claim 8,
In addition to the configuration of the character input device according to any one of claims 1 to 6, in the abbreviation means, a rule for forming the abbreviation is such that the last word constituting the original character string is all characters thereof. Is extracted, and the other words constituting the original character string are to extract the first character.

【0023】この構成に係る文字入力装置では、複合名
詞などの場合、意味の中心を形成する単語については省
略しないため、略語化しても元の複合名詞の意味が理解
しやすい略語を形成する。
In the character input device according to this configuration, in the case of a compound noun or the like, the word that forms the center of the meaning is not omitted. Therefore, even if the word is abbreviated, the meaning of the original compound noun is easily understood.

【0024】請求項9に係る発明の文字入力処理プログ
ラムを記録したコンピュータ読み取り可能な記録媒体で
は、コンピュータに、文字列を入力する文字列入力の手
順と、前記文字列入力の手順により入力された文字列を
見出し語と、文法情報とを含む辞書を検索することによ
り形態素解析を行って単語に分割し、前記辞書の文法情
報を前記分割された単語に付与する形態素解析の手順
と、前記形態素解析の手順により分割された文字列か
ら、所定の条件を満たす単語が所定数連続した単語列を
原文字列として抽出する原文字列抽出の手順と、前記原
文字列抽出の手順により抽出した原文字列を、その一部
の文字を一定の規則の下で省略して略語を形成する略語
化の手順と、前記略語化の手順により形成された略語を
表示する略語表示の手順とを実行させる。
According to a ninth aspect of the present invention, in the computer-readable recording medium storing the character input processing program, a character string input procedure for inputting a character string and a character string input procedure are input to the computer. A morphological analysis procedure of performing a morphological analysis by searching a dictionary including a headword and grammatical information to divide the character string into words, and adding grammatical information of the dictionary to the divided words; An original character string extraction procedure of extracting, as an original character string, a word string in which a predetermined number of words satisfying a predetermined condition are consecutive from the character string divided by the analysis procedure, and an original character string extracted by the original character string extraction procedure. An abbreviation procedure for forming an abbreviation by abbreviating a part of the character string under certain rules, and an abbreviation display method for displaying the abbreviation formed by the abbreviation procedure. To execute the door.

【0025】この構成に係る文字入力処理プログラムを
記録したコンピュータ読み取り可能な記録媒体では、コ
ンピュータに、ユーザが通常に文字入力するだけで、文
書の入力時に頻出する長い語句を自動的に検出し抽出し
て、これを自動的に略語化する手順とを実行させるた
め、文字入力をしようとするユーザが、文章を読み返す
ようなことをしないでも略語の生成ができ、ユーザに負
担をかけずに入力された文章が読みやすく編集される。
In a computer-readable recording medium on which the character input processing program according to this configuration is recorded, a user simply inputs characters normally and automatically detects and extracts long words frequently appearing when inputting a document. Then, in order to execute the procedure for automatically converting the abbreviation into an abbreviation, the user who wants to input characters can generate the abbreviation without having to read back the text, and can input the abbreviation without burdening the user. The sentence is edited for readability.

【0026】請求項10に係る発明の文字入力処理プロ
グラムを記録したコンピュータ読み取り可能な記録媒体
では、請求項9記載の文字入力処理プログラムを記録し
たコンピュータ読み取り可能な記録媒体の構成に加え、
前記コンピュータに、前記原文字列抽出の手順により抽
出された原文字列を、前記略語化の手順により形成され
た略語に置換えて表示する置換え表示の手順を実行させ
るプログラム備えたことを特徴とする。
According to a tenth aspect of the present invention, there is provided a computer readable recording medium recording the character input processing program, in addition to the configuration of the computer readable recording medium recording the character input processing program according to the ninth aspect,
A program for causing the computer to execute a replacement display procedure of replacing the original character string extracted in the original character string extraction procedure with the abbreviation formed in the abbreviation procedure and displaying the same. .

【0027】この構成に係る文字入力処理プログラムを
記録したコンピュータ読み取り可能な記録媒体では、コ
ンピュータに、文書の入力時に頻出する長い語句を、自
動的に生成された略語に置換える手順を実行させるた
め、ユーザがいちいち生成された略語とおきかえる必要
がない。
In the computer-readable recording medium storing the character input processing program according to this configuration, the computer is caused to execute a procedure for replacing a long phrase frequently appearing in inputting a document with an automatically generated abbreviation. It is not necessary for the user to replace the generated abbreviation.

【0028】請求項11に係る発明の文字入力処理プロ
グラムを記録したコンピュータ読み取り可能な記録媒体
では、請求項9又は請求項10に記載の文字入力処理プ
ログラムを記録したコンピュータ読み取り可能な記録媒
体の構成に加え、前記コンピュータに、略語化される前
の前記原文字列を、当該文字列が略語化されて形成され
た略語とに関係づけて表示する原文字列表示の手順を実
行させるプログラムを備えることを特徴とする。
A computer-readable recording medium on which the character input processing program according to the invention of claim 11 is recorded has a structure of a computer-readable recording medium on which the character input processing program according to claim 9 or 10 is recorded. In addition to the above, a program for causing the computer to execute an original character string display procedure of displaying the original character string before being abbreviated in association with an abbreviation formed by abbreviating the character string is provided. It is characterized by the following.

【0029】この構成に係る文字入力処理プログラムを
記録したコンピュータ読み取り可能な記録媒体では、コ
ンピュータに、自動的に略語化された元の文字列が何で
あったかが目で対比して確認できるように表示する手順
を実行させるため、元の文字列を忘れてしまった時の確
認や、略語生成の適否の検討がしやすくなる。
In the computer-readable recording medium storing the character input processing program according to this configuration, the computer automatically displays the original abbreviation character string so that it can be visually confirmed. This makes it easier to confirm when the original character string has been forgotten and to determine whether abbreviations are appropriate.

【0030】請求項12に係る発明の文字入力処理プロ
グラムを記録したコンピュータ読み取り可能な記録媒体
では、請求項9乃至請求項11のいずれかに記載の文字
入力処理プログラムを記録したコンピュータ読み取り可
能な記録媒体の構成に加え、前記コンピュータに、前記
略語を編集する略語編集の手順を実行させるプログラム
を備えたことを特徴とする。
According to a twelfth aspect of the present invention, there is provided a computer readable recording medium having recorded thereon the character input processing program according to any one of the ninth to eleventh aspects. In addition to the configuration of the medium, a program for causing the computer to execute an abbreviation editing procedure for editing the abbreviation is provided.

【0031】この構成に係る文字入力処理プログラムを
記録したコンピュータ読み取り可能な記録媒体では、コ
ンピュータに、自動的に生成された略語が適当でないと
考えたときに、略語の修正が容易にできる手順を実行さ
せる。
In the computer-readable recording medium storing the character input processing program according to this configuration, the computer is provided with a procedure which can easily correct the abbreviation when the automatically generated abbreviation is considered inappropriate. Let it run.

【0032】請求項13に係る発明の文字入力処理プロ
グラムを記録したコンピュータ読み取り可能な記録媒体
では、請求項9乃至請求項12のいずれかに記載の文字
入力処理プログラムを記録したコンピュータ読み取り可
能な記録媒体の構成に加え、前記コンピュータに、前記
文字列中の前記略語を原文字列に復帰させる原文字列復
帰の手順を実行させるプログラムを備えたことを特徴と
する。
According to a thirteenth aspect of the present invention, there is provided a computer readable recording medium having recorded thereon the character input processing program according to any one of the ninth to twelfth aspects. In addition to the configuration of the medium, a program for causing the computer to execute a procedure for restoring the abbreviation in the character string to an original character string is provided.

【0033】この構成に係る文字入力処理プログラムを
記録したコンピュータ読み取り可能な記録媒体では、コ
ンピュータに、略語化した文字列を、容易にもとの文字
列に復帰でき、最初の文章に復帰できる手順を実行させ
るため、略語化が適当ではないと考えた場合や、編集の
みを略語化した文字列で行いたいような場合に便利であ
る。
In a computer-readable recording medium on which the character input processing program according to the present invention is recorded, the computer can easily return the abbreviation character string to the original character string and return to the first sentence. Is convenient when it is considered that abbreviation is not appropriate, or when it is desired to perform only editing with a character string obtained by abbreviation.

【0034】請求項14に係る発明の文字入力処理プロ
グラムを記録したコンピュータ読み取り可能な記録媒体
では、請求項9乃至請求項13のいずれかに記載の文字
入力処理プログラムを記録したコンピュータ読み取り可
能な記録媒体の構成に加え、前記原文字列抽出の手順に
おいて、前記単語の所定の条件は、名詞を含む特定の品
詞であるとすることを特徴とする。
According to a fourteenth aspect of the present invention, there is provided a computer readable recording medium having recorded thereon the character input processing program according to any one of the ninth to thirteenth aspects. In addition to the configuration of the medium, in the original character string extraction procedure, the predetermined condition of the word is a specific part of speech including a noun.

【0035】この構成に係る文字入力処理プログラムを
記録したコンピュータ読み取り可能な記録媒体では、コ
ンピュータに、品詞を基準に判断することにより、略語
化する文字の対象を適切に選択できる手順を実行させ
る。
In the computer-readable recording medium storing the character input processing program according to this configuration, the computer is caused to execute a procedure capable of appropriately selecting the target of the character to be abbreviated by determining based on the part of speech.

【0036】請求項15に係る発明の文字入力処理プロ
グラムを記録したコンピュータ読み取り可能な記録媒体
では、請求項9乃至請求項14のいずれかに記載の文字
入力処理プログラムを記録したコンピュータ読み取り可
能な記録媒体の構成に加え、コンピュータに、前記略語
化の手順において、前記略語を形成する規則は、前記原
文字列を構成する各単語の先頭の文字を抽出することで
ある手順を実行させることを特徴とする。
According to a fifteenth aspect of the present invention, there is provided a computer readable recording medium having recorded thereon the character input processing program according to any one of the ninth to fourteenth aspects. In addition to the configuration of the medium, the abbreviation conversion procedure may cause the computer to execute a procedure in which the rule for forming the abbreviation is to extract the first character of each word constituting the original character string. And

【0037】この構成に係る文字入力処理プログラムを
記録したコンピュータ読み取り可能な記録媒体では、コ
ンピュータに、複合語を形成するすべての単語の1文字
を用いているため、略語化前の原文字列を構成する単語
が何であったか理解しやすく、且つ短く略語化できる手
順を実行させる。
In a computer-readable recording medium storing the character input processing program according to this configuration, since one character of all the words forming a compound word is used in the computer, the original character string before abbreviation is used. A procedure is executed to make it easy to understand what the constituent words were and to make the abbreviation short.

【0038】請求項16に係る発明の文字入力処理プロ
グラムを記録したコンピュータ読み取り可能な記録媒体
では、請求項9乃至請求項14のいずれかに記載の文字
入力処理プログラムを記録したコンピュータ読み取り可
能な記録媒体の構成に加え、コンピュータに、前記略語
化の手順において、前記略語を形成する規則は、前記原
文字列を構成する末尾の単語はそのすべての文字を抽出
し、その他の前記原文字列を構成する単語は先頭の文字
を抽出することである手順を実行させることを特徴とす
る。
According to a sixteenth aspect of the present invention, there is provided a computer readable recording medium having recorded thereon a character input processing program according to any one of the ninth to fourteenth aspects. In addition to the structure of the medium, in the abbreviation procedure, the abbreviation forming rule is such that the last word constituting the original character string extracts all of its characters, and the other original character strings are extracted. The constituent words are characterized by executing a procedure of extracting a leading character.

【0039】この構成に係る文字入力処理プログラムを
記録したコンピュータ読み取り可能な記録媒体では、コ
ンピュータに、複合名詞などの場合、意味の中心を形成
する単語については省略しない手順を実行させるため、
略語化しても元の複合名詞の意味が理解しやすい略語を
形成する。
In a computer-readable recording medium storing the character input processing program according to this configuration, in the case of a compound noun or the like, the computer is caused to execute a procedure that does not omit the word that forms the center of meaning.
The abbreviation forms an abbreviation in which the meaning of the original compound noun is easy to understand.

【0040】[0040]

【発明の実施の形態】以下、本発明の一の実施形態につ
いて、添付図面を参照して説明する。まず最初に、本実
施の形態の文字入力装置及び文字入力処理プログラムの
構成について図面を参照しながらその概略を説明する。
図1は、本実施の形態の文字入力装置及び文字入力処理
プログラムの構成の概略を示す図である。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS One embodiment of the present invention will be described below with reference to the accompanying drawings. First, the outlines of the configuration of the character input device and the character input processing program of the present embodiment will be described with reference to the drawings.
FIG. 1 is a diagram schematically illustrating a configuration of a character input device and a character input processing program according to the present embodiment.

【0041】図1で示すように、制御部10は、CPU
20、RAM30、ROM40、入出力ポート24がバ
スライン26を介して相互データ交換可能に接続されて
構成されており、入出力ポート24には、入力装置2、
表示部6とこれを制御する表示制御部7、外部記憶装置
4、印刷部8が接続されている。
As shown in FIG. 1, the control unit 10 includes a CPU
20, a RAM 30, a ROM 40, and an input / output port 24 are connected to each other via a bus line 26 so that they can exchange data with each other.
A display unit 6, a display control unit 7 for controlling the display unit 6, an external storage device 4, and a printing unit 8 are connected.

【0042】入力装置2は、キーボード、マウスから成
る文字入力及び操作のためのキーを有し、図示しない、
文字を入力するための文字キー、各種処理を起動するた
めの入力文編集キー、ユーザ辞書編集キー、略語化キ
ー、略語編集キー、登録キー、削除キー、キャンセルキ
ー、出力文編集キー、終了キー,及び印字実行キーとい
った各種機能キー、入力文や出力文の編集、表示部6に
表示されている画面操作等に使用するカーソルキー、挿
入キー、削除キー、確定キー、変換キー及び次候補選択
キー等が設けられている。
The input device 2 has keys for character input and operation including a keyboard and a mouse.
Character keys for entering characters, input sentence edit keys for starting various processes, user dictionary edit keys, abbreviation keys, abbreviation edit keys, registration keys, delete keys, cancel keys, output sentence edit keys, end keys , And various function keys such as a print execution key, a cursor key used for editing an input sentence or an output sentence, operating a screen displayed on the display unit 6, an insert key, a delete key, a confirm key, a conversion key, and a next candidate selection. A key and the like are provided.

【0043】外部記憶装置4は、入力された文字列の形
態素解析に使用される基本辞書12及びユーザ辞書14
が、ハードディスクやCD−ROMなどに格納されてい
る。
The external storage device 4 stores a basic dictionary 12 and a user dictionary 14 used for morphological analysis of the input character string.
Are stored on a hard disk, CD-ROM, or the like.

【0044】基本辞書は、見出し語、品詞、接続情報な
どの文法情報が格納されている。ここで、文字入力装置
が利用する辞書としては、文字入力装置が予めシステム
の一部として保有しているシステム辞書である基本辞書
12の他に、例えば医学用語など専門分野毎に編集され
た専門辞書、及びユーザが独自に構築するユーザ辞書1
4がある。専門辞書、ユーザ辞書14は任意に用いるも
ので基本辞書だけでもシステムとしては稼動できる。ユ
ーザ辞書14、専門辞書を利用する際には、外部記憶装
置4内に格納して利用する。また、専門辞書は,各種専
門分野毎に、ユーザ辞書は、例えば、ユーザ毎や利用分
野毎にそれぞれ複数個の辞書が同時に存在可能に構成さ
れていてもよい。本実施形態では、便宜上基本辞書とユ
ーザ辞書を1種類のみ利用した状況において説明する。
The basic dictionary stores grammatical information such as headwords, parts of speech, and connection information. Here, as the dictionary used by the character input device, in addition to the basic dictionary 12 which is a system dictionary which the character input device has in advance as a part of the system, for example, a specialized dictionary edited for each specialized field such as medical terms is used. Dictionaries and user dictionaries 1 that the user independently builds
There are four. The specialized dictionary and the user dictionary 14 are arbitrarily used, and the system can operate with only the basic dictionary. When the user dictionary 14 and the specialized dictionary are used, they are stored in the external storage device 4 and used. Further, the specialized dictionary may be configured so that a plurality of dictionaries can exist simultaneously for each of various specialized fields, and the user dictionary can be, for example, for each user or each of the fields of use at the same time. In this embodiment, a description will be given in a situation where only one type of basic dictionary and user dictionary is used for convenience.

【0045】なお、ユーザ辞書14については、基本辞
書12のデータ構成と基本的に同じ構成である。但し、
基本辞書12の内容は、ユーザが勝手に変更できないの
に比べ、ユーザ辞書14の内容はユーザが、ユーザ辞書
編集キーを操作すればユーザ辞書編集プログラム56に
より編集可能になっており、ユーザが希望する語句を予
め登録しておくことが可能である。形態素解析の処理に
際してはユーザ辞書14に登録した場合は、基本辞書1
2に優先してユーザ辞書14の内容が読み出される。
The user dictionary 14 has basically the same configuration as the data configuration of the basic dictionary 12. However,
While the contents of the basic dictionary 12 cannot be changed by the user without permission, the contents of the user dictionary 14 can be edited by the user dictionary editing program 56 by operating the user dictionary editing key. Can be registered in advance. When the morphological analysis is performed, if the user registers in the user dictionary 14, the basic dictionary 1
2, the contents of the user dictionary 14 are read out.

【0046】表示部6は、CRTからなるディスプレー
とこれを制御する表示制御部7からなり、入力した文字
列や、文書編集をした文字列などや、操作に必要な画面
表示がされる。本実施の形態では、マウスを備え画面上
のポインタで選択などの操作が可能となっている。
The display unit 6 comprises a display comprising a CRT and a display control unit 7 for controlling the display, and displays input character strings, document edited character strings, etc., and screens necessary for operations. In the present embodiment, a mouse is provided so that operations such as selection with a pointer on the screen can be performed.

【0047】印刷部8は、レーザプリンタからなり、編
集した文章などをハードコピーとして印刷するプリンタ
から構成されている。
The printing unit 8 is composed of a laser printer, and a printer that prints edited text and the like as a hard copy.

【0048】なお、図示していないが、入出力ポート
は、電話回線を通じてインターネットと接続したり、音
声認識装置からの入力を行ったり、また文書編集した文
章を有線で出力したりするためのインターフェイスとな
っており、有線、無線を問わず各種の機器を接続しての
入出力が可能となっている。
Although not shown, an input / output port is an interface for connecting to the Internet via a telephone line, inputting from a voice recognition device, and outputting a document edited text by wire. It allows input and output by connecting various devices regardless of wired or wireless.

【0049】制御部10は、バスライン26を介して入
出力ポート24を介して接続した外部機器をPCU20
により制御する。
The control unit 10 connects an external device connected via the input / output port 24 via the bus line 26 to the PCU 20.
Is controlled by

【0050】また、制御部10は、各種プログラムを格
納したROM40と、データを一時的に保持するRAM
30と、プログラムの実行を行うCPU20とにより、
本発明の文字入力装置の機能を実現するものでもある。
The control unit 10 includes a ROM 40 storing various programs, and a RAM temporarily storing data.
30 and the CPU 20 that executes the program,
It also implements the function of the character input device of the present invention.

【0051】ROM40には、装置全体のコントロール
をする制御プログラム41、入力された文字列の形態素
解析を行う形態素解析プログラム51、ユーザ辞書の編
集を行うユーザ辞書編集プログラム56などが格納され
ている。
The ROM 40 stores a control program 41 for controlling the entire apparatus, a morphological analysis program 51 for performing morphological analysis of an input character string, a user dictionary editing program 56 for editing a user dictionary, and the like.

【0052】制御プログラム41は、入出力ポートに接
続された各種入出力装置の制御や、各プログラムの立上
げやプログラム間の調整を行う。
The control program 41 controls various input / output devices connected to the input / output ports, starts up the programs, and adjusts the programs.

【0053】略語処理プログラム42は、以下のような
プログラムを含む。
The abbreviation processing program 42 includes the following programs.

【0054】原文字列抽出プログラム43は、詳細は後
述のフローチャートにより詳説するが、概ね以下のよう
な手順をCPUに実行させる。形態素解析が終わって文
字列が単語に切り分けられているが、この切り分けられ
た単語に対して、形態素解析により得た品詞情報に基づ
いて、名詞、接頭辞、接尾辞、カタカナなどの未知語な
どについて略語化の対象とされる原文字列を構成するも
のとして、他の単語と識別できるようなフラグを立て
る。そしてこれらのフラグのついた特定の単語が連続し
て並んでいる部分を調べて、例えば本実施の形態では連
続して4つ並んでいれば略語の必要があるとして抜き出
す。そして、これと同じ文字列を他の文章部分でパタン
マッチングにより探して、その数を数え、例えば5つ以
上あれば、略語化する文字列の対象としての原文字列を
抽出して、後述の略語化プログラム44で略語化するも
のである。
The details of the original character string extraction program 43 will be described later with reference to a flowchart, but the CPU generally executes the following procedure. After the morphological analysis, the character string is cut into words. Based on the part-of-speech information obtained by morphological analysis, unknown words such as nouns, prefixes, suffixes, katakana, etc. A flag is set so that it can be distinguished from other words as constituting the original character string to be abbreviated. Then, the part where the specific words with these flags are continuously arranged is checked. For example, in the present embodiment, if four consecutive words are arranged, it is extracted as the necessity of the abbreviation. Then, the same character string is searched for in another sentence part by pattern matching, and the number is counted. For example, if the number is five or more, the original character string as the target of the character string to be abbreviated is extracted and described later. It is abbreviated by the abbreviation program 44.

【0055】後述するように、ここで抽出された原文字
列は、略語の自動生成の候補としてユーザに、略語化前
の画面出力例を示す図3の(A)のように表示され、ユ
ーザの指示により、自動的に略語を生成し原文字列と置
換えられて、略語化後の画面出力例を示す図3の(B)
のように表示される。
As will be described later, the original character string extracted here is displayed to the user as a candidate for automatic generation of abbreviations as shown in FIG. FIG. 3B shows an example of screen output after abbreviation is automatically generated and replaced with the original character string according to the instruction of FIG.
Is displayed as follows.

【0056】略語化プログラム44は、これも後述する
フローチャートで詳述するが、原文字列抽出プログラム
43により抽出された原文字列から、略語を生成する手
順を実行させるプログラムである。
The abbreviation program 44 is a program for executing a procedure for generating an abbreviation from the original character string extracted by the original character string extraction program 43, which will also be described in detail in a flowchart described later.

【0057】略語の作り方の概略は、以下のようであ
る。名詞等が連続している複合名詞の場合、日本語を始
めとして最も意味上で重要な単語は最後部にある単語で
あることが多い。そこで、略語化するに当たり、最後部
の単語だけは省略しないでそのまま表示し、これらを修
飾等する他の単語は最初の一文字をピックアップして拾
い、最後部の単語の前に付けるものである。例えば、
「機械/翻訳/システム/開発/グループ」という文字
列であれば、最後尾の「グループ」という単語はそのま
ま、「機械」からは、「機」、「翻訳」からは「翻」、
「システム」からは「シ」、「開発」からは「開」をそ
れぞれ取り出し、これらを並べると「機翻シ開グルー
プ」となる。同様に「機械翻訳システム開発」であれ
ば、「機翻シ開発」というようになる。
The outline of how to create abbreviations is as follows. In the case of compound nouns in which nouns and the like are continuous, the most significant word in terms of meaning, such as Japanese, is often the last word. Therefore, in abbreviation, only the last word is displayed as it is without omitting it, and other words that modify these are picked up and picked up by the first letter, and attached in front of the last word. For example,
In the case of the character string "machine / translation / system / development / group", the word "group" at the end remains unchanged, "machine" from "machine", "translation" from "translation",
Extract "S" from "System" and "Open" from "Development", and arrange them together to form a "Shift Group". Similarly, "machine translation system development" would be "machine translation system development".

【0058】このような省略の仕方によれば、「グルー
プ」の名前なのか、或いは「開発」のテーマ名なのかが
容易に推察できる。そして、このような長い複合名詞が
連続する場合は、略語化することにより文章が大変読み
やすくなる。
According to such an omission method, it can be easily inferred whether the name is "group" or "development". When such long compound nouns are continuous, the sentence becomes very readable by abbreviation.

【0059】なお、英語の場合で「word/proc
essor」のようなものであれば、「wp」というよ
うに、頭文字だけで略語を生成するようにしてもよい。
これらの方法は、入力される文章の言語や、入力される
文書の内容、さらにユーザの好みの問題もあるので、こ
れらを選択できるようにしてもよい。
In the case of English, "word / proc
For example, an abbreviation such as "wp" may be generated using only the initials.
These methods have problems with the language of the input text, the content of the input document, and the user's preference, so that they may be selectable.

【0060】略語表示プログラム45は、略語化プログ
ラム44により生成された略語を表示させる手順を実行
させるプログラムであり、種々の方法が考えられるが、
本実施の形態では、先ず置換え表示プログラム46によ
り、入力文中の原文字列を消去し、原文字列があった場
所にそのまま略語化された文字列が置き換わって、略語
化後の画面出力例を示す図3の(B)のように表示され
る。
The abbreviation display program 45 is a program for executing a procedure for displaying the abbreviation generated by the abbreviation program 44, and various methods are conceivable.
In the present embodiment, first, the original character string in the input sentence is erased by the replacement display program 46, and the abbreviated character string is replaced as it is in the place where the original character string was present. It is displayed as shown in FIG.

【0061】原文字列表示プログラム47は、略語化さ
れて略語に置き換わった文字列については、略語化する
前の原文字列Xが表示されないため、元がどんな語句で
あったかユーザが確かめたい場合があるが、この場合
に、略語Zに対応する原文字列Xを表示する手順を実行
させるプログラムである。本実施の形態の場合、略語化
後の画面出力例を示す図3の(B)に示すように、略語
編集ウインドウ61を表示して、略語Zと対応する入力
文字列を画面表示により表示することにより、簡単に対
応する原文字列を確かめることができる。
The original character string display program 47 does not display the original character string X before the abbreviation for the character string that has been abbreviated and replaced with the abbreviation, so that the user may want to check what the original phrase was. However, in this case, the program executes a procedure for displaying the original character string X corresponding to the abbreviation Z. In the case of the present embodiment, as shown in FIG. 3B showing an example of screen output after abbreviation, an abbreviation edit window 61 is displayed, and an input character string corresponding to the abbreviation Z is displayed on the screen. Thus, the corresponding original character string can be easily confirmed.

【0062】略語編集プログラム48は、本実施の形態
によるように略語Zの自動生成機能をもっている場合、
ユーザの考えと異なった略語化がなされる場合や、意味
が分かり難い、発音しにくい場合等、自動生成された略
語Zの文字列から文字を削除または略語の文字列に文字
を付加したいようなときがあるが、その場合に略語Zを
修正するプログラムである。本実施の形態では、図3の
(B)に示すように略語編集ウインドウ61により略語
Zと入力文字列として原文字列Xが表示されるので、こ
の画面上で略語を編集することにより、変換テーブルの
機能を有する略語保存領域35のデータを書き換えて、
これに基づく表示を変更することができる。
If the abbreviation editing program 48 has an abbreviation Z automatic generation function as in this embodiment,
When abbreviations different from the user's idea are made, or when the meaning is difficult to understand or difficult to pronounce, it is necessary to delete characters from the automatically generated abbreviation Z character string or add characters to the abbreviation character string. In some cases, the program corrects the abbreviation Z. In the present embodiment, the abbreviation Z and the original character string X are displayed as an input character string in the abbreviation editing window 61 as shown in FIG. By rewriting the data in the abbreviation storage area 35 having a table function,
The display based on this can be changed.

【0063】原文字列復帰プログラム49は、略語化さ
れ置換えて表示された原文字列について略語化するのを
やめて、原文字列の表現に戻したいと考えた場合に、略
語を元の原文字列に復帰させる手順を実行させるプログ
ラムである。この場合文章中に立てられたフラグZを手
掛かりに略語Zを、変換テーブルでもある略語保存領域
35で対応する原文字列である文字列Xに変換して入力
文中の略語Zと置換え表示するものである。従って、前
述の置換え表示プログラム46と相俟って、略語Zと原
文字列Xは双方向に文中で変換できることになる。
When the original character string return program 49 wants to stop abbreviation of the original character string displayed by being abbreviated and replaced and return to the original character string expression, the abbreviation is replaced with the original original character string. This is a program that executes a procedure for returning to a column. In this case, the abbreviation Z is converted into the corresponding original character string X in the abbreviation storage area 35 which is also a conversion table, using the flag Z set in the text as a clue, and replaced with the abbreviation Z in the input sentence. It is. Therefore, in combination with the above-described replacement display program 46, the abbreviation Z and the original character string X can be bidirectionally converted in the sentence.

【0064】略語化入力プログラム50は、一度原文字
列を略語化して、略語保存領域35に保存されれば、以
後の文字列入力に際しては、ユーザ辞書と同様に、略語
Zを入力するとこれを原文字列として表示する機能を実
行するプログラムである。従って、略語化入力モードで
入力すれば、前述の「機翻シ開グループ」と入力し、略
語表示をすれば、本来略語ではないが、保存された略語
Zと同一の文字列である「機翻シ開グループ」という文
字列を略語であると見なし、「機械翻訳システム開発グ
ループ」と変換されて、入力文中に表示するものであ
る。従って、一度略語化をすれば、以後原文字列と同一
の表記をしたい場合は、略語と同一の文字列を入力すれ
ば、変換して原文字列と同一の表記をすることができ
る。
The abbreviation input program 50 once abbreviates the original character string and saves it in the abbreviation storage area 35. In the subsequent character string input, the abbreviation Z is input as in the user dictionary. This is a program that executes the function of displaying as an original character string. Therefore, if the input is made in the abbreviation input mode, the above-mentioned "quick open group" is input, and if the abbreviation is displayed, the character string which is not originally an abbreviation but is the same as the saved abbreviation Z is The character string "translation group" is regarded as an abbreviation, converted to "machine translation system development group", and displayed in the input sentence. Therefore, once the abbreviation is made, if the same notation as the original character string is desired to be applied thereafter, if the same character string as the abbreviation is input, it can be converted to the same notation as the original character string.

【0065】図2は、本実施の形態の文字入力装置の処
理の流れの概略を示すフローチャートである。以下、本
図のフローチャートに従って文字入力装置の処理の流れ
の概略を説明する。図2に示すように、本実施の形態で
は、まず文字列を入力装置2から入力する(S10
0)。入力は、キーボードによる文字列のキー入力と、
マウスを使った画面指示によるコマンド入力による。文
節ごと、連文節、一文など任意に入力でき、入力された
単位で次の形態素解析が行われる。
FIG. 2 is a flowchart showing an outline of the processing flow of the character input device of the present embodiment. Hereinafter, an outline of a processing flow of the character input device will be described with reference to the flowchart of FIG. As shown in FIG. 2, in the present embodiment, first, a character string is input from the input device 2 (S10).
0). Input is a key input of a character string with a keyboard,
By command input using screen instructions using a mouse. Arbitrary phrases, continuous phrases, one sentence, etc. can be arbitrarily input, and the next morphological analysis is performed in the input unit.

【0066】次に、入力された文字列を形態素解析を行
う(S110)。形態素解析は、入力された文字列を、
最長一致法と呼ばれる方法で、辞書を検索して入力され
た文字列に辞書の見出しと同一の見出しを発見する。こ
こで、入力された文字列と、辞書の見出しが一致する
と、前後の単語との接続関係などがチェックされてその
文字列の単語が確定され、辞書からその単語についての
読み情報、品詞、活用形、意味、接続情報などの文法情
報が呼び出されて、その単語に関係づけられて保存され
る。従って、単文節よりは、連文節の方が接続情報など
の情報が多いため一般的には解析の精度が高い。
Next, morphological analysis is performed on the input character string (S110). Morphological analysis converts the input character string into
By a method called the longest match method, a dictionary is searched to find the same heading as the dictionary in the input character string. Here, when the input character string matches the dictionary heading, the connection relationship between the preceding and following words is checked, the word of the character string is determined, and reading information, part of speech, utilization of the word from the dictionary are determined. Grammar information such as shape, meaning, and connection information is called up and stored in association with the word. Therefore, the continuous phrase generally has higher analysis accuracy than the single phrase because the continuous phrase has more information such as connection information.

【0067】そして、形態素解析の結果に基づいて、適
切な漢字が当てられ、読み入力から漢字かな混じり文を
生成する、かな漢字変換が行われる(S120)。この
段階までは、周知の手段により本発明の実施できるの
で、詳しくは説明しない。
Then, based on the result of the morphological analysis, an appropriate kanji is assigned, and a kana-kanji conversion is performed to generate a kanji-kana mixed sentence from the reading input (S120). Up to this stage, the present invention can be implemented by well-known means, and thus will not be described in detail.

【0068】次に、形態素解析が終了した文字列におい
て、略語化処理が行われる(S130)。ここでいう
「略語化」とは、文中に複合名詞などがある場合、これ
らの文字列の一部分を抜き出して略語を作ることをい
う。そのための手順としては、まず、文中から略語化す
る対象としての原文字列である複合名詞などを探す原文
字列抽出の手順を実行し、次に抽出した原文字列を所定
の規則により略語化する略語化の手順を実行し略語Zを
生成する。そして、生成した略語Zを元の原文字列と置
換えて表示する略語表示の手順を実行し、さらに必要な
場合は、原文字列を表示する原文字列表示の手順を実行
したり、既に生成された略語を編集する略語編集の手順
を実行する。
Next, abbreviation processing is performed on the character string for which the morphological analysis has been completed (S130). Here, “abbreviation” means that when there is a compound noun or the like in a sentence, a part of these character strings is extracted to form an abbreviation. As a procedure for this, first, an original character string extraction procedure for searching for a compound noun, which is an original character string to be abbreviated from a sentence, is executed, and then the extracted original character string is abbreviated according to a predetermined rule. An abbreviation Z is generated by executing an abbreviation conversion procedure. Then, an abbreviation display procedure for replacing the generated abbreviation Z with the original original character string is performed, and if necessary, executing the original character string display procedure for displaying the original character string, Perform the abbreviation editing procedure to edit the abbreviation that was entered.

【0069】ここで、略語化処理の手順を図4に示すフ
ローチャートにより詳述する。略語化処理がスタートす
ると、まず形態素解析(図2:S110)の結果を受け
て入力文を単語単位に分割する。次に、分割した単語の
うち、形態素解析の結果、名詞、接頭辞、接尾辞の他、
カタカナなど未知語と判定された単語を抽出し、これら
の単語にフラグYを立てる(S2)。そして、フラグY
のカウントをするためのカウンタメモリのyを0にリセ
ットする(S3)。入力された文字列の文頭からフラグ
のない単語を検出した場合には、yを0にして、フラグ
Yを検出した場合にはカウンタメモリのyを+1する
(S4)。こうしてyがN以上になったら(S5:YE
S)フラグYがN個連続したとして略語化の対象候補と
して原文字列をRAM30の文字列保存部36に文字列
Xとして保存する(S6)。本実施例の場合、Nは4に
設定しているので、連続して前記所定の単語種が4つ並
んだ文字列を抽出して保存する。
Here, the procedure of the abbreviation processing will be described in detail with reference to the flowchart shown in FIG. When the abbreviation processing starts, first, the input sentence is divided into words in response to the result of the morphological analysis (FIG. 2: S110). Next, among the divided words, the results of morphological analysis, nouns, prefixes, suffixes,
Words determined as unknown words, such as katakana, are extracted, and flags Y are set for these words (S2). And the flag Y
Is reset to 0 in the counter memory for counting (S3). If a word without a flag is detected from the beginning of the input character string, y is set to 0, and if a flag Y is detected, y in the counter memory is incremented by 1 (S4). When y becomes N or more in this way (S5: YE
S) Assuming that N flags Y are consecutive, the original character string is stored as a character string X in the character string storage unit 36 of the RAM 30 as an abbreviation target candidate (S6). In the case of the present embodiment, N is set to 4, so that a character string in which four of the predetermined word types are continuously arranged is extracted and stored.

【0070】つぎに文字列Xの出現回数をカウントする
kのカウンタメモリ38のkを0にリセットして(S
7)、文字列Xのカウントの準備をする(S7)。そし
て、文字列Xの出願回数をカウントするが(S8)、最
初に発見した回数もカウントするため、この段階でk=
1となっている。そして、入力文の文末でなければ(S
9:NO)、文字列保存部36に保存された文字列Xと
のパターンとマッチする文字列を入力文において検索す
るパターンマッチングを行う(S10)。入力文の残余
の部分から文字列Xと同一の文字列が発見されたら(S
11:YES)、文字列Xの出現回数のカウンタkを+
1してkカウンタメモリ38の記憶を更新する。
Next, k of the counter memory 38 for counting the number of appearances of the character string X is reset to 0 (S
7) Prepare for counting the character string X (S7). Then, the number of applications of the character string X is counted (S8), but the number of times that the character string X is first found is also counted.
It is 1. And if it is not the end of the input sentence (S
9: NO), pattern matching is performed to search the input sentence for a character string that matches the pattern with the character string X stored in the character string storage unit 36 (S10). If a character string identical to the character string X is found from the rest of the input sentence (S
11: YES), the counter k of the number of appearances of the character string X is incremented by +
1 to update the storage of the k counter memory 38.

【0071】こうして文末まで文字列Xと同一の文字列
の検索をして文末に達したら(S9:YES)文字列X
の検索を終了する。また、入力文で文字列Xと同一の文
字列の検索の結果、同一の文字列が発見されず(S1
1:NO)、文末に達しても(S9:YES)同様に検
索を終了する。
When the same character string as the character string X is searched until the end of the sentence is reached (S9: YES), the character string X
End the search for. As a result of the search for the same character string as the character string X in the input sentence, the same character string is not found (S1).
1: NO), even if the end of the sentence is reached (S9: YES), the search is similarly terminated.

【0072】ここで、kカウンタメモリ38に記憶され
たkがM個以上であった場合、本実施形態の場合5個以
上であった場合(S12:YES)、文字列Xを略語化
の対象とする。一方、kが5未満であった場合には、文
字列Xは、略語化の対象外として、入力文中の文字列X
のフラグYを、次の検索の対象から外すため消去する
(S18)。また、文字列保存部36の文字列Xについ
ても、次の検索をしないために記憶を消去する(S1
9)。
If the number of k stored in the k counter memory 38 is M or more, and in the case of this embodiment it is 5 or more (S12: YES), the character string X is subjected to abbreviation. And On the other hand, if k is less than 5, the character string X is excluded from the abbreviation and is not included in the input sentence.
The flag Y is deleted to exclude it from the next search target (S18). Also, the storage of the character string X in the character string storage unit 36 is deleted so as not to perform the next search (S1).
9).

【0073】文字列Xの出現回数がM回以上、ここでは
5回以上であった場合(S12:YES)、ユーザにこ
の文字列が略語化の対象であることを認識させるよう
に、図3の(A)に示すように、例えばアンダーライン
を引いて文字列Xを表示する(S13)。ユーザが表示
された文字列Xについて略語化を望めば、キーボードの
略語化キーを操作することで(S14:YES)、文字
列Xを略語化する。
If the number of appearances of the character string X is M or more, here 5 or more (S12: YES), the user is made to recognize that this character string is an abbreviation target in FIG. (A), the character string X is displayed, for example, by underlining (S13). If the user desires to abbreviate the displayed character string X, the character string X is abbreviated by operating the abbreviation key on the keyboard (S14: YES).

【0074】ここで、図5は、文字列Xの略語化の手順
を表わしたフローチャートであり、この図5にそって、
S15において処理される文字列X略語化の手順を、さ
らに詳述する。
FIG. 5 is a flowchart showing the procedure for abbreviation of the character string X.
The procedure of character string X abbreviation processed in S15 will be described in further detail.

【0075】略語化キーを操作して文字列Xの略語化を
選択すると(S14:YES)、文字列Xについてフラ
グYの検出が最初の単語から始まる(S151)。そし
て、ここでは出現回数kを5回以上として設定している
ので、最初の単語は文字列Xの末尾の単語ではないため
(S152:NO)、その単語の最初の1文字だけを抽
出し、RAM30の略語保存領域35に保存する(S1
53)。
When the abbreviation key is operated to select the abbreviation of the character string X (S14: YES), detection of the flag Y for the character string X starts from the first word (S151). Since the number of appearances k is set to 5 or more, the first word is not the last word of the character string X (S152: NO), and only the first character of the word is extracted. It is stored in the abbreviation storage area 35 of the RAM 30 (S1
53).

【0076】そして再び、文字列XのフラグYの検索を
続け、2つ目の単語を検出し(S151)、2つ目めの
単語もまだ末尾の単語ではないため(S152:N
O)、2つ目の単語の最初の1文字を抽出して、既に最
初の単語の1文字目が記憶されている略語保存領域35
の最初の単語の1文字目の文字の後に続くように、今検
出した2文字目の最初の文字を記憶する。続いて3つ目
の単語、4つ目の単語も同様に最初の1文字を抽出して
略語保存領域35に記憶する。このようにして略語記憶
領域35には、4つの文字が記憶されていることにな
る。
The search for the flag Y of the character string X is continued again, and the second word is detected (S151). Since the second word is not the last word yet (S152: N).
O) The abbreviation storage area 35 in which the first character of the second word is extracted and the first character of the first word is already stored.
The first character of the second character detected just after the first character of the first word is stored. Subsequently, the first word is similarly extracted from the third word and the fourth word and stored in the abbreviation storage area 35. In this way, four characters are stored in the abbreviation storage area 35.

【0077】そして、同様にフラグYの検出による単語
の検出で(S151)、文字列Xの最後の単語が検出さ
れた場合(S152:YES)、この単語は、複合名詞
では意味の中心をなす主名詞と推定されるので、その単
語のすべての文字を、略語保存部35に記憶されている
1文字ずつ抽出され順に配列された文字の最後に連続し
て保存される(S154)。こうして、文字列Xの略語
Zが生成され、略語保存部35に保存される。この略語
Zが、文字列Xから生成されたことが分かるように、文
字列Xと同一の文字列が検出された場所を示すポインタ
が略語保存部35に付与される(S155)。このポイ
ンタは、生成された略語Zが入力文の内のどの文字列か
ら生成されたかを示すポインタで、入力文の文字列Xの
出現回数とおなじ数のポインタを有することになる。こ
のポインタを有することで原文字列を略語Zに入れ替え
たり、編集した略語を更新したり、略語Zを元の原文字
列に復帰させたりすることが可能になる。こうして、文
字列Xの略語化が終了する。
When the last word of the character string X is detected (S152: YES) by detecting a word by detecting the flag Y (S151), this word forms the center of meaning in a compound noun. Since it is presumed to be the main noun, all the characters of the word are successively stored at the end of the characters stored in the abbreviation storage unit 35, which are extracted one by one and arranged in order (S154). Thus, the abbreviation Z of the character string X is generated and stored in the abbreviation storage unit 35. In order to know that the abbreviation Z is generated from the character string X, a pointer indicating a location where the same character string as the character string X is detected is given to the abbreviation storage unit 35 (S155). This pointer indicates which character string in the input sentence the generated abbreviation Z was generated from, and has the same number of occurrences of the character string X in the input sentence. Having this pointer makes it possible to replace the original character string with the abbreviation Z, update the edited abbreviation, and restore the abbreviation Z to the original original character string. Thus, the abbreviation of the character string X is completed.

【0078】ここで、略語保存領域35について説明す
ると、略語保存領域35は、略語編集ウインドウ61と
同様の構成で、上記文字列Xが記憶されている入力文字
列のフィールドと、このフィールドに関係づけられて、
この文字列Xが略語化された文字列である略語Zが記憶
されている略語のフィールドからなる。それに加え、入
力文字列の入力文中の場所を示すポインタがこれらに関
係付けられて記憶されている。また、略語保存領域は、
略語化される前の入力文字列である原文字列と、これを
略語化した略語Zとの変換テーブルとしての機能も有し
ており、これらの相互の変換に利用できる。
Here, the abbreviation storage area 35 will be described. The abbreviation storage area 35 has the same configuration as the abbreviation editing window 61, and includes a field of the input character string in which the character string X is stored, and a field related to this field. Attached
The character string X is composed of an abbreviation field in which an abbreviation Z, which is an abbreviation character string, is stored. In addition, a pointer indicating the location of the input character string in the input sentence is stored in association with these. The abbreviation storage area is
It also has a function as a conversion table between an original character string, which is an input character string before being abbreviated, and an abbreviation Z, which is an abbreviation of the original character string, and can be used for mutual conversion.

【0079】略語化処理(S130)が終了すると、必
要な場合には、略語Zを編集する略語編集処理を行う
(S140)。略語編集処理(S140)は、略語化処
理(S130)で自動的に生成された略語Zをユーザの
任意で修正する手順である。ここで、略語Zを修正すれ
ば、既に略語化された入力文中の略語Zが修正される。
略語Zを編集する場合は、図3の(B)に示す略語編集
ウインドウ61を表示させ、このウインドウ上で略語Z
を編集することにより、この画面と連動させた略語保存
領域35のデータを更新する。つまり、原文字列−略語
の変換テーブルの機能を有する略語保存領域35の内容
を略語編集ウインドウ61により表示させることによ
り、直接変換テーブルの機能を持つ略語保存領域35の
データを書き換えるものである。そうすることで、略語
保存領域35に記憶されているポインタにより、入力文
中の略語Zを書き換えたりすることができる。
When the abbreviation process (S130) is completed, an abbreviation editing process for editing the abbreviation Z is performed, if necessary (S140). The abbreviation editing process (S140) is a procedure in which the user arbitrarily corrects the abbreviation Z automatically generated in the abbreviation conversion process (S130). Here, if the abbreviation Z is modified, the abbreviation Z in the already abbreviated input sentence is modified.
When editing the abbreviation Z, an abbreviation editing window 61 shown in FIG. 3B is displayed, and the abbreviation Z is displayed on this window.
Is updated, the data in the abbreviation storage area 35 linked with this screen is updated. That is, by displaying the contents of the abbreviation storage area 35 having the function of the original character string-abbreviation conversion table on the abbreviation editing window 61, the data of the abbreviation storage area 35 having the function of the direct conversion table is rewritten. By doing so, the abbreviation Z in the input sentence can be rewritten using the pointer stored in the abbreviation storage area 35.

【0080】ここで、図6に示す略語編集処理の手順を
表わしたフローチャートに沿って略語編集処理(S14
0)の処理の概略を説明する。まず、略語編集キーを操
作すると(S141:YES)、図3の(B)に示すよ
うな略語編集ウインドウ61が表示される(S14
3)。そして、表示された画面のうち、略語の欄の略語
Zを、通常の文書編集と同様に加入・削除・変更を行っ
て、所望の略語に編集する。編集が済んだら、確定キー
を操作して(S145:YES)編集を終了する。そう
すると、略語編集ウインドウ61で編集した略語が、略
語保存領域35の該当する略語Zに上書きされて、略語
保存領域35の略語Zの内容が更新される(S14
6)。そして、略語保存領域35の該当する原文字列の
場所を示すポインタに従って、該当場所の編集前の略語
Zを編集した略語に書きかえる(S147)。このよう
にして、略語編集ウインドウ61の略語Zを編集するだ
けで、入力文中のすべての略語Zを編集することができ
る。なお、略語編集キーを押さないで終了キーを押した
場合(S142:YES)や編集後確定キーを押さない
で(S145:NO)終了キーを押した場合(S14
2:YES)は処理が終了される(略語編集処理エン
ド)。また、編集後確定キーを押さないで、略語編集キ
ーを押せば(S145:NO、S142:NO、S14
1:YES)再度編集ができる。
Here, the abbreviation editing process (S14) is performed according to the flowchart showing the procedure of the abbreviation editing process shown in FIG.
The outline of the process 0) will be described. First, when the abbreviation edit key is operated (S141: YES), an abbreviation edit window 61 as shown in FIG. 3B is displayed (S14).
3). Then, in the displayed screen, the abbreviation Z in the abbreviation column is added, deleted, or changed in the same manner as in normal document editing, and edited to a desired abbreviation. When the editing is completed, the enter key is operated (S145: YES), and the editing ends. Then, the abbreviation edited in the abbreviation editing window 61 is overwritten on the corresponding abbreviation Z in the abbreviation storage area 35, and the content of the abbreviation Z in the abbreviation storage area 35 is updated (S14).
6). Then, according to the pointer indicating the location of the corresponding original character string in the abbreviation storage area 35, the abbreviation Z of the corresponding location before editing is rewritten to the edited abbreviation (S147). In this way, by simply editing the abbreviation Z in the abbreviation editing window 61, all the abbreviations Z in the input sentence can be edited. When the end key is pressed without pressing the abbreviation edit key (S142: YES) or when the end key is pressed without pressing the finalize key after editing (S145: NO) (S14)
2: YES), the process ends (abbreviation editing process end). If the abbreviation edit key is pressed without pressing the enter key after editing (S145: NO, S142: NO, S14
1: YES) Editing can be performed again.

【0081】略語編集処理(S140)が、終了し、続
いて新たな入力文を入力する場合(S150:YE
S)、最初の文字列入力の手順(S100)に戻り、前
述の手順が繰り返される(S100.S110,S12
0)。
When the abbreviation editing process (S140) is completed and a new input sentence is subsequently input (S150: YE)
S), the procedure returns to the first character string input procedure (S100), and the above procedure is repeated (S100. S110, S12).
0).

【0082】この場合、既に略語保存領域35に保存さ
れている原文字列と同様な文字列を入力するとき、これ
に対応する略語を入力すれば、略語保存領域35の変換
テーブルとしての機能を利用して原文字列が自動的に入
力されたり、逆に、原文字列を入力すれば略語が自動的
に入力されるように、略語化入力プログラム50を備え
ることもできる。この場合、原文字列または略語が入力
されたときに入力された場所を示すポインタを生成して
略語保存領域35に保存することにより、後編集が容易
になる。
In this case, when a character string similar to the original character string already stored in the abbreviation storage area 35 is input, by inputting the corresponding abbreviation, the function of the abbreviation storage area 35 as a conversion table can be performed. An abbreviation input program 50 may be provided so that the original character string is automatically input using the input, or conversely, the abbreviation is automatically input when the original character string is input. In this case, by generating a pointer indicating the location where the original character string or abbreviation was input when the abbreviation was input and storing it in the abbreviation storage area 35, post-editing becomes easy.

【0083】入力が終了すれば、編集した入力文を出力
文として画面に表示して(S160)、本実施の形態の
文字入力処理を終了する(エンド)。
When the input is completed, the edited input sentence is displayed on the screen as an output sentence (S160), and the character input processing of the present embodiment ends (end).

【0084】ここで、図3の出力画面を示す図を参照し
て、図2に示すフローチャートに沿って「機械翻訳シス
テム開発グループ・・・」という文字列を入力した場合
を具体例として説明する。まず、「きかいほんやくしす
てむかいはつぐるーぷ・・・」とキーボードから入力す
る(S100)。ここで、変換キー、次候補選択キーを
押せば、入力文の文字列を形態素解析を行って(S11
0)、該当する漢字を表示してかな漢字変換を行う(S
110)。同様に、文字列を入力し、かな漢字変換を行
う。ここで「機械翻訳システム開発グループ」は、「機
械/翻訳/システム/開発/グループ」と名詞が5つ連
続しており、出現回数が5回を超えているものとする。
Here, a case in which a character string “Machine Translation System Development Group...” Is input along the flowchart shown in FIG. 2 will be described with reference to a diagram showing the output screen of FIG. . First, the operator inputs "Kikaihonshisuteimukaiguru ...." from the keyboard (S100). Here, if the conversion key and the next candidate selection key are pressed, the character string of the input sentence is subjected to morphological analysis (S11).
0), display the corresponding kanji and perform kana-kanji conversion (S
110). Similarly, a character string is input and Kana-Kanji conversion is performed. Here, the “machine translation system development group” has five consecutive nouns “machine / translation / system / development / group” and the number of appearances exceeds five.

【0085】入力文の入力が終了したら、略語化キーを
操作すると略語化処理が開始される。最初の略語化する
文字列の候補が発見されると、図3の(A)に示すよう
に候補「機械翻訳システム開発グループ」にアンダーラ
インが表示されるので(図4:S13)、この文字列を
略語化したいときには確定キーを操作する(図4:S1
4:YES)。そうすると、略語化の処理がされ(図
4:S15)、文章中の「機械翻訳システム開発グルー
プ」という文字列は「機翻シ開グループ」というように
最後の単語はすべての文字が、それ以外の単語は最初の
1文字が抽出されて略語Zが形成されて、元の文字列と
入れ替わって表示される(図4:S17)。この時の画
面を図3の(B)に示す。この場合に、元の文字列が知
りたい場合は、略語編集キーを操作することにより、図
3の(B)に示すように略語編集ウインドウ61を表示
させることができる(図4:S21:YES、S2
2)。
When the input of the input sentence is completed, the abbreviation key is operated to start the abbreviation processing. When the first candidate for the character string to be converted into an abbreviation is found, an underline is displayed in the candidate “Machine Translation System Development Group” as shown in FIG. 3A (FIG. 4: S13). When the column is to be abbreviated, the enter key is operated (FIG. 4: S1).
4: YES). Then, abbreviation processing is performed (FIG. 4: S15), and the character string “Machine Translation System Development Group” in the sentence is all characters in the last word, such as “Machine Translation System Development Group”. The first character of the word is extracted to form an abbreviation Z, and is displayed in place of the original character string (FIG. 4: S17). The screen at this time is shown in FIG. In this case, if the user wants to know the original character string, the abbreviation edit window 61 can be displayed by operating the abbreviation edit key as shown in FIG. 3B (FIG. 4: S21: YES). , S2
2).

【0086】なお、本実施の形態においては、制御プロ
グラム41が、入力装置2とともにCPU20を本発明
の文字列入力手段として機能させ、本発明の文字列入力
の手順を実行させる。また、基本辞書12及びユーザ辞
書14が、本発明の辞書に相当する。同様に、形態素解
析プログラム51が、CPU20を本発明の形態素解析
手段として機能させ、本発明の形態素解析の手順を実行
させる。原文字列抽出プログラム43が、CPU20を
原文字列抽出手段として機能させ、本発明の原文字列抽
出の手順を実行させる。略語化プログラム44が、CP
U20を略語化手段として機能させ、本発明の原略語化
の手順を実行させる。略語表示プログラム45が、CP
U20を略語表示手段として機能させ、本発明の略語表
示の手順を実行させる。置換え表示プログラム46が、
表示部6とともにCPU20を置換え表示手段として機
能させ、本発明の置換え表示の手順を実行させる。原文
字列表示プログラム47が、表示部6とともにCPU2
0を原文字列表示手段として機能させ、本発明の原文字
列表示の手順を実行させる。略語編集プログラム48
が、CPU20を略語編集手段として機能させ、本発明
の略語編集の手順を実行させる。そして、原文字列復帰
プログラム49が、CPU20を原文字列復帰手段とし
て機能させ、本発明の原文字列復帰の手順を実行させ
る。
In this embodiment, the control program 41 causes the CPU 20 together with the input device 2 to function as the character string input means of the present invention, and to execute the procedure of character string input of the present invention. Further, the basic dictionary 12 and the user dictionary 14 correspond to the dictionary of the present invention. Similarly, the morphological analysis program 51 causes the CPU 20 to function as the morphological analysis means of the present invention, and to execute the morphological analysis procedure of the present invention. The original character string extraction program 43 causes the CPU 20 to function as an original character string extraction unit and to execute the original character string extraction procedure of the present invention. The abbreviation program 44
U20 is made to function as an abbreviation means, and the original abbreviation procedure of the present invention is executed. The abbreviation display program 45 uses the CP
U20 is made to function as abbreviation display means to execute the abbreviation display procedure of the present invention. The replacement display program 46
The CPU 20 together with the display unit 6 functions as replacement display means to execute the replacement display procedure of the present invention. The original character string display program 47 is executed by the CPU 2 together with the display unit 6.
0 is made to function as an original character string display means to execute the original character string display procedure of the present invention. Abbreviation editing program 48
Causes the CPU 20 to function as abbreviation editing means, and to execute the abbreviation editing procedure of the present invention. Then, the original character string restoring program 49 causes the CPU 20 to function as an original character string restoring means, and to execute the original character string restoring procedure of the present invention.

【0087】以上、一の実施の形態を説明したが、本実
施の形態は、以下のように変更実施することもできる。
Although the embodiment has been described above, the present embodiment can be modified as follows.

【0088】例えば、言語の種類は、日本語を例に説明
したが、本発明は、英語を始め他の言語の場合であって
も同様に適用できる。
For example, the type of language has been described using Japanese as an example, but the present invention can be similarly applied to other languages including English.

【0089】また、本実施の形態では、各プログラムは
ROM40に格納されているが、例えば外部記憶装置4
のハードディスクにインストールされて、実行されるも
のであってもよい。この場合、各プログラムがインスト
ールされたハードディスクが本発明の文字入力処理プロ
グラムを記録したコンピュータ読み取り可能な記録媒体
に相当することになる。また、記録媒体は、ハードディ
スクに限らず、コンピュータ読み取り可能な記録媒体で
あれば如何なるものであってもよい。
In this embodiment, each program is stored in the ROM 40.
May be installed and executed on a hard disk. In this case, the hard disk in which each program is installed corresponds to a computer-readable recording medium that records the character input processing program of the present invention. The recording medium is not limited to a hard disk, but may be any other computer-readable recording medium.

【0090】さらに、文章の入力は、キーボードからの
キー入力だけでなく、テキストファイルを読み込むよう
な入力方法であってもよい。但し、この場合は、入力語
形態素解析をするように構成される。
Further, the input of the sentence may be not only a key input from a keyboard but also an input method of reading a text file. In this case, however, the input word morphological analysis is performed.

【0091】そして、本装置は及び本記録媒体は、文字
入力の単機能のものばかりでなく、例えば機械翻訳装置
やOCRの一部として用いられても、その効果を発揮す
るものである。
The present apparatus and the present recording medium are not limited to those having a single function of character input, but exert their effects even when they are used as a part of a machine translator or an OCR, for example.

【0092】以上、一の実施の形態に基づき本発明を説
明したが、本発明は上述した実施の形態に何ら限定され
るものではなく、本発明の特許請求の範囲の趣旨を逸脱
しない範囲で種々の改良変更が可能であることは容易に
推察できるものである。
Although the present invention has been described with reference to one embodiment, the present invention is not limited to the above-described embodiment, and it does not depart from the spirit of the claims of the present invention. It is easily inferred that various improvements and modifications are possible.

【0093】[0093]

【発明の効果】上記説明から明らかなように、請求項1
に係る発明の文字入力装置では、ユーザが通常に文字入
力するだけで、文書の入力時に頻出する長い語句を自動
的に検出し抽出して、これを自動的に略語化するため、
文字入力をしようとするユーザが、文章を読み返すよう
なことをしないでも略語の生成ができ、ユーザに負担を
かけずに入力された文章が読みやすく編集される。
As is apparent from the above description, claim 1
In the character input device of the invention according to the present invention, the user simply inputs characters normally, automatically detects and extracts long phrases frequently appearing during document input, and automatically abbreviates them.
The abbreviation can be generated without the user trying to input characters reading the sentence again, and the input sentence can be edited in a legible manner without burdening the user.

【0094】請求項2に係る発明の文字入力装置では、
文書の入力時に頻出する長い語句を、自動的に生成され
た略語に置換えるため、ユーザがいちいち生成された略
語とおきかえる必要がない。
In the character input device according to the second aspect of the present invention,
Since long phrases frequently appearing when inputting a document are replaced with automatically generated abbreviations, it is not necessary for the user to replace them with the abbreviations generated one by one.

【0095】請求項3に係る発明の文字入力装置では、
自動的に略語化された元の文字列が何であったかが目で
対比して確認でき、元の文字列を忘れてしまった時の確
認や、略語生成の適否の検討がしやすくなる。
In the character input device according to the third aspect of the present invention,
It is possible to visually confirm what the original abbreviation character string was, making it easier to confirm when the original character string has been forgotten and to determine whether abbreviation generation is appropriate or not.

【0096】請求項4に係る発明の文字入力装置では、
自動的に生成された略語が適当でないと考えたときに、
略語の修正が容易にできる。
In the character input device of the invention according to claim 4,
When you think that the automatically generated abbreviations are not appropriate,
Abbreviations can be easily modified.

【0097】請求項5に係る発明の文字入力装置では、
略語化した文字列を、容易にもとの文字列に復帰でき、
最初の文章に復帰できるため、略語化が適当ではないと
考えた場合や、編集のみを略語化した文字列で行いたい
ような場合に便利である。
In the character input device of the invention according to claim 5,
Abbreviated strings can be easily restored to their original strings,
Because it is possible to return to the first sentence, it is convenient when it is considered that abbreviation is not appropriate, or when it is desired to edit only with an abbreviated character string.

【0098】請求項6に係る発明の文字入力装置では、
品詞を基準に判断することにより、略語化する文字の対
象を適切に選択できる。
In the character input device of the invention according to claim 6,
By making a determination based on the part of speech, the target of the character to be abbreviated can be appropriately selected.

【0099】請求項7に係る発明の文字入力装置では、
複合語を形成するすべての単語の1文字を用いているた
め、略語化前の原文字列を構成する単語が何であったか
理解しやすく、且つ短く略語化できる。
In the character input device of the invention according to claim 7,
Since one character of all the words forming the compound word is used, it is easy to understand what the word constituting the original character string before abbreviation was, and the abbreviation can be shortened.

【0100】請求項8に係る発明の文字入力装置では、
複合名詞などの場合、意味の中心を形成する単語につい
ては省略しないため、略語化しても元の複合名詞の意味
が理解しやすい略語を形成する。
In the character input device of the invention according to claim 8,
In the case of a compound noun or the like, the word that forms the center of the meaning is not omitted. Therefore, even if the word is abbreviated, the meaning of the original compound noun is easily understood.

【0101】請求項9に係る発明の文字入力処理プログ
ラムを記録したコンピュータ読み取り可能な記録媒体で
は、コンピュータに、ユーザが通常に文字入力するだけ
で、文書の入力時に頻出する長い語句を自動的に検出し
抽出して、これを自動的に略語化する手順とを実行させ
るため、文字入力をしようとするユーザが、文章を読み
返すようなことをしないでも略語の生成ができ、ユーザ
に負担をかけずに入力された文章が読みやすく編集され
る。
In a computer-readable recording medium on which the character input processing program according to the ninth aspect of the present invention is recorded, long words frequently appearing when a document is input can be automatically input to a computer simply by a user inputting characters normally. The procedure for detecting, extracting, and automatically abbreviation of the abbreviation is performed, so that the user who attempts to input characters can generate the abbreviation without having to read back the sentence, which puts a burden on the user. Sentences entered without being edited are easy to read.

【0102】請求項10に係る発明の文字入力処理プロ
グラムを記録したコンピュータ読み取り可能な記録媒体
では、コンピュータに、文書の入力時に頻出する長い語
句を、自動的に生成された略語に置換える手順を実行さ
せるため、ユーザがいちいち生成された略語とおきかえ
る必要がない。
In a computer-readable recording medium having recorded thereon a character input processing program according to the present invention, a computer is provided with a procedure for replacing long phrases frequently appearing in inputting a document with automatically generated abbreviations. It is not necessary for the user to replace the generated abbreviation with the abbreviation generated.

【0103】請求項11に係る発明の文字入力処理プロ
グラムを記録したコンピュータ読み取り可能な記録媒体
では、コンピュータに、自動的に略語化された元の文字
列が何であったかが目で対比して確認できるように表示
する手順を実行させるため、元の文字列を忘れてしまっ
た時の確認や、略語生成の適否の検討がしやすくなる。
In the computer-readable recording medium storing the character input processing program according to the eleventh aspect of the present invention, the computer can visually confirm the original character string automatically abbreviated. This makes it easy to confirm when the original character string has been forgotten and to determine whether or not abbreviation generation is appropriate.

【0104】請求項12に係る発明の文字入力処理プロ
グラムを記録したコンピュータ読み取り可能な記録媒体
では、コンピュータに、自動的に生成された略語が適当
でないと考えたときに、略語の修正が容易にできる手順
を実行させる。
In the computer-readable recording medium on which the character input processing program according to the twelfth aspect of the present invention is recorded, when the computer automatically determines that the automatically generated abbreviation is not appropriate, the computer can easily correct the abbreviation. Perform the steps that can be performed.

【0105】請求項13に係る発明の文字入力処理プロ
グラムを記録したコンピュータ読み取り可能な記録媒体
では、コンピュータに、略語化した文字列を、容易にも
との文字列に復帰でき、最初の文章に復帰できる手順を
実行させるため、略語化が適当ではないと考えた場合
や、編集のみを略語化した文字列で行いたいような場合
に便利である。
In the computer-readable recording medium storing the character input processing program according to the thirteenth aspect of the present invention, the abbreviation character string can be easily returned to the original character string by the computer, and the first sentence This is convenient when the abbreviation is not considered appropriate, or when only the editing is desired to be performed with the abbreviated character string, so that the procedure for restoring is executed.

【0106】請求項14に係る発明の文字入力処理プロ
グラムを記録したコンピュータ読み取り可能な記録媒体
では、コンピュータに、品詞を基準に判断することによ
り、略語化する文字の対象を適切に選択できる手順を実
行させる。
In the computer-readable recording medium storing the character input processing program according to the fourteenth aspect of the present invention, the computer determines a procedure based on the part of speech so that the target of the character to be abbreviated can be appropriately selected. Let it run.

【0107】請求項15に係る発明の文字入力処理プロ
グラムを記録したコンピュータ読み取り可能な記録媒体
では、コンピュータに、複合語を形成するすべての単語
の1文字を用いているため、略語化前の原文字列を構成
する単語が何であったか理解しやすく、且つ短く略語化
できる手順を実行させる。
In the computer-readable recording medium storing the character input processing program according to the present invention, since one character of all the words forming the compound word is used in the computer, the original before abbreviation is used. A procedure is executed that makes it easy to understand what the words that make up the character string were and that can abbreviate them into short abbreviations.

【0108】請求項16に係る発明の文字入力処理プロ
グラムを記録したコンピュータ読み取り可能な記録媒体
では、コンピュータに、複合名詞などの場合、意味の中
心を形成する単語については省略しない手順を実行させ
るため、略語化しても元の複合名詞の意味が理解しやす
い略語を形成する。
In the computer-readable recording medium storing the character input processing program according to the present invention, in the case of a compound noun or the like, in the case of a compound noun or the like, the computer executes a procedure which does not omit words forming the center of meaning. The abbreviation forms an abbreviation in which the meaning of the original compound noun is easy to understand.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本実施の形態の文字入力装置及び文字入力処理
プログラムの構成の概略を示す図である。
FIG. 1 is a diagram schematically illustrating a configuration of a character input device and a character input processing program according to an embodiment.

【図2】本実施の形態の文字入力装置の処理の流れの概
略を示すフローチャートである。
FIG. 2 is a flowchart showing an outline of a processing flow of the character input device of the present embodiment.

【図3】(A) 略語化前の画面出力例を示す図であ
る。 (B) 略語化後の画面出力例を示す図である。
FIG. 3A is a diagram showing an example of screen output before abbreviation. (B) is a diagram showing an example of screen output after abbreviation.

【図4】図2における略語化処理S130の手順を示す
フローチャートである。
FIG. 4 is a flowchart showing a procedure of an abbreviation processing S130 in FIG. 2;

【図5】図4における文字列X略語化S15の手順を示
すフローチャートである。
FIG. 5 is a flowchart showing a procedure of character string X abbreviation S15 in FIG. 4;

【図6】図2における略語編集処理S140の手順を示
すフローチャートである。
FIG. 6 is a flowchart showing a procedure of an abbreviation editing process S140 in FIG. 2;

【符号の説明】[Explanation of symbols]

2 入力装置 4 外部記憶装置 6 表示部 7 表示制御部 8 印刷部 10 制御部 12 基本辞書 14 ユーザ辞書 20 CPU 24 入出力ポート 26 バスライン 30 RAM 31 入力文保存領域 32 出力文保存領域 34 ワークエリア 35 略語保存領域 36 文字列保存部 37 yカウンタメモリ 38 kカウンタメモリ 40 ROM 41 制御プログラム 42 略語処理プログラム 43 原文字列抽出プログラム 44 略語化プログラム 45 略語表示プログラム 46 置換え表示プログラム 47 原文字列表意プログラム 48 略語編集プログラム 49 原文字列復帰プログラム 50 略語化入力プログラム 51 形態素解析プログラム 56 ユーザ辞書編集プログラム 61 略語編集ウインドウ 2 input device 4 external storage device 6 display unit 7 display control unit 8 printing unit 10 control unit 12 basic dictionary 14 user dictionary 20 CPU 24 input / output port 26 bus line 30 RAM 31 input sentence storage area 32 output sentence storage area 34 work area 35 abbreviation storage area 36 character string storage 37 y counter memory 38 k counter memory 40 ROM 41 control program 42 abbreviation processing program 43 original character string extraction program 44 abbreviation program 45 abbreviation display program 46 replacement display program 47 original character string representation program 48 Abbreviation editing program 49 Original character string restoration program 50 Abbreviation input program 51 Morphological analysis program 56 User dictionary editing program 61 Abbreviation editing window

Claims (16)

【特許請求の範囲】[Claims] 【請求項1】 文字列を入力する文字列入力手段と、 見出し語と、文法情報とを含む辞書と、 前記文字列入力手段により入力された文字列を前記辞書
を検索することにより形態素解析を行って単語に分割
し、前記辞書の文法情報を前記分割された単語に付与す
る形態素解析手段と、 前記形態素解析手段により単語に分割された文字列か
ら、所定の条件を満たす単語が所定数連続した単語列を
原文字列として抽出する原文字列抽出手段と、 前記原文字列抽出手段により抽出した原文字列を、その
一部の文字を一定の規則の下で省略して略語を形成する
略語化手段と、 前記略語化手段により形成された略語を表示する略語表
示手段とを備えた文字入力装置。
1. A character string input means for inputting a character string; a dictionary including a headword and grammatical information; and a morphological analysis by searching the dictionary for a character string input by the character string input means. Morphological analysis means for dividing the words into words, and adding the grammatical information of the dictionary to the divided words, and a predetermined number of consecutive words satisfying a predetermined condition are obtained from a character string divided into words by the morphological analysis means. An original character string extracting means for extracting the extracted word string as an original character string; and forming an abbreviation by omitting some of the characters of the original character string extracted by the original character string extracting means under a certain rule. A character input device comprising: abbreviation means; and abbreviation display means for displaying an abbreviation formed by the abbreviation means.
【請求項2】 前記原文字列抽出手段により抽出された
原文字列を、前記略語化手段により形成された略語に置
換えて表示する置換え表示手段を備えたことを特徴とす
る請求項1に記載の文字入力装置。
2. The apparatus according to claim 1, further comprising replacement display means for replacing the original character string extracted by the original character string extraction means with an abbreviation formed by the abbreviation means and displaying the original character string. Character input device.
【請求項3】 略語化される前の前記原文字列を、当該
文字列が略語化されて形成された略語とに関係づけて表
示する原文字列表示手段を備えることを特徴とする請求
項1又は請求項2に記載の文字入力装置。
3. An original character string display means for displaying the original character string before being abbreviated in relation to an abbreviation formed by abbreviating the character string. The character input device according to claim 1 or 2.
【請求項4】 前記略語を編集する略語編集手段を備え
たことを特徴とする請求項1乃至請求項3のいずれかに
記載の文字入力装置。
4. The character input device according to claim 1, further comprising an abbreviation editing means for editing the abbreviation.
【請求項5】 前記文字列中の前記略語を原文字列に復
帰させる原文字列復帰手段を備えたことを特徴とする請
求項1乃至請求項4のいずれかに記載の文字入力装置。
5. The character input device according to claim 1, further comprising an original character string restoring means for restoring the abbreviation in the character string to an original character string.
【請求項6】 前記原文字列抽出手段において、 前記単語の所定の条件は、名詞を含む特定の品詞である
とすることを特徴とする請求項1乃至請求項5のいずれ
かに記載の文字入力装置。
6. The character according to claim 1, wherein in the original character string extracting unit, the predetermined condition of the word is a specific part of speech including a noun. Input device.
【請求項7】 前記略語化手段において、 前記略語を形成する規則は、前記原文字列を構成する各
単語の先頭の文字を抽出することであることを特徴とす
る請求項1乃至請求項6のいずれかに記載の文字入力装
置。
7. The abbreviation conversion unit according to claim 1, wherein a rule for forming the abbreviation is to extract a leading character of each word constituting the original character string. The character input device according to any one of the above.
【請求項8】 前記略語化手段において、 前記略語を形成する規則は、前記原文字列を構成する末
尾の単語はそのすべての文字を抽出し、 その他の前記原文字列を構成する単語は先頭の文字を抽
出することであることを特徴とする請求項1乃至請求項
6のいずれかに記載の文字入力装置。
8. The abbreviation converting means, wherein the rule forming the abbreviation is such that a last word constituting the original character string extracts all of its characters, and other words constituting the original character string include a leading word. The character input device according to any one of claims 1 to 6, wherein the character is extracted.
【請求項9】 コンピュータに、 文字列を入力する文字列入力の手順と、 前記文字列入力の手順により入力された文字列を見出し
語と、文法情報とを含む辞書を検索することにより形態
素解析を行って単語に分割し、前記辞書の文法情報を前
記分割された単語に付与する形態素解析の手順と、 前記形態素解析の手順により単語に分割された文字列か
ら、所定の条件を満たす単語が所定数連続した単語列を
原文字列として抽出する原文字列抽出の手順と、 前記原文字列抽出の手順により抽出した原文字列を、そ
の一部の文字を一定の規則の下で省略して略語を形成す
る略語化の手順と、 前記略語化の手順により形成された略語を表示する略語
表示の手順とを実行させる文字入力処理プログラムを記
録したコンピュータ読み取り可能な記録媒体。
9. A morphological analysis by searching a computer for a character string inputting procedure for inputting a character string, and searching a dictionary including a headword and grammatical information for the character string input in the character string inputting procedure. To divide the words into words, and apply the grammatical information of the dictionary to the divided words.From the character string divided into words by the morphological analysis procedure, An original character string extraction procedure for extracting a predetermined number of consecutive word strings as an original character string, and a part of the original character string extracted by the original character string extraction procedure is omitted under a certain rule. Computer-readable recording medium storing a character input processing program for executing an abbreviation procedure for forming an abbreviation by performing an abbreviation, and an abbreviation display procedure for displaying an abbreviation formed by the abbreviation procedure.
【請求項10】 前記コンピュータに、 前記原文字列抽出の手順により抽出された原文字列を、
前記略語化の手順により形成された略語に置換えて表示
する置換え表示の手順を実行させるプログラム備えたこ
とを特徴とする請求項9記載の文字入力処理プログラム
を記録したコンピュータ読み取り可能な記録媒体。
10. An original character string extracted by the original character string extraction procedure,
10. A computer-readable recording medium recording a character input processing program according to claim 9, further comprising a program for executing a replacement display procedure of replacing and displaying the abbreviation formed by the abbreviation procedure.
【請求項11】 前記コンピュータに、 略語化される前の前記原文字列を、当該文字列が略語化
されて形成された略語とに関係づけて表示する原文字列
表示の手順を実行させるプログラムを備えることを特徴
とする請求項9又は請求項10に記載の文字入力処理プ
ログラムを記録したコンピュータ読み取り可能な記録媒
体。
11. A program for causing the computer to execute an original character string display procedure of displaying the original character string before being abbreviated in relation to an abbreviation formed by abbreviating the character string. A computer-readable recording medium recording the character input processing program according to claim 9 or claim 10.
【請求項12】 前記コンピュータに、 前記略語を編集する略語編集の手順を実行させるプログ
ラムを備えたことを特徴とする請求項9乃至請求項11
のいずれかに記載の文字入力処理プログラムを記録した
コンピュータ読み取り可能な記録媒体。
12. A program for causing the computer to execute an abbreviation editing procedure for editing the abbreviation.
A computer-readable recording medium recording the character input processing program according to any one of the above.
【請求項13】 前記コンピュータに、 前記文字列中の前記略語を原文字列に復帰させる原文字
列復帰の手順を実行させるプログラムを備えたことを特
徴とする請求項9乃至請求項12のいずれかに記載の文
字入力処理プログラムを記録したコンピュータ読み取り
可能な記録媒体。
13. The program according to claim 9, further comprising a program for causing the computer to execute an original character string restoring procedure for restoring the abbreviation in the character string to an original character string. A computer-readable recording medium that records the character input processing program according to any of the above.
【請求項14】 前記原文字列抽出の手順において、 前記単語の所定の条件は、名詞を含む特定の品詞である
とすることを特徴とする請求項9乃至請求項13のいず
れかに記載の文字入力処理プログラムを記録したコンピ
ュータ読み取り可能な記録媒体。
14. The method according to claim 9, wherein in the original character string extraction procedure, the predetermined condition of the word is a specific part of speech including a noun. A computer-readable recording medium recording a character input processing program.
【請求項15】 前記略語化の手順において、 前記略語を形成する規則は、前記原文字列を構成する各
単語の先頭の文字を抽出することであることを特徴とす
る請求項9乃至請求項14のいずれかに記載の文字入力
処理プログラムを記録したコンピュータ読み取り可能な
記録媒体。
15. The abbreviation conversion procedure according to claim 9, wherein a rule for forming the abbreviation is to extract a leading character of each word constituting the original character string. 14. A computer-readable recording medium recording the character input processing program according to any one of 14.
【請求項16】 前記略語化の手順において、 前記略語を形成する規則は、前記原文字列を構成する末
尾の単語はそのすべての文字を抽出し、その他の前記原
文字列を構成する単語は先頭の文字を抽出することであ
ることを特徴とする請求項9乃至請求項14のいずれか
に記載の文字入力処理プログラムを記録したコンピュー
タ読み取り可能な記録媒体。
16. In the abbreviation conversion procedure, the rule for forming the abbreviation is such that all the characters of the last word constituting the original character string are extracted, and the other words constituting the original character string are: 15. A computer-readable recording medium storing a character input processing program according to claim 9, wherein a leading character is extracted.
JP10134030A 1998-05-15 1998-05-15 Character input device and computer-readable recording medium where character input processing program is recorded Pending JPH11328166A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10134030A JPH11328166A (en) 1998-05-15 1998-05-15 Character input device and computer-readable recording medium where character input processing program is recorded

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10134030A JPH11328166A (en) 1998-05-15 1998-05-15 Character input device and computer-readable recording medium where character input processing program is recorded

Publications (1)

Publication Number Publication Date
JPH11328166A true JPH11328166A (en) 1999-11-30

Family

ID=15118743

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10134030A Pending JPH11328166A (en) 1998-05-15 1998-05-15 Character input device and computer-readable recording medium where character input processing program is recorded

Country Status (1)

Country Link
JP (1) JPH11328166A (en)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004044887A1 (en) * 2002-11-11 2004-05-27 Matsushita Electric Industrial Co., Ltd. Speech recognition dictionary creation device and speech recognition device
JP2007034430A (en) * 2005-07-22 2007-02-08 Fuji Xerox Co Ltd Translation device, translation method, and program
JP2007087056A (en) * 2005-09-21 2007-04-05 Fuji Xerox Co Ltd Translation device and program
JP2007156797A (en) * 2005-12-05 2007-06-21 Nippon Telegr & Teleph Corp <Ntt> Chemical substance management apparatus and name registration method
JP2008204399A (en) * 2007-02-22 2008-09-04 Nippon Telegr & Teleph Corp <Ntt> Abbreviation extracting method, abbreviation extracting device and program
JP2010277219A (en) * 2009-05-27 2010-12-09 Kyocera Corp Character input device, character display system, character display device and character conversion method
JP2012168858A (en) * 2011-02-16 2012-09-06 Kyocera Corp Mail system, communication terminal, transmission/reception method, transmission program, transmission method, reception program, and reception method
JP2016164724A (en) * 2015-03-06 2016-09-08 株式会社東芝 Vocabulary knowledge acquisition device, vocabulary knowledge acquisition method, and vocabulary knowledge acquisition program
JP2018032187A (en) * 2016-08-24 2018-03-01 日本電信電話株式会社 Formal name omission expression list generation device, formal name omission expression list generation method, and program

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004044887A1 (en) * 2002-11-11 2004-05-27 Matsushita Electric Industrial Co., Ltd. Speech recognition dictionary creation device and speech recognition device
JP2007034430A (en) * 2005-07-22 2007-02-08 Fuji Xerox Co Ltd Translation device, translation method, and program
JP2007087056A (en) * 2005-09-21 2007-04-05 Fuji Xerox Co Ltd Translation device and program
JP2007156797A (en) * 2005-12-05 2007-06-21 Nippon Telegr & Teleph Corp <Ntt> Chemical substance management apparatus and name registration method
JP2008204399A (en) * 2007-02-22 2008-09-04 Nippon Telegr & Teleph Corp <Ntt> Abbreviation extracting method, abbreviation extracting device and program
JP2010277219A (en) * 2009-05-27 2010-12-09 Kyocera Corp Character input device, character display system, character display device and character conversion method
JP2012168858A (en) * 2011-02-16 2012-09-06 Kyocera Corp Mail system, communication terminal, transmission/reception method, transmission program, transmission method, reception program, and reception method
JP2016164724A (en) * 2015-03-06 2016-09-08 株式会社東芝 Vocabulary knowledge acquisition device, vocabulary knowledge acquisition method, and vocabulary knowledge acquisition program
JP2018032187A (en) * 2016-08-24 2018-03-01 日本電信電話株式会社 Formal name omission expression list generation device, formal name omission expression list generation method, and program

Similar Documents

Publication Publication Date Title
EP0370774A2 (en) Machine translation system
JPH11328166A (en) Character input device and computer-readable recording medium where character input processing program is recorded
JP2943791B2 (en) Language identification device, language identification method, and recording medium recording language identification program
JP2621999B2 (en) Document processing device
JPS59100941A (en) Kana (japanese syllabary)-kanji (chinese character) converter
JP3692711B2 (en) Machine translation device
JPH0612453A (en) Unknown word extracting and registering device
JP3999771B2 (en) Translation support program, translation support apparatus, and translation support method
JP2005010916A (en) Document processor, character input support method and program
JP2893239B2 (en) Translation support dictionary search and display system
JP3147947B2 (en) Machine translation equipment
JP3809238B2 (en) Document processing method and apparatus
JP2002183134A (en) Translating device
JPH0683807A (en) Document preparing device
JP2000029882A (en) Summary preparing device
JPH0716192Y2 (en) Text processor
JP3052339B2 (en) Document data processing device
JPH05189421A (en) Method and device for kana/kanji conversion of ancient classics
JPH07191995A (en) Machine translation device
JP2001282781A (en) Data input method, recording medium for data input using the method, and arithmetic processor
JPH08241315A (en) Word registering mechanism for document processor
JPH01318156A (en) Document processor
JPH11316758A (en) Morpheme analyzing device, machine translating device equipped with same, computer-readable medium having morpheme analyzing program recorded, and computer readable medium recording machine translating program with morpheme analyzing program
JPH0981555A (en) Method and device for document processing
JPH07105219A (en) Machine translating device