JPH0154742B2 - - Google Patents

Info

Publication number
JPH0154742B2
JPH0154742B2 JP58222387A JP22238783A JPH0154742B2 JP H0154742 B2 JPH0154742 B2 JP H0154742B2 JP 58222387 A JP58222387 A JP 58222387A JP 22238783 A JP22238783 A JP 22238783A JP H0154742 B2 JPH0154742 B2 JP H0154742B2
Authority
JP
Japan
Prior art keywords
kana
kanji
headword
word
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP58222387A
Other languages
Japanese (ja)
Other versions
JPS60112175A (en
Inventor
Hiroichi Yoshida
Jun Kato
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP58222387A priority Critical patent/JPS60112175A/en
Publication of JPS60112175A publication Critical patent/JPS60112175A/en
Publication of JPH0154742B2 publication Critical patent/JPH0154742B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 <技術分野> 本発明は仮名文字或は仮名文(又はローマ字
文)を仮名漢字変換辞書に従つて対応の漢字又は
漢字まじり文に変換する仮名漢字変換装置に関
し、特に略称仮名文の入力に応答してこの略称に
対応した漢字又は漢字まじり文に変換する機能を
有するような仮名漢字変換装置に関する。
[Detailed Description of the Invention] <Technical Field> The present invention relates to a kana-kanji conversion device that converts kana characters or kana sentences (or Roman characters) into corresponding kanji or kanji-mixed sentences according to a kana-kanji conversion dictionary. The present invention relates to a kana-kanji conversion device having a function of converting an abbreviation kana sentence into a kanji or a kanji-mixed sentence corresponding to the abbreviation in response to input of the abbreviation kana sentence.

<従来技術> 最近、文書の処理能率を向上する目的で、日本
語文書処理装置(日本語ワードプロセツサ)が実
用化されている。この日本語文書処理装置は、仮
名キーボードなどの入力装置によつて仮名文を入
力し、仮名漢字変換辞書を検索して対応の漢字も
しくは漢字まじり文を出力するものである。この
ような装置において、文書作成にあたつては、例
えば「国鉄」、「流感」というように略称で表現す
ることがある。つまり、これらの正式名称は「国
有鉄道」、「流行性感冒」である。
<Prior Art> Recently, Japanese document processing devices (Japanese word processors) have been put into practical use for the purpose of improving document processing efficiency. This Japanese document processing device inputs a kana sentence using an input device such as a kana keyboard, searches a kana-kanji conversion dictionary, and outputs the corresponding kanji or a sentence mixed with kanji. In such devices, when creating documents, abbreviations such as "Japan National Railways" or "flukan" are sometimes used. In other words, their official names are ``National Railway'' and ``Epidemic Flu.''

従来装置では一般に仮名漢字変換辞書に正式名
称について登録させるのが普通であり、前記略称
に対しても変換させようとすると仮名漢字変換辞
書には略称語についてもすべて登録させる必要が
ある。この辞書への略称語の登録は仮名漢字変換
辞書のメモリ容量が膨大なものになるという問題
を有している。
In conventional devices, it is common to register formal names in a kana-kanji conversion dictionary, and in order to convert the abbreviations as well, it is necessary to register all abbreviations in the kana-kanji conversion dictionary. The problem with registering abbreviations in this dictionary is that the memory capacity of the kana-kanji conversion dictionary becomes enormous.

そこで従来では例えば“こく”、“てつ”と単漢
字ごとに変換処理させて前記辞書が大容量化する
ことを避けている。しかしながら、このように単
漢字ごとに変換処理させると操作性が極めて悪
く、高速処理化が要求される現状にそぐわないも
のである。
Conventionally, therefore, conversion processing is performed for each single kanji character, such as ``koku'' and ``tetsu,'' to avoid increasing the capacity of the dictionary. However, performing the conversion process for each single kanji character in this way is extremely difficult to operate, and is not suitable for the current situation where high-speed processing is required.

<目 的> 本発明は上記の問題に鑑み、仮名漢字変換辞書
の容量の増大を招来することなしに略称語につい
ても仮名漢字変換できるようになし、もつて変換
処理の操作性を改善したものである。
<Purpose> In view of the above-mentioned problems, the present invention enables kana-to-kanji conversion of abbreviations without increasing the capacity of the kana-to-kanji conversion dictionary, thereby improving the operability of the conversion process. It is.

<実施例> 第1図は本発明の略称語変換方式を実施した仮
名漢字変換装置(ワードプロセツサ)の概要を示
すブロツク図である。第1図において、1は編集
制御部(CPU)であつてRAM3に記憶されたプ
ログラムによつて制御される。このRAM3には
外部メモリ手段(図示せず)から予めプログラム
がロードされて保持されている。
<Embodiment> FIG. 1 is a block diagram showing an outline of a kana-kanji conversion device (word processor) that implements the abbreviation conversion method of the present invention. In FIG. 1, reference numeral 1 denotes an editing control unit (CPU), which is controlled by a program stored in RAM3. A program is previously loaded and held in this RAM 3 from an external memory means (not shown).

2はアルフアベツト、仮名等の文字キー及び編
集制御のための各種指示キーを備えたキーボード
装置である。
Reference numeral 2 denotes a keyboard device equipped with character keys such as alphabets and kana, and various instruction keys for editing control.

4は各種データを保持するためのRAMであ
り、編集された文章データを記憶する文章バツフ
ア41と、キーボード装置2から入力された仮名
文字列が導入記憶される仮名バツフア42と、そ
の他バツフアやフラグ等を構成するエリア43で
構成されている。
4 is a RAM for holding various data, including a text buffer 41 for storing edited text data, a kana buffer 42 for introducing and storing kana character strings input from the keyboard device 2, and other buffers and flags. It is made up of an area 43 that includes, etc.

5は辞書メモリ6を制御する辞書メモリ制御部
であり、辞書メモリ6から読出された候補データ
を記憶する結果バツフア51と、辞書メモリ6を
アドレスする複数のアドレス回路部52とで主に
構成されてる。
Reference numeral 5 denotes a dictionary memory control unit for controlling the dictionary memory 6, and it mainly comprises a result buffer 51 for storing candidate data read from the dictionary memory 6, and a plurality of address circuit units 52 for addressing the dictionary memory 6. Teru.

7はCRT表示装置8の表示制御部、9はドツ
トプリンタ10のプリンタ制御部である。
7 is a display control section of the CRT display device 8, and 9 is a printer control section of the dot printer 10.

第2図は上記した辞書メモリ6の構成を示し、
61はエリアには仮名見出し語、62のエリアに
は仮名見出し語に対応する漢字又は漢字まじり文
(変換語)、63のエリアには品詞情報、64のエ
リアには各単漢字に対応する読み仮名数、65の
エリアには接続可能となる熟語が夫々記憶され
る。
FIG. 2 shows the configuration of the dictionary memory 6 described above,
Area 61 contains kana entry words, area 62 contains kanji or kanji-mixed sentences (converted words) corresponding to the kana entry words, area 63 contains part-of-speech information, and area 64 contains readings corresponding to each single kanji. In the area of 65 kana, phrases that can be connected are stored respectively.

そして、前記61及び62のエリアには具体的
には各文字コード列で記憶され、65のエリアは
対応の辞書のアドレス値で記憶される。
Specifically, each character code string is stored in the areas 61 and 62, and the address value of the corresponding dictionary is stored in the area 65.

第3図及び第4図は上記第1図の構成の動作を
示すフローチヤートであり、以下このフローチヤ
ートに従つた第1図の構成の動作を説明する。
3 and 4 are flowcharts showing the operation of the configuration shown in FIG. 1, and the operation of the configuration shown in FIG. 1 will be explained below in accordance with this flowchart.

先ず略称語として“国鉄”を例にして説明する
と、キーボード装置2の仮名文字キーより仮名文
字列“こくてつ”を入力する。すると、RAM4
の仮名バツフア42に仮名入力毎に仮名文字が導
入記憶される。
First, to explain the abbreviation "Japan Railways" as an example, the kana character string "Kokutetsu" is input using the kana character keys of the keyboard device 2. Then, RAM4
Kana characters are introduced and stored in the kana buffer 42 each time a kana is input.

続いて、変換を指示すると、この仮名文字列が
辞書メモリ制御部5に供給されて辞書メモリ6を
サーチする。
Subsequently, when a conversion is instructed, this kana character string is supplied to the dictionary memory control section 5 and the dictionary memory 6 is searched.

即ち、辞書メモリ6の見出し語に、“こくてつ”
なる見出し語があるかどうか検索される。
In other words, the headword in the dictionary memory 6 is "Kokutetsu".
A search is performed to see if there is a headword.

この場合、“こくてつ”なる略称語であるので
その見出し語を見つけることができないが、もし
略称でない通常の仮名文字列であるとその見出し
語が検出されてこの見出し語に対応する漢字まじ
り文が結果バツフア51に読出され、CRT表示
装置8で表示される。
In this case, the headword cannot be found because it is an abbreviation of "Kokutetsu," but if it is a regular kana character string that is not an abbreviation, the headword will be detected and the corresponding kanji character string will be detected. The sentence is read into the result buffer 51 and displayed on the CRT display device 8.

そして、この表示された漢字まじり文が目的の
変換文であれば選択操作によつて変換が決定さ
れ、文章バツフア41に記憶される。また、同音
異義語が複数存在する場合は、次候補の漢字まじ
り文が順次読出され、目的の変換文を選択操作す
る。
If the displayed sentence mixed with kanji is the target conversion sentence, conversion is determined by a selection operation and is stored in the sentence buffer 41. If there are multiple homophones, the next candidate sentences containing kanji are sequentially read out, and the desired converted sentence is selected.

所で、上記“こくてつ”なる見出し語は略称語
であるので検出されないことから、候補なしとし
て処理が行われる(第3図のステツプ100〜102)。
However, since the headword "kokutetsu" is an abbreviation and is not detected, processing is performed as if there were no candidates (steps 100 to 102 in FIG. 3).

次に上記辞書メモリ6に候補がなければ、続い
て仮名バツフア42の文字列を前後に分割処理す
る。この分割は先ず1/2分割して前段と後段の仮
名文字列について夫々その仮名文字を有するとこ
ろの見出し語のサーチを行なう。
Next, if there are no candidates in the dictionary memory 6, then the character string in the kana buffer 42 is divided into front and back parts. In this division, first, it is divided into 1/2, and the headwords containing the kana characters are searched for the former and latter kana character strings, respectively.

つまり、この例では“こく”と“てつ”に分
け、まずこの前後の仮名文字列を辞書メモリ制御
部5へ供給してこの仮名文字列を含む見出し語を
サーチし、見出し語を検出すると更にこの見出し
語の中に後段の仮名文字列を含んでいるかサーチ
する。
In other words, in this example, it is divided into "koku" and "tetsu", and the kana character strings before and after these are first supplied to the dictionary memory control unit 5 to search for a headword that includes this kana character string, and when the headword is detected. Furthermore, a search is made to see if this entry word contains a subsequent kana character string.

この処理によつて目的の略称語を含む正式名称
があるか判定され、この場合には“こくてつ”に
対して“こくゆうてつどう”の見出し語が検出さ
れる。
Through this process, it is determined whether there is an official name that includes the target abbreviation, and in this case, the headword "Kokuyuutetsudo" is detected for "Kokutetsu".

続いて、この検出した見出し語に対応する変換
語の中から見出し語“こくてつ”に対応する個々
の単漢字を抽出してCRT表示装置8で表示させ
る。これが目的の略称語であると、上述したよう
に選択処理されて文章バツフア41に記憶される
(第3図のステツプ103〜108)。
Subsequently, individual single kanji characters corresponding to the headword "kokutetsu" are extracted from the converted words corresponding to the detected headword and displayed on the CRT display device 8. If this is the desired abbreviation, it is selected and stored in the text buffer 41 as described above (steps 103-108 in FIG. 3).

また、上記仮名バツフア42の文字列を前、後
に分割処理するに際し、当初1/2分割して前段と
後段とに分けて夫々辞書メモリ6をサーチした
が、この時にもし見出し語の検索ができないとき
は前段仮名文字列に仮名文字を1字追加してつま
り“こくて”と“つ”に分割し或は“こ”と“く
てつ”と分割する等の処理を行なつて順々に辞書
メモリ6をサーチさせるものである。
In addition, when dividing the character string of the above-mentioned kana buffer 42 into front and rear parts, the dictionary memory 6 was initially divided into 1/2 parts and the former part and the latter part were searched, but at this time, if the entry word could not be searched. To do this, add one kana character to the previous kana character string, divide it into "kokute" and "tsu", or divide it into "ko" and "kutetsu", etc. This allows the dictionary memory 6 to be searched.

次に第4図のフローチヤートを参照して略称語
の変換処理を更に具体的に説明する。
Next, the abbreviation conversion process will be explained in more detail with reference to the flowchart of FIG.

上記した仮名バツフア42の仮名文字列“こく
てつ”を前段と後段に“こく”と“てつ”に分割
し、この前段の仮名文字列“こく”を辞書メモリ
制御部5へ供給し、この仮名文字列を含む見出し
語について辞書メモリ6をサーチする。
The kana character string "Kokutetsu" of the above-mentioned kana buffer 42 is divided into "Koku" and "Tetsu" in the first and second stages, and this first stage kana character string "Koku" is supplied to the dictionary memory control unit 5, The dictionary memory 6 is searched for headwords containing this kana character string.

この場合、辞書メモリ6が第2図の構成になつ
ていると、見出し語“こく”を有する最初の見出
し語“こくゆうてつどう”が検出され、この見出
し語に対応する変換語と共に、63、64及び65のエ
リアのデータが結果バツフア51に読出される
(第4図のステツプ200〜202)。
In this case, if the dictionary memory 6 has the configuration shown in FIG. 2, the first entry word "Kokuyuutetsudo" having the entry word "Koku" is detected, and along with the converted word corresponding to this entry word, 63 , 64 and 65 are read out to the result buffer 51 (steps 200-202 in FIG. 4).

続いて、この検出された見出し語と漢字に対す
る読み仮名文字数(64のデータ)との対応をと
り、“こく”の見出し語が1つまたは複数の漢字
として分断可能であるか確認される。
Next, the detected headword and the number of pronunciation kana characters for the kanji (64 data) are matched to confirm whether the headword for "koku" can be divided into one or more kanji.

今、“こく”が2文字であり、辞書の検出され
た見出し語(こくゆうてつどう)の“こく”に対
応する漢字“国”の読み仮名も2文字であつて
“こく”に対して1つの漢字となつていることか
ら漢字に分断可能と判定される。つまり、上記前
段と後段に分割(1/2分割)した位置は漢字とし
て分断可能な位置であると判定される(ステツプ
203)。
Now, “koku” has two letters, and the pronunciation of the kanji “kuni” that corresponds to “koku” in the headword detected in the dictionary (kokuyuutetsudo) is also two letters, so for “koku” Since it is a single kanji, it is determined that it can be divided into kanji. In other words, the position where the above-mentioned first and second stages are divided (divided into 1/2) is determined to be a position that can be divided as a kanji (step
203).

次にフラグONかどうか判定され、今は“こ
く”に対応する見出し語を検出しているのでフラ
ツグがOFF状態にあり、従つて次のステツプへ
進んでこの検出した見出し語に対応する変換語の
漢字列中に区切りコードを含んで略称語として使
用可能な漢字列であるかどうか判定される(ステ
ツプ204、205)。
Next, it is determined whether the flag is ON or not, and since the entry word corresponding to "koku" has been detected, the flag is in the OFF state. Therefore, the process proceeds to the next step and uses the converted word corresponding to this detected entry word. It is determined whether the kanji string includes a delimiter code and can be used as an abbreviation (steps 204 and 205).

即ち、第2図に示す辞書メモリ6には登録され
た漢字の中で略称語として使用できる漢字につい
てはその分断される位置に区切りコード(第2図
でスラツシユ“/”で示している)が挿入されて
いる。
That is, in the dictionary memory 6 shown in FIG. 2, for the registered kanji that can be used as an abbreviation, a delimiter code (indicated by a slash "/" in FIG. 2) is placed at the position where the kanji is divided. It has been inserted.

例えば“こくゆうてつどう”に対応する漢字列
には“国有/鉄道”として登録され、略称語とし
て使用できる漢字列であることを示している。
For example, the kanji string corresponding to ``kokuyuutetsudo'' is registered as ``nationally owned/railway,'' indicating that the kanji string can be used as an abbreviation.

従つて、この場合には区切りコードが存在する
ことが判定され、続いて次のステツプへ進行して
後段の仮名文字列“てつ”を辞書メモリ制御部5
へ供給し、今度はこの“てつ”が前記検出した見
出し語の中に含まれるかチエツクする(ステツプ
206、207)。
Therefore, in this case, it is determined that the delimiter code exists, and the process proceeds to the next step to store the latter kana character string "tetsu" in the dictionary memory control unit 5.
and then checks whether this “tetsu” is included in the detected headwords (step
206, 207).

続いて、この“てつ”が1つまたは複数の漢字
に分断されるかチエツクされ、今“てつ”が2文
字であり、辞書の検出された見出し語(こくゆう
てつどう)の“てつ”に対応する漢字“鉄”の読
み仮名も2文字であつて“てつ”に対して1つの
漢字となつていることから、漢字に分断可能と判
定される(ステツプ208)。
Next, it is checked whether this "tetsu" is split into one or more kanji, and now "tetsu" is two characters, and the dictionary's detected entry word (kokuyuutetsudo) is "tetsu". Since the reading kana for the kanji character ``tetsu'' corresponding to ``tetsu'' is also two characters and is one kanji character for ``tetsu'', it is determined that it can be divided into kanji characters (step 208).

続いて、上記“こく”と“てつ”に対応する漢
字を“国有/鉄道”の変換語の漢字列から夫々切
出し、“国”と“鉄”なる略称語の漢字列を得る
(ステツプ209)。
Next, the kanji corresponding to the above-mentioned ``koku'' and ``tetsu'' are extracted from the kanji string of the converted word ``nationally owned/railway'' to obtain the kanji strings of the abbreviated words ``koku'' and ``tetsu.'' (Step 209) ).

このように略称語の仮名文字列については上述
の如くその略称語の仮名文字列を前、後に分断
し、該分断した前段と後段の仮名文字列を夫々含
むところの見出し語について辞書メモリの中から
検索し、該検索した見出し語に対応する変換語か
ら前記分割した仮名文字列に夫々対応する漢字に
ついて辞書メモリから読出して当該略称語に対応
する変換語を得るものである。
In this way, for the kana character string of an abbreviation word, as mentioned above, the kana character string of the abbreviation word is divided into front and rear parts, and the headword containing the divided kana character strings in the first and second part is stored in the dictionary memory. Then, from the converted word corresponding to the searched entry word, the kanji corresponding to each of the divided kana character strings are read from the dictionary memory to obtain a converted word corresponding to the abbreviation word.

次に、別の例として略称語“りゆうかん”と入
力した場合について説明する。
Next, as another example, a case where the abbreviation "Riyuukan" is input will be described.

先ず、仮名バツフア42に入力された仮名文字
列が辞書メモリ制御部5に供給されて辞書メモリ
6をサーチする。
First, the kana character string input to the kana buffer 42 is supplied to the dictionary memory control section 5 and the dictionary memory 6 is searched.

この“りゆうかん”なる見出し語について辞書
を検索するが、第2図に示すようにこの略称語を
見出し語とした漢字は登録されていないので候補
なしとして処理される。
The dictionary is searched for this headword "Riyukan", but as shown in FIG. 2, no kanji with this abbreviation as a headword is registered, so it is processed as having no candidates.

次に仮名バツフア42の文字列を前後に分割処
理する。つまり“りゆう”と“かん”に分断され
る。そしてこの前段の“りゆう”なる仮名文字列
が辞書メモリ制御部5に供給され、“りゆう”な
る見出し語について辞書メモリ6を検索し、最初
は第2図の“m”のアドレスの“りゆうき”が選
択される。続いてこの“りゆう”が1つの漢字に
分割可能と判断された後に、漢字列中に区切りコ
ードを含んでいるかつまり略称語として使用可能
かチエツクされる。しかし、この場合には区切り
コードがないので再び次の候補について辞書をサ
ーチする。
Next, the character string in the kana buffer 42 is divided into two parts. In other words, it is divided into "Riyuu" and "Kan". The previous kana character string "Riyuu" is then supplied to the dictionary memory control unit 5, which searches the dictionary memory 6 for the headword "Riyuu". ``Ryuuki'' is selected. Subsequently, after it is determined that this ``riyu'' can be divided into one kanji, it is checked whether the kanji string contains a delimiter code, that is, whether it can be used as an abbreviation. However, in this case, since there is no delimiter code, the dictionary is searched again for the next candidate.

これによつて、第2図の辞書のアドレスm+1
〜m+3の見出し語について検索されるが、いず
れも略語として使用可能でないので、この略語に
ついての検索は候補なしとしてフラツグがON動
作される(ステツプ202→210)。
As a result, the address m+1 of the dictionary in FIG.
A search is made for the entry words .about.m+3, but since none of them can be used as an abbreviation, a flag is turned on to indicate that there are no candidates for the search for this abbreviation (steps 202→210).

このフラツグをON動作すると、再び辞書を最
初にサーチする。
When this flag is turned ON, the dictionary will be searched first again.

つまり、今度は予め辞書に設けた漢字が接続す
る熟語を有するかどうかチエツクされる。
That is, this time it is checked whether the kanji provided in the dictionary in advance has a connected idiom.

これは仮名文字列“りゆうかん”を前段と後段
に分割した前段の“りゆう”を辞書メモリ制御部
5に供給し、この“りゆう”を有する見出し語に
ついてサーチする(ステツプ201)。
This divides the kana character string "Riyuukan" into the first and second parts, and supplies the first part "Riyuu" to the dictionary memory control section 5, and searches for a headword containing this "Riyuu" (Step 201).

その後、ステツプ202、203、204と進行し、こ
のステツプ204では上述したようにフラツグが
ON状態にあるのでステツプ211へ進行して接続
可能な熟語が存在するかチエツクされる。
After that, the process proceeds to steps 202, 203, and 204, and in step 204, the flag is set as described above.
Since it is in the ON state, the process advances to step 211 and it is checked whether there are any connectable idioms.

この例の場合、最初見出し語として第2図のm
アドレスである“りゆうき”が選択され、今、接
続可能な熟語が存在するのでこの熟語の見出し語
の位置がアドレスされ、“げんしよう”の見出し
語に後段の仮名文字列“かん”が含まれているか
どうかチエツクされる。この場合は“かん”はな
いので再び次の候補のサーチが辞書で行われる。
この例では“りゆう”“かん”の“りゆう”に対
しては辞書のm+2のアドレスである見出し語
“りゆうこうせい”が選択されそして接続する熟
語として“かんぼう”の見出し語の位置がアドレ
スされると“かん”が含まれると判断される。
In this example, the first headword is m in Figure 2.
The address "Riyuuki" is selected, and since there is a connectable compound word, the position of the headword of this compound word is addressed, and the latter kana character string "kan" is included in the headword of "Gensho". is checked. In this case, there is no "kan", so the dictionary is searched again for the next candidate.
In this example, for "Riyuu" in "Riyuu" and "Kan", the headword "Riyuukosei" which is the m+2 address of the dictionary is selected, and the position of the headword "Kanbou" is selected as the connected idiom. When ``kan'' is addressed, it is determined that ``kan'' is included.

これによつて、ステツプ214へ進行し、この
“かん”に対応する部分が1つ又は複数の漢字と
して分断可能かどうかチエツクされる。この場
合、“かん”は“感”なる漢字となり、漢字単位
に分断可能と判定されてステツプ209へ進行する。
This causes the process to proceed to step 214, where it is checked whether the part corresponding to this "kan" can be divided into one or more kanji. In this case, "kan" becomes the kanji "kan", and it is determined that it can be divided into kanji units, and the process proceeds to step 209.

そして、ここで見出し語の“りゆうこうせい”
の“りゆう”に対応する漢字“流”と、見出し語
の“かんぼう”の“かん”に対応する漢字“感”
との切出しが行われて“流感”なる漢字を得る。
And here, the entry word “Riyuukosei”
The kanji ``flow'' corresponds to ``riyuu,'' and the kanji ``kan'' corresponds to ``kan'' in the headword ``kanbou.''
The kanji ``flukan'' is obtained by cutting out the word ``flukan''.

この場合には辞書の2つの変換文から略称語に
対応する漢字を夫々選択して変換処理する。
In this case, the kanji corresponding to the abbreviation are selected from the two converted sentences in the dictionary and converted.

なお、上記フラツグは変換が完了するとOFF
になる。
The above flag will be turned OFF once the conversion is complete.
become.

<効 果> 以上のように本発明にあつては、辞書メモリ
に、見出し語に対応する変換語に関連して当該変
換語に接続可能となる漢字又は熟語等を示す付加
情報を装備させ、入力した仮名文字列を見出し語
とする変換語が辞書メモリにない略称語の入力仮
名文字列に対し、この入力仮名文字列を少くとも
前段と後段に分割処理して該分割した前段の仮名
文字列を含むところの見出し語を前記辞書メモリ
の中から検索させ、前記検索により検出された見
出し語に対応する変換語と上記付加情報から前記
分割した後段の仮名文字列に対応する漢字につい
て含むかを判定させ、該判定で後段の仮名文字列
に対応する漢字を含むことを検出することに基い
て上記分割した前段と後段の仮名文字列に夫々対
応する漢字を辞書メモリから読出して当該略称語
に対応する変換語を得るようにしたものであり、
上記辞書メモリとしては見出し語と対応して略称
語を登録させずに、付加情報として変換語に関連
して装備させることからこのメモリ容量が大容量
化することを回避でき、しかも略称語を単漢字毎
に変換させるものでもないので操作性もよく、装
置の大型化及びコストアツプを招来することなし
に効率よく略称語の変換ができるという特徴を有
するものである。
<Effects> As described above, in the present invention, the dictionary memory is equipped with additional information indicating kanji or compound words that can be connected to the converted word corresponding to the headword in relation to the converted word, For an input kana character string of an abbreviation word for which there is no conversion word in the dictionary memory that uses the input kana character string as a headword, this input kana character string is divided into at least the first stage and the second stage, and the kana characters of the divided first stage are processed. Search the dictionary memory for the headword containing the column, and use the conversion word corresponding to the headword detected by the search and the additional information to determine whether the kanji corresponding to the divided kana character string in the subsequent stage is included. Based on this determination, when it is detected that the kana character string in the latter part contains a corresponding kanji character, the kanji corresponding to the divided former and latter kana character strings are read from the dictionary memory and the abbreviation is read out. It is designed to obtain the converted word corresponding to
The dictionary memory described above does not register abbreviations in correspondence with headwords, but instead stores them as additional information in relation to converted words. This avoids an increase in the memory capacity, and moreover, the abbreviations can be stored in Since it does not convert each kanji character by character, it is easy to operate, and abbreviations can be efficiently converted without increasing the size or cost of the device.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の略称語変換方式を実施した仮
名漢字変換装置の構成を示すブロツク図、第2図
は辞書メモリの構成を示す図、第3図及び第4図
は第1図の装置の仮名漢字変換処理動作を示すフ
ローチヤートである。 1:編集制御部(CPU)、2:キーボード装
置、4:RAM、5:辞書メモリ制御部、6:辞
書メモリ、8:CRT表示装置、41:文章バツ
フア、42:仮名バツフア、51:結果バツフ
ア。
FIG. 1 is a block diagram showing the configuration of a kana-kanji conversion device implementing the abbreviation conversion method of the present invention, FIG. 2 is a diagram showing the configuration of a dictionary memory, and FIGS. 3 and 4 are the device shown in FIG. 1. This is a flowchart showing the operation of the kana-kanji conversion process. 1: Edit control unit (CPU), 2: Keyboard device, 4: RAM, 5: Dictionary memory control unit, 6: Dictionary memory, 8: CRT display device, 41: Text buffer, 42: Kana buffer, 51: Result buffer .

Claims (1)

【特許請求の範囲】 1 仮名の見出し語と前記見出し語に対応する漢
字又は漢字まじり文(以下変換語)とを記憶した
辞書メモリを備え、仮名文字入力手段より入力さ
れた所定の仮名文字列について当該仮名文字列を
見出し語とする変換語を前記辞書メモリから読出
して入力した仮名文字列に対応する変換語を得る
仮名漢字変換装置において、 前記辞書メモリにはこの変換語に関連して当該
変換語に接続可能となる漢字又は熟語等を示す付
加情報を装備させ、上記入力した仮名文字列を見
出し語とする変換語のない略称語の入力仮名文字
列に対し、この入力仮名文字列を少くとも前段と
後段に分割処理して該分割した前段の仮名文字列
を含むところの見出し語を前記辞書メモリの中か
ら検索させ、 前記検索により検出された見出し語に対応する
変換語と上記付加情報の中から前記分割した後段
の仮名文字列に対応する漢字について含むかを判
定させ、該判定で後段の仮名文字列に対応する漢
字を含むことを検出することに基いて上記分割し
た前段と後段の仮名文字列に夫々対応する漢字を
辞書メモリから読出して当該略称語に対応する変
換語を得るようにしたことを特徴とする仮名漢字
変換装置における略称語変換方式。
[Scope of Claims] 1. A dictionary memory storing a kana headword and a kanji or kanji-mixed sentence (hereinafter referred to as a converted word) corresponding to the headword, and a predetermined kana character string inputted from a kana character input means. In the kana-kanji conversion device which obtains a converted word corresponding to the inputted kana character string by reading a converted word having the relevant kana character string as a headword from the dictionary memory, the dictionary memory stores the corresponding converted word related to this converted word. Equipped with additional information indicating kanji or compound words that can be connected to the conversion word, this input kana string is used for input kana strings of abbreviations without conversion words that use the input kana string as the headword. The dictionary memory is searched for a headword containing the divided kana character string in the first stage and the second stage, and the converted word corresponding to the headword detected by the search and the above-mentioned addition are processed. It is determined from the information whether the kanji corresponding to the kana character string in the latter part of the division is included, and based on the determination that it includes the kanji character corresponding to the kana character string in the latter part, the first part of the division is determined. An abbreviation word conversion method in a kana-kanji conversion device, characterized in that a conversion word corresponding to the abbreviation word is obtained by reading out the kanji characters corresponding to each subsequent kana character string from a dictionary memory.
JP58222387A 1983-11-24 1983-11-24 Abbreviation conversion system of kana (japanese syllabary)/kanji (chinese character) convertor Granted JPS60112175A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58222387A JPS60112175A (en) 1983-11-24 1983-11-24 Abbreviation conversion system of kana (japanese syllabary)/kanji (chinese character) convertor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58222387A JPS60112175A (en) 1983-11-24 1983-11-24 Abbreviation conversion system of kana (japanese syllabary)/kanji (chinese character) convertor

Publications (2)

Publication Number Publication Date
JPS60112175A JPS60112175A (en) 1985-06-18
JPH0154742B2 true JPH0154742B2 (en) 1989-11-21

Family

ID=16781560

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58222387A Granted JPS60112175A (en) 1983-11-24 1983-11-24 Abbreviation conversion system of kana (japanese syllabary)/kanji (chinese character) convertor

Country Status (1)

Country Link
JP (1) JPS60112175A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9620104B2 (en) 2013-06-07 2017-04-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2957120B2 (en) * 1995-12-19 1999-10-04 株式会社東邦ビジネス管理センター Medical information input system and medical information input method

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9620104B2 (en) 2013-06-07 2017-04-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition

Also Published As

Publication number Publication date
JPS60112175A (en) 1985-06-18

Similar Documents

Publication Publication Date Title
JPH096787A (en) Translation allocating machine translation device
JPH0154742B2 (en)
JPH0412866B2 (en)
JPS60112174A (en) Abbreviation conversion system of kana (japanese syllabary)/kanji (chinese character) convertor
JP2737160B2 (en) Sentence processing equipment
JPH0716192Y2 (en) Text processor
JP2928246B2 (en) Translation support device
JPS6061825A (en) Character converter
JPH06119379A (en) System and method for machine translation provided with reading kana @(3754/24)japanese syllabary) attaching function
JP2713942B2 (en) Kana-Kanji conversion device
JP3273778B2 (en) Kana-kanji conversion device and kana-kanji conversion method
JP3070761B2 (en) Kanji input device
JP2688651B2 (en) String converter
JP2603269B2 (en) Character processor
JPS6061824A (en) Character converter
JPS6257055A (en) Japanese word processor
JPH0131229B2 (en)
JPS60129875A (en) Season word conversion system for kana/kanji converter
JPS63261454A (en) Document processor
JPH0589094A (en) Kana/kanji converter
JPS61169961A (en) Character processor provided with user dictionary
JPS62168263A (en) Kana-kanji mutual converter
JPS62260266A (en) Kana/kanji converting system
JPH05151199A (en) Document preparation device
JPH08272793A (en) Character processing and device therefor method