JP2806452B2 - Kana-kanji conversion device and method, and recording medium - Google Patents

Kana-kanji conversion device and method, and recording medium

Info

Publication number
JP2806452B2
JP2806452B2 JP9108420A JP10842097A JP2806452B2 JP 2806452 B2 JP2806452 B2 JP 2806452B2 JP 9108420 A JP9108420 A JP 9108420A JP 10842097 A JP10842097 A JP 10842097A JP 2806452 B2 JP2806452 B2 JP 2806452B2
Authority
JP
Japan
Prior art keywords
analysis
character string
kana
result
japanese
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP9108420A
Other languages
Japanese (ja)
Other versions
JPH10232863A (en
Inventor
秀行 岸塲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp filed Critical Omron Corp
Priority to JP9108420A priority Critical patent/JP2806452B2/en
Publication of JPH10232863A publication Critical patent/JPH10232863A/en
Application granted granted Critical
Publication of JP2806452B2 publication Critical patent/JP2806452B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、かな漢字変換装置
および方法、並びに記録媒体に関し、特に、日本語と外
国語とが混在する文章を、迅速かつ正確に、作成するこ
とができるようにした、かな漢字変換装置および方法、
並びに記録媒体に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a kana-kanji conversion apparatus and method, and a recording medium, and more particularly to a method for quickly and accurately creating a sentence in which Japanese and foreign languages are mixed. Kana-kanji conversion apparatus and method,
And a recording medium.

【0002】[0002]

【従来の技術】最近、インターネットを代表とするネッ
トワークの普及にともない、電子メール、ネットニュー
スなどが活発に利用されるようになってきた。このよう
な電子メール、ネットニュースなどを活用するには、コ
ンピュータ(ワードプロセッサ)を利用して、文章を作
成する必要がある。そして、その文章には、日本語だけ
でなく、英単語のアルファベット文字やカタカナ文字を
混在させる必要がある場合が増加している。
2. Description of the Related Art Recently, with the spread of networks represented by the Internet, electronic mail, net news, and the like have been actively used. In order to utilize such e-mail, net news, etc., it is necessary to create sentences using a computer (word processor). The sentence is increasingly required to include not only Japanese characters but also alphabetic characters and katakana characters of English words.

【0003】このようなコンピュータ上における従来の
かな漢字変換システムの連文節解析アルゴリズムでは、
英単語のアルファベット文字列を含む日本語の文章を作
成するには、アルファベット文字を入力する時点で、入
力モードを、日本語(ローマ字)入力モードから英数固
定入力モードに切り替え、アルファベット文字を入力し
た後、入力モードを再び元に戻すという処理を行うか、
あるいはまた、アルファベット文字だけを後変換という
別の変換により入力するようにしていた。
[0003] In such a continuous kana-kanji conversion algorithm of a conventional kana-kanji conversion system on a computer,
To create a Japanese sentence that includes an alphabetic string of English words, switch the input mode from Japanese (Roman) input mode to fixed alphanumeric input mode and enter alphabetic characters at the time of entering alphabetic characters After that, perform the process of returning the input mode again,
Alternatively, only alphabetic characters are input by another conversion called post-conversion.

【0004】[0004]

【発明が解決しようとする課題】しかしながら、このよ
うな従来のかな漢字変換装置においては、入力モードを
切り替えるか、または後変換を行う必要があるため、自
分がこれからアルファベット文字を入力するのか、日本
語を入力するのかを常に意識する必要があるばかりでな
く、現在の入力モードが、いま入力している文字に対応
するモードとなっているか否かを常に意識しておく必要
があった。さらにまた、入力モードの切換や後変換によ
り、本来の文章作成のために必要な操作以外のオーバヘ
ッドの操作が必要であり、入力ミスや、それにともなう
修正、文章作成中の思考の中断などが発生し易く、結
局、文章を作成するのに時間がかかる課題があった。
However, in such a conventional kana-kanji conversion device, it is necessary to switch the input mode or to perform post-conversion, so that it is necessary to input the alphabet characters in the future. It is necessary not only to always be conscious of whether or not to input a character, but also to always be conscious whether or not the current input mode is a mode corresponding to the character that is being input. Furthermore, input mode switching and post-conversion require overhead operations other than those required for original sentence creation, resulting in erroneous input, correction due to it, interruption of thinking during sentence creation, etc. There is a problem that it is easy to do, and it takes time to create a sentence after all.

【0005】本発明はこのような状況に鑑みてなされた
ものであり、日本語と英語が混在する文章を、迅速かつ
正確に、作成することができるようにするものである。
The present invention has been made in view of such a situation, and aims to quickly and accurately create a sentence in which Japanese and English are mixed.

【0006】[0006]

【課題を解決するための手段】請求項1に記載のかな漢
字変換装置は、変換する文字列を受け取る受け取り手段
と、受け取り手段により受け取られた文字列を、日本語
として連文節解析する第1の解析手段と、受け取り手段
により受け取られた文字列から外国語に対応する文字列
を抽出する抽出手段と、受け取り手段により受け取られ
た文字列のうち、抽出手段により外国語として抽出され
なかった部分を、日本語として連文節解析する第2の解
析手段と、第1の解析手段の解析結果と第2の解析手段
の解析結果を、端部に向かって解析を進め、その文節の
区切りが最初に一致する位置を区切り位置として検出す
る検出手段と、第1の解析手段の解析結果の、検出手段
により検出された区切り位置までの未決定の文字列と、
第2の解析手段の解析結果の、検出手段により検出され
た区切り位置までの未決定の文字列を、所定の選択条件
に基づいて比較し、その比較結果に対応して、検出手段
により検出された区切り位置までの未決定の文字列の解
析結果として、第1の解析手段の解析結果と第2の解析
手段の解析結果の一方を選択する選択手段とを備えるこ
とを特徴とする。
[MEANS FOR SOLVING THE PROBLEMS] The kana kan according to claim 1
The character conversion device receives a character string to be converted.
And the character string received by the receiving means
First analyzing means for analyzing a continuous phrase as a sentence, and receiving means
A string corresponding to a foreign language from the string received by
Extracted by the extracting means and the receiving means
Extracted as a foreign language by the extraction means
The second solution which analyzes the missing part in Japanese
Analysis means, analysis results of the first analysis means, and second analysis means
The analysis result of
Detect the first position where a break matches as a break position
Detecting means, and detecting means for detecting the analysis result of the first analyzing means.
Character string up to the break position detected by
The detection result of the analysis result of the second analysis means is detected by the detection means.
The undetermined character string up to the delimiter position is
And based on the comparison result, the detecting means
Of the undetermined string up to the break position detected by
As an analysis result, the analysis result of the first analysis means and the second analysis
Selection means for selecting one of the analysis results of the means.
And features.

【0007】請求項5に記載のかな漢字変換方法は、
換する文字列を受け取る受け取りステップと、受け取り
ステップで受け取られた文字列を、日本語として連文節
解析する第1の解析ステップと、受け取りステップで受
け取られた文字列から外国語に対応する文字列を抽出す
る抽出ステップと、受け取りステップで受け取られた文
字列のうち、抽出ステップで外国語として抽出されなか
った部分を、日本語として連文節解析する第2の解析ス
テップと、第1の解析ステップの解析結果と第2の解析
ステップの解析結果を、端部に向かって解析を進め、そ
の文節の区切りが最初に一致する位置を区切り位置とし
て検出する検出ステップと、第1の解析ステップでの解
析結果の、検出ステップで検出された区切り位置までの
未決定の文字列と、第2の解析ステップでの解析結果
の、検出ステップで検出された区切り位置までの未決定
の文字列を、所定の選択条件に基づいて比較し、その比
較結果に対応して、検出ステップで検出された区切り位
置までの未決定の文字列の解析結果として、第1の解析
ステップでの解析結果と第2の解析ステップでの解析結
果の一方を選択する選択ステップとを含むことを特徴と
する。
[0007] Kana-Kanji conversion method according to claim 5, varying
Receiving a character string to be replaced, and receiving
The character string received in the step is a continuous phrase as Japanese
A first analyzing step for analyzing and a receiving step
Extract foreign language strings from the extracted strings
Extraction step and the statement received in the receiving step
Whether the string is not extracted as a foreign language in the extraction step
The second analysis method that analyzes the phrase
Step, analysis result of first analysis step and second analysis
Analyze the analysis result of the step toward the end, and
The position where the segment break of the first
And the solution in the first analysis step
Analysis results up to the break position detected in the detection step.
Undetermined character string and analysis result in the second analysis step
Not determined up to the break position detected in the detection step
Are compared based on predetermined selection conditions.
The break position detected in the detection step according to the comparison result
As the result of analyzing the undetermined character string up to
Analysis result in the step and the analysis result in the second analysis step
Selecting one of the fruits .

【0008】請求項9に記載のコンピュータ読み取り可
能な記録媒体は、入力された文字列を変換するかな漢字
変換装置に、変換する文字列を受け取る受け取りステッ
プと、受け取りステップで受け取られた文字列を、日本
語として連文節解析する第1の解析ステップと、受け取
りステップで受け取られた文字列から外国語に対応する
文字列を抽出する抽出ステップと、受け取りステップで
受け取られた文字列のうち、抽出ステップで外国語とし
て抽出されなかった部分を、日本語として連文節解析す
る第2の解析ステップと、第1の解析ステップの解析結
果と第2の解析ステップの解析結果を、端部に向かって
解析を進め、その文節の区切りが最初に一致する位置を
区切り位置として検出する検出ステップと、第1の解析
ステップでの解析結果の、検出ステップで検出された区
切り位置までの未決定の文字列と、第2の解析ステップ
での解析結果の、検出ステップで検出された区切り位置
までの未決定の文字列を、所定の選択条件に基づいて比
較し、その比較結果に対応して、検出ステップで検出さ
れた区切り位置までの未決定の文字列の解析結果とし
て、第1の解析ステップでの解析結果と第2の解析ステ
ップでの解析結果の一方を選択する選択ステップを実行
させるためのプログラムを記録したことを特徴とする
[0008] The computer readable of claim 9
Kana-Kanji that can convert the input character string
A receiving step for receiving the character string to be converted is provided to the converting device.
And the character string received in the receiving step
First parsing step for parsing clauses as words, receiving
Corresponding to a foreign language from the string received in the step
In the extraction step to extract the character string and the receiving step
Of the received strings, in the extraction step as a foreign language
Segment not analyzed by Japanese
A second analysis step and an analysis result of the first analysis step.
The results and the results of the second analysis step towards the end
Proceed with parsing and find the position where the segment break first matches.
A detecting step of detecting as a break position, and a first analysis
Of the analysis result in the step detected in the detection step
Undetermined character string up to the cutting position and second analysis step
Position detected in the detection step of the analysis result in
Undetermined character strings up to
In the detection step according to the comparison result.
Of the undetermined character string up to the
The analysis result of the first analysis step and the second analysis step
Performs a selection step to select one of the analysis results in the step
A program for causing the program to be recorded .

【0009】選択は、文節数の少ない方、直前に使用し
た候補が含まれている方、または日本語である方を、そ
の優先順位で、選択条件として、行うことができる。
The selection should be made in the direction with the fewest phrases,
If you have a candidate that includes
, And can be performed as a selection condition.

【0010】さらに、2つの解析結果の一部を次候補と
したり、外国語に対応する文字列の大文字と小文字、全
角文字と半角文字などの差異を、候補毎、または変換環
境毎に学習するようにすることができる。
[0010] Further, a part of the two analysis results is regarded as a next candidate.
Or the uppercase and lowercase letters in the string corresponding to the foreign language,
Differences between square characters and half-width characters can be learned for each candidate or each conversion environment.

【0011】請求項1に記載のかな漢字変換装置、請求
項5に記載のかな漢字変換方法、および請求項9に記載
コンピュータ読み取り可能な記録媒体においては、受
け取られた文字列が日本語として連文節解析されるだけ
でなく、受け取られた文字列から外国語に対応する文字
列が抽出され、外国語に対応する文字列として抽出され
なかった部分がさらに日本語に連文節解析される。そし
て、日本語としての解析結果と、外国語に対応する文字
列を含む解析結果の一方が、選択条件に基づいて選択さ
れる。従って、迅速かつ正確に、日本語と外国語が混在
する文章を作成することが可能となる。
[0011] In the kana-kanji conversion apparatus according to the first aspect, the kana-kanji conversion method according to the fifth aspect, and the computer-readable recording medium according to the ninth aspect, the received character string is subjected to continuous phrase analysis as Japanese. In addition, the character string corresponding to the foreign language is extracted from the received character string, and the portion not extracted as the character string corresponding to the foreign language is further subjected to continuous phrase analysis in Japanese. Then, one of the analysis result in Japanese and the analysis result including the character string corresponding to the foreign language is selected based on the selection condition. Therefore, it is possible to quickly and accurately create a sentence in which Japanese and foreign languages are mixed.

【0012】[0012]

【発明の実施の形態】図1は、本発明のかな漢字変換装
置の構成例を示すブロック図である。CPU1は、RO
M2またはハードディスクドライブ(HDD)5に記憶
されているプログラムに従って、かな漢字変換処理を実
行する。ROM2には、プログラムのほか、アルファベ
ット文字、数字、漢字、ひらがな、カタカナなどの各種
の文字のフォントも記憶されている。RAM3には、か
な漢字変換処理をする上において必要な各種のデータ
が、適宜記憶される。
FIG. 1 is a block diagram showing a configuration example of a kana-kanji conversion device of the present invention. CPU1 is RO
According to the program stored in the M2 or the hard disk drive (HDD) 5, the kana-kanji conversion process is executed. The ROM 2 stores fonts for various characters such as alphabetic characters, numbers, kanji, hiragana, and katakana, in addition to programs. The RAM 3 appropriately stores various data required for performing the kana-kanji conversion process.

【0013】インタフェース(I/F)4には、LCD
6が接続されており、このLCD6には、作成した文章
が表示されるようになされている。キーボード7は、文
字を入力するとき操作される。
The interface (I / F) 4 has an LCD
6 is connected, and the LCD 6 displays the created text. The keyboard 7 is operated when inputting characters.

【0014】図2は、かな漢字変換処理の基本的なプロ
グラムの構成を表している。キーボード7を操作して所
定の文字列を入力すると、この文字列は、インタフェー
ス4を介してCPU1に入力される。CPU1は、この
文字列をユーザ入出力部21に、変換前文字列情報とし
て供給する。ユーザ入出力部21は、この変換前文字列
情報を、連文節解析処理部22と次候補解析処理部23
に供給する。
FIG. 2 shows the configuration of a basic program for kana-kanji conversion processing. When a predetermined character string is input by operating the keyboard 7, the character string is input to the CPU 1 via the interface 4. The CPU 1 supplies this character string to the user input / output unit 21 as character string information before conversion. The user input / output unit 21 converts the pre-conversion character string information into a continuous phrase analysis processing unit 22 and a next candidate analysis processing unit 23.
To supply.

【0015】連文節解析処理部22は、入力された文字
列を解析し、辞書検索すべき文字列を抽出し、これを辞
書検索処理部24に送る。辞書検索処理部24は、供給
された文字列が、辞書25に記憶されているか否かを検
索する。そして、検索結果を連文節解析処理部22に出
力する。連文節解析処理部22は、例えば、辞書検索処
理部24から、辞書検索文字列に対応する漢字が供給さ
れてきたとき、それに対応する辞書検索文字列を、その
漢字に置換する処理を行う。
The continuous phrase analysis processing section 22 analyzes the input character string, extracts a character string to be searched in the dictionary, and sends the extracted character string to the dictionary search processing section 24. The dictionary search processing unit 24 searches whether or not the supplied character string is stored in the dictionary 25. Then, the search result is output to the continuous phrase analysis processing unit 22. For example, when a kanji corresponding to a dictionary search character string is supplied from the dictionary search processing unit 24, the continuous phrase analysis processing unit 22 performs a process of replacing the corresponding dictionary search character string with the kanji.

【0016】連文節解析処理部22は、以上のようにし
て、変換前文字列情報を解析した結果得られた解析結果
情報を、ユーザ入出力部21に出力する。ユーザ入出力
部21は、連文節解析処理部22より供給された解析結
果情報に対応する変換後文字列を出力する。CPU1
は、この文字列をインタフェース4を介してLCD6に
表示させる。
The continuous phrase analysis processing section 22 outputs the analysis result information obtained as a result of analyzing the pre-conversion character string information to the user input / output section 21 as described above. The user input / output unit 21 outputs a converted character string corresponding to the analysis result information supplied from the continuous phrase analysis processing unit 22. CPU1
Causes the LCD 6 to display this character string via the interface 4.

【0017】同様にして、次候補解析処理部23は、ユ
ーザ入出力部21より入力された変換前文字列情報から
辞書検索すべき文字列を抽出し、これを辞書検索処理部
24に出力する。辞書検索処理部24は、入力された辞
書検索すべき文字列に対応する文字が、辞書25に登録
されているか否かを検索し、その検索結果を、次候補解
析処理部23に出力する。次候補解析処理部23は、辞
書検索処理部24から次候補として送られてくる複数の
候補をまとめ、これをユーザ入出力部21に出力する。
ユーザ入出力部21は、この複数の次候補の文字列を、
変換後文字列としてCPU1に出力する。CPU1は、
この次候補の文字列も、インタフェース4を介してLC
D6に出力し、表示させる。
Similarly, the next candidate analysis processing unit 23 extracts a character string to be searched for a dictionary from the pre-conversion character string information input from the user input / output unit 21 and outputs this to the dictionary search processing unit 24. . The dictionary search processing unit 24 searches whether a character corresponding to the input character string to be searched in the dictionary is registered in the dictionary 25, and outputs the search result to the next candidate analysis processing unit 23. The next candidate analysis processing unit 23 puts together a plurality of candidates sent from the dictionary search processing unit 24 as next candidates, and outputs this to the user input / output unit 21.
The user input / output unit 21 converts the character strings of the plurality of next candidates into
The converted character string is output to the CPU 1. CPU1
The character string of the next candidate is also transmitted to the LC via the interface 4.
Output to D6 for display.

【0018】以上のようにして、LCD6には、キーボ
ード7より入力したかな(またはローマ字)が、適宜に
漢字に変換された文字列が、次候補の文字列とともに表
示される。使用者は、次候補の中から、所定の候補の文
字列を選択し、意図する文章を作成する。
As described above, on the LCD 6, a character string obtained by appropriately converting kana (or Roman characters) inputted from the keyboard 7 into kanji is displayed together with the character string of the next candidate. The user selects a character string of a predetermined candidate from the next candidates and creates an intended sentence.

【0019】本発明のかな漢字変換装置は、日本語中に
英語が混在する場合にも、入力モードを変更することな
く、日本語を連続して入力する場合と同様の操作で、文
章を作成することができるようになされている。このた
め、本発明のかな漢字変換装置においても、プログラム
は基本的に、図2に示すように構成されるのであるが、
より細かく区分すると、プログラムは、図3に示すよう
に構成されている。
According to the kana-kanji conversion device of the present invention, even when Japanese is mixed with English, a sentence is created by the same operation as in the case of continuously inputting Japanese without changing the input mode. It has been made possible. For this reason, even in the kana-kanji conversion device of the present invention, the program is basically configured as shown in FIG.
More specifically, the program is configured as shown in FIG.

【0020】入力部41と出力部42は、図2における
ユーザ入出力部21に対応する部分であり、入力部41
は、キーボード7より入力された文字列を受け取り、各
部に出力する。出力部42は、各部から供給されてきた
文字列を受け取り、LCD6に出力する。
The input unit 41 and the output unit 42 correspond to the user input / output unit 21 in FIG.
Receives a character string input from the keyboard 7 and outputs it to each unit. The output unit 42 receives the character string supplied from each unit and outputs the character string to the LCD 6.

【0021】辞書検索処理部43と辞書44は、図2に
おける辞書検索処理部24と辞書25に対応しており、
辞書検索処理部43は、各部から供給されてきた辞書検
索文字列を辞書44を参照して検索し、検索結果を各部
に返す処理を実行する。
The dictionary search processing unit 43 and the dictionary 44 correspond to the dictionary search processing unit 24 and the dictionary 25 in FIG.
The dictionary search processing unit 43 executes a process of searching for a dictionary search character string supplied from each unit with reference to the dictionary 44 and returning a search result to each unit.

【0022】日英混在連文節解析部45は、図2におけ
る連文節解析処理部22に対応している。この日英混在
連文節解析部45は、日本語連文節解析部46と英語連
文節解析部47により構成されている。日本語連文節解
析部46は、従来のかな漢字変換装置の場合と同様に、
変換前文字列を日本語として連文節解析する処理を行
い、英語連文節解析部47は、変換前文字列を英語とし
ての(英語読みの)連文節解析を行う。
The Japanese-English mixed phrase analysis unit 45 corresponds to the continuous phrase analysis processing unit 22 in FIG. The Japanese-English mixed phrase analysis unit 45 includes a Japanese phrase analysis unit 46 and an English phrase analysis unit 47. As in the case of the conventional kana-kanji conversion device,
The pre-conversion character string is subjected to a continuous phrase analysis process as Japanese, and the English consecutive phrase analysis unit 47 performs a continuous phrase analysis (of English reading) using the pre-conversion character string as English.

【0023】日英混在全候補解析部48は、図2におけ
る次候補解析処理部23に対応しており、この日英混在
全候補解析部48は、変換前文字列を日本語(かな)に
変換するローマ字かな変換部49を有している。日本語
次候補処理部50(次候補解析手段)は、日本語の同音
異義語などを次候補として解析処理する。英単語読み抽
出部51(抽出手段)は、変換前文字列を英語として解
析するために、英単語を抽出する処理を行う。
The mixed Japanese-English all-candidate analysis unit 48 corresponds to the next candidate analysis processing unit 23 in FIG. 2. The mixed Japanese-English all-candidate analysis unit 48 converts the character string before conversion into Japanese (kana). It has a Roman character kana conversion unit 49 for conversion. The next Japanese candidate processing unit 50 (next candidate analysis means) analyzes Japanese homonyms and the like as the next candidate. The English word reading extraction unit 51 (extraction means) performs a process of extracting English words in order to analyze the character string before conversion as English.

【0024】英単語次候補処理部52(次候補解析手
段)は、英単語の次候補を解析処理する。この英単語次
候補処理部52は、日本語を処理する場合における日本
語次候補処理部50と同様の処理を、英語において行う
ことになる。
The next English word candidate processing section 52 (next candidate analysis means) analyzes the next English word candidate. The next English word candidate processing unit 52 performs the same processing as the next Japanese candidate processing unit 50 in processing English in English.

【0025】同音異義語評価ソート部53は、日本語次
候補処理部50と英単語次候補処理部52で解析処理さ
れた結果得られた次候補を、所定の基準で評価して、ソ
ート処理を行う。
The homonym synonym evaluation sort unit 53 evaluates the next candidate obtained as a result of the analysis processing by the Japanese next candidate processing unit 50 and the English word next candidate processing unit 52 according to a predetermined criterion. I do.

【0026】日本語候補学習結果反映部54(学習手
段)と英単語候補学習結果反映部55(学習手段)は、
それぞれ、日本語または英単語の次候補の中から所定の
単語が選択された場合、その結果を学習し、後の次候補
の解析に反映させる処理を行う。例えば、英単語候補学
習結果反映部55は、表記の異なる候補(全角/半角、
大文字/小文字、アルファベット/カタカナ)を、直前
の学習情報(候補毎の学習情報、変換環境毎の学習情
報)に応じて切り替える処理を行う。
The Japanese candidate learning result reflecting unit 54 (learning means) and the English word candidate learning result reflecting unit 55 (learning means)
When a predetermined word is selected from the next candidates of Japanese or English words, a process of learning the result and reflecting the result in the analysis of the next candidate is performed. For example, the English word candidate learning result reflecting unit 55 outputs the candidates having different notations (full-width / half-width,
A process of switching between uppercase / lowercase and alphabet / Katakana according to the immediately preceding learning information (learning information for each candidate, learning information for each conversion environment) is performed.

【0027】次に、図4のフローチャートを参照して、
所定の文字列がアルファベット文字で入力された場合
に、これをかな漢字変換する、具体的な処理例について
説明する。
Next, referring to the flowchart of FIG.
A description will be given of a specific processing example in which, when a predetermined character string is input in alphabetical characters, the character string is converted into kana-kanji characters.

【0028】使用者が、キーボード7を操作して、例え
ば、「systemikansitekudasai」の文字列を入力したと
する。この文字列には、日本語(ローマ字)と英語が混
在している。ステップS1では、この変換前情報を受け
取る処理が実行される。この処理は、入力部41(受け
取り手段)で行われる。入力部41で受け取られた変換
前文字列(キー入力情報)は、ステップS2において、
日本語読み変換処理が行われる。すなわち、入力部41
で受け取られた変換前文字列は、日本語連文節解析部4
6(第1の解析手段)に送られ、日本語として連文節解
析される。これにより、例えば、「sysてみかんしてく
ださい」の文字列が得られる。そして、さらにステップ
S3において、日本語連文節解析部46は、ひらがな部
分を漢字に変換し、「sys手未完してください」の文字
列を得る。
It is assumed that the user operates the keyboard 7 to input, for example, a character string "systemikansitekudasai". This character string is a mixture of Japanese (Roman) and English. In step S1, a process of receiving the pre-conversion information is executed. This processing is performed by the input unit 41 (receiving means). The pre-conversion character string (key input information) received by the input unit 41 is
Japanese reading conversion processing is performed. That is, the input unit 41
The pre-conversion character string received by
6 (first analysis means) and is subjected to continuous phrase analysis as Japanese. As a result, for example, a character string of “Please try sys” is obtained. Then, further in step S3, the Japanese consecutive phrase analysis unit 46 converts the hiragana portion into kanji, and obtains a character string "sys hand not complete".

【0029】一方、入力部41は、受け取った変換前文
字列「systemikansitekudasai」を、英単語読み抽出部
51(第2の解析手段)にも出力する。英単語読み抽出
部51は、ステップS4において、入力された文字列か
ら英単語を抽出する処理を行う。この英単語読み抽出処
理の詳細は、図5のフローチャートに示されている。
On the other hand, the input unit 41 also outputs the received pre-conversion character string "systemikansitekudasai" to the English word reading and extracting unit 51 (second analysis means). In step S4, the English word reading and extracting unit 51 performs a process of extracting an English word from the input character string. Details of the English word reading extraction processing are shown in the flowchart of FIG.

【0030】最初にステップS21において、入力され
た変換前文字列を英語辞書で検索する処理が行われる。
すなわち、英単語読み抽出部51は、入力された変換前
文字列から辞書検索すべき文字列を抽出し、辞書検索処
理部43に送り、辞書44のうち、英語の辞書を参照し
て、英単語としての検索を実行させる。辞書検索処理部
43は、検索結果を英単語読み抽出部51に出力する。
First, in step S21, a process of searching the input pre-conversion character string in the English dictionary is performed.
That is, the English word reading extraction unit 51 extracts a character string to be dictionary-searched from the input pre-conversion character string, sends the character string to the dictionary search processing unit 43, and refers to the English dictionary among the dictionaries 44, and Perform a search as a word. The dictionary search processing unit 43 outputs the search result to the English word reading and extracting unit 51.

【0031】英単語読み抽出部51は、ステップS22
において、検索された英単語があるか否かを判定する。
いまの場合、例えば、「system」と「site」が検索され
る。このときステップS23に進み、英単語読み抽出部
51は、入力された変換前文字列のうち、検索された文
字列に対応する部分を英単語として置き換える処理を実
行する。いまの場合、「system」と「site」が英単語と
して処理される。
The English word reading and extracting unit 51 determines in step S22
In, it is determined whether or not there is a searched English word.
In this case, for example, “system” and “site” are searched. At this time, the process proceeds to step S23, and the English word reading extraction unit 51 executes a process of replacing a portion corresponding to the searched character string in the input pre-conversion character string as an English word. In this case, "system" and "site" are processed as English words.

【0032】次に、ステップS24に進み、英単語とし
て検索されたなかった単語をかなに変換する処理が行わ
れる。すなわち、英単語読み抽出部51は、ステップS
23で英単語として検索されなかった文字列「ikan」と
「kudasai」をひらがなに変換させる。これにより、結
局、変換前文字列は、「systemいかんsiteください」に
変換されることになる。
Next, the process proceeds to step S24, in which a word which has not been searched for as an English word is converted into kana. That is, the English word reading extraction unit 51 determines in step S
The character strings “ikan” and “kudasai” that were not searched for as English words in 23 are converted to hiragana. As a result, the pre-conversion character string is eventually converted into “system ikan site please”.

【0033】ステップS22において検索された英単語
が存在しないと判定された場合には、ステップS23と
S24の処理はスキップされる。
If it is determined in step S22 that the searched English word does not exist, steps S23 and S24 are skipped.

【0034】図4に戻って、以上のようにして、英単語
読み抽出処理の結果、「systemいかんsiteください」の
文字列が得られたとすると、この文字列が、英単語読み
抽出部51から、英語連文節解析部47(第2の解析手
段)に送られる。英語連文節解析部47においては、入
力された文字列のうち、英語の単語の部分以外のひらが
なの部分を、辞書検索処理部43に送り、漢字検索し
て、適宜漢字に変換する処理を行う。これにより、例え
ば、「system移管siteください」が得られる。
Returning to FIG. 4, assuming that a character string “system ikan site please” is obtained as a result of the English word reading extraction processing as described above, this character string is Is sent to the English consecutive phrase analysis unit 47 (second analysis means). The English continuous phrase analysis unit 47 sends a hiragana portion other than the English word portion of the input character string to the dictionary search processing unit 43, performs a kanji search, and performs a process of appropriately converting it to kanji. Thereby, for example, "Please transfer system site" is obtained.

【0035】以上のようにして、ステップS3またはス
テップS5において、日本語読みとしての連文節解析
と、英語読みとしての連文節解析が得られたら、ステッ
プS6以降に進み、2つの連文節解析の結果のうち、い
ずれか一方を選択する処理が行われる。
As described above, in step S3 or step S5, if the continuous phrase analysis as a Japanese reading and the continuous phrase analysis as an English reading are obtained, the process proceeds to step S6 and the subsequent steps. , Is performed.

【0036】ステップS6においては、日英混在連文節
解析部45で、読みの先頭までの評価が終了したか否か
が判定される。いまの場合、まだ、読みの先頭までの評
価が終了していないので、NOの判定が行われ、ステッ
プS7(検出手段)に進む。ステップS7においては、
日英混在連文節解析部45は、ステップS3で得られた
日本語読みの連文節解析結果と、ステップS5で得られ
た英語読みの連文節解析結果の文節の区切りが一致する
ところまで解析結果を進める。この例の場合、「siteku
dasai」までが、いずれの文節においても一致するの
で、この文節が、最初に抽出される。
In step S6, the Japanese / English mixed phrase analyzer 45 determines whether the evaluation up to the beginning of the reading has been completed. In this case, since the evaluation up to the beginning of the reading has not been completed, a NO determination is made, and the process proceeds to step S7 (detection means) . In step S7,
The Japanese-English mixed-phrase analysis unit 45 advances the analysis result until the result of the Japanese-language consecutive- clause analysis result obtained in step S3 matches the phrase segmentation of the English-read continuous- phrase analysis result obtained in step S5. In this example, "siteku
Since "dasai" matches in any of the clauses, this clause is extracted first.

【0037】次に、ステップS8(選択手段)に進み、
2つの連文節解析結果のうち、いずれを優先して選択す
るのかが判定される。この判定は、次の優先順位に従っ
て行われる。 (1) キー入力情報が一致する文節区切り位置での文
節数の少ない方を優先する。 (2) 文節数が同じ場合には、直前に使用した(確定
した)候補が含まれている方を優先する。 (3) 上記した(1)と(2)が同じ場合には、「日
本語読み」の方を優先する。
Next, the process proceeds to step S8 (selection means).
It is determined which of the two consecutive phrase analysis results is to be selected with priority. This determination is made according to the following priorities. (1) Priority is given to the phrase having the smaller number of phrases at the phrase break position where the key input information matches. (2) If the number of clauses is the same, the one that contains the candidate used (fixed) immediately before is prioritized. (3) When the above (1) and (2) are the same, priority is given to "Japanese reading".

【0038】この基準に従って、優先順位を判定する
と、いまの場合、上記した(3)の条件が適用され、
「日本語読み」の文節が選択される。その結果、「site
ください」ではなく、「してください」が選択される。
When the priority order is determined according to this criterion, in this case, the condition (3) is applied,
The phrase "Japanese reading" is selected. As a result, "site
"Please" is selected instead of "Please."

【0039】次に、ステップS9に進み、日英混在連文
節解析部45は、ステップS8で選択した解析結果を記
憶する処理を行う。いまの場合、「してください」が記
憶される。
Next, proceeding to step S9, the Japanese-English mixed-phrase analysis unit 45 performs a process of storing the analysis result selected in step S8. In this case, "please" is stored.

【0040】次に、ステップS10に進み、日本語読み
の連文節解析結果と英語読みの連文節解析結果の両方
を、それぞれ、次の解析処理に進める。そして、ステッ
プS6に戻り、読みの先頭まで評価が終了したか否かが
判定される。いまの場合、まだ、読みの先頭まで評価が
終了していないので、再び、NOの判定が行われ、ステ
ップS7に進む。ステップS7においては、「systemik
an」の文節の解析が行われることになる。いまの場合、
日本語読みの連文節解析の結果は、「sys手未完」とな
り、英語読みの連文節解析の結果は、「system移管」と
なる。
Next, the process proceeds to step S10, where both the results of the continuous phrase analysis of the Japanese reading and the results of the continuous phrase analysis of the English reading are respectively advanced to the next analysis processing. Then, the process returns to step S6, and it is determined whether the evaluation has been completed up to the beginning of the reading. In this case, since the evaluation has not yet been completed up to the beginning of the reading, a NO determination is made again, and the process proceeds to step S7. In step S7, "systemik
The phrase "an" will be analyzed. In this case,
The result of the continuous phrase analysis of Japanese reading is "sys hand incomplete", and the result of continuous phrase analysis of English reading is "system transfer".

【0041】ステップS8においては、この2つの解析
結果のうち、いずれを優先するかが判定される。いまの
場合、上記した(1)の文節数の少ない方を優先すると
いう基準に従って、「system移管」が選択される。
In step S8, it is determined which of the two analysis results has priority. In this case, “system transfer” is selected in accordance with the criterion (1) that gives priority to the one with a smaller number of clauses.

【0042】次に、ステップS9に進み、ステップS8
で選択された解析結果が、前回の処理で解析された結果
と合わせて記憶される。これにより、「system移管して
ください」の解析結果が記憶されたことになる。
Next, the process proceeds to step S9, and the process proceeds to step S8.
The analysis result selected in is stored together with the result analyzed in the previous processing. As a result, the analysis result of "Please transfer system" is stored.

【0043】次に、ステップS10からステップS6に
戻り、ステップS6において、読みの先頭まで評価が終
了したと判定されるので、ここでYESの判定が行わ
れ、ステップS11に進む。ステップS11において
は、ステップS9で記憶された解析結果を出力部42に
返す処理が行われる。いまの場合、「system移管してく
ださい」の変換後文字列が、出力部42に出力されるこ
とになる。出力部42は、この文字列をLCD6に出力
し、表示させる。
Next, the process returns from step S10 to step S6, where it is determined in step S6 that the evaluation has been completed up to the beginning of the reading, so a YES determination is made here and the process proceeds to step S11. In step S11, a process of returning the analysis result stored in step S9 to the output unit 42 is performed. In this case, the converted character string of "Please transfer system" is output to the output unit 42. The output unit 42 outputs this character string to the LCD 6 and displays it.

【0044】なお、本発明のかな漢字変換装置において
は、変換前文字列を強制的に日本語に変換(ローマ字か
な変換)した読み(日本語読み)での候補と、英単語と
して有効な部分を抽出し、残りを日本語に変換した読み
(英語読み)での候補が、同時に、同音異義語として処
理される。この処理について、図6のフローチャートを
参照して説明する。
In the kana-kanji conversion apparatus according to the present invention, a candidate for reading (Japanese reading) in which a character string before conversion is forcibly converted to Japanese (Roman-Kana conversion) and a portion effective as an English word are included. Candidates in the extracted (English reading) extracted and converted into Japanese are processed as homonyms at the same time. This processing will be described with reference to the flowchart in FIG.

【0045】例えば、ステップS41において、変換前
情報(キー入力情報)として、「datega」が入力部41
で受け取られたものとする。このとき、日本語連文節解
析部46において、ステップS42で、文字列「dateg
a」が、強制的に日本語に変換される。その結果、「だ
てが」が得られる。
For example, in step S 41, “datega” is input to the input unit 41 as the pre-conversion information (key input information).
Shall be received at At this time, in the Japanese consecutive phrase analyzing unit 46, in step S42, the character string "dateg
"a" is forcibly converted to Japanese. As a result, a "date" is obtained.

【0046】次に、ステップS43に進み、日本語次候
補処理部50において、次候補解析処理が行われる。こ
れにより、例えば、「伊達が」、「立てが」、または
「建てが」が次候補として得られる。
Next, the process proceeds to step S43, where the next Japanese candidate processing unit 50 performs a next candidate analysis process. Thereby, for example, “Date”, “Tatega”, or “Building” is obtained as the next candidate.

【0047】一方、ステップS41で得られた変換前情
報「datega」は、ステップS44において、英単語読み
抽出部51に送られ、英単語読み抽出処理が行われる。
これにより、「date」の部分が英単語として認識され
る。その結果、ステップS45において、英単語以外の
部分を英語連文節解析部47で日本語に変換する処理が
行われて、「dateが」が得られる。
On the other hand, the pre-conversion information "datega" obtained in step S41 is sent to the English word reading extraction unit 51 in step S44, and the English word reading extraction processing is performed.
As a result, the "date" portion is recognized as an English word. As a result, in step S45, a process other than the English word is converted into Japanese by the English consecutive clause analysis unit 47, and "date" is obtained.

【0048】さらに、ステップS46において、英単語
次候補処理部52が、ステップS45で得られた同音異
義語として、「dateが」、「datが」、または「デ
ートが」を得る
[0048] Further, in step S46, the English word next candidate processing unit 52, a homonym obtained in step S45, "date is", "dat e is" or get "dating".

【0049】この発明の実施の形態においては、図7に
示すように、小文字半角アルファベット文字、先頭だけ
が大文字の半角のアルファベット文字、すべてが大文字
の半角のアルファベット文字、すべてが小文字の全角の
アルファベット文字、先頭だけが大文字の全角アルファ
ベット文字、すべてが大文字の全角アルファベット文
字、全角カタカナ文字、または半角カタカナ文字のいず
れもが、同音異義語として、次候補として処理される。
In the embodiment of the present invention, as shown in FIG. 7, lowercase half-width alphabet letters, only the uppercase half-width alphabet letters, all uppercase half-width alphabet letters, and all lowercase half-width alphabet letters, Any of the characters, full-width alphabetic characters in which only the first letter is capitalized, and all-uppercase full-width alphabet characters, full-width katakana characters, or half-width katakana characters are processed as homonyms as the next candidate.

【0050】ステップS43または、ステップS46に
おいて、日本語読みまたは英語読みの次候補解析結果が
得られた場合には、これらの次候補は、同音異義語評価
ソート部53に送られ、ステップS47において、所定
の基準により(後述する日本語候補学習結果反映部54
と英単語候補学習結果反映部55の学習結果に基づき)
評価され、その評価結果に対応して、ソート処理が行わ
れる。ステップS48においては、以上のようにして得
られたソート結果が、出力部42に出力され、そこから
LCD6に出力、表示される。
If the next candidate analysis result of Japanese reading or English reading is obtained in step S43 or S46, these next candidates are sent to the homonymous word evaluation sort unit 53, and in step S47. , According to a predetermined criterion (the Japanese candidate learning result reflecting unit 54 described later)
And the learning result of the English word candidate learning result reflecting unit 55)
The evaluation is performed, and a sorting process is performed according to the evaluation result. In step S48, the sorting result obtained as described above is output to the output unit 42, from which it is output and displayed on the LCD 6.

【0051】以上のようにして、次候補が複数得られた
場合には、その中から使用者が、所望のものを選択する
ことになる。この選択処理を行った結果は、日本語候補
学習結果反映部54と、英単語候補学習結果反映部55
で、それぞれ反映される。例えば、表記の異なる英単語
候補(全角/半角、大文字/小文字、アルファベット/
カタカナ)は、直前の学習情報に応じて、最適な表記が
選択される。
As described above, when a plurality of next candidates are obtained, the user selects a desired one from among them. The result of performing this selection processing is a Japanese candidate learning result reflecting unit 54 and an English word candidate learning result reflecting unit 55
In each, it is reflected. For example, English word candidates with different notations (full-width / half-width, uppercase / lowercase, alphabet /
For katakana, an optimal notation is selected according to the immediately preceding learning information.

【0052】この処理を実現するために、辞書44内の
情報には、図8に示すような定義が行われている。
In order to realize this processing, information in the dictionary 44 is defined as shown in FIG.

【0053】例えば、systemという語に対しては、読み
としては英語(アルファベット文字(system))と日本語
(ひらがな(しすてむ))の2種類が登録されており、
変換後候補は、図9に示すようなフォーマットで規定さ
れる。
For example, for the word “system”, two kinds of readings, English (alphabetic characters (system)) and Japanese (hiragana (shisutemu)), are registered.
The converted candidates are defined in a format as shown in FIG.

【0054】¥eは、特殊候補であることを示すフラグ
であり、その次には、英語(アルファベット)の候補が
配置され、その次には、¥で示される候補区切りフラグ
が配置され、その次に、日本語(カタカナ)候補が配置
される。
$ E is a flag indicating that the candidate is a special candidate. Next, English (alphabet) candidates are arranged, and then a candidate delimiter flag indicated by @ is arranged. Next, Japanese (Katakana) candidates are arranged.

【0055】さらに、品詞としては、「英単語」という
特殊品詞(文法上は名詞と同等)が採用されている。
Further, a special part of speech "English word" (grammatically equivalent to a noun) is adopted as the part of speech.

【0056】図8に示すように、「system」と入力した
後、変換操作を行うと、「しすてむ」と入力した後、変
換操作を行った場合と、同一の変換後候補が得られる。
英単語次候補処理部52と日本語次候補処理部50は、
変換後の候補の英語の候補または日本語の候補に対し
て、全角と半角をコンバートしたり、小文字と大文字を
コンバートすることで、表記の異なる次候補を自動的に
作成する。
As shown in FIG. 8, when a conversion operation is performed after "system" is input, the same post-conversion candidate is obtained as when "shisutemu" is input and the conversion operation is performed. Can be
The next English word candidate processing unit 52 and the next Japanese candidate processing unit 50
By converting full-width and half-width characters, or converting lowercase and uppercase characters to English or Japanese candidates after conversion, the next candidates with different notations are automatically created.

【0057】英単語候補学習結果反映部55と日本語候
補学習結果反映部54は、候補確定時に学習を行う。例
えば、最近の使用、使用頻度などが学習される他、どの
表記で確定されたかを候補毎に学習し、読みの種類(例
えば通常アルファベット、先頭大文字アルファベット、
カタカナなど)に応じて、変換環境全体での学習が行わ
れる。
The English word candidate learning result reflecting unit 55 and the Japanese candidate learning result reflecting unit 54 perform learning when a candidate is determined. For example, in addition to learning the recent use, the frequency of use, etc., it also learns which notation has been confirmed for each candidate, and determines the type of reading (for example, normal alphabet, initial capital letter,
Learning in the entire conversion environment is performed according to katakana.

【0058】そして、学習が行われると、それ以降の変
換時に、次の優先順位により、どの表記を終了するかが
決定される。 (1) その候補での学習情報 (2) その読みの種類に対応した環境全体での学習情
報 (3) その読みの種類に対応したデフォルト設定情報
Then, when learning is performed, at the time of subsequent conversion, which notation is to be ended is determined based on the next priority. (1) Learning information for the candidate (2) Learning information for the entire environment corresponding to the type of reading (3) Default setting information corresponding to the type of reading

【0059】従って、例えば、「system」と入力し、
「system」が前回選択されたときは、次回も、「syste
m」が第1の候補とされる。「System」と入力し、「Sys
tem」が前回選択されたときは、同様に、「System」が
第1の候補とされる。「system」と入力し、「システ
ム」が前回選択されたときも、次回は「システム」が第
1の候補とされる。
Therefore, for example, if "system" is input,
When “system” was selected last time, next time “syste
m ”is the first candidate. Type "System" and enter "Sys
When “tem” was previously selected, “System” is similarly the first candidate. When “system” is input and “system” is selected last time, “system” is the first candidate next time.

【0060】そして、学習は、環境全体で行われるの
で、例えば、e−mail作成時における学習と、ワー
ドプロセッサ機能を利用した文章作成時の学習は、個別
に行われ、それぞれにおける学習が優先され、次に、他
の機能実行時の学習が参照される。
Since the learning is performed in the entire environment, for example, the learning at the time of creating an e-mail and the learning at the time of writing a sentence using a word processor function are performed individually, and the learning in each of them is given priority. Next, learning at the time of executing another function is referred to.

【0061】なお、上記実施の形態においては、外国語
として英語を例として説明したが、この他、フランス
語、イタリア語、その他の外国が、日本語と混在する場
合にも、本発明は適用することが可能である。
In the above embodiment, English has been described as an example of a foreign language. However, the present invention is also applicable to a case where French, Italian, and other foreign languages are mixed with Japanese. It is possible.

【0062】また、上記した実施の形態においては、上
記した処理を実行するプログラムをROM2またはハー
ドディスクドライブ5に予め記憶させるようにしたが、
フロッピーディスク、CD−ROMディスクなどの記録
媒体にプログラムを記録しておき、これらの記録媒体を
ユーザに配布し、ハードディスクやRAMにインストー
ルさせるようにしてもよい。さらにインターネット、そ
の他のネットワークを介してプログラムを伝送して、ハ
ードディスクやRAMにインストールさせるようにして
もよい。
In the above-described embodiment, the program for executing the above-described processing is stored in the ROM 2 or the hard disk drive 5 in advance.
The program may be recorded on a recording medium such as a floppy disk or a CD-ROM disk, and the recording medium may be distributed to users and installed on a hard disk or a RAM. Further, the program may be transmitted via the Internet or another network and installed on a hard disk or a RAM.

【0063】[0063]

【発明の効果】以上の如く、請求項1に記載のかな漢字
変換装置、請求項5に記載のかな漢字変換方法、および
請求項9に記載のコンピュータ読み取り可能な記録媒体
によれば、日本語としての解析結果だけでなく、外国語
としての文字列を含む解析結果も得るようにし、両者の
区切り位置までの文字列を、所定の選択条件に基づいて
比較し、その比較結果に対応して、両者のうちのいずれ
か一方を選択するようにしたので、日本語と外国語が混
在する文章を、迅速かつ正確に、作成することが可能と
なる。
As described above, according to the kana-kanji conversion device of claim 1, the kana-kanji conversion method of claim 5, and the computer-readable recording medium of claim 9, In addition to analysis results in Japanese, analysis results including character strings as foreign languages are also obtained, and character strings up to the delimitation position of both are compared based on predetermined selection conditions, and corresponding to the comparison results Then, one of the two is selected, so that a sentence in which Japanese and foreign languages are mixed can be quickly and accurately created.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明のかな漢字変換装置の構成例を示すブロ
ック図である。
FIG. 1 is a block diagram illustrating a configuration example of a kana-kanji conversion device of the present invention.

【図2】図1の実施の形態におけるプログラムの構成を
説明する図である。
FIG. 2 is a diagram illustrating a configuration of a program according to the embodiment of FIG. 1;

【図3】図1の実施の形態におけるより詳細なプログラ
ムの構成を説明する図である。
FIG. 3 is a diagram for explaining a more detailed configuration of a program in the embodiment of FIG. 1;

【図4】図3のプログラムの構成の処理を説明するフロ
ーチャートである。
FIG. 4 is a flowchart illustrating processing of the configuration of the program in FIG. 3;

【図5】図4のステップS4の英単語読み抽出処理のよ
り詳細な処理を説明するフローチャートである。
FIG. 5 is a flowchart illustrating a more detailed process of the English word reading extraction process in step S4 of FIG. 4;

【図6】図3の日英混在全候補解析部の処理を説明する
フローチャートである。
FIG. 6 is a flowchart illustrating a process of a Japanese-English mixed all candidate analysis unit in FIG. 3;

【図7】同音異義語の構成を説明する図である。FIG. 7 is a diagram illustrating the configuration of a homonym.

【図8】辞書内の情報の定義を説明する図である。FIG. 8 is a diagram illustrating the definition of information in a dictionary.

【図9】変換後候補の特殊フォーマットを説明する図で
ある。
FIG. 9 is a diagram illustrating a special format of a candidate after conversion.

【符号の説明】[Explanation of symbols]

21 ユーザ入出力部 22 連文節解析処理部 23 次候補解析処理部 24 辞書検索処理部 25 辞書 41 入力部 42 出力部 43 辞書検索処理部 44 辞書 45 日英混在連文節解析部 46 日本語連文節解析部 47 英語連文節解析部 48 日英混在全候補解析部 49 ローマ字かな変換部 50 日本語次候補処理部 51 英単語読み抽出部 52 英単語次候補処理部 53 同音異義語評価ソート部 54 日本語候補学習結果反映部 55 英単語候補学習結果反映部 Reference Signs List 21 User input / output unit 22 Continuous phrase analysis processing unit 23 Next candidate analysis processing unit 24 Dictionary search processing unit 25 Dictionary 41 Input unit 42 Output unit 43 Dictionary search processing unit 44 Dictionary 45 Japanese-English mixed continuous phrase analysis unit 46 Japanese consecutive phrase analysis unit 47 English phrase and phrase analysis unit 48 Japanese-English mixed candidate analysis unit 49 Romaji kana conversion unit 50 Japanese next candidate processing unit 51 English word reading and extraction unit 52 English word next candidate processing unit 53 Homonymic synonym evaluation sort unit 54 Japanese candidate learning result Reflection unit 55 English word candidate learning result reflection unit

フロントページの続き (56)参考文献 特開 平5−282360(JP,A) 特開 昭63−316162(JP,A) 特開 昭64−53265(JP,A) 特開 平4−75162(JP,A) 特開 平8−106461(JP,A) 特開 昭64−18872(JP,A) 特開 平8−212216(JP,A) 特開 平5−342192(JP,A) 特開 昭60−20234(JP,A) (58)調査した分野(Int.Cl.6,DB名) G06F 17/21 G06F 17/22Continuation of front page (56) References JP-A-5-282360 (JP, A) JP-A-63-316162 (JP, A) JP-A-64-53265 (JP, A) JP-A-4-75162 (JP, A) JP-A 8-106461 (JP, A) JP-A 64-18872 (JP, A) JP-A 8-212216 (JP, A) JP-A 5-342192 (JP, A) 60-20234 (JP, A) (58) Fields investigated (Int. Cl. 6 , DB name) G06F 17/21 G06F 17/22

Claims (12)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 変換する文字列を受け取る受け取り手段
と、 前記受け取り手段により受け取られた文字列を、日本語
として連文節解析する第1の解析手段と、 前記受け取り手段により受け取られた文字列から外国語
に対応する文字列を抽出する抽出手段と、 前記受け取り手段により受け取られた文字列のうち、前
記抽出手段により外国語として抽出されなかった部分
を、日本語として連文節解析する第2の解析手段と、 前記第1の解析手段の解析結果と前記第2の解析手段の
解析結果を、端部に向かって解析を進め、その文節の区
切りが最初に一致する位置を区切り位置として検出する
検出手段と、 前記第1の解析手段の解析結果の、前記検出手段により
検出された区切り位置までの未決定の文字列と、前記第
2の解析手段の解析結果の、前記検出手段により検出さ
れた区切り位置までの未決定の文字列を、所定の選択条
件に基づいて比較し、その比較結果に対応して、前記検
出手段により検出された区切り位置までの未決定の文字
列の解析結果として、前記第1の解析手段の解析結果と
前記第2の解析手段の解析結果の一方を選択する選択手
段とを備えることを特徴とするかな漢字変換装置。
A receiving means for receiving a character string to be converted; a first analyzing means for performing continuous phrase analysis on the character string received by the receiving means as Japanese; and a foreign language from the character string received by the receiving means. Extracting means for extracting a character string corresponding to a word; and second analyzing means for analyzing a portion of the character string received by the receiving means, which is not extracted as a foreign language by the extracting means, as a continuous phrase analysis in Japanese Detecting means for analyzing the analysis result of the first analysis means and the analysis result of the second analysis means toward an end, and detecting a position where a segment break of the phrase first matches as a break position; An undetermined character string of the analysis result of the first analysis means up to the break position detected by the detection means, and an analysis result of the second analysis means. The undetermined character string up to the break position detected by the detection means is compared based on a predetermined selection condition, and the undetermined character string up to the break position detected by the detection means is compared with the comparison result. A kana-kanji conversion device comprising: a selection unit that selects one of an analysis result of the first analysis unit and an analysis result of the second analysis unit as an analysis result of a character string.
【請求項2】 前記選択手段は、文節数の少ない方を最
初の前記選択条件とし、直前に使用した候補が含まれて
いる方を次の前記選択条件とし、前記第1の解析手段の
解析結果の方をさらにその次の前記選択条件として、前
記選択を行うことを特徴とする請求項1に記載のかな漢
字変換装置。
2. The method according to claim 1, wherein the selecting means selects the one having the smaller number of phrases.
As the first selection condition, the candidate used immediately before is included
Is used as the next selection condition, and the first analysis means
The analysis result is used as the next selection condition.
2. The kana-kanji conversion device according to claim 1, wherein the selection is performed .
【請求項3】 前記抽出手段により抽出された外国語に
対応する文字列の、少なくとも、大文字と小文字、全角
文字と半角文字、または先頭だけが大文字でその後は小
文字である文字列と先頭もその後も小文字である文字列
を、次候補として処理する処理手段をさらに備えること
を特徴とする請求項1または2に記載のかな漢字変換装
置。
3. The foreign language extracted by the extracting means.
At least uppercase and lowercase letters, full-width characters of the corresponding string
Letters and single-byte characters, or only capital letters and small letters thereafter
A string that is a character and a string that starts and ends with a lowercase letter
3. The kana-kanji conversion device according to claim 1 or 2, further comprising a processing unit for processing as a next candidate .
【請求項4】 使用者が最終的に選択した表記を学習
し、次回の処理に反映させる学習手段をさらに備える
とを特徴とする請求項1、2または3に記載のかな漢字
変換装置。
4. Learning the notation finally selected by the user
The kana-kanji conversion device according to claim 1, 2, or 3, further comprising a learning means for reflecting the result in a next process .
【請求項5】 入力された文字列を変換するかな漢字変
換装置におけるかな漢字変換方法において、 変換する文字列を受け取る受け取りステップと、 前記受け取りステップで受け取られた文字列を、日本語
として連文節解析する第1の解析ステップと、 前記受け取りステップで受け取られた文字列から外国語
に対応する文字列を抽出する抽出ステップと、 前記受け取りステップで受け取られた文字列のうち、前
記抽出ステップで外国語として抽出されなかった部分
を、日本語として連文節解析する第2の解析ステップ
と、 前記第1の解析ステップの解析結果と前記第2の解析ス
テップの解析結果を、端部に向かって解析を進め、その
文節の区切りが最初に一致する位置を区切り位置として
検出する検出ステップと、 前記第1の解析ステップでの解析結果の、前記検出ステ
ップで検出された区切り位置までの未決定の文字列と、
前記第2の解析ステップでの解析結果の、前記検出ステ
ップで検出された区切り位置までの未決定の文字列を、
所定の選択条件に基づいて比較し、その比較結果に対応
して、前記検出ステップで検出された区切り位置までの
未決定の文字列の解析結果として、前記第1の解析ステ
ップでの解析結果と前記第2の解析ステップでの解析結
果の一方を選択する選択ステップと を含む ことを特徴と
するかな漢字変換方法。
5. A kana-kanji conversion for converting an input character string.
In the kana-kanji conversion method in the conversion device, a receiving step of receiving a character string to be converted , and converting the character string received in the receiving step into Japanese
A first parsing step of parsing a phrase as a sequence, and a foreign language from the character string received in the receiving step.
Extracting a character string corresponding to the character string, and among the character strings received in the receiving step,
Part not extracted as a foreign language in the extraction step
Second parsing step for analyzing multiple phrases in Japanese
And the analysis result of the first analysis step and the second analysis step.
Analyze the analysis results of the step toward the end,
The position where the break of the clause first matches as the break position
A detecting step of detecting, and the detecting step of the analysis result in the first analyzing step.
Undetermined character string up to the break position detected in the
Detecting the analysis result in the second analysis step;
The undetermined character string up to the break position detected in the
Comparing based on predetermined selection conditions and corresponding to the comparison result
To the break position detected in the detection step.
As the analysis result of the undetermined character string, the first analysis step
Analysis results in the second analysis step and the analysis results in the second analysis step.
Kana-Kanji conversion method characterized by comprising a selection step of selecting one of the fruit.
【請求項6】 前記選択ステップでは、文節数の少ない
方を最初の前記選択条件とし、直前に使用した候補が含
まれている方を次の前記選択条件とし、前記第1の解析
ステップでの解析結果の方をさらにその次の前記選択条
件として、前記選択を行うことを特徴とする請求項5に
記載のかな漢字変換方法。
6. In the selecting step, the number of phrases is small.
Is the first selection condition, and the candidate used immediately before is included.
The first analysis is defined as the next selection condition.
The analysis result in the step is further
The kana-kanji conversion method according to claim 5 , wherein the selection is performed as a matter .
【請求項7】 前記抽出ステップで抽出された外国語に
対応する文字列の、少なくとも、大文字と小文字、全角
文字と半角文字、または先頭だけが大文字でその後は小
文字である文字列と先頭もその後も小文字である文字列
を、次候補として処理する処理ステップをさらに含む
とを特徴とする請求項5または6に記載のかな漢字変換
方法。
7. The foreign language extracted in the extracting step
At least uppercase and lowercase letters, full-width characters of the corresponding string
Letters and single-byte characters, or only capital letters and small letters thereafter
A string that is a character and a string that starts and ends with a lowercase letter
7. The kana-kanji conversion method according to claim 5 , further comprising a processing step of processing as a next candidate .
【請求項8】 使用者が最終的に選択した表記を学習
し、次回の処理に反映させる学習ステップをさらに含む
ことを特徴とする請求項5、6または7に記載のかな漢
字変換方法。
8. Learning the notation finally selected by the user
The kana-kanji conversion method according to claim 5, 6 or 7, further comprising a learning step for reflecting the result in a next process.
【請求項9】 入力された文字列を変換するかな漢字変
換装置に、 変換する文字列を受け取る受け取りステップと、 前記受け取りステップで受け取られた文字列を、日本語
として連文節解析する第1の解析ステップと、 前記受け取りステップで受け取られた文字列から外国語
に対応する文字列を抽出する抽出ステップと、 前記受け取りステップで受け取られた文字列のうち、前
記抽出ステップで外国語として抽出されなかった部分
を、日本語として連文節解析する第2の解析ステップ
と、 前記第1の解析ステップの解析結果と前記第2の解析ス
テップの解析結果を、端部に向かって解析を進め、その
文節の区切りが最初に一致する位置を区切り位置として
検出する検出ステップと、 前記第1の解析ステップでの解析結果の、前記検出ステ
ップで検出された区切り位置までの未決定の文字列と、
前記第2の解析ステップでの解析結果の、前記検出ステ
ップで検出された区切り位置までの未決定の文字列を、
所定の選択条件に基づいて比較し、その比較結果に対応
して、前記検出ステップで検出された区切り位置までの
未決定の文字列の解析結果として、前記第1の解析ステ
ップでの解析結果と前記第2の解析ステップでの解析結
果の一方を選択する選択ステップを 実行させるためのプ
ログラムを記録したことを特徴とするコンピュータ読み
取り可能な記録媒体
9. A kana-kanji conversion for converting an input character string.
A receiving step of receiving a character string to be converted , and converting the character string received in the receiving step into Japanese
A first parsing step of parsing a phrase as a sequence, and a foreign language from the character string received in the receiving step.
Extracting a character string corresponding to the character string, and among the character strings received in the receiving step,
Part not extracted as a foreign language in the extraction step
Second parsing step for analyzing multiple phrases in Japanese
And the analysis result of the first analysis step and the second analysis step.
Analyze the analysis results of the step toward the end,
The position where the break of the clause first matches as the break position
A detecting step of detecting, and the detecting step of the analysis result in the first analyzing step.
Undetermined character string up to the break position detected in the
Detecting the analysis result in the second analysis step;
The undetermined character string up to the break position detected in the
Comparing based on predetermined selection conditions and corresponding to the comparison result
To the break position detected in the detection step.
As the analysis result of the undetermined character string, the first analysis step
Analysis results in the second analysis step and the analysis results in the second analysis step.
To perform a selection step to select one of the results.
Computer reading characterized by recording the program
A removable recording medium .
【請求項10】 前記選択ステップでは、文節数の少な
い方を最初の前記選択条件とし、直前に使用した候補が
含まれている方を次の前記選択条件とし、前記第1の解
析ステップでの解析結果の方をさらにその次の前記選択
条件として、前記選択を行うことを特徴とする請求項9
に記載の記録媒体。
10. In the selecting step, the number of phrases is small.
Is the first selection condition, and the candidate used immediately before
The included condition is used as the next selection condition, and the first solution
Analysis result in the analysis step is further selected
10. The method according to claim 9 , wherein the selection is performed as a condition.
A recording medium according to claim 1.
【請求項11】 前記抽出ステップで抽出された外国語
に対応する文字列の、少なくとも、大文字と小文字、全
角文字と半角文字、または先頭だけが大文字でその後は
小文字である文字列と先頭もその後も小文字である文字
列を、次候補として処理する処理ステップをさらに実行
させるためのプログラムを記録したことを特徴とする請
求項9または10に記載の記録媒体。
11. The foreign language extracted in the extraction step
, At least uppercase and lowercase, all
Square and half-width characters, or only the first letter is uppercase and
Strings that are lowercase and characters that start and end with lowercase
Perform further processing steps to process the column as the next candidate
The recording medium according to claim 9, wherein a program for causing the recording medium to be recorded is recorded.
【請求項12】 使用者が最終的に選択した表記を学習
し、次回の処理に反映させる学習ステップをさらに実行
させるためのプログラムを記録したことを特徴とする請
求項9、10または11に記載の記録媒体。
12. Learning the notation finally selected by the user
And further execute the learning step to be reflected in the next processing
12. The recording medium according to claim 9, wherein a program for causing the recording medium to be recorded is recorded.
JP9108420A 1996-12-19 1997-04-25 Kana-kanji conversion device and method, and recording medium Expired - Lifetime JP2806452B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9108420A JP2806452B2 (en) 1996-12-19 1997-04-25 Kana-kanji conversion device and method, and recording medium

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP33920596 1996-12-19
JP8-339205 1996-12-19
JP9108420A JP2806452B2 (en) 1996-12-19 1997-04-25 Kana-kanji conversion device and method, and recording medium

Publications (2)

Publication Number Publication Date
JPH10232863A JPH10232863A (en) 1998-09-02
JP2806452B2 true JP2806452B2 (en) 1998-09-30

Family

ID=26448298

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9108420A Expired - Lifetime JP2806452B2 (en) 1996-12-19 1997-04-25 Kana-kanji conversion device and method, and recording medium

Country Status (1)

Country Link
JP (1) JP2806452B2 (en)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6848080B1 (en) * 1999-11-05 2005-01-25 Microsoft Corporation Language input architecture for converting one text form to another text form with tolerance to spelling, typographical, and conversion errors
US7165019B1 (en) * 1999-11-05 2007-01-16 Microsoft Corporation Language input architecture for converting one text form to another text form with modeless entry
US7403888B1 (en) * 1999-11-05 2008-07-22 Microsoft Corporation Language input user interface
EP1411442A4 (en) * 2001-06-11 2010-03-03 Hiroshi Ishikura System for assisting input of text through automatic generation of space
JP4787803B2 (en) * 2007-08-31 2011-10-05 株式会社リコー Information processing apparatus, information processing method, and program
WO2011150730A1 (en) * 2010-05-31 2011-12-08 百度在线网络技术(北京)有限公司 Method and device for mixed input in english and another kind of language
CN103885608A (en) * 2014-03-19 2014-06-25 百度在线网络技术(北京)有限公司 Input method and system

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63316162A (en) * 1987-06-18 1988-12-23 Brother Ind Ltd Document preparing device
JPS6418872A (en) * 1987-07-13 1989-01-23 Ricoh Kk Input processing method for roman character with word processor
JPS6453265A (en) * 1987-08-24 1989-03-01 Nec Corp Roman character and chinese character conversion device
JPH0475162A (en) * 1990-07-18 1992-03-10 Toshiba Corp Japanese syllabary/chinese character conversion device
JPH05282360A (en) * 1992-03-31 1993-10-29 Hitachi Ltd Multi-language input device
JPH08106461A (en) * 1994-10-03 1996-04-23 Just Syst Corp Method and device for document processing
JPH08212216A (en) * 1995-02-08 1996-08-20 Toshiba Corp Natural language processor and natural language processing method

Also Published As

Publication number Publication date
JPH10232863A (en) 1998-09-02

Similar Documents

Publication Publication Date Title
US4777600A (en) Phonetic data-to-kanji character converter with a syntax analyzer to alter priority order of displayed kanji homonyms
KR100912753B1 (en) Handwriting and voice input with automatic correction
EP0370774A2 (en) Machine translation system
JP2806452B2 (en) Kana-kanji conversion device and method, and recording medium
EP2031490A2 (en) Electronic dictionary, search method for and electronic dictionary, and search program for an alectronic dictionary
JP4886244B2 (en) Machine translation apparatus and machine translation program
JPH11212967A (en) Prediction input device/method
JP3952964B2 (en) Reading information determination method, apparatus and program
JPH10240739A (en) Device for retrieving information and method therefor
JP3377942B2 (en) Electronic dictionary search device and computer-readable storage medium storing electronic dictionary search device control program
KR0165591B1 (en) Hangul english automatic translation method
JP3814000B2 (en) Character string conversion apparatus and character string conversion method
KR0123403B1 (en) Hangul english automatic translation method
Kawada Inputting Japanese from the keyboard
JPH08272780A (en) Processor and method for chinese input processing, and processor and method for language processing
JPH0531186B2 (en)
JP2000148747A (en) Conversion candidate display method, record medium for program for japanese syllabary-to-chinese character conversion by same method, and japanese syllbary-to- chinese character conversion device
JPH0683807A (en) Document preparing device
JPH08241315A (en) Word registering mechanism for document processor
JP3204517B2 (en) Unknown word recognition method
JPH0546612A (en) Sentence error detector
Bol'shakov Automatic error correction in inflected languages
JPH0785057A (en) Syntax analyzing method and device therefor
JPH0683809A (en) Document processor
JPH08106460A (en) Automatic correcting device for input error

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19980625

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080724

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080724

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090724

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090724

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100724

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110724

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110724

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120724

Year of fee payment: 14

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130724

Year of fee payment: 15

EXPY Cancellation because of completion of term