JPH0563831B2 - - Google Patents

Info

Publication number
JPH0563831B2
JPH0563831B2 JP59090250A JP9025084A JPH0563831B2 JP H0563831 B2 JPH0563831 B2 JP H0563831B2 JP 59090250 A JP59090250 A JP 59090250A JP 9025084 A JP9025084 A JP 9025084A JP H0563831 B2 JPH0563831 B2 JP H0563831B2
Authority
JP
Japan
Prior art keywords
confirmation information
phrase
research
kana
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP59090250A
Other languages
Japanese (ja)
Other versions
JPS60235271A (en
Inventor
Kimito Takeda
Hiromi Saito
Tsutomu Kawada
Shigemi Nakazato
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Shibaura Electric Co Ltd filed Critical Tokyo Shibaura Electric Co Ltd
Priority to JP59090250A priority Critical patent/JPS60235271A/en
Publication of JPS60235271A publication Critical patent/JPS60235271A/en
Publication of JPH0563831B2 publication Critical patent/JPH0563831B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は例えば文単位として入力されるような
長さの長い連続仮名文字系列を適宜文節単位に区
切りながら仮名漢字変換を行つて漢字仮名混じり
の日本語文章を効果的に作成することのできる仮
名漢字変換装置に関する。
[Detailed Description of the Invention] [Technical Field of the Invention] The present invention converts a long sequence of continuous kana characters, such as those input as a sentence unit, into phrases while converting them into kana-kanji characters. This invention relates to a kana-kanji conversion device that can effectively create Japanese sentences.

〔発明の技術的背景とその問題点〕[Technical background of the invention and its problems]

従来の日本語ワードプロセツサ等における仮名
漢字入力の単位は、一般に単一文節に限られてお
り、また名詞の複合語の入力においても高々数単
位程度に限定されているものが殆んどである。従
つて、この種の装置を用いて日本語文章を入力作
成する場合、単語あるいは文節の単位を常に意識
しなければならず、オペレータにとつて大きな負
担となつた。そこで最近では文章入力の単位を制
限することなく、文単位の読み仮名列、所謂ベタ
文を入力し、このベタ文に対して仮名漢字変換処
理を行う研究が種々試みられている。それらは具
体的には、例えば文節解析処理を再帰的に行うこ
とでその目的を達成している。然し乍ら、この為
には相当長い処理時間を必要とし、またバツフア
メモリを大量に消費せざるを得ないという問題が
あつた。また処理時間およびメモリ量を制限して
文節解析処理のアルゴリズムを簡素化することが
考えられているが、その変換処理精度が劣化する
ことが否めなかつた。しかも、このようにして得
られた変換結果をどのように表示出力すれば、そ
の同音語選択の指示を扱い易くできるかが大きな
課題となつていた。
In conventional Japanese word processors, etc., the unit of Kana-Kanji input is generally limited to a single phrase, and in most cases, the input of compound nouns is also limited to several units at most. be. Therefore, when inputting and creating Japanese sentences using this type of device, the operator must always be aware of the units of words or phrases, which places a heavy burden on the operator. Therefore, recently, various studies have been attempted to input a sequence of pronunciations of kana in sentence units, so-called solid sentences, without restricting the units of text input, and to perform kana-kanji conversion processing on the solid sentences. Specifically, they achieve their purpose by, for example, recursively performing clause analysis processing. However, this requires a considerably long processing time and requires a large amount of buffer memory, which is a problem. Furthermore, although it has been considered to simplify the algorithm for phrase analysis processing by limiting the processing time and memory amount, it cannot be denied that the accuracy of the conversion processing deteriorates. In addition, a major issue has been how to display and output the conversion results obtained in this manner so that instructions for selecting homophones can be easily handled.

例えば、「ざんだかをもとめる」なる文字列を
仮名入力した場合、「ざんだかを/もとめる」と
機械的に文節分割ができることが予想されるが、
あるいは「ざんだかをも/とめる」という分割形
式も文法的にありうる。この場合、一般に経験的
にみて所謂最長一致するものが確からしいと考え
られるが、このような経験則だけに基いて、常に
入力文字列の前方から文節解析処理を行い、例え
ば「残高をも/止める」だけを抽出したのではそ
の変換精度が著しく悪くなる。従つて、結局「残
高をも/止める」、及び「残高を/求める」等の
複数の変換候補を抽出し、その選択をオペレータ
の判断に委ねることが必要となる。
For example, if you enter the character string ``Zandaka wo motoru'' in kana, it is expected that it will be able to be mechanically divided into clauses as ``Zandaka wo / motoru''.
Alternatively, the division form ``Zandaka wo mo/stop'' is also grammatically possible. In this case, it is generally considered empirically that the so-called longest match is most likely, but based only on such empirical rules, clause analysis is always performed starting from the beginning of the input character string, for example, If only "stop" is extracted, the conversion accuracy will be significantly degraded. Therefore, it becomes necessary to extract a plurality of conversion candidates such as "also/stop balance" and "to/calculate balance" and leave the selection to the operator's discretion.

また、「けいさんしき」という入力に対しても、
もし装置内の辞書に「計算式」という単語が登録
されていないとすると、結果は同様にして「計
算/式」、「計算し/木」と云うように複数の変換
結果が生じる。更には「毛/遺産/式」のような
変換結果も生じる。更には仮に「るけい=“流
刑”」という単語が辞書登録されているとすれば、
「残高を/求め/流刑/算式」という候補も出現
する。
Also, for the input "Keisanshiki",
If the word "calculation formula" is not registered in the dictionary within the device, a plurality of conversion results will similarly occur, such as "calculation/formula" and "calculation/tree." Furthermore, conversion results such as "hair/heritage/formula" are also generated. Furthermore, if the word ``rukei'' is registered in the dictionary,
The following candidates also appear: ``To find the balance/exile/formula.''

ところで、このような入力に対する多様な変換
結果の中で、最も確からしいものを第1順位に出
力するための評価処理として、例えば、全体を構
成する文節数あるいは単語数の少ない順に優先度
を決定する方法が考えれている。具体的には、例
えば「こうがくしよとく」の入力に対して、「高
額/所得」を「項が/句/所得」や「項が/区処
と/句」より確からしいと判定するものである。
尚、この場合、同音語については使用頻度の大な
る単語か優先して出力するのが自然であり、好ま
しい。しかし、全体を構成する文節数が同じであ
つてもその区切り方が異なる場合もあり、また変
換漏れを少なくするために構成数の多い解析結果
をも含めて出力する場合には、その取扱うデータ
構造が複雑になる。しかもオペレータがより選択
操作を行い易くする為に、それらの複数の変換結
果をどのように表示出力するかが問題となる。こ
の問題を解択するために例えば、複数の単語を辞
書登録した辞書検索部を用いて一連の入力文字例
からその文節単位の系列を抽出し、これらの各文
節をその文節の読みに対応する仮名漢字混じり表
記にそれぞれ変換して出力するに際し、前記入力
文字列に対する複数の文節系列の相互に異なる区
切り位置の中で最も前方にある文節始点を基準点
とし、この基準点以降に存在する次の文節の自立
語部分と前記基準点で区切られた前文節の付属語
部分とを変換候補の単位として仮名漢字変換を行
い、その変換候補を順に表示出力する手法が考慮
されている。
By the way, as an evaluation process for outputting the most probable one in the first order among various conversion results for such an input, for example, priority is determined in order of the number of clauses or words that make up the whole. I have thought of a way to do that. Specifically, for example, in response to the input of "Kogakushi Yotoku", "high amount/income" is determined to be more likely than "term ga/phrase/income" or "term ga/kukoto/phrase". It is.
In this case, it is natural and preferable to output homophones with priority given to words that are used more frequently. However, even if the number of phrases that make up the whole phrase is the same, the way they are separated may be different, and when outputting analysis results that include a large number of phrases to reduce conversion omissions, the data to be handled is The structure becomes complicated. Moreover, the problem is how to display and output the plurality of conversion results in order to make it easier for the operator to perform selection operations. To solve this problem, for example, a dictionary search unit with multiple words registered in the dictionary can be used to extract a series of clause units from a series of input character examples, and each of these clauses can be associated with the pronunciation of that clause. When converting to kana-kanji mixed notation and outputting, the forwardmost bunsetsu start point among the mutually different break positions of the plural bunsetsu series for the input character string is used as a reference point, and the next clause that exists after this reference point is A method has been considered in which kana-kanji conversion is performed using the independent word part of the clause and the dependent word part of the previous clause separated by the reference point as units of conversion candidates, and the conversion candidates are displayed and output in order.

例えば上述した例の「ざんだかをもとめるけい
さんしき」という入力に対して、「残高をも/止
める」や「残高を/求める」のように文節系列の
候補を作成し、その変換候補結果を「〔残高〕を
〔も止〕める」、「〔残高〕を〔求〕める」等のよう
に求め、これを順に表示出力するので、同音次候
補の選択処理を非常に簡単化することができる。
即ち、例えば、前記〔も止〕の部分については、
実際上「も止」という単語は存在しないが、その
読み仮名である「もと」の部分に他の同音単語情
報や別表記語が存在している。つまり同じ読みに
対応する他の候補が存在することが示され、文節
内の同音語の選択と同様に同音語次候補の切り換
え指示により、異構造文節列の選択が可能とな
る。
For example, in the above example, for the input ``Keisanshiki to find Zandaka'', create phrase series candidates such as ``Also/stop the balance'' or ``Determine the balance'', and convert the conversion candidate result. It asks for things like "[stop] [balance]", "[requires] [balance]", etc., and displays and outputs these in order, which greatly simplifies the process of selecting the next candidate with the same sound. be able to.
That is, for example, regarding the above part,
Although the word ``Modome'' does not actually exist, there are other homophone word information and other written words in the pronunciation of ``Moto''. In other words, it is shown that there are other candidates corresponding to the same pronunciation, and similarly to the selection of homophones within a bunsetsu, the selection of a differently structured bunsetsu string becomes possible by instructing the switching of the next homophone candidate.

しかしながら、異構造文節列が自立語1つから
なる場合は、選択操作は簡易であるが、複数の自
立語が組合わさつてなりたつ場合は、多くの同音
語が出力されることとなる。例えば、 「研究や開発の活動の様子を今日的な視点から
考えてみると、研究成果の記録と公表に関する努
力が不足していたとする執筆者の方々の反省の意
見は」を、ベタ文で入力すると、 {研究や/開発、研究/夜会/発}の{か集う
の/様子、活動のよう/巣、活動のよう/酢、活
動の/様子}を{今日/的、今日/敵、今日/
滴、紺に/知的}な{支店、視点、始点、支点}
から{考、勘が、観が、缶が}えてみると、{研
究/製か、研究/制か、研究/声か、研究/生
か、研究/世か、研究/性か、研究/星か、研
究/成果、研究/盛夏、研究/正価、研究/生
花、研究/製菓、研究/青果、件/急性か、兼/
急性か、券/急性か、剣/急性か、県/急性か、
件/急逝か、兼/急逝か、券/急逝か、剣/急逝
か、県/急逝か、件/旧制か、兼/旧制か、券/
急制か、剣/旧制か、県/旧制か、件/旧姓か、
兼/旧姓か、券/旧姓か、剣/旧姓か、県/旧姓
か、研究せ/意か、研究せ/以下、研究せ/医
科、研究せ/胃か、研究/製/日、研究/制/
日、研究/声/日、研究/生/日、研究/世/
日、研究/星/日、研究/製/課、研究/制/
課、研究/声/課、研究/生/課、研究/世/
課、研究/星/課、研究/製/化、研究/制/
化、研究/声/化、研究/生/化、研究/世/
化、研究/星/化、研究/製/科、研究/制/
科、研究/声/科、研究/生/科、研究/世/
科、研究/星/科、研究/製/家、研究/制/
家、研究/声/家、研究/生/家、研究/世/
家、研究/星/家、研究/製/下、研究/制/
下、研究/声/下、研究/生/下、研究/世/
下、研究/星/下}の記録と{好評、公表、講
評}に{関、冠}する。努力が不足してい{たと
刷、たとす、他とす、田とす}る執筆{車、者、
社、舎}の{旁々、方々、か他形、か田形、か他
型、か田型、か他方、か田方}の反省(のい件
は、の意見は、の違憲は、のい兼は、のい券は、
のい剣は、のい県は、の意見派、の違憲派、の意
見波、の違憲波、のい兼派、のい券派、のい剣
派、のい県派、のい兼波、のい剣波、のい県波、
のい県波} の変換候補が得られる。ここで「けんきゆうせい
かの」の入力文に対して60以上の同音語が発生
し、選択に時間が多くかかり問題が多かつた。
However, if the different structure clause string consists of one independent word, the selection operation is easy, but if it consists of a combination of multiple independent words, many homophones will be output. For example, in a solid sentence, you could write, ``When considering the state of research and development activities from a modern perspective, the authors' remorseful opinion is that there was a lack of effort in recording and publishing research results.'' When input, {research and/development, research/evening party/departure} {gathering/state, activity-like/nest, activity-like/vinegar, activity/state} of {today/target, today/enemy, today/
Drops, dark blue/intellectual {branch, point of view, starting point, fulcrum}
From {thought, intuition, view, can}, {research / production, research / system, research / voice, research / life, research / world, research / sex, research / star , research/results, research/midsummer, research/net price, research/fresh flowers, research/confectionery, research/fruit and vegetables, matter/acute, cum/
Acute, ticket/acute, sword/acute, prefecture/acute,
Case / sudden death, cum / sudden death, ticket / sudden death, sword / sudden death, prefecture / sudden death, case / old system, cum / old system, ticket /
Emergency system, sword/old system, prefecture/old system, case/maiden name,
cum/maiden name, ticket/maiden name, sword/maiden name, prefecture/maiden name, research/meaning, research/below, research/medical, research/stomach, research/made/day, research/ System/
day, research/voice/day, research/life/day, research/world/
day, research/star/day, research/production/section, research/system/
Division, Research/Voice/Division, Research/Student/Division, Research/World/
Division, Research/Star/Division, Research/Production/Cation, Research/System/
transformation, research / voice / transformation, research / life / transformation, research / world /
, research / star / , research / production / department, research / system /
department, research/voice/department, research/student/department, research/world/
department, research / star / department, research / production / home, research / system /
Home, Research/Voice/Home, Research/Life/Home, Research/World/
Home, Research/Star/Home, Research/Made/Bottom, Research/System/
lower, research/voice/lower, research/student/lower, research/world/
{Seki, Crown} for the record of {Research/Star/Bottom} and {favorable reception, publication, comments}. Writing with insufficient effort {to print, tosu, other to, rice} {car, person,
The opinion of the company and the building is that it is unconstitutional. Yes, the ticket is
Noiken, Noi Prefecture, opinion group, unconstitutional faction, opinion wave, unconstitutional wave, Noiken faction, Noiken faction, Noiken faction, Noiken faction, Noikaneha , Noi Kenha, Noi Kenha,
Conversion candidates for ``Noi Prefectural Wave'' are obtained. Here, more than 60 homophones were generated for the input sentence ``Kenki Yuuseikano'', and selection took a lot of time and caused many problems.

〔発明の目的〕[Purpose of the invention]

本発明はこのような事情を考慮してなされたも
ので、その目的とするところは、多数の同音語を
効率よく選択して、文書作成の効率を向上し得る
かな漢字変換装置を提供することにある。
The present invention has been made in consideration of these circumstances, and its purpose is to provide a kana-kanji conversion device that can efficiently select a large number of homophones and improve the efficiency of document creation. be.

〔発明の概要〕[Summary of the invention]

本発明は、同音語の選択に際し、確認された確
認情報を文節単位に記憶するのと合わせて、隣な
り合う文節との組合せ情報も記憶し、この記憶さ
れた確認情報を含む変換候補が出現したとき、優
先して出力するようにしたものである。
When selecting homophones, the present invention not only stores confirmed confirmation information for each phrase, but also stores combination information with adjacent phrases, and a conversion candidate that includes this stored confirmation information appears. When this happens, priority is given to output.

〔発明の効果〕〔Effect of the invention〕

かくして本発明によれば、例えば上述した例の
「けんきゆうせいか」の入力に対して、「研究/成
果」を選択すると、次に同じ入力があつた場合、
「研究/製か」より「研究/成果」は優先して出
力され、確認のみ行えばよい。即ち、例えば、前
記「研究/成果」を選択することにより、文節単
位の確認情報として、「研究」と「成果」が記憶
され、合せてとなり合う組合せ情報として、「研
究−成果」が記憶されて、優先出力の対象とな
る。上述の例文全てを選択すると以下の組合せ情
報が記憶される。
Thus, according to the present invention, if "research/results" is selected in response to the input of "kenkiyuuseika" in the above example, the next time the same input is received,
"Research/Results" is output with priority over "Research/Production" and only needs to be confirmed. That is, for example, by selecting the above-mentioned "research/results", "research" and "results" are stored as confirmation information for each phrase, and "research-results" is stored as adjacent combination information. and is subject to priority output. When all of the above example sentences are selected, the following combination information is stored.

研究−開発 t0 研究−成果 t0 開発−活動 t1 成果−記録 t3 活動−様子 t0 記録−公表 t2 様子−今日 t1 公表−関する t1 今日−的 t0 関する−努力 t3 的 −視点 t1 努力−不足 × 視点−考 t1 執筆−者 t2 者 −方々 t1 反省−意見 t2 方々−反省 t3 意見− 上記例における組合せ情報の後に記してあるt0
〜t3は記憶するタイミングを示してある。隣なり
合う文節に同音異議語がある場合と、前又は後に
同音異議語がない場合とて、タイミングが相異す
る。
Research-development t0 Research-results t0 Development-activities t1 Results-records t3 Activities-status t0 Records-publication t2 Status-today t1 Announcement-related t1 Today-target t0 Related-effort t3 Target-perspective t1 Effort-deficiency × Perspective- Thoughts t1 Author t2 Author t1 Reflections t2 Reflections t3 Opinions t0 written after the combination information in the above example
~t3 indicates the storage timing. The timing is different depending on whether there is a homophone opposition word in adjacent clauses or when there is no homophone opposition word before or after it.

t0…同音語が選択された時点では合成語となつ
ている。
t0...When the homophone is selected, it is a compound word.

t1… 〃 前の文節が同
音異議語である。
t1… 〃 The previous clause is a homophone antonym.

t2… 〃 前の文節が同
音異議語でない。
t2… 〃 The previous clause is not a homophone antonym.

t3… 〃 後に文節が同
音異議語でない。
t3... 〃 The following clause is not a homophone antonym.

x…隣なり合う文節が同音異議語でない。 x... Adjacent clauses are not homonyms.

ここで、×は、組合せ情報を記憶する必要はな
い。又、文節間にある助詞、助動詞は無視して、
例では示してある。確認情報を記憶するタイミン
グにより、組合せ情報として記憶しなくてもよ
い。
Here, × does not need to store combination information. Also, ignoring particles and auxiliary verbs between clauses,
It is shown in the example. Depending on the timing of storing the confirmation information, it may not be necessary to store it as combination information.

例えば、t0のみ記憶することでも選択効率は高か
くなる。従つて、異構造文節列の中の別の候補を
選択する為の特殊な指示キーを設けることなく、
従来の同音語次候補キーを用いてその選択処理を
効率良く行うことが可能となる等の絶大なる効果
が奏せられる。
For example, storing only t0 also increases selection efficiency. Therefore, there is no need to provide a special instruction key to select another candidate in a string of differently structured phrases.
Great effects such as the ability to efficiently perform selection processing using conventional homophone next candidate keys can be achieved.

〔発明の実施例〕[Embodiments of the invention]

以下、図面を参照して本発明の一実施例装置に
つき説明する。
Hereinafter, an embodiment of the present invention will be described with reference to the drawings.

第1図は実施例装置の概略構成図である。入力
装置1は鍵盤装置や音声認識装置、仮名文字読取
り装置等からなる。この入力装置1を介して入力
される読みを表わす文字列(第1の文字列)は、
例えば仮名文字コードに変換された後、仮名漢字
変換部2に与えられる。尚、上記読みを表わす第
1の文字列は、例えば平仮名、片仮名、ローマ字
等として示されるものである。
FIG. 1 is a schematic configuration diagram of an embodiment device. The input device 1 includes a keyboard device, a voice recognition device, a kana character reading device, and the like. The character string (first character string) representing the reading input via this input device 1 is:
For example, after being converted into a kana character code, it is given to the kana-kanji conversion unit 2. Note that the first character string representing the above-mentioned pronunciation is indicated as, for example, hiragana, katakana, romaji, or the like.

仮名漢字変換部2は、例えばブロツク抽出部2
a、総文節系列抽出部2b、文節抽出部2c、お
よび変換辞書3により構成される。この仮名漢字
変換部2は、前記入力装置1より転送された第1
の文字列に対して、それに該当する漢字混じりの
表示文字列からなる第2の文字列を求め、これを
出力制御部4に与えている。ブロツク抽出部2a
は、上記第1の文字列に対して、特に長さの長い
入力文字列を能率よく解析する為に設けられたも
のであり、予め設定されている数値N、例えばN
=4として、N文節以内の文節系列として対応づ
ける文節解析結果を求めるもので、対応した文節
解析結果がない時には、上記第1の入力文字列を
幾つかのブロツク区間に分割している。そしてこ
のようにして分割した各ブロツクの読み仮名列を
総文節系列抽出部2bに送り、またこの総文節系
列抽出部2bで求められた前記各ブロツクについ
ての仮名漢字変換結果、即ち第2の文字列を順次
出力制御部4に送つている。
The kana-kanji conversion unit 2 is, for example, a block extraction unit 2.
a, a total phrase series extraction section 2b, a phrase extraction section 2c, and a conversion dictionary 3. This kana-kanji conversion unit 2 converts the first
For the character string , a second character string consisting of a corresponding display character string mixed with kanji is obtained, and this is provided to the output control section 4. Block extractor 2a
is provided to efficiently analyze particularly long input character strings for the first character string, and is set to a preset value N, for example, N.
= 4, the phrase analysis result to be associated as a phrase series within N phrases is obtained, and when there is no corresponding phrase analysis result, the first input character string is divided into several block sections. Then, the pronunciation kana strings of each block divided in this way are sent to the total bunsetsu series extraction section 2b, and the kana-kanji conversion results for each block obtained by the total bunsetsu series extraction section 2b, that is, the second character. The columns are sequentially sent to the output control section 4.

上記総文節系列抽出部2bは、文節抽出部2c
を用いて前記第1の文字列を分割可能な文節系列
に分割し、これらの文節系列についてそれぞれ求
められた仮名漢字混り表記の変換結果を上記ブロ
ツク抽出部2aに出力するものである。文節系列
は前記入力文字列の文節分割可能な全ての組合せ
について求められ、例えば優先度の評価によつ
て、その確からしい候補の順に順位付されたの
ち、その第1順位のものから順に出力される。
尚、優先度の評価としては、一般に文節個数が少
ないもののほうが入力目的とする漢字混り文に対
応している傾向が高いことから、例えば文節個数
の少ない文節系列を優先して出力する等して行わ
れる。
The above-mentioned total phrase series extraction section 2b includes a phrase extraction section 2c.
is used to divide the first character string into divisible phrase series, and output the conversion results of kana-kanji mixed notation obtained for each of these phrase series to the block extraction section 2a. The phrase series is obtained for all combinations of the input character string that can be divided into phrases, and after ranking the most likely candidates by, for example, priority evaluation, the phrase series is output in order starting from the first ranked candidate. Ru.
In addition, when evaluating the priority, in general, there is a higher tendency for phrases with a small number of phrases to correspond to sentences containing kanji that are the input target, so for example, phrase sequences with a small number of phrases are given priority for output. will be carried out.

文節抽出部2cは、入力された文字コード列と
変換辞書3に予め登録された文字列(単語)との
間で照合検索を行い、上記第1の文字列に該当す
る漢字混りの表記文字からなる第2の文字列を求
めている。変換辞書3は、例えば第2図にそのメ
モリ構成例を示すように、入力見出し表領域3
a、出力見出し表領域3bおよび品詞領域3cと
を備え、上記入力見出し表領域3aに読みを表わ
す第1の文字列を格納し、またこの第1の文字列
に対応する漢字混じりの表記文字からなる第2の
文字列を上記出力見出し表領域3bに格納したも
のとなつている。そして品詞領域3cには、上記
第1および第2の文字列に対する品詞の情報を格
納している。
The phrase extraction unit 2c performs a collation search between the input character code string and character strings (words) registered in advance in the conversion dictionary 3, and extracts written characters containing kanji that correspond to the first character string. We are looking for a second string of characters. The conversion dictionary 3 has an input heading table area 3, as shown in FIG.
a, an output heading table area 3b and a part of speech area 3c, a first character string representing a reading is stored in the input heading table area 3a, and a first character string representing a reading is stored in the input heading table area 3a; The second character string is stored in the output heading table area 3b. The part of speech area 3c stores part of speech information for the first and second character strings.

しかして文節抽出部2cは、与えられた入力文
字列に対して、例えば公知の前方最長一致法によ
り変換辞書3の入力見出し表領域3aに予め登録
されている文字列(単語)を検索し、その活用語
尾や付属語の解析等を行つて、前記入力文字列の
頭字より最も長く一致した入力文字列部分を支節
抽出結果として求めている。この時、上記の活用
語尾の解析は品詞領域3cに格納された品詞項目
に基いて行われる。そして、この解析によつて見
出された文節抽出結果に対応する漢字混りの表記
文字からなる第2の文字列を前記出力見出し表領
域3bから読出し、これを出力している。更にこ
のとき、前記総文節系列抽出部2bは、前記文節
抽出部2cへの入力単位(文節抽出結果)を、前
記入力文字列に対して定められたブロツク区間に
おける文節分割可能な組合せについて様々に変化
させ、その中の最も確からしい文節系列を求めて
いる。
Therefore, the clause extracting unit 2c searches for a character string (word) registered in advance in the input heading table area 3a of the conversion dictionary 3 using, for example, a known longest forward match method for the given input character string, By analyzing the conjugated endings and adjuncts, the part of the input character string that matches the initial character of the input character string for the longest length is obtained as the branch extraction result. At this time, the above-mentioned analysis of the conjugated ending is performed based on the part of speech item stored in the part of speech area 3c. Then, a second character string consisting of written characters mixed with kanji corresponding to the phrase extraction result found through this analysis is read out from the output heading table area 3b and output. Furthermore, at this time, the total phrase series extraction unit 2b inputs the input unit (phrase extraction result) to the phrase extraction unit 2c into various combinations that can be divided into phrases in the block section determined for the input character string. We are trying to find the most probable phrase sequence among them.

仮名漢字変換部2は、このような文節系列に対
して求められた仮名漢字混じり表記からなる第2
の文字列を出力制御部4の出力データメモリ5に
転送している。出力制御部4はこれらのデータを
所定の表示出力形式に変換し、文書表示用メモリ
6に格納する。
The kana-kanji converter 2 converts the second kana-kanji mixture of kana-kanji notation obtained for such a phrase series.
The character string is transferred to the output data memory 5 of the output control section 4. The output control unit 4 converts these data into a predetermined display output format and stores it in the document display memory 6.

文書表示用メモリ6に格納された、これらのデ
ータは、確認情報優先部8へ送られ、確認情報記
憶部9を参照することにより、既でに確認された
変換候補がなるときは、その変換候補を優先し
て、出力するように、順番が変更される。
These data stored in the document display memory 6 are sent to the confirmation information priority section 8, and by referring to the confirmation information storage section 9, if a conversion candidate that has already been confirmed is found, that conversion is performed. The order is changed so that candidates are prioritized and output.

本実施例において、確認情報記憶部9は、第3
図dに示すように、文節単位の情報と、隣なり合
う文節の組合せ情報からなる。文節単位の情報は
ROMにある単語とFDD/RAMにある単語と
別々に記憶する。ROMにある単語は、かな漢字
変換において、一般的に使かわれる標準的単語を
記憶する。FDD/RAMにある単語は、利用者が
登録した単語や、分野別の単語を記憶している。
この様に構成することにより、分野が変更された
ときに容易に確認情報の入れかえが可能となる。
In this embodiment, the confirmation information storage unit 9
As shown in Figure d, it consists of information for each phrase and information on combinations of adjacent phrases. Information for each clause is
Words in ROM and words in FDD/RAM are memorized separately. The words in the ROM memorize standard words commonly used in kana-kanji conversion. The words stored in the FDD/RAM include words registered by users and words by field.
With this configuration, confirmation information can be easily replaced when the field is changed.

隣なり合う文節の組合せ情報は、文節単位の情報
の相対位置と、標準的単語であるのか、利用者が
登録した単語又は、分野別の単語であるかの区別
を記憶する。
The combination information of adjacent phrases stores the relative position of the information for each phrase, and whether the word is a standard word, a word registered by the user, or a field-specific word.

第3図eに前述例において、タイミングt0で記憶
した例を示す。
FIG. 3e shows an example in which data is stored at timing t0 in the above example.

ここで前記出力データメモリ5は第3図aに示
すように組合せテーブル5a、マツピングテーブ
ル5b、見出し語テーブル5cからなり、上記辞
書検索部2によつて変換された見出し語を、各組
合せの構造と併わせて記憶するものである。この
例は第4図aに示す日本語文の例をデータ格納構
造を表現したもので、組合せテーブル5aは、前
記入力文字列の文節構造に対応して番号付けされ
た各文節の並びを記述している。このテーブル5
aの行は文節構造の解釈上の種類を、列は個々の
文節構造における文節の繋がりを順に記述したも
のとなつている。即ち、最初のブロツクでは候補
が1種類、2番目のブロツクは2種類、3番目は
3種類の系列候補が有ることが示される。またこ
れらの各数値はマツピングテーブル5bの要素番
号を示している。また各文節単位毎に存在する同
音異議語の見出し語をテーブル5cでグループ化
して記憶し、マツピングテーブル5bの各要素を
ポインタとして、見出し語テーブル5cの各グル
ープをそれぞれ記述している。このようにして入
力の読み仮名位置との対応関係も同時に記述して
いる。
Here, the output data memory 5 includes a combination table 5a, a mapping table 5b, and a headword table 5c as shown in FIG. It is stored together with the structure. This example represents the data storage structure of the Japanese sentence example shown in FIG. ing. This table 5
The rows of a indicate the interpretational types of bunsetsu structures, and the columns describe the connections of clauses in each bunsetsu structure in order. That is, it is shown that there is one type of sequence candidate in the first block, two types in the second block, and three types in the third block. Further, each of these numerical values indicates an element number of the mapping table 5b. In addition, headwords of homophone dissonance words that exist for each phrase unit are grouped and stored in a table 5c, and each group in the headword table 5c is described using each element of the mapping table 5b as a pointer. In this way, the correspondence with the input reading kana position is also described at the same time.

第3図bは前記出力データメモリ6の内容を表
示装置7に出力する為の文字表示情報を記憶する
前記文書表示用メモリ6のテーブル構造である。
このメモリ6は前記出力データメモリ5の内容に
基いて、同じ読み仮名位置にある同音意義語や異
構造文節列について比較照合し、先ず入力文字列
に対する全ての文節系列候補中の共通の文節区切
り箇所で前記入力文字列を分割し、さらに共通の
付属語文字部分および唯一通り求められる変換結
果部分とをそれぞれ他の部分から切離して記述し
ている。また、ある文節の頭部の見出し語文字に
対して、同じ読み仮名を付属語部分に持つ変換候
補結果については、先の文節頭部に合せて区切
り、区切られた後ろ側の付属語部分の文字列を次
に続く文節に結合させて記述している。即ち、或
る文節系列の文節における付属語の文字であつて
も、対応する同じ読みの部分が他の文節系列中に
おいて自立語の始りの一部になつていれば、その
付属語の文字は次に続く文節の変換候補に結合さ
せて記述している。
FIG. 3b shows a table structure of the document display memory 6 that stores character display information for outputting the contents of the output data memory 6 to the display device 7.
Based on the contents of the output data memory 5, this memory 6 compares and collates homophone meaning words and different structure clause strings located at the same pronunciation kana position. The input character string is divided into parts, and the common adjunct character part and the uniquely obtained conversion result part are each separated from other parts and described. In addition, for conversion candidate results that have the same reading kana in the adjunct part for the headword character at the beginning of a certain bunsetsu, it is separated according to the beginning of the previous bunsetsu, and the adjunct part after the separation is The string is written by joining it to the next clause. In other words, even if it is a letter of an adjunct word in a clause of a certain bunsetsu series, if the corresponding part with the same reading is part of the beginning of an independent word in another clause series, then the letter of that adjunct word is written in conjunction with the conversion candidate for the next clause.

第3図cは、前記第3図bの内容を、確認情報
優先部8により、順位変更した例である。この例
では、「資源開発」が、組合せ情報として、確認
情報記憶部9に記憶されていたと、「資源開発」
が表示順位第1位に変更される。
FIG. 3c is an example in which the contents of FIG. 3b are changed in order by the confirmation information priority unit 8. In this example, if "resource development" is stored in the confirmation information storage unit 9 as combination information, "resource development"
is changed to the first place in the display ranking.

これらの同音語は後述するように、その表示属
性を通常の表示属性とは異ならせて表示出力され
る。第5図a〜eはその表示例であり、斜線部が
表示属性の異なりを示している。この表示属性の
変更は、例えば表示文字の反転、ブリンク、輝度
変更、下線付等によつて行われる。
As will be described later, these homophones are displayed and output with their display attributes different from normal display attributes. FIGS. 5 a to 5 e are display examples, and the shaded areas indicate different display attributes. This change in display attributes is performed, for example, by inverting, blinking, changing brightness, underlining, etc. the displayed characters.

次に第3図に示す仮名文字入力例を用いて、上
記仮名漢字変換部2における仮名漢字変換処理に
つき説明する。
Next, the kana-kanji conversion process in the kana-kanji conversion section 2 will be explained using the example of kana character input shown in FIG.

ブロツク抽出部2aは入力された文字系列の先
頭から最大N文節の系列を可能な限り求め体る。
ここでNを例えば4とすると第4図aに示す例で
は、先づ入力系列全体を文節抽出部2cに入力
し、最長一致法により「そして」を第1の文節結
果として得る。次にこの文節切れ目以降を始点
(次の文節開始文字位置)として同様に最長一致
結果を求め、「こんごのと」なる文節を得る。こ
のような処理を順に繰返して第1の文節系列候補
「そして/こんごのと/うしは/かいていし」を
第4図b中の項目「ア」の如く得る。次にこの項
目「ア」で得られた文節系列と別の文節系列を得
るために、第3番目の文節結果「うしは」の最後
の1文字、つまりその文節において付属語として
解析される「は」削除してこれを文節抽出部2c
に送り、同様にして最長−致結果「うし」なる文
節を得、続く「は」で始まる文節として「は」を
求める。以下、同様にして上記第3、第2および
第1の文節により短い文節が得られる都度、更に
これらに続く別の文節列を順次求める。このよう
にして入力文字列に対して文節分割可能な全ての
4文節系列を第4図bに示す如く求める。尚この
時、対応する漢字混じりの見出し語候補(第2の
文字列)を同時に求めておく。
The block extraction unit 2a obtains as many as possible a sequence of N phrases from the beginning of the input character sequence.
Assuming that N is 4, for example, in the example shown in FIG. 4a, the entire input sequence is first input to the clause extractor 2c, and "and" is obtained as the first clause result by the longest match method. Next, the longest matching result is obtained in the same manner, using the point after this bunsetsu break as the starting point (the position of the next bunsetsu start character), to obtain the bunsetsu ``Kongonoto''. Such processing is repeated in order to obtain the first phrase series candidate ``And/Kongonoto/Ushiha/Kaiteishi'' as shown in item ``A'' in FIG. 4B. Next, in order to obtain a phrase series different from the phrase series obtained for this item "A", we will use the last character of the third phrase result "Ushiha", that is, "' is deleted and this is added to the phrase extraction section 2c.
Similarly, the longest-matching phrase ``Ushi'' is obtained, and ``HA'' is found as the following phrase starting with ``HA''. Thereafter, each time a short clause is obtained from the third, second, and first clauses, another series of clauses following these clauses is sequentially obtained. In this way, all four-clause sequences that can be divided into phrases for the input character string are obtained as shown in FIG. 4b. At this time, a corresponding headword candidate (second character string) containing kanji is also obtained.

次にこれらの系列のうちで、その全体の長さが
最長となる候補(文節系列)だけに着目する。こ
のことは先に示したように入力による文節数が最
小となる系列が、入力目的とする変換結果に合つ
ている傾向が高いと云うことに立脚している。こ
のことは、一つのブロツクの文節構成数が最小で
あればよく、また文節の構成数が同じであれば、
そのブロツクはより長い長さをもつことを意味し
ている。
Next, among these sequences, attention is focused only on the candidate whose total length is the longest (the bunsetsu sequence). This is based on the fact that, as shown above, the sequence with the minimum number of input clauses has a high tendency to match the conversion result intended for input. This means that the number of clauses in one block should be the minimum, and if the number of clauses in one block is the same,
This means that the block has a longer length.

しかして前記第4図bに示される結果の中で、
最長の文節系列となるものは、項目「ア」と項目
「ウ」に示されるものである。そこで次にこれら
文節系列が共通に文節の切れ目をもつている個所
を見つける。この例では「そして/〜」と、「〜
は/〜」しが共通の文節区切り箇所として求めら
れる。ブロツク抽出部2aはこのような2つの位
置をブロツクの区切りと判定するもので、第1ブ
ロツク区間を「そして」、第2ブロツク区間を
「こんごのとうしは」とする。そして順次これら
の区間の文字列を総文節列解析部2bに解析さ
せ、それらの変換結果を出力制御部4へ送つてい
る。
However, among the results shown in FIG. 4b,
The longest bunsetsu series are those shown in item "A" and item "U". Next, we find locations where these phrase series have phrase breaks in common. In this example, "and/~" and "~
は/〜”し is required as a common clause break point. The block extracting unit 2a determines these two positions as delimiters of blocks, and defines the first block section as "and" and the second block section as "congo no toshiwa." Then, the character strings in these sections are sequentially analyzed by the total clause string analysis section 2b, and the conversion results are sent to the output control section 4.

この結果、上記第1のブロツク区間は「そして」
のみの候補となり、この情報が先ず出力制御部4
へ送られる。尚、この場合、他に同音語が無いの
で、そのまま文書中の文字データ(変換結果)と
して通常形態で表示される。しかる後、第2ブロ
ツク区間の解析が行われる。
As a result, the first block section above is "and"
This information is first sent to the output control unit 4.
sent to. In this case, since there are no other homophones, the text is displayed as character data (conversion result) in the document in its normal form. Thereafter, the second block section is analyzed.

ここで、前記総文節列解析部2bは、与えられ
たブロツク区間の読みの対応した文字系列を総当
りで求めるものであるが、実際には第4図bに示
すように既に文節系列が求められているので、そ
の指定区間の範囲に対応するものだけ選べば十分
である。そして優先度の評価として、例えば文節
数最小の構成の候補だけを選ぶと、その解析結果
は第4図dの項目「」のようになる。勿論、そ
の他の文節候補列も出力データメモリ5に代えて
おくようにしてもよい。例えば「今後の/問う/
誌は」をも、出力結果に加えることも可能であ
る。
Here, the total phrase sequence analysis unit 2b calculates character sequences corresponding to the pronunciations of a given block section by brute force, but in reality, as shown in FIG. 4b, the phrase sequence has already been determined. Therefore, it is sufficient to select only those that correspond to the range of the specified interval. As a priority evaluation, for example, if only the candidates with the minimum number of clauses are selected, the analysis result will be as in the item "" in FIG. 4d. Of course, other clause candidate sequences may also be stored in the output data memory 5. For example, “Future / ask /
It is also possible to add "magazine" to the output results.

さて、ブロツク抽出部2aは、次に前記入力文
字系列のうちで末だにブロツクが決定していない
残りの部分、つまり「かいていしげ……」なる文
字列について、同様の方法でブロツクの単位を求
め、第4図dの項目「」に示す如き変換結果を
求める。続いて変換結果「限つて」を第3図dの
項目「」のように求め、その入力系列全体に対
する変換処理を終了することになる。
Next, the block extracting unit 2a extracts the unit of block in the same way for the remaining portion of the input character sequence for which no block has been determined yet, that is, the character string "Kaitishige...". Then, the conversion result as shown in the item "" in FIG. 4d is obtained. Subsequently, the conversion result ``limited'' is obtained as shown in the item ``'' in FIG. 3d, and the conversion process for the entire input series is completed.

以上の変換結果は各ブロツク毎に出力制御部4
へ送られる。出力制御部4は出力データメモリ5
に格納された各ブロツク毎のデータをそれぞれ変
換し、文書表示用メモリ6に順次スタツクし、出
力の優先順位を変更し、表示装置7に出力する。
即ち、出力制御部4では文書表示用データを前記
第3図bの如く作成し、これを先ず第4図aに示
すように表示装置7に出力している。上記の例で
は、「今後のと」の文節候補に対しては、自立語
部が“今後”として、付属語部が“のと”として
分離される。文節候補「牛は」も同様に“牛”と
“は”に分離される。また第2文節系列候補では
自立語部が“今後”、付属語部が“の”として分
離され、「投資は」は“投資”と“は”とに分離
される。従つてこの場合、“の”と“は”は共に
共通の付属語文字であり、また“今後”には他に
同音語がないので、これらの文字部分については
通常の表示形態で表示される。また他の文字につ
いては複数の変換候補(同音異字)が存在するこ
とから、これを強調して示すために例えば高輝度
で表示される。つまり、文節「今後のと」におけ
る“と”は付属語ではあるが、次の文節単語
「牛」と共に扱われる。
The above conversion results are output to the output controller 4 for each block.
sent to. The output control section 4 has an output data memory 5
The data for each block stored in the data block is converted, sequentially stacked in the document display memory 6, the output priority is changed, and the data is output to the display device 7.
That is, the output control section 4 creates document display data as shown in FIG. 3b, and first outputs this to the display device 7 as shown in FIG. 4a. In the above example, for the phrase candidate "Koku no to", the independent word part is separated as "Kitai" and the attached word part is separated as "noto". Similarly, the bunsetsu candidate "Ushiwa" is separated into "Ushi" and "Ha". Furthermore, in the second clause series candidate, the independent word part is separated into "Shikaku" and the attached word part is separated into "no", and "Investment wa" is separated into "Investment" and "Ha". Therefore, in this case, both "no" and "wa" are common adjunct characters, and since "future" has no other homophones, these character parts are displayed in the normal display form. . Furthermore, since there are a plurality of conversion candidates (homophones and allographs) for other characters, they are displayed with high brightness, for example, to emphasize these candidates. In other words, although "to" in the bunsetsu "Koku no to" is an adjunct, it is treated together with the next bunsetsu word "ushi".

従つて、表示装置7には、「そして今後の〔と
牛〕は〔改定し限界発に〕限つて」と表示される
ことになる。尚、〔 〕内は高輝度表示される文
字を示している。
Therefore, the display device 7 will display, ``And from now on, [Togyo] will be limited to [revised and limited].'' Note that characters in brackets [ ] indicate characters displayed with high brightness.

ここで目的とする見出し語の選択の為に、入力
装置1には例えば第1図中1aに示すように次候
補キーが設けられている。この次候補キー1a
は、例えば第5図に示すように〔と牛〕の部分に
カーソル1bを合わせ、この状態で前記次候補キ
ー1aが操作されたとき、その表示を次の候補に
変更する役割を担うものである。従つてこの場合
には、第4図aに示されるテーブル5aの第1行
目の構造に代えて、第2行目に示す文節列構造、
即ち「今後の〔投資〕は」が第5図bに示す如く
出力表示される。そして、更に前記次候補キー1
aを操作していくと〔投資〕が〔闘志〕、〔透視〕
の如く、順次他の同音語に変更され、再び元の
〔と牛〕の表示に戻ることになる。尚、これらの
動作は前記第3図bに示した文書表示用メモリ6
に格納されたデータに基づいて行われる。
In order to select the desired headword here, the input device 1 is provided with a next candidate key, as shown, for example, at 1a in FIG. This next candidate key 1a
For example, as shown in FIG. 5, when the cursor 1b is placed on the [and cow] part and the next candidate key 1a is operated in this state, the function is to change the display to the next candidate. be. Therefore, in this case, instead of the structure in the first row of table 5a shown in FIG. 4a, the phrase string structure shown in the second row,
That is, "Future [Investment]" is output and displayed as shown in FIG. 5b. Further, the next candidate key 1
As you manipulate a, [Investment] becomes [Fighting Spirit] and [Clairvoyance].
The word will be changed to other homophones one after another, and then it will return to its original form. Note that these operations are performed using the document display memory 6 shown in FIG.
This is done based on data stored in .

ところで前記第3図bに示される文書対応テー
ブル6aは、表示装置7の表示画面上の座標値i
1〜i7と出力データ(変換結果)との対応した
表したものである。表示語テーブル6bは出力デ
ータの内容を示している。しかして変換候補の表
示は、先ず文書対応テーブル6aのデータi3に
よつて表示語テーブル6bの「と牛」が指示さ
れ、これが表示される。しかる後、前記次候補キ
ー1aが操作されると、データi3によつてその
ブロツクにおける次の候補「投資」にポインタ
が進められ、表示が切換えられる。このようにし
てポインタが進められて「凍死」まで表示が切
替えられと、その次には再び「と牛」に戻るよ
うに制御されている。この表示語テーブル6bに
示されるように、前述したように文節単位に基い
て解析された複数の変換候補結果は、同音異字の
関係に従つて整理され、部分的にその区切りの単
位が変更されている。
By the way, the document correspondence table 6a shown in FIG.
1 to i7 and output data (conversion results) are shown in correspondence. The display word table 6b shows the contents of the output data. In displaying the conversion candidates, first, "toushi" in the display word table 6b is designated by data i3 in the document correspondence table 6a, and this is displayed. Thereafter, when the next candidate key 1a is operated, the pointer is advanced to the next candidate "Investment" in that block based on the data i3, and the display is switched. In this way, the pointer is advanced and the display is switched to ``frozen to death,'' and then it is controlled to return to ``cattle.'' As shown in the displayed word table 6b, the multiple conversion candidate results analyzed based on the bunsetsu unit as described above are organized according to homophone and allograph relationships, and the unit of separation is partially changed. ing.

次候補キー1aを操作し、目的とする単語が表
示されたとき、選択キー1bを操作し、確認を行
う。この確認操作により、出力制御部6は、確認
情報を確認情報記憶部9へ記憶する指示をする。
例においては、「投資」が目的とする単語である
ことを指示すると、例えば「投資」の辞書番号が
確認情報記憶部9へ記憶される。
When the next candidate key 1a is operated and the desired word is displayed, the selection key 1b is operated to confirm. By this confirmation operation, the output control section 6 instructs the confirmation information storage section 9 to store the confirmation information.
In the example, when it is specified that "investment" is the target word, for example, the dictionary number of "investment" is stored in the confirmation information storage section 9.

この「投資」においては、確認された文節が複数
でないので文節単位の情報のみ登録される。
In this "investment", since there is not a plurality of clauses that have been confirmed, only information for each clause is registered.

同様にして「かいていしげ…」なる文字列につい
ても、自立語部が“改定”、付属語部が“し”と
して扱われ、“し”の部分については他に“資源”
という文節単語が存在しているので、この“し”
は次の文節“限界”と結合して出力される。続く
「発に」までは全候補が共通に持つ単語の区切り
がないので、これらはまとめて出力されるる。な
お機械処理上、自立語は1単語毎に文節として扱
われる。
Similarly, for the character string "Kaitishige...", the independent word part is treated as "revised", the adjunct word part is treated as "shi", and the "shi" part is treated as "resource".
Since there is a phrase word ``shi''
is combined with the next clause ``Limit'' and output. Since there is no break between the words that all candidates have in common until the following "Hatsu ni", these words are output together. Note that in machine processing, each word of an independent word is treated as a clause.

「かいていしげ……」なる文字列は、複数の文
節から同音語構造を構成していることより、文節
単位の情報の他に、隣なり合う文節との組合せ情
報も、確認情報記憶部9へ記憶する。実施例にお
いては、「海底−資源」「資源−開発」が記憶され
る。ここで、文節単位の確認情報と組合せ情報の
優先関係を説明する。例えば、「海底−資源」が
選択された後、「改定」が単独で選択されたとす
ると、文節単位の優先関係は、改定>海底とな
る。このため、「かいてい」を入力すると、出力
順位は改定→海底→改訂→開延となる。しかしな
がら「かいていしげん」が入力されると、組合せ
情報が、優先され、出力順位は、海底→改定→改
訂→開延となる。
Since the character string "Kaiteishige..." has a homophone structure made up of multiple clauses, in addition to the information for each clause, information on combinations with adjacent clauses is also stored in the confirmation information storage unit 9. Remember. In the embodiment, "undersea - resources" and "resources - development" are stored. Here, the priority relationship between confirmation information and combination information for each phrase will be explained. For example, if "revision" is selected alone after "seafloor-resources" is selected, the priority relationship in phrase units is revision>seafloor. Therefore, when "Kaitei" is input, the output order is revised → seabed → revised → expanded. However, when "Kaiteishigen" is input, the combination information is prioritized, and the output order is: seabed → revision → revision → expansion.

第6図乃至第11図は本装置の上述した処理の
流れを示すものである。第6図に示す制御フロー
においては、入力装置1から得られる入力キーコ
ードは常時調べられており、その入力コードが日
本語文の読みに対応する仮名文字コードであれ
ば、順次スタツクに蓄れられる。また上記入力コ
ードが変換要求を示すものであれば第7図に示さ
れる仮名漢字変換処理が行われる。この変換要求
は、入力装置が変換要求キーを有している場合、
オペレータが適当な長さの文字列を入力後、この
変換要求キーを打鍵することにより発生される。
また入力装置が変換要求キーを有するか否かに拘
らず、入力文字が例えば句読点をを示すコードで
あつたことを検出した場合には、上記変換要求を
自動的に発生することが望ましい。
6 to 11 show the flow of the above-described processing of this apparatus. In the control flow shown in FIG. 6, input key codes obtained from the input device 1 are constantly checked, and if the input code is a kana character code that corresponds to the reading of a Japanese sentence, it is stored in the stack in sequence. . If the input code indicates a conversion request, the kana-kanji conversion process shown in FIG. 7 is performed. This conversion request is made when the input device has a conversion request key.
This is generated by the operator inputting a character string of an appropriate length and then pressing the conversion request key.
Further, regardless of whether the input device has a conversion request key or not, it is desirable to automatically generate the conversion request when it is detected that the input character is a code indicating a punctuation mark, for example.

また入力コードが前記次候補キー1aに対応し
たものであれば、第8図に示す同音語選択処理を
行ない、その他のコード、例えば訂正、挿入、削
除等のコードの場合には既に表示された文章につ
いて編集処理が行なわれる。また第9図は本発明
における第7図中の変換候補の編集出力処理を示
すものである。
If the input code corresponds to the next candidate key 1a, the homophone selection process shown in FIG. Editing processing is performed on the text. Further, FIG. 9 shows the editing and output processing of the conversion candidates in FIG. 7 according to the present invention.

尚、一般にワードプロセツサでは、同音語の選
択を各変換結果毎に遂次実行するものと、例えば
1頁分の文字列の入力後に一括して選択するもの
が知られているが、本発明装置にあつては、その
いずれの方式であつてもよい。
Generally speaking, word processors are known that select homophones sequentially for each conversion result, or select them all at once after inputting, for example, one page of character strings. The device may be of either type.

以上説明したように本装置によれば、比較的長
い入力仮名文字列を解析し、仮名漢字混りの文字
列に変換して日本語文章を作成していく際、その
結果として生ずる多数の文節列候補を、単純明快
に表示することができ、表示される順序は、複合
文節は確認情報がより優先して行なわれオペレー
タの同音語選択の操作の能率を上げることができ
る。つまり、一つの文節候補における同音語の選
択ばかりではなく、文節区切りの異なる異文節系
列の候補についても前述したように一括して同音
字の選択を行い得る。従つて、同音異議語および
同音異文節の変換候補文字から目的とする仮名漢
字変換文字を簡易に選択して日本語文章を極めて
効率良く作成することができる。またオペレータ
の負担を大幅に軽減することができ、その実用的
利点は絶大である。
As explained above, according to this device, when a relatively long input kana character string is analyzed and converted into a character string containing kana and kanji to create a Japanese sentence, a large number of phrases are generated as a result. The column candidates can be displayed simply and clearly, and the order in which they are displayed is such that confirmation information is prioritized for complex phrases, thereby increasing the efficiency of the operator's homophone selection operation. In other words, it is possible to select homophones not only for one phrase candidate, but also for candidates in a series of different phrases with different phrase breaks as described above. Therefore, it is possible to easily select the target kana-kanji conversion characters from the conversion candidate characters of homophone dissonance words and homophone dissonance phrases, and to create a Japanese sentence extremely efficiently. Furthermore, the burden on the operator can be significantly reduced, and its practical advantages are enormous.

尚、本発明は上記実施例に限定されるものでは
ない。例えば、ベタ文の入力でなく、文節単位に
区切つて入力されるものでも、文節単位と隣なり
合う文節を組合せた情報を記憶するようにして出
力する優先順序を入れかえ、その選択を促すよう
にしても良い。又、付属語の種類や、付属語その
ものを組合せて記憶してもよい。要するに本発明
はその要旨を逸脱しない範囲で種々変形して実施
することができる。
Note that the present invention is not limited to the above embodiments. For example, even if the input is not a solid sentence, but is input in units of clauses, the output priority order can be changed by storing information that combines the units of clauses and adjacent clauses, and the selection can be encouraged. It's okay. Further, the types of adjunct words and the adjunct words themselves may be stored in combination. In short, the present invention can be implemented with various modifications without departing from the gist thereof.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明の一実施例を示す装置概略構成
図、第2図は変換辞書のメモリの構成を示す図、
第3図は出力データメモリと文書表示用メモリの
構成と確認情報を示す図、第4図は入力文字列と
その変換処理を示す図、第5図は変換候補の表示
例を示す図、第6図乃至第11図は変換処理の制
御フローの一例を示す図である。 1…入力装置、2…仮名漢字変換部、3…変換
辞書、4…出力制御部、5…出力データメモリ、
6…制御テーブル、7…表示装置、1a…次候補
キー、1b…選択キー、2a…ブロツク抽出部、
2b…総文節系列抽出部、2c…文節抽出部、3
a…入力見出し表領域、3b…出力見出し表領
域、6a…文書対応テーブル、6b…表示語テー
ブル、8…確認情報優先部、9…確認情報記憶
部。
FIG. 1 is a schematic configuration diagram of a device showing an embodiment of the present invention, FIG. 2 is a diagram showing the configuration of a memory of a conversion dictionary,
FIG. 3 is a diagram showing the configuration of the output data memory and document display memory and confirmation information, FIG. 4 is a diagram showing input character strings and their conversion processing, FIG. 5 is a diagram showing an example of displaying conversion candidates, 6 to 11 are diagrams showing an example of a control flow of conversion processing. 1... Input device, 2... Kana-kanji conversion section, 3... Conversion dictionary, 4... Output control section, 5... Output data memory,
6... Control table, 7... Display device, 1a... Next candidate key, 1b... Selection key, 2a... Block extractor,
2b... Total clause series extraction unit, 2c... Clause extraction unit, 3
a... Input heading table area, 3b... Output heading table area, 6a... Document correspondence table, 6b... Display word table, 8... Confirmation information priority section, 9... Confirmation information storage section.

Claims (1)

【特許請求の範囲】 1 一連の入力文字列を得るための入力装置と、
複数の単語を記憶する辞書記憶部と、この辞書記
憶部を検索する辞書検索部と、この辞書検索部を
用いて前記入力文字列より文節単位の系列を抽出
する文節系列抽出部と、この文節系列抽出部によ
つて求められた各々の文節に対して、文法的評価
を施しかな漢字混じり表記を出力する結果出力部
と、この結果出力部に出力された変換結果に対し
て、確認情報を与える手段と、この確認された情
報を記憶する確認情報記憶部と、この確認情報記
憶部に記憶された確認情報を有する変換候補が出
現したとき、優先順位を変更する確認情報優先部
を具備し、前記確認情報は、文節単位の確認情報
と、隣合う文節を組合わせた情報を記憶すること
を特徴とするかな漢字変換装置。 2 確認情報優先部は、隣合う文節を組合せた情
報は文節単位の確認情報より優先して出力するこ
とを特徴とする特許請求の範囲第1項記載のかな
漢字変換装置。 3 前記確認情報記憶部へ記憶する隣合う文節を
組合わせた情報は、結果出力部に於いて、文節の
区切りが単一でない複合文節のときに記憶するこ
とを特徴とする特許請求の範囲第1項記載のかな
漢字変換装置。
[Claims] 1. An input device for obtaining a series of input character strings;
a dictionary storage unit that stores a plurality of words; a dictionary search unit that searches this dictionary storage unit; a clause sequence extraction unit that uses the dictionary search unit to extract a series of clause units from the input character string; A result output unit that performs grammatical evaluation on each clause found by the sequence extraction unit and outputs a notation containing kana and kanji, and provides confirmation information for the conversion results output to this result output unit. means, a confirmation information storage section that stores the confirmed information, and a confirmation information priority section that changes the priority order when a conversion candidate having the confirmation information stored in the confirmation information storage section appears; The kana-kanji conversion device is characterized in that the confirmation information stores confirmation information for each phrase and information combining adjacent phrases. 2. The kana-kanji conversion device according to claim 1, wherein the confirmation information priority section outputs information combining adjacent phrases with priority over confirmation information for each phrase. 3. The information on the combination of adjacent phrases stored in the confirmation information storage section is stored in the result output section when the phrase is a compound phrase with no single segmentation. The kana-kanji conversion device described in item 1.
JP59090250A 1984-05-08 1984-05-08 Kana-kanji converting device Granted JPS60235271A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59090250A JPS60235271A (en) 1984-05-08 1984-05-08 Kana-kanji converting device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59090250A JPS60235271A (en) 1984-05-08 1984-05-08 Kana-kanji converting device

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP10049982A Division JPH10247192A (en) 1998-02-17 1998-02-17 Kana-to-kanji conversion device

Publications (2)

Publication Number Publication Date
JPS60235271A JPS60235271A (en) 1985-11-21
JPH0563831B2 true JPH0563831B2 (en) 1993-09-13

Family

ID=13993247

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59090250A Granted JPS60235271A (en) 1984-05-08 1984-05-08 Kana-kanji converting device

Country Status (1)

Country Link
JP (1) JPS60235271A (en)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63308665A (en) * 1987-06-10 1988-12-16 Seiko Epson Corp Kana/kanji converting device
JPH0612537B2 (en) * 1987-06-12 1994-02-16 松下電器産業株式会社 Kana-Kanji converter
JPH0610804B2 (en) * 1987-06-26 1994-02-09 株式会社日立製作所 Kana-Kanji converter
JP3049502B2 (en) * 1988-12-01 2000-06-05 セイコーエプソン株式会社 Kana-Kanji conversion device
JPH02299061A (en) * 1989-05-15 1990-12-11 Casio Comput Co Ltd Kana(japanese syllabary)-kanji(chinese character) converting device
JPH07146859A (en) * 1994-06-10 1995-06-06 Seiko Epson Corp Kana/kanji converter
JPH08287062A (en) * 1995-12-28 1996-11-01 Canon Inc Character processor and its method
JPH08272797A (en) * 1995-12-28 1996-10-18 Canon Inc Device and method for character processing

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS567173A (en) * 1979-06-29 1981-01-24 Sharp Corp Sentence processor
JPS58192128A (en) * 1982-05-06 1983-11-09 Ricoh Co Ltd Kana(japanese syllabary)-kanji(chinese character) conversion processor
JPS59186026A (en) * 1983-04-08 1984-10-22 Hitachi Ltd Method of kana-kanji conversion

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS567173A (en) * 1979-06-29 1981-01-24 Sharp Corp Sentence processor
JPS58192128A (en) * 1982-05-06 1983-11-09 Ricoh Co Ltd Kana(japanese syllabary)-kanji(chinese character) conversion processor
JPS59186026A (en) * 1983-04-08 1984-10-22 Hitachi Ltd Method of kana-kanji conversion

Also Published As

Publication number Publication date
JPS60235271A (en) 1985-11-21

Similar Documents

Publication Publication Date Title
US6275789B1 (en) Method and apparatus for performing full bidirectional translation between a source language and a linked alternative language
US5214583A (en) Machine language translation system which produces consistent translated words
JPH03185561A (en) Method for inputting european word
KR870005314A (en) Shorthand Translation System
RU2223864C2 (en) Method for rapid typesetting on keyboard
JPH0563831B2 (en)
JPS62197864A (en) Language information offering device
JPH10247192A (en) Kana-to-kanji conversion device
JP3056810B2 (en) Document search method and apparatus
JPH0221021B2 (en)
JP2958044B2 (en) Kana-Kanji conversion method and device
JPH0528129A (en) Word processor
JP2633025B2 (en) Sentence processing equipment
JPH0821039B2 (en) Electronic dictionary search device
JPS6061825A (en) Character converter
JPH0612453A (en) Unknown word extracting and registering device
JP3653044B2 (en) Search device, search program, and recording medium
JP2702443B2 (en) Japanese input device
JP3048793B2 (en) Character converter
CN113227946A (en) Alphabetic writing input method
JPS58219632A (en) Data conversion processing system
JPS5957327A (en) Sentence forming device
JPS60117366A (en) System for accessing dictionary file
JPH05151199A (en) Document preparation device
JPS59221731A (en) Kana/kanji conversion processor