JPS58200328A - カナ漢字変換装置 - Google Patents

カナ漢字変換装置

Info

Publication number
JPS58200328A
JPS58200328A JP57081961A JP8196182A JPS58200328A JP S58200328 A JPS58200328 A JP S58200328A JP 57081961 A JP57081961 A JP 57081961A JP 8196182 A JP8196182 A JP 8196182A JP S58200328 A JPS58200328 A JP S58200328A
Authority
JP
Japan
Prior art keywords
kana
interpretation
input
clause
likelihood
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57081961A
Other languages
English (en)
Inventor
Ryoichi Sugimura
領一 杉村
Makoto Tatebayashi
誠 館林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP57081961A priority Critical patent/JPS58200328A/ja
Publication of JPS58200328A publication Critical patent/JPS58200328A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は、カナコードで入力されるベタ書き文の日本語
文章をカナ漢字混じり文に変換して出力するカナ漢字変
換装置に関するものである。
従来のカナ漢字変換方式として知られているものには漢
字区間指定方式や文節分から書き入力方式があるが、こ
れらはいずれも通常の日本語文章以外にカナ漢字変換用
の特殊記号を挿入するものであシ、オペレータの負担は
大変大きなものである。これに対してべた書き入力方式
では、オペレータは入力すべき文章のみに注意を集中す
るだけで良いという利点を有する。
さてカナ漢字変換方式として、最も一般的なものは入力
カナコード列の先頭位置よりカナコード列の一部を切り
出し、この部分系列に致する単語を予め用意された単語
記憶装置において検索し入力順に順次検索された単語間
の文法的接続検査を行なって、日本語文章として妥当な
単語系列のみを出力するものであ求。特に、ベタ書き入
力方式としては、カナ漢字変換速度を向上させるため3
ページ 日本語文法でいう文節の概念を用い、入力カナ列の先頭
位置から2文節分の解釈を行ない、複数の解釈の候補が
現われた場合には2文節として最長の解釈長さを与える
先行文節を決定するという方式が知られている。
しるしながら上記の方式においては、入カベた書き文の
うちで先頭部の情報しか用いずに出力を決定するため、
必然的I変換の可能性が生じるという欠点を有する。更
に、カナ漢字変換を入力カナ列の先頭位置から連続的に
行なうため、入力文中に単語記憶装置に未登録の単語が
ある場合、その単語の位置以降に対し正しい解釈が得ら
れな。
いだけでなく、誤った変換結果を必然的に出力させるを
得す、実用上問題のあるものであった。これらの問題を
解決する一方法として特願昭56−24445に示され
るように入力文中で文節頭となる可能性の高い位置を見
つけて、入力文の中途より文節検索する方法が知られて
いる。しかしとの方法では可能性を示す値が固定的であ
シ、従って無駄な処理を行なわざるを得ないという欠点
を有する。
本発明は、上記の問題点を改善するために為されたもの
であシ、カナ漢字変換速度が速くかつ誤変換が少なく、
また未登録の単語が出現した場合にも十分信頼性のある
変換結果を得ることのできるカナ漢字表変装置を提供す
るものである。
以下、本発明の一実施例について図面を参照しながら説
明する。
第1図は本発明の一実施例におけるカナ漢字変換装置の
ブロック図である。
第1図において、1はカナコード入力装置で、例えば鍵
盤である。2はカナコード入力装置1によって入力され
たカナコード列を一時的に記憶する入力カナコード列一
時記憶部である。3はカナ漢字変換制御部で、本カナ漢
□字変換装置の動作制御を行なう。4は文節検索開始順
序指定部で、文節検索を開始すべき位置とその順序を指
定する。
すなわち文節検索□開始順序指定部4はまず、入力カナ
コード列中において予め指定されたカナコードを検出し
、又、入力カナコード列を音節の単位5・”−ジ に区切ることにより漢語の熟語になり得るカナコード列
を検出する。そして更に検出された上記カナ又はカナコ
ード列に対して予め与えられている尤度を用いて入力カ
ナ列内各位置に於ける文節開始の尤度を竺出する。そし
てこの文節開始尤度の大きい順に文節検索位置を決定す
るものである。
5は文節検索部で、文節検索開始順序指定部4によって
指定された文節検索開始位置以降の入カカオコード列、
から日本語文法の文節として妥当なものを検索する。6
は解釈候補一時記憶部で、文節検索部5の出力又は後述
する解釈候補接続部の出力の解釈候補を追々口して記憶
する。ては解釈候補尤度計算那で、解釈候補一時記憶部
6に追加された解釈候補に対し、予め定められた規則、
により尤度を計算し、その解釈候補に付随させて解釈候
補一時記憶部6に記憶する。8は解釈候補接続部で連続
したカナコード位置にある解釈候補に対してこれらを結
合した解釈候補を作成する。9は変換出力部で、カナ漢
字変換制御部3が変換出力相信号を出力した時、解釈候
補一時記憶部6に記憶6ページ されている文節候補のうち指定されたものを、カナ漢字
混じシ表記に出力するもので、例えばディスプレイ装置
等である。
次に第2図を用い、文節検索開始順序指定部4について
さらに詳細な構成を説明する。
第2図において、11は入力カナ列コードの文頭のカナ
全検出するとともに文頭のカナの位置情報と尤度を出力
する文頭検出回路、12は入力カナコード列内からカナ
「ヲ」を検すするとともにそのカナ「ヲ」の位置情報と
尤度を出力するヲ検出回路、13は入力カナ列コードの
内からカナ「ノ」を検出すると7ともにそのカナ「ノ」
の位置情報と尤度を出力するノ検出回路、14は入力カ
ナ列コードの内からカナ「ガ」を検出するとともにその
カナ「ガ」の位置情報と尤度を出力する。が検出回路、
15は入力カナ列コードの内からカナ「二」を検出する
とともにそのカナ「二」の位置情報と尤度を出力する三
検出回路、16は入力カナ列コードの内から熟語となる
カナ列を検出する熟語パターン検出回路、17は入力カ
ナ列の内か7 ページ ら未解釈すなわち解釈候補一時記憶部6でまだ処理なさ
れていない残りの入力カナ列の最短区間を検出する最短
未解釈区間検出回路で、以上の文頭検出回路11.ヲ検
出回路12.ノ検出回路13゜ガ検出回路14.二検出
回路16.熟語パターン検出回路16及び最短未解釈区
間検出回路17は検出回路制御部1oに分節検索開始位
置指定信号がカナ漢字変換制御部3から送出されると検
出回路制御部1oにより駆動される。18は検索開始位
置別尤度計算部で、文頭検出回路11.ヲ検出回路12
.ノ検出回路13.が検出回路14.二検出回路15.
熟語パターン検出回路16及び最短解釈区間検出回路1
7から送出される各信号により、入力カナ列を区切り入
力した位置情報と尤度とを位置情報順に並べて、各位置
ごとに時定の尤度を加算する。19は検索開始位置尤度
順ソート部で、検索開始位置別尤度計算部18から送出
・: された入力カナ位置情報と総合尤度を総合尤度の高いも
の順にソートして、検出回路制御部1oを介しカナ漢字
変換制御部3あるいは解釈候補接続部8からの要求があ
る毎に尤度の高い位置情報から順に、文節検索開始位置
情報として文節検索部5に転送する。
次に第3図を参照しながら文節検索部5について、さら
に詳細な構成を説明する。
第3図において、22は文節検索開始順序指定部4から
送出される情報の中から自立語記憶装置2oにより自立
語を検索する自立語検索部、23は自立検索部22が検
索した情報の品詞を判定する品詞判定部、24は品詞判
定部23が名詞を検索した場合にその名詞の付属語を付
属語記憶装置21から検索する付属語検索部、25は付
属語検索部24の検索した付属語が正しく名詞に接続さ
れるかどうかの接続関係を検査する接続検査部である。
以下、上記のように構成されたカナ漢字変換装置の動作
について説明する。
まずカナコード入力装置1から第4図aのD:ニッポン
デ・・・・・・」のようなカナコード列が入力されたも
のとする。この入力カナコード列は順次大9ページ カ力ナコード列一時記憶部2に格納され、交尾の句点が
入力されたとき、カナ漢字変換制御部3は文節検索開始
順序指定部4に対して分節検索開始位置指定の信号を送
出する。
そしてカナ漢字変換制御部3からの検出開始信号を受け
て検出回路制御部10は、文頭検出回路11、ヲ検出回
路12.ノ検出回路13.ガ検出回路14.二検出回路
15.熟語パターン検出回路16.最短未解釈区間検出
回路17を順次駆動し、検出結果を検索開始位置別尤度
計算部18へ転送する。
以    下    余    白 1o   、。
ベー: ] ]ベージ すなわち、文頭検出回路11は表に示すように「1」の
「二」を文頭として検出し、位置情報の「1」と尤度「
ア」をまたノ検出回路13は位置情報の「24」と尤度
「6」をさらに熟語パターン検出回路16は位置情報と
してrI J、、r8J。
「20」と尤度として「5」をそれぞれ検索開始位置別
尤度計算部18へ転送する。検索開始位置別尤度計算部
18は、受は取った位置情報と尤度を、位置情報順に々
らべ、各位置毎に尤度を可算する。その際表に示すよう
に位置「1」に対して「7」+「6」=[12jすなわ
ち総合尤度「12」が与えられる。以下同様に位置「8
」に対し「6」位置「2o」に対しr5J、r24Jに
対し「6」が与えられる。なお、他の位置の総合尤度は
全て「φ」である。そして検索開始位置別尤度計算部1
8は、入力カナの位置毎に計算された総合尤度を、位置
情報と共に検索開始・位置尤度順ソート部、1、。
19へ転送する。検索開始位置尤度順ソート部19では
、受は取った込カカナ内位置情報と、総合尤度を総合尤
度順にソートし、尤度の高い位置情報から順に、カナ漢
字変換制御部3からの要求がある毎に位置情報を文節検
索開始位置情報として文節検索部6へ転送する。そして
表に示すように検索開始位置として「1jを文節検索部
5に出力する。
この位置情報の信号を受けると文節検索部5は入力カナ
コード列における検索位置「1」以降の系列について一
文節分の解釈を行なう。すなわち指定された検索位置か
らまず自立語検索部22によシ自立語検索が行なわれ、
この結果「ニラポン(名詞・日本)」が得られる。次い
で品詞判定部23によシ、「ニラポン」の品詞が検査さ
れ、これが名詞であって付属語検索が必要であることが
判定される。そして付属語検索部24および接続検査部
25によシ、「ニラポン」に接続しうる付属語列であシ
、文節を構成しうるものとして、「デ」もしくは「デハ
」が検索される。以上のようにして得られたr6ニツポ
ンデ」、「ニッポンデハ」はいずれも日本語文法にいう
文節であることにより、この−文節を解釈候補として考
え、その1 ?、 、。
入力カナコード列中の位置9文節カナコード数。
文節数および漢字表記に関する情報を解釈候補一時記憶
部6に記憶する。(第4図C)次に解釈候補尤度計算部
7では、今作成された解釈候補「ニッポンデ」、「ニツ
ボンデノ為」について、尤度を計算する。この尤度は、
より少ない文節数でより長いカナコード列を解釈する仕
方がより確からしいという経験則に基づき、例えば次の
ようにして計算される。すなわち 尤度=解釈カナコード数−nx文節数 とする。ここで正数nを例えば3とすると、上式。
は3以上のカナコード数を有する一文節を解釈した場合
には確かさく尤度)が増加し、2以下のカナコード数を
有する一文節を解釈した場合は、確かさく尤度)が減少
することを意味する。
上記のように各解釈候補に対して計算された尤度値は各
解釈候補に付随して解釈候補一時記憶部6に記憶される
次に解釈候補接続部8では現在作成された解釈候補が解
釈候補一時記憶部6中に既に存在してい147、−ッ る他の解釈候補と接続し得るか否かを検査し、接続する
場合には新らしく解釈候補を作成して、再び解釈候補一
時記憶部6に追加して記憶する。なお、本実施例の他に
解釈候補がないので、この旨の信号を文節検索位置指定
部4に対して送出する。
この信号を受けた文節検索開始順序指定部4は検出回路
制御部10よシ検索開始位置尤度順ソート部19へ次に
総合尤度の高い検索開始位置を出力させる。すなわち表
に示すように、第24番目の[ノコの次の位置25が分
節検索部5へ転送され、文節検索部5は前述のようにこ
の位置より一文節分の解釈を行ない、この結果「ヒトツ
ブ」((名詞「ひとつ」十格助詞「で」)又は「ヒトツ
デス」(名詞「ひとつj十助動詞「です」)なる文節を
得て、解釈候補一時記憶部6に格納する。
(第4図C#3. #4)。この後前述の処理を繰り返
すが、表又は第4図aに示すように、導出される文節は
第4図#11までである。そこで検索開始位置尤度順ソ
ート部19は、文頭検出回路11から、熟語パターン1
6までのきっかけを全て出16ベー:゛ 力し終ると、文節として解釈されていない区間15から
19を見つける。そして尤度としては、未解釈区間の長
さを息とすると、例えば 尤度=128=j2; という尤度を与えて、検索開始位置尤度順ソート部19
へ転送する。以下は前述した処理と同様にして文節第4
図#12が見つけられ、次に#13゜#14が得られる
。第4図#14が得られた時点で文節検索開始位置はな
くなり、各文節で最も高い尤度を有する文節が、変換出
力部9へ転送され第4図dのような表示を行なうことが
できる。
以上のように本実施例によれば、入力力ナコード列一時
記憶部2に格納されている入力カナコード列の中から、
文節検索開始順序指定部4により文節の切れ目となりや
すいカナ文字、又は自立語であることが明らかである漢
語の熟語に予め着目して、入力文中の各々のカナ又はカ
ナ記号に対応して文節類となる尤度を求めるとともに、
最も文節がありそうな位置から順に文節を出力させ、文
節検索部6により文節内の文節検索をさせ一時的に解釈
候補一時記憶部6に記憶させ、そして解釈候補尤度計算
部7により解釈候補の尤度を計算するとともに、解釈候
補接続部8により解釈候補一時記憶部6に入力された文
節と記憶していた文節との接続関係を検査させることに
より、自立語検索の回数が必要量小成となるとともに、
誤変換の出現率も低くなり、たとえ未登録の単語があっ
てもその文節の他の部分で検索結果を得ることができる
なお本実施例において自立語(名詞、動詞の語幹、形容
詞の語幹、副詞等)を記憶している自立語記憶装置2o
と、付属語(助動詞、動詞の語幹の語尾、形容詞の語尾
等)を記憶している付属語記憶装置とは別々のブロック
で構成したが、実際には1つの記憶装置によって実現し
てもよい。
以上の説晩から明らかなように、本発明によれば、一時
記憶部に格納された入力カナコード列中で、文節の切れ
目となシやすいカナ文字、又は自立語であることが明ら
かである漢語の熟語に予め着目し、入力文中の各々のカ
ナ又はカナ記号に対17、−ッ 応じて文節類と々る尤度金求め、最も文節がありそうな
位置から順に文節検索を行なうことにより自立語検索の
回数が必要最少限な値に近づき、高速なカナ漢字変換を
行なうことができ、また入力力ナコード列の部分系列に
対応する解釈候補に尤度の概念を持たせ、これをカナ漢
字変換の処理において利用することによシ、必然的に誤
変換の出現率も低くおさえることができ、さらに入力文
中に単語記憶装置に未登録の単語がある場合にも、その
単語以外の部分において最も尤度の大きい解釈 候補を
出力することにより、実用性のあるカナ漢字変換を行な
うことができ、その工業的価値は大なるものがある。
【図面の簡単な説明】
第1図は本発明の一実施例におけるカナ漢字変換装置の
ブロック図、第2図は同文節検索開始順序指部のブロッ
ク図、第3図は同文節検索部 のブロック図、第4図は
カナ漢字変換の方法を示す図である。 1 ・・・・・カナコード入力装置、2・・・・・入力
力18、−シ ナコード列一時記憶部、4・・・・・・文節検索開始順
序指定部、5・・・・・・文節検索部、6 ・・・・・
解釈候補一時記憶部、7・・・・・解釈候補尤度計算部
、・・・・・・解釈候補接続部。

Claims (1)

  1. 【特許請求の範囲】 日本語文をカナコードにより順次入力するカナ憶するカ
    ナコード列記憶手段と、前記カナコード列を入力すると
    ともに、文節検索を開始すべき位手段の決定した順序で
    文節検索を行なうとともに、その文節検索の結果を解釈
    候補として一時記憶する解釈候補一時記憶手段と、前記
    解釈候補−特記列の中の連続した位置となる互いの解釈
    候補の接続を前記解釈尤度一時記憶手段が求めた解釈尤
    度よシ検査する解釈候補接続検査手段とを具備したカナ
    漢字変換装置。 2ベージ
JP57081961A 1982-05-14 1982-05-14 カナ漢字変換装置 Pending JPS58200328A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57081961A JPS58200328A (ja) 1982-05-14 1982-05-14 カナ漢字変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57081961A JPS58200328A (ja) 1982-05-14 1982-05-14 カナ漢字変換装置

Publications (1)

Publication Number Publication Date
JPS58200328A true JPS58200328A (ja) 1983-11-21

Family

ID=13761095

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57081961A Pending JPS58200328A (ja) 1982-05-14 1982-05-14 カナ漢字変換装置

Country Status (1)

Country Link
JP (1) JPS58200328A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60134992A (ja) * 1983-12-23 1985-07-18 Hitachi Ltd 文字入力装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS52132631A (en) * 1976-04-30 1977-11-07 Toshiba Corp Divisional write input unit
JPS5692676A (en) * 1979-12-26 1981-07-27 Fujitsu Ltd Input system of japanese sentence
JPS5714971A (en) * 1980-07-02 1982-01-26 Nec Corp Kana japanese syllabary kanji chinese character conversion device
JPS5727368A (en) * 1980-07-28 1982-02-13 Fujitsu Ltd "kana" (japanese syllabary) to "kanji" (chinese character converter)

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS52132631A (en) * 1976-04-30 1977-11-07 Toshiba Corp Divisional write input unit
JPS5692676A (en) * 1979-12-26 1981-07-27 Fujitsu Ltd Input system of japanese sentence
JPS5714971A (en) * 1980-07-02 1982-01-26 Nec Corp Kana japanese syllabary kanji chinese character conversion device
JPS5727368A (en) * 1980-07-28 1982-02-13 Fujitsu Ltd "kana" (japanese syllabary) to "kanji" (chinese character converter)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60134992A (ja) * 1983-12-23 1985-07-18 Hitachi Ltd 文字入力装置

Similar Documents

Publication Publication Date Title
JP2515726B2 (ja) 情報検索方法及び装置
KR100259407B1 (ko) 중국어 텍스트 입력키보드, 중국어 텍스트 처리 컴퓨터 시스템, 중국어 텍스트 입력장치, 음성 중국어의 음절 및 단어 저장방법
JP2000298667A (ja) 構文情報による漢字変換装置
JP2595934B2 (ja) 仮名漢字変換処理装置
JPS58200328A (ja) カナ漢字変換装置
JP2659700B2 (ja) かな漢字変換方法
JP2798931B2 (ja) 中国語の語音区切方式および語音漢字変換方式
KR100268297B1 (ko) 중국어 텍스트 처리 컴퓨터 시스템, 형태 처리에 의한 단어 스트링 처리 방법, 중국어 어구 분석 방법
KR860000681B1 (ko) 한글/한자 워드프로 세서
JPS62180462A (ja) 音声入力かな漢字変換装置
JP2951486B2 (ja) 漢字変換装置
JPS6395573A (ja) 日本語文形態素解析における未知語処理方法
JPS62247480A (ja) 文字認識後処理方式
JPH06149872A (ja) 文章入力装置
JP3438913B2 (ja) 文書処理装置
JPH0262659A (ja) 日本文訂正候補文字抽出装置
JPH06259413A (ja) 日本語入力方式
JPH06290183A (ja) 漢字変換装置
JPS6079469A (ja) 日本語文の語「い」上「あい」味性検出装置
JPH04372047A (ja) 仮名漢字変換装置
JPH0546612A (ja) 文章誤り検出装置
JPS6132167A (ja) カナ漢字変換処理装置
JPH03116265A (ja) かな漢字変換装置
Sadigh et al. A rule-based approach to farsi language text-to-phoneme conversion.
JPS6395572A (ja) 日本語文形態素解析における未知語処理方法