JPS62251960A - かな漢字変換装置 - Google Patents
かな漢字変換装置Info
- Publication number
- JPS62251960A JPS62251960A JP61096291A JP9629186A JPS62251960A JP S62251960 A JPS62251960 A JP S62251960A JP 61096291 A JP61096291 A JP 61096291A JP 9629186 A JP9629186 A JP 9629186A JP S62251960 A JPS62251960 A JP S62251960A
- Authority
- JP
- Japan
- Prior art keywords
- clause
- candidate
- kana
- candidates
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000006243 chemical reaction Methods 0.000 claims abstract description 23
- 238000000926 separation method Methods 0.000 claims description 4
- 240000000220 Panda oleosa Species 0.000 abstract description 9
- 235000016496 Panda oleosa Nutrition 0.000 abstract description 9
- 238000004458 analytical method Methods 0.000 abstract description 8
- 239000000284 extract Substances 0.000 abstract 1
- 238000012950 reanalysis Methods 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 5
- 238000000034 method Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 210000003127 knee Anatomy 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 206010011878 Deafness Diseases 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 231100000895 deafness Toxicity 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 208000016354 hearing loss disease Diseases 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は、カナコードで入力された日本語文章りかな漢
字混じり文に変換して出方するかな漢字変換装置知関す
る。
字混じり文に変換して出方するかな漢字変換装置知関す
る。
従来のキー人力等により入力された日本語かな文章に対
して自動的に文節区切り髪行ない、複数文節を解析し文
節量位て候補な確定して1八〈事を特徴とするかな漢字
変換装置くおいては文節な(自立語+ItltIli語
)等と仮定し自立語の単語の長さを最長とする候補を次
々と確定して(ハ〈方法(最長一致法)あるいけ、単語
の候補総てを洗い出しその接合を検定し文節数/1′−
滑小となる単語の並びな総て候補とする方法(文節数最
小法)などの方法h;とちれていた。
して自動的に文節区切り髪行ない、複数文節を解析し文
節量位て候補な確定して1八〈事を特徴とするかな漢字
変換装置くおいては文節な(自立語+ItltIli語
)等と仮定し自立語の単語の長さを最長とする候補を次
々と確定して(ハ〈方法(最長一致法)あるいけ、単語
の候補総てを洗い出しその接合を検定し文節数/1′−
滑小となる単語の並びな総て候補とする方法(文節数最
小法)などの方法h;とちれていた。
前者の場合は、自立語の長さめ一滑長のもの/IS候補
となり易いといへ経験則KGづいている為の誤変換の可
能性ht嵩高11車と文節な文の先頭から確定してい〈
為、解析に失敗した場合のバック・トラッキング(11
4−)定地点まで後戻りして解析を1.直す事)に時間
、5(かかる為、実際にけ多くのかな漢字変換装着にお
いて、バッタリド−91キングな行なわず、無理やり自
立語シ当でけめるなどの事による誤変換b’−高い車な
どの不都合fl;多く、後者の場合は全単語な基本的に
は展開する必要がある為莫大な辞iF検索を必要とL
、特に叶属語hS助詞。
となり易いといへ経験則KGづいている為の誤変換の可
能性ht嵩高11車と文節な文の先頭から確定してい〈
為、解析に失敗した場合のバック・トラッキング(11
4−)定地点まで後戻りして解析を1.直す事)に時間
、5(かかる為、実際にけ多くのかな漢字変換装着にお
いて、バッタリド−91キングな行なわず、無理やり自
立語シ当でけめるなどの事による誤変換b’−高い車な
どの不都合fl;多く、後者の場合は全単語な基本的に
は展開する必要がある為莫大な辞iF検索を必要とL
、特に叶属語hS助詞。
助動詞単位等短区間で登録されている場合は、この傾向
^;特I/CJ!i著であり、処理時間h″−長くなる
と1、−、’+不都合がもった。
^;特I/CJ!i著であり、処理時間h″−長くなる
と1、−、’+不都合がもった。
かな漢字変換は、使用者h;より高速にvA変換の少/
7いかな漢字候補を求めるものであり、R初の候補をユ
ーザーの求める最も可能性の高い候補を出力し、その砕
はユーザーの希望で叫度解析シすれば良いとい5特@な
持も、入力とかな漢字変換処1と髪同時平行的に行なわ
ない場合、これらな2つに分割する車は再伸である、 〔発明hs解決しようとする間嗜点〕 前述の従来技術に対して、より誤変換の少ない填1候補
?、より高速に出方する為には、前記の様に1文節区切
りに誤りの少ない方法で文節区切りシ行なlA第1候補
文節列な出方し、その後に文節量位に解析を深める手段
ht必要となる。
7いかな漢字候補を求めるものであり、R初の候補をユ
ーザーの求める最も可能性の高い候補を出力し、その砕
はユーザーの希望で叫度解析シすれば良いとい5特@な
持も、入力とかな漢字変換処1と髪同時平行的に行なわ
ない場合、これらな2つに分割する車は再伸である、 〔発明hs解決しようとする間嗜点〕 前述の従来技術に対して、より誤変換の少ない填1候補
?、より高速に出方する為には、前記の様に1文節区切
りに誤りの少ない方法で文節区切りシ行なlA第1候補
文節列な出方し、その後に文節量位に解析を深める手段
ht必要となる。
前述の問題点を解決する為には、本発明は単語にたとえ
ば次の様な固有コストけけを行ない、自立語=2 助数詞=0 けllli語=0 さらに1文節間の棒金条件てよるコスト叶はシ行ない、
全体とL7て総コスト^″−屑小となる文節区切りを優
先度の高い文節区切りとして確定し、その債の文節候補
要求に応じて適時逐次的に解析な行なへ事という手段を
講じる。
ば次の様な固有コストけけを行ない、自立語=2 助数詞=0 けllli語=0 さらに1文節間の棒金条件てよるコスト叶はシ行ない、
全体とL7て総コスト^″−屑小となる文節区切りを優
先度の高い文節区切りとして確定し、その債の文節候補
要求に応じて適時逐次的に解析な行なへ事という手段を
講じる。
本発明は、上記の構成により、まず入力部においてかな
文字列を入力し、かな漢字変換実行キーが押下された時
、このかな文字列を入力データとして1文節を自立諸子
は属語と仮定して1文部相区切り?行なうと共に、これ
に伴5文節候補を作成する。
文字列を入力し、かな漢字変換実行キーが押下された時
、このかな文字列を入力データとして1文節を自立諸子
は属語と仮定して1文部相区切り?行なうと共に、これ
に伴5文節候補を作成する。
そして、これら文節候補のうち総コストh;@低とrf
る文節列シ文節粗区切り候補として確定し、この文節区
切りに合致する1文節候補をI!1文節候補群とする、 この第1文部候補列をまず表示し、これらの文節候補で
よかったら確定する。しかし、文節区切りが正しぐても
1文節の前候補、次候補な要求されt場合、別個に文節
内解析に入る。
る文節列シ文節粗区切り候補として確定し、この文節区
切りに合致する1文節候補をI!1文節候補群とする、 この第1文部候補列をまず表示し、これらの文節候補で
よかったら確定する。しかし、文節区切りが正しぐても
1文節の前候補、次候補な要求されt場合、別個に文節
内解析に入る。
そ1.て、文節次候補h;選択行為により無くなり7を
場合は、文節を自立語+W!尾語+け積和あるbけ埠頭
語+自ブ諸子寸属語などと仮定し文節区切り内部か単文
節として丙解析し、候補を増加し。
場合は、文節を自立語+W!尾語+け積和あるbけ埠頭
語+自ブ諸子寸属語などと仮定し文節区切り内部か単文
節として丙解析し、候補を増加し。
ユーードーに示す。これによってユーザーへの応答)時
間の短縮h;図れる。
間の短縮h;図れる。
ここで、以下に本発明の詳細な図示しt実施例Vr−茎
づいて説明すう。
づいて説明すう。
填1図は本発明のかな漢字変換装着の一実施例シ示す1
カでちる6章中符号1け入力部2(キーボー)”l)よ
り入力されたデータだ基づき5システム全体の制御を行
なう中央部8!!seである。入力部2により読入込ま
れた文字列および制御コードは、かな漢字変換装置8て
送られかな漢字変換h;行なわれる。
カでちる6章中符号1け入力部2(キーボー)”l)よ
り入力されたデータだ基づき5システム全体の制御を行
なう中央部8!!seである。入力部2により読入込ま
れた文字列および制御コードは、かな漢字変換装置8て
送られかな漢字変換h;行なわれる。
かな文字入力部9により取り込まれた(401)かな文
字列は文節区切り部10により、辞書展開区分11にシ
いて、自立語辞書13及びけ属語辞書12より単語候補
を抽出しながら単語検定部11により相互の連結の可能
性を検定しなh;ら、凰語間の連接によるコスト叶けを
行ないなめ;ら9文節量位に候補を並べると共に文節末
に対応し友桁単位の総合コストテーブルに該当桁で文節
末となる文節までの総コストの最小値な持ち、新ただ候
補として展開され九文節でこの値よりも総コスト1′1
′−犬救いものを候補としないという処理を行ない、最
終的に文節の総コストの最小のバス?候補として1文節
区切りが確定され、さらば、ここで作成された文節候補
は1文節候補格納部17に格納される(402)。
字列は文節区切り部10により、辞書展開区分11にシ
いて、自立語辞書13及びけ属語辞書12より単語候補
を抽出しながら単語検定部11により相互の連結の可能
性を検定しなh;ら、凰語間の連接によるコスト叶けを
行ないなめ;ら9文節量位に候補を並べると共に文節末
に対応し友桁単位の総合コストテーブルに該当桁で文節
末となる文節までの総コストの最小値な持ち、新ただ候
補として展開され九文節でこの値よりも総コスト1′1
′−犬救いものを候補としないという処理を行ない、最
終的に文節の総コストの最小のバス?候補として1文節
区切りが確定され、さらば、ここで作成された文節候補
は1文節候補格納部17に格納される(402)。
これらの解析が終了し次段階で、かな漢字候補選択部3
により、表示要求hz出され、文節候補格納部17より
最初の文節候補群が文節候補表示部4により、表示部5
に表示される。ユーザーは。
により、表示要求hz出され、文節候補格納部17より
最初の文節候補群が文節候補表示部4により、表示部5
に表示される。ユーザーは。
かな漢字候補選択部3により文節量位に、前候補・次候
補を表示し、求めるかな漢字文節な選択するh″−1こ
こで次候補な行なかうとして、当該文節の次には、もけ
や文節候補h′−俯い場合、再変換指定部15に対して
巣文節賓換要求な出すと単文節解析部16け文節候補が
どこ亨で再開[7たかを確認[7、要求のrfS度1文
節を次の形態であると仮定し、順次解析結果な要求の都
度出力する(ans)。
補を表示し、求めるかな漢字文節な選択するh″−1こ
こで次候補な行なかうとして、当該文節の次には、もけ
や文節候補h′−俯い場合、再変換指定部15に対して
巣文節賓換要求な出すと単文節解析部16け文節候補が
どこ亨で再開[7たかを確認[7、要求のrfS度1文
節を次の形態であると仮定し、順次解析結果な要求の都
度出力する(ans)。
(1) 自立語+接尾諸子は属語
(2) 埠頭語+自立諸子ば属語
(3) 接頭語+自立語+接尾諸子は属語これにより
作成され欧文節候補は、文節候補格納部17に文節区切
りの位置に格納され、その濱1候補は文節候補表示部4
により表示部5に表示されユーザーの選択を待つ。
作成され欧文節候補は、文節候補格納部17に文節区切
りの位置に格納され、その濱1候補は文節候補表示部4
により表示部5に表示されユーザーの選択を待つ。
さらに、ニー41−は文節区切りその本のに誤り品もる
場合は、耳文節範囲指定部7で文節の長さを騨整で弾、
これにより指定された文節範囲で。
場合は、耳文節範囲指定部7で文節の長さを騨整で弾、
これにより指定された文節範囲で。
再変換指定部45により羞文節変換が前記と同様て実施
され、その候補は文節候補格納部17に格納され、さら
に1文節指定の残りのかな文字列【ついては、1つの文
字列として4度この部分に対して文節区切り部10で文
節区切り?行ない、その候補8−文節候補格納部17に
格納L−!新の文節区切りと−Cる。
され、その候補は文節候補格納部17に格納され、さら
に1文節指定の残りのかな文字列【ついては、1つの文
字列として4度この部分に対して文節区切り部10で文
節区切り?行ない、その候補8−文節候補格納部17に
格納L−!新の文節区切りと−Cる。
この様にして5文節の赤部とQR換シ繰り返して、ニー
→1−は目的のかな澤字文字列を選択1.。
→1−は目的のかな澤字文字列を選択1.。
全部hz求めるものとなった段階で、文節候補格納部6
により候補な確定する。
により候補な確定する。
第2図は1文節の粗区切り髪行なう際の状聾を示す図で
あり、まず1桁目から文節の候補シ文節の形式に組立て
た秋期で作成し、全Uが終了したら、その最長のものの
次の桁、例でけ7桁目より解析を再開する。この様に続
けていくと図の様な候補群b−展開で鎗、この場合でい
えば、「車ですら7箱を、/運んでいる。」h′−候補
となり1文節区切りl−41−6,7−9,1Q−15
,16となる。
あり、まず1桁目から文節の候補シ文節の形式に組立て
た秋期で作成し、全Uが終了したら、その最長のものの
次の桁、例でけ7桁目より解析を再開する。この様に続
けていくと図の様な候補群b−展開で鎗、この場合でい
えば、「車ですら7箱を、/運んでいる。」h′−候補
となり1文節区切りl−41−6,7−9,1Q−15
,16となる。
113図は2文節の候補り一作成されたのちに再度単文
節解析を行なっt場合の図でもつ、細い枠囲いflS文
節区切り処理中K、文節を自立諸子は頃語と仮定して作
成されtものであり、このf1回目の再変換により、上
気(n hz J応され1文節な自立語+接尾諸子けW
4語とした場合の図中の太い枠囲いの「木業」 「具体
化J h−候補として作成される。
節解析を行なっt場合の図でもつ、細い枠囲いflS文
節区切り処理中K、文節を自立諸子は頃語と仮定して作
成されtものであり、このf1回目の再変換により、上
気(n hz J応され1文節な自立語+接尾諸子けW
4語とした場合の図中の太い枠囲いの「木業」 「具体
化J h−候補として作成される。
この場合「挙1 「化」は接尾語である。又1以上の実
楕例では、当初の文節区切りにおいて1gi小値となる
ように1.たh′−1電入寸けを賓★、て、やれば膏大
値となるよう区切ってもよい。
楕例では、当初の文節区切りにおいて1gi小値となる
ように1.たh′−1電入寸けを賓★、て、やれば膏大
値となるよう区切ってもよい。
〔発明の効果〕
LgJ、 l:説明し之様に1本発明によれば、かな漢
字瞥換て訃ける1文節内部の詳細な實換処理シュー→ど
−に行な5か否か判断させた後で行なう為、濱1番目の
候補を出力するまでの時間には粗い解析の入で行なえろ
為、その時間b′−短縮できる。
字瞥換て訃ける1文節内部の詳細な實換処理シュー→ど
−に行な5か否か判断させた後で行なう為、濱1番目の
候補を出力するまでの時間には粗い解析の入で行なえろ
為、その時間b′−短縮できる。
−!た。この考えシ拡張して1文節区切りな一意に確定
せず、総ての最小コストの文節区切りシ区切り情報とし
て持ち、これシも切り換える様に変更した場合、さらに
かな漢字変換精度を向−ヒする事h;で欠る。
せず、総ての最小コストの文節区切りシ区切り情報とし
て持ち、これシも切り換える様に変更した場合、さらに
かな漢字変換精度を向−ヒする事h;で欠る。
4、 図面の?1ill亀な説明
第1図は本発明の/l−な涜字変攬装置の歓略を示す慢
昨ブo1り図である。
昨ブo1り図である。
第2図は水先明随むける文節区切りシ行なう場合の候補
作成の概略例を示すすでもる、第3図は本発明における
文節外!換シ行なう場合の候補作成の15略例を示す図
であ石。
作成の概略例を示すすでもる、第3図は本発明における
文節外!換シ行なう場合の候補作成の15略例を示す図
であ石。
wt4図は本発明の処理内容を示す7a−チャートであ
る。
る。
8・・・・・・かな漢字変4@l装肯
以 h
Claims (1)
- 各文節量位の変換結果に重み付けを行ない該重み付けの
結果が極値をとるよう文節を区切る文節区切り手段と、
該文節区切り手段によって粗区切りされたおのおの文節
について、さらに再解析をして新たな候補文字列を作成
する再解析手段を有することを特徴とするかな漢字変換
装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61096291A JPH0827795B2 (ja) | 1986-04-25 | 1986-04-25 | かな漢字変換装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61096291A JPH0827795B2 (ja) | 1986-04-25 | 1986-04-25 | かな漢字変換装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS62251960A true JPS62251960A (ja) | 1987-11-02 |
JPH0827795B2 JPH0827795B2 (ja) | 1996-03-21 |
Family
ID=14160965
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP61096291A Expired - Lifetime JPH0827795B2 (ja) | 1986-04-25 | 1986-04-25 | かな漢字変換装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0827795B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH038051A (ja) * | 1988-11-16 | 1991-01-16 | Ricoh Co Ltd | 自然言語処理システム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5880771A (ja) * | 1981-11-06 | 1983-05-14 | Mitsubishi Electric Corp | かな漢字変換処理装置 |
JPS60189069A (ja) * | 1984-03-08 | 1985-09-26 | Matsushita Electric Ind Co Ltd | かな漢字変換装置 |
-
1986
- 1986-04-25 JP JP61096291A patent/JPH0827795B2/ja not_active Expired - Lifetime
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5880771A (ja) * | 1981-11-06 | 1983-05-14 | Mitsubishi Electric Corp | かな漢字変換処理装置 |
JPS60189069A (ja) * | 1984-03-08 | 1985-09-26 | Matsushita Electric Ind Co Ltd | かな漢字変換装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH038051A (ja) * | 1988-11-16 | 1991-01-16 | Ricoh Co Ltd | 自然言語処理システム |
Also Published As
Publication number | Publication date |
---|---|
JPH0827795B2 (ja) | 1996-03-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH0675992A (ja) | テキストをインデックス及び検索するための関連ワード形態の限定状態トランスジューサ | |
JPH07114558A (ja) | 漢字変換訂正処理方式 | |
JP2002117027A (ja) | 感情情報抽出方法および感情情報抽出プログラムの記録媒体 | |
JPH11238051A (ja) | 中国語入力変換処理装置、中国語入力変換処理方法、中国語入力変換処理プログラムを記録した記録媒体 | |
JPS62251960A (ja) | かな漢字変換装置 | |
JP2943791B2 (ja) | 言語識別装置,言語識別方法および言語識別のプログラムを記録した記録媒体 | |
JP3952964B2 (ja) | 読み情報決定方法及び装置及びプログラム | |
JP2659700B2 (ja) | かな漢字変換方法 | |
JP5169602B2 (ja) | 形態素解析装置、形態素解析方法及びコンピュータプログラム | |
KR101777141B1 (ko) | 한글 입력 키보드를 이용한 훈민정음 기반 중국어 및 외국어 입력 장치 및 방법 | |
JP3533591B2 (ja) | 文字入力装置、文字入力方法および文字入力制御プログラムを記録した記録媒体 | |
JPH08272780A (ja) | 中国語入力処理装置及び中国語入力処理方法及び言語処理装置及び言語処理方法 | |
JP2802369B2 (ja) | かな漢字変換装置 | |
KR860000681B1 (ko) | 한글/한자 워드프로 세서 | |
JP2024021555A (ja) | 日本語入力システムのkearm優先変換 | |
JPS63163956A (ja) | 文書作成・校正支援装置 | |
JPH0612453A (ja) | 未知語抽出登録装置 | |
JPH01118961A (ja) | 翻訳装置 | |
JPH07104863B2 (ja) | かな漢字変換装置 | |
JPH08171568A (ja) | 複数言語入力方法 | |
JPH086950A (ja) | キーワード翻訳機能付き機械翻訳装置 | |
JPH11238060A (ja) | 自然言語処理装置 | |
JPH0546612A (ja) | 文章誤り検出装置 | |
JPS61246869A (ja) | 音声日本語情報処理装置 | |
JPH0267676A (ja) | 漢数字変換処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
EXPY | Cancellation because of completion of term |