JPS5979339A - 仮名・漢字変換方式 - Google Patents
仮名・漢字変換方式Info
- Publication number
- JPS5979339A JPS5979339A JP57190123A JP19012382A JPS5979339A JP S5979339 A JPS5979339 A JP S5979339A JP 57190123 A JP57190123 A JP 57190123A JP 19012382 A JP19012382 A JP 19012382A JP S5979339 A JPS5979339 A JP S5979339A
- Authority
- JP
- Japan
- Prior art keywords
- kanji
- kana
- character string
- analysis
- converted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/53—Processing of non-Latin text
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔発明の技術分野〕
本発明は仮名文字列として入力された仮名文を効率良く
適確に仮名・漢字変換して日本語文章を作成することの
できる実用性の高い似者・漢字変換方式に関する。
適確に仮名・漢字変換して日本語文章を作成することの
できる実用性の高い似者・漢字変換方式に関する。
近時、ワードプロセッサを用いて仮名文字列として入力
した仮名文を適宜漢字変換して仮名漢字混シの日本語文
章を作成することが行われている。このワードプロセッ
サは従来一般に入力された仮名文字列を文節や文毎に区
切って処理単位とし、これを分析すると共にその単位中
の仮名文字列を上記分析の結果に従って漢字変換してこ
れを表示するものである。然し乍ら、従来の仮名・漢字
変換処理にあっては、次のような問題があった。即ち、
仮名文を文節単位に区切って分析し、その分析結果に従
って仮名文字を漢字変換する場合、同音異義語が存在す
ることから上記分析結果だけがらは適切な変換漢字を見
出すことができなくなると云う問題がある。この場合、
一般的には複数の候補漢字の出現頻度の情報を利用して
変換漢字を決定すること等が行われているが、その決定
要素としては甚だ不十分であった。また仮名文の文節単
位での分析が進んで、既に変換した漢字が不適切である
ことが見出されたとしても、その訂正に煩雑な処理を必
要とした。
した仮名文を適宜漢字変換して仮名漢字混シの日本語文
章を作成することが行われている。このワードプロセッ
サは従来一般に入力された仮名文字列を文節や文毎に区
切って処理単位とし、これを分析すると共にその単位中
の仮名文字列を上記分析の結果に従って漢字変換してこ
れを表示するものである。然し乍ら、従来の仮名・漢字
変換処理にあっては、次のような問題があった。即ち、
仮名文を文節単位に区切って分析し、その分析結果に従
って仮名文字を漢字変換する場合、同音異義語が存在す
ることから上記分析結果だけがらは適切な変換漢字を見
出すことができなくなると云う問題がある。この場合、
一般的には複数の候補漢字の出現頻度の情報を利用して
変換漢字を決定すること等が行われているが、その決定
要素としては甚だ不十分であった。また仮名文の文節単
位での分析が進んで、既に変換した漢字が不適切である
ことが見出されたとしても、その訂正に煩雑な処理を必
要とした。
一方、文の如き長い単位でその分析を行い、その分析結
果に従って仮名・漢字変換を行うことによシ、同音異義
語に対する選択情報を多く得て、変換誤シを少なくする
ことが試みられている。然し乍ら、上記処理単位が文で
示され、長い為にその分析に多大な処理時間を必要とす
る。この為、仮名文を順次入力しながら、それをモニタ
することができなくなシ、オペレータの不安が増すと云
う不具合があった。
果に従って仮名・漢字変換を行うことによシ、同音異義
語に対する選択情報を多く得て、変換誤シを少なくする
ことが試みられている。然し乍ら、上記処理単位が文で
示され、長い為にその分析に多大な処理時間を必要とす
る。この為、仮名文を順次入力しながら、それをモニタ
することができなくなシ、オペレータの不安が増すと云
う不具合があった。
〔発明の目的〕
本発明はこのような事情を考慮してなされたもので、そ
の目的とするところは、入力された仮名文を効率良く分
析して逐次所定の仮名文字゛を漢字変換し、且つ同音異
義語に対しても適切な漢字変換を行い得る実用性の高い
仮名・漢字変換方式を提供することにある。
の目的とするところは、入力された仮名文を効率良く分
析して逐次所定の仮名文字゛を漢字変換し、且つ同音異
義語に対しても適切な漢字変換を行い得る実用性の高い
仮名・漢字変換方式を提供することにある。
本発明は入力された仮名文字列を所定の単位で逐次分析
し、その分析結果に従って仮名文字列を適宜漢字変換す
ると共に、上記分析の進行に伴って既に変換された漢字
で不適切々ものが見出されたとき、その仮名文字列が有
する他の候補漢字から前記新た彦分析結果に従って適切
なものを見出して遡及的に修正し、これによって適確な
仮名・漢字流シの日本語文章を作成するようにしたもの
である。
し、その分析結果に従って仮名文字列を適宜漢字変換す
ると共に、上記分析の進行に伴って既に変換された漢字
で不適切々ものが見出されたとき、その仮名文字列が有
する他の候補漢字から前記新た彦分析結果に従って適切
なものを見出して遡及的に修正し、これによって適確な
仮名・漢字流シの日本語文章を作成するようにしたもの
である。
従って本発明によれば、リアルタイムに入力した仮名文
を、例えば文節単位で漢字変換して表示し、上記仮名文
の入力操作に伴ってその分析が進行し、これによって既
に変換された漢字に誤シが見出されたときには、これを
遡及的に修正するので、最終的には良好なる日本語文章
を作成することが可能となる。しかも、オ被レークは、
仮名文字列を順に入力し、その漢字変換を即時的にモニ
タし乍ら日本語文章作成作業を行い得る。そして、誤っ
た変換漢字に対しては遡及的にその修正が行われるので
、煩られしい修正処理を必要としない。故に、文書作成
を行うオペレータに、その入力操作に対する不安を与え
ることがなく、またその負担を大幅に軽減することがで
きる。そして、仮名・漢字変換処理の効率向上を図るこ
とができ、実用上多大なる効果が奏せられる。
を、例えば文節単位で漢字変換して表示し、上記仮名文
の入力操作に伴ってその分析が進行し、これによって既
に変換された漢字に誤シが見出されたときには、これを
遡及的に修正するので、最終的には良好なる日本語文章
を作成することが可能となる。しかも、オ被レークは、
仮名文字列を順に入力し、その漢字変換を即時的にモニ
タし乍ら日本語文章作成作業を行い得る。そして、誤っ
た変換漢字に対しては遡及的にその修正が行われるので
、煩られしい修正処理を必要としない。故に、文書作成
を行うオペレータに、その入力操作に対する不安を与え
ることがなく、またその負担を大幅に軽減することがで
きる。そして、仮名・漢字変換処理の効率向上を図るこ
とができ、実用上多大なる効果が奏せられる。
以下、図面を参照して本発明の一実施例につき説明する
。
。
第1図は実施例方式における仮名・漢字変換処理の流れ
を示す図であシ、第2図(a) 、 (b)は仮名漢字
変換の一例を示す図である。キーボード等を介して仮名
文字列から力る仮名文が入力されると、先ずその仮名文
を例えば文節毎に切出す処理が行われる(ステップ1)
。このステップ1において、仮名文字列がその処理単位
(文節)毎に漢字変換処理される。この漢字変換処理」
・0−〜 理は、上記処理単位の仮名文字列を見出しとして辞書を
検索すること等によって行われる。そして、上記見出し
に該当する漢字が見出されたとき、ステップ2において
これを暫定的に表示する。尚、該当する漢字が存在しな
い場合には、その仮名文字列をそのまま表示する。また
該当する漢字が複数存在する場合、つまシ同音異義語が
存在する場合には、例えばその出現頻度の情報等に従っ
て、適切であると予想される漢字を暫定的に表示する。
を示す図であシ、第2図(a) 、 (b)は仮名漢字
変換の一例を示す図である。キーボード等を介して仮名
文字列から力る仮名文が入力されると、先ずその仮名文
を例えば文節毎に切出す処理が行われる(ステップ1)
。このステップ1において、仮名文字列がその処理単位
(文節)毎に漢字変換処理される。この漢字変換処理」
・0−〜 理は、上記処理単位の仮名文字列を見出しとして辞書を
検索すること等によって行われる。そして、上記見出し
に該当する漢字が見出されたとき、ステップ2において
これを暫定的に表示する。尚、該当する漢字が存在しな
い場合には、その仮名文字列をそのまま表示する。また
該当する漢字が複数存在する場合、つまシ同音異義語が
存在する場合には、例えばその出現頻度の情報等に従っ
て、適切であると予想される漢字を暫定的に表示する。
しかるのち、ステップ3では、上記漢字変換処理に供せ
られた処理単位の仮名文字列に対する構文・意味の分析
が行われる。この分析処理は、既に分析処理に供された
前段の文字列に加えて行われる。つまυ、文節単位で分
析された結果に加えて、各文節のつながシ関係等が総合
的に分析される。しかして、ステラf4では上記分析結
果を得て、既に漢字変換されたものの中で同音異義の他
の変換候補漢字を有するもののうし、文の描込中、適切
なものがあるか否かが判定される。この判定によって、
同音異義漢字のうち、文の構造上適切なものが見出され
た場合、その漢字が正しい変換漢字であるとして、ステ
ップ5の処理によシ決定される。この決定結果が、先に
暫定的に定めた漢字と同じものである場合には、表示さ
れている漢字がその一11文章情報として確定される。
られた処理単位の仮名文字列に対する構文・意味の分析
が行われる。この分析処理は、既に分析処理に供された
前段の文字列に加えて行われる。つまυ、文節単位で分
析された結果に加えて、各文節のつながシ関係等が総合
的に分析される。しかして、ステラf4では上記分析結
果を得て、既に漢字変換されたものの中で同音異義の他
の変換候補漢字を有するもののうし、文の描込中、適切
なものがあるか否かが判定される。この判定によって、
同音異義漢字のうち、文の構造上適切なものが見出され
た場合、その漢字が正しい変換漢字であるとして、ステ
ップ5の処理によシ決定される。この決定結果が、先に
暫定的に定めた漢字と同じものである場合には、表示さ
れている漢字がその一11文章情報として確定される。
また暫定的に定めた漢字と新たに決定された漢字とが異
なる場合には、その表示された漢字が修正されて、文章
情報として確定される。その後、ステップ6において、
後に続く文字列が存在するか否かが判定され、入力文字
列が存在する場合には、ステップ1からの処理が繰返し
実行される。
なる場合には、その表示された漢字が修正されて、文章
情報として確定される。その後、ステップ6において、
後に続く文字列が存在するか否かが判定され、入力文字
列が存在する場合には、ステップ1からの処理が繰返し
実行される。
ことで重要々ことは、ステラf3,4における処理であ
って、入力された仮名文字列の分析が、その変換処理単
位にとどまらず、処理単位(文節)IHlのつながり関
係や、その意味を含めて行われることである。従って、
入力された仮名文の分析が進むにつれて新たな分析結果
が次次に得られ、これによって既に変換処理を終えた文
節の中で不適切な漢字変換が行われたものが見出される
。この不適切な変換漢字を得た仮名文字列は、同音異義
の他の候補漢字を有することを意味する。そして、その
中の適切なものは、進行した多くの分析結果からして容
易に選ぶことが可能となる。従って、先にリアルタイム
に暫定的に変換した漢字が不適切であったとしても、仮
名文の分析が進むに従ってこれを修正することが可能と
なり、故に遡及的に適切な漢字変換を行うことができる
。
って、入力された仮名文字列の分析が、その変換処理単
位にとどまらず、処理単位(文節)IHlのつながり関
係や、その意味を含めて行われることである。従って、
入力された仮名文の分析が進むにつれて新たな分析結果
が次次に得られ、これによって既に変換処理を終えた文
節の中で不適切な漢字変換が行われたものが見出される
。この不適切な変換漢字を得た仮名文字列は、同音異義
の他の候補漢字を有することを意味する。そして、その
中の適切なものは、進行した多くの分析結果からして容
易に選ぶことが可能となる。従って、先にリアルタイム
に暫定的に変換した漢字が不適切であったとしても、仮
名文の分析が進むに従ってこれを修正することが可能と
なり、故に遡及的に適切な漢字変換を行うことができる
。
この例について第2図(a> (b)をか照して説明す
る。今、「キシャガ」なる仮名文が入力されると、その
仮名文字列を見出しとして辞書が検索される。このとき
辞書には、例えば第3図に示す如き複数の該当漢字が存
在する。従って、例えばその出現頻度に従って「汽車」
なる漢字を特定的に選択し、「汽車が」と表示する。こ
のとき、他の候補漢字「記者」「貴社」「帰社」を補助
的に表示し、同音異義語が存在することを示すようにし
てもよい。しかるのち、前記「キシャガ」に続いて「キ
シャシタ」なる仮名文字列が入力されると、この文節の
「キシャ」なる文字列に対しても同様に漢字検索が行わ
れる。このとき、先に分析された文節の「キシャガ」な
る分析結果から、「キシャ」が主語となるものであるこ
とが見出されておシ、また「キシャシク」なる文節の分
析によってその意味が見出される。即ち「キシャシタ」
なる文字列の「シタ」なる意味から、その文字列は動作
を示すものであることが見出される。この結果、辞書に
登録された漢字の属性情報、つまシ品詞、意味マーカに
よって、「キシャ」に対する適切な漢字が「帰社」であ
ることが判定される。そしてこの「帰社した」なる文節
の意味から、その主語となシ得るものが人間であること
が分析される。この結果、既に変換処理された「キシャ
ガ」なる文節が主語としての意味を持ち、「帰社した」
との係シから人間でなければならないので、前記辞書の
属性情報を参照して「記者」なる漢字が選択されること
になる。これによって前記「汽車が」なる文節が第2図
(b)に示すように「記者が」に遡及的に修正され、「
帰社した」と共に表示されることになる。尚、ここでは
先に入力した文節の仮名文字列とそれに続いて入力した
文節の仮名文字列とが同じ「キシャ」で示されるものに
つき説明したが、これに限定されないことは云うまでも
ない。また更に多くの文節にまたがって、その文構造が
分析され、これによって遡及的に変換漢字の修正がなさ
れることもあシ得ることは云うまでもない。
る。今、「キシャガ」なる仮名文が入力されると、その
仮名文字列を見出しとして辞書が検索される。このとき
辞書には、例えば第3図に示す如き複数の該当漢字が存
在する。従って、例えばその出現頻度に従って「汽車」
なる漢字を特定的に選択し、「汽車が」と表示する。こ
のとき、他の候補漢字「記者」「貴社」「帰社」を補助
的に表示し、同音異義語が存在することを示すようにし
てもよい。しかるのち、前記「キシャガ」に続いて「キ
シャシタ」なる仮名文字列が入力されると、この文節の
「キシャ」なる文字列に対しても同様に漢字検索が行わ
れる。このとき、先に分析された文節の「キシャガ」な
る分析結果から、「キシャ」が主語となるものであるこ
とが見出されておシ、また「キシャシク」なる文節の分
析によってその意味が見出される。即ち「キシャシタ」
なる文字列の「シタ」なる意味から、その文字列は動作
を示すものであることが見出される。この結果、辞書に
登録された漢字の属性情報、つまシ品詞、意味マーカに
よって、「キシャ」に対する適切な漢字が「帰社」であ
ることが判定される。そしてこの「帰社した」なる文節
の意味から、その主語となシ得るものが人間であること
が分析される。この結果、既に変換処理された「キシャ
ガ」なる文節が主語としての意味を持ち、「帰社した」
との係シから人間でなければならないので、前記辞書の
属性情報を参照して「記者」なる漢字が選択されること
になる。これによって前記「汽車が」なる文節が第2図
(b)に示すように「記者が」に遡及的に修正され、「
帰社した」と共に表示されることになる。尚、ここでは
先に入力した文節の仮名文字列とそれに続いて入力した
文節の仮名文字列とが同じ「キシャ」で示されるものに
つき説明したが、これに限定されないことは云うまでも
ない。また更に多くの文節にまたがって、その文構造が
分析され、これによって遡及的に変換漢字の修正がなさ
れることもあシ得ることは云うまでもない。
このようにして、順次入力される仮名文字によって示さ
れる仮名文は、その処理単位毎に即時的に適宜仮名・−
字変換され、同時にその分析が進行するに伴い、分析結
果に従って不適切な変換漢字を遡及的に修正される。従
ってオペレータニ1、仮名文の入力状況をリアルタイム
にモニタすることができ、またその修正作業が遡及的に
行われるので簡易に且つ効率良く文章作成作業を行うこ
とが可能となシ、その負担も大幅に軽減される等の効果
が奏せられる。
れる仮名文は、その処理単位毎に即時的に適宜仮名・−
字変換され、同時にその分析が進行するに伴い、分析結
果に従って不適切な変換漢字を遡及的に修正される。従
ってオペレータニ1、仮名文の入力状況をリアルタイム
にモニタすることができ、またその修正作業が遡及的に
行われるので簡易に且つ効率良く文章作成作業を行うこ
とが可能となシ、その負担も大幅に軽減される等の効果
が奏せられる。
尚、本発明は上記実施例にのみ限定されるものではない
。例えば辞制の構成や、文の分析処理法等のアルゴリズ
ムは、その仕様に応じて定めればよいものである。また
、処理単位も文節に限定されることはない。また文間の
つガがシ関係から、その意味を抽出するようにしてもよ
く、分析処理と、同音異義語の決定に用いる属性情報も
特に制限されない。厭するに本発明はその要旨を逸脱し
ない範囲で種々変形して実施することができる。
。例えば辞制の構成や、文の分析処理法等のアルゴリズ
ムは、その仕様に応じて定めればよいものである。また
、処理単位も文節に限定されることはない。また文間の
つガがシ関係から、その意味を抽出するようにしてもよ
く、分析処理と、同音異義語の決定に用いる属性情報も
特に制限されない。厭するに本発明はその要旨を逸脱し
ない範囲で種々変形して実施することができる。
図は本発明の一実施例方式を説明する為のもので、第1
図は処理の流れを示す図、第2図は仮名・漢字変換の一
例を示す図、第3図は辞書の構成を示す図である。 1・・・処理単位切出しステップ、2・・・漢字変換出
力ステップ、3・・・分析処理ステップ、4・・・同音
異義語の判定ステップ、5・・・同音異義語の決定ステ
ップ。 出願人代理人 弁理士 鈴 江 武 彦第1図 第 2図 第3図
図は処理の流れを示す図、第2図は仮名・漢字変換の一
例を示す図、第3図は辞書の構成を示す図である。 1・・・処理単位切出しステップ、2・・・漢字変換出
力ステップ、3・・・分析処理ステップ、4・・・同音
異義語の判定ステップ、5・・・同音異義語の決定ステ
ップ。 出願人代理人 弁理士 鈴 江 武 彦第1図 第 2図 第3図
Claims (3)
- (1) 入力された仮名文を分析する手段と、この分
析結果に従って上記仮名文を形成する所定の仮名文字列
を漢字変換する手段と、前記仮名文の分析の進行によっ
て既に漢字変換処理された文字列中に不適切な変換漢字
が見出され、且つ上記変換漢字を得た前記所定の仮名文
字列が他の適切な変換候補漢字を有するとき前記不適切
な変換漢字を上記適切な変換候補漢字で置換する手段と
を具備したことを特徴とする仮名・漢字変換方式。 - (2) 仮名文の分析と所定の仮名文−字列の漢字変
換は文節単位で順次行われるものである特許請求の範囲
第1項記載の仮名・漢字変換方式。 - (3)仮名文字列の漢字変換は仮名文分析の進行に従っ
て順に暫定的に行われるものであって、変換漢字の置換
処理は上記仮名文分析の進行に従って渕及的に行われる
ものである特許請求の範囲第1項記載の仮名・漢字変換
方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57190123A JPS5979339A (ja) | 1982-10-29 | 1982-10-29 | 仮名・漢字変換方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57190123A JPS5979339A (ja) | 1982-10-29 | 1982-10-29 | 仮名・漢字変換方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS5979339A true JPS5979339A (ja) | 1984-05-08 |
Family
ID=16252771
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP57190123A Pending JPS5979339A (ja) | 1982-10-29 | 1982-10-29 | 仮名・漢字変換方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS5979339A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS60191360A (ja) * | 1984-03-12 | 1985-09-28 | Hitachi Ltd | 言語処理方式 |
JPS6231467A (ja) * | 1985-08-01 | 1987-02-10 | Toshiba Corp | 文章作成装置 |
US5384700A (en) * | 1992-10-29 | 1995-01-24 | International Business Machines Corporation | Method and system for storing multiple, modifiable Yomi and Kanji strings in a structured document |
-
1982
- 1982-10-29 JP JP57190123A patent/JPS5979339A/ja active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS60191360A (ja) * | 1984-03-12 | 1985-09-28 | Hitachi Ltd | 言語処理方式 |
JPS6231467A (ja) * | 1985-08-01 | 1987-02-10 | Toshiba Corp | 文章作成装置 |
JPH0433069B2 (ja) * | 1985-08-01 | 1992-06-02 | Tokyo Shibaura Electric Co | |
US5384700A (en) * | 1992-10-29 | 1995-01-24 | International Business Machines Corporation | Method and system for storing multiple, modifiable Yomi and Kanji strings in a structured document |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3691844B2 (ja) | 文書処理方法 | |
US4777600A (en) | Phonetic data-to-kanji character converter with a syntax analyzer to alter priority order of displayed kanji homonyms | |
US20030004702A1 (en) | Partial sentence translation memory program | |
CN114266256A (zh) | 一种领域新词的提取方法及系统 | |
JP2633824B2 (ja) | 仮名漢字変換装置 | |
CN109344389B (zh) | 一种汉盲对照双语语料库的构建方法和系统 | |
JPS5979339A (ja) | 仮名・漢字変換方式 | |
CN113420124A (zh) | 解决语音检索多条件下的冲突方法 | |
JPH0877196A (ja) | 文書情報抽出装置 | |
JPH0619968A (ja) | 専門用語自動抽出装置 | |
JPH06266769A (ja) | 同義語情報作成装置 | |
CN111259159A (zh) | 数据挖掘方法、装置和计算机可读存储介质 | |
JPS63228326A (ja) | キ−ワ−ド自動抽出方式 | |
JPS6175952A (ja) | 文書入力処理方式 | |
JPS5995672A (ja) | 翻訳編集方式 | |
JPH04673A (ja) | 連語登録方法および装置 | |
JP3939264B2 (ja) | 形態素解析装置 | |
JP2766084B2 (ja) | 仮名漢字変換方法 | |
JPH08329059A (ja) | 汎用参照装置 | |
JP3197110B2 (ja) | 自然言語解析装置および機械翻訳装置 | |
JPS6395573A (ja) | 日本語文形態素解析における未知語処理方法 | |
JPH05233714A (ja) | 関連語情報作成支援方式 | |
JP3137329B2 (ja) | 文書編集装置 | |
JPH0687239B2 (ja) | 文字処理装置 | |
JPH05165805A (ja) | かな漢字変換装置 |