JPH0748213B2 - 連文節仮名漢字変換方法および装置 - Google Patents

連文節仮名漢字変換方法および装置

Info

Publication number
JPH0748213B2
JPH0748213B2 JP2323431A JP32343190A JPH0748213B2 JP H0748213 B2 JPH0748213 B2 JP H0748213B2 JP 2323431 A JP2323431 A JP 2323431A JP 32343190 A JP32343190 A JP 32343190A JP H0748213 B2 JPH0748213 B2 JP H0748213B2
Authority
JP
Japan
Prior art keywords
kana
boundary
series
kana character
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2323431A
Other languages
English (en)
Other versions
JPH04195253A (ja
Inventor
宏 金子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP2323431A priority Critical patent/JPH0748213B2/ja
Publication of JPH04195253A publication Critical patent/JPH04195253A/ja
Publication of JPH0748213B2 publication Critical patent/JPH0748213B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】 A.産業上の利用分野 この発明は連文節仮名漢字変換方法および装置に関し、
とくに文節切りの学習を効率良く行えるようにするもの
である。
B.従来の技術 複数の文節について入力仮名文字列を漢字仮名混じり文
に変換する連文節仮名漢字変換手法では、入力仮名文字
列を所定のアルゴリズムで文節候補の単位で分割し(文
節切り)、文節候補の各々に対応する仮名漢字混じりの
文字列を生成して連結し、変換結果としている。そして
この文節切りが誤ったものである場合には正しい文節切
りを学習させ、以降同一の文節切り誤りが生じないよう
にすることも行われつつある。
たとえば「埼玉県では県財政を立て直す」という正書に
対して「さいたまけんではけんざいせいをたてなおす」
という仮名文字列を入力した場合に、「埼玉県で派遣財
政を立て直す」と誤って変換することがある。これは
「埼玉県では/県」と文節切りを行うべきところ、誤っ
て「埼玉県で/派遣」と文節切りを行った結果である。
このような文節切り誤りに対処するために学習を行う場
合には「埼玉県では/県」に修正するときに、以降は正
しく文節切りが行われるように文節切り情報を記憶して
おく。
ところで従来の学習用の文節切り情報は、当該文節切り
誤りのあった入力文字列固有のものであり、たとえば
「さいたまけんではけん」という読みは「埼玉県では
県」という正書に対するものであった。このため類似の
誤りについても個別に学習する必要があった。上述の
「埼玉県では県」を学習したのちに、「ちばけんではけ
ん・・」を入力したときには依然として「千葉県で派
遣」というように文節誤りが起こるおそれがあり、その
場合個別に学習する必要がある。
なおこの発明に関連する先行技術としては特開昭61-147
365号公報および特開昭61-147366公報所載のものがあ
る。
特開昭61-147365号公報の先行技術は正しい境界を含む
文節切り直し前の付属語と、その付属語の先頭から正し
い境界に至る仮名文字列とを記憶し、文節切りの学習を
行う。たとえば「今の日本は」(正書)に対する「いま
のにほんは」という入力が誤って「今のに本は」に変換
されたときには、学習により「のに」と「の」とを記憶
し、以降「のに」が入力されたら「の」の後に文節境界
を置く。しかしこの先行技術では文節切りが付属語の文
字列中で起こる場合しか対処できない。たとえば「今日
は医者に」(正書)が「今日歯医者に」に誤変換された
ときには、誤変換の「今日歯−医者」(−印は正しい文
節境界を示す)において正しい文節境界を含む付属語が
ないのでこの先行技術は適用できない。またこのような
文節切りの学習には弊害(副作用)も多い。付属語の
「のに」が現れたら一律に「の」で文節切りを行うので
は付属語の「のに」を付属語辞書に登録している意味が
なくなってしまう。
特開昭61-147366号公報の先行技術は正しい境界を含む
文節切りなおし前の文節の付属語、その文節に続く自立
語を含む文の情報を記憶して文節切りの学習を行う。た
とえば「表示し内容に注意し」(正書)に対する「ひょ
うじしないようにちゅういし」という入力が誤って「表
示しないように注意し」に変換されたときに、学習によ
り、「しないようにちゅうい」と「し」とを記憶し、以
降「しないようにちゅうい」が入力されたら「し」の後
に文節境界を置く。この先行技術でも特開昭61-147365
号公報の場合と同様な問題が生じる。ただし弊害につい
ては、先の例で「ちゅうい」まで考慮していることから
理解できるように若干改善される。しかし弊害が改善さ
れる反面、学習が有効な文節切り誤りの範囲は狭くなっ
ている。先の例で「注意」に代えて「留意」、「考
慮」、「反映」等が来ると適用できない。
C.発明が解決しようとする課題 この発明は以上の事情を考慮してなされたものであり、
一回の文節切り情報の学習により、当該入力文字固有の
文節切りのみでなく、その入力文字に代表される類型的
な文節切りまで学習でき、効率的な文節切りの学習が可
能であり、しかもそのような類型的な学習による弊害を
極力抑えることができる連文節文節変換手法を提供する
ことを目的としている。
D.課題を解決するための手段 この発明では以上の目的を達成するために、文節切りを
学習するときに、正しい文節境界を包含する文節切り誤
り時の文節に含まれる自立語が、正しい文節境界の直前
の正書時の文節に含まれる自立語と同じときに、当該文
節の自立語に変えて任意の自立語表示を用いて学習を行
うようにしている。このようにして包括的な文節切りの
学習が可能となる。他方、正しい文節境界を包含する文
節切り誤り時の文節に含まれる自立語が、正しい文節境
界の直前の正書時の文節に含まれる自立語と異なるとき
には、当該文節の自立語自体を用いて、包括的な学習を
止め、包括的な学習による弊害が生じないようにしてい
る。
なおここで自立語等の定義について触れておく。上述の
とおり連文節仮名漢字変換ではまず文節切りを行う。そ
してこの文節切りは第1の辞書(または辞書の部分)に
登録されている語と、第2の辞書(または辞書の部分)
に登録されている語(空の文字列も含む、後述例)とを
接続して文節を構成し、これを入力文字列に突き合わせ
て行う。ここでは第1の辞書に登録されている語を自立
語といい、第2の辞書に登録されている語を付属語とい
う。たとえば前の「埼玉県では県」は「埼玉(自立語)
−空文字列(付属語)−県(自立語)−では(付属語)
−県(自立語)」から構成されている。
E.実施例 以下この発明の一実施例について説明する。
第1図はこの実施例を全体として示すものである。な
お、第1図では機能ブロックを用いてハードウェアの実
現態様を示しているが、ソフトウェアで実現できること
はもちろんである。第1図において、仮名漢字変換部1
は仮名入力INを受け取って辞書2を参照しながら連文節
仮名漢字変換を行う。この仮名漢字変換部1はまず辞書
(自立語辞書部および付属語辞書部を含む)2を参照し
て1以上の変換結果候補を求める。この処理自体は通常
のものなのでこの点の詳細な説明は省略する(動作につ
いてはのちに例を挙げる)。つぎに仮名漢字変換部1は
所定の規則(たとえばそれぞれの語の得点またはペナル
ティと語の間の接続の得点またはペナルティとの総和の
大小に応じて変換結果を決定する)に加えて第1種切り
なおし学習辞書3、第2種切りなおし学習辞書4および
文節切り指定データ・バッファ5を参照して変換結果を
決定をする。
文節切りなおし部6は、オペレータ文節切り誤りを指示
したときの処理を行う部分である。すなわちオペレータ
による文節切りなおしの前の変換結果OUTを修正前変換
結果バッファ7に保存し、文節切り指定データを作成し
て(バッファ5にストア)仮名漢字変換部1を呼び出
し、変換結果を修正させる。さらに文節切りなおしの後
の変換結果OUTを修正後変換結果バッファ8に保存して
学習部9を呼び出す。なお文節切りなおしは、たとえば
誤変換結果を元の仮名文字に直したのち所望の文節のみ
を反転表示等で変換領域としてマークして再変換して行
うことができる。
学習部9は、修正前変換結果バッファ7と修正後変換結
果バッファ8とを比較して文節切りなおしの種類を判定
し、第1種切りなおし学習辞書3または第2種切りなお
し学習辞書4を更新する。
すなわちのちに例を挙げて示すように正しい境界を含む
修正前の文節に含まれる自立語と正しい境界の直前の修
正後の文節に含まれる自立語とが同一のときに第1種切
りなおし辞書3に登録を行い、同一でないときに第2切
りなおし辞書4に登録を行う。
つぎに、「じっけんのないよう」という入力仮名文字列
等を例に挙げて仮名漢字変換、文節切りなおしおよび再
変換の過程を示す。
文節切りなおし学習前の変換をまず説明する。第2図に
おいて、自立語検索(ステップS1)では第5図に示すよ
うな自立語を自立語バッファJBに格納する。付属語検索
(ステップS2)では第6図に示すような付属語を付属語
バッファFBに格納する。文節構成処理(ステップS3)で
は以上の2つのバッファを参照して第7図に示すような
文法的に正しい文節を文節バッファBBに格納する。候補
構成処理(ステップS4)では文節バッファBBを参照して
第8図に示すような候補を候補バッファCBに格納する。
以降、上記の自立語検索、付属語検索、文節構成および
候補構成のすべての処理を一括して「候補生成」と呼
ぶ。変換結果決定(ステップS5)は修正前変換結果バッ
ファ7、修正後変換結果バッファ8および文節切り指定
データ・バッファ5を参照して候補バッファCBに格納さ
れた候補より1を選択し変換結果OUTを更新する。この
場合には上述の2種の切りなおし学習辞書3、4にデー
タが存在せず、また文節切り指定データもないので「実
験のないよう」が変換結果となる(第8図の上から下の
順に候補が選ばれるように得点などが与えられているも
のとする)。
ついで、オペレータが文節切りなおしを行って「実験の
ないよう」を「実験の内容」に修正する過程を説明す
る。第3図において、まずステップS11で修正前変換結
果の保存が行われる。すなわち修正前変換結果バッファ
7に漢字「実験のないよう」および仮名「じっけんのな
いよう」を格納する。オペレータによる文節切りの指定
(ステップS12)はたとえば第5文字「な」が文節先頭
であることを指定し、これにより文節切り指定データ・
バッファ5に「5」を格納する。こののち仮名漢字変換
の指示(ステップS13)により仮名漢字変換部1を呼び
出す。
仮名漢字変換の指示(ステップS13)でによって呼び出
された変換でも候補生成の過程は上記と同一である。変
換結果決定(ステップS14)では文節切り指定データ
「5」を参照して、第5文字「な」が文節先頭となるよ
うな候補すなわち「実験の内容」を選択する(第8
図)。
修正後変換結果OUTの保存(ステップS14)では修正後変
換結果バッファ8に漢字「実験の内容」および仮名「じ
っけんの−ないよう」(「−」は文節境界を表す)を格
納する。こののち学習の指示(ステップS15)において
は学習部5が呼び出される。
文節境界の学習は第4図に示すように行われる。第4図
において、区切りの直前の自立語比較が行われる(ステ
ップS21)。すなわち修正前変換結果バッファ7の第1
自立語と修正後変換結果バッファ8の第1自立語とを比
較する。この場合には、共に「実験」であるので、一致
出力となり、第1種学習(ステップS22)に制御を渡
す。第1種学習では修正後変換結果バッファ8に格納さ
れている仮名「じっけんの−ないよう」から一致した自
立語「じっけん」を削除し「の−ないよう」を第1種切
りなおし学習辞書3に付加する(第12図)。
このように学習したのち、オペレータが再び仮名「じっ
けんのないよう」を変換しようとすると、仮名漢字変換
部1が呼び出され、第2図の処理が行われる。候補生成
の過程は上記と同一である。変換結果決定(ステップS
5)では第1種切りなおし学習辞書3のデータ「の−な
いよう」と整合する候補「実験の内容」を変換結果とし
て選択する。
また以上の文節切りなおしおよび学習が実行された後
に、上述の「じっけんのないよう」と類似の誤変換を伴
う「ちょうさのないよう」なる入力仮名文字列に対する
変換の過程を考える。「じっけんのないよう」なる入力
仮名文字列に対する変換と同様にして、第9図に示すよ
うな候補を候補バッファCBに格納する。変換結果決定
(ステップS5)では第1種切りなおし学習辞書3のデー
タ「の−ないよう」と整合する候補「調査の内容」を変
換結果として選択する。この場合には「調査のないよ
う」という誤変換が回避される。
つぎに、「ごかんせい」なる入力仮名文字列に対する変
換、文節切りなおし及び再変換の過程を示す。
候補生成の過程は「じっけんのないよう」なる入力仮名
文字列に対する変換と同様であり、図10図に示すような
候補を候補バッファCBに格納する。文節切りなおし学習
前の変換では、変換結果決定(ステップS5、第2図)は
「御完成」を変換結果として選択する。
ついで、オペレータが文節切りなおしを行って「御完
成」を「互換性」に修正する過程において、修正前変換
結果の保存(S11、第3図)は修正前変換結果バッファ
7に漢字「御完成」および仮名「ご−かんせい」を格納
する。オペレータによる文節切りの指定(S12)は文節
切り指定データ・バッファ5に「4」を格納する(ごか
ん−せい)。仮名漢字変換の指示(S13)によって仮名
漢字変換部1が呼び出される。変換結果決定(S5、第2
図)は文節切り指定データ「4」を参照して、第10図に
示す候補の中から第4文字「せ」が文節先頭となるよう
な候補「互換性」を選択する。修正後変換結果の保存
(S14、第3図)は修正後変換結果バッファ8に漢字
「互換性」および仮名「ごかん−せい」を格納する。学
習の指示(S15)は学習部5を呼び出す。
区切りの直前の自立語比較では(ステップS21、第4
図)修正前変換結果バッファ7の第1自立語と修正後変
換結果バッファ8の第1自立語とを比較する。この場合
には、「御」と「互換」であるので、不一致出力とな
り、第2種学習S23に制御を渡す。第2種学習23では修
正後変換結果バッファ8に格納されている仮名「ごかん
−せい」を第2種切りなおし学習辞書4に付加する(第
13図)。
こののちオペレータが再び仮名「ごかんせい」を変換し
ようとすると、仮名漢字変換部1が呼び出される。候補
生成の過程は上記と同一である。変換結果決定(S5)は
第2種切りなおし学習辞書4のデータ「ごかん−せい」
と整合する候補「互換性」を変換結果として選択する。
つぎに、以上の文節切りなおしおよび学習が実行された
のちに、「ごかんせい」と類似する「ききこうせい」な
る入力仮名文字列に対する変換の過程を示す。第11図に
示すような候補が候補バッファCB(第2図)に格納され
る。変換結果決定(S5)は、第1種切りなおし学習辞書
3および第2種切りなおし学習辞書6の中に整合する候
補が存在しないので、何も学習されていない場合と同じ
候補「機器構成」を変換結果として選択する。
なおこの例で、互換性(「ごかん−せい」)の文節境界
の学習時に「(任意の自立語)−せい」(第1付属語は
空文字列)が第1種切りなおし辞書3に登録されている
と、「機器甲性」が誤って変換出力されるが(第11図の
3番目の候補)、この実施例のように第1自立語の判定
によってこのような文節境界については一括的な学習を
行わず、個別の学習を行えば、以上のような問題がな
い。
この実施例の効果を確かめるために954文節からなる文
章(日本学術会議第14期活動計画、昭和63年11月)を仮
名漢字変換してみた。この場合この実施例の学習を行わ
ないと第14図に示すように21個の境界誤りがあった。そ
して実施例による学習の下ではそのうちの7個を防止で
きた。境界誤りE02の包括的な学習によりE07およびE15
が回避され、E05によりE09が回避され、E11によりE16が
回避され、E18によりE19、E20およびE21が回避される。
F.発明の効果 以上説明したように、この発明では、文節切りを学習す
るときに、正しい文節境界を包含する文節切り誤り時の
文節に含まれる自立語が、正しい文節境界の直前の正書
時の文節に含まれる自立語と同じときに、当該文節の自
立語に変えて任意の自立語表示を用いて学習を行うよう
にしている。このようにして包括的な文節切りの学習が
可能となる。他方、正しい文節境界を包含する文節切り
誤り時の文節に含まれる自立語が、正しい文節境界の直
前の正書時の文節に含まれる自立語と異なるときには、
当該文節の自立語自体を用いて、包括的な学習を止め、
包括的な学習による弊害が生じないようにしている。
【図面の簡単な説明】
第1図はこの発明の1実施例の構成を示すブロック図、
第2図は第1図の実施例の仮名漢字変換部1の動作を説
明するフローチャート、第3図は同実施例の文節切りな
おし部6の動作を説明するフローチャート、第4図は同
実施例の学習部9の動作を説明するフローチャート、第
5図ないし第13図は同実施例の動作に供する図、第14図
は同実施例の効果の説明に供する図である。 1……仮名漢字変換部、2……辞書、3……第1種切り
なおし学習辞書、4……第2種切りなおし学習辞書、5
……文節切り指定データ・バッファ、6……文節切りな
おし部、7……修正前変換結果バッファ、8……修正誤
変換結果バッファ、9……学習部。

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】入力仮名文字列を仮名漢字混じり文に変換
    するために、第1辞書部に登録されている第1群の語の
    うちの1つに続けて第2辞書部に登録されている第2群
    の語のうちの1つまたは空文字列を結合してなる文節単
    位を順次生成し、上記入力仮名文字列に適合する文節単
    位の連鎖を1または複数構成し、上記1の連鎖、または
    上記複数の連鎖のうち所定の規則にしたがって選定した
    ものを仮名漢字混じり文として出力する連文節仮名漢字
    変換方法において、 文節単位の境界の修正情報を受け取るステップと、 文節単位の境界の修正情報に適合するように上記連鎖の
    1つを選定しなおして仮名漢字混じり文として再度出力
    するステップと、 修正後の境界を包含する修正前の文節単位に含まれる上
    記第1群の語を、上記再出力された仮名漢字混じり文に
    含まれる上記修正された境界の直前の上記第1群の語に
    比較するステップと、 上記比較結果が不一致を示すときに、上記再出力された
    仮名漢字混じり文に含まれる、上記修正後の境界の前の
    文節単位に相当する仮名文字列、および上記再出力され
    た仮名漢字混じり文に含まれる、上記修正後の境界の後
    の文節単位のうちの少なくとも上記第1群の語に相当す
    る仮名文字列を第1の一連の仮名文字列として登録し、
    かつ上記第1の一連の仮名文字列における修正後の境界
    位置を指示する情報を登録するステップと、 上記比較結果が一致を示すときに、上記再出力された仮
    名漢字混じり文に含まれる、上記修正後の境界の前の文
    節単位のうちの上記第1群の語を除いた部分に相当する
    仮名文字列、および上記再出力された仮名漢字混じり文
    に含まれる、上記修正後の境界の後の文節単位のうちの
    少なくとも上記第1群の語に相当する仮名文字列を第2
    の一連の仮名文字列として登録し、かつ上記第2の一連
    の仮名文字列における上記修正後の境界位置を指示する
    情報を登録するステップと、 上記第1の一連の仮名文字列が入力されたときに、また
    は任意の上記第1群の語に続いて上記第2の一連の仮名
    文字列が入力されたときに、上記登録された修正後の境
    界位置で強制的に文節単位を分割するステップとを有す
    ることを特徴とする連文節仮名漢字変換方法。
  2. 【請求項2】上記再出力された仮名漢字混じり文に含ま
    れる、上記修正後の境界の前の文節単位のうちの上記第
    1群の語を除いた部分に相当する仮名文字列の1つに、
    空の仮名文字列も含まれる請求項1記載の連文節仮名漢
    字変換方法。
  3. 【請求項3】入力仮名文字列を仮名漢字混じり文に変換
    するために、1の自立語語に続けて1の付属語または空
    文字列を結合して文節を順次生成し、上記入力仮名文字
    列に適合する文節の連鎖を1または複数構成し、上記1
    の連鎖、または上記複数の連鎖のうち所定の規則にした
    がって選定したものを仮名漢字混じり文として出力する
    連文節仮名漢字変換方法において、 文節の境界の修正情報を受け取るステップと、 文節の境界の修正情報に適合するように上記連鎖の1つ
    を選定しなおして仮名漢字混じり文として再度出力する
    ステップと、 修正後の境界を包含する修正前の文節に含まれる自立語
    を、上記再出力された仮名漢字混じり文に含まれる上記
    修正された境界の直前の自立語に比較するステップと、 上記比較結果が不一致を示すときに、上記再出力された
    仮名漢字混じり文に含まれる、上記修正後の境界の前の
    文節に相当する仮名文字列、および上記再出力された仮
    名漢字混じり文に含まれる、上記修正後の境界の後の文
    節のうちの少なくとも自立語に相当する仮名文字列を第
    1の一連の仮名文字列として登録し、かつ上記第1の一
    連の仮名文字列における修正後の境界位置を指示する情
    報を登録するステップと、 上記比較結果が一致を示すときに、上記再出力された仮
    名漢字混じり文に含まれる、上記修正後の境界の前の文
    節単位のうちの自立語を除いた部分に相当する仮名文字
    列、および上記再出力された仮名漢字混じり文に含まれ
    る、上記修正後の境界の後の文節のうちの少なくとも自
    立語に相当する仮名文字列を第2の一連の仮名文字列と
    して登録し、かつ上記第2の一連の仮名文字列における
    上記修正後の境界位置を指示する情報を登録するステッ
    プと、 上記第1の一連の仮名文字列が入力されたときに、また
    は任意の自立語に続いて上記第2の一連の仮名文字列が
    入力されたときに、上記登録された修正後の境界位置で
    文節切りを強制的に行うステップとを有することを特徴
    とする連文節仮名漢字変換方法。
  4. 【請求項4】入力仮名文字列を仮名漢字混じり文に変換
    するために、第1辞書部に登録されている第1群の語の
    うちの1つに続けて第2辞書部に登録されている第2群
    の語のうちの1つまたは空文字列を結合してなる文節単
    位を順次生成し、上記入力仮名文字列に適合する文節単
    位の連鎖を1または複数構成し、上記1の連鎖、または
    上記複数の連鎖のうち所定の規則にしたがって選定した
    ものを仮名漢字混じり文として出力する連文節仮名漢字
    変換装置において、 文節単位の境界の修正情報を受け取る手段と、 文節単位の境界の修正情報に適合するように上記連鎖の
    1つを選定しなおして仮名漢字混じり文として再度出力
    する手段と、 修正後の境界を包含する修正前の文節単位に含まれる上
    記第1群の語を、上記再出力された仮名漢字混じり文に
    含まれる上記修正された境界の直前の上記第1群の語に
    比較する手段と、 上記比較結果が不一致を示すときに、上記再出力された
    仮名漢字混じり文に含まれる、上記修正後の境界の前の
    文節単位に相当する仮名文字列、および上記再出力され
    た仮名漢字混じり文に含まれる、上記修正後の境界の後
    の文節単位のうちの少なくとも上記第1群の語に相当す
    る仮名文字列を第1の一連の仮名文字列として登録し、
    かつ上記第1の一連の仮名文字列における修正後の境界
    位置を指示する情報を登録する第1の記憶手段と、 上記比較結果が一致を示すときに、上記再出力された仮
    名漢字混じり文に含まれる、上記修正後の境界の前の文
    節単位のうちの上記第1群の語を除いた部分に相当する
    仮名文字列、および上記再出力された仮名漢字混じり文
    に含まれる、上記修正後の境界の後の文節単位のうちの
    少なくとも上記第1群の語に相当する仮名文字列を第2
    の一連の仮名文字列として登録し、かつ上記第2の一連
    の仮名文字列における上記修正後の境界位置を指示する
    情報を登録する第2の記憶手段と、 上記第1の記憶手段および第2の記憶手段を参照して上
    記第1の一連の仮名文字列が入力されたことまたは上記
    第2の一連の仮名文字列が入力されたことを判別する手
    段と、 上記判別する手段の判別結果に応答して、上記第1の一
    連の仮名文字列が入力されたときに、または任意の上記
    第1群の語に続いて上記第2の一連の仮名文字列が入力
    されたときに、上記登録された修正後の境界位置で強制
    的に文節単位を分割する手段とを有することを特徴とす
    る連文節仮名漢字変換装置。
  5. 【請求項5】上記比較結果が一致を示すときに、上記再
    出力された仮名漢字混じり文に含まれる、上記修正後の
    境界の前の文節単位のうちの上記第1群の語を除いた部
    分に相当する仮名文字列の1つに、空の仮名文字列も含
    まれる請求項4記載の連文節仮名漢字変換装置。
  6. 【請求項6】入力仮名文字列を仮名漢字混じり文に変換
    するために、1の自立語語に続けて1の付属語または空
    文字列を結合して文節を順次生成し、上記入力仮名文字
    列に適合する文節の連鎖を1または複数構成し、上記1
    の連鎖、または上記複数の連鎖のうち所定の規則にした
    がって選定したものを仮名漢字混じり文として出力する
    連文節仮名漢字変換装置において、 文節の境界の修正情報を受け取る手段と、 文節の境界の修正情報に適合するように上記連鎖の1つ
    を選定しなおして仮名漢字混じり文として再度出力する
    手段と、 修正後の境界を包含する修正前の文節に含まれる自立語
    を、上記再出力された仮名漢字混じり文に含まれる上記
    修正された境界の直前の自立語に比較する手段と、 上記比較結果が不一致を示すときに、上記再出力された
    仮名漢字混じり文に含まれる、上記修正後の境界の前の
    文節に相当する仮名文字列、および上記再出力された仮
    名漢字混じり文に含まれる、上記修正後の境界の後の文
    節のうちの少なくとも自立語に相当する仮名文字列を第
    1の一連の仮名文字列として登録し、かつ上記第1の一
    連の仮名文字列における修正後の境界位置を指示する情
    報を登録する第1の記憶手段と、 上記比較結果が一致を示すときに、上記再出力された仮
    名漢字混じり文に含まれる、上記修正後の境界の前の文
    節単位のうちの自立語を除いた部分に相当する仮名文字
    列、および上記再出力された仮名漢字混じり文に含まれ
    る、上記修正後の境界の後の文節のうちの少なくとも自
    立語に相当する仮名文字列を第2の一連の仮名文字列と
    して登録し、かつ上記第2の一連の仮名文字列における
    上記修正後の境界位置を指示する情報を登録する第2の
    記憶手段と、 上記第1の記憶手段および第2の記憶手段を参照して上
    記第1の一連の仮名文字列が入力されたことまたは上記
    第2の一連の仮名文字列が入力されたことを判別する手
    段と、 上記判別する手段の判別結果に応答して、上記第1の一
    連の仮名文字列が入力されたときに、または任意の自立
    語に続いて上記第2の一連の仮名文字列が入力されたと
    きに、上記登録された修正後の境界位置で文節切りを強
    制的に行う手段とを有することを特徴とする連文節仮名
    漢字変換装置。
  7. 【請求項7】中央処理装置、記憶装置、表示装置および
    文字入力装置を有してデータ処理行うとともに、入力仮
    名文字列を仮名漢字混じり文に変換するために、第1辞
    書部に登録されている第1群の語のうちの1つに続けて
    第2辞書部に登録されている第2群の語のうちの1つま
    たは空文字列を結合してなる文節単位を順次生成し、上
    記入力仮名文字列に適合する文節単位の連鎖を1または
    複数構成し、上記1の連鎖、または上記複数の連鎖のう
    ち所定の規則にしたがって選定したものを仮名漢字混じ
    り文として出力するデータ処理装置において、 文節単位の境界の修正情報を受け取る手段と、 文節単位の境界の修正情報に適合するように上記連鎖の
    1つを選定しなおして仮名漢字混じり文として再度出力
    する手段と、 修正後の境界を包含する修正前の文節単位に含まれる上
    記第1群の語を、上記再出力された仮名漢字混じり文に
    含まれる上記修正された境界の直前の上記第1群の語に
    比較する手段と、 上記比較結果が不一致を示すときに、上記再出力された
    仮名漢字混じり文に含まれる、上記修正後の境界の前の
    文節単位に相当する仮名文字列、および上記再出力され
    た仮名漢字混じり文に含まれる、上記修正後の境界の後
    の文節単位のうちの少なくとも上記第1群の語に相当す
    る仮名文字列を第1の一連の仮名文字列として登録し、
    かつ上記第1の一連の仮名文字列における修正後の境界
    位置を指示する情報を登録する第1の記憶手段と、 上記比較結果が一致を示すときに、上記再出力された仮
    名漢字混じり文に含まれる、上記修正後の境界の前の文
    節単位のうちの上記第1群の語を除いた部分に相当する
    仮名文字列、および上記再出力された仮名漢字混じり文
    に含まれる、上記修正後の境界の後の文節単位のうちの
    少なくとも上記第1群の語に相当する仮名文字列を第2
    の一連の仮名文字列として登録し、かつ上記第2の一連
    の仮名文字列における上記修正後の境界位置を指示する
    情報を登録する第2の記憶手段と、 上記第1の記憶手段および第2の記憶手段を参照して上
    記第1の一連の仮名文字列が入力されたことまたは上記
    第2の一連の仮名文字列が入力されたことを判別する手
    段と、 上記判別する手段の判別結果に応答して、上記第1の一
    連の仮名文字列が入力されたときに、または任意の上記
    第1群の語に続いて上記第2の一連の仮名文字列が入力
    されたときに、上記登録された修正後の境界位置で強制
    的に文節単位を分割する手段とを有することを特徴とす
    るデータ処理装置。
JP2323431A 1990-11-28 1990-11-28 連文節仮名漢字変換方法および装置 Expired - Fee Related JPH0748213B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2323431A JPH0748213B2 (ja) 1990-11-28 1990-11-28 連文節仮名漢字変換方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2323431A JPH0748213B2 (ja) 1990-11-28 1990-11-28 連文節仮名漢字変換方法および装置

Publications (2)

Publication Number Publication Date
JPH04195253A JPH04195253A (ja) 1992-07-15
JPH0748213B2 true JPH0748213B2 (ja) 1995-05-24

Family

ID=18154603

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2323431A Expired - Fee Related JPH0748213B2 (ja) 1990-11-28 1990-11-28 連文節仮名漢字変換方法および装置

Country Status (1)

Country Link
JP (1) JPH0748213B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110442685A (zh) * 2019-08-14 2019-11-12 杭州品茗安控信息技术股份有限公司 建筑专业词库的数据扩充方法、装置、设备及存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61147366A (ja) * 1984-12-20 1986-07-05 Matsushita Electric Ind Co Ltd 日本語文作成装置
JPS63308665A (ja) * 1987-06-10 1988-12-16 Seiko Epson Corp 仮名漢字変換装置

Also Published As

Publication number Publication date
JPH04195253A (ja) 1992-07-15

Similar Documents

Publication Publication Date Title
JPS5827547B2 (ja) 電子辞書
JPS6037509B2 (ja) 英文文章処理装置における綴り誤り処理方式
JPH0748213B2 (ja) 連文節仮名漢字変換方法および装置
JPH08129332A (ja) 学習指導方法
JPS6210763A (ja) 仮名漢字変換処理装置
JP3455643B2 (ja) 文字認識装置における学習辞書の更新方法及び文字認識装置
JPH0484261A (ja) 誤り表記検索方式
JPS605318A (ja) 漢字仮名混り文入力装置
JPS593630A (ja) 文書作成装置
JPH0721171A (ja) キー入力訂正装置
JPH0660058A (ja) 文書作成装置
JPS62247454A (ja) ワ−ドプロセツサ
JPS62205464A (ja) 文章の校正方法
JP2708923B2 (ja) かな漢字変換装置
JPS63115263A (ja) 日本語文章校正装置
JP2002351868A (ja) 電子辞書
JPS62154169A (ja) かな漢字変換装置の辞書検索方法
JPS58129634A (ja) 文字処理装置
JPH03202951A (ja) 日本語文章処理装置
JPH0728957A (ja) 英文字認識装置
JPH06251204A (ja) 文字認識装置
JPH09293074A (ja) 文書作成装置及び誤入力補正方法
JPH0155495B2 (ja)
JPH076172A (ja) ワードプロセッサ
JPH0410057A (ja) 翻訳装置用の光学式文字読取装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees