JPS6126175A

JPS6126175A - 複合漢字列分割装置

Info

Publication number: JPS6126175A
Application number: JP13923984A
Authority: JP
Inventors: 藤崎　哲之助; 雅之沼尾
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 1984-07-06
Filing date: 1984-07-06
Publication date: 1986-02-05
Also published as: JPH0347547B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】［産業上の利用分野コこの発明は基本漢字列が組み合わされてなる複合漢字列
をもとの基本漢字列に機械的に分割する複合漢字列分割
装置に関し、とくに確率的な手法で高精度の分割を行え
るようにしたものである。

［従来技術］近年コンピュータによる日本語情報処理例えば日本語情
報の機械検索、自動抄録作成、機械翻訳、自動朗読、点
字化等が実用化され、あるいは広く研究されつつある。

そしてこのような日本語情報処理を可能にするには日本
語文章を解析し、その内容を機械的に把握するフロント
エンドが必要となる。とくに、日本語ではわかち書きの
習慣がなく文章はブランクのないベタ書きであるので日
本語文章を機械的に単語レベルの単位に分割する自動単
語分割の可能なフロントエンドが切望されている。過去
においては日本語情報を統計的に処理する等の際に人間
が単語分割を行って入力を行っていた。この場合コスト
及び所要時間の点で極めて不都合がある。

このような点から日本語文章を単語または文節に分割す
る手法についてはいくつかの提案がなされている。この
ような提案の１つは字種を参照するものである。経験上
字種の変わり目（ひらがなからひらがな以外の字種への
変わり目）は文節の変わり目であることが多く、この性
質を利用して文節単位の分割を行うのである。この単純
な規則だけでも文節単位の分割を約８４％の精度で行え
ることが報告されている。ただこの手法ではより細かな
単語単位の分割はできず、また精度も十分でないという
不具合がある。

他の提案としては単語辞書を用いるものがある、情報処
理Ｖｏ１．１９．　Ｎｏ、６．　ｐｐ５］、４−５２１
（１，９７３年）所載の長尾氏等の「国語辞書の記憶と
日本語文の自動分割Ｊはこの単語辞書の手法と上述字種
情報等とを利用して単語を機械的に分割することを提案
している。特公昭５７−１３８９５．５７−１６３７２
．５７−１６３７３．５７−１６３７４、及び５７−１
８２２１号にも類似した提案が示されている。

また、確率辞書を用いて漢字仮名まじり文をわかち文書
する手法が自然言語処理２８−５（１，９８１年）所載
の藤崎氏の［動的計画法による漢字仮名混り文の単位切
りと仮名ふりｊに示されている。これは動的計画法を利
用して最も尤度の高いわかち書文を与える一単位切りを
見出すものである。

ところで漢字は造語力があり基本漢字列を組み合わせて
複合的な意味を有する複合漢字列を形成することが多く
、この複合漢字列は単語文割の際にとくに困難なものと
されてきた。例えば「電話　　　−器用難燃材料Ｊは「
電話器用」、「難燃」及び「材料」という基本漢字列を
複合してなるものであるが、器用という単語に着目して
しまって「電話ｊ、Ｆ器用Ｊ、「離燃」及び「材料Ｊと
いう基本漢字列に全開しがちである。上述の従来の手法
もこのような複合漢字列の分割に対処できないものがほ
とんどである。

ただ上述長尾氏等の論文ではこの複合漢字列の分割の手
法も開示されている。この手法では辞書を用いて複合漢
字列を２文字漢字の単位に分割したり、接頭語的又は接
尾語的性質を有する一文字漢字をキーとして漢字列を分
割している。また辞書を用いて複合漢字列を２文字漢字
列の単位に分割することを基本としつつ、その分割が不
可能なときに一文字漢字の性質に着目することも示され
ている。

しかしながら漢字列の一部が２文字漢字として扱えるか
、あるいは接頭語的又は接尾語的性質を有するかという
ことはその漢字列全体から決定されることである。例え
ば上述の「電話器用難燃材料」という漢字列の「器」及
び「用」はともに接尾語的性質を有するもので、「器用
」という２文字漢字として切り出すのは誤りであるけれ
ども、このようなことは漢字列全体から始めて理解でき
る。従って、そのようなことを考慮せずに２文字漢字ま
たは一文字漢字をキーとして機械的に分割を行うことに
は無理がある。本来的には２文字漢字ごとに分割されな
いものが２文字漢字として誤って分割されてしまうこと
も多く、また２文字漢字を構成する漢字の一方が誤って
接頭語的等と判断される蓋然性も高く、分割の精度を向
上させることは困難であると考えられる。

［発明が解決しようとする問題点］この発明は以上事情を考慮してなされたものであり、複
合漢字列を高精度に基本漢字列に分割することができる
複合漢字列分割装置を提供することを目的としている。

［問題点を解決するための手段］この発明では以上の目的を達成するために、継続する２
つの漢字の間で起こる状態の遷移の確率をストアする確
率辞書手段を参照して、入力複合漢字列の状態の系列の
うち一番生起確率が犬のものを判別し、この判別された
状態の系列に基づいて入力複合漢字列を基本漢字単語に
分割するようにしている。

好ましい態様では動的計画法により最大生起確率をとる
入力複合漢字列の状態の系列を選定する。

また漢字列中の漢字のとる状態としては接頭語状態Ｐ、
２つの継続する基本漢字状態１．２及び接尾語状態Ｓを
採用することが好ましい。

［実施例コ以下で説明されるこの発明の実施例は漢字列に、、に２
・・・Ｋｎ（Ｋｉは１つの漢字である）の実現可能な状
態の系列のうち最も到達確率の高いものを動的計画法で
求め、そのようにして選んだ状態の系列に基づいて漢字
列に工に２・・・Ｋｎを基本漢字単語に分割するように
なっている。ここでは図面に基づ〈実施例の詳細な説明
にさきだって動的計画法による手法の概要について簡単
に触れておくこととする。なお以下の実施例はハードウ
ェアで実現されたものとして示されているけれども、ソ
フトウェア実現態様を採用し得ることはもちろんである
。

この実施例では漢字列に１に２・・・Ｋｎの前後に特殊
記号上を付し、土ＫＩＫ２・・・Ｋｎ土とする。なお、
以下では便宜上止も漢字と呼ぶこととする。前段の土か
ら後段の土にいたる漢字の並びに従って時間が推移する
ものと考える。特殊記号上は開始ブランク状態Ｉ及び終
了ブランク状態Ｆをとるものとする。漢字Ｋｉ　（ｉ＝
１〜ｎ）は接頭語状態Ｐ、２つの継続する基本語状態１
．２及び接尾語状態Ｓをとるものとする。例を挙げれば
「超党派構成委員会案」の「超」はＰ状態の漢字であり
、「構」は１状態の漢字であり、「成」は２状態の漢字
であり、また「会」、「案」はともにＳ状態の漢字であ
る。

便宜上漢字列上に□に２・・・Ｋｎ±実現可能な状態の
系列を有向グラフを用いて表わすと第８図に示すように
なる。この図では時間即ち漢字Ｋｉの推移に従って状態
がどのように遷移してぃくがが示されている。前段の土
から後段の土にいたる多数の遷移のルートの到達確率Ｆ
ＲＢはそのルーある。ただすべてのルートについてやみ
くもに到達確率を求め、その中から最大のものを選ぶの
は現実的でない。そこで動的計画法では時間即ち漢字Ｋ
ｉの推移ごとにルートに沿った中間的な積を演算してい
くと同時に、その推移の時点ですでに考慮する必要がな
いことが判明したルートを削除するようにしている。

第８図の漢字Ｋ１−１から漢字Ｋｉへの推移を一例とし
て考えよう。漢字Ｋ１−１、Ｋｉはともに状態Ｐ１．２
及びＳを基本的にはとり得る。そして漢字ＫｉがＰの場
合、前段漢字Ｋｉ、−０がとる状態はＰ、２及びＳであ
り、このとき３種類の状態遷移が考えられる（尚１に継
続する状態は２のみであるので１→Ｐの遷移は不可能で
ある）。これら３種類の局所的なパスはそれぞれ遷移確
率ＰＲＯＢ　（Ｑ　□、ｋｘ、ｊｘ）、ＰＲＯＢ（Ｑ２
、Ｋ２、ｊ２）及びＰＲＯＢ（Ｑ３、Ｋ３、ｊ３’）に
よって第８図に示されている。またＫ１−１までの到達
遷移はすでに航回のテストで決定されており、この第８
図では状態Ｓ、２及びＰに応じてそれぞれの到達確率を
ＰＰＲＢ　（Ｓ）　、ＰＰＲＢ　（２）及びＰＰＲＢ（
Ｐ）で表わした。そしてＫｉまでの到達確率を考えた場
合、○印を付したルートの到達確率即ちＰＰＲＢ　（Ｓ
）ＸＰＲＯＢ（０，□、ｋｌ、ｊｌ）が他の２つのルー
トの到達確率より大であれば、これら他の２つのルート
をのちのテストで考慮に入れる必要はない。

同様にしてＫｉが状態１．２及びＳの場合についても最
大の到達確率をとるルートを１つ選ぶ。

そうしてＫｉにいたるルートのうち考慮すべきものを絞
り込むのである。

以上のような手法を繰り返して前段の土から後段の土ま
で状態の系列をテストし、これにより効率良く最大の到
達確率を有する状態の系列を選定し、この選定した系列
に従って漢字列に□に２・・・Ｋｎが基本漢字列に分割
される。

この実施例では以下の規則に従ってこの分割が行われる
。

（１）漢字２文字で基本的な意味を有するものは基本漢
字列である。この基本漢字列の状態の系列は「１２ｊで
ある。

（２）上の基本漢字列に１以上の接頭漢字が付いたもの
も基本漢字列である。この基本漢字列の状態の系列は「
Ｐ・・・ＰＩ３」である。

（３）上の基本漢字列に１以上の接尾漢字が付いたもの
も基本漢字列である。この基本漢字列の状態の系列は「
１２Ｓ・・・Ｓ」または「Ｐ・・・Ｐ１２Ｓ・・・Ｓ」
である。

例えば「国会法改定法案」の状態の系列としてｒｌ　２
　Ｓ　１２１２Ｊが得られ、それゆえ「国会法／改定／
法審」に分割される。また「政治的道義的責任」及び「
超党派構成委員会案」からはそれぞれｒ１２ｓ１２ｓ１
２Ｊ及びｒＰ１２１２１２ＳＳＪが得られ、「政治的／
道義的／責任」及び［超党派／構成／委員会案」に分割
される。

さてつぎに実施例の具体的な構成について説明しよう。

第１図はこの実施例を全体として示すもので、この図に
おいて入力段１は分割すべき漢字列に、に２・・・Ｋｎ
例えば「国会法改定法案」を受は取るものである。この
入力段１で受は取られた漢字列に１に２・・・Ｋｎはそ
の前後に漢字（特殊記号）土を付けされて入力段１のレ
ジスタエ。、■１・・・Ｉｎ十、にストアされる。これ
を第２図に示す。

この人力段１は入力列上ＫｉＫ２・・・Ｋｎ土に対して
第２図に散点で示すようなウィンドウを施こして継続す
る２つの漢字上、Ｋ１漢字Ｋｉ−□、Ｋ１または漢字Ｋ
ｎ、土を演算制御部２に送出する。このウィンドウは上
述動的計画法における漢字の遷移の各々に対応し、この
ウィンドウがその遷移の推移に従って１漢字分ずつ第２
図に矢印で示すようにシフトされ、この結果漢字列に□
に２・・・Ｋｎから順次重に１、Ｋ工に２・・・、Ｋｎ
土が切り出されて演算制御部２に供給される。

演算制御部２はこのように送出されてくる漢字Ｋｉ−□
、ｋｉ（±）をキーとして確率辞書データベース３をア
クセスして漢字に１−１、Ｋｉ間の実現可能な複数の状
態遷移確率ＰＲＯＢを得る。この確率辞書データベース
３は前段漢字Ｘい当設漢字ＸＲ前段状態ＰＳ及び出段状
態ＣＳに応じて状態遷移確率ＰＲＯＢをアクセスできる
ようになっており、その詳細は第５図を参照口でのちに
理解されるであろう。

上述したように動的計画法では前回の遷移におけるテス
１へで、前段の記号上から漢字Ｋｉ−□にいたるルート
が前段状態ＰＳごとに〕っずつ確定されている。そして
新たな遷移においては漢字Ｋｉの出段状態Ｃ８ごとにど
のルートが最適かをテストすることとなる。もちろん到
達確率が一番大きいものが最適のルートとして選ばれ、
これを当設到達状態遷移Ｃ３ＴＴとし、対応する到達確
率を当設到達確率ＣＰＲＢとしよう。

演算制御部２では以上の処理を実行するために前回の遷
移のテストで前段状態ＰＳごとに求められ前段到達確率
ＰＰＲＢ　（Ｉ）、ＰＰＲＢ　（Ｐ）、ＰＰＲＢ　（］
、）　、ＰＰＲＢ　（２）及びＰＰＲＢ（Ｓ）に今回の
状態遷移確率ＰＲＯＢを掛けＸ＝ＰＰＲＢＸＰＲＯＢを
得、この中から出段状態Ｃ８ごとに最大のものを選び当
段到達確ＣＰＲＢとし、対応する到達状態遷移を当設到
達状態遷移Ｃ３ＴＴとして当設作業域４にストアするの
である。

なお話は前後するけれども、以上の説明から明らかなよ
うに当設到達確率ＣＰＲＢ及び当設状態遷移Ｃ３ＴＴを
求めるには前段到達確率ＰＰＲＢ等が必要であり、これ
は前段作業域５にストアされている。

尚、上述当設作業域４及び前段作業域５はそれぞれ第３
図及び第４図に示すように準備される。

また確率辞書データベース３は第５図Ａ、Ｂ及びＣに示
すように３種類のチーフルＴＢＩ、ＴＢ２及びＴＢ３を
有する構造で状態遷移確率ＰＲＯＢをアクセスし得るよ
うになっている。この構成によれば多数の漢字の配列を
効率よくアクセスすることができる。

第５図から明らかなようにテーブルＴＢＩにおいては前
段漢字ｘＬおよび当設漢字ＸＲからなる配列Ｘ　Ｌ　Ｘ
　Ｒがその行番号、コを用いてＸ１Ｘｎ（ｊ）として表
記可能である。例えば「国会」という配列はＸＬＸＲ（
１０２４）として表記される。そしてこの行Ｊごとにテ
ーブルＴＢ２へのポインタＰＴ２（ｊ）が付されており
、このテーブルＴ　Ｉ３２では配列ＸＬＸＲ（ｊ）の各
々の前段可能状態ＰＳ（■、Ｐ、１．２、Ｓのいずれか
である）ごとに行ｋが割り当てられている。従って、所
定の配列ＸＬＸｔ＋（ｊ）における前段状態ＰＳはＰＳ
　（ｋ、ｊ）と表記可能である。　テーブルＴＢ２にお
いても各行にごとにテーブルＴＢ３へのポインタＰＴ３
（ｋｌ、〕）が付されており、このテーブル３では先の
前段状態Ｐｓ　（ｋ、ｊ）の各々の出段状態Ｃｓ　（ｐ
、王、２、Ｓ、Ｆのいずれかである。）ごとに行番号Ω
が割り当てられている。従って所定の漢字配列ＸＬＸＲ
（ｊ　）　、所定の前段状態ＰＳ（ｋ、Ｊ）における当
設状態ＣＳはＣ８（Ｑ、ｋ、ｊ）と表記可能である。こ
のテーブルＴＢ３の各行Ωには対応する状態遷移確率Ｐ
ＲＯＢがストアされている。所定の配列ＸＬＸｕ（ｊ）
がＰＳ（ｋｌ、ｊ　）及びＣｓ　（Ｑ、に、ｊ）をとる
状態遷移確率ＰＲＯＢをＰＲＯＢ　（Ω、ｋ、ｊ）と表
記できることはもちろんである。

以下では必要に応じて行番号ｊ、に、Ｑを用いて配列、
状態遷移、確率等を特定することとする。

つぎに第６図及び第７図のフローチャートをも参照しな
がら第１図の実施例についてさらに詳細に説明しよう。

第］−図の入力段１が分割すべき漢字列ＫＩＫ２・・・
Ｋｎを受は取ると第６図及び第７図で示す手順が開始さ
れる（ステップ１１）。こののち当設作業域４及び前段
作業域５がそれぞれ第３図及び第４図に示すように初期
設定される（ステップ１２）。

これら第４図及び第５回で空欄となっている部分は無視
（Ｄｏｎ’　ｔ　ｃａｒｅ）の部分である。初期状態で
は前段状態ＰＳは「土」に対応する開始ブランク状態工
でしかあり得ないので、対応する到達確率ＰＰＲＢ　（
Ｉ）が１．０であり、他の到達確率ＰＰＲＢ　（Ｉ以外
）が０．０であることに留意されたい。

ステップ１３ではウィンドウが施こされるレジスタ■Ｌ
−０及びＩＬのサフィックスＬがＬ＝１に初期設定され
る。これはウィンドウが第２図に散点で示すように送室
されることを意味する。このウィンドウはのちにステッ
プ２９において順次第２図の矢印に示すようにシフトさ
れられていく。

ステップ１４〜２６は当設状態ｃｓごとに当設到達確率
ＣＰＲＢ及び当設到達状態遷移Ｃ３ＴＴを求めるもので
ある。

上述したように当設到達確率ＣＰＲＢを得るには前回の
テストで決定された複数の前段到達確率ＰＰＲＢのそれ
ぞれに今回の対応する状態遷移確率ＰＲＯＢを掛け、Ｘ
＝ＰＰＲＢＸＰＲＯＢを得、この中から最大のものを選
ばなければならない。

この実施例では前段状態ＰＳを変えながら順次対応する
値Ｘを求め、その都度それまでの最大のＸの値と今求め
たＸの値とを比較し、大きいほうを所定の領域、具体的
には第３図のフィールドＣ３ＴＴにストアしていく。前
段状態ＰＳのすべてに上述の処理を実行しおえると、正
規の最大値即ち当設到達確率ＣＰＲＢがストアされるこ
ことなるのは明らかであろう。また、この実施例では当
設状態ＣＳごとに対応するＸの暫定的な最大値を第３図
の対応するフィールドＣ３ＴＴにストアするようにして
いるので、当設状態Ｃ８のすべてについて当設到達確率
ＣＰＲＢ及び当設到達状態遷移Ｃ３ＴＴを同時に得るこ
とができる。

即ちステップ１４ではウィンドウの施こされたレジスタ
ＩＬ−ｘ、ＩＬにストアされている漢字Ｋ１−１に１を
それぞれ前段漢字ＸＬ及び当設漢字Ｘ３とする配列Ｘ、
Ｌ　ＸＲ（ｊ）が確率辞書データベース３のテーブルＴ
ＢＩから探し出される。例えば上述の例「国会」では行
ｊは１０２４である。次にチーフル１゛Ｂ１の行ｊのポ
インｐＴ２（ｊ）が指定するテーブルＴＢ２の行ｋを参
照して前段状態ＰＳ（ｋ、ｊ）を得（ステップ１５）、
この前段可能状態ＰＳ　（ｋ、ｊ）の前段到達確率ＰＰ
ＲＢ　（ＰＳ　（ｋ、ｊ））を前段作業域５から得る（
ステップ１６）。

ステップ１７では前段到達確率ＰＰＲＢ（ＰＳ（ｋ、ｊ
））がゼロであるかどうかをテストし、ゼロであれば対
応するルートを考慮する必要がないので直接つぎの前段
状態ｐｓ　（ｋ、ｊ）につきテストを行う。ステップ２
５及び２６において所定の配列ＸＬＸｎ（ｊ）について
実現可能な前段状態ＰＳ　（ｋ、ｊ）が順次テストされ
ていくことは明らかである。

ステップ１７で前段到達確率ＰＰＲＢ　（ＰＳ（ｋ、ｊ
））がゼロでない場合には、ステップ］８が実行されて
テーブル１゛Ｂ２の行にのポインタＰＴ３　（ｋ、ｊ）
の指定するテーブルＴＢ３の行Ｑが参照され。状態遷移
確率ＰＲＯＢ　（Ｑ、ｋ、ｊ）が得られる。こののちこ
の状態遷移確率ＰＲＯＢ　（Ｑ、に、、ｊ）と上述で得
た前段到達確率ＰＦＲＢ　（ｐｓ　（ｋ、ｊ））との積
が実行され（ステップ１９）、この積の値Ｘが暫定的な
当設到達確率ＣＰＲＢ　（Ｃ８（ｆｌ、ｋ、、ｊ））と
比較される（ステップ２０）、この当設到達確率ＣＰＲ
Ｂ（ＣＳ（Ω、ｋ、ｊ））は自段作業域４にストアされ
ている。同時に前段到達状態遷移Ｐ　Ｓ　ＴＴ（ＰＳ（
ｋ、ｊ））に当設状態Ｃ８（ｆｌ、　ｋ、　、ｊ）を結
合して新たな当設到達状態遷移Ｃ３ＴＴ　（Ｃ８ＣＱ、
に、ｊ））として自段作業域４にストアする（ステップ
２２）。新たな積の値Ｘが前回までの暫定的な当設到達
確率ｃｐＲＢ（ｃｓ（ｎ、　ｋ、ｊ））より小さい場合
には何もしない。このテストは配列ＸＬＸＲ（ｊ）、前
段到達状態遷移ＰＳＴＴ（ｋ、ｊ）における実現可能な
当設状態Ｃ３（ｎ、に、ｊ）につきそれぞれ実行される
（ステップ２４）。

以上の手順が繰り返されることによって自段作業域４に
は最終的に正規な当設到達確率ＣＰＲＢ（Ｃ８ＣＱ、に
、ｊ））及び当設到達状態遷移Ｃ３ＴＴ　（Ｃ８（Ｑ、
に、ｊ））がストアされることとなる。

こののちつぎの遷移のテストの準備が行われる。

即ち、自段作業域４の内容が前段作業域５の対応する領
域に転送され（ステップ２８）、さらにＰＳ　（Ｉ）の
場合の前段到達確率ＰＰＲＢ　（Ｉ）がゼロにセットさ
れ、当設到達確率ＣＰＲＢがすべてゼロとされる。ＣＰ
ＲＢをゼロとすれば任意の正のＸを新たなＣＰＲＢとし
てストアすることができることに留意されたい。

ステップ２９においてウィンドウのサフィックスＬが増
分されてウィンドウが順次シフトされていくことについ
てはすでに述べた。最後に漢字Ｋｎ土についてテストが
行われる。この場合漢字（記号）土が状態Ｆ以外をとる
確率はゼロであり、前段到達状態遷移ＰＳＴＴ　（Ｆ）
が最終的に得られる最も尤度の高いルートである。この
前段到達状態遷移ＰＳＴＴ　（Ｆ）は入力段１からの終
了信号に基づいてゲート回路６でゲートされ出力される
（ステップ３１）。こうして１つの漢字列に工に２・・
・Ｋｎの漢字分割が終了する（ステップ３２）。

以上説明したようにこの実施例によれば確率に基づいて
漢字列を分割するようにしているので極めて高精度に分
割を行うことができる。また確率辞書データベース３を
対象となる漢字列の分野にあわせて選択すれば一層精度
を向上させることができる。さらに動的計画法の手法を
採用しているので効率良く確率を求めることができる。

実験によればこの実施例の分割装置ではＪＩＣ３Ｔ（科
学技術情報センタ）抄録の漢字列を９９゜１％の精度で
分割できた。上述の長尾氏等の論文による手法では、２
文字漢字辞書を用いず一文字渓字のみをキーとした場合
で５４．０〜８２．６％であり、さらに２文字漢字辞書
を用いた場合でも７８．０〜９４．９％であり、これに
比較してこの実施例の精度が十分に高いものであること
が理解できる。

［発明の効果コこの発明によれば継続する２つの漢字の間で起こる状態
の遷移の確率をストアしている確率辞書手段を利用して
入力連続漢字列の実現可能な状態の系列のうち一番遷移
確率が大となるものを判別し、この判別結果からその入
力連続漢字列の分割を行っている。従って、分割を確率
にのみ依存して行うことができ、その精度を向上させる
ことができる。

【図面の簡単な説明】

第１図はこの発明の一実施例を示すブロック図、第２図
は第１図の入力段１を説明するための図、第３図は第１
図の自段作業域を説明するための図、第４図は第１図の
前段作業域を説明する゛ための図、第５図は第１図の確
率辞書データベースを説明するための図、第６図及び第
７図は第１図実施例の動作を説明するフローチャート、
第８図は第１図実施例の概略を説明する図である。１・・・・入力段、２・・・・確率辞書データベース、
３・・・・演算制御部、４・・・・自段作業域、５・・
・・前段作業域、６・・・・ゲート回路。第２図１０　１１　１２　　　°　・　・　・　・　ＩｎＩｎ
、１第３図第４図Ｂ１第５図第８図手続補正書（自発）昭和５９年９り／夕日

Claims

【特許請求の範囲】継続する２つの漢字の間で起こる状態の遷移の確率がス
トアされている確率辞書手段と、基本漢字列が複合されてなる入力複合漢字列の実現可能
な状態の系列のうち一番生起確率が大となるものを上記
確率辞書手段を参照して判別する判別手段と、この判別手段で判別された状態の系列に基づいて上記入
力複合漢字列を上記基本漢字列に分割する分割手段とを
有することを特徴とする複合漢字列分割装置。