JPS6075982A - 形態素接続解析方式 - Google Patents

形態素接続解析方式

Info

Publication number
JPS6075982A
JPS6075982A JP58183434A JP18343483A JPS6075982A JP S6075982 A JPS6075982 A JP S6075982A JP 58183434 A JP58183434 A JP 58183434A JP 18343483 A JP18343483 A JP 18343483A JP S6075982 A JPS6075982 A JP S6075982A
Authority
JP
Japan
Prior art keywords
morpheme
connection
analysis
morphemes
connection information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58183434A
Other languages
English (en)
Inventor
Kazushi Muraki
一至 村木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp, Nippon Electric Co Ltd filed Critical NEC Corp
Priority to JP58183434A priority Critical patent/JPS6075982A/ja
Publication of JPS6075982A publication Critical patent/JPS6075982A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は形態素解析方式において形態素解析失敗回復コ
ストを大巾に低減するため、隣接形態素間の接続情報の
暖味さを集合として管理する形態素接続解析方式に関す
る。
従来形態素解析方式におりでは、特定の形態素に前接す
る形態素あるいは後接する形態素を指示書に登録[7て
入口文の形態素解析即ち形態素の発見を行なう。同解析
途中時刻tにおいても辞書検索を行ない同一表記であり
々から異なった複数個の形態素が存在したり、1つの形
態素が複数個の接続情報を持つ場合、1つの形態素を選
びそのうえ同形態素の1つの接続情報を選択し同接続情
報を仮定し2以後の処理を進める。そして時刻r(>t
)で解析が行き詰まったときにはr−1の状態に復帰し
別の接続情報を選択して処理を進める後戻り制御手法を
用いる。
しかしこの従来手法では、辞書引き時に形態素の暖味さ
、あるいけ個々の形態素が持つ接続暖味さ、が存在する
とき、1つの接続情報を強制的に選択し、それ以後で発
生した解析の行き詰号りから後戻り制御が頻ばんに起動
される傾向にあり、形態素、解析の効率を低下させる要
因となる。
本発明の目的は、従来の形態素解析手法では頻発すZl
失敗回復処理によって、形態素解析効率が低下する々い
う欠点を少なくする高速な形態素接続解析方式を提供す
ることにある。
本発明によれば、各々の形態素について、左接続、右接
続情報を付加した形態素辞書を格納し、与えられた文字
列の先頭部分(可変長)と表記が一致する形態素集合を
検索する辞書格納、検索手段と、形態素の右接続情報と
それに右接する形態素が持つべき左接続情報の対の集合
を格納し、入力右接続情報乗合から左接続情報乗合を検
索する隣接行列検索手段と、時刻t から1 までに発
足した形態素の乗合と同乗合の持つ右接続情報乗合を0
11記隣接行列検索手段の入力とし得られた左接続情報
集合と右接する、形態素集合が持9在接続集合の集合積
を対にしてスタ・りする失敗回復処理用スタ、り手段と
、前記辞書格納検索手段と前記隣接行列検索手段と前記
失敗回復処理用スタック手段とを制御し形態素解析を行
なう形態素解析手法手段よりなることを特徴とする形態
素接続解析方式が得られる。
本発明による形態素接続が1折力式含−実施例について
図面を用い説明する。第1潮は本発明方式を実現する装
置の一実施例を示すプロ、j冒ある。
第1図において、辞書格納・検索手段1は、データ線・
11 よりの入力文字列の先頭よp登録済み形態素のう
ち最長文字列の形態素に関する、左接続右接続情報をデ
ータ線14を介り、出力する。同検索時刻自形態系が兄
つからない時は、同データ線14を介し”F”ail”
を出力する。
隣接行列検索手段2は、内部に隣接行列を格納し7、同
隣接行列の行に右接続情報項目、同列に猫定行の右接続
情報に後接する形態素の左接続’+’A報が登録され、
データ線42よりの複数の右接続情報入力に対し各々の
右接続情報に対応する左接続(’A報を組にしてデータ
線24 より出力する。
失敗回復処理用スタック手段3は、データ線43゜上り
のデータをプノンユダウン記憶し、ボノプア2ブデータ
を同データ線34よ多出力する。プツシ−ダウン、ポン
プアップ操作は、信号線432よリノ人力”d7”U”
 によって指定される。
形態素解析制御手段4は、データ線04よシ入力文を受
け取り、一旦同手段内バッファに格納する入力文読み込
み動作を行なった後第2図(a) (b) (clフロ
ーチャートに示すような形態素解析動作を行なう。同形
態素解析動作は、入力文が全て形態素列に変換された時
終了し、データ線40全通し前記失敗回復処理用スタッ
ク手段3内の内容を出力する。前記形態素解析制御手段
4はマイクロコンビュータに上り実現でき、その動作の
一例は、前記第2図のフローチャートに示される。まず
読み込まれた、人力文字列は、バッファ内に貯えられ、
nにその文字鹸iを1に、Wlを初期値0に設定する。
形態素解析用にローカル変数集合J−1rM、が確保さ
れ、全てのMj には、Wj(形Wjの入力文字列中で
の先頭位置)、杓(Wjの左接続情報集合)、r3 (
W4の右接続情報集合)、町(形態素j末尾の入力文字
列中での位置)が設定され、Moには、roだけが設定
されている。
入力さハ、ると、Wlカらf、までの文字列が辞書格納
・検索手段1へ送られ、Miを読み込む、もし、その値
がFAILなら失敗回復処理のため■へ行く。I”AI
Lでなかったら、r−一、右接続情報集合を隣接行列検
索手段2へ送り、i′、左接続情報集合を得る。
/Vi = l IA7; が0でW、とf、が等しか
ったら■へ、それ以外は■へ行く。ヘーハ△7iが0で
kいときは、べに対応するr、の部分集合r′iをr、
に設定し、ヘ をi、に設定する。
その後l に対応するro、7L を選択し、+ 1 
.1 Hr 各々r= 、I−に再設定する。その後、M、1−−1
 1−1 1’−’ を失敗処理用スタック手段3にプッシュダウンする。も
し、解析すべき入力文字列が残ってい寿かったら出力処
理へ、残っていれば■へ行く。
失敗回復処理■ではもし、WIが0ならばFAILを出
力、そう−r3いなら、失敗回復処理スタック手段3V
 J:リボ、ブアノプ腰ム4.−1に設定]2て■へ、
行く。
この処理に於いて、右接続・左接続情報は許される全て
の暖味さが集合でri、4 K保持される。
こハ、によって、従来1つの形態素jを検索してそれが
もつ左接続、右接続の集合のうち1つ選択し、次に接続
する形態素j++ を選択し7ていたために、本方式に
比[7、失敗回復処理回数が多くなり、同処理に要する
コストが大きくなるという欠点があったが、本発明によ
ってこの秒の無駄を大きく減少することができる。
【図面の簡単な説明】
第1図は本発明方式を実現する装置の一実施例をボすブ
ロック図を示す。 第2図(al 、 (b) 、 (clけ本方式中の形
態素解析制御手段4の動作を説明するフローナ)、−ト
を示す図である。 図において、1は辞書格納・検索手段、2は隣接行列検
索手段、3は失敗回復処理用スタック、4は形態解析制
御手段をそれぞれ示す。 71 図 オ 2 図 (b) 71−2 図 (C)

Claims (1)

    【特許請求の範囲】
  1. 形態素解析方式において、形態素辞書を格納し人力文字
    列に従って前記文字列の形態素の接続情報を検索する辞
    書格納・検索手段と、形態素の接続関係を保持し前記形
    態素の接続情報に従って接続関係を検索する隣接行列検
    索手段と、入力文字列を前記辞書格納検索手段と前記隣
    接行列検索手段を用いて形態素解析を行なった手順を全
    て格納し指定された時刻の状態を復帰させる失敗回復処
    理用スタック手段と、入力文中の隣接の形態素間の接続
    可能性に係る暖味さを集合のまま保持する仁とにより形
    態素接続解析を制御する形態素解析制御手段よりなるこ
    とを特徴とする形態素接続解析方式。
JP58183434A 1983-09-30 1983-09-30 形態素接続解析方式 Pending JPS6075982A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58183434A JPS6075982A (ja) 1983-09-30 1983-09-30 形態素接続解析方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58183434A JPS6075982A (ja) 1983-09-30 1983-09-30 形態素接続解析方式

Publications (1)

Publication Number Publication Date
JPS6075982A true JPS6075982A (ja) 1985-04-30

Family

ID=16135703

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58183434A Pending JPS6075982A (ja) 1983-09-30 1983-09-30 形態素接続解析方式

Country Status (1)

Country Link
JP (1) JPS6075982A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH086945A (ja) * 1994-06-16 1996-01-12 Ibm Japan Ltd 文書の論理構造の解析方法及びシステム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH086945A (ja) * 1994-06-16 1996-01-12 Ibm Japan Ltd 文書の論理構造の解析方法及びシステム

Similar Documents

Publication Publication Date Title
Wang et al. A transition-based algorithm for AMR parsing
US5060143A (en) System for string searching including parallel comparison of candidate data block-by-block
JPH0689302A (ja) 辞書メモリ
JPS6033665A (ja) キ−ワ−ド自動抽出方式
JPS6075982A (ja) 形態素接続解析方式
JPH0454564A (ja) 重み学習型テキストベース検索装置
JPH0752450B2 (ja) 辞書デ−タ検索装置
JP3253657B2 (ja) 文書検索方法
Fenogenova et al. Automatic morphological analysis on the material of Russian social media texts
JPH0345421B2 (ja)
JPS62184572A (ja) 単語分割装置における呼応複合語の辞書検索方式
JPS6282466A (ja) 辞書検索装置
JPS59221732A (ja) カナ漢字変換処理装置
JPH0226268B2 (ja)
JP2695772B2 (ja) 仮名漢字変換装置
JPS6132167A (ja) カナ漢字変換処理装置
JPS61282966A (ja) 仮名漢字変換方式
JPH04278664A (ja) 住所解析処理装置
JPS58214931A (ja) 単語切り出し装置
JPS63257030A (ja) 文字列検索回路
JPH0827636B2 (ja) 単語つづり―発音記号変換装置
JPH0193820A (ja) 検索装置
Masaki et al. A new approach to syntactic annotation
JPS6316369A (ja) 日本語処理方式
JPS6395575A (ja) 日本語文の形態素解析方法