JP3348909B2 - 形態素解析装置 - Google Patents

形態素解析装置

Info

Publication number
JP3348909B2
JP3348909B2 JP11009993A JP11009993A JP3348909B2 JP 3348909 B2 JP3348909 B2 JP 3348909B2 JP 11009993 A JP11009993 A JP 11009993A JP 11009993 A JP11009993 A JP 11009993A JP 3348909 B2 JP3348909 B2 JP 3348909B2
Authority
JP
Japan
Prior art keywords
character
onomatopoeia
pattern
dictionary
mimetic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP11009993A
Other languages
English (en)
Other versions
JPH06301715A (ja
Inventor
美苗 西村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP11009993A priority Critical patent/JP3348909B2/ja
Publication of JPH06301715A publication Critical patent/JPH06301715A/ja
Application granted granted Critical
Publication of JP3348909B2 publication Critical patent/JP3348909B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、擬音語・擬態語を含む
文章を解析する形態素解析装置に関する。
【0002】
【従来技術】擬音語・擬態語の取り扱いにについて、特
開平3−161860号公報には、モーラ(音の区切り
の単位)2個の組み合せを元として、その繰り返し型や
その派生型も擬音語・擬態語として認識することが記載
されている。認識された擬音語・擬態語のかな漢字変換
結果として、全ての文字がひらがなである候補と、全て
の文字がカタカナである候補を得る。例えば、「にょろ
にょろ」は「にょ」と「ろ」という基本のモーラの組み
合せの繰り返し型である擬態語であると認識し、かな漢
字変換結果として「にょろにょろ」、「ニョロニョロ」
を得る。また、「にょっろーん」は「にょ」と「ろ」と
いう基本のモーラ組み合わせの派生型であると認識し、
かな漢字変換結果として「にょっろーん」、「ニョッロ
ーン」を得る。また、特開平3−199455号公報に
は、同一文字列の繰り返しを文章から取り出し、その全
ての文字をひらがな及びカタカナに変換する擬音語・擬
態語変換手段を備えることが記載されている。例えば、
入力文字列から「ぽいぽい」が繰り返し文字列として抽
出され、変換結果としては「ぽいぽい」と「ポイポイ」
を得る。
【0003】
【発明が解決しようとする課題】上記特開平3−161
860号公報においては、基本のモーラの組み合わせは
擬音語・擬態語辞書に一つ一つ登録しておく必要があ
る。登録されていない組み合わせを元にする擬音語・擬
態語は、擬音語・擬態語として処理されない。しかし、
日本語の擬音語・擬態語の数は多く、その全てを擬音語
・擬態語辞書に登録するのは困難である。また、特開平
3−199455号公報においては、擬音語・擬態語、
あるいは、それらを作るモーラの組み合わせを辞書に登
録する必要はない。しかし、擬音語、擬態語が繰り返し
文字列でない場合は、変換対象とならない。例えば、
「ごろん」という文字列は、繰り返し文字列でないため
に、かな漢字変換を行った場合には「語呂ん」、「頃
ん」、「語論」、などの変換結果候補しか得られない可
能性がある。
【0004】本発明においては、擬音語・擬態語をその
文字パターンで辞書に登録することにより、数多い擬音
語・擬態語を一々辞書登録する必要をなくし、辞書の容
量の増大を防ぎ、また、繰り返し文字列のみではなく、
他のパターンの擬音語・擬態語も認識する、形態素解析
装置を提供することを目的とする。
【0005】
【課題を解決するための手段】本発明は上記課題を解決
するために、入力された日本語文字列を複数の形態素候
補列に分割し、この複数の形態素候補列の中から、最も
高い接続性をもつ形態素候補列を形態素解析結果とする
形態素解析装置において、擬音語・擬態語を文字パター
ンで記憶している擬音語・擬態語辞書と、単語辞書と、
前記入力された日本語文字列と前記擬音語・擬態語辞書
および前記単語辞書を照合して、複数の形態素候補列を
取り出す照合手段とを備え、前記擬音語・擬態語辞書
は、擬音語・擬態語の先頭文字を第一汎用記号とし、そ
の文字以降の各文字に対して、擬音語・擬態語に出現す
る特徴的な文字と前記第一汎用記号とで置き換えて生成
される文字列である非繰り返し型の文字パターンと、同
一部分文字列の繰り返しを含む擬音語・擬態語中の異な
る文字には異なる第二汎用記号と置き換えて生成される
文字列である繰り返し型の文字パターンとのいずれか
に、擬音語・擬態語を変換し、この変換した文字パター
ンを見出し語とし、この見出し語と品詞および後接可能
な品詞情報とを対応させて記憶し、前記照合手段は、前
記擬音語・擬態語辞書中の見出し語の先頭文字によって
いずれの型の文字パターンかを判断して前記入力された
日本語文字列と照合し、一致した部分の日本語文字列
後接する形態素の品詞と、その一致した文字パターンに
対する後接可能な品詞情報とが一致する場合、その一致
した部分の日本語文字列を擬音語・擬態語の形態素候補
とすることを特徴としたものである。
【0006】
【作用】擬音語・擬態語を文字パターンで記憶してお
き、形態素解析をする際にその文字パターンと照合し、
擬音語又は擬態語と認識させるようにし、擬音語・擬態
語を少ない辞書容量で数多く認識できるようにする。
【0007】
【実施例】図1は、本発明の一実施例を説明するための
概略構成図で、図中、1は入力手段、2は辞書部、3は
辞書照合手段、4は接続情報部、5は接続判断手段、6
は出力手段である。入力手段1より入力された文字列は
辞書照合手段3により形態素辞書部2のエントリーと照
合される。接続情報部4は品詞と品詞のつながりの妥当
性に関する情報を持ち、接続判断手段5が前記辞書部2
のエントリーから出した候補と、前記接続情報部4の情
報とにより、最も妥当な候補の並びを決め、その結果を
出力手段6に出力する。
【0008】図2は、本発明における辞書に記憶してあ
る擬音語・擬態語のパターンの例を示したもので、図
中、C、X、Y、Zは任意の一文字である。また「m=
助動と連用」は、その擬音語・擬態語が助動詞「と」と
共に使われることを示し、「+動詞する」は、その擬音
語・擬態語が動詞「する」と共に使われることを示す。
この擬音語・擬態語パターンは任意の文字(C、X、
Y、Z)を示す記号と、個別の文字(例えば、り、っ、
ん,リ、ッ、ン、ー)を使って表現することができる。
すなわち、任意の文字を示す記号によって、擬音語・擬
態語に用いられるいろいろな文字をまとめて表すことが
できる。また、個別の文字を使うことができるので、あ
る複数の擬音語・擬態語に共通して用いられる特徴的な
文字を指定することができる。この記述方法により擬音
語・擬態語の色々なパターンを容易に記述できる。
【0009】擬音語・擬態語パターンには品詞情報を与
えることにより、通常の表記からなる辞書エントリーと
同じように、形態素として扱うことができる。さらに、
擬音語・擬態語パターンには形態素の接続の妥当性を判
断するのに必要な情報を与えることができる。なお、通
常の表記からなるエントリーと擬音語・擬態語エントリ
ーは別々の辞書に分けて登録することも可能である。
【0010】以下、擬音語・擬態語を含む文字列の形態
素解析処理について説明する。形態素解析する文字列に
対し、辞書照合手段は解析対象文字列から一文字ずつ順
に照合の開始点をずらしながら、辞書見出しとの比較を
おこない、見出しと一致する部分文字列を解の候補とし
て取り出す。照合の時、辞書の通常の表記エントリーだ
けでなく、擬音語・擬態語エントリーとの照合も行な
う。
【0011】擬音語・擬態語エントリーは、図2に示し
たように、パターンで記述する。表記エントリーとも、
擬音語・擬態語エントリーともマッチしない部分文字列
は辞書未登録語として処理される。照合されて切り出さ
れた形態素の候補は、普通、複数あるので、その中から
最も妥当なものを選ぶ。そのためには、接続判断手段が
形態素候補の品詞情報と、接続情報部に蓄えられている
接続に関するルールを参照し、隣り合う形態素の品詞と
品詞のつながりの最も妥当度の高いものを選んでいく。
【0012】次に、解析対象文字列と辞書中の擬音語・
擬態語パターンの照合手順について説明する。見出し語
が、擬音語・擬態語パターンである場合の照合手順は、
通常の表記からなる見出しの場合と異なり、擬音語・擬
態語パターンによって二つに分れる。一つのパターンは
「り、っ、ん、ー」など擬音語・擬態語に特徴的な文字
持ち、かつ同一文字列の繰り返しを含まないパターン
である。「ころり、ばったり、どすん、どーん」などが
このパターンの例である。このパターンを以下、非繰り
返し型と呼ぶ。非繰り返し型中の「り、っ、ん、ー」以
外の文字は任意の文字である。任意の文字は辞書の擬音
語・擬態語パターン見出し中、図2に示したように、
「C」で表してある。また、擬音語・擬態語がカタカナ
表記される場合にも照合できるように、辞書には、カタ
カナを使ったパターンも登録しておく。もう一つの擬音
語・擬態語パターンは二つ以上の文字を繰り返す繰り返
し型である。「ころころ」、「ふわりふわり」などがこ
のパターンの例である。辞書では、図2に示したよう
に、XYまたはXYZの繰り返しで表してある。繰り返
しの回数は、三回までとして辞書の例には示してある
が、繰り返し回数のより多いパターンを辞書に追加する
ことは可能である。
【0013】図3は、擬音語・擬態語の照合を説明する
ためのフロー図で、照合手段が、辞書見出しを一つずつ
参照するとき(step1)、見出しの一文字目P1が、任
意の文字を示す「C」や個別の文字の「り、っ、ん、
リ、ッ、ン、ー」などであれば、非繰り返し型擬音語・
擬態語用の照合を行なうため、ステップ2以降へ進む。
1が「り、っ、ん、リ、ッ、ン、ー」などの個別の文
字でなければ(step2)、照合手段は、解析対象文字列
の次の文字S(i+1)に進み(step4)、擬音語・擬
態語パターンの次の文字P(i+1)との照合を行な
う。iの値が1より大きい場合、パターンの文字が
「C」の場合、iの値を1増やし、次の文字の照合に進
む(step1,2,4)。
【0014】パターンの文字Piが「っ,ッ,り,リ,ン,
ん,ー」など、任意の文字「C」でなく、個々の文字で
ある場合(step2)、解析対象文字列の文字Siと比較
する(step3)。同じ文字である場合、iの値を1増や
し、次の文字に進んで照合を続ける(step4)。ステッ
プ3において、パターンの文字Piと解析対象文字Si
が異なっていたら、解析対象文字列の解析開始文字S1
まで戻り、辞書の次の見出し語との照合を行なう(step
16)。パターンP全体と文字列Sが一致し、ステップ
5において、パターンの終りが検出されたら、その文字
列Sを非繰り返し型擬音語・擬態語とし、解候補のひと
つとする。一致した擬音語・擬態語パターンの品詞情
報,接続情報を辞書から取り、接続判断手段に送る。
【0015】ステップ1において、辞書見出しを一つず
つ参照するとき、辞書の擬音語・擬態語パターンの一文
字目P1が任意の一文字を示す「C」や個別の文字の
「り、っ、ん、リ、ッ、ン、ー」などでない場合は、繰
り返し型用の照合を行なうため、ステップ6へ進む。ス
テップ6において、P1が「X」の場合、解析対象文字
S1をL1に記憶し(step10)、iを1増やして次の
文字に進む(step14)。ステップ6において、P1が
「X」でない場合、見出し語は擬音語・擬態語パターン
でなく、表記による見出しと判断し、通常の照合を行な
う(step8)。擬音語・擬態語パターンの二文字目P2
が「Y」の場合、解析対象文字S2をL2に記憶し(st
ep10)、iを1増やして次の文字に進む(step1
4)。
【0016】ステップ7において、パターンの三文字目
P3が「Z」である場合は、パターンは三文字の繰り返
し型である。「Z」でない場合は、二文字の繰り返し型
パターンとなる。三文字の繰り返し型パターンの場合、
S3をL3に記憶し(step10)、iを1増やして4と
する。二文字の繰り返し型パターンの場合、解析対象文
字S3がS1と同じかどうか調べるため、S3とL1を
比較する(step12)。同じであれば、iを1増やして
4とし(step14)、解析対象文字S4がS2と同じか
どうか調べるため、S4とL2を比較する(step1
2)。同じであれば、iを1増やして5とする。ステッ
プ15において、パターンが終わっていなければ、ステ
ップ6に戻り照合を続け、終わっていれば、照合した解
析対象文字S1からS4までをXYXY型擬音語・擬態
語とし、解候補のひとつとする。
【0017】辞書に記述されているXYXY型の品詞情
報、接続情報は接続判断手段に送られる。照合手段は解
析対象文字列の解析開始文字まで戻り、辞書の次の見出
し語との照合を行なう(step16)。step12におい
て、S3とL1、またはS4とL2の比較をした結果、
同じ文字でない場合、二文字の繰り返し型パターンとの
比較を終わる。次いで、照合手段は解析対象文字列の解
析開始文字まで戻り、辞書の次の見出し語との照合を行
なう(step16)。
【0018】ターンが三文字の繰り返しである場合の
照合も二文字の繰り返し型パターンとの照合に準じて行
なうことができる。その場合、ステップ13において比
較されるのは、S4とL1、S5とL2、S6とL3で
ある。
【0019】実施例1 「鐘がごーんとなった。」この文の擬音語部分「ごー
ん」が、辞書のエントリーに含まれていない場合、形態
素解析を行なうと表1に示すような候補が得られる。
【0020】
【表1】
【0021】以上のような候補の中から、つながりの妥
当性のもっとも高い組み合わせを接続ルールなどを使っ
て決める。この時、未登録語を最小限にするように品詞
が選ばれるので、文全体の解析結果としては表2に示す
ような結果を得る。
【0022】
【表2】
【0023】形態素辞書が擬音語・擬態語パターンを
ントリーとして含む場合、辞書照合手段は、「ごーん」
それらのエントリーとマッチするかどうか調べる。擬
音語・擬態語パターン「Cーん」とマッチすることがわ
かるので、これを解候補とする。接続判断手段におい
て、「Cーん」の接続情報である「助動詞と連用」と次
の形態素「と」の品詞「助動詞と連用」がマッチするの
で、この組み合わせを解候補とする。すなわち、「ごー
んと」という部分文字列について表3に示すような解を
得る。
【0024】
【表3】
【0025】文字列S「ごーん」と擬音語・擬態語パタ
ーンP「Cーん」の照合を、図3に示す、文字列と擬音
語・擬態語パターン照合のフロー図に沿って説明する。
まず、最初に、iは1にセットされる。ステップ1にお
いて、パターンの第一文字目P1が「C」なので、ステ
ップ2に進む。P1は、個別の文字ではないので(step
2)、文字S1「ご」との比較は行なわず、iを1増や
し第二文字目に進む(step4)。ステップ5で、パター
ンがP2を持ち、文字列Sが二文字目S2を持つとわか
るので、ステップ1に戻る。パターン「Cーん」の第二
文字目P2と、文字列「ごーん」の第二文字目S2
「ー」を比較すると、同じなので(step1,step2,st
ep3)、iをさらに1増やし第三文字目に進む。ステッ
プ5で、パターンがP3を持ち、文字列Sが三文字目S
3を持つとわかるので、ステップ1に戻る。パターン
「Cーん」の第三文字目P3と文字列「ごーん」の第三
文字目S3を比較すると、同じなので、iをさらに1増
やす。ステップ5において、パターンP及び文字列Sの
終わりを検出するので照合を終わり、文字列S「ごー
ん」を擬音語・擬態語とする。「Cーん」の辞書内容を
接続判断手段に送る。接続判断手段では「ごーん」の前
後の形態素の最適なものを接続情報を使って選ぶ。
【0026】更に、接続妥当度の最も高いような品詞の
並びの組を解候補から選び、文全体の解を得る。この例
では「ご 接辞頭+ー 未登録語+ん 助動ず終止形」な
どより、「ごーん 副詞+と 助動詞と連用」の接続が妥
当であるという基準から表4に示すような形態素解析結
果を得る。
【0027】
【表4】
【0028】実施例2 「くよくよしない。」この文の擬音語部分「くよくよ」
が、辞書のエントリーに含まれていない場合、形態素解
析を行なうと「くよくよし」の部分に対して表5に示す
ような解候補が得られる。
【0029】
【表5】
【0030】以上のような候補の中から、つながりの妥
当性のもっとも高い組み合わせを接続ルールなどを使っ
て決める。この時、未登録語を最小限にするように品詞
が選ばれるので、表6に示すような解を得る。
【0031】
【表6】
【0032】形態素辞書が擬音語・擬疑語パターンを
ントリーとして含む場合、辞書照合手段は、「くよく
よ」がそれらのエントリーとマッチするかどうか調べ
る。擬音語・擬態語パターン「XYXY」とマッチする
ことがわかるので、これを解候補とする。接続判断手段
において、「XYXY」の接続情報である「+動詞サ
変」と次の形態素「し」の品詞「助動サ変連用」がマッ
チするので、この組み合わせを解候補とする。そして、
「くよくよし」という部分文字列の解析結果としては、
表7に示すような結果を得る。
【0033】
【表7】
【0034】文字列S「くよくよ」と擬音語・擬態語パ
ターンP「XYXY」の照合を、図3に示す、文字列と
擬音語・擬態語パターン照合のフロー図に沿って説明す
る。まず、最初に、iを1にセットする。ステップ1に
おいて、パターンの第一文字目P1が「C」や、個別の
文字ではないのでステップ6に進む。P1は、「Z」で
はないので、ステップ9に進み、iの値が1で3より小
さいので、ステップ10に進み、L1にS1「く」を記
憶する。ステップ14でiを1増やす。ステップ15
で、パターンがP2を持ち、文字列Sが二文字目S2を
持つとわかるので、ステップ6に戻る。ステップ8でP
2が、「Z」ではないので、ステップ9に進む。iの値
は2で3より小さいので、ステップ10に進み、L2に
S2「よ」を記憶する。ステップ14でiを1増やし3
にする。ステップ15で、パターンがP3を持ち、文字
列Sが三文字目S3を持つとわかるので、ステップ6に
戻る。ステップ7において、P3が「Y」なので、ステ
ップ9に進み、iが3なので、ステップ12に進む。
【0035】S3「く」がL1「く」と同じなので、ス
テップ14に進みiを1増やし4にする。ステップ15
で、パターンがP4を持ち、文字列Sが四文字目S4を
持つとわかるので、ステップ6に戻る。ステップ7にお
いて、P4が「Z」ではないので、ステップ9に進み、
iが4なので、ステップ12に進む。S4「よ」が、L
2「よ」と同じなので、ステップ14に進み、iを1増
やし5にする。ステップ14でパターンP「XYXY」
が終了しているとわかるので、パターンP「XYXY」
との照合を終わる。「XYXY」の辞書内容を接続判断
手段に送り、接続判断手段では「くよくよ」の前後の形
態素の最適なものを接続情報を使って選ぶ。
【0036】更に、接続妥当度の最も高いような品詞の
並びの組を解候補から選び、文全体の解を得る。この例
では「く 未登録語+よく 助動詞よい連用+よし 名詞
和語+ない 形態詞ない終止」などの接続より、「くよ
くよ 副詞+し 動詞サ変連用+ない 助動詞ない終止」
の接続が妥当と判断され文全体の形態素解析結果として
は表8を得る。
【0037】
【表8】
【0038】
【効果】以上の説明から明らかなように、本発明による
と、以下のような効果がある。 (1)個々の擬音語・擬態語を辞書に記述する必要がな
いので、辞書の容量の大きさを抑えたままで、擬音語・
擬態語を含む文字列の形態素解析の解析率を向上させる
ことができる。 (2)個別の文字と汎用的な記号を使って擬音語・擬態
語のパターンを容易に表現することができ、その結果、
辞書の保守が容易になる。 (3)通常の表記によって辞書に登録されている形態素
と同様、擬音語・擬態語についても、品詞を指定でき
る。 (4)通常の表記によって辞書に登録されている形態素
と同様、擬音語・擬態語についても、他の語とのつなが
りを指定することができる。
【図面の簡単な説明】
【図1】 本発明の一実施例を説明するためのブロック
図の一例である。
【図2】 形態素辞書の擬音語・擬態語の記述例を示し
たものである。
【図3】 文字列と擬音語・擬態語パターン照合のフロ
ー図の一例である。
【符号の説明】
1…入力手段、2…形態素辞書部、3…辞書照合手段、
4…接続情報部、5…接続判断手段、6…出力手段。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力された日本語文字列を複数の形態素
    候補列に分割し、この複数の形態素候補列の中から、最
    も高い接続性をもつ形態素候補列を形態素解析結果と
    る形態素解析装置において、擬音語・擬態語を文字パタ
    ーンで記憶している擬音語・擬態語辞書と、単語辞書
    と、前記入力された日本語文字列と前記擬音語・擬態語
    辞書および前記単語辞書を照合して、複数の形態素候補
    列を取り出す照合手段とを備え、前記擬音語・擬態語辞
    書は、擬音語・擬態語の先頭文字を第一汎用記号とし、
    その文字以降の各文字に対して、擬音語・擬態語に出現
    する特徴的な文字と前記第一汎用記号とで置き換えて生
    成される文字列である非繰り返し型の文字パターンと、
    同一部分文字列の繰り返しを含む擬音語・擬態語中の異
    なる文字には異なる第二汎用記号と置き換えて生成され
    る文字列である繰り返し型の文字パターンとのいずれか
    に、擬音語・擬態語を変換し、この変換した文字パター
    ンを見出し語とし、この見出し語と品詞および後接可能
    な品詞情報とを対応させて記憶し、前記照合手段は、前
    記擬音語・擬態語辞書中の見出し語の先頭文字によって
    いずれの型の文字パターンかを判断して前記入力された
    日本語文字列と照合し、一致した部分の日本語文字列
    後接する形態素の品詞と、その一致した文字パターンに
    対する後接可能な品詞情報とが一致する場合、その一致
    した部分の日本語文字列を擬音語・擬態語の形態素候補
    することを特徴とする形態素解析装置。
JP11009993A 1993-04-12 1993-04-12 形態素解析装置 Expired - Fee Related JP3348909B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11009993A JP3348909B2 (ja) 1993-04-12 1993-04-12 形態素解析装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11009993A JP3348909B2 (ja) 1993-04-12 1993-04-12 形態素解析装置

Publications (2)

Publication Number Publication Date
JPH06301715A JPH06301715A (ja) 1994-10-28
JP3348909B2 true JP3348909B2 (ja) 2002-11-20

Family

ID=14527015

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11009993A Expired - Fee Related JP3348909B2 (ja) 1993-04-12 1993-04-12 形態素解析装置

Country Status (1)

Country Link
JP (1) JP3348909B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5354425B2 (ja) * 2009-04-21 2013-11-27 国立大学法人電気通信大学 オノマトペのイメージ評価システム、イメージ評価装置、およびイメージ評価用プログラム

Also Published As

Publication number Publication date
JPH06301715A (ja) 1994-10-28

Similar Documents

Publication Publication Date Title
US7584093B2 (en) Method and system for generating spelling suggestions
US6876963B1 (en) Machine translation method and apparatus capable of automatically switching dictionaries
JPH07325829A (ja) 文法チェックシステム
JPH09128383A (ja) 中国語テキストを処理するためのシステムおよび方法
US20040243394A1 (en) Natural language processing apparatus, natural language processing method, and natural language processing program
JP5231698B2 (ja) 日本語の表意文字の読み方を予測する方法
US20040193399A1 (en) System and method for word analysis
KR20040101678A (ko) 복합 형태소 분석 장치 및 방법
Adda-Decker A corpus-based decompounding algorithm for German lexical modeling in LVCSR.
JP3348909B2 (ja) 形態素解析装置
JP3880087B2 (ja) 形態素解析装置
JPH11338863A (ja) 未知名詞および表記ゆれカタカナ語自動収集・認定装置、ならびにそのための処理手順を記録した記録媒体
JP4047895B2 (ja) 文書校正装置およびプログラム記憶媒体
Dione Finite-state tokenization for a deep Wolof LFG grammar
JP3752535B2 (ja) 訳語選択装置、及び翻訳装置
JP3470927B2 (ja) 自然語解析方法及び装置
JP4047894B2 (ja) 文書校正装置およびプログラム記憶媒体
JPS62249269A (ja) 文書処理装置
JP4318223B2 (ja) 文書校正装置およびプログラム記憶媒体
Bonus The Tagalog Stemming Algorithms (TagSA)
JP3143906B2 (ja) 未知語の存在の判定装置
Carlos et al. Large-coverage root lexicon extraction for Hindi
JPH0869467A (ja) 日本語文書処理装置
Kang et al. A hybrid approach to automatic word-spacing in Korean
JPH0262659A (ja) 日本文訂正候補文字抽出装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080913

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080913

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090913

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees