JP3072955B2 - 重複話題語を考慮した話題構造認識方法と装置 - Google Patents

重複話題語を考慮した話題構造認識方法と装置

Info

Publication number
JP3072955B2
JP3072955B2 JP06245934A JP24593494A JP3072955B2 JP 3072955 B2 JP3072955 B2 JP 3072955B2 JP 06245934 A JP06245934 A JP 06245934A JP 24593494 A JP24593494 A JP 24593494A JP 3072955 B2 JP3072955 B2 JP 3072955B2
Authority
JP
Japan
Prior art keywords
topic
word
processing
recalculation
storage unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP06245934A
Other languages
English (en)
Other versions
JPH08110906A (ja
Inventor
敦 竹下
孝史 井上
一男 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP06245934A priority Critical patent/JP3072955B2/ja
Priority to US08/354,120 priority patent/US5642520A/en
Publication of JPH08110906A publication Critical patent/JPH08110906A/ja
Application granted granted Critical
Publication of JP3072955B2 publication Critical patent/JP3072955B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、自然言語解析における
話題構造認識の方法に関する。
【0002】
【従来の技術】人間にテキストや対話データを提示して
「これらテキストないし対話データの中の同じことが書
いてあるブロックと、その『同じこと』を求めよ」とい
う課題を与えると、個人差なく同じ構造を答えるという
性質が実験的に確認されている。その実験については、
例えば『竹下他:「話題構造認識の観点からのヒューマ
ンコミュニケーションの研究」電子情報通信学会199
3年秋季大会D-62(p.6-64)』に記載されている。人間に
よって把握されるこのような構造を「話題構造」と呼
ぶ。話題構造は入れ子構造を形成するので、各話題は、
話題を示す「話題語」と、入れ子の深さを表す「話題レ
ベル」と、テキストないし対話データの中においてその
話題がどの文からどの文まで継続するかという「話題ス
コープ」によって表現できる。以下において、話題構造
の解析の対象となるテキストや対話データのことを言語
データと呼ぶ。
【0003】図1は、電気通信政策に関連した内容の言
語データに対する話題構造の一例を示している。言語デ
ータは、第0文から始まって少なくとも第770文まで
続いている。そして、「通信サービス」という話題語を
持つ話題の話題レベルは1であり、その話題スコープは
第0文から第770文までの範囲である。なお、説明を
簡単にするために、以下においては、『「通信サービ
ス」の話題』のように、話題語を用いてその話題を指す
ことにする。
【0004】「通信サービス」の話題の中には、話題レ
ベルが2である「新規サービス」と「従来からのサービ
ス」という話題が存在し、「新規サービス」の話題は第
125文から第431文までの話題スコープを持ち、
「従来からのサービス」の話題は第432文から第77
0文までの話題スコープを持つ。また、「新規サービ
ス」の話題と「サービスA」の話題のように話題レベル
が1だけ違い、直接の入れ子関係になっているような関
係を「親子関係」と呼び、話題レベルが小さい方の話題
を「親話題」、話題レベルが大きい方の話題を「子話
題」と呼ぶ。ここに示した例では、「新規サービス」の
話題が親話題であり、「サービスA」の話題が子話題と
なる。したがって、「従来からのサービス」の話題は
「サービスB」の話題の親話題であるが、「サービス
A」の親話題ではない。同様に、「新規サービス」の話
題は「サービスB」の話題の親話題ではないし、「通信
サービス」の話題も「サービスB」の親話題ではない。
【0005】このような話題構造を計算機によって認識
することを話題構造認識と呼ぶ。話題構造を認識するた
めの方法は、これまでにもいくつか提案されている。こ
こでは、『竹下:「話題構造認識を用いた映像検索シス
テム」情報処理学会情報メディア研究会94-IM-15-1』で
述べられている話題構造の認識方法について簡単に説明
する。図2はこの認識方法で使用する話題構造認識装置
の一例の構成を示すブロック図であり、図3はこの認識
方法における話題構造認識処理を示すフローチャートで
あり、図4はこの話題構造認識処理における話題構造認
識前処理以降の処理の流れの一例を示す図である。これ
らの図を用いて、本発明の前提となるべき話題構造認識
処理について説明する。
【0006】図2に示される従来の話題構造認識装置
は、言語データが入力するデータ入力部701と、各種
の処理を実行する処理部702と、結果を表示する表示
部703と、処理結果や処理途中で必要となるデータを
保持する記憶部704と、話題構造認識処理で使用され
る辞書や規則類を格納する辞書・規則部705によって
構成されている。記憶部704には、前処理後の言語デ
ータを記憶する言語データ記憶部710と、中間の処理
結果や最終的な処理結果を保持する話題構造記憶部71
1とが設けられている。さらに話題構造記憶部711に
は、基盤展開記憶部712と意味的展開記憶部713と
統合話題記憶部714が設けられている。一方、辞書・
規則部705には、前処理用辞書721と意味的展開処
理規則722と基盤展開処理規則723と統合処理規則
724とが設けられている。
【0007】この話題構造認識装置を用いて話題構造認
識処理を行う場合、まず、図3に示すように、入力され
た言語データ730に対する話題構造認識前処理740
を行う。この話題構造認識前処理740の第1ステップ
は、入力した言語データ730に対する形態素解析処理
741である。形態素解析処理741では、入力された
言語データ730の文字列を単語ごとに区切って単語列
とし、さらに各単語の品詞や活用語の活用形等を同定す
る。続いて、前処理740の第2ステップとして、形態
素解析の結果を入力として、単文区切り処理742を行
う。単文区切り処理742は、埋め込み文や重文のよう
に複数の述語を含む文を、1つの述語のみを含む単文に
分割する処理である。前処理740の第3ステップとし
て、顕著名詞句抽出743を実行する。顕著名詞句抽出
743は、単文区切り処理742の結果を入力として、
各単文において最も強調されている名詞句を抽出する処
理である。そして、前処理740の第4ステップとし
て、ブロック認識744を実行する。ブロック認識74
4は、テキストでの段落に相当するブロックを認識する
処理である。これら、話題構造認識前処理740に属す
る各処理は、辞書・規則部705内にある前処理用辞書
721を用いて、処理部702によって実行され、その
結果は、記憶部704内の言語データ記憶部710に格
納される。
【0008】話題構造認識前処理740が完了したら、
話題の展開の処理を基盤展開処理750と意味的展開処
理760とに分離して実行する。ここで基盤展開とは、
「まず」や「次に」のような手掛かり句や章立て、箇条
書きなどによって明示的に示された話題展開のことであ
り、意味的展開とは、基盤展開の各話題の中で、明示的
ではない形で提示、進行する話題の展開のことである。
【0009】まず、図3に示されるように、基盤展開処
理750において、話題確立区間の決定751、話題語
の決定752、話題スコープと話題レベルの決定753
という3つの処理を順次行う。ここで話題確立区間と
は、話題が提示、確立される区間のことである。話題語
の決定752では、各話題確立区間における顕著名詞句
を話題語候補とし、これら話題語候補の中で優先順位が
最も高いものを選んで話題語とする。話題スコープと話
題レベルの決定753では、箇条書き等の構造に基づい
て、処理が行われる。基盤展開処理750は、辞書・規
則部705内の基盤展開処理規則723を用いて処理部
702で実行され、その結果は記憶部704の中の話題
構造記憶部711内に含まれる基盤展開記憶部712に
格納される。
【0010】このような基盤展開処理750における処
理の具体例が図4に示されている。まず、言語データの
開始時点と「まず」とか「次に」といった手掛かり句の
近辺とを基盤展開の話題確立区間として決定している。
そして、話題語の決定752では、最初の話題確立区間
からは「通信サービス」が、2番目の話題確立区間から
は「新規サービス」が、3番目の話題確立区間からは
「従来からのサービス」が、それぞれ、話題語として選
ばれている。
【0011】基盤展開処理750の実行後、意味的展開
処理760が実行される。意味的展開処理760は、基
盤展開処理750と同様に、話題確立区間の決定76
1、話題語の決定762、話題スコープと話題レベルの
決定763という3つの処理によって構成される。この
意味的展開処理760は、辞書・規則部705内の意味
的展開処理規則722を用いるとともに基盤展開処理7
50の結果も利用して処理部702で実行され、その結
果は記憶部704の中の話題構造記憶部711に含まれ
る意味的展開記憶部713に格納される。
【0012】図4に示した例では、話題確立区間とし
て、ある程度以上長い段落あるいはブロックが選択さ
れ、それらにおける話題語として、「サービスA」と
「サービスB」が選ばれている。話題スコープとして
は、上述した話題確立区間の開始点から基盤展開におけ
る次の話題確立区間の開始点までが求められている。話
題レベルは、テキストの意味的展開の場合には、全て同
じレベルすなわちレベル1とされる。
【0013】最後に、基盤展開と意味的展開の統合処理
770が行われ、その結果として、言語データ全体の話
題構造780が出力される。この統合処理770は、基
盤展開処理750と意味的展開処理760のそれぞれの
話題構造を入力とし、辞書・規則部705内の統合処理
規則724を用いて、処理部702によって実行され
る。図4に示した例では、統合処理の結果として、図1
に示したのと同様の話題構造780が得られている。
【0014】基盤展開と意味的展開のそれぞれにおい
て、話題確立区間や話題語、話題スコープ、話題レベル
を決定するための規則(意味的展開処理規則722や基
盤展開処理規則723)は、言語データが対話、モノロ
ーグ、書き言葉テキストなどのどの伝達形態によるもの
であるかによって異なる。伝達形態による話題展開様式
や話題構造認識規則の違いと、話題構造認識実験の結果
については、『竹下他:「話題構造認識の観点からのヒ
ューマンコミュニケーションの研究」電子情報通信学会
1993年秋季大会D-62(p.6-64)』に記載がある。
【0015】
【発明が解決しようとする課題】しかしながら、上述し
た従来の話題構造認識方法では、話題構造内に含まれる
話題語の関係を考慮せずに話題語の決定を行っていたの
で、親子関係や隣接関係にある2つの話題の話題語が同
じになってしまうことがあり、そのために話題構造認識
の精度が落ちたり、あるいは人間が話題構造を内容一覧
や目次として利用しようとしたときに分かりにくくなる
という問題点がある。
【0016】例えば、図5に示したモノローグ例に対し
て従来の話題構造認識方法を適用すると、図6のような
内容一覧が自動的に生成される。ところが、図6の内容
一覧では、1.1.1と1.1.2の章タイトルが全く同じ(「簡
易型携帯電話」)であるため、人間にとっては違和感が
あり、また、どこに何が書いてあるかという概要を把握
することも困難となる。
【0017】本発明の目的は、話題構造内に含まれる話
題語相互間の関係を考慮することによって正確な話題構
造認識を行うことができ、的確な内容一覧を出力するこ
とができる話題構造認識方法及び装置を提供することに
ある。
【0018】
【課題を解決するための手段】本発明の話題構造認識方
法は、辞書・規則部に格納された前処理用辞書を使用
し、入力された言語データの文字列を単語ごとに区切っ
て、単語列、前記各単語の品詞、活用語の活用形を同定
する形態素解析処理と、前記単語列と前記各単語の品詞
と前記活用語の活用形から、複数の述語を含む文を一つ
の述語のみを含む単文に分割する処理と、前記各単文に
おいて最も強調されている名詞句を顕著名詞句として抽
出する処理と、段落に相当するブロックを認識するブロ
ック処理と、からなる前処理を行い、 前記辞書・規則部
に格納された基盤展開規則を用い、前記言語データから
各々話題確立区間と話題語と話題スコープと話題レベル
を決定する基盤展開処理と、前記辞書・規則部に格納さ
れた意味的展開規則を用い、前記言語データから各々話
題確立区間と話題語と話題スコープと話題レベルを決定
する意味的展開処理と、前記基盤展開処理と前記意味的
展開処理によって各々決定された前記話題確立区間と前
記話題語と前記話題スコープと前記話題レベルから、前
記辞書・規則部に格納された統合処理規則を用いて前記
言語データ全体の話題語と話題スコープと話題レベルと
を統合する統合処理とにより、話題構造を認識する話題
構造認識方法において、前記話題構造から複話語を
検出する重複話題語検出過程と前記話題構造に重複話
題語が検出されていない場合に再計算が不要であると判
定し、前記重複話題語が検出された場合、再計算回数を
計数し前記再計算回数が予め設定された最大回数未満で
ある場合に再計算が必要であると判断し、それ以外の場
合には再計算が不要と判定する再計算判定過程と、を有
し、再計算が不要であると判断された場合には処理を終
了し、再計算が必要であると判断された場合には、前記
重複話題語が出現した単文の単文番号を調べ、前記単文
から顕著名詞句が検出されなかったと設定し、前記ブロ
ック処理からの一連の処理を繰り返す
【0019】本発明の話題構造認識装置は、言語データ
を入力するための入力部と、話題構造認識のための規則
類を蓄える辞書・規則部と、該辞書・規則部の規則類を
用いた処理を行うともに再計算が必要になった場合に再
計算を実行する処理部と、前記処理部による結果を蓄え
る記憶部と、前記処理部による処理結果を表示する表示
部とを有し、前記辞書・規則部が、述語を1つだけ持つ
単位である単文に前記言語データを分割し、前記各単文
から手掛かり句を抽出するとともに当該単文で最も強調
されている名詞句である顕著名詞句を抽出し、前記手掛
かり句のタイプを同定することを含む話題構造認識前処
理のための前処理用辞書と、基盤展開に対する処理を行
うための基盤展開処理規則と、意味的展開に対する処理
を行うための意味的展開処理規則と、基盤展開と意味的
展開を統合するための統合処理規則と、重複話題語を検
出するための重複話題語検出処理規則と、再計算を行う
必要があるかどうかを決定するための再計算判断処理規
則と、再計算準備を行うための再計算準備規則とを含
み、前記再処理判断処理規則が、前記話題構造に重複話
題語が検出されていない場合に再計算が不要であると判
定し、前記重複話題語が検出された場合、再計算回数を
計数し前記再計算回数が予め設定された最大回数未満で
ある場合に再計算が必要であると判断し、それ以外の場
合には再計算が不要と判定するというものであり、 前記
再計算準備規則が、重複話題語が出現した単文の単文番
号を前記統合話題記憶部で調ベ、前記単文情報テーブル
上の当該単文番号の顕著名詞句に関するフィールドの内
容を消去し、これにより当該顕著名詞句が検出されなか
ったこととするというものであり、前記記憶部が、入力
された言語データに関する情報を蓄える言語データ記憶
部と、話題構造に関する情報を蓄える話題構造記憶部と
を含み、前記言語データ記憶部が、言語データに含まれ
る各単語の文字列と品詞を含む情報を格納する単語情報
テーブルと、言語データの各単文に含まれる単語と顕著
名詞句を含む情報を格納する単文情報テーブルとを含
み、話題構造記憶部が、基盤展開に関する情報を蓄える
基盤展開記憶部と、意味的展開に関する情報を蓄える意
味的展開記憶部と、基盤展開と意味的展開の統合後の情
報を蓄えるために話題語が出現した単文の単文番号と、
話題レベルと、話題スコープを含む情報を格納するテー
ブルを含む統合話題記憶部と、を含み前記処理部が、
記前処理用辞書を使用し、入力された前記言語データの
文字列を単語ごとに区切って、単語列、前記各単語の品
詞、活用語の活用形を同定し前記単語情報テーブルに格
納する処理と、前記単語列と前記各単語の品詞と前記活
用語の活用形から、複数の述語を含む文を一つの述語の
みを含む単文に分割して各単文の開始と終了の単文番号
を前記単文情報テーブルに格納する処理と、前記各単文
において最も強調されている名詞句を顕著名詞句として
抽出して前記単文情報テーブルに格納する処理と、段落
に相当するブロックを認識するブロック処理と、からな
る前処理と、 前記基盤展開規則を用い、前記言語データ
から各々話題確立区間と話題語と話題スコープと話題レ
ベルを決定して前記基盤展開記憶部に格納する基盤展開
処理と、前記意味的展開規則を用い、前記言語データか
ら各々話題確立区間と話題語と話題スコープと話題レベ
ルを決定して前記意味的展開記憶部に格納する意味的展
開処理と、前記基盤展開記憶部に格納された前記話題確
立区間、前記話題語、前記話題スコープ及び前記話題レ
ベルと前記意味的展開記憶部に格納された前記話題確立
区間、前記話題語、前記話題スコープ及び前記話題レベ
ルとからから、前記統合処理規則を用いて前記言語デー
タ全体の話題語と話題スコープと話題レベルとを統合す
る統合処理とを実行して話題構造を認識し前記統合話題
記憶部に格納する処理と、 前記重複話題語検出記録に基
づき、前記統合話題記憶部に格納された前記話題構造
複話語を検出する重複話題語検出過程と前記再
計算判断処規則に基づいて再計算の必要の有無を判定す
る再計算判定過程と、 再計算が不要であると判断された
場合には処理を終了し、再計算が必要であると判断され
た場合には前記再計算準備規則に基づいて再計算準備を
行ってから、 前記ブロック処理からの一連の処理を繰り
返す処理と、を実行する
【0020】
【作用】重複話題語が存在する場合に、必要に応じて、
重複話題語が検出されないようにしてから再計算を行う
ので、話題構造が正しく認識され、認識結果として得ら
れた話題構造が人間にとって分かりやすくなる。
【0021】
【実施例】次に、本発明の実施例について図面を参照し
て説明する。図7は本発明の一実施例の話題構造認識装
置の構成を示すブロック図である。この話題構造認識装
置は、図2に示す従来の話題構造認識装置と比べ、辞書
・規則部の内部に重複話題語検出のための規則と再計算
のための規則を備え、重複話題語が検出された場合に再
計算を行うように構成されている点で相違する。
【0022】[話題構造認識処理と装置の概要] 本実施例の話題構造認識装置には、言語データが入力す
るデータ入力部101と、各種の処理を実行する処理部
102と、結果を表示する表示部103と、処理結果や
処理途中で必要となるデータを保持する記憶部104
と、話題構造認識処理で使用される辞書や規則類を格納
する辞書・規則部105によって構成されている。処理
部102は、後述する重複語検出処理や再計算判定処
理、再計算準備の処理なども実行する。記憶部104に
は、前処理後の言語データを記憶する言語データ記憶部
110と、中間の処理結果や最終的な処理結果を保持す
る話題構造記憶部111とが設けられている。言語デー
タ記憶部110には、単文ごとの情報を格納する単文情
報テーブル115と単語ごとの情報を格納する単語情報
テーブル116が設けられている。話題構造記憶部11
1には、基盤展開記憶部112と意味的展開記憶部11
3と統合話題記憶部114が設けられている。一方、辞
書・規則部105には、前処理用辞書121と、意味的
展開処理規則122と、基盤展開処理規則123と、統
合処理規則124と、重複する話題語を検出するために
使用される重複話題語検出処理記録125と、再計算を
行うかどうかを判定するために使用される再計算判定処
理規則126と、再計算の際の準備作業を行うための再
計算準備規則127とが設けられている。
【0023】この話題構造認識装置を用い本発明の方法
にしたがって話題構造認識処理を行う場合の処理手順
が、図8に示されている。まず、図8にフローチャート
を用い、全体の処理の流れを説明する。
【0024】最初に、再計算の実行回数を記憶するため
の変数をtimesとし、その値を0にする(ステップ20
1)。そして「従来の技術」の欄で説明した従来の方法
と同様に、前処理用辞書121を用いて話題構造認識前
処理を行い、(ステップ202)、基盤展開規則123
を用いて基盤展開処理を行い(ステップ203)、意味
的展開処理規則122を用いて意味的展開処理を行い
(ステップ204)、統合処理規則124を用いてこれ
ら基盤展開と意味的展開の統合処理を実行する(ステッ
プ205)。その結果、上述した場合と同様に、話題構
造認識が行われ、話題構造が抽出される。
【0025】次に、重複話題語の検出を行う(ステップ
206)。重複話題語とは、基盤展開と意味的展開の統
合処理の結果得られた話題構造に含まれる任意の2つの
話題について、(1)親子関係であって話題語が単語列と
して同じであるものや、(2)話題語が単語列として同じ
であってかつ話題レベルも同じであり、相互間に話題レ
ベルが1だけ小さいような話題がないようなもののこと
である。重複話題語の検出の処理の詳細については後述
する。
【0026】次に、再計算を行うかどうかを決定する再
計算判定処理を行う(ステップ207)。再計算判定処
理では、まず、重複話題語が検出されたかどうかを判定
する(ステップ231)。重複話題語が検出されていな
い場合には、再計算が不要であるとし(ステップ23
2)、重複話題語が検出された場合には、再計算回数ti
mesの値が予め設定した最大回数t_maxの値と等しいかど
うかを判定する(ステップ233)。最大回数t_maxと
等しい場合にはステップ232に移行して再計算は不要
であるとし、timesがt_maxに等しくない場合には、time
sの値を1だけ増やして(ステップ234)、再計算は
必要であるとする(ステップ235)。このようにし
て、再計算判定処理では、重複話題語が検出されかつ再
計算timesがt_max未満である場合に再計算が必要である
と判断し、それ以外の場合には再計算が不要であると判
断する。
【0027】そして、再計算判定処理で再計算が必要と
判定されたかどうかを調べる(ステップ308)。再計
算は必要ないと判定されている場合には、そのまま話題
構造認識の処理を終了する。したがって、ステップ20
5の基盤展開と意味的展開の統合処理で得られている話
題構造が最終的に出力されるべき話題構造となる。一
方、再計算が必要であると判定されている場合には、再
計算準備を実行して(ステップ209)、話題構造認識
前処理202に戻る。本実施例の場合、顕著名詞句の抽
出や顕著名詞句の情報を使用しない処理はやり直さず、
それ以外の処理のみをやり直す。図8で言えば、形態素
解析(ステップ221)、単文区切り処理(ステップ2
02)及び顕著名詞句抽出(ステップ203)に対して
は再計算が行われないが、ブロック認識(ステップ22
4)の処理については再計算が実行される、すなわちや
り直しが行われる。図9は再計算準備の処理手順を示す
フローチャートである。再計算準備では、重複話題語が
出現した単文の単文番号を調べ(ステップ241)、そ
の単文番号の単文から顕著名詞句が検出されなかったこ
とにする(ステップ242)。
【0028】次に、本実施例における統合話題記憶部1
14、単文情報テーブル115及び単語情報テーブル1
16について、図10を用いて説明する。
【0029】話題構造記憶部111内に設けられている
統合話題記憶部114には、基盤展開と意味的展開の統
合処理で得られた話題構造が記録されており、各話題に
ついて、その話題に係る話題語が出現した単文の単文番
号と、話題レベルと、話題スコープの開始と終了の単文
番号を含む情報が記録されている。つまり、話題構造認
識処理によって抽出された話題構造がこの統合話題記憶
部14に記録されることになる。ここで単文番号とは、
その単文が言語データ中の何番目の単文であるかを0か
ら始まる連続番号で示したものであり、話題番号とはそ
の話題が言語データ中の何番目の話題であるかを0から
始まる連続番号で示したのものである。図10(a)に示
した例では、話題番号0の話題の話題語は単文番号0で
の顕著名詞句であり、話題レベルは1であり、話題スコ
ープは単文番号が0から23の範囲である。
【0030】言語データ記憶部110内に設けられてい
る単語情報テーブル116には、話題構造認識の対象と
する文書や議事録などの言語データに対して形態素解析
を行った結果として得られる単語の文字列や、その単語
の品詞の情報が記録される。ここで単語番号とは、その
単語が言語データ中の何番目の単語であるかを0から始
まる連続番号で示したものである。また、言語データ記
憶部110中の単文情報テーブル115には、単文区切
り処理によって言語データを単文(述語を1つだけ持つ
単位のこと)に分割したときの、各単文の開始と終了の
単語番号と、各単文の中で最も強調されている名詞句で
ある顕著名詞句に関する情報とが記録される。顕著名詞
句タイプは、その顕著名詞句が明示型のものか非明示型
のものであるかを示している。例えば、単文番号0の単
文は単語番号が0から15の範囲であり、単語情報テー
ブル116上で単語番号が2,3,4,5からなる名詞句
が顕著名詞句として記録されている。図10(b)には、
単文情報テーブル115の各フィールドにおける単語番
号と、単語情報テーブル116に記録された各単語との
関係が矢印で示されている。
【0031】[重複話題語の検出]次に、重複話題語検
出の処理の具体的手順について、図11のフローチャー
トを用いて説明する。統合話題記憶部114にi+1番
目に記録されている話題(話題番号がi)の話題をT
(i)とする。例えば、T(0)は最初の話題である。そし
て、話題T(i)の話題レベルをL(i)で表わし、話題T
(i)の話題語の単語列をW(i)で表わす。また、統合話題
記憶部114に記憶されている話題レベルの値の最大値
をlmとする。すなわち、検出された話題構造の中で最も
深いレベルにある話題の話題レベルをlmとする。本実施
例では、基盤展開と意味的展開の統合処理の結果得られ
た話題構造に含まれる任意の2つの話題について、親子
関係であって話題語が単語列として同じであるものや、
話題語が単語列として同じでありかつ話題レベルも同じ
であって相互間に話題レベルが1だけ小さいような話題
がないようなものを重複話題語として検出する。
【0032】重複話題語の検出処理は、話題レベルが小
さい方の話題から実行される。現在注目している話題レ
ベルを変数levelで表わすものとし、まず、levelを1に
する(ステップ301)。すなわち、話題レベル1の話
題に着目する。
【0033】次に、levelが話題レベルの最大値lm以下
であるどうかを調べ(ステップ302)、そうでなけれ
ば重複話題語の検出を終了し、最大値lm以下であればス
テップ303に移行する。lm≧1であるから、level=
1のときは必ずステップ303に移行する。
【0034】ステップ303では、L(i)=levelを満た
す、すなわち話題レベルがlevelであるような話題のう
ち、最小のiを探す。すなわち、話題レベルがlevelで
ある話題のうち最も早く現われるものを探索する。そし
て、L(j)=levelかつj>iを満たす最小のjを探す
(ステップ304)。これはすなわち、話題レベルがle
velであって話題T(i)の次にある話題T(j)を探してい
ることになる。このようなjが見つかったかどうかを判
定し(ステップ305)、jがあった場合には、ステッ
プ306に進んで変数nextにjが見つかったことを示す
値1を代入し、ステップ308に進む。ステップ305
でjが見つからなかった場合には、ステップ307に進
んで変数nextにjが見つからなかったことを示す値0を
代入し、さらにステップ312に進む。
【0035】ステップ308では、L(k)=leve1−1か
つi<k<jを満たすkを探す。すなわち、T(i)とT
(j)の間に、話題レベルがlevel−1である話題が存在し
ているかどうかを探す。そして、そのようなkが見つか
ったかどうかを判断する(ステップ309)。kが見つ
かる場合は、話題レベルがlevelである2つの話題T(i)
とT(j)の間に話題レベルが1だけ小さい話題が存在す
る場合である。kが見つかった場合には、後述するステ
ップ312に進み、kが見つからなかった場合には、W
(i)とW(j)が等しいかどうかを調ベる(ステップ31
0)。W(i)=W(j)の場合は、話題語が単語列として同
じでありかつ話題レベルも同じであって相互間に話題レ
ベルが1だけ小さいような話題がないような場合である
から、後の方の話題T(j)の話題語W(j)を重複話題語と
し(ステップ311)、重複話題語の検出の処理を終了
する。W(i)≠W(j)の場合には、ステップ312に進
む。
【0036】ステップ312では、L(p)=level−1か
つp<iである最大のpを探す。すなわち話題T(i)の
親話題T(p)を探す。そしてpが見つかったかどうかを
判定する(ステップ313)。pが見つかった場合、す
なわち親話題が見つかった場合には、W(p)とW(i)が等
しいかどうかを調べ(ステップ314)、W(p)=W(i)
であれば、親子関係であって話題語が単語列として同じ
場合であるから、子話題T(i)の話題語W(i)を重複話題
語とし(ステップ315)、処理を終了する。
【0037】一方、ステップ313でpが見つからなか
った場合、あるいはステップ314でW(p)≠W(i)の場
合には、変数nextの値が1であるかどうかを調ベる(ス
テップ316)。nextがlであれば、話題T(i)と同じ
話題レベルの次の話題T(j)が存する場合であるので、
話題T(j)をあらためて話題T(i)として上述の処理を繰
り返すために、jの値をiに代入し(ステップ31
8)、ステップ304に戻る。nextが1でない場合に
は、同じ話題レベルの次の話題が存在しないので、次の
話題レベルを調ベるために、levelの値に1を加え(ス
テップ317)、ステップ302に戻る。
【0038】以上の処理を実行することによって、重複
話題語の検出が行われる。
【0039】[言語データ例を用いた説明]次に、実際
の言語データに対して処理を行った場合を例に挙げて、
さらに詳しく本実施例を説明する。ここでは、図5に示
したモノローグ例が話題構造認識の処理対象であるとし
て説明する。
【0040】図8に示したフローチャートにしたがって
処理が行われ、基盤展開と意味的展開の統合処理(ステ
ップ205)までが行われたとする。この時点では、再
計算はまだ一度も行われていないので、times=0であ
る。単文情報テーブル115及び単語情報テーブル11
6の記録内容が図10(b)に示したものであったとし、
また、この時の統合話題記憶部114の記憶内容、すな
わちこの時点での話題構造認識結果が、図10(a)に示
したものであったとする。図示されている例では、統合
話題記憶部114に話題番号0から5までの6個の話題
が記録されているが、これは図6に示した内容一覧に対
応するものとする。再計算判定処理で用いる最大回数t_
max=5とする。
【0041】(1) 重複話題語検出 基盤展開と意味的展開の統合処理の次に、重複話題語検
出処理が、図11のフローチャートにしたがって行われ
る。まず、ステップ301で変数levelに1に代入され
る。図10(a)に示されるように話題レベルの最大値lm
は3であるので、ステップ303に進む。L(0)=1で
あるのでi=1となる。話題レベルが1のものは話題T
(i)より後ろにはないので、ステップ304ではjは見
つからず、next=0となり、ステップ312に進む。こ
こでも、levelが0の話題は存在しないので、pは見つ
からず、ステップ316に進む。next=0であるので、
ステップ317でlevelの値を2にして、ステップ30
2に戻る。
【0042】ステップ302ではlevel≦3(=lm)で
あるので、ステップ303に進む。ここではL(1)=2
であるので、i=1となる。一方、L(4)=2であるの
で、ステップ304でjが見つかり(j=4)となり、
ステップ306に進んでnextに1を代入する。そして、
ステップ308で、L(k)=1かつ1<k<4を満たす
kの存在が調べられるが、このようなkは存在しないの
で、ステップ310に進む。ここでは、W(1)とW(4)が
等しいかどうかを調ベるが、前述したように統合話題記
憶部114の話題構造は図6に示したのものと対応して
いるので、W(1)は単語列「新規サービス」、W(4)は単
語列「従来からのサービス」である。したがって、単語
列として等しくないので、ステップ312に進む。ここ
では、L(0)=1かつ0<1であるので、pが見つかり
(p=0)となり、ステップ314に進む。ステップ3
14では、W(0)とW(1)が等しいかどうかが比較される
が、W(1)とW(4)との比較と同様に、等しくないので、
ステップ316に進む。nextの値が1になっているの
で、ステップ318に進んでi=4とした後に、ステッ
プ304に戻る。
【0043】ステップ304ではjが見つからないの
で、ステップ307に進んでnextに0を代入し、ステッ
プ312に進む。ここでは、L(0)=1かつ0<4であ
るので、pが見つかり(p=0)、ステップ314に進
んでW(4)とW(0)が等しいかどうかを調ベるが、前述し
た場合と同様に等しくないので、ステップ316に進
む。このときはnextの値が0になっているので、level
の値を3に更新して、ステップ302に戻る。
【0044】ステップ302ではleve1=3,lm=3で
あるから、ステップ303に進んでiを探し、i=2と
し、次のステップ304ではj=3となる。jがあった
ので、ステップ306に進んでnextに1を代入する。そ
して、ステップ308で、L(k)=2かつ2<k<3を
満たすkを探すが、見つからないので、ステップ310
に進んでW(2)とW(3)が等しいかどうかを調ベる。図l
0の統合話題記憶部114によると、話題番号2の話題
語が出現した単文の単文番号は4であり、単文情報テー
ブル115によると、単文番号4の単文の顕著名詞句は
単語情報テーブル116上の単語番号44,45,46,
47の単語であるので、W(2)は単語番号44,45,4
6,47の単語からなる単語列である。同様に、W(3)は
単語番号121,122,123,134の単語からな
り、単語情報テーブル116を参照することにより、単
語列としてW(2)とW(3)が等しいことが分かる。したが
って、ステップ311に進み、W(3)を重複話題語とし
て検出し、処理を終了する。
【0045】(2) 再計算判定処理と再計算準備 上で述ベたように、重複話題語検出の結果、W(3)、す
なわち図10の統合話題記憶部114の話題番号3の話
題語が重複話題語として検出された。続いて、再計算判
定処理が行われる。重複話題語が検出されており、かつ
前述したように再計算回数times=0、最大回数t_max=
5であるので、timesの値を1増やしてtimes=1とし
て、「再計算は必要」という判定が下される。
【0046】再計算が必要であるので、再計算準備に移
行する。再計算準備では図8のフローチャートに示すと
おり、まず重複話題語が出現した単文番号ssが調ベられ
る(ステップ241)。図10の統合話題記憶部114
によると、重複話題語W(3)は単文番号10の単文に含
まれているので、ss=10である。そして、単文ssから
顕著名詞句が検出されていないことにするための処理が
行われる(ステップ242)。この処理は、図10の例
だと、単文情報テーブル115上の単文番号ssの欄の顕
著名詞句と顕著名詞句タイプの値を、それぞれ、顕著名
詞句が検出されなかったことを示す値−1に書き換える
ことによって行われる。。この書き換えを行った後の単
文情報テーブル115の内容を図12に示す。
【0047】このようの再計算準備を行った後、処理部
102は、話題構造認識前処理のブロック認識まで戻っ
て処理をやり直し、再計算を実行する。
【0048】以上説明したようにして、図5のモノロー
グ例に対し、再計算が不要になるまで処理を行った結果
を図13に示す。図6に示した従来の方法による結果と
比較すると、重複話題語であった1.1.2の章タイトルと
して、重複話題語ではない適切な話題語「マルチメディ
ア・サービス」が認識されており、人間にとって非常に
分かりやすくなっている。
【0049】
【発明の効果】以上説明したように本発明は、重複話題
語が存在する場合に、必要に応じて、重複話題語が検出
されないようにしてから再計算を行うことにより、より
高精度であって、結果が人間にとって分かりやすい話題
構造認識を行うことが可能となるという効果がある。
【0050】書き言葉の文書、講演や対談などの話し言
葉の議事録に対して、本発明を用いて話題構造を内容一
覧として付与することにより、これらの文書や議事録は
より再利用しやすくなり、その結果、調査や情報収集な
どの人間の知的活動を支援することになる。
【図面の簡単な説明】
【図1】人間による語題構造認識の例である。
【図2】従来の話題構造認識装置の一例の構造を示すブ
ロック図である。
【図3】従来の語題構造認識のための処埋を示すフロー
チャートである。
【図4】従来の話題構造認識における前処埋以降の例を
示す図である。
【図5】モノローグの一例を示す図である。
【図6】図5のモノローグに対して従来の話題構造認識
方法を適用した結果を示す図である。
【図7】本発明の一実施例の話題構造認識装置の構成を
示すブロック図である。
【図8】図7の装置を用い本発明の方法に基づいて行わ
れる話題構造認識処理の手順を示すフローチャートであ
る。
【図9】再計算準備の処理手順を示すフローチャートで
ある。
【図10】(a)は統合話題記憶部の構成を示す図、(b)は
単文情報テーブルと単語情報テーブルの構成とこれらテ
ーブル間の関係を示す図である。
【図11】重複話題語検出の処理手順を示すフローチャ
ートである。
【図12】再計算準備が終了した時点での単文情報テー
ブルの状態を示す図である。
【図13】図7の装置を用い図5に示すモノローグ例に
対して本発明の方法を適用して行った話題構造認識結果
の例を示すである。
【符号の説明】
101 データ入力部 102 処理部 103 表示部 104 記憶部 105 辞書・規則部 110 言語データ記憶部 111 話題構造記憶部 112 基盤展開記憶部 113 意味的展開記憶部 114 統合話題記憶部 115 単文情報テーブル 116 単語情報テーブル 121 前処理用辞書 122 意味的展開規則 123 基盤展開規則 124 統合処理規則 125 重複話題後検出処理規則 126 再計算判定処理規則 127 再計算準備規則 201〜209,221〜224,231〜235
ステップ 241,242,301〜318 ステップ
フロントページの続き (56)参考文献 特開 平7−160710(JP,A) 特開 平6−236410(JP,A) 特開 平6−139276(JP,A) 特開 平4−332084(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06F 17/27

Claims (6)

    (57)【特許請求の範囲】
  1. 【請求項1】 辞書・規則部に格納された前処理用辞書
    を使用し、入力された言語データの文字列を単語ごとに
    区切って、単語列、前記各単語の品詞、活用語の活用形
    を同定する形態素解析処理と、前記単語列と前記各単語
    の品詞と前記活用語の活用形から、複数の述語を含む文
    を一つの述語のみを含む単文に分割する処理と、前記各
    単文において最も強調されている名詞句を顕著名詞句と
    して抽出する処理と、段落に相当するブロックを認識す
    るブロック処理と、からなる前処理を行い、 前記辞書・規則部に格納された基盤展開規則を用い、前
    記言語データから各々話題確立区間と話題語と話題スコ
    ープと話題レベルを決定する基盤展開処理と、前記辞書
    ・規則部に格納された意味的展開規則を用い、前記言語
    データから各々話題確立区間と話題語と話題スコープと
    話題レベルを決定する意味的展開処理と、前記基盤展開
    処理と前記意味的展開処理によって各々決定された前記
    話題確立区間と前記話題語と前記話題スコープと前記話
    題レベルから、前記辞書・規則部に格納された統合処理
    規則を用いて前記言語データ全体の話題語と話題スコー
    プと話題レベルとを統合する統合処理とにより、話題構
    造を 認識する話題構造認識方法において、前記 話題構造から複話語を検出する重複話題語検出
    過程と前記話題構造に重複話題語が検出されていない場合に再
    計算が不要であると判定し、前記重複話題語が検出され
    た場合、再計算回数を計数し前記再計算回数が予め設定
    された最大回数未満である場合に再計算が必要であると
    判断し、それ以外の場合には再計算が不要と判定する再
    計算判定過程と、を有し、 再計算が不要であると判断された場合には処理を終了
    し、再計算が必要であると判断された場合には、前記重
    複話題語が出現した単文の単文番号を調べ、前記単文か
    ら顕著名詞句が検出されなかったと設定し、前記ブロッ
    ク処理からの一連の処理を繰り返すことを特徴とする話
    題構造認識方法。
  2. 【請求項2】 前記重複話題語検出過程が、 話題構造認識処理の結果得られた話題構造に含まれる任
    意の2つの話題Aと話題Bの親話題が同一の話題Cであ
    り、かつ前記話題Aと前記話題Bの話題語が単語列とし
    て同じであり、かつ前記話題Aと前記話題Bの間に前記
    話題Cを親話題とする他の話題がない場合に、前記話題
    Aと前記話題Bのうちの後ろにある方の話題の話題語を
    重複話題語として検出し、 さらに、前記話題構造に含まれ親子関係にある2つの話
    題についてそれらの話題の話題語が単語列として同じで
    ある場合に、当該親子関係における子話題の話題語を重
    複話題語として検出する処理である請求項1に記載の話
    題構造認識方法。
  3. 【請求項3】 前記ブロック処理からの一連の処理を繰
    り返す場合に、前記顕著名詞句の抽出の処理と前記顕著
    名詞句の情報を用いない処理は繰り返さない請求項
    記載の話題構造認識方法。
  4. 【請求項4】 言語データを入力するための入力部と、
    話題構造認識のための規則類を蓄える辞書・規則部と、
    該辞書・規則部の規則類を用いた処理を行うともに再計
    算が必要になった場合に再計算を実行する処理部と、前
    記処理部による結果を蓄える記憶部と、前記処理部によ
    る処理結果を表示する表示部とを有し、 前記辞書・規則部が、述語を1つだけ持つ単位である単
    文に前記言語データを分割し、前記各単文から手掛かり
    句を抽出するとともに当該単文で最も強調されている名
    詞句である顕著名詞句を抽出し、前記手掛かり句のタイ
    プを同定することを含む話題構造認識前処理のための前
    処理用辞書と、基盤展開に対する処理を行うための基盤
    展開処理規則と、意味的展開に対する処理を行うための
    意味的展開処理規則と、基盤展開と意味的展開を統合す
    るための統合処理規則と、重複話題語を検出するための
    重複話題語検出処理規則と、再計算を行う必要があるか
    どうかを決定するための再計算判断処理規則と、再計算
    準備を行うための再計算準備規則とを含み、前記再処理判断処理規則が、前記話題構造に重複話題語
    が検出されていない場合に再計算が不要であると判定
    し、前記重複話題語が検出された場合、再計算回数を計
    数し前記再計算回数が予め設定された最大回数未満であ
    る場合に再計算が必要であると判断し、それ以外の場合
    には再計算が不要と判定するというものであり、 前記再計算準備規則が、重複話題語が出現した単文の単
    文番号を前記統合話題記憶部で調ベ、前記単文情報テー
    ブル上の当該単文番号の顕著名詞句に関するフィールド
    の内容を消去し、これにより当該顕著名詞句が検出され
    なかったこととするというものであり、 前記記憶部が、入力された言語データに関する情報を蓄
    える言語データ記憶部と、話題構造に関する情報を蓄え
    る話題構造記憶部とを含み、 前記言語データ記憶部が、言語データに含まれる各単語
    の文字列と品詞を含む情報を格納する単語情報テーブル
    と、言語データの各単文に含まれる単語と顕著名詞句を
    含む情報を格納する単文情報テーブルとを含み、 話題構造記憶部が、基盤展開に関する情報を蓄える基盤
    展開記憶部と、意味的展開に関する情報を蓄える意味的
    展開記憶部と、基盤展開と意味的展開の統合後の情報を
    蓄えるために話題語が出現した単文の単文番号と、話題
    レベルと、話題スコープを含む情報を格納するテーブル
    を含む統合話題記憶部と、を含み前記処理部が、 前記前処理用辞書を使用し、入力された前記言語データ
    の文字列を単語ごとに区切って、単語列、前記各単語の
    品詞、活用語の活用形を同定し前記単語情報テーブルに
    格納する処理と、前記単語列と前記各単語の品詞と前記
    活用語の活用形から、複数の述語を含む文を一つの述語
    のみを含む単文に分割して各単文の開始と終了の単文番
    号を前記単文情報テーブルに格納する処理と、前記各単
    文において最も強調されている名詞句を顕著名詞句とし
    て抽出して前記単文情報テーブルに格納する処理と、段
    落に相当するブロックを認識するブロック処理と、から
    なる前処理と、 前記基盤展開規則を用い、前記言語データから各々話題
    確立区間と話題語と話題スコープと話題レベルを決定し
    て前記基盤展開記憶部に格納する基盤展開処理と、前記
    意味的展開規則を用い、前記言語データから各々話題確
    立区間と話題語と話題スコープと話題レベルを決定して
    前記意味的展開記憶部に格納する意味的展開処理と、前
    記基盤展開記憶部に格納された前記話題確立区間、前記
    話題語、前記話題スコープ及び前記話題レベルと前記意
    味的展開記憶部に格納された前記話題確立区間、前記話
    題語、前記話題スコープ及び前記話題レベルとからか
    ら、 前記統合処理規則を用いて前記言語データ全体の話
    題語と話題スコープと話題レベルとを統合する統合処理
    とを実行して話題構造を認識し前記統合話題記憶部に格
    納する処理と、 前記重複話題語検出記録に基づき、前記統合話題記憶部
    に格納された前記 話題構造から複話語を検出する重
    複話題語検出過程と前記再計算判断処規則に基づいて再計算の必要の有無を
    判定する再計算判定過程と、 再計算が不要であると判断された場合には処理を終了
    し、再計算が必要であると判断された場合には前記再計
    算準備規則に基づいて再計算準備を行ってから、前記ブ
    ロック処理からの一連の処理を繰り返す処理と、を実行
    する ことを特徴とする話題構造認識装置。
  5. 【請求項5】 前記重複話題語検出規則が、 前記統合話題記憶部に記録された任意の第1の話題と前
    記第1の話題より後ろに記録された任意の第2の話題に
    ついて、 a.前記第1及び第2の話題の話題レベルの値が2以上
    であってかつ同一の値mであり、 b.前記第1の話題と第2の話題の間に、話題レベルの
    値がm−1である話題と話題レベルの値がmである話題
    がいずれも存在せず、 c.第1の話題と第2の話題の話題語が単語列として同
    じである、 の3条件a〜cが同時に成立する場合か、 d.第1の話題の話題レベルの値がnであって第2の話
    題の話題レベルの値がn+1であり、 e.前記第1の話題と第2の話題の間に、話題レベルの
    値がnである話題が存在せず、 f.第1の話題と第2の話題の話題語が単語列として同
    じである、 の3条件d〜fが同時に成立する場合に、前記第2の話
    題を重複話題語とする規則である請求項に記載の話題
    構造認識装置。
  6. 【請求項6】 前記ブロック処理からの一連の処理を繰
    り返す場合に前記顕著名詞句を抽出して前記単文情報
    テーブルに記録するための処理と前記単文情報テーブル
    に記された顕著名詞句に関する情報を用いない処理とは
    繰り返さない請求項に記載の話題構造認識装置。
JP06245934A 1993-12-07 1994-10-12 重複話題語を考慮した話題構造認識方法と装置 Expired - Lifetime JP3072955B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP06245934A JP3072955B2 (ja) 1994-10-12 1994-10-12 重複話題語を考慮した話題構造認識方法と装置
US08/354,120 US5642520A (en) 1993-12-07 1994-12-06 Method and apparatus for recognizing topic structure of language data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP06245934A JP3072955B2 (ja) 1994-10-12 1994-10-12 重複話題語を考慮した話題構造認識方法と装置

Publications (2)

Publication Number Publication Date
JPH08110906A JPH08110906A (ja) 1996-04-30
JP3072955B2 true JP3072955B2 (ja) 2000-08-07

Family

ID=17141039

Family Applications (1)

Application Number Title Priority Date Filing Date
JP06245934A Expired - Lifetime JP3072955B2 (ja) 1993-12-07 1994-10-12 重複話題語を考慮した話題構造認識方法と装置

Country Status (1)

Country Link
JP (1) JP3072955B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1910654B (zh) * 2004-01-20 2012-01-25 皇家飞利浦电子股份有限公司 确定交谈主题并获取和呈现相关内容的方法和系统

Also Published As

Publication number Publication date
JPH08110906A (ja) 1996-04-30

Similar Documents

Publication Publication Date Title
US7120586B2 (en) Method and system for segmenting and identifying events in images using spoken annotations
JP6813591B2 (ja) モデル作成装置、テキスト検索装置、モデル作成方法、テキスト検索方法、及びプログラム
US5794177A (en) Method and apparatus for morphological analysis and generation of natural language text
JP2783558B2 (ja) 要約生成方法および要約生成装置
US20160132492A1 (en) Text segmentation with multiple granularity levels
EP1927927A2 (en) Speech recognition training method for audio and video file indexing on a search engine
WO1997004405A9 (en) Method and apparatus for automated search and retrieval processing
CN110633375A (zh) 一种基于政务工作的媒体信息整合利用的系统
EP1197884A2 (en) Method and apparatus for authoring and viewing audio documents
CN115828893A (zh) 非结构化文档问答的方法、装置、存储介质和设备
JP3072955B2 (ja) 重複話題語を考慮した話題構造認識方法と装置
JP2894301B2 (ja) 文脈情報を用いた文書検索方法および装置
JP2000259653A (ja) 音声認識装置及び音声認識方法
JPH06215035A (ja) テキスト検索装置
CN112711695A (zh) 基于内容的搜索建议生成方法及装置
JP3082890B2 (ja) 書き言葉テキストに対する話題構造認識方法および装置
KR101931714B1 (ko) 유사문서 추천장치를 이용하여 문서로부터 개체명을 추출하는 개체명 인식시스템 및 인식방법
JP2835335B2 (ja) データ検索装置及びデータ検索方法
JP3082889B2 (ja) モノローグ・データに対する話題構造認識方法および装置
JP3333952B2 (ja) 話題構造認識方法及び装置
JP3436109B2 (ja) 関連検索式検索装置及び関連検索式検索プログラムを記録したコンピュータ読み取り可能な記録媒体
JP3707506B2 (ja) 文書検索装置及び文書検索方法
JP2000339342A (ja) 文書検索方法および文書検索装置
JP3329353B2 (ja) テキスト用話題構造認識における話題語選択方法と話題構造認識装置
JPS6389976A (ja) 言語解析装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090602

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090602

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100602

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100602

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110602

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120602

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130602

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140602

Year of fee payment: 14

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term