JP3161660B2 - キーワード検索方法 - Google Patents

キーワード検索方法

Info

Publication number
JP3161660B2
JP3161660B2 JP31996893A JP31996893A JP3161660B2 JP 3161660 B2 JP3161660 B2 JP 3161660B2 JP 31996893 A JP31996893 A JP 31996893A JP 31996893 A JP31996893 A JP 31996893A JP 3161660 B2 JP3161660 B2 JP 3161660B2
Authority
JP
Japan
Prior art keywords
text
topic
keyword
word
sub
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP31996893A
Other languages
English (en)
Other versions
JPH07175819A (ja
Inventor
敦 竹下
透 中川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP31996893A priority Critical patent/JP3161660B2/ja
Publication of JPH07175819A publication Critical patent/JPH07175819A/ja
Application granted granted Critical
Publication of JP3161660B2 publication Critical patent/JP3161660B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、フルテキスト・データ
ベースに対するキーワード検索の方法に関する。
【0002】
【従来の技術】従来のフルテキスト・データベース検索
技術は、『小川他:「フルテキスト・データベースの技
術動向」情報処理Vo1.33No.4pp.404-412(199
2)』に説明されているように、大別すると検索の高速化
と検索精度の向上、ユーザインタフェースの向上という
方向で検討されている。このうち、検索精度の向上に関
しては、語句間の上位−下位関係等を記したシソーラス
を用いる手法や、テキストを単語ごとに分解して各単語
の品詞等を同定する形態素解析処理を用いる手法が提案
されている。
【0003】また、話題構造を認識するための方法は提
案されていた。ここで、話題構造の認識方法について簡
単に説明する。話題の展開を章、節や手掛かり句のよう
に明示的に示される基盤展開と、その基盤展開の中で展
開する意味的展開に分けてそれぞれにおける話題を認識
し、その後に基盤展開と意味的展開での話題を結合する
ことにより、テキスト全体の話題を認識する。基盤展開
と意味的展開のそれぞれにおいては、あらかじめ与えら
れた話題構造認識規則を用いて、話題が提示・確立され
る話題確立区間の認識と、その話題確立区間で認識され
る話題語の認識と、その話題語の入れ子関係と継続区間
を求める話題レベル区間の認識を行なう。 基盤展開と
意味的展開のそれぞれで、話題確立区間と話題語と話題
レベル区間を認識するための規則は、言語データが対
話、モノローグ、テキストのどの伝達形態であるかによ
って異なる。伝達形態による話題展開様式の違いと、話
題構造認識実験の結果については『竹下他:「話題構造
認識の観点からのヒューマンコミュニケーションの研
究」電子情報通信学会1993年秋季大会D−62(p.6
-64)』を参照のこと。
【0004】
【発明が解決しようとする課題】フルテキスト・データ
ベース検索の精度を向上させるための従来の技術では、
検索結果に対して「明確な観点」に基づく順位付けを行
なうことができなかった。このため、検索を行なうユー
ザは、多くの検索結果がシステムから返された場合に、
それぞれに対して均等に、それが自分の欲しい情報であ
るかを自分で調べる必要があった。
【0005】本発明の目的は、ユーザ自分の欲しい情報
をより効率良く取得することができるキーワード検索方
法を提供することにある。
【0006】
【課題を解決するための手段】本発明のキーワード検索
方法は、あらかじめ話題構造情報と要約区間情報が各テ
キストに与えられたフルテキスト・データベースから与
えられたキーワードに関係のあるテキストを検索する際
に、各テキストの話題構造情報に含まれる話題語とキー
ワードとの部分文字列マッチングを取り、もしマッチン
グに成功すれば、マッチングした話題語を含む話題構造
情報から、テキストにおいてそのキーワードについて述
べられている占有領域を求め、もしマッチングに失敗す
れば、テキストで要約区間以外の部分とキーワードとの
部分文字列マッチングを行ない、もしマッチングに成功
すればマッチングした文字列のテキストにおける位置と
その位置に対応する話題構造情報から占有領域を求め、
もし、マッチングに失敗すれば占有領域は存在しないも
のとし、占有領域内の単文数とテキスト内の単文数の比
である中心度を計算する。
【0007】
【作用】本発明は、各テキストに対して与えられた話題
構造情報と要約区間情報を用いて、各テキストにおいて
キーワードに関連する事柄がどれだけ大々的に扱われて
いるかを示す中心度を計算する。中心度という明確な観
点が与えられたことにより、ユーザは欲しい情報を効率
良く取得することが可能となる。
【0008】また、中心度の値に基づいてテキストに順
位付けを行なうことにより、検索結果をユーザに分かり
やすい形で表示することが可能となる。
【0009】
【実施例】次に、本発明の実施例について図面を参照し
て説明する。
【0010】図1は本発明の一実施例の話題指向型キー
ワード検索方法を示すフローチャート、図2は本発明の
一実施例の話題指向型キーワード検索位置のブロック図
である。
【0011】装置への入力は、検索したいものを表現す
るキーワード5と検索対象6である。検索対象6は、テ
キストと、その話題構造に関する情報と、そのテキスト
の要約区間に関する情報を含む。テキスト木生成手段1
1は、検索対象6を入力してテキスト木生成処理1を行
う。テキスト木生成処理1では、まず、テキストを各話
題語に直接対応する直轄ブロックに分割し、次に、話題
語の入れ子関係を反映した木構造を生成し、さらにその
木構造の各ノードの話題語に対応する直轄ブロックをノ
ードに加える。この処理でできた木構造をテキスト木と
呼ぶ。テキスト木生成処理1は、検索対象6のテキスト
に対して、最初に1度だけ行なってやればよい。
【0012】サブ・キーワード抽出手段12は、ユーザ
が指定したキーワード5を対象として、サブ・キーワー
ド抽出処理2を行う。サブ・キーワード抽出処理2はキ
ーワード5に含まれる単語の中から具体的な意味を持つ
単語を抽出する(この抽出されたそれぞれの単語をサブ
・キーワードと呼ぶ)。サブ・キーワード抽出処理2は
キーワード5が与えられるたびに行なう。
【0013】中心度計算手段13は、中心度の計算3を
行う。中心度の計算3では、テキスト木とサブ・キーワ
ードの間でマッチングを取り、その結果を用いて、キー
ワード5がテキスト中でどれだけ中心的に大きく扱われ
ているかを表す中心度を計算する。
【0014】テキスト並び変え手段14は、テキスト並
び変え処理4を行う。テキスト並び変え処理4では、各
テキストに対して求められた中心度を比較して、中心度
の高い順にテキストを並べ変え、この順序に従って、ユ
ーザに検索結果7を表示する。 (テキスト木生成処理1)テキスト木と呼ばれる木構造
を作成する。テキスト木の各ノードには2つの要素が含
まれている。1つ目の要素は話題情報である。2つ目の
要素はその話題が、子話題を介してではなく、直接に対
応している直轄ブロックである。また、テキスト木のノ
ード間の親子関係は、各ノードに含まれる話題の親子関
係と同じである。
【0015】図3はテキストに対するテキスト木生成処
理1を示すフローチャートである。まず、そのテキスト
の話題構造情報8から、そこに含まれるすべての話題の
話題開始点を抽出する(ステップ21)。話題構造は、
その話題を代表する名詞句である話題語と、その話題が
継続する話題区間の最初の単文の番号を示す開始点と、
話題区間の最後の単文の番号を示す終了点と、その話題
の入れ子の深さを示す話題レベルという情報を含む。こ
こで、単文とは動詞、形容詞、形容動詞などで構成され
る述語を1つ含む単位であり、また、話題レベルは一番
外側の話題の話題レベルを1とし、1段内側の話題にな
るにつれて話題レベルは1ずつ増加するものとする。
【0016】次に、先ほど集めた話題開始点について、
隣接する話題開始点の間に挟まれるテキストのうち、要
約区間9に含まれない部分を「直轄ブロック」として認
定する(ステップ22)。ここで、要約区間情報9は、
要約区間の最初の単文の番号を示す開始点と、最後の単
文の番号を示す終了点を含む。
【0017】次に、話題レベルが1である話題と、その
話題に対応する直轄ブロックの組を木構造のルート・ノ
ードとする(ステップ23)。次に、それ以外の話題に
ついて、話題レベルがn+1である話題と、その話題に
対応する直轄ブロックの組を木の1つのノードAとし
(ステップ24)、さらにそのノードAの話題区間を包
含し、かつ話題レベルがnである話題を含むノードBを
ノードAの親とする(ステップ25)。これらの処理が
全ての話題に関して終了すれば(ステップ26)、テキ
スト木生成処理1を終了する。 (サブ・キーワード抽出処理2)与えられたキーワード
に含まれる語のうち、具体的な意味を持つ語であるサブ
・キーワードを抽出する。
【0018】図4はサブ・キーワード抽出処理2を示す
フローチャートである。まず、ユーザが指定したキーワ
ード5に対して形態素解析処理を行なう(ステップ3
1)。ここで、形態素解析とは与えられた文や語句を単
語に分割し、各単語の品詞を求め、さらに動詞や形容詞
のような活用語に対しては未然形や連体形などの活用形
も求める処理である。
【0019】次に、形態素解析済みキーワード10を用
いてサブ・キーワードを抽出したが、その際に用いる2
つの変数を定義しておく。変数「SK開始点」は現在求
めているサブ・キーワードの最初の単語の位置を保存
し、変数「現在点」は現在処理を行っている単語の位置
を保存する。
【0020】「現在点」の初期値は第1単語とする(ス
テップ32)。もし、「現在点」の単語が名詞や形容詞
のような自立語であり、かつ「SK開始点」が未定義状
態であれば、「現在点」の値を「SK開始点」に代入す
る(ステップ33、34、35)。もし、「現在点」の
単語が自立語でなく、かつ「SK開始点」が未定義状態
でなければ、SK開始点から現在点の直前までの単語列
をサブ・キーワードとして切り出し、さらに「SK開始
点」を未定義状態にする(ステップ33、36〜3
8)。上記以外の場合、すなわち現在点の単語が自立語
であり、SK開始点が未定義状態ではない場合と、現在
点の単語が自立語でなく、SK開始点が未定義状態であ
る場合は何もしない。
【0021】次に、もし現在点が指しているのが形態素
解析済みキーワード10の最後の単語でなければ「現在
点」の値を次の単語とし(ステップ39、40)、上記
の現在点の初期値を与えた処理より後の処理を繰り返
す。もし、現在点が指しているのが最後の単語で、かつ
SK開始点が未定義状態でなければ、SK開始点から現
在点までをサブ・キーワードとして切り出し(ステップ
39、41、42)、サブ・キーワード抽出処理を終了
する。もし、現在点が最後の単語であるが、SK開始点
が未定義状態であれば、何もせずサブ・キーワード抽出
処理2を終了する。 (中心度の計算3)与えられたキーワードが、あるテキ
ストにおいてどれだけ大々的に扱われているかを示す中
心度の計算を行う。
【0022】図5は中心度計算処理3を示すフローチャ
ートである。第1に、テキスト木の各ノードにサブ・キ
ーワードが含まれているかどうかを調べる処理であるテ
キスト木へのマーク付けを行なう。テキスト木へのマー
ク付けでは、各サブ・キーワードに対して以下の処理を
行う。まず、未処理のサブ・キーワードSKWを1つ選
び(ステップ51)、また現在処理対象としている話題
レベルTの値をT=1とする(ステップ52)。次に、
現在選んだサブ・キーワードSKWが、話題レベルTの
話題を含むテキスト木のノードに含まれている、すなわ
ちサブ・キーワードSKWがそのノード中の話題語か直
轄ブロックに含まれているかどうかをマッチングを取っ
て調べる(ステップ53)。もし、サブ・キーワードS
KWが話題レベルTのノードの話題語とマッチングが取
れれば、その話題語にマークを付け、直轄ブロックとの
マッチングは行わず、話題語とマッチングが取れなく
て、かつ直轄ブロックとのマッチングが取れれば、直轄
ブロックにマークを付ける(ステップ53、56)。も
し、サブ・キーワードSKWが話題レベルTのノードに
含まれておらず、かつ話題レベルTがテキスト木での最
大値でなければ、処理対象の話題レベルTの値を1増や
して(ステップ53〜55)、上記でTの初期値を与え
た処理より後の処理を行なう、もし、サブ・キーワード
SKWが話題レベルTのノードに含まれておらず、かつ
話題レベルTがテキスト木での最大値であれば、何も行
なわない。上記の処理を全てのサブ・キーワードに対し
て行なえば(ステップ57)、テキスト木へのマーク付
けは終了する。
【0023】第2に、マークが付いたテキスト木を用い
て占有領域の認識を行う。ここで、占有領域とは、テキ
ストに含まれる単文のうち、与えられたキーワードに関
する事柄を大々的に述べている単文の集合である。キー
ワードが大々的に述べられているとみなすためには、キ
ーワードから得られたサブ・キーワードのうちの幾つか
がテキスト木のノードに含まれており、しかもそれらの
ノードが、修飾関係に相当するテキスト木での親子関係
になっている必要がある。これは、テキスト木における
ノードの親子関係について、ある数以上のマーク付きノ
ードが存在することに相当する。この必要数を「必要一
致ノード数」と呼ぶと、これは例えば以下のように求め
ることができる(ステップ58)。
【0024】必要一致ノード数N=(サブ・キーワード
の数×0.75)の四捨五入 ここで、0.75という値は、テキストの内容が属する
分野や、論文、新聞記事などテキストの種類などに応じ
て、他の適切な値を用いることもできる。もし、親子関
係にあり、かつN個以上マークされたノード集合がなけ
れば、このテキストには占有領域は存在しないものとす
る(ステップ60)。もし、親子関係にあり、かつN個
以上マークされたノード集合が存在すれば、それぞれの
ノード集合で一番話題レベルTが大きいノードを選ぶ
(ステップ61)。さらに、もし、そのノードの話題語
の方にマークがついていればその話題の話題区間全体を
占有領域として認定し(ステップ62〜64)、もし、
直轄ブロックの方にマークが付いていれば、直轄ブロッ
ク中に最初に現れるサブ・キーワードの位置から、その
直轄ブロックに相当する話題区間の終了点までを占有領
域として認定する(ステップ65)。
【0025】最後に、中心度を計算する全てのノードを
処理すれば(ステップ66)、中心度の値は 中心度=(占有領域内の単文数)/(テキスト内の単文
数) という式に基づいて計算する。 (テキスト並べ変え処理4)各テキストに対して求めら
れた中心度を比較して、中心度の高い順にテキストを並
べ変える。同じ中心度のテキストが複数ある場合は、例
えばその占有領域に含まれる単文数の多い順に並べ、も
し占有領域に含まれる単文数も同じであるテキストが複
数あれば、任意の順に並べる。
【0026】キーワード検索の結果7としては、例えば
中心度がある値以上のテキストを返したり、あるいは中
心度が上位であるテキストの一定数を返すなどする。検
索結果7を表示する際は、例えば上記で並び変えた順で
表示する。
【0027】次に、本実施例の動作を図6に示す具体的
なテキスト例により説明する。 (テキスト木生成処理1)図6に示すテキストの話題構
造として、図7に示す情報が与えられたと仮定する。図
3に示すテキスト木生成処理1に従い、話題構造情報8
から各話題の開始点を集めると、 話題開始点の集合={第1単文,第4単文,第12単
文,第25単文} となる。単文1と単文2が要約区間9であるという要約
情報が与えられたと仮定すると、上記の話題開始点の集
合から、直轄ブロックは図8の破線のブロックp,q,
r,sとなる。pは第1単文から第3単文までのうち、
要約部分でない部分であり、他の直轄ブロックq,r,
sに関しても同様にして求めることができる。
【0028】次に、テキスト木のルート・ノードを求め
る。「A社の通信サービス」を話題語として持つ話題の
話題レベルTが1であるので、この話題と、それに対応
する直轄ブロックpの組をルート・ノードとする。ま
た、「サービスC」を話題語として持つ話題を考える
と、対応する直轄ブロックqとの組でノードを形成し、
さらに話題レベルTが2であるので、先程のルート・ノ
ードがこのノードの親となる。他のノードも同様にして
求めることができる。その結果得られたテキスト木を図
9に示す。 (サブ・キーワード抽出処理2)図10にサブ・キーワ
ード抽出例を示す。「A社のサービスC」という名詞句
がキーワード5として与えられたと仮定する。それに対
して形態素解析処理を行なうと(ステップ31)、図1
0に示すように、名詞の「A社」と、助詞の「の」と、
名詞の「サービスC」に分解される。
【0029】図4に従い、「現在点=第1単語」とする
(ステップ32)。現在点の単語「A社」が名詞、即ち
自立語であり、かつSK開始点が未定義状態であるの
で、「SK開始点=第1単語」とする(ステップ33〜
35)。現在点が最後の単語を指してはいないので、
「現在点=第2単語」として(ステップ39、40)、
同様の処理を行なう。現在点の単語「の」が助詞、すな
わち付属語であり、かつSK開始点が定義されているの
で、サブ・キーワードとして「A社」を切り出し(ステ
ップ33、36、37)、SK開始点を未定義状態にす
る(ステップ38)。さらに、現在点は最後の単語では
ないので、「現在点=第3単語」とする(ステップ3
9、40)。現在点の単語「サービスC」が名詞、即ち
自立語であり、かつSK開始点が未定義状態であるの
で、「SK開始点=第3単語」とする(ステップ33〜
35)。現在点が最後の単語であり、かつSK開始点が
定義されているので、サブ・キーワードとして「サービ
スC」を切り出す(ステップ39、41、42)。 (中心度の計算3)図5の中心度計算のフローチャート
に従い、まずテキスト木へのマーク付けを行なう。サブ
・キーワード「A社」を考えると(ステップ51)、サ
ブ・キーワード「A社」は、テキスト木のルート・ノー
ドに含まれる話題レベルT=1の話題語「A社の通信サ
ービス」に含まれるので、その話題語にマークを付ける
(ステップ52、53、56)。サブ・キーワード「サ
ービスC」に関しても同様にマークを付ける(ステップ
51〜53、56)。図9のテキスト木において話題語
にマーク(実線のブロック)を付けた結果を図11に示
す。
【0030】次に、図5に従い、占有領域の認識を行な
う。サブ・キーワードSKWの数が2つであるので、必
要一致ノード数Nは 必要一致ノード数N=(2×0.75)の四捨五入=2 となる(ステップ58)。図11のマーク付きテキスト
木を見ると、話題語「A社の通信サービス」と「サービ
スC」を含むノードが親子関係であり、かつ必要一致ノ
ード数2以上のノードを含んでいる。これらのうち、話
題語「サービスC」を含むノードが最も話題レベルTが
大きく、かつ話題語の方にマークが付いているので、図
12に示すように、この「サービスC」を含む話題の話
題区間を占有領域として認定する(ステップ59 ,6
1〜64)。必要一致ノード数2を満たす親子ノード集
合は、これ以外にはないので、占有領域はこれだけであ
る。
【0031】最後に、テキスト全体の単文数が40で、
占有領域に含まれる単文数が8であるので、 中心度=8/40=0.20 となる(ステップ67)。
【0032】
【発明の効果】以上説明したように本発明は、下記のよ
うな効果がある。 (1)請求項1の発明は、与えられたキーワードが、検
索対象の各テキストにおいてどれだけ大々的に述べられ
ているかを表す中心度を計算することにより、ユーザは
欲しい情報を効率良く取得することが可能となる。 (2)請求項2の発明は、中心度に値に基づいてテキス
トに順位付けを行なうことにより、検索結果をユーザに
分かり易いように表示することが可能となる。
【図面の簡単な説明】
【図1】本発明の一実施例のキーワード検索方法の処理
を示すフローチャートである。
【図2】本発明の一実施例のキーワード検索装置のブロ
ック図である。
【図3】テキスト木生成処理1を示すフローチャートで
ある。
【図4】サブ・キーワード抽出処理2を示すフローチャ
ートである。
【図5】中心度の計算3を示すフローチャートである。
【図6】テキストの一例を示す図である。
【図7】話題構造情報8を示す図である。
【図8】図6のテキスト例の直轄ブロックを示す図であ
る。
【図9】図6のテキスト例のテキスト木を示す図であ
る。
【図10】キーワードからのサブ・キーワード抽出例を
示す図である。
【図11】図6のテキスト例のテキスト木に対するマー
クを示す図である。
【図12】図6のテキスト例の占有領域を示す図であ
る。
【符号の説明】
1 テキスト木生成処理 2 サブ・キーワード抽出処理 3 中心度の計算 4 テキスト並べ換え処理 5 ユーザが指定したキーワード 6 検索対象 7 検索結果 8 話題構造情報 9 要約区間 10 形態素解析済みキーワード 11 テキスト木生成手段 12 サブ・キーワード抽出手段 13 中心度計算手段 14 テキスト並び換え手段 21〜26、31〜42、51〜67 ステップ
フロントページの続き (56)参考文献 特開 昭61−117658(JP,A) 特開 平2−181261(JP,A) 特開 平2−254566(JP,A) 特開 平3−105566(JP,A) 特開 平3−191475(JP,A) 特開 平4−24869(JP,A) 特開 平4−281565(JP,A) 特開 平4−135278(JP,A) 三池,小野,住田「A METHOD OF INFORMATION RE TRIEVAL BY DOCUMEN T STRUCTURE ANALYS IS」情報処理学会研究報告(93−FI −31)pp.39−46(平5−9−14) 原田,外3名「抄録からの主題文の自 動抽出」情報処理学会研究報告(93−F I−29−3)pp.17−26(平5−5− 18) 西村,島津「特定表現の重点的解析に よる科学技術論文構造化手法」情報処理 学会研究報告(93−FI−29−5)p p.35−42(平5−5−18) (58)調査した分野(Int.Cl.7,DB名) G06F 17/30 JICSTファイル(JOIS)

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 キーワード検索方法において、 あらかじめ話題構造情報と要約区間情報が各テキストに
    与えられたフルテキスト・データベースから与えられた
    キーワードに関係のあるテキストを検索する際に、各テ
    キストの話題構造情報に含まれる話題語とキーワードと
    の部分文字列マッチングを取り、 もしマッチングに成功すれば、マッチングした話題語を
    含む話題構造情報から、テキストにおいてそのキーワー
    ドについて述べらている占有領域を求め、 もしマッチングに失敗すれば、テキストで要約区間以外
    の部分とキーワードとの部分文字列マッチングを行な
    い、もしマッチングに成功すればマッチングした文字列
    のテキストにおける位置とその位置に対応する話題構造
    情報から占有領域を求め、もし、マッチングに失敗すれ
    ば占有領域は存在しないものとし、 占有領域内の単文数とテキスト内の単文数の比である中
    心度を計算することを特徴とするキーワード検索方法。
  2. 【請求項2】 各テキストに対して、求められた中心度
    の値に基づいて順位付けを行う請求項1記載のキーワー
    ド検索方法。
JP31996893A 1993-12-20 1993-12-20 キーワード検索方法 Expired - Lifetime JP3161660B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP31996893A JP3161660B2 (ja) 1993-12-20 1993-12-20 キーワード検索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP31996893A JP3161660B2 (ja) 1993-12-20 1993-12-20 キーワード検索方法

Publications (2)

Publication Number Publication Date
JPH07175819A JPH07175819A (ja) 1995-07-14
JP3161660B2 true JP3161660B2 (ja) 2001-04-25

Family

ID=18116269

Family Applications (1)

Application Number Title Priority Date Filing Date
JP31996893A Expired - Lifetime JP3161660B2 (ja) 1993-12-20 1993-12-20 キーワード検索方法

Country Status (1)

Country Link
JP (1) JP3161660B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120038000A (ko) * 2004-01-20 2012-04-20 코닌클리케 필립스 일렉트로닉스 엔.브이. 대화의 주제를 결정하고 관련 콘텐트를 획득 및 제시하는 방법 및 시스템

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
三池,小野,住田「A METHOD OF INFORMATION RETRIEVAL BY DOCUMENT STRUCTURE ANALYSIS」情報処理学会研究報告(93−FI−31)pp.39−46(平5−9−14)
原田,外3名「抄録からの主題文の自動抽出」情報処理学会研究報告(93−FI−29−3)pp.17−26(平5−5−18)
西村,島津「特定表現の重点的解析による科学技術論文構造化手法」情報処理学会研究報告(93−FI−29−5)pp.35−42(平5−5−18)

Also Published As

Publication number Publication date
JPH07175819A (ja) 1995-07-14

Similar Documents

Publication Publication Date Title
US6167370A (en) Document semantic analysis/selection with knowledge creativity capability utilizing subject-action-object (SAO) structures
US5794177A (en) Method and apparatus for morphological analysis and generation of natural language text
EP0597630B1 (en) Method for resolution of natural-language queries against full-text databases
US7257530B2 (en) Method and system of knowledge based search engine using text mining
US6745181B1 (en) Information access method
WO1997004405A9 (en) Method and apparatus for automated search and retrieval processing
JP3173411B2 (ja) 関連文書検索装置及び関連文書検索プログラムを記録した記録媒体
JP2011118689A (ja) 検索方法及びシステム
Kallimani et al. Summarizing news paper articles: experiments with ontology-based, customized, extractive text summary and word scoring
Arslan DeASCIIfication approach to handle diacritics in Turkish information retrieval
US6907562B1 (en) Hypertext concordance
JP4065346B2 (ja) 単語間の共起性を用いたキーワードの拡張方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2000132560A (ja) 中国語テレテキスト処理方法及び装置
Croft et al. TREC-2 routing and ad-hoc retrieval evaluation using the INQUERY system
JP3161660B2 (ja) キーワード検索方法
JP2004046438A (ja) テキスト検索方法及び装置及びテキスト検索プログラム及びテキスト検索プログラムを格納した記憶媒体
JP4378106B2 (ja) 文書検索装置、文書検索方法及びプログラム
KR100452024B1 (ko) 자연어 질의 응답 검색 엔진 및 검색 방법
JP2007164462A (ja) 質問応答システム、質問応答方法及び質問応答プログラム
JPH07134720A (ja) 文章作成システムにおける関連情報提示方法及び装置
KR970049752A (ko) 동사정보를 이용한 한국어 자연어 질의 정보검색 방법
JPS63228326A (ja) キ−ワ−ド自動抽出方式
JP3358100B2 (ja) 日本語質問メッセージ解析方法及び装置
JPH1145255A (ja) 文書検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH05233689A (ja) 文書自動要約方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090223

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090223

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100223

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110223

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110223

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120223

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130223

Year of fee payment: 12

EXPY Cancellation because of completion of term