JP2809341B2 - 情報要約方法、情報要約装置、重み付け方法、および文字放送受信装置。 - Google Patents

情報要約方法、情報要約装置、重み付け方法、および文字放送受信装置。

Info

Publication number
JP2809341B2
JP2809341B2 JP7253981A JP25398195A JP2809341B2 JP 2809341 B2 JP2809341 B2 JP 2809341B2 JP 7253981 A JP7253981 A JP 7253981A JP 25398195 A JP25398195 A JP 25398195A JP 2809341 B2 JP2809341 B2 JP 2809341B2
Authority
JP
Japan
Prior art keywords
keyword
keywords
weighting
unit
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP7253981A
Other languages
English (en)
Other versions
JPH08329118A (ja
Inventor
今中  武
充照 片岡
聰 松浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP7253981A priority Critical patent/JP2809341B2/ja
Priority to US08/560,394 priority patent/US6064952A/en
Priority to CNB951188496A priority patent/CN1178164C/zh
Priority to KR1019950041892A priority patent/KR960018990A/ko
Publication of JPH08329118A publication Critical patent/JPH08329118A/ja
Application granted granted Critical
Publication of JP2809341B2 publication Critical patent/JP2809341B2/ja
Priority to US09/211,385 priority patent/US6240378B1/en
Priority to US09/754,470 priority patent/US6502065B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Probability & Statistics with Applications (AREA)
  • Television Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、例えば、文字放送
受信装置など所定の単位に分けられた複数の文字列デー
タから所定のキーワードを抽出する場合等に利用可能
な、情報要約方法、情報要約装置、重み付け方法、およ
び文字放送受信装置に関する。
【0002】
【従来の技術】近年、マルチメディア時代の到来により
CD−ROMなどのパッケージメディアのみでなく、数
多くの情報が通信や放送などを通じても提供されてきて
いる。これらの情報の中には、映像、音声に関するもの
に加えて電子ブック、文字放送など文字情報がある。文
字情報はASCIIコード、JISコードなど計算機で容易に処
理できる文字コードで表現されている。しかしながら、
人間にとっては文字情報は一度に表示できる情報量が少
ない、映像情報と比べて要点を解釈するのに必要な時間
が多い、といった問題がある。この問題は、情報化社会
が進展する中、提供される情報はますます増えて行くこ
とを考えれば、さらに深刻になる。このような問題に対
し、自動的に文書内容を解釈して分かりやすく表現し直
す技術への取り組みが考えられる。このような取り組み
の例として、人工知能研究分野における自然言語処理の
研究がある。しかしながら、大規模な辞書情報、文法情
報などが必要である上に文書内容を誤って解釈する確率
を実用レベルにまで引き下げるのが困難など現実的問題
に適用するには問題点が多く、実際的な応用例は少な
い。
【0003】一方、近年では文字コードが放送として送
られてくる文字放送を対象とした受信装置が開発、販売
されており、家庭内に向けて提供される文字情報は急激
に増えてきている。文字放送では、多数の番組が提供さ
れている反面、情報の形態が文字なので、利用者はテレ
ビに映し出される文章を読むことによって情報を得るこ
とができる。この結果、情報の全容を把握するためには
大量の文字を読まなければならない、ページをめくりな
がら順に読まなければならない、などの問題が生じる。
実際に、ニュースなどでは何が情報として提供されてい
るのか予め解っていることは希であり、利用者自身があ
らかじめ自分の興味のある情報を意識している場合が少
ない。このため、自分にとって必要な情報のみを取り出
すことは困難であり、全部の情報を一通り読み終えてか
ら、必要な情報を利用者自身が選び出すことになる。し
たがって、必要な情報を得るために費やす時間が長くな
り、文字放送を楽しむ利用者の数が多くなることに対す
る妨げになっている。このため、文字放送において情報
のポイントを抽出し、ポイントのみを表示するなどの情
報要約機能の必要性は高まっている。また、文字放送中
には主なニュースの要約を放送しているチャンネルもあ
るが、要約自体が数ページに渡っている、放送局によっ
て要約の内容、形式、長さが異なるなど問題が多い。
【0004】従来より、文書データの情報要約技術とし
て実用化されているものとしてキーワード抽出技術があ
る。この技術は、学術論文などを対象とし、論文中で用
いられている専門用語などの頻度を算出し、頻度の高い
キーワードを論文の要約として抽出するものである。こ
のような技術が実用化された背景には、特定分野の論文
といったように専門用語がある程度限られる文書を対象
としていたことがある。このような対象ではキーワード
として抽出するべき用語の辞書を予め準備することが比
較的容易である。この技術により自動抽出したキーワー
ドは各論文に付与し、論文の整理、検索に用いられる。
【0005】
【発明が解決しようとする課題】しかしながら、上述の
キーワード抽出技術を文字放送番組の要約に適用した場
合、番組内に現れるキーワードのうち単純に頻度の大き
いものを抽出してしまう。この結果、互いに類似した内
容のキーワードがいくつも抽出され、要約としては冗長
になる。さらに、文字放送を対象とした場合には、番組
の内容の要約以外に複数の番組に共通する話題を、その
時々の話題性のある情報として抽出したいといった要求
が生じる。たとえば、ニュース番組が複数のチャンネル
で放送されており、複数チャンネルのニュースから共通
している話題を現在のトレンドとして抽出するような情
報要約に対する要求がある。この場合、同一番組内で繰
り返し登場するキーワードと複数の番組にまたがって登
場するキーワードを区別して扱う技術が必要である。ま
た、従来の自然言語処理技術を例えばニュース番組に適
用しようとしても、ニュース番組には固有名詞が非常に
多く用いられるといった特徴があり、予め用語の辞書を
準備することはできない。この結果、従来技術はそのま
までは適用できない。したがって、情報のトレンドを扱
うことができ、かつ用語の辞書を必要としない情報要約
技術が必要である。
【0006】また、情報要約としてキーワードを用いる
場合、単純に頻度に基づくキーワードの抽出を行えば、
類似の内容を示すキーワードがいくつも抽出されたり、
キーワード間の関連がわからないなど、キーワードの数
の割に情報として得られる内容が乏しくなるといった問
題を引き起こす。たとえば、実際に同じ時間に放送され
ていた文字放送の7個のニュースから頻度の高いキーワ
ードを単純に取り出した場合、頻度の高い上位7個のキ
ーワードは図15に示すようになった。図15の(a),
(b)は異なる時間に受信したニュースに対して行った実
験結果である。この結果からも単純に頻度に基づくキー
ワードの抽出では情報要約として問題があることが明白
である。たとえば、(a)においては1番目のキーワード
「泉佐野」と6番目のキーワード「朝日新聞社」は同じ
話題に関連するキーワードであるが、そのことは図15
のようなキーワードの羅列では解らない。このため、類
似した意味を持つキーワードを重複して抽出しないよう
にする、キーワード間の関連を情報要約の中で明示的に
示す技術が必要である。この必要性に対し、従来の自然
言語処理のようにキーワードの意味や関連を記述した辞
書情報を予め用意することが考えられるが、現実的な問
題を考えた場合、大規模な辞書情報を準備することはコ
スト面からも問題になる場合が多く、可能な限り予め準
備する辞書情報を少なくする必要がある。さらに、文字
放送のニュース番組などを対象とする場合、固有名詞が
多数用いられるために予め辞書を準備すること自体困難
である。したがって、辞書を用いないでキーワード間の
関連を自動的に推論し、キーワード間の関連も考慮した
形で情報要約を行う技術が必要である。
【0007】さらに、以上のような技術は文字放送に限
定されず、文字コードで与えられた文字列データ一般に
必要である。たとえば、論文データにおいても個々の論
文の要約ではなく、学会全体の話題の要約が必要になる
場合もある。また、通信を用いた電子メール装置におい
ては、最近の話題など全てのメールにおいて何が話題と
して多く取り上げられているのかを抽出する際にも必要
である。
【0008】また、辞書を用いないでキーワードの頻度
を扱う場合に、予め類語辞書を用意しておくことはでき
ないために、同じことを表していても表現の異なるキー
ワードの処理が必要になる。たとえば、同じ選手の名前
でも「伊達公子」と表現したり、「伊達選手」と表現し
たりする。このように表現が異なっていても同じ意味で
用いられているキーワードは、頻度を数えるときに互い
の頻度を加算する必要がある。したがって、辞書を用い
ないで「伊達公子」と「伊達選手」を類似キーワードと
して扱い、類似キーワードの頻度を考慮して頻度計算を
行う技術の開発が課題である。
【0009】表現の異なるキーワードの使用は、文字放
送など複数の放送局からデータが提供され、放送局が違
えばデータを作成した作成者が違うといった場合には頻
繁に生じる。特に、放送内容がニュースなど世の中の出
来事を扱っている場合、学問分野などと異なり専門用語
がきちんと決まっていないという問題がある。したがっ
て、同じ出来事を表現するためのキーワードであって
も、情報源によって様々な表現が用いられる。この結
果、文字放送を対象とした場合、表現の違うキーワード
の処理を行う技術の開発は重要な課題である。
【0010】また、辞書を用いないで表現の異なるキー
ワードの類似性を算出する場合、2つのキーワードの間
で同じ文字の数や割合を用いる方法が考えられる。たと
えば、「伊達公子」と「伊達選手」は同じ文字が「伊
達」の2文字であり、キーワード4文字中2文字が一致
している。すなわち、半分以上の文字が一致しているた
めに、これらのキーワードは類似していると見なすこと
ができる。しかしながら、このように単純に一致してい
る文字数に基づいて類似度を算出すれば、「伊達」の2
文字が一致するキーワード「伊達公子」と「伊達選手」
と「伊達政宗」はすべて類似度合いが同じになってしま
うといった問題がある。「伊達公子」と「伊達選手」の
類似度は大きく、「伊達公子」と「伊達政宗」は類似度
が小さくなるような算出方法を考案することが課題であ
る。
【0011】表現の異なるキーワードの処理は、文字放
送など複数の放送局からデータが提供され、データを作
成した作成者が異なる場合に、必要性が大きい。特に、
放送内容がニュースなど世の中の出来事を扱っている場
合、学問分野などと異なり専門用語がきちんと決まって
いないという問題がある。さらに、会議名、人名、会社
名などの場合、同じようなキーワードで、全く関係のな
い話題で扱われていることがある。したがって、文字放
送を対象とした場合、表現の違うキーワードの処理を行
う技術の開発が課題である。
【0012】さらに、キーワードをデータ中から抽出
し、抽出したキーワードの頻度に基づいて要約を行う際
には、たとえば英語の{a,the}などの冠詞、前置詞など
は頻出のキーワードになる。したがって、このような頻
出であまり話題を表す上で意味のないキーワードを取り
除く必要性がある。
【0013】また、文字放送においても、英語の引用文
が提供される場合が考えられる。その場合には、前置
詞、冠詞など話題を表す上で重要でないキーワードの頻
度が大きくなる恐れがあり、このようなキーワードが情
報要約として出力されないようにする技術の開発が課題
である。
【0014】本発明は、従来のこのような問題を考慮
し、従来に比べてより一層適切なキーワードをデータ内
から抽出することに利用可能な、情報要約方法、情報要
約装置、重み付け方法、および文字放送受信装置を提供
することを目的とする。
【0015】
【課題を解決するための手段】第1の発明は、所定の単
位に分けられており、かつ各文字が文字コードで表され
た文字列データの入力を受け付ける入力手段と、前記入
力手段から入力された文字列データから前記所定の単位
ごとにキーワードを抽出するキーワード抽出手段と、前
記キーワードに、そのキーワードと同一のキーワードの
他の前記単位における出現状態を考慮して、重み付けす
る重み付け手段と、その重み付けの結果に基づいてキー
ワードを選択するキーワード選択手段と、その選択され
たキーワードを前記文字列データに関する情報要約とし
て出力するための出力手段と、を備えた情報要約装置で
ある。
【0016】第2の発明は、文字放送を受信する文字放
送受信手段と、所定の番組のチャンネルを複数個記憶す
るチャンネル記憶手段と、前記チャンネル記憶手段に記
憶されている各チャンネルの番組を前記文字放送受信手
段で受信し、受信した番組ごとにキーワードを抽出する
キーワード抽出手段と、前記キーワードに、そのキーワ
ードと同一のキーワードの他の前記番組における出現状
態を考慮して、重み付けする重み付け手段と、その重み
付けの結果に基づいてキーワードを選択するキーワード
選択手段と、その選択されたキーワードの全部又は一部
を前記文字放送に関する情報要約として表示するための
表示手段と、を備えた文字放送受信装置である。
【0017】第3の発明は、所定の単位に分けられた、
かつ各単位内が所定の段落に分けられた、かつ各文字が
文字コードで表された文字列データの入力を受け付ける
入力手段と、前記入力手段から入力された文字列データ
から前記所定の単位の段落ごとにキーワードを抽出する
キーワード抽出手段と、同一の前記段落から得られたキ
ーワードどうしを関連付けして、キーワード関連を生成
するキーワード関連付け手段と、前記キーワードに、そ
のキーワードと同一のキーワードの他の前記単位におけ
る出現状態を考慮して、重み付けし、又、前記キーワー
ド関連に、そのキーワード関連と同一のキーワード関連
の他の前記段落における出現状態を考慮して、重み付け
する重み付け手段と、それらの重み付けの結果に基づい
てキーワード、およびキーワード関連を選択する選択手
段と、それら選択されたキーワード及びキーワード関連
を、前記文字列データに関する情報要約として、出力す
るための出力手段と、を備えた情報要約装置である。
【0018】第4の発明は、文字放送を受信する文字放
送受信手段と、所定の番組のチャンネルを複数個記憶す
るチャンネル記憶手段と、前記チャンネル記憶手段に記
憶されている各チャンネルの番組を前記文字放送受信手
段で受信し、受信した番組ごとにキーワードを抽出する
キーワード抽出手段と、同一番組中の同一段落から得ら
れたキーワードどうしを関連付けして、キーワード関連
を生成するキーワード関連付け手段と、前記キーワード
に、そのキーワードと同一のキーワードの他の前記番組
における出現状態を考慮して、重み付けし、又、前記キ
ーワード関連に、そのキーワード関連と同一のキーワー
ド関連の他の前記段落における出現状態を考慮して、重
み付けする重み付け手段と、それらの重み付けの結果に
基づいて、キーワード、およびキーワード関連を選択す
る選択手段と、それら選択されたキーワード及びキーワ
ード関連の全部又は一部を、前記文字放送に関する情報
要約として表示するための表示手段と、を備えた文字放
送受信装置である。
【0019】第5の発明は、所定の単位に分けられてお
り、かつ各文字が文字コードで表された文字列データの
入力を受け付ける入力手段と、その入力された文字列デ
ータから前記所定の単位ごとにキーワードを抽出するキ
ーワード抽出手段と、それら抽出したキーワード間の類
似性を算出する類似性算出手段と、前記キーワードに、
そのキーワードと同一又は類似のキーワードの他の前記
単位における出現状態を考慮して、重み付けする重み付
け手段と、その重み付けの結果に基づいてキーワードを
選択するキーワード選択手段と、その選択されたキーワ
ードを前記文字列データに関する情報要約として出力す
るための出力手段と、を備えた情報要約装置である。
【0020】第6の発明は、文字放送を受信する文字放
送受信手段と、所定の番組のチャンネルを複数個記憶す
るチャンネル記憶手段と、前記チャンネル記憶手段に記
憶されている各チャンネルの番組を前記文字放送受信手
段で受信し、受信した番組ごとにキーワードを抽出する
キーワード抽出手段と、それら抽出したキーワード間の
類似性を算出する類似性算出手段と、前記キーワード
に、そのキーワードと同一又は類似のキーワードの他の
前記番組における出現状態を考慮して、重み付けする重
み付け手段と、その重み付けの結果に基づいてキーワー
ドを選択するキーワード選択手段と、その選択されたキ
ーワードの全部又は一部を前記文字放送に関する情報要
約として表示するための表示手段と、を備えた文字放送
受信装置である。
【0021】第7の発明は、所定の単位に分けられた、
かつ各単位内が所定の段落に分けられた、かつ各文字が
文字コードで表された文字列データの入力を受け付ける
入力手段と、前記入力手段から入力された文字列データ
から前記所定の単位の段落ごとにキーワードを抽出する
キーワード抽出手段と、同一の前記段落から得られたキ
ーワードどうしを関連付けして、キーワード関連を生成
するキーワード関連付け手段と、前記抽出したキーワー
ド間の類似性を、キーワードどうしの前記関連付けを含
む複数の要因に基づいて算出する類似性算出手段と、前
記キーワードに、そのキーワードと同一又は類似のキー
ワードの他の前記単位における出現状態を考慮して、重
み付けし、又、前記キーワード関連に、そのキーワード
関連と同一のキーワード関連の他の前記段落における出
現状態を考慮して、重み付けする重み付け手段と、それ
らの重み付けの結果に基づいて、キーワード、およびキ
ーワード関連を選択する選択手段と、それら選択された
キーワード、及びキーワード関連を前記文字列データに
関する情報要約として出力するための出力手段と、を備
えた情報要約装置である。
【0022】第8の発明は、文字放送を受信する文字放
送受信手段と、所定の番組のチャンネルを複数個記憶す
るチャンネル記憶手段と、前記チャンネル記憶手段に記
憶されている各チャンネルの番組を前記文字放送受信手
段で受信し、受信した番組ごとにキーワードを抽出する
キーワード抽出手段と、同一番組中の同一段落から得ら
れたキーワードどうしを関連付けして、キーワード関連
を生成するキーワード関連付け手段と、前記抽出したキ
ーワード間の類似性を、キーワードどうしの前記関連付
けを含む複数の要因に基づいて算出する類似性算出手段
と、前記キーワードに、そのキーワードと同一又は類似
のキーワードの他の前記番組における出現状態を考慮し
て、重み付けし、又、前記キーワード関連に、そのキー
ワード関連と同一のキーワード関連の他の前記段落にお
ける出現状態を考慮して、重み付けする重み付け手段
と、それらの重み付けの結果に基づいて、キーワード、
およびキーワード関連を選択する選択手段と、それら選
択されたキーワード及びキーワード関連の全部又は一部
を、前記文字放送に関する情報要約として表示するため
の表示手段と、を備えた文字放送受信装置である。
【0023】第9の発明は、キーワードとして処理しな
いキーワードを予め記憶しておく例外キーワード記憶手
段を有し、入力手段から入力された文字列データから所
定の単位ごとに含まれているキーワードを抽出する際
に、前記例外キーワード記憶手段に記憶されているキー
ワードと同一のキーワードは、抽出対象から外す情報要
約装置である。
【0024】第10の発明は、キーワードとして処理し
ないキーワードを予め記憶しておく例外キーワード記憶
手段を有し、チャンネル記憶手段に記憶されている各チ
ャンネルの番組を前記文字放送受信手段で受信し、受信
した番組ごとに含まれているキーワードを抽出する際
に、前記例外キーワード記憶手段に記憶されているキー
ワードと同一のキーワードは、抽出対象から外す文字放
送受信装置である。
【0025】第1の発明によれば、例えば、所定の単位
に分けられており、かつ各文字が文字コードで表された
文字列データの入力を受け付け、その入力された文字列
データから前記所定の単位ごとにキーワードを抽出し、
前記キーワードに、そのキーワードと同一のキーワード
の他の前記単位における出現状態を考慮して、重み付け
し、その重み付けの結果に基づいてキーワードを選択
し、その選択されたキーワードを前記文字列データに関
する情報要約として出力する。
【0026】この結果、例えば、多くの単位にまたがっ
て用いられているキーワードが優先的に情報要約として
選出される。すなわち、多くの単位で共通の話題として
現れているキーワードが選出され、文字列データ全体の
傾向を表す要約情報として取り出される。
【0027】第2の発明によれば、文字放送受信手段が
文字放送を受信し、チャンネル記憶手段が、所定の番組
のチャンネルを複数個記憶し、キーワード抽出手段が、
前記チャンネル記憶手段に記憶されている各チャンネル
の番組を前記文字放送受信手段で受信し、受信した番組
ごとにキーワードを抽出し、重み付け手段が、前記キー
ワードに、そのキーワードと同一のキーワードの他の前
記番組における出現状態を考慮して、重み付けし、キー
ワード選択手段が、その重み付けの結果に基づいてキー
ワードを選択し、表示手段が、その選択されたキーワー
ドの全部又は一部を前記文字放送に関する情報要約とし
て表示する。
【0028】これにより、例えば、より多くの番組にま
たがって現れているキーワードほど点数が高くなるよう
にキーワードごとに点数を算出する。この結果、例え
ば、チャンネル記憶手段に記憶されているチャンネルの
文字放送のうち多くの番組で共通して取り上げられてい
る話題のキーワードを情報要約として取り出すことがで
きる。すなわち、文字放送で放送される番組のように時
時刻刻と変化するものに対して、最新情報のトレンドを
取りだし、情報要約として表示する。
【0029】第3の発明によれば、所定の単位に分けら
れた、かつ各単位内が所定の段落に分けられた、かつ各
文字が文字コードで表された文字列データの入力を受け
付け、前記入力された文字列データから前記所定の単位
の段落ごとにキーワードを抽出し、同一の前記段落から
得られたキーワードどうしを関連付けして、キーワード
関連を生成し、前記キーワードに、そのキーワードと同
一のキーワードの他の前記単位における出現状態を考慮
して、重み付けし、又、前記キーワード関連に、そのキ
ーワード関連と同一のキーワード関連の他の前記段落に
おける出現状態を考慮して、重み付けし、それらの重み
付けの結果に基づいて、キーワード、およびキーワード
関連を選択し、それら選択されたキーワード及びキーワ
ード関連を、前記文字列データに関する情報要約として
出力する。
【0030】これにより、例えば、より多くの単位にま
たがって現れているキーワード、およびより多くの段落
にまたがって現れているキーワードどうしの関連付けほ
ど点数が高くなるように、キーワード、およびキーワー
ドどうしの関連付けごとに点数を算出する。この算出し
た点数に基づいてキーワード、およびキーワードどうし
の関連付けを選択し、情報要約として抽出する。この結
果、例えば、出現頻度の大きいキーワードを単純に選択
した場合に比べ、頻繁に関連づけて用いられる関連の深
いキーワードどうしを取り出すことができ、情報要約の
表示の際には関連の深いキーワードが多数ある場合に代
表的なもののみを表示し、関連のあるキーワードを複数
表示する時には、それらを関連づけて表示することによ
り情報要約の内容が冗長になったり、わかりにくくなる
のを防ぐ。
【0031】第4の発明によれば、文字放送受信手段
が、文字放送を受信し、チャンネル記憶手段が、所定の
番組のチャンネルを複数個記憶し、キーワード抽出手段
が、前記チャンネル記憶手段に記憶されている各チャン
ネルの番組を前記文字放送受信手段で受信し、受信した
番組ごとにキーワードを抽出し、キーワード関連付け手
段が、同一番組中の同一段落から得られたキーワードど
うしを関連付けして、キーワード関連を生成し、重み付
け手段が、前記キーワードに、そのキーワードと同一の
キーワードの他の前記番組における出現状態を考慮し
て、重み付けし、又、前記キーワード関連に、そのキー
ワード関連と同一のキーワード関連の他の前記段落にお
ける出現状態を考慮して、重み付けし、選択手段が、そ
れらの重み付けの結果に基づいて、キーワード、および
キーワード関連を選択し、表示手段が、それら選択され
たキーワード及びキーワード関連の全部又は一部を、前
記文字放送に関する情報要約として表示する。
【0032】これにより、例えば、より多くの番組にま
たがって現れているキーワード、およびより多くの段落
にまたがって現れるキーワードどうしの関連付けほど点
数が高くなるように、キーワード、およびキーワードど
うしの関連付けごとに点数を算出する。この算出した点
数に基づいてキーワード、およびキーワードどうしの関
連付けを選択し、情報要約として抽出する。この結果、
例えば、出現頻度の大きいキーワードを単純に選択した
場合に比べ、頻繁に同時に用いられる関連の深いキーワ
ードを関連付けて取り出すことができる。特に、文字放
送では各チャンネルでニュースなど同じ情報源から得た
情報が放送され、かつ1つの事件に対して各番組とも共
通して用いるキーワードが複数個あるために、キーワー
ド間の関連付けに基づいて冗長なキーワードを要約内容
から取り除くこと、関連を明らかにすることにより情報
量の多い要約を表示することができる。これにより、膨
大な量の情報のポイントを短時間で把握することができ
る。
【0033】第5の発明によれば、所定の単位に分けら
れており、かつ各文字が文字コードで表された文字列デ
ータの入力を受け付け、その入力された文字列データか
ら前記所定の単位ごとにキーワードを抽出し、それら抽
出したキーワード間の類似性を算出し、前記キーワード
に、そのキーワードと同一又は類似のキーワードの他の
前記単位における出現状態を考慮して、重み付けし、そ
の重み付けの結果に基づいてキーワードを選択し、その
選択されたキーワードを前記文字列データに関する情報
要約として出力する。
【0034】これにより、例えば、完全には一致してい
ないキーワードどうしであっても類似キーワードとして
扱われ、類似キーワードが数多く抽出されていれば点数
が高くなり、情報要約として表示される。
【0035】第6の発明によれば、文字放送受信手段
が、文字放送を受信し、チャンネル記憶手段が、所定の
番組のチャンネルを複数個記憶し、キーワード抽出手段
が、前記チャンネル記憶手段に記憶されている各チャン
ネルの番組を前記文字放送受信手段で受信し、受信した
番組ごとにキーワードを抽出し、類似性算出手段が、そ
れら抽出したキーワード間の類似性を算出し、重み付け
手段が、前記キーワードに、そのキーワードと同一又は
類似のキーワードの他の前記番組における出現状態を考
慮して、重み付けし、キーワード選択手段が、その重み
付けの結果に基づいてキーワードを選択し、表示手段
が、その選択されたキーワードの全部又は一部を前記文
字放送に関する情報要約として表示する。
【0036】これにより、例えば、番組ごとに異なる表
現で記述されているキーワードであっても類似している
ものは頻度が加算される。
【0037】第7の発明によれば、所定の単位に分けら
れた、かつ各単位内が所定の段落に分けられた、かつ各
文字が文字コードで表された文字列データの入力を受け
付け、前記入力された文字列データから前記所定の単位
の段落ごとにキーワードを抽出し、同一の前記段落から
得られたキーワードどうしを関連付けして、キーワード
関連を生成し、前記抽出したキーワード間の類似性を、
キーワードどうしの前記関連付けを含む複数の要因に基
づいて算出し、前記キーワードに、そのキーワードと同
一又は類似のキーワードの他の前記単位における出現状
態を考慮して、重み付けし、又、前記キーワード関連
に、そのキーワード関連と同一のキーワード関連の他の
前記段落における出現状態を考慮して、重み付けし、そ
れらの重み付けの結果に基づいて、キーワード、および
キーワード関連を選択し、それら選択されたキーワード
及びキーワード関連を、前記文字列データに関する情報
要約として、出力する。
【0038】これにより、例えば、番組ごとに異なる表
現で記述されているキーワードであっても類似している
ものが抽出されていれば点数が加算される。この加算に
より、情報要約を表す上で重要なキーワードが異なる表
現で記述されていても高い点数が与えられる。
【0039】第8の発明によれば、文字放送受信手段
が、文字放送を受信し、チャンネル記憶手段が、所定の
番組のチャンネルを複数個記憶し、キーワード抽出手段
が、前記チャンネル記憶手段に記憶されている各チャン
ネルの番組を前記文字放送受信手段で受信し、受信した
番組ごとにキーワードを抽出し、キーワード関連付け手
段が、同一番組中の同一段落から得られたキーワードど
うしを関連付けして、キーワード関連を生成し、類似性
算出手段が、前記抽出したキーワード間の類似性を、キ
ーワードどうしの前記関連付けを含む複数の要因に基づ
いて算出し、重み付け手段が、前記キーワードに、その
キーワードと同一又は類似のキーワードの他の前記番組
における出現状態を考慮して、重み付けし、又、前記キ
ーワード関連に、そのキーワード関連と同一のキーワー
ド関連の他の前記段落における出現状態を考慮して、重
み付けし、選択手段が、それらの重み付けの結果に基づ
いて、キーワード、およびキーワード関連を選択し、表
示手段が、それら選択されたキーワード及びキーワード
関連の全部又は一部を、前記文字放送に関する情報要約
として表示する。
【0040】これにより、例えば、番組ごとに異なる表
現で記述されているキーワードであっても、関連付けら
れたキーワードを用いて類似度を算出し、類似している
ものが抽出されていれば点数が加算される。特に、表現
が類似していても全く異なる話題で用いられている場合
には関連付けられているキーワードが類似しないために
算出される類似度は小さくなり、より正確に類似度を算
出することができる。
【0041】第9の発明によれば、入力手段から入力さ
れた文字列データから所定の単位ごとに含まれているキ
ーワードを抽出する際に、前記例外キーワード記憶手段
に記憶されているキーワードと同一のキーワードは、抽
出対象から外す。
【0042】この結果、例えば、英語の入力データが与
えられた場合に、冠詞、前置詞などを例外キーワード記
憶手段に記憶させることにより、情報要約として表示さ
れるキーワードの中に、これらのキーワードが含まれな
いようにできる。
【0043】第10の発明によれば、チャンネル記憶手
段に記憶されている各チャンネルの番組を前記文字放送
受信手段で受信し、受信した番組ごとに含まれているキ
ーワードを抽出する際に、前記例外キーワード記憶手段
に記憶されているキーワードと同一のキーワードは、抽
出対象から外す。
【0044】この結果、例えば、文字放送に英語の文な
どが含まれている場合にでも、冠詞、前置詞など話題を
表す上であまり意味を持たないキーワードが情報要約と
して用いられることがなくなる。
【0045】
【発明の実施の形態】以下、本発明の実施の形態につい
て、図を用いて説明する。
【0046】図1は、第1の発明にかかる実施の一形態
の情報要約装置のシステム構成図であり、同図を用い
て、第1の発明にかかる実施の一形態としての情報要約
方法、および情報要約装置について述べる。
【0047】図1において、1は、所定の単位に分けら
れており、かつ各文字が文字コードで表された文字列デ
ータの入力を受け付ける入力部、2は情報要約の結果を
表示するための出力部、3は入力部1から入力された文
字列データから前記所定の単位ごとに含まれているキー
ワードを抽出するキーワード切り出し部、4はより多く
の単位で抽出されたキーワードほど点数が高くなるよう
にキーワードごとに点数を算出する点数算出部、5は点
数算出部4で算出された点数に基づいてキーワードを選
択し、情報要約として出力部2に出力する要約部であ
る。
【0048】以上のように構成されたシステムが実行さ
れるハードウェア構成を図2に示す。図2は、基本的に
汎用の計算機システムの構成と同じであり、図1で示し
たシステム構成の構成部分として説明した入力部1と、
出力部2とを備えている。図2の構成部分のうち図1の
システム構成と同一構成部分については同一番号を付し
ており、説明を省略する。図2において、11は出力部
2に表示されるデータを記憶するVRAM、12は処理
のためのプログラムやデータを実行時に記憶する主記憶
装置、13はプログラムやデータを蓄積しておく外部記
憶装置、14は外部記憶装置13に記憶されているプロ
グラムを主記憶装置12に転送し実行するCPUであ
る。
【0049】以上のように構成された情報要約方法、お
よび情報要約装置の動作を図3のフローチャートを参照
しながら説明する。
【0050】ステップa1では、入力部1を通じて文字列
データが入力される。入力される文字列データは、図4
に示すように所定の単位に区切られたデータである。図
4では、所定の単位に区切られた文字列データがn個あ
る。たとえば、スポーツ新聞の内容が新聞社ごとに単位
1〜単位nまでに格納されて入力されるなどの例が考えら
れる。別の例としては、特定の分野の研究論文が学会ご
とに単位1〜単位nに格納して入力されるなどの例が考え
られる。前者の例では、本情報要約方法、および情報要
約装置によりスポーツ界の主な情報が要約情報として得
られ、後者の例では個々の学会の枠を超え、特定の分野
における最先端の話題は何かを情報要約の結果として得
ることができる。以降のステップの説明において例題と
して用いるために、ステップa1では最近のニュースが新
聞社ごとに単位1〜単位nに格納されたデータが入力され
たものとする。入力データの例を図5に示す。これは、
現在放送されている文字放送のデータに基づいて作成し
たものである。
【0051】ステップa2では、ステップa1で入力された
文字列データから1単位を取り出す。文字列データから
1単位を取り出す際には、たとえば入力された順など予
め定めた順序で一つずつ取り出す。このため、ステップ
a2を繰り返し実行することにより、入力データから取り
出すべき単位がなくなってしまう。この場合には、フロ
ーチャートに示すようにステップa5へ進む。
【0052】ステップa3では、キーワード切り出し部3
においてステップa2で取り出された1単位の文字列デー
タからキーワードの切り出しを行う。キーワードの切り
出しに関しては、従来より自然言語処理技術で種々の方
法が検討されており、いずれの方法でも構わない。しか
しながら、辞書情報など大規模な記憶容量を必要とする
ものは実現の際に大きな障害になる点、ニュースなどを
対象とした場合には固有名詞が多くあらかじめ辞書情報
を準備できない点、の2点を考慮し、本実施の一形態で
は辞書情報を用いないで字種の違いに基づいてキーワー
ドを切り出す方法を用いている。具体的には、漢字、数
字あるいはカタカナが3文字以上続いているものを切り
出している。ただし、切り出した時に数字で始まるキー
ワードになる場合は、キーワードとして扱う対象から除
外する。たとえば、ステップa2で取り出されたデータが
図4に示すデータの単位1であった場合、「米朝高官協
議合意」、「北朝鮮」、「核問題」、「米朝高官会議」
などがキーワードとして切り出される。このように、字
種の違いに基づいてキーワードを切り出した場合、デー
タによっては無意味なキーワードが切り出されるが、無
意味なキーワードの一部は後述のステップa7で、他の単
位のキーワードと部分照合することによって修正され
る。また、ステップa3では既に切り出したキーワードと
同じキーワードであっても繰り返し切り出して記憶す
る。
【0053】ステップa4では、点数算出部4においてス
テップa3で切り出したキーワードで同一のものをまとめ
て、その数を出現頻度として算出する。たとえば、ステ
ップa3においてキーワード「国際平和維持軍」が4個切
り出された場合、キーワード「国際平和維持軍」を1つ
にまとめて出現頻度を4にする。ただし、本実施の一形
態では同一ではない2つのキーワードA,Bが抽出され
ていて、キーワードBがキーワードAの部分になってお
り、かつその部分がキーワードAの文字数の5割より長
い場合、キーワードBの出現頻度にキーワードAの出現
頻度を加えてキーワードAを消去する。たとえば、キー
ワード「米朝高官協議合意」が5個、キーワード「米朝
高官協議」が3個抽出されている場合には、キーワード
「米朝高官協議」の出現頻度を8個にし、キーワード
「米朝高官協議合意」を消去する。たとえば、ステップ
a3で切り出されたキーワードが「泉佐野」、「ヘリ墜
落」、「大阪府警」、「泉佐野市」、「朝日新聞社取材
用」、「ヘリコプター」、「新聞大会開」、「第47回新
聞大会」、「京都市」、「新聞販売」、「正常化」、
「特別宣言」、「電動茶」、「京都府茶協同組合」、
「電動茶」、「米朝高官協議合意」、「北朝鮮」、「核
問題」、「米朝高官会議」、「ジュネーブ」、「調印
式」になっている場合を考える。この場合、同一のキー
ワードをまとめて、以下の(表1)のようなキーワード
カウント結果を得る。
【0054】
【表1】
【0055】また、得られたキーワードカウント結果は
FILO(First In Last Out)のスタックに記憶(プッシ
ュ)する。
【0056】ステップa5では、ステップa4で記憶したス
タックからキーワードと出現頻度の組を一つ取り出す。
このスタックでは取り出したデータは消去する。このた
め、ステップa5を繰り返し実行するうちに取り出すべき
データがなくなる。取り出すべきデータがなくなった場
合にはステップa10へ進む。
【0057】ステップa6では、ステップa5で取り出した
組の項目「キーワード」の値を取り出す。
【0058】ステップa7〜ステップa9は点数算出部4に
おいて実行される。ステップa7では、ステップa6で取り
出したキーワードを用いてキーワード頻度表に同一のキ
ーワードが存在するか否かを判定する。キーワード頻度
表は以下の(表2)に示すような形式なっており初期値
は空である。したがって、初めてこのステップが呼び出
される時には、必ずステップa9へ進む。
【0059】また、(表2)は図5のデータ例の単位1
から切り出されたキーワードのみからなっているように
見えるが、実際にはキーワード頻度表は、最終的に全て
の単位から切り出されたキーワードが含まれる表にな
る。本実施の一形態の説明ではキーワード頻度表が大き
くなりすぎるために、今後もキーワード頻度表の一部を
例として示す。
【0060】
【表2】
【0061】また、ステップa7で行う判定方法は、ステ
ップa6で取り出したキーワードとキーワード頻度表のキ
ーワードの項目”キーワード”と順に比較して実行す
る。ただし、比較の際にはステップa3の説明で述べたよ
うにキーワード切り出しによっては無意味なキーワード
が抽出されているために、「容疑者浮」と「容疑者」の
ように片方の比較対象がもう一方の一部分になってお
り、かつ部分になっている文字数がキーワード長の5割
より長い場合には一致したものと見なし、キーワードは
共通している部分「容疑者」にして扱う。
【0062】ステップa8は、ステップa6で取り出したキ
ーワードがキーワード頻度表の中に既に登録されている
場合に実行される。これは、複数の単位の中に同一のキ
ーワードが存在した場合である。この場合には、(表
2)のキーワード表形式の単位間共有度の値に1を加え
る。また、単位内頻度の値はステップa5で取り出した組
の項目「出現頻度」の値を取り出し、単位内頻度の項目
に加える。例えば、(表2)のようなキーワード頻度表
に対して、ステップa5で取り出した組が(米朝高官協
議,3)である場合を考える。この場合、ステップa8を
実行することによって以下の(表3)のようなキーワー
ド頻度表が得られる。
【0063】
【表3】
【0064】(表3)中でステップa8の実行によって変
化した部分は、キーワード「米朝高官協議」の行のキー
ワード、単位内頻度、単位間共有度である。(表2)で
はキーワードが、「米朝高官協議合意」であったのに対
して、ステップa7での比較の際に、「米朝高官協議」を
部分的に含んでおり、その部分がキーワード長の5割よ
りも大きいために同じキーワードとして扱われ、共通し
ている部分「米朝高官協議」にまとめられている。
【0065】ステップa9では、キーワード頻度表の中に
ステップa6で取りだしたキーワードと同一のキーワード
が存在しない場合であり、この場合にはステップa6で取
りだしたキーワードをキーワード頻度表に追加する。追
加する際には、単位内頻度はステップa5で取りだした組
の出現頻度に設定する。また、単位間共有度は0にす
る。
【0066】ステップa10では、要約部5においてキー
ワード頻度表から単位間共有度の大きいものから順にキ
ーワードを取り出し、表示可能な数のキーワードを出力
部2に表示する。例えば、表示可能なキーワード数が3
個である場合に、(表4)のようなキーワード頻度表か
らはキーワード「米朝高官協議」、「北朝鮮」、「核問
題」が順に選択される。
【0067】
【表4】
【0068】また、単位間共有度が同じキーワード間で
は、単位内頻度の大きいものから選択する。このキーワ
ードの選択法としては、単位間共有度と単位内頻度の重
み付き和で優先度合を算出し、順番に表示する方法も考
えられる。この方法では、予め重み付けを表す定数S,T
を定め、各キーワードごとに(単位内頻度×S+単位間
共有度×T)を算出し、この値の大きいものから選択す
る。さらに、別の方法として、キーワードの長さを考慮
する方法もある。この方法は、キーワードの文字数を導
入した重み付き和で優先度合を算出する。たとえば、S,
Tに加えて定数Uを予め定めて、(単位内頻度×S+単位
間共有度×T+キーワードの文字数×U)を算出し、この
値の大きいものから選択する。
【0069】選択されたキーワードは、情報要約として
出力部2に表示される。たとえば、キーワード「米朝高
官協議」、「北朝鮮」、「核問題」が選択された場合、
図6のような出力結果が得られる。
【0070】なお、(表4)は、単位1から取り出され
たキーワードのみでなく、全ての単位から取り出された
キーワードからなっているが、情報要約として取り出す
際には一つの単位から切り出されたキーワードの中だけ
で単位間共有度を比較し、その中で最も単位間共有度の
大きいものから順にキーワードを取り出す方法が考えら
れる。これにより、一つの単位の中で、他の単位でも共
通に扱われているキーワードを取り出すことができる。
【0071】次に、第1の発明の実施の一形態を他の例
題に当てはめた場合の処理について説明する。ここで説
明する例題は、入力部1から入力されるデータが英語で
記述されたものである。例えば、図37のデータ例を考
える。このデータ例の各単位は、Los Angeles Times, C
hicago Tribune, USA TODAY, Atlanta Constitutionな
どの記事に対する概要(Abstract)をデータとして取り
出したものである。このような英語のデータ例に対して
処理を行う場合について日本語と異なる部分について特
に詳しく説明する。フローチャートは日本語の場合と同
じく図3のようになる。
【0072】ステップa1〜ステップa2では、日本語に対
する処理と同様である。
【0073】ステップa3では、日本語では字種の違いに
基づいてキーワードを切り出したのに対し、英語の場合
には空白ですでに単語が区切られているので、空白を切
れ目として切り出す。したがって、日本語に比べて簡単
な処理で行える。ただし、本実施の一形態では大文字で
始まっているのものは1文字以上、小文字で始まってい
るものは5文字以上の単語のみをキーワードとして切り
出すようにする。これにより、冠詞や前置詞をキーワー
ドとして切り出さないようにするためである。また、大
文字で始まる単語が連続する場合には、それらをつなげ
て一つの単語と見なす。たとえば、"Rosa Mota of Port
ugal"からは、"Rosa Mota"と"Portugal"がキーワードと
して切り出される。このように、大文字で始まる単語の
連続を一固まりと見なすのは、人名などを固まりとして
扱うためである。例として、図37の単位1の第1段落
からは、{"U.S. Olympic","champion","Joan Benoit Sa
muelson","featured","NYC Marathon"}が切り出され
る。ただし、図37の入力データ例では各単位は空白行
で段落が分かれているものとする。
【0074】ステップa4では、日本語の場合と同様の処
理を行う。キーワードカウント結果としては、たとえば
図37の単位1から切り出したキーワードから(表5)
のような表を得る。
【0075】
【表5】
【0076】(表5)では、"Olympic"の出現頻度が2
になっている。これは、"U.S. Olympic"と"Olympic"が
別々に切り出されているが、日本語の場合と同様に、"O
lympic"が"U.S. Olympic"の一部分になっており、かつ
その部分が5割よりも長いために一つにまとめたからで
ある。"marathon"についても"NYC Marathon"と"maratho
n"が1つにまとめられた結果、出現頻度が2になってい
る。また、このようにキーワードが別のキーワードの部
分になっているか否かを判定したり、キーワードどうし
が等しいか否か判定する際には大文字と小文字を区別し
ない。
【0077】ステップa5〜ステップa9では、日本語の場
合と同じ処理を行う。たとえば、キーワード頻度表とし
て以下の(表6)のような表が得られる。
【0078】
【表6】
【0079】ステップa10では、日本語の場合と同じ処
理を行う。例えば(表6)のようなキーワード頻度表か
ら単位間共有度の大きいキーワードから順に所定数のキ
ーワードを取り出す。たとえば、(表6)から3個取り
出す場合には、"Olympic","marathon","Rosa Mota"が取
り出される。ただし、"Portugal" と"Rosa Mota"は単位
間共有度も単位内頻度も等しいために、空白も含めた文
字数として"Rosa Mota"が9文字、"Portugal"が8文字
であり、文字数の長い方を選択している。選択したキー
ワードは図38に示すように出力部2に出力する。日本
語では図6に示すように「情報要約」をタイトルにして
いるが、英語では"Trend"をタイトルにしている。
【0080】次に、第2の発明にかかる実施の一形態を
図を参照しながら説明する。
【0081】第2の発明の実施の一形態として情報要約
方法を適用した文字放送受信装置を示す。図7は、第2
の発明の実施の一形態のシステム構成図である。図7に
おいて、21は文字放送を受信する文字放送受信部、2
2は所定の番組のチャンネルを記憶するチャンネル記憶
部、23はチャンネル記憶部22に記憶されているチャ
ンネルの各番組を文字放送受信部21で受信し、受信し
た各番組ごとに番組に含まれているキーワードを抽出す
る文字放送キーワード切り出し部、24は多くの番組に
またがって現れているキーワードほど点数が高くなるよ
うにキーワードごとに点数を算出する文字放送点数算出
部、25は算出した点数に基づいてキーワードを選択
し、情報要約として抽出する文字放送要約部、26は要
約結果を表示する表示部である。
【0082】以上のように構成されたシステムが実行さ
れるハードウェア構成を図8に示す。図8は、基本的に
汎用の計算機システムの構成と同じであり、図2で示し
た第1の発明の実施の一形態のハードウェア構成の構成
部分と図7で示した第2の発明の実施の一形態のシステ
ム構成の構成部分からなっているために、同一構成部分
に対して同一番号を付し、詳細な説明は省略する。
【0083】以上のように構成された文字放送受信装置
の動作を図9のフローチャートを参照しながら説明す
る。また、本発明は文字放送受信方式自体に関わるもの
ではないので文字放送受信部分については文字放送受信
部21といった一構成部分としてまとめ、詳細な説明は
省略する。
【0084】ステップb1〜ステップb2では、チャンネル
記憶部22に記憶されているチャンネルから一つを取り
出し、取り出したチャンネルに従って文字放送受信部2
1で放送を受信する。ステップb1では、ステップが呼び
出される度にチャンネル記憶部22に記憶されているチ
ャンネルを順に取り出すために、記憶されているチャン
ネルがN個であればN+1回呼び出された時点で取り出
すべきチャンネルがなくなる。この場合、フローチャー
トに示すようにステップb5へ進む。チャンネル記憶部2
2に記憶されているチャンネルは以下の(表7)に示す
ようになっている。
【0085】
【表7】
【0086】チャンネル記憶部22に(表7)のような
データが記憶されている場合、初めにステップb1が呼び
出された時には4chと02#が取り出される。このようなチ
ャンネルになっているのは、現在の文字放送においてチ
ャンネルの数字と#が付く数字で番組を指定するように
なっているためである。また、ステップb2では受信した
文字放送の番組の内容を主記憶装置12に記憶する。た
だし、記憶する場所は外部記憶装置13であっても構わ
ない。チャンネル記憶部22に記憶させるチャンネルの
例としては、ニュース番組のチャンネルを複数記憶させ
る、スポーツ番組のチャンネルを複数記憶させるなど、
特定のジャンルの番組が放送されているチャンネルを記
憶させることにより、本実施の一形態が特定のジャンル
の最新のトレンドを要約結果として取り出すことができ
る。
【0087】ステップb3では、文字放送キーワード切り
出し部23においてステップb2で記憶された文字放送の
番組の内容からキーワードを切り出す。キーワードの切
り出しは、第1の発明の実施の一形態のステップa3と同
様の方法で行う。文字放送で受信した番組1個分が第1
の発明の実施の一形態の1単位に対応する。
【0088】ステップb4では、ステップb3で切り出した
キーワードに対して、第1の発明の実施の一形態のステ
ップa4と同様の方法でキーワードの数を数えてスタック
に記憶(プッシュ)する。キーワードの数を数えた結果
は第1の発明の実施の一形態で示したカウント結果表で
ある(表1)と同様の形式にしてスタックに記憶する。
【0089】ステップb5〜ステップb9では、第1の発明
の実施の一形態のステップa5〜ステップa9と同様の処理
を行う。ただし、第1の発明の実施の一形態では、キー
ワード頻度表の形式が(表2)のようになっているが、
本実施の一形態では単位の変わりに文字放送の番組を用
いているために、項目名を以下の(表8)のようにす
る。
【0090】
【表8】
【0091】ただし、処理内容は第1の発明の実施の一
形態と同様であり、単位内頻度に対して行った処理と同
じ処理を番組内頻度に対して行い、単位間共有度に対し
て行った処理と同じ処理を番組間共有度に対して行う。
また、第1の発明の実施の一形態では点数算出部4で実
行していた部分は、本実施の一形態では文字放送点数算
出部24で実行する。
【0092】ステップb10では、文字放送要約部25に
おいて第1の発明の実施の一形態のステップa10と同様
の処理を行う。第1の発明の実施の一形態の説明で用い
た図5のデータ例は文字放送から取り出したものであ
り、出力結果の例としては第1の発明の実施の一形態で
示した図6と同様である。出力結果は表示部26に表示
される。
【0093】なお、第2の発明の実施の一形態を英語の
例題に当てはめた場合の処理については、第1の発明の
実施の一形態において説明した内容と同様であるために
ここでは省略する。本発明においても英語で記述された
データを扱えることは第1の発明と同様である。
【0094】次に、第3の発明にかかる実施の一形態を
図面を参照しながら説明する。
【0095】第3の発明にかかる実施の一形態としてキ
ーワード間の関連を考慮した情報要約方法、および情報
要約装置を示す。図10は、第3の発明の実施の一形態
のシステム構成図である。図10には第1の発明の実施
の一形態の一構成例と同一の構成部分があるので、同一
構成部分に対しては同一番号を付して詳細な説明は省略
する。図10において、31はキーワード切り出し部3
で抽出したキーワードに対して同一の単位中の同一段落
から得られたキーワードどうしを関連付けるキーワード
関連付け部、32はキーワード切り出し部3で切り出さ
れたキーワード、およびキーワード関連付け部31で関
連づけられたキーワードどうしの関連付けに対して、よ
り多くの単位にまたがって現れているキーワード、およ
びキーワードどうしの関連付けほど点数が高くなるよう
に点数を算出する関連付点数算出部である。33は関連
付点数算出部32で算出された点数に基づいてキーワー
ド、およびキーワードどうしの関連付けを選択し、情報
要約として出力部2に表示する関連付要約部である。
【0096】以上のように構成されたシステムが実行さ
れるハードウェア構成は図2に示した第1の発明の実施
の一形態のハードウェア構成と同じである。したがっ
て、詳細な説明は省略する。
【0097】以上のように構成されたキーワード間の関
連を考慮した情報要約方法、および情報要約装置の動作
を図11のフローチャートを参照しながら説明する。
【0098】ステップc1〜ステップc3は、第1の発明の
実施の一形態のステップa1〜ステップa3と同様の処理を
行う。
【0099】ステップc4では、キーワード関連付部31
において同一単位中の同一段落のキーワードどうしを関
連づける。キーワードどうしの関連付けは、2つのキー
ワードの組を抽出する。キーワードどうしの関連付けを
表すキーワードの組においては、順序関係は無いものと
する。すなわち、(Keyword1,Keyword2)と(Keyword2,
Keyword1)を同一の関連付けと見なす。ただし、別々に
切り出された2つのキーワードのうち片方が、もう片方
の部分になっている場合には、ステップa4の説明で述べ
たのと同様の方法で同一とみなし、一つにまとめてから
関連付けを行う。たとえば、図5に示したデータ例の単
位1では、空白行ごとに段落が区切られている。このデ
ータ例の単位1の第1段落から抽出されるキーワード
「泉佐野」、「ヘリ墜落」、「大阪府警」、「朝日新聞
社取材用」、「ヘリコプター」に対して、キーワードど
うしの関連付け(泉佐野,ヘリ墜落)、(泉佐野,大阪府
警)、(泉佐野,朝日新聞社取材用)、(泉佐野,ヘリコ
プター)、(ヘリ墜落,大阪府警)、(ヘリ墜落,朝日新
聞社取材用)、(ヘリ墜落,ヘリコプター)、(大阪府
警,朝日新聞社取材用)、(大阪府警,ヘリコプター)、
(朝日新聞社取材用,ヘリコプター)が生成される。た
だし、データ例からは「泉佐野」と「泉佐野市」がキー
ワードとして抽出されるが、前述のとおりステップa4の
説明で述べた方法により一つのキーワード「泉佐野」に
まとめている。
【0100】ステップc5では、ステップc3、ステップc4
で抽出したキーワードとキーワードどうしの関連付けを
カウント表の形式にし、第1の発明の実施の一形態のス
テップa4と同様にFILO(First In Last Out)のスタック
に記憶(プッシュ)する。その際には、同一のキーワー
ド、キーワードどうしの関連付けが複数個ある場合に
は、それらをまとめて、数を出現頻度の項目に記憶す
る。カウント表の形式は、以下の(表9)の形式であ
る。
【0101】
【表9】
【0102】(表9)の項目「キーワード、あるいは関
連付け」には、具体的なキーワード、あるいはキーワー
ドどうしの関連付けが項目値として入る。キーワードど
うしの関連付けの場合は、2つのキーワードの組になる
ために(Keyword1,Keyword2)の形式の項目値になる。
たとえば、図5に示したデータ例の単位1の第1段落に
おいて、抽出されるキーワード、キーワード間の関連付
けから得られるカウント表は、以下の(表10)のよう
になる。
【0103】
【表10】
【0104】(表10)のキーワードどうしの関連付け
の出現頻度は、関連付けされている2つのキーワードの
出現頻度のうち大きい方の値にする。
【0105】ステップc6では、ステップc5でスタックに
記憶したキーワード、あるいはキーワードどうしの関連
付けと出現頻度の組で表されるデータを1つ取り出す。
【0106】ステップc7では、ステップc6で取りだした
データの項目「キーワード、あるいは関連付け」の値を
取り出し、その値がキーワードである場合にはステップ
c8へ進み、キーワードどうしの関連付けの場合にはステ
ップc11へ進む。取り出した項目値がキーワードかキー
ワードどうしの関連付けかを判断する手法は、項目値が
(keyword1,keyword2)のように2つのキーワードの組
になっている場合には、キーワードどうしの関連付けと
判断し、Keyword1のように単純にキーワードが1つだけ
ある場合には、キーワードと判断する。
【0107】ステップc8〜ステップc10では、関連付点
数算出部32において第1の発明の実施の一形態のステ
ップa7〜ステップa9と同様の処理を行う。ただし、キー
ワード頻度表の形式は、以下に示す(表11)のように
なっている。
【0108】
【表11】
【0109】(表11)のキーワード頻度表は、(表
2)に示した表と類似の形式であるが、項目名「キーワ
ード」が項目名「キーワード、あるいは関連付け」に変
わっている。これは、この項目値としてキーワードのみ
でなく、キーワードどうしの関連付けも格納されるため
である。ただし、ステップc8〜ステップc10では、ステ
ップc6で取り出したデータの項目「キーワード、あるい
は関連付け」の値がキーワードである場合に対してのみ
処理するために、項目名が異なるだけでステップa7〜ス
テップa9と同様に処理を進める。
【0110】ステップc11が実行されるのは、ステップc
6で取り出されたデータがキーワードどうしの関連付け
に対するデータである場合であり、その関連付けと同一
の関連付けがキーワード頻度表に存在するか否かを判定
する。キーワード表にステップc6で取りだしたキーワー
ドどうしの関連付けと同一のものがあるか否かを判定す
る際の方法は、キーワード頻度表の項目「キーワード、
あるいは関連付け」の値と順に比較して実行する。ただ
し、判定の方法は効率のよい別の方法であっても構わな
い。また、キーワードどうしの関連付けの場合の判定時
には、ステップc4の説明で述べた通り関連付けの表現形
式(Keyword1,Keyword2)に対して、(Keyword2,Keyword1)
であっても同一と見なす。また、各キーワードについ
て、片方のキーワードがもう片方のキーワードの部分に
なっている場合には、ステップa7で説明したのと同様の
基準と方法で一つにまとめる。
【0111】ステップc12は、ステップc6で取り出した
キーワードどうしの関連付けがキーワード頻度表の中に
既に登録されている場合に実行される。これは、複数の
異なる段落中に同一のキーワードどうしの関連付けが存
在した場合である。この場合には、キーワード頻度表の
単位間共有度の値に1を加える。実際にはキーワードど
うしの関連付けの場合、単位ではなく段落で扱うため
に、項目「単位間共有度」、「単位内頻度」は、項目名
を「段落間共有度」、「段落内頻度」とするべきである
が、キーワードの場合と同一のキーワード頻度表を用い
るために、項目名はキーワードの場合に合わせている。
また、単位内頻度の値はステップc6で取りだした組の出
現頻度を単位内頻度の項目の値に加える。たとえば、ス
テップc6で取り出された組が((米朝高官協議,北朝
鮮),2)である場合を考える。この場合、キーワード
頻度表の中の属性「キーワード、あるいは関連付け」の
項目値が(米朝高官協議,北朝鮮)であるデータの単位
内頻度の値を2増やし、単位間共有度の値を1増やす。
【0112】ステップc13は、キーワード頻度表の中に
ステップc6で取りだしたキーワードどうしの関連付けと
同一のものが存在しない場合に実行される処理であり、
この場合にはステップc6で取りだした組のキーワードど
うしの関連付けをキーワード頻度表に追加する。追加す
る際には、単位内頻度はステップc6で取りだした組の出
現頻度に設定する。また、単位間共有度は0にする。以
上のステップc11〜ステップc13は関連付点数算出部32
において実行される。
【0113】ステップc14では、関連付要約部33にお
いて、キーワード頻度表のキーワードの中から単位間共
有度が大きいものから順に所定数のキーワードを取り出
す。次に、それぞれのキーワードに対して、そのキーワ
ードを含む関連付けのうち単位間共有度の大きいものか
ら順に所定数の関連付けを取り出す。最後に、検索した
結果を出力部2に表示する。ただし、単位間共有度が同
じ場合には単位内頻度の大きいものを優先する。単位内
頻度まで同じ場合には、文字数の多いキーワード、ある
いは文字数の多いキーワードを含むキーワードどうしの
関連付けを優先して取り出す。たとえば、(表12)の
ようなキーワード頻度表に対して、キーワードを2個
と、各キーワードに対して関連付けを2個ずつ取り出す
場合を考える。
【0114】
【表12】
【0115】この場合、単位間共有度の大きいものから
2個のキーワードを取り出すと「米朝高官協議」、「朝
日新聞社」になる。キーワード「朝日新聞社」とキーワ
ード「ヘリ墜落」とキーワード「北朝鮮」は単位間共有
度が等しいが、単位内頻度に基づいて「朝日新聞社」が
取り出される。また、各キーワードを含むキーワードど
うしの関連付けを単位間共有度に基づいて取り出すと、
(米朝高官協議,北朝鮮)、(米朝高官協議,核問題)、
(朝日新聞社,ヘリ墜落)、(泉佐野,朝日新聞社)にな
り、関連付けられているキーワードは「北朝鮮」、「核
問題」、「ヘリ墜落」、「泉佐野」になる。このように
して取り出したキーワード、およびキーワードどうしの
関連付けの表示例を図12に示す。図12においては3
つのキーワードの組合せで1つの話題を表している。な
お、キーワード、およびキーワードどうしの関連付けを
選択する際には、別の方法として単位内頻度と単位間共
有度の重み付け和の大きいもの順に所定数を検索する方
法も考えられる。重み付け和は、予め重み付けを表す定
数S,Tを定め、各キーワードごとに(単位内頻度×S+単
位間共有度×T)を算出する。
【0116】また、ステップc14において要約結果を取
り出す別の方法として、より話題を正確に取り出す方法
を以下に述べる。まず、単位間共有度の最も大きいキー
ワードを選択してAとし、キーワードAと関連付けられ
ているキーワードのうち、Aとのキーワードどうしの関
連付けの単位間共有度が最も大きいキーワードを選択し
てキーワードBとする。次に、選択されたキーワード
A、キーワードBの両方に関連付けられていて、それぞ
れのキーワードとのキーワードどうしの関連付けの単位
間共有度を合計した値が最も大きいキーワードを選択し
てCとする。そして、キーワードA、B、Cを組み合わ
せて1つ目の話題とする。2つ目の話題を取り出す際に
は、1つ目の話題を表すキーワードと、そのキーワード
を含むキーワードどうしの関連付けをキーワード頻度表
から消去し、その後に同じ処理を行う。また、選択の際
に単位間共有度が等しい複数のキーワード、あるいはキ
ーワードどうしの関連付けがある場合は、上述のように
単位間頻度やキーワードの長さなどを比べる。
【0117】例として(表12)から2つの話題を取り
出す際の処理について述べる。1つ目の話題を取り出す
際には、キーワードAとして「米朝高官協議」が選択さ
れ、このキーワードとのキーワードどうしの関連付けの
単位間共有度が最も大きい「北朝鮮」がキーワードBと
して選択される。さらに、これらのキーワードの両方と
関連付けられており、かつキーワードどうしの関連付け
の単位間共有度を合計した値が最も大きい「核問題」が
キーワードCとして選択される。2つ目の話題を取り出
す際には、1つ目の話題に用いたキーワード「米朝高官
協議」、「北朝鮮」、「核問題」と、これらのキーワー
ドを含むキーワードどうしの関連付けをキーワード頻度
表から消去した後に同様の方法でキーワードA,B,C
を選択する。(表12)からは、2つ目の話題を表すキ
ーワードとして「朝日新聞社」、「ヘリ墜落」、「泉佐
野」が選択される。
【0118】次に、第3の発明の実施の一形態を他の例
題に当てはめた場合の処理について説明する。ここで説
明する例題は、入力部1から入力されるデータが英語で
記述されたものである。例えば、第1の発明の実施の一
形態において説明したのと同様に図37のデータ例を考
える。英語のデータ例に対して処理を行う場合について
日本語と異なる部分について特に詳しく説明する。フロ
ーチャートは、日本語の場合と同じく図11のようにな
る。
【0119】ステップc1〜ステップc2では、日本語に対
する処理と同様である。
【0120】ステップc3での日本語に対する処理との相
違点については、第1の発明の実施の一形態のステップ
a3を英語の例題に当てはめた際に説明したのと同じであ
る。
【0121】ステップc4〜ステップc14では、日本語に
対する処理と同様である。ステップc5で得られるカウン
ト表の例を(表13)に示す。
【0122】
【表13】
【0123】また、キーワード頻度表の例を(表14)
に示す。このようなキーワード頻度表から、ステップc1
4において、まず単位間共有度が最も大きいキーワード
を選択してAとし、キーワードAと関連付けられている
キーワードのうち、キーワードAとのキーワードどうし
の関連付けの単位間共有度が最も大きいものを1つ選択
してキーワードBとする。次に、選択されたキーワード
A、キーワードBの両方に関連付けられていて、それぞ
れのキーワードとのキーワードどうしの関連付けの単位
間共有度を合計した値が最大のキーワードを選択してC
とする。そして、キーワードA,B,Cを組み合わせて
1つの話題として出力する。ただし、このようなキーワ
ードの組合せで表される話題を複数個取り出しても構わ
ない。たとえば、(表14)で具体的に値が記述されて
いる部分のみからこのような話題を2個取り出すと、
{marathon,Rosa Mota,Portugal}、{Olympic,Gelindo
Bordin,Italy}が得られる。2個取り出す場合、1個
目の話題を表すキーワードと、そのキーワードを含むキ
ーワードどうしの関連付けをキーワード頻度表から消去
した後に、2個目の話題を同様の処理で取り出す。出力
結果としては図39に示すような結果が得られる。
【0124】
【表14】
【0125】なお、本実施の一形態では同一単位中の同
一段落で説明したが、段落の代わりに文単位など他の決
め方による範囲でも構わない。
【0126】なお、本発明ではキーワードの単位内頻
度、単位間共有度の両方を算出し、要約結果として表示
するキーワードを選択したが、単位間共有度のみを用い
て選択する方法も考えられる。これは、キーワードが同
一単位内で繰り返し出現するのは、単なる言い替えであ
ったり表現上の理由である場合があり、単位内頻度はキ
ーワードとしての重要性よりも表現上の理由で大きくな
る場合があるからである。このため、処理の簡素化を優
先して単位内頻度を算出しないで単位間共有度のみで処
理を行う方法も必要である。
【0127】また、文書の要約結果としてキーワードを
表示する際には、キーワードの組合せによって意味内容
が伝わる場合が多く、個々のキーワードの重要性を処理
するよりもキーワードどうしの関連付けの重要性のみを
扱った方が要約方法としても簡素化され、実際の装置と
して実現する際に有用になる場合がある。以下、この方
法について説明する。
【0128】まず、ステップc5においてキーワードに対
する処理を行わずにキーワードどうしの関連付けに対す
る処理のみを行う。また、出現頻度に関する処理も行わ
ない。すなわち、キーワードについてはスタックに記憶
せずに、キーワードどうしの関連付けのみをスタックに
記憶する。その際には、出現頻度に関する処理を行わな
いために、カウント表の形式は(表9)の「出現頻度」
の項目を取り除いた形式になる。すなわち、項目「キー
ワード、あるいは関連付け」のみからなり、この項目に
はキーワードどうしの関連付けのみが項目値として入る
表になる。ただし、同一のキーワードどうしの関連付け
は一つにまとめる。カウント表の例を(表15)に示
す。
【0129】
【表15】
【0130】また、ステップc8〜ステップc10は不要に
なり、ステップc7では判定処理を行わずにステップc11
へ常に進む。ステップc12、ステップc13では、ステップ
c6で取り出したデータに項目「出現頻度」が無く、この
項目値を用いて行う単位内頻度に対する処理は行わな
い。このような処理により、たとえば(表16)に示す
ように(表12)のキーワード頻度表のうち、キーワー
ドどうしの関連付けのみからなり、かつ項目「単位内頻
度」のないキーワード頻度表が得られる。
【0131】
【表16】
【0132】さらに、ステップc14においてはキーワー
ド頻度表のキーワードどうしの関連付けの中から単位間
共有度の最も大きいものを取り出す。たとえば、(表1
6)からは、((米朝高官協議,北朝鮮),3)が取り
出される。次に、取り出されたキーワードどうしの関連
付けを構成する2つのキーワードA,Bそれぞれについ
て、Aと関連付けられて、かつBとも関連付けられてい
るキーワードのうちAとの関連付け、Bとの関連付けの
単位間共有度の和が最も大きいキーワードを選択する。
たとえば、(表16)のキーワード頻度表を考えれば、
キーワードA,Bは「米朝高官協議」、「北朝鮮」であ
り、これらと関連付けられており、かつその関連付けの
単位間共有度の和が最大になるのは「核問題」である。
したがって、キーワード「核問題」が選択される。キー
ワードA,Bと、この選択の結果得られたキーワードと
を組み合わせて1つの話題として得る。また、さらに別
の話題を情報要約として得る際には、キーワード頻度表
から既に選ばれたキーワードを含むキーワードどうしの
関連付けを消去し、残ったキーワードどうしの関連付け
の中から同様の処理で3つのキーワードを選択する。た
とえば、上記の例では、{「米朝高官協議」、「北朝
鮮」、「核問題」}が選択された後、これらのキーワー
ドを含むキーワードどうしの関連付けが消去され、次に
単位間共有度の大きいキーワードどうしの関連付けとし
て((朝日新聞社,ヘリ墜落),2)が取り出される。
この場合、キーワードA,Bは、「朝日新聞社」、「ヘ
リ墜落」になり、これらと関連付けられていて、そのキ
ーワードどうしの関連付けの単位間共有度の和が最大に
なるのは「泉佐野」であり、このキーワードが選択され
る。この結果、(表16)からは、情報要約として
{「米朝高官協議」、「北朝鮮」、「核問題」}と
{「朝日新聞社」、「ヘリ墜落」、「泉佐野」}が取り
出され、図12のような出力結果が得られる。
【0133】また、このように単位間共有度のみを用い
る方法を英語の例題に適用した場合については、上述の
ような日本語処理との相違点があるのみで、適用できる
ことは言うまでもない。
【0134】次に、第4の発明にかかる実施の一形態を
図面を参照しながら説明する。
【0135】第4の発明の実施の一形態としてキーワー
ド間の関連を考慮した情報要約付き文字放送受信装置を
示す。図13は、第4の発明の実施の一形態のシステム
構成図である。図13には第2の発明の実施の一形態の
一構成例と同一の構成部分があるので、同一構成部分に
対しては同一番号を付して詳細な説明は省略する。図1
3において、41は文字放送キーワード切り出し部23
で抽出したキーワードに対して同一番組中の同一段落か
ら得られたキーワードどうしを関連付ける文字放送キー
ワード関連付け部、42はより多くの番組にまたがって
現れているキーワード、およびキーワードどうしの関連
付けほど点数が高くなるようにキーワード、およびキー
ワードどうしの関連付けごとに点数を算出する文字放送
関連付け点数算出部、43は文字放送関連付け点数算出
部で算出した点数に基づいてキーワード、およびキーワ
ードどうしの関連付けを選択し、表示部26に表示する
文字放送関連付け要約部である。
【0136】以上のように構成されたシステムが実行さ
れるハードウェア構成は図8に示した第2の発明の実施
の一形態のハードウェア構成と同じである。したがっ
て、詳細な説明は省略する。
【0137】以上のように構成されたキーワード間の関
連を考慮した情報要約機能付き文字放送受信装置の動作
を図14のフローチャートを参照しながら説明する。
【0138】ステップd1〜ステップd3では、第2の発明
の実施の一形態のステップb1〜ステップb3と同様の処理
を行う。
【0139】ステップd4〜ステップd14では、第3の発
明の実施の一形態のステップc4〜ステップc14と同様の
処理を行う。ただし、ステップd4は文字放送キーワード
関連付部41において実行される。ステップd8〜ステッ
プd13は文字放送関連付点数算出部42において実行さ
れる。ステップd14は、文字放送関連付要約部43にお
いて実行される。
【0140】なお、本発明においても第3の発明と同様
に、単位間共有度のみを用いて選択する方法が考えられ
る。この方法については、ステップd4〜ステップd14が
ステップc4〜ステップc14と同様の処理を行うことから
第3の発明で説明したのと同様の変更で実現できるので
詳細な説明は省略する。また、第3の発明の実施の一形
態で説明したのと同様にキーワードどうしの関連付けの
みに対して処理を行う方法が考えられる。
【0141】次に、第5の発明にかかる実施の一形態を
図面を参照しながら説明する。
【0142】第5の発明の実施の一形態として情報要約
方法、および情報要約装置を示す。図16は、第5の発
明の実施の一形態のシステム構成図である。図16には
第1の発明の実施の一形態の一構成例と同一の構成部分
があるので、同一構成部分に対しては同一番号を付して
詳細な説明は省略する。図16において、第1の発明の
実施の一形態のシステム構成例と異なるのは、キーワー
ド切り出し部3で切り出したキーワード間の類似性を算
出する類似度付点数算出部51である。
【0143】以上のように構成されたシステムが実行さ
れるハードウェア構成は図2に示した第1の発明の実施
の一形態のハードウェア構成と同じである。
【0144】以上のように構成された情報要約方法、お
よび情報要約装置の動作を図17のフローチャートを参
照しながら説明する。
【0145】ステップe1〜ステップe3では、第1の発明
の実施の一形態のステップa1〜ステップa3と同様の処理
を行う。
【0146】ステップe4〜ステップe9は類似度付点数算
出部51で実行される。
【0147】ステップe4では、ステップe3で切り出した
キーワードに対して、類似度を考慮しながら出現頻度を
算出する。出現頻度の算出の際には、まず完全に一致す
るキーワードをまとめて頻度を抽出された個数にする。
たとえば、「国際平和維持軍」が4個切り出された場
合、キーワード「国際平和維持軍」を1つにまとめて出
現頻度を4にする。次に、同一ではない2つのキーワー
ドA,Bに対しては、文字と順序が一致している文字数
をキーワードA,Bの文字数の平均で割った値を類似度
として用いる。たとえば、「米朝高官会議」と「米朝高
官協議」であれば「米朝高官議」が一致しているために
文字と順序が一致している文字数は5文字になる。2つ
のキーワードの文字数の平均は6文字である。この結
果、2つのキーワードの類似度は、5/6=0.83
(小数点以下2桁まで)になる。さらに、2つのキーワ
ードA,Bの間で算出した類似度をSとして、Aの出現
頻度に(S×Bの出現頻度)を加え、Bの出現頻度に
(S×Aの出現頻度)を加える。たとえば、類似度によ
る出現頻度の加算を行う前の「米朝高官会議」の出現頻
度が3で、「米朝高官協議」の出現頻度が5であった場
合、類似度0.83を用いて「米朝高官会議」の出現頻
度は”3+5×0.83=7.15”になり、「米朝高
官協議」の出現頻度は”5+3×0.83=7.49”
になる。このようなキーワード間の類似度は、ステップ
e3で切り出されたキーワードすべての組み合わせに対し
て算出する。ただし、計算時間を少なくするために2つ
のキーワードで一致する文字数が5割以上のもののみに
対して類似度を算出するなどの方法も考えられる。この
ように、類似度に基づく出現頻度を算出するために、た
とえば以下の(表17)のように整数以外の出現頻度を
含むキーワードカウント結果を得る。
【0148】
【表17】
【0149】また、得られたキーワードカウント結果は
FILO(First In Last Out)のスタックに単位を識別する
識別子と組み合わせて記憶(プッシュ)する。第1の発
明の実施の一形態では、ステップa4において同一と見な
されるキーワードは1つにまとめられ、かつキーワード
の類似度を考えない。このため、後のステップa5〜ステ
ップa9でキーワード頻度表の単位内頻度、単位間共有度
を更新する際に、どの単位から抽出されたキーワードか
をスタックに記憶していなくても、同じ単位から抽出さ
れたキーワードどうしは同一と見なされることはない。
この結果、同じ単位から抽出されたキーワードどうし
が、ステップa7で同一と見なされてステップa8で単位間
共有度の更新処理を受けるといったことは生じない。こ
れに対し、本実施の一形態のように類似度を考慮してい
るのにもかかわらず、さらにスタックに抽出された単位
の識別子を記憶しなければ、キーワード頻度表を更新す
る際に同じ単位から抽出されたキーワードどうしも、他
の単位から抽出されたキーワードどうしも区別なく類似
度が算出される。この結果、別の単位から抽出されたキ
ーワードか同じ単位から抽出されたキーワードかの区別
ができなくなり、後述のステップe7における頻度修正処
理で別の単位に同様のキーワードが出現していることを
表す単位間共有度を算出することができなくなる。した
がって、第1の発明の実施の一形態と異なり、スタック
には単位を識別する識別子を組み合わせて記憶する。な
お、この識別子は他の単位と区別できればよいので、処
理の中でb1,b2,...などのように生成して割り当てれば
よい。
【0150】ステップe5では、第1の発明の実施の一形
態のステップa5と同様の処理を行う。ただし、ステップ
e5で取り出されるデータは、ステップa5と比較して、単
位識別子が組み合わされている点が異なる。
【0151】ステップe6では、ステップe5で取り出した
データの中の単位を識別する識別子と変数Bidの内容を
比較する。ただし、変数Bidの初期値としては、いずれ
の識別子とも等しくなると同時に、比較対象の値を持つ
ように設定する。たとえば、単位の識別子としては0よ
り大きい整数を割り当て、Bidの初期値を-1とし、この
ステップでの比較処理において、Bidが-1の時のみ、Bid
に比較対象の識別子をまず代入してから比較処理を行
う。比較の結果、等しい場合には、ステップe7へ進み、
それ以外の場合にはステップe11へ進む。
【0152】ステップe7では、第1の発明の実施の一形
態のステップa6と同様の処理を行う。
【0153】ステップe8では、第1の発明の実施の一形
態で示した(表2)のようなキーワード頻度表のキーワ
ードの項目に対して、まずステップe7で取り出したキー
ワードと類似度を算出する。また、類似度の算出の際に
は、後述のステップe9で同一のキーワードがキーワード
頻度表の中に存在するか否かを判定するために、フラグ
変数などを用いて同一のキーワード(類似度=1)が存
在した場合には、ステップe9で判定可能なようにする。
次に、類似度が0.5以上の場合に、キーワード頻度表
の単位内頻度と単位間共有度を更新する。単位内頻度、
単位間共有度の更新方法は、以下の方法で行う。ステッ
プe5で取り出したデータのキーワードの項目値をA,出
現頻度の項目の値をFとし、キーワード頻度表のキーワ
ードの項目値をB、単位内頻度をFi、単位間共有度を
Feとする。キーワードA,Bの類似度をSとした場合
に、キーワード頻度表の単位内頻度の値をFi+S×F
に、単位間共有度の値をFe+Sに更新する。たとえ
ば、ステップe5で取り出したデータが、(キーワード,
出現頻度)=(米朝高官会談,2.63)であり、以下
の(表18)のようなキーワード頻度表に対して更新処
理をする場合を考える。ただし、この例で用いている数
値は説明のために定めた仮のものであり実際のデータか
ら算出したものではない。
【0154】
【表18】
【0155】(表18)の中で、キーワード「米朝高官
会談」と類似度0.5以上のキーワードは、「米朝高官
協議」と「米朝高官会議」である。「米朝高官会談」と
「米朝高官協議」の類似度は0.67、「米朝高官会
談」と「米朝高官会議」の類似度は0.83である。
(小数点以下第3位を四捨五入)この結果、(表18)
のキーワード頻度表の(キーワード、単位内頻度、単位
間共有度)={(米朝高官協議、4.15,2.7
1),(米朝高官会議,3.34,2.68)}が
{(米朝高官協議、4.15+0.67×2.63,
2.71+0.67),(米朝高官会議,3.34+
0.83×2.63,2.68+0.83)に更新され
る。
【0156】なお、本実施の一形態ではキーワード頻度
表の中のキーワードのうち、ステップe5で取り出したデ
ータと0.5以上の類似度になるものに対してのみ更新
処理を施すことにしたが、他の基準でも構わない。類似
度0.5以上のものに対してのみ処理を施したのは、更
新処理の回数を少なくするためである。また、図17に
示すフローチャートを実行開始してから初めてステップ
e8を実行する際には、キーワード頻度表は空であり、こ
の場合ステップe8ではなにも行わずにステップe9へ進
む。
【0157】ステップe9では、ステップe8でキーワード
頻度表の更新処理をする中で、ステップe7で取り出した
キーワードと同一のキーワードがキーワード頻度表の中
に存在したか否かを判定し、存在した場合にはステップ
e5へ戻り、存在しなかった場合にはステップe10へ進
む。
【0158】ステップe10では、ステップe5で取り出し
たデータをスタックなどの記憶領域に一時的に記憶す
る。ただし、ステップe4で使用したものとは別のスタッ
クに記憶する。
【0159】ステップe11では、ステップe10でスタック
などの記憶領域に記憶したデータを一つずつ取り出して
キーワード頻度表に追加する。各データをキーワード頻
度表に追加する方法は、第1の発明の実施の一形態のス
テップa9と同様の処理で行う。また、このステップでは
データを取り出して記憶領域から消去する。このため、
このステップを実行し終わる度にステップe10でスタッ
クに記憶したデータは一度空になる。
【0160】ステップe12では、変数Bidにステップe5で
読み出したデータの単位を識別する識別子を代入する。
【0161】ステップe13では、ステップe11と同じ処理
を行う。
【0162】ステップe14では、キーワードの出現頻
度、単位内頻度、単位間共有度の値が整数ではなく、小
数点以下のある実数になっている点が異なるが、第1の
発明の実施の一形態のステップa10と同様の処理を行
う。
【0163】次に、第6の発明にかかる実施の一形態を
図面を参照しながら説明する。
【0164】第6の発明の実施の一形態として情報要約
付き文字放送受信装置を示す。図18は、第6の発明の
実施の一形態のシステム構成図である。図18には第2
の発明の実施の一形態の一構成例と同一の構成部分があ
るので、同一構成部分に対しては同一番号を付して詳細
な説明は省略する。図18において、61は文字放送キ
ーワード切り出し部23で切り出したキーワード間の類
似性を算出する文字放送類似度付点数算出部である。
【0165】以上のように構成されたシステムが実行さ
れるハードウェア構成は図8に示した第2の発明の実施
の一形態のハードウェア構成と同じである。したがっ
て、詳細な説明は省略する。
【0166】以上のように構成されたキーワード間の類
似性を考慮した情報要約機能付き文字放送受信装置の動
作を図19のフローチャートを参照しながら説明する。
【0167】ステップf1〜ステップf3では、第2の発明
の実施の一形態のステップb1〜ステップb3と同様の処理
を行う。
【0168】ステップf4〜ステップf13は、文字放送類
似度付点数算出部61で実行する。
【0169】ステップf4〜ステップf13は、第5の発明
の実施の一形態のステップe4〜ステップe13と同様の処
理を行う。ただし、キーワード頻度表の項目名は第2の
発明の実施の一形態と同様であり、第5の発明と比べて
単位内頻度に対して行った処理と同じ処理を番組内頻度
に対して行い、単位間共有度に対して行った処理と同じ
処理を番組間共有度に対して行う。
【0170】ステップf14では、キーワードの出現頻
度、単位内頻度、単位間共有度の値が整数ではなく、小
数点以下のある実数になっている点が異なるが、第2の
発明の実施の一形態のステップb10と同様の処理を行
う。
【0171】次に、第7の発明にかかる実施の一形態を
図面を参照しながら説明する。
【0172】第7の発明の実施の一形態としてキーワー
ドの類似度とキーワード間の関連付けの両方を考慮した
情報要約方法、および情報要約装置を示す。図20は、
第7の発明の実施の一形態のシステム構成図である。図
20には第3の発明の実施の一形態の一構成例と同一の
構成部分があるので、同一構成部分に対しては同一番号
を付して詳細な説明は省略する。図20において、71
はキーワード間の類似性をキーワードどうしの関連付け
を含む複数の要因に基づいて算出する類似度付関連付点
数算出部である。
【0173】以上のように構成されたシステムが実行さ
れるハードウェア構成は図2に示した第1の発明の実施
の一形態のハードウェア構成と同じである。したがっ
て、詳細な説明は省略する。
【0174】以上のように構成された情報要約方法、お
よび情報要約装置の動作を図21のフローチャートを参
照しながら説明する。
【0175】ステップg1〜ステップg3では、第5の発明
の実施の一形態のステップe1〜ステップe3と同様の処理
を行う。
【0176】ステップg4では、第3の発明の実施の一形
態のステップc4と同様の処理を行う。ただし、ステップ
c4では、2つのキーワードのうち片方が、もう一方の部
分になっている場合には同一と見なす処理を行ったが、
本実施の一形態では完全に一致するキーワード以外は同
一とは見なさない。なお、本実施の一形態においても、
2つのキーワードのうち片方がもう一方の部分になって
いるキーワードを同一と見なす処理を施しても構わな
い。
【0177】ステップg5では、ステップg3で切り出した
キーワードに対して、第5の発明の実施の一形態のステ
ップe4と同様の処理を行う。また、ステップg4で関連付
けられたキーワードの関連付けに対しては、完全に一致
する関連付けをまとめ、関連付けの出現頻度を抽出され
た個数にする。たとえば、(泉佐野、ヘリ墜落)が4個
切り出された場合、関連付け(泉佐野、ヘリ墜落)を1
つにまとめて出現頻度を4にする。また、得られたキー
ワード、および関連付けのカウント結果はFILO(First I
n Last Out)のスタックに単位を識別する識別子と組み
合わせて、キーワードから先に記憶(プッシュ)する。
単位を識別する識別子と組み合わせる方法、および理由
は第5の発明の実施の一形態のステップe4と同様であ
る。関連付けから先に記憶するのは、後述のステップg6
でこのスタックからデータを読み出す際に、関連付けを
先に取り出し、その後にキーワードを取り出し、キーワ
ードの類似性を算出する際に先に取り出した関連付けを
用いるためである。
【0178】なお、このステップにおいて同一ではない
キーワードを含む2つの関連付け(K1,K2)(L
1,L2)に対しても、関連付けどうしの類似度を算出
し、その類似度に基づいて出現頻度を加算してもよい。
関連付けどうしの類似度は、K1とL1の類似度、K2
とL2の類似度を第5の発明の実施の一形態のステップ
e4と同様の方法で算出し、この算出結果の平均値にす
る。また、K1とL2の類似度、K2とL1の類似度を
算出して平均した値の方が大きければ、その値を関連付
けどうしの類似度とする。たとえば、関連付け(米朝高
官会議、核問題)と(米朝高官協議、核問題討議)の類
似度は、「米朝高官会議」と「米朝高官協議」の類似度
0.83と「核問題」と「核問題討議」の類似度0.7
5の平均を求めて、(0.83+0.75)/2=0.
79(小数点3位以下四捨五入)になる。関連付けどう
しの類似度が算出されれば、あとはキーワードに対して
ステップe4で施した処理を関連付けに対しても行う。2
つの関連付けA,Bの間で算出した類似度をSとして、
Aの出現頻度に{S×(Bの出現頻度)}を加え、Bの
出現頻度に{S×(Aの出現頻度)}を加える。たとえ
ば、類似度を算出する前の関連付け(米朝高官会議、核
問題)の出現頻度が3で、(米朝高官協議、核問題討
議)の出現頻度が5であった場合、類似度0.79を用
いて(米朝高官会議、核問題)の出現頻度は”3+5×
0.79=6.95”になり、(米朝高官協議、核問題
討議)の出現頻度は”5+3×0.79=7.37”に
なる。このような関連付けの類似度は、ステップe3で切
り出されたキーワードすべての組み合わせに対して算出
する。ただし、計算時間を少なくするためにキーワード
で一致する文字数が5割以上のもののみに対して類似度
を算出するなどの方法も考えられる。
【0179】ステップg6〜ステップg8では、第5の発明
の実施の一形態のステップe5〜ステップe7と同様の処理
を行う。ただし、第5の発明ではキーワードに対して行
っていた処理を関連付けに対しても行う点が異なる。
【0180】ステップg9では、ステップg6で取り出した
データがキーワードである場合と、関連付けである場合
で処理が異なる。取り出したデータが関連付けである場
合、第5の発明の実施の一形態のステップe8と同様の処
理を行う。ただし、ステップe8では、キーワード間での
類似度を算出して単位内頻度と単位間共有度を算出した
のに対し、このステップでは関連付けどうしの類似度を
算出し、関連付けの単位内頻度と単位間共有度を算出、
更新する。関連付けどうしの類似度はステップg5の説明
の中で述べた通りである。
【0181】ステップg6で取り出したデータがキーワー
ドである場合、キーワードの類似度のみでなく、キーワ
ードと関連付けされているキーワードの類似度も考慮し
たマクロ類似度を用いて単位間共有度を算出、更新す
る。単位内頻度については、第5の発明の実施の一形態
のステップe8と同様の方法で更新する。すなわち、キー
ワード間の類似度に基づいて更新する。単位間共有度に
ついては、まずステップg6で取り出したキーワードを含
む関連付けをステップg11で記憶されたデータから取り
出して集合Iとする。次に、キーワード頻度表のキーワ
ードに対し、そのキーワードを含む関連付けの集合Jを
キーワード頻度表から取り出す。たとえば、以下の(表
19)に示すキーワード頻度表を想定する。
【0182】
【表19】
【0183】ステップg6で取り出されたデータのキーワ
ードが「調印式典」であるとする。このデータが取り出
される前に、ステップg11で記憶されたデータが以下の
(表20)であると想定する。
【0184】
【表20】
【0185】集合Iは、{((米朝高官会談,調印式
典),F1,Bid1),((核問題,調印式典),F2,
Bid1)}である。
【0186】取り出されたキーワードとキーワード頻度
表内のキーワードとの類似度の算出と頻度の更新処理
は、キーワード頻度表内の各キーワードに対して順に行
う。このため、ここではキーワード頻度表内の「調印
式」との間での類似度計算について述べる。集合Jは
{((核問題,調印式),Fi4,Fe4),((調印
式、米朝高官協議),Fi5,Fe5)}になる。
【0187】集合I,Jが求められると、2つの集合の
間で、類似度計算の対象となっているキーワードと関連
付けられたキーワードを取り出し、それらのキーワード
間で類似度を算出する。ただし、キーワードの集合どう
しであるために、集合Iから一つずつキーワードを取り
出し、取り出したキーワードと集合Jの全てのキーワー
ドとの間で順に類似度を算出し、最大の類似度を集合I
から取り出したキーワードに対する類似度とする。この
ようにして、集合Iに属する各キーワードに対する類似
度を求め、その平均を集合Iと集合Jの集合類似度Kと
する。たとえば、上記の例では集合Iからは{米朝高官
会談、核問題}、集合Jからは{核問題,米朝高官協
議}が取り出されて、集合Iの「米朝高官会談」に対し
て集合Jの「米朝高官協議」が最大の類似度となり、類
似度は0.67、「核問題」に対しては集合Jの「核問
題」が最大の類似度となり、その類似度は1.0であ
る。これらの類似度の平均を求めると0.84になる。
(小数点以下第3位を四捨五入)したがって、集合Iと
集合Jの集合類似度Kは0.84である。この集合類似
度Kと、キーワード「調印式」と「調印式典」の類似度
S=0.86との、重み付き和をキーワード間のマクロ
類似度とする。
【0188】重みは、あらかじめ定めた定数X,Yであ
り、マクロ類似度は”X×K+Y×S”になる。マクロ
類似度が求められれば、あとは第5の発明の実施の一形
態のステップe8と同様の処理でキーワード頻度表内の単
位内頻度と単位間共有度を更新する。ただし、ステップ
e8と比べて、キーワードの類似度の代わりにマクロ類似
度を用いる。これにより、よく似たキーワードが別の話
題で扱われている場合に、マクロ類似度が低くなり、同
じ話題で扱われている場合に、マクロ類似度が大きくな
る。たとえば、ステップg6で取り出されたキーワードが
同じ「調印式典」であっても、キーワード頻度表内の比
較対象が「仮調印式」である場合、集合Jが{ヨルダ
ン,イスラエル}になる。この結果、「調印式典」と
「仮調印式」の類似度は0.75と高いが、集合Iと集
合Jの類似度は0になり、「調印式典」と「仮調印式」
のマクロ類似度は小さな値になる。これにより、同じ調
印式に関することであっても、別の話題の調印式であ
り、マクロ類似度がそのことを表している。
【0189】なお、本実施の一形態では集合I、Jに含
まれるキーワードの出現頻度、単位内頻度、単位間共有
度を使わずに集合類似度Kを算出したが、算出の際にこ
れらの値を含めても構わない。これらの値を含めれば算
出方法が複雑になるが、キーワード間の関連付けの強さ
(どれだけ多くの回数関連付けられているか)を考慮し
た上でマクロ類似度を算出することができる。
【0190】ステップg10〜ステップg14では、第5の発
明の実施の一形態のステップe9〜ステップe13と同様の
処理を行う。ただし、第5の発明ではキーワードに対し
て行っていた処理を関連付けに対しても行う点が異な
る。
【0191】ステップg15では、キーワード、および関
連付けの出現頻度、単位内頻度、単位間共有度の値が整
数ではなく、小数点以下のある実数になっている点が異
なるが、第3の発明の実施の一形態のステップc14と同
様の処理を行う。
【0192】なお、本発明においても第3、第4の発明
と同様に、キーワードどうしの関連付けのみを用いた
り、単位間共有度のみを用いる方法が考えられる。特
に、キーワードを用いないでキーワードどうしの関連付
けのみで、かつ単位内頻度を用いないで単位間共有度の
みを用いる方法について本発明の上記実施の一形態で説
明したステップのうち異なる部分についてのみ説明す
る。
【0193】まず、ステップg5においてキーワードに対
する処理を行わずにキーワードどうしの関連付けに対す
る処理のみを行う。また、関連付けどうしに対する処理
のうち、類似度の算出処理、出現頻度に関する処理も行
わない。すなわち、キーワードについてはスタックに記
憶せずに、キーワードどうしの関連付けのみをスタック
に記憶する。その際には、出現頻度に関する処理を行わ
ないために、カウント表の形式は第3の発明で説明した
(表15)のような形式になる。
【0194】また、ステップg6、ステップg8では、ステ
ップg6で取り出されるデータにはキーワードはなく、キ
ーワードどうしの関連付けに関するデータのみになる点
が異なるが基本的な処理内容は変わらない。
【0195】ステップg9では、ステップg6で取り出され
るデータがキーワードどうしの関連付けのみになること
から、ステップg6で取り出されたデータがキーワードで
ある場合に行っていた処理は不要になる。このため、キ
ーワードどうしの関連付けに対して行っていた処理のみ
を行う。この結果、キーワード間の類似度の算出に用い
ていたマクロ類似度の算出処理も不要になる。また、第
3の発明の実施の一形態において説明したのと同様に、
単位間共有度のみを用いて要約を行うために、キーワー
ド頻度表は(表16)の形式になり、ステップg9での処
理においては、単位間共有度に対する処理のみを行い、
単位内頻度に対する処理は省略する。
【0196】ステップg15においては単位間共有度の値
が実数になっている点が異なるが第3の発明の実施の一
形態で説明した(表16)に対する処理と同様にしてキ
ーワードを選択することが出来る。
【0197】次に、第8の発明にかかる実施の一形態を
図面を参照しながら説明する。
【0198】第8の発明の実施の一形態として情報要約
付き文字放送受信装置を示す。図22は、第8の発明の
実施の一形態のシステム構成図である。図22には第4
の発明の実施の一形態の一構成例と同一の構成部分があ
るので、同一構成部分に対しては同一番号を付して詳細
な説明は省略する。図22において、81は文字放送キ
ーワード切り出し部23で切り出したキーワードに対し
て類似性を考慮して点数を算出する文字放送類似度付関
連付け点数算出部である。
【0199】以上のように構成されたシステムが実行さ
れるハードウェア構成は図8に示した第2の発明の実施
の一形態のハードウェア構成と同じである。したがっ
て、詳細な説明は省略する。
【0200】以上のように構成されたキーワード間の類
似性を考慮した情報要約機能付き文字放送受信装置の動
作を図23のフローチャートを参照しながら説明する。
【0201】ステップh1〜ステップh2では、第2の発明
の実施の一形態のステップb1〜ステップb2と同様の処理
を行う。
【0202】ステップh3〜ステップh14は、文字放送類
似度付関連付け点数算出部81で実行する。
【0203】ステップh3〜ステップh14は、第7の発明
の実施の一形態のステップg3〜ステップg14と同様の処
理を行う。ただし、キーワード頻度表の項目名が異な
り、単位内頻度が番組内頻度に、単位間共有度が番組間
共有度になっている。内容的には同じであり、単位内頻
度に対して行った処理と同じ処理を番組内頻度に対して
行い、単位間共有度に対して行った処理と同じ処理を番
組間共有度に対して行う。 ステップh15では、第7の
発明の実施の一形態のステップg15と同様の処理を行
う。ただし、出力部2に出力する代わりに表示部26に
出力する。
【0204】なお、本発明においても第7の発明と同様
に、単位間共有度のみを用いて選択する方法、キーワー
ドどうしの関連付けのみを用いる方法が考えられる。こ
の方法は、基本的に第7の発明のなお書きの部分で説明
したものと同じ処理で実現できるために、詳細な説明は
省略する。
【0205】次に、第9の発明にかかる実施の一形態を
図面を参照しながら説明する。
【0206】第9の発明の実施の一形態としてキーワー
ドとして用いることのできない例外のキーワードを考慮
した情報要約方法、および情報要約装置を示す。図24
は、第9の発明の実施の一形態のシステム構成図であ
る。図24には第1の発明の実施の一形態の一構成例と
同一の構成部分があるので、同一構成部分に対しては同
一番号を付して詳細な説明は省略する。図24におい
て、91はキーワードとして処理しないキーワードを記
憶しておく例外キーワード記憶部である。92は、例外
キーワード記憶部91に記憶されているキーワードに基
づいてキーワードを抽出する例外付キーワード切り出し
部である。
【0207】以上のように構成されたシステムが実行さ
れるハードウェア構成は図25に示す。図25に示した
ハードウェア構成の各部分は第1の発明の実施の一形態
のハードウェア構成の部分と図24に示したシステム構
成の構成部分からなるので、同一構成部分に同一番号を
付して詳細な説明は省略する。
【0208】以上のように構成された情報要約方法、お
よび情報要約装置の動作を表すフローチャートは、図3
に示した第1の発明の実施の一形態の動作を表すフロー
チャートのステップa3とステップa4の間に図26のフロ
ーチャートに示すステップを挿入したものである。した
がって、図26に示すステップについてのみ説明する。
また、ステップa3は例外付キーワード切り出し部92で
実行される。
【0209】ステップi1は、ステップが実行される度に
ステップa3で切り出したキーワードを一つずつ順に読み
出す。このステップが何回も呼び出されると、ステップ
a3で切り出したキーワードを順にすべて読み出してしま
い、読み出すべきキーワードが無くなった時点で図26
のフローチャートの"END"の方へ進む。このステップで
は、順に読み出すだけで、読み出されたデータはこのス
テップによって消去されない。ステップi1は、例外付キ
ーワード切り出し部92で実行される。
【0210】ステップi2は、例外キーワード記憶部91
に記憶されているキーワードからキーワード1つを読み
出す。例外キーワード記憶部91には、以下の(表2
1)に示すように、キーワードとして処理しないキーワ
ードが予め記憶されている。
【0211】
【表21】
【0212】例外キーワード記憶部91からのキーワー
ドの読み出しは、このステップが実行される度に次のキ
ーワードへと順に進める。たとえば、初めてこのステッ
プが実行されたときには(表21)からは、"a"が読み
出され、次に実行されたときには"the"が読み出され
る。このように、順に読み出していくと実行が繰り返さ
れるうちに読み出すべきデータが無くなる。その場合に
は、図26のフローチャート内の"END"で示される方へ
進む。
【0213】ステップi3は、ステップi1で読み出したキ
ーワードとステップi2で読み出したキーワードを比較す
る。比較の結果、等しい場合にはステップi4へ進み、そ
の他の場合にはステップi2へ戻る。
【0214】ステップi4は、ステップa3で切り出したキ
ーワードの中からステップi1で読み出したキーワードを
消去する。これにより、ステップa4以降では消去された
キーワードは処理対象にならない。
【0215】次に、第9の発明の第2の実施の一形態と
して、図10に示す第3の発明の実施の一形態のシステ
ム構成のうち、キーワード切り出し部3を図29に示す
構成で置き換えたシステム構成のものがある。入力部1
が図29の端点1に接続され、図29の端点2がキーワ
ード関連付部31に接続される。この実施の一形態にお
ける動作は、図11に示すフローチャートのステップc3
とステップc4の間に図26のステップを挿入したもので
あり、各ステップはすでに説明済みなので詳細な説明は
省略する。また、ハードウェア構成は図25に示す第1
の実施の一形態のハードウェア構成と同じである。
【0216】次に、第9の発明の第3の実施の一形態と
して、図16に示す第5の発明の実施の一形態のシステ
ム構成のうち、キーワード切り出し部3を図29に示す
構成で置き換えたシステム構成のものがある。入力部1
が図29の端点1に接続され、図29の端点2が類似度
付点数算出部51に接続される。この実施の一形態にお
ける動作は、図17に示すフローチャートのステップe3
とステップe4の間に図26のステップを挿入したもので
あり、各ステップはすでに説明済みなので詳細な説明は
省略する。また、ハードウェア構成は図25に示す第1
の実施の一形態のハードウェア構成と同じである。
【0217】次に、第9の発明の第4の実施の一形態と
して、図20に示す第7の発明の実施の一形態のシステ
ム構成のうち、キーワード切り出し部3を図29に示す
構成で置き換えたシステム構成のものがある。入力部1
が図29の端点1に接続され、図29の端点2がキーワ
ード関連付け部31に接続される。この実施の一形態に
おける動作は、図21に示すフローチャートのステップ
g3とステップg4の間に図26のステップを挿入したもの
であり、各ステップはすでに説明済みなので詳細な説明
は省略する。また、ハードウェア構成は図25に示す第
1の実施の一形態のハードウェア構成と同じである。
【0218】次に、第10の発明にかかる実施の一形態
を図面を参照しながら説明する。
【0219】第10の発明の実施の一形態としてキーワ
ードとして用いることのできない例外のキーワードを考
慮した文字放送受信装置を示す。図27は、第10の発
明の実施の一形態のシステム構成図である。図27には
第2の発明の実施の一形態の一構成例と、第9の発明の
実施の一形態と同一の構成部分があるので、同一構成部
分に対しては同一番号を付して詳細な説明は省略する。
図27において、101は文字放送として受信した番組
に対して、例外キーワード記憶部91に記憶されている
キーワードに基づいてキーワードを抽出する例外付文字
放送キーワード切り出し部である。
【0220】以上のように構成されたシステムが実行さ
れるハードウェア構成は図28に示す。図28に示した
ハードウェア構成の各部分は第2の発明の実施の一形態
のハードウェア構成の部分と図27に示したシステム構
成の構成部分からなるので、同一構成部分に同一番号を
付して詳細な説明は省略する。
【0221】以上のように構成された情報要約方法、お
よび情報要約装置の動作を表すフローチャートは、図9
に示した第2の発明の実施の一形態の動作を表すフロー
チャートのステップb3とステップb4の間に図26のフロ
ーチャートに示すステップを挿入したものである。した
がって、すべてのステップについて説明済みであり詳細
な説明は省略する。ただし、ステップb3、ステップi1〜
ステップi4は例外付文字放送キーワード切り出し部10
1で実行される。
【0222】次に、第10の発明の第2の実施の一形態
として、図13に示す第4の発明の実施の一形態のシス
テム構成のうち、文字放送キーワード切り出し部23を
図30に示す構成で置き換えたシステム構成のものがあ
る。文字放送受信部21が図30の端点1に接続され、
図30の端点2が文字放送キーワード関連付け部41に
接続される。この実施の一形態における動作は、図14
に示すフローチャートのステップd3とステップd4の間に
図26のステップを挿入したものであり、各ステップは
すでに説明済みなので詳細な説明は省略する。また、ハ
ードウェア構成は図28に示す第1の実施の一形態のハ
ードウェア構成と同じである。
【0223】次に、第10の発明の第3の実施の一形態
として、図18に示す第6の発明の実施の一形態のシス
テム構成のうち、文字放送キーワード切り出し部23を
図30に示す構成で置き換えたシステム構成のものがあ
る。文字放送受信部21が図30の端点1に接続され、
図30の端点2が文字放送類似度付点数算出部61に接
続される。この実施の一形態における動作は、図19に
示すフローチャートのステップf3とステップf4の間に図
26のステップを挿入したものであり、各ステップはす
でに説明済みなので詳細な説明は省略する。また、ハー
ドウェア構成は図28に示す第1の実施の一形態のハー
ドウェア構成と同じである。
【0224】次に、第10の発明の第4の実施の一形態
として、図22に示す第8の発明の実施の一形態のシス
テム構成のうち、文字放送キーワード切り出し部23を
図30に示す構成で置き換えたシステム構成のものがあ
る。文字放送受信部21が図30の端点1に接続され、
図30の端点2が文字放送キーワード関連付け部41に
接続される。この実施の一形態における動作は、図23
に示すフローチャートのステップh3とステップh4の間に
図26のステップを挿入したものであり、各ステップは
すでに説明済みなので詳細な説明は省略する。また、ハ
ードウェア構成は図28に示す第1の実施の一形態のハ
ードウェア構成と同じである。
【0225】なお、第1の発明、第3の発明、第5の発
明、第7の発明、第9の発明のいずれの発明も、オーデ
ィオ装置、電子メール装置、パーソナルコンピュータへ
の適用が考えられる。オーディオ装置への適用において
は、ラジオの文字放送を対象としたものであり、単位と
しては放送局ごとの放送内容になる。また、段落は放送
内容の中の固まりであり、たとえばニュース放送では記
事の切れ目が段落の切れ目になる。オーディオ装置の中
には、たとえば車載用オーディオがあり音楽を聴きなが
ら文字放送で提供されるニュース情報の要約のみを見る
といった使い方ができる。従来のオーディオの場合、ニ
ュースを知りたければ音楽番組などを諦めてニュース番
組を聴かなければならなかったのに対し、音楽番組も、
またニュースについても同時に知ることができる。さら
に、オーディオ機器はテレビに比べて大画面を備えるこ
とが困難であり、文字放送として送られてくるニュース
は短い文章で構成されているものの、ニュースの数が多
ければ何ページものニュース番組になる。この結果、要
約してキーワードの組み合わせといった簡潔な形式で表
示することによる効果は非常に大きい。
【0226】電子メールでは、多数の人が文書を投稿す
る伝言板のような機能があり、電子メール装置に適用す
る場合には、単位としては利用者ごとの文書になる。ま
た、段落としては、文書の中の段落を考えてもよいが、
1文書1段落ととらえることもできる。現在でも、イン
ターネットにおいてニュースグループとして特定分野の
研究者が互いの情報交換を行っているなど、伝言板的に
電子メールを利用することは、電子メールの利点の一つ
である。このような、ニュースグループの情報に対し
て、本発明を適用することにより、特定の分野でどのよ
うな話題が注目されているのかがキーワードの組み合わ
せといった簡単な形式でわかる。今後、パソコン通信な
どで電子メール機能が普及すれば、このようなニュース
グループの利用者数と比べて爆発的に人数が増え、ニュ
ースグループのような伝言板的機能へのメールの投稿量
が増加する。その結果、すべての情報にいちいち目を通
すだけで長時間を費やさなければならなくなり、本発明
の要約機能は極めて効果的に働く。
【0227】パーソナルコンピュータへ適用した場合、
ワープロなどで作成した文書が1単位になる。また、段
落としては、文書の中の段落を考えてもよいが、1文書
1段落ととらえることもできる。また、パーソナルコン
ピュータに文字放送受信機能を備えることも可能であ
り、その場合には第2の発明、第4の発明、第6の発
明、第8の発明と同様に考えることができる。ワープロ
で作成した文書の中には、たとえば学会の論文集をテキ
スト情報として蓄えたものが考えられる。このような、
テキスト情報に対して、本発明を適用すれば、学会での
主な話題をキーワードの組み合わせといった簡潔な表現
で把握するする事ができる。また、特許情報などが提供
されており、本発明を適用すれば時代と共に特許として
どのようなものが多数出願されているかが簡単に把握で
きる。
【0228】なお、第1、3、5または7の発明の実施
の他の形態として、更に、次に示すような、例が考えら
れる。
【0229】即ち、利用者が表示させたいと希望するデ
ータを指定出来るデータ指定手段を新たに設ける。入力
手段から入力されて、キーワードを抽出するのに利用し
たデータを、一旦、作業領域に記憶しておく。
【0230】上述した内容と同様にして、出力手段に情
報要約を出力した後に、データ指定手段からの入力を受
け付け、この入力に基づいて作業領域に記憶しておいた
データを検索し、その検索されたデータを利用者に表示
することも考えられる。
【0231】この場合のシステム構成のうち新たに設け
る部分を図31に示す。図31において、111は、利
用者から、利用者が表示させたいと希望するデータを指
定するための指定入力を受け付けるデータ指定手段であ
る。即ち、利用者は、出力部2に表示された情報要約を
見て、その中から、更に詳しい内容を表示させたいと思
ったキーワードを、データ指定手段111を用いて指定
する。112は、データ記憶部である。113は、利用
者からの上記指定入力に基づいて、作業領域としてのデ
ータ記憶部112に一旦記憶されたデータを、検索する
検索部である。114は、検索部113で検索したデー
タを出力するデータ提示部である。
【0232】この構成図で示される情報要約方法、およ
び情報要約装置の実行されるハードウェア構成は、基本
的に第1、3、5または7の発明の実施の一形態におい
て示したハードウェア構成にデータ指定手段が付加され
たものである。また、フローチャートは、基本的に第
1、3、5または7の発明の実施の一形態において示し
たフローチャートに、それぞれステップa1、ステップc
1、ステップe1、ステップg1のデータ入力処理の後に主
記憶装置12の作業領域上にデータを記憶するデータ記
憶処理を加え、さらにそれぞれステップa10、ステップc
14、ステップe14、ステップg15で示される要約出力処理
の後に、データ指定手段111からの指定入力を受け付
ける処理、受け付けた指定入力に基づいてデータを検索
する処理、検索結果を表示する処理を加えたものであ
る。
【0233】データ記憶処理は、作業領域上に入力デー
タをそのままの形式で記憶する。指定入力を受け付ける
処理は、図6や図12に示したような出力に対して、マ
ウス、十字キー、数字ボタンなどを用いて利用者がキー
ワードを選択するのを受け付ける。これらの選択の方法
は、従来より用いられ得ている一般的な方法で構わな
い。受け付けた指定入力に基づいてデータを検索する処
理は、利用者が選択したキーワードを含むデータの部分
をデータ記憶処理で記憶したデータから検索する。この
時、利用者が選択したキーワードを含む段落、行、前後
5行など予め定めた量のデータ部分を検索結果として取
り出す。処理結果を表示する処理は、検索されたデータ
部分を出力部2に表示する。たとえば、利用者がキーワ
ード「朝日新聞社」を選択した場合、図5に示したデー
タ例の中からは、単位1の第1段落、単位3の第2段
落、が検索されて出力される。ただし、図5の各単位は
空白行で段落が分かれているものとする。
【0234】また、このようなデータ表示機能は、第9
の発明とも組み合わせることが出来る。
【0235】なお、第2、4、6または8の発明の実施
の他の形態として、更に、次に示すような、例が考えら
れる。
【0236】即ち、利用者が表示させたいと希望するデ
ータを指定出来るデータ指定手段を新たに設ける。文字
放送受信手段から受信して、キーワードを抽出するのに
利用したデータを、一旦、作業領域に記憶しておく。
【0237】上述した内容と同様にして、表示手段に情
報要約を表示した後に、データ指定手段からの入力を受
け付け、この入力に基づいて作業領域に記憶しておいた
データを検索し、その検索されたデータを利用者に表示
することも考えられる。
【0238】この場合のシステム構成のうち新たに設け
る部分を図32に示す。図32の構成部分は、図31の
構成部分と同一構成部分からなるので、その部分に同一
番号を付して説明は省略する。この構成図で示される文
字放送受信装置の実行されるハードウェア構成は、基本
的に第2、4、6または8の発明の実施の一形態におい
て示したハードウェア構成にデータ指定手段が付加され
たものである。また、フローチャートは、基本的に第
2、4、6または8の発明の実施の一形態において示し
たフローチャートに、それぞれステップb2、ステップd
2、ステップf2、ステップh2の番組受信処理の後に主記
憶装置12の作業領域上に受信した番組のデータを記憶
するデータ記憶処理を加え、さらにそれぞれステップb1
0、ステップd14、ステップf14、ステップg15で示される
要約出力処理の後に、データ指定手段111からの指定
入力を受け付ける処理、受け付けた指定入力に基づいて
データを検索する処理、検索結果を表示する処理を加え
たものである。各処理については、上述の第1、3、5
または7の発明とデータ表示機能を組み合わせた場合と
同じであり、説明を省略する。
【0239】また、このようなデータ表示機能は、第1
0の発明とも組み合わせることが出来る。
【0240】なお、第1、3、5または7の発明の実施
の他の形態として、更に、次に示すような、例が考えら
れる。
【0241】即ち、利用者が興味をもっているデータ内
容を、キーワードを用いて指定出来るデータ指定手段を
新たに設ける。
【0242】上述した内容と同様にして、出力手段に要
約結果を出力した後に、このデータ指定手段からキーワ
ードの指定入力を受け付け、このキーワードの指定入力
があり、かつ入力部1から再びデータの入力があった場
合に、前記指定入力されたキーワードが入力データ中に
存在するか否かを検索し、検索の結果前記指定入力され
たキーワードが含まれている場合に出力部2に前記キー
ワードを含むデータの全部又は一部を表示することが考
えられる。あるいは、表示内容としては、データ内容そ
のものではなく、前記キーワードを含むデータが存在し
たことを知らせるメッセージを表示することも考えられ
る。これらデータ内容あるいは、メッセージの表示は、
上述のようにキーワードの指定入力があり、かつ入力部
1から再びデータの入力があった場合、更に、その入力
されたデータ内容が、以前に入力された内容から更新さ
れているか否かを判定して、更新されている場合のみ、
行なうものである。
【0243】尚、利用者がデータ指定手段111を用い
て指定するキーワードは、出力部2に表示された情報要
約の中から、指定してもよいし、あるいは、情報要約の
中には無い、任意のキーワードを指定してもよい。
【0244】又、データ内容が更新されているか否かの
判定は、図34、35を用いて後述するように、入力さ
れたデータ内に、指定されたキーワードが含まれている
か否かを検索するステップの前に行なってもよいし(図
35参照)、あるいは、後で行なってもよい(図34参
照)。
【0245】この場合のシステム構成のうち新たに設け
る部分を図33に示す。図33において、図31と同一
構成部分を含むので、同一部分には同一番号を付し説明
は省略する。121は、入力部1から再びデータが入力
された時に、データ指定手段111で受け付けたキーワ
ードの指定入力に基づいてデータを検索するキーワード
発見部、122はキーワード発見部121でキーワード
を含むデータが発見されたときに利用者に知らせる連絡
部である。この構成図で示される情報要約方法、および
情報要約装置の実行されるハードウェア構成は、基本的
に第1、3、5または7の発明の実施の一形態において
示したハードウェア構成にデータ指定手段が付加された
ものである。
【0246】また、フローチャートは、基本的に第1、
3、5または7の発明の実施の一形態において示したフ
ローチャートに、それぞれステップa10、ステップc14、
ステップe14、ステップg15で示される要約出力処理の後
に、図34、図35に示す処理を加えたものである。以
下、図35を中心に、各ステップについて説明する。
【0247】ステップj1は、データ指定手段111にお
いて、利用者から興味のあるキーワードの指定を受け付
け、指定されたキーワードを記憶する。指定入力を受け
付ける処理は、図6や図12に示したような出力に対し
て、マウス、十字キー、数字ボタンなどを用いて利用者
がキーワードを選択するのを受け付ける。これらの選択
の方法は、従来より用いられ得ている一般的な方法で構
わない。
【0248】ステップj2では、ステップj1で指定入力が
あったか否かを判定する。指定入力があればステップj3
へ進み、無い場合には処理を終了する。
【0249】ステップj3では、キーワード発見部121
において、入力部1から新たなデータの入力があるか否
かを判定する。尚、放送のように常にデータが入力され
ている場合には、このステップでは前回入力されたデー
タとの比較を行わずに、データが更新されたか否かの比
較・判定は、後述するステップj5において行なう。メール
のように、一固まりのデータとして入力される場合には
新たなデータの到着を検出することにより判定できる。
【0250】ステップj4〜ステップj6では、キーワード
発見部121において、ステップj1で指定入力され、記
憶されたキーワードが、新たに入力され、且つ更新され
たデータに含まれるか否かを検索し、含まれている場合
にはステップj7へ進み、含まれていない場合にはステッ
プj3へ戻る。この検索の方法は、単純にキーワードが含
まれているかどうかを調べる従来のキーワードマッチン
グの手法でも構わない。
【0251】ステップj7では、ステップj4での処理の結
果、入力データ中に指定入力されたキーワードが含まれ
ており、そのデータ部分を出力部2に表示する。たとえ
ば、利用者がキーワード「朝日新聞社」をステップj1で
指定入力しており、図5に示したデータ例が新たに入力
された場合、単位1の第1段落、単位3の第2段落、に
キーワードが含まれており、これらを出力部2に出力す
る。ただし、図5の各単位は空白行で段落が分かれてい
るものとする。また、この処理は図36に示すようにキ
ーワードを含むデータが入力されたことだけをメッセー
ジとして表示し、利用者が別に設けたボタンを押した場
合に、キーワードを含むデータ部分を表示するなどの方
法を用いても構わない。さらに、この処理においてデー
タを表示するのみでなく、キーワードを含むデータを蓄
積しておくことも考えられる。これにより、興味のある
キーワードを含むデータ部分が新たに入力されたデータ
に含まれれば、次々に蓄積されるといった効果が得られ
る。
【0252】また、以上のような処理は、第9の発明と
も組み合わせることが出来る。
【0253】なお、第2、4、6または8の発明におい
て、利用者から興味のあるデータの指定入力を受け付け
るデータ指定手段を新たに設け、表示手段に要約結果を
出力した後に、このデータ指定手段からキーワードの指
定入力を受け付け、このキーワードの指定入力があり、
かつ文字放送受信部21で受信したデータが更新された
場合に、前記指定入力されたキーワードが受信データ中
に存在するか否かを検索し、検索の結果前記指定入力さ
れたキーワードが含まれている場合に表示部26に前記
キーワードを含むデータ部分、もしくは前記キーワード
を含むデータが存在したことを知らせるメッセージを表
示することも考えられる。この場合のシステム構成のう
ち新たに設ける部分は図33に示したシステム構成と殆
ど同様であり、異なる点はキーワード発見部は入力部1
ではなく、文字放送受信部21と接続され、連絡部12
2は出力部2ではなく、表示部26と接続される点であ
る。この文字放送受信装置の実行されるハードウェア構
成は、基本的に第2、4、6または8の発明の実施の一
形態において示したハードウェア構成にデータ指定手段
が付加されたものである。また、フローチャートは、基
本的に第2、4、6または8の発明の実施の一形態にお
いて示したフローチャートに、それぞれステップb10、
ステップd14、ステップf14、ステップh15で示される要
約出力処理の後に、図35に示す処理を加えたものであ
る。ただし、図35のステップのうち、ステップj5で
は、文字放送受信部21から受信されたデータを、前回
受信されたデータと比較し、データが更新されたか否か
を判定する。
【0254】また、ステップj7では、ステップj4での処
理の結果、指定入力されたキーワードが更新されたデー
タに含まれており、そのデータ部分を表示部26に表示
する。たとえば、利用者がキーワード「朝日新聞社」を
ステップj1で指定入力しており、図5に示したデータが
新たに更新されたデータとして受信された場合、単位1
の第1段落、単位3の第2段落、にキーワードが含まれ
ており、これらを表示部26に表示する。また、この処
理は図36に示すようにキーワードを含むデータが入力
されたことだけをメッセージとして表示し、利用者が別
に設けたボタンを押した場合に、キーワードを含むデー
タ部分を表示するなどの方法を用いても構わない。
【0255】尚、図34は、データ内容が更新されてい
るか否かの判定を実行する順番は、上述した図35に示
す内容と異なり、入力されたデータ内に指定されたキー
ワードが含まれているか否かを検索するステップj6の後
で行なった場合のフローチャートである。図34でのス
テップの番号は、図35と同じ内容のものには、同じ番
号を付した。
【0256】また、以上のような処理は、第10の発明
とも組み合わせることも出来る。
【0257】以上述べたところより明かなように、第1
の発明にかかる実施の形態によれば、所定の単位で与え
られる文字列データが多数ある場合に、それらのデータ
間に共通して現れ、かつ頻度が大きいキーワードが共通
の話題として抽出される。この結果、本発明による情報
要約装置の利用者にとっては多数のデータをすべて見る
ことなく短時間で主だった話題を把握することができる
といった利点が生じる。
【0258】第2の発明にかかる実施の形態によれば、
文字放送といったリアルタイムに与えられるデータに対
する情報要約を行うことにより、常に最新データの主だ
った話題を抽出し、画面上に情報要約として表示するこ
とができる。このため、たとえばニュース放送を文字放
送で受信すれば、最新の主だったニュースを常に要約と
して把握することができる。この結果、膨大な量のニュ
ース放送を見ることなく主な内容だけを常に要約として
知ることができる。
【0259】第3の発明にかかる実施の形態によれば、
所定の単位で与えられる多数の文字列データに対し、そ
の主な内容を複数のキーワードで表示する際に、キーワ
ード間の関連を明らかにして表示することができる。こ
の結果、単純なキーワードの羅列と異なり、キーワード
間の関連に基づき、話題の内容がより解りやすくなる。
【0260】第4の発明にかかる実施の形態によれば、
文字放送といったリアルタイムに与えられるデータから
常に最新データの主だった話題を抽出し、画面上に情報
要約として表示する際に、複数のキーワードをキーワー
ド間の関連を明らかにした形式で表示する。このため、
最新ニュースで主に取り上げられている話題を互いに関
連のあるキーワードの集合として把握することができ
る。この結果、膨大な量のニュース放送を見ることなく
主な内容だけを短時間に、かつ解りやすい形の要約とし
て知ることができる。
【0261】第5の発明にかかる実施の形態によれば、
キーワードの頻度を扱う場合に、同じことを表していて
表現の異なるキーワードを処理することができる。たと
えば、同じ選手の名前でも「伊達公子」と表現したり、
「伊達選手」と表現したりする。このように表現が異な
っていても同じ意味で用いられているキーワードは、類
似度を計算することにより類似キーワードとして互いの
頻度を加算する。また、頻度の加算の際には、類似度を
掛け合わせるために、より類似度の大きいキーワードが
抽出されれば、その類似度に合わせてより大きな値が頻
度として加算される。類似度の小さいキーワードが抽出
されても、類似度を掛け合わせるために小さい値が頻度
として加算される。この結果、内容的に有用なキーワー
ドであるにもかかわらず別表現されていることが原因で
頻度が小さくなり、要約結果として用いられなくなると
いったことがなくなり、より適切な要約結果を得ること
ができる。
【0262】第6の発明にかかる実施の形態によれば、
文字放送といった複数の放送局からデータが提供され、
データを作成した作成者が異なる場合において別表現さ
れたキーワードの処理が可能である。特に、放送内容が
ニュースなど世の中の出来事を扱っている場合、専門用
語がきちんと決まっていないという問題があり、キーワ
ードの別表現は頻繁に起こる。したがって、別表現され
たキーワードでも類似キーワードとして頻度を加算する
ことにより、多くの放送局で共通に扱われている話題に
関する有用なキーワードを要約結果に反映させることが
できる。
【0263】第7の発明にかかる実施の形態によれば、
表現の異なるキーワードの類似性を算出する場合、2つ
のキーワードの間で同じ文字の数や割合だけでなく、対
象となるキーワードに関連する他のキーワードの類似性
も考慮したマクロ類似度を用いる。これにより、たとえ
ば「伊達公子」と「伊達選手」と「伊達政宗」のよう
に、一致している文字数が等しいキーワードどうしであ
っても、同一選手を意味する「伊達公子」と「伊達選
手」のマクロ類似度は大きく、別人である「伊達公子」
と「伊達政宗」はマクロ類似度が小さくなる。この結
果、別表現されているキーワードであっても同じ意味を
表しているキーワードは類似しているとし、文字だけを
みれば類似しているキーワードであっても別の話題でべ
つの事柄を表しているものは、あまり類似していないと
することができる。これらは、マクロ類似度といった数
値の大きさで判断され、この判断に基づいて加算された
頻度を用いて要約結果を得ることができる。
【0264】第8の発明にかかる実施の形態によれば、
文字放送といった複数の放送局からデータが提供され、
データを作成した作成者が異なる場合において別表現さ
れたキーワードの処理が可能である。文字放送では、た
とえばニュースにおける会議名、人名、会社名など、同
じようなキーワードで、全く関係のない話題で扱われて
いることがある。したがって、マクロ類似度により同じ
意味内容で別表現されているキーワードと、同じような
表現であるが全く別の意味のキーワードを、それぞれ類
似キーワード、類似していないキーワードとして処理す
る機能が必要があり、マクロ類似度を用いることによ
り、この機能を実現している。
【0265】第9の発明にかかる実施の形態によれば、
要約を表すキーワードとして適切でないものを予め例外
キーワード記憶部91に記憶している。この例外キーワ
ード記憶部91に記憶されているキーワードを取り除い
てからキーワードを処理し、キーワードの頻度に基づい
て要約を行うために、たとえば英語の{a,the}などの冠
詞、前置詞など話題を表す上で意味のないキーワードを
取り除くことができる。第10の発明にかかる実施の形
態によれば、文字放送において、たとえば英語の引用文
が提供される場合でも、例外キーワード記憶部91に記
憶しているキーワードを取り除いて、要約を行う。この
結果、英語における前置詞、冠詞など話題を表す上で重
要でないキーワードが要約結果に出ないようにすること
ができる。
【0266】
【発明の効果】以上述べたところから明らかなように本
発明は、従来にくらべてより一層適切なキーワードをデ
ータ内から抽出することが出来るという長所を有する。
【図面の簡単な説明】
【図1】第1の発明にかかる実施の一形態である情報要
約方法、および情報要約装置のシステム構成を示すブロ
ック図である。
【図2】同実施の一形態におけるハードウェア構成例で
ある。
【図3】同実施の一形態における情報要約方法、および
情報要約装置の動作手順を示すフローチャートである。
【図4】同実施の一形態における入力データのデータ例
である。
【図5】同実施の一形態における入力データのデータ例
である。
【図6】同実施の一形態における出力例である。
【図7】第2の発明にかかる実施の一形態である文字放
送受信装置のシステム構成を示すブロック図である。
【図8】同実施の一形態におけるハードウェア構成例で
ある。
【図9】同実施の一形態における文字放送受信装置の動
作手順を示すフローチャートである。
【図10】第3の発明にかかる実施の一形態である情報
要約方法、および情報要約装置のシステム構成を示すブ
ロック図である。
【図11】同実施の一形態における情報要約方法、およ
び情報要約装置の動作手順を示すフローチャートであ
る。
【図12】同実施の一形態における出力例である。
【図13】第4の発明にかかる実施の一形態である文字
放送受信装置のシステム構成を示すブロック図である。
【図14】同実施の一形態における文字放送受信装置の
動作手順を示すフローチャートである。
【図15】キーワードの頻度のみに基づく情報要約の出
力例である。
【図16】第5の発明にかかる実施の一形態である情報
要約方法、および情報要約装置のシステム構成を示すブ
ロック図である。
【図17】同実施の一形態における情報要約方法、およ
び情報要約装置の動作手順を示すフローチャートであ
る。
【図18】第6の発明にかかる実施の一形態である文字
放送受信装置のシステム構成を示すブロック図である。
【図19】同実施の一形態における文字放送受信装置の
動作手順を示すフローチャートである。
【図20】第7の発明にかかる実施の一形態である情報
要約方法、および情報要約装置のシステム構成を示すブ
ロック図である。
【図21】同実施の一形態における情報要約方法、およ
び情報要約装置の動作手順を示すフローチャートであ
る。
【図22】第8の発明にかかる実施の一形態である文字
放送受信装置のシステム構成を示すブロック図である。
【図23】同実施の一形態における文字放送受信装置の
動作手順を示すフローチャートである。
【図24】第9の発明にかかる実施の一形態である情報
要約方法、および情報要約装置のシステム構成を示すブ
ロック図である。
【図25】同実施の一形態におけるハードウェア構成例
である。
【図26】同実施の一形態における情報要約方法、およ
び情報要約装置の動作手順を示すフローチャートの一部
分である。
【図27】第10の発明にかかる実施の一形態である文
字放送受信装置のシステム構成を示すブロック図であ
る。
【図28】同実施の一形態におけるハードウェア構成例
である。
【図29】第9の発明の第2の実施の一形態、第3の実
施の一形態、第4の実施の一形態のシステム構成の一部
である。
【図30】第10の発明の第2の実施の一形態、第3の
実施の一形態、第4の実施の一形態のシステム構成の一
部である。
【図31】データ検索機能を備えた情報要約方法、およ
び情報要約装置のシステム構成の一部である。
【図32】データ検索機能を備えた文字放送受信装置の
システム構成の一部である。
【図33】データの到着を知らせる機能を備えた情報要
約方法、および情報要約装置のシステム構成の一部であ
る。
【図34】データの到着を知らせる機能を備えた情報要
約方法、および情報要約装置の動作手順の一部を示すフ
ローチャートである。
【図35】データの到着を知らせる機能を備えた情報要
約方法、および情報要約装置の他の動作手順の一部を示
すフローチャートである。
【図36】データの到着を知らせる機能を備えた情報要
約方法、および情報要約装置においてデータの到着を知
らせる出力例を表した図である。
【図37】英語で記述された入力データを表すデータ例
である。
【図38】英語で記述された入力データを処理した場合
の出力例である。
【図39】英語で記述された入力データをキーワードど
うしの関連付けを考慮して処理した場合の出力例であ
る。
【符号の説明】
1 入力部 2 出力部 3 キーワード切り出し部(キーワード抽出手段) 4 点数算出部(重み付け手段) 5 要約部(キーワード選択手段) 11 VRAM 12 主記憶装置 13 外部記憶装置 14 CPU 21 文字放送受信部 22 チャンネル記憶部 23 文字放送キーワード切り出し部(キーワード抽出
手段) 24 文字放送点数算出部(重み付け手段) 25 文字放送要約部(キーワード選択手段) 26 表示部 31 キーワード関連付部 32 関連付点数算出部(重み付け手段) 33 関連付要約部(選択手段) 41 文字放送キーワード関連付け部(キーワード関連
付け手段) 42 文字放送関連付け点数算出部(重み付け手段) 43 文字放送関連付要約部(選択手段) 51 類似度付点数算出部(類似性算出手段、重み付け
手段) 61 文字放送類似度付点数算出部(類似性算出手段、
重み付け手段) 71 類似度付関連付点数算出部(類似性算出手段、重
み付け手段) 81 文字放送類似度付関連付け点数算出部(類似性算
出手段、重み付け手段) 91 例外キーワード記憶部 92 例外付キーワード切り出し部 101 例外付文字放送キーワード切り出し部 111 データ指定手段(キーワード指定手段) 112 データ記憶部(作業領域) 113 検索部 114 データ提示部(出力手段) 121 キーワード発見部 122 連絡部(出力手段)
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭64−1030(JP,A) 特開 平6−282587(JP,A) 特開 平5−81327(JP,A) 特開 平2−202674(JP,A) 特開 平4−71067(JP,A) 特開 平4−90053(JP,A) 特開 平5−75984(JP,A) 特開 平2−247778(JP,A) 特開 平6−176064(JP,A) 特開 平6−215036(JP,A) 特開 平5−282367(JP,A) 特開 平5−81333(JP,A) (58)調査した分野(Int.Cl.6,DB名) G06F 17/30

Claims (53)

    (57)【特許請求の範囲】
  1. 【請求項1】 所定の単位に分けられており、かつ各文
    字が文字コードで表された文字列データの入力を受け付
    け、 その入力された文字列データから前記所定の単位ごとに
    キーワードを抽出し、 前記キーワードに、前記所定の単位内での前記キーワー
    ドの出現状態と、そのキーワードと同一のキーワードの
    他の前記単位における出現状態との両方を考慮して、重
    み付けし、 その重み付けの結果に基づいてキーワードを選択し、 その選択されたキーワードを前記文字列データに関する
    情報要約として出力することを特徴とする情報要約方
    法。
  2. 【請求項2】 所定の単位に分けられており、かつ各文
    字が文字コードで表された文字列データの入力を受け付
    ける入力手段と、 前記入力手段から入力された文字列データから前記所定
    の単位ごとにキーワードを抽出するキーワード抽出手段
    と、 前記キーワードに、前記所定の単位内での前記キーワー
    ドの出現状態と、そのキーワードと同一のキーワードの
    他の前記単位における出現状態との両方を考慮して、重
    み付けする重み付け手段と、 その重み付けの結果に基づいてキーワードを選択するキ
    ーワード選択手段と、 その選択されたキーワードを前記文字列データに関する
    情報要約として出力するための出力手段と、 を備えたことを特徴とする情報要約装置。
  3. 【請求項3】 所定の単位に分けられており、かつ各文
    字が文字コードで表された文字列データの入力を受け付
    け、 その入力された文字列データから前記所定の単位ごとに
    キーワードを抽出し、 前記キーワードに、前記所定の単位内での前記キーワー
    ドの出現状態と、そのキーワードと同一のキーワードの
    他の前記単位における出現状態との両方を考慮して、重
    み付けすることを特徴とする重み付け方法。
  4. 【請求項4】 文字放送を受信する文字放送受信手段
    と、 所定の番組のチャンネルを複数個記憶するチャンネル記
    憶手段と、 前記チャンネル記憶手段に記憶されている各チャンネル
    の番組を前記文字放送受信手段で受信し、受信した番組
    ごとにキーワードを抽出するキーワード抽出手段と、 前記キーワードに、前記番組内での前記キーワードの出
    現状態と、そのキーワードと同一のキーワードの他の前
    記番組における出現状態の両方を考慮して、重み付けす
    る重み付け手段と、 その重み付けの結果に基づいてキーワードを選択するキ
    ーワード選択手段と、 その選択されたキーワードの全部又は一部を前記文字放
    送に関する情報要約として表示するための表示手段と、 を備えたことを特徴とする文字放送受信装置。
  5. 【請求項5】 所定の単位に分けられた、かつ各単位内
    が所定の段落に分けられた、かつ各文字が文字コードで
    表された文字列データの入力を受け付け、 前記入力された文字列データから前記所定の単位の段落
    ごとにキーワードを抽出し、 同一の前記段落から得られたキーワードどうしを関連付
    けして、キーワード関連を生成し、 前記キーワードに、そのキーワードの単位内の出現状態
    と、前記キーワードと同一のキーワードの他の前記単位
    における出現状態の両方を考慮して、重み付けし、かつ
    前記キーワード関連に、そのキーワード関連の段落内の
    出現状態と、同一のキーワード関連の他の前記段落にお
    ける出現状態の両方を考慮して、重み付けし、 それらの重み付けの結果の両方に基づいて、キーワー
    ド、およびキーワード関連を選択し、 それら選択されたキーワード及びキーワード関連を、前
    記文字列データに関する情報要約として出力することを
    特徴とする情報要約方法。
  6. 【請求項6】 所定の単位に分けられた、かつ各単位内
    が所定の段落に分けられた、かつ各文字が文字コードで
    表された文字列データの入力を受け付ける入力手段と、 前記入力手段から入力された文字列データから前記所定
    の単位の段落ごとにキーワードを抽出するキーワード抽
    出手段と、 同一の前記段落から得られたキーワードどうしを関連付
    けして、キーワード関連を生成するキーワード関連付け
    手段と、 前記キーワードに、そのキーワードの単位内の出現状態
    と、前記キーワードと同一のキーワードの他の前記単位
    における出現状態の両方を考慮して、重み付けし、かつ
    前記キーワード関連に、そのキーワード関連の段落内の
    出現状態と、同一のキーワード関連の他の前記段落にお
    ける出現状態の両方を考慮して、重み付けする重み付け
    手段と、 それらの重み付けの結果の両方に基づいてキーワード、
    およびキーワード関連を選択する選択手段と、 それら選択されたキーワード及びキーワード関連を、前
    記文字列データに関する情報要約として、出力するため
    の出力手段と、 を備えたことを特徴とする情報要約装置。
  7. 【請求項7】 所定の単位に分けられた、かつ各単位内
    が所定の段落に分けられた、かつ各文字が文字コードで
    表された文字列データの入力を受け付け、 前記入力された文字列データから前記所定の単位の段落
    ごとにキーワードを抽出し、 同一の前記段落から得られたキーワードどうしを関連付
    けして、キーワード関連を生成し、 前記キーワードに、そのキーワードの単位内の出現状態
    と、前記キーワードと同一のキーワードの他の前記単位
    における出現状態の両方を考慮して、重み付けし、かつ
    前記キーワード関連に、そのキーワード関連の段落内の
    出現状態と、同一のキーワード関連の他の前記段落にお
    ける出現状態の両方を考慮して、重み付けすることを特
    徴とする重み付け方法。
  8. 【請求項8】 文字放送を受信する文字放送受信手段
    と、 所定の番組のチャンネルを複数個記憶するチャンネル記
    憶手段と、 前記チャンネル記憶手段に記憶されている各チャンネル
    の番組を前記文字放送受信手段で受信し、受信した番組
    ごとにキーワードを抽出するキーワード抽出手段と、 同一番組中の同一段落から得られたキーワードどうしを
    関連付けして、キーワード関連を生成するキーワード関
    連付け手段と、 前記キーワードに、そのキーワードの単位内の出現状態
    と、前記キーワードと同一のキーワードの他の前記番組
    における出現状態の両方を考慮して、重み付けし、かつ
    前記キーワード関連に、そのキーワード関連の段落内の
    出現状態と、同一のキーワード関連の他の前記段落にお
    ける出現状態の両方を考慮して、重み付けする重み付け
    手段と、 それらの重み付けの結果の両方に基づいて、キーワー
    ド、およびキーワード関連を選択する選択手段と、 それら選択されたキーワード及びキーワード関連の全部
    又は一部を、前記文字放送に関する情報要約として表示
    するための表示手段と、 を備えたことを特徴とする文字放送受信装置。
  9. 【請求項9】 所定の単位に分けられており、かつ各文
    字が文字コードで表された文字列データの入力を受け付
    け、 その入力された文字列データから前記所定の単位ごとに
    キーワードを抽出し、 それら抽出したキーワード間の類似性を算出し、前記キーワードに、そのキーワードと同一又は類似のキ
    ーワードの単位内での出現状態と、他の前記単位におけ
    る出現状態と、前記類似性に基づいて 重み付けし、 その重み付けの結果に基づいてキーワードを選択し、 その選択されたキーワードを前記文字列データに関する
    情報要約として出力することを特徴とする情報要約方
    法。
  10. 【請求項10】 所定の単位に分けられており、かつ各
    文字が文字コードで表された文字列データの入力を受け
    付ける入力手段と、 その入力された文字列データから前記所定の単位ごとに
    キーワードを抽出するキーワード抽出手段と、 それら抽出したキーワード間の類似性を算出する類似性
    算出手段と、前記キーワードに、そのキーワードと同一又は類似のキ
    ーワードの単位内での出現状態と、他の前記単位におけ
    る出現状態と、前記類似性に基づいて 重み付けする重み
    付け手段と、 その重み付けの結果に基づいてキーワードを選択するキ
    ーワード選択手段と、 その選択されたキーワードを前記文字列データに関する
    情報要約として出力するための出力手段と、 を備えたことを特徴とする情報要約装置。
  11. 【請求項11】 所定の単位に分けられており、かつ各
    文字が文字コードで表された文字列データの入力を受け
    付け、 その入力された文字列データから前記所定の単位ごとに
    キーワードを抽出し、 それら抽出したキーワード間の類似性を算出し、前記キーワードに、そのキーワードと同一又は類似のキ
    ーワードの単位内での出現状態と、他の前記単位におけ
    る出現状態と、前記類似性に基づいて 重み付けすること
    を特徴とする重み付け方法。
  12. 【請求項12】 文字放送を受信する文字放送受信手段
    と、 所定の番組のチャンネルを複数個記憶するチャンネル記
    憶手段と、 前記チャンネル記憶手段に記憶されている各チャンネル
    の番組を前記文字放送受信手段で受信し、受信した番組
    ごとにキーワードを抽出するキーワード抽出手段と、 それら抽出したキーワード間の類似性を算出する類似性
    算出手段と、前記キーワードに、そのキーワードと同一又は類似のキ
    ーワードの番組内での出現状態と、他の前記番組におけ
    る出現状態と、前記類似性に基づいて 重み付けする重み
    付け手段と、 その重み付けの結果に基づいてキーワードを選択するキ
    ーワード選択手段と、 その選択されたキーワードの全部又は一部を前記文字放
    送に関する情報要約として表示するための表示手段と、 を備えたことを特徴とする文字放送受信装置。
  13. 【請求項13】 所定の単位に分けられた、かつ各単位
    内が所定の段落に分けられた、かつ各文字が文字コード
    で表された文字列データの入力を受け付け、 前記入力された文字列データから前記所定の単位の段落
    ごとにキーワードを抽出し、 同一の前記段落から得られたキーワードどうしを関連付
    けして、キーワード関連を生成し、 前記抽出したキーワード間の類似性を、キーワードどう
    しの前記関連付けを含む複数の要因に基づいて算出し、 前記キーワードに、そのキーワードと同一又は類似のキ
    ーワードの単位内での出現状態と、他の前記単位におけ
    る出現状態と、前記類似性を考慮して、重み付けし、
    又、前記キーワード関連に、そのキーワード関連と同一
    のキーワード関連の単位内の出現状態と、他の前記段落
    における出現状態の両方を考慮して、重み付けし、 それらの重み付けの結果の両方に基づいて、キーワー
    ド、およびキーワード関連を選択し、 それら選択されたキーワード及びキーワード関連を、前
    記文字列データに関する情報要約として、出力すること
    を特徴とする情報要約方法。
  14. 【請求項14】 所定の単位に分けられた、かつ各単位
    内が所定の段落に分けられた、かつ各文字が文字コード
    で表された文字列データの入力を受け付ける入力手段
    と、 前記入力手段から入力された文字列データから前記所定
    の単位の段落ごとにキーワードを抽出するキーワード抽
    出手段と、 同一の前記段落から得られたキーワードどうしを関連付
    けして、キーワード関連を生成するキーワード関連付け
    手段と、 前記抽出したキーワード間の類似性を、キーワードどう
    しの前記関連付けを含む複数の要因に基づいて算出する
    類似性算出手段と、 前記キーワードに、そのキーワードと同一又は類似のキ
    ーワードの単位内ので出現状態と他の前記単位における
    出現状態と、前記類似性を考慮して、重み付けし、又、
    前記キーワード関連に、そのキーワード関連と同一のキ
    ーワード関連の単位内での出現状態と他の前記段落にお
    ける出現状態の両方を考慮して、重み付けする重み付け
    手段と、それらの重み付けの結果の両方に基づいて 、キーワー
    ド、およびキーワード関連を選択する選択手段と、 それら選択されたキーワード、及びキーワード関連を前
    記文字列データに関する情報要約として出力するための
    出力手段と、 を備えたことを特徴とする情報要約装置。
  15. 【請求項15】 所定の単位に分けられた、かつ各単位
    内が所定の段落に分けられた、かつ各文字が文字コード
    で表された文字列データの入力を受け付け、 前記入力された文字列データから前記所定の単位の段落
    ごとにキーワードを抽出し、 同一の前記段落から得られたキーワードどうしを関連付
    けして、キーワード関連を生成し、 前記抽出したキーワード間の類似性を、キーワードどう
    しの前記関連付けを含む複数の要因に基づいて算出し、 前記キーワードに、そのキーワードと同一又は類似のキ
    ーワードの単位内での出現状態と他の前記単位における
    出現状態と、前記類似性を考慮して、重み付けし、又、
    前記キーワード関連に、そのキーワード関連と同一のキ
    ーワード関連の単位内での出現状態と他の前記段落にお
    ける出現状態の両方を考慮して、重み付けすることを特
    徴とする重み付け方法。
  16. 【請求項16】 文字放送を受信する文字放送受信手段
    と、 所定の番組のチャンネルを複数個記憶するチャンネル記
    憶手段と、 前記チャンネル記憶手段に記憶されている各チャンネル
    の番組を前記文字放送受信手段で受信し、受信した番組
    ごとにキーワードを抽出するキーワード抽出手段と、 同一番組中の同一段落から得られたキーワードどうしを
    関連付けして、キーワード関連を生成するキーワード関
    連付け手段と、 前記抽出したキーワード間の類似性を、キーワードどう
    しの前記関連付けを含む複数の要因に基づいて算出する
    類似性算出手段と、 前記キーワードに、そのキーワードと同一又は類似のキ
    ーワードの番組内での出現状態と他の前記番組における
    出現状態と、前記類似性を考慮して、重み付けし、又、
    前記キーワード関連に、そのキーワード関連と同一のキ
    ーワード関連の他の前記段落における出現状態を考慮し
    て、重み付けする重み付け手段と、それらの重み付けの結果の両方に基づいて 、キーワー
    ド、およびキーワード関連を選択する選択手段と、 それら選択されたキーワード及びキーワード関連の全部
    又は一部を、前記文字放送に関する情報要約として表示
    するための表示手段と、を備えたことを特徴とする文字
    放送受信装置。
  17. 【請求項17】 前記キーワードに重み付けする際に、
    その重み付けの対象となるキーワードが抽出されている
    前記単位の数と、前記各単位内での前記対象となるキー
    ワードの出現頻度と、前記対象となるキーワードの文字
    数とのうち、少なくとも2つ以上を利用して重み付けす
    ることを特徴とする請求項1記載の情報要約方法。
  18. 【請求項18】 前記キーワードに重み付けする際に、
    その重み付けの対象となるキーワードが抽出されている
    前記単位の数と、前記各単位内での前記対象となるキー
    ワードの出現頻度と、前記対象となるキーワードの文字
    数とのうち、少なくとも2つ以上を利用して重み付けす
    ることを特徴とする請求項2記載の情報要約装置。
  19. 【請求項19】 前記キーワードに重み付けする際に、
    その重み付けの対象となるが抽出されている前記単位の
    数と、前記各単位内での前記対象となるキーワードの出
    現頻度と、前記対象となるキーワードの文字数とのう
    ち、少なくとも2つ以上を利用して重み付けすることを
    特徴とする請求項3記載の重み付け方法。
  20. 【請求項20】 前記キーワードに重み付けする際に、
    その重み付けの対象となるが抽出されている前記単位の
    数と、前記各単位内での前記対象となるキーワードの出
    現頻度と、前記対象となるキーワードの文字数とのう
    ち、少なくとも2つ以上を利用して重み付けすることを
    特徴とする請求項4記載の文字放送受信装置。
  21. 【請求項21】 前記キーワードに重み付けする際に、 その重み付けの対象となるキーワードが抽出されている
    前記単位の数と、前記各単位内での前記対象となるキー
    ワードの出現頻度と、前記対象となるキーワードの文字
    数とのうち、少なくとも2つ以上を利用して重み付け
    し、 又、前記キーワード関連に重み付けする際に、 その重み付けの対象となるキーワード関連が得られた前
    記段落の数と、前記各段落内において前記対象となるキ
    ーワード関連を構成するキーワードが出現する出現頻度
    と、前記対象となるキーワード関連を構成するキーワー
    ドの文字数とのうち、少なくとも2つ以上を利用して
    み付けすることを特徴とする請求項5記載の情報要約方
    法。
  22. 【請求項22】 前記重み付け手段は、 前記キーワードに重み付けする際に、その重み付けの対
    象となるキーワードが抽出されている前記単位の数と、
    前記各単位内での前記対象となるキーワードの出現頻度
    と、前記対象となるキーワードの文字数とのうち、少な
    くとも2つ以上を利用して重み付けし、 又、前記キーワード関連に重み付けする際に、その重み
    付けの対象となるキーワード関連が得られた前記段落の
    数と、前記各段落内において前記対象となるキーワード
    関連を構成するキーワードが出現する出現頻度と、前記
    対象となるキーワード関連を構成するキーワードの文字
    数とのうち、少なくとも2つ以上を利用して重み付けす
    ることを特徴とする請求項6記載の情報要約装置。
  23. 【請求項23】 前記キーワードに重み付けする際に、 その重み付けの対象となるキーワードが抽出されている
    前記単位の数と、前記各単位内での前記対象となるキー
    ワードの出現頻度と、前記対象となるキーワードの文字
    数とのうち、少なくとも2つ以上を利用して重み付け
    し、 又、前記キーワード関連に重み付けする際に、その重み
    付けの対象となるキーワード関連が得られた前記段落の
    数と、前記各段落内において前記対象となるキーワード
    関連を構成するキーワードが出現する出現頻度と、前記
    対象となるキーワード関連を構成するキーワードの文字
    数とのうち、少なくとも2つ以上を利用して重み付けす
    ることを特徴とする請求項7記載の重み付け方法。
  24. 【請求項24】 前記重み付け手段は、 前記キーワードに重み付けする際に、その重み付けの対
    象となるキーワードが抽出されている前記単位の数と、
    前記各単位内での前記対象となるキーワードの出現頻度
    と、前記対象となるキーワードの文字数とのうち、少な
    くとも2つ以上を利用して重み付けし、 又、前記キーワード関連に重み付けする際に、その重み
    付けの対象となるキーワード関連が得られた前記段落の
    数と、前記各段落内において前記対象となるキーワード
    関連を構成するキーワードが出現する出現頻度と、前記
    対象となるキーワード関連を構成するキーワードの文字
    数とのうち、少なくとも2つ以上を利用して重み付けす
    ることを特徴とする請求項8記載の文字放送受信装置。
  25. 【請求項25】 所定の単位に分けられた、かつ各単位
    内が所定の段落に分けられた、かつ各文字が文字コード
    で表された文字列データの入力を受け付け、 前記入力された文字列データから前記所定の単位の段落
    ごとにキーワードを抽出し、 同一の前記段落から得られたキーワードどうしを関連付
    けして、キーワード関連を生成し、 前記キーワード関連に、そのキーワード関連の段落内の
    出現状態と、同一のキーワード関連の他の前記段落にお
    ける出現状態の両方を考慮して、重み付けし、 その重み付けの結果に基づいてキーワード関連を選択
    し、 その選択結果に基づいて生成した、前記文字列データに
    関する情報要約を出力することを特徴とする情報要約方
    法。
  26. 【請求項26】 所定の単位に分けられた、かつ各単位
    内が所定の段落に分けられた、かつ各文字が文字コード
    で表された文字列データの入力を受け付ける入力手段
    と、 前記入力手段から入力された文字列データから前記所定
    の単位の段落ごとにキーワードを抽出するキーワード抽
    出手段と、 同一の前記段落から得られたキーワードどうしを関連付
    けして、キーワード関連を生成するキーワード関連付け
    手段と、 前記キーワード関連に、そのキーワード関連の段落内の
    出現状態と、同一のキーワード関連の他の前記段落にお
    ける出現状態の両方を考慮して、重み付けする重み付け
    手段と、 その重み付けの結果に基づいてキーワード関連を選択す
    る選択手段と、 その選択結果に基づいて生成された、前記文字列データ
    に関する情報要約を出力するための出力手段と、 を備えたことを特徴とする情報要約装置。
  27. 【請求項27】 所定の単位に分けられた、かつ各単位
    内が所定の段落に分けられた、かつ各文字が文字コード
    で表された文字列データの入力を受け付け、 前記入力された文字列データから前記所定の単位の段落
    ごとにキーワードを抽出し、 同一の前記段落から得られたキーワードどうしを関連付
    けして、キーワード関連を生成し、 前記キーワード関連に、そのキーワード関連の段落内で
    の出現状態と、同一のキーワード関連の他の前記段落に
    おける出現状態の両方を考慮して、重み付けすることを
    特徴とする重み付け方法。
  28. 【請求項28】 文字放送を受信する文字放送受信手段
    と、 所定の番組のチャンネルを複数個記憶するチャンネル記
    憶手段と、 前記チャンネル記憶手段に記憶されている各チャンネル
    の番組を前記文字放送受信手段で受信し、受信した番組
    ごとにキーワードを抽出するキーワード抽出手段と、 同一番組中の同一段落から得られたキーワードどうしを
    関連付けして、キーワード関連を生成するキーワード関
    連付け手段と、 前記キーワード関連に、そのキーワード関連の段落内で
    の出現状態と、同一のキーワード関連の他の前記段落に
    おける出現状態の両方を考慮して、重み付けする重み付
    け手段と、 その重み付けの結果に基づいてキーワード関連を選択す
    る選択手段と、 その選択の結果に基づいて生成された、前記文字放送に
    関する情報要約を表示するための表示手段と、を備えた
    ことを特徴とする文字放送受信装置。
  29. 【請求項29】 所定の単位に分けられた、かつ各単位
    内が所定の段落に分けられた、かつ各文字が文字コード
    で表された文字列データの入力を受け付け、 前記入力された文字列データから前記所定の単位の段落
    ごとにキーワードを抽出し、 同一の前記段落から得られたキーワードどうしを関連付
    けしてキーワード関連を生成し、 前記抽出したキーワード間の類似性を算出し、 前記生成されたキーワード関連を構成するキーワード
    と、他のキーワード関連を構成するキーワードとの間の
    前記算出された類似性を利用して、そのキーワード関連
    間の類似性を算出し、 前記キーワード関連に、そのキーワード関連と同一又は
    類似のキーワード関連の段落内における出現状態と、他
    の前記段落における出現状態と、前記キーワード関連間
    の類似性を考慮して、重み付けし、 その重み付けの結果に基づいてキーワード関連を選択
    し、 その選択されたキーワード関連を、前記文字列データに
    関する情報要約として出力することを特徴とする情報要
    約方法。
  30. 【請求項30】 所定の単位に分けられた、かつ各単位
    内が所定の段落に分けられた、かつ各文字が文字コード
    で表された文字列データの入力を受け付ける入力手段
    と、 前記入力手段から入力された文字列データから前記所定
    の単位の段落ごとにキーワードを抽出するキーワード抽
    出手段と、 同一の前記段落から得られたキーワードどうしを関連付
    けしてキーワード関連を生成するキーワード関連付け手
    段と、 前記抽出したキーワード間の類似性を算出する類似性算
    出手段と、 前記生成されたキーワード関連を構成するキーワード
    と、他のキーワード関連を構成するキーワードとの間の
    前記算出された類似性を利用して、そのキーワード関連
    間の類似性を算出するキーワード関連類似性算出手段
    と、 前記キーワード関連に、そのキーワード関連と同一又は
    類似のキーワード関連の段落内での出現状態と、他の前
    記段落における出現状態と前記キーワード関連間の類似
    性を考慮して、重み付けする重み付け手段と、 その重み付けの結果に基づいてキーワード関連を選択す
    る選択手段と、 その選択されたキーワード関連を前記文字列データに関
    する情報要約として出力するための出力手段と、 を備えたことを特徴とする情報要約装置。
  31. 【請求項31】 所定の単位に分けられた、かつ各単位
    内が所定の段落に分けられた、かつ各文字が文字コード
    で表された文字列データの入力を受け付け、 前記入力された文字列データから前記所定の単位の段落
    ごとにキーワードを抽出し、 同一の前記段落から得られたキーワードどうしを関連付
    けしてキーワード関連を生成し、 前記抽出したキーワード間の類似性を算出し、 前記生成されたキーワード関連を構成するキーワード
    と、他のキーワード関連を構成するキーワードとの間の
    前記算出された類似性を利用して、そのキーワード関連
    間の類似性を算出し、 前記キーワード関連に、そのキーワード関連と同一又は
    類似のキーワード関連の段落内での出現状態と、他の前
    記段落における出現状態と、前記キーワード関連間の類
    似性を考慮して、重み付けすることを特徴とする重み付
    け方法。
  32. 【請求項32】 文字放送を受信する文字放送受信手段
    と、 所定の番組のチャンネルを複数個記憶するチャンネル記
    憶手段と、 前記チャンネル記憶手段に記憶されている各チャンネル
    の番組を前記文字放送受信手段で受信し、受信した番組
    ごとにキーワードを抽出するキーワード抽出手段と、 同一の前記段落から得られたキーワードどうしを関連付
    けしてキーワード関連を生成するキーワード関連付け手
    段と、 前記抽出したキーワード間の類似性を算出する類似性算
    出手段と、 前記生成されたキーワード関連を構成するキーワード
    と、他のキーワード関連を構成するキーワードとの間の
    前記算出された類似性を利用して、そのキーワード関連
    間の類似性を算出するキーワード関連類似性算出手段
    と、 前記キーワード関連に、そのキーワード関連と同一又は
    類似のキーワード関連の段落内の出現状態と、他の前記
    段落における出現状態と、前記キーワード関連間の類似
    性を考慮して、重み付けする重み付け手段と、 その重み付けの結果に基づいてキーワード関連を選択す
    る選択手段と、 その選択されたキーワード関連の全部又は一部を、前記
    文字放送に関する情報要約として表示するための表示手
    段と、 を備えたことを特徴とする文字放送受信装置。
  33. 【請求項33】 前記入力された文字列データを所定の
    作業領域に記憶し、 前記情報要約を出力した後に、その情報要約を構成する
    キーワードの中から、キーワードを指定する場合、その
    指定されたキーワードを利用して、その指定されたキー
    ワードを含む前記文字列データの全部又は一部を出力す
    ることを特徴とする請求項1、5、9、13、17、2
    1、25または29記載の情報要約方法。
  34. 【請求項34】 キーワードを指定するためのキーワー
    ド指定手段と、 前記入力手段から入力された前記文字列データを記憶す
    るための作業領域とを有し、 前記出力手段に前記情報要約が出力された後に、その出
    力された情報要約を構成するキーワードの中から、前記
    キーワード指定手段によって、キーワードが指定された
    場合、その指定されたキーワードを利用して、そのキー
    ワードを含む前記文字列データの全部又は一部を前記出
    力手段によって出力することを特徴とする請求項2、
    6、10、14、18、22、26または30記載の情
    報要約装置。
  35. 【請求項35】 キーワードを指定するためのキーワー
    ド指定手段と、 前記文字放送受信手段から受信された前記文字放送デー
    タを記憶するための作業領域とを有し、 前記表示手段に前記情報要約が表示された後に、その表
    示された情報要約を構成するキーワードの中から、前記
    キーワード指定手段によって、キーワードが指定された
    場合、その指定されたキーワードを利用して、そのキー
    ワードを含む前記文字放送のデータの全部又は一部を前
    記表示手段によって表示することを特徴とする請求項
    4、8、12、16、20、24、28または32記載
    の文字放送受信装置。
  36. 【請求項36】 前記類似性のより高いキーワードで構
    成される前記キーワード関連が、前記段落内においてよ
    り多く存在するほど、そのキーワード関連に対して、類
    似性の高さと存在する段落の多さに応じて、より大きく
    重み付けすることを特徴とする請求項13記載の情報要
    約方法。
  37. 【請求項37】 前記類似性のより高いキーワードで構
    成される前記キーワード関連が、前記段落内においてよ
    り多く存在するほど、そのキーワード関連に対して、類
    似性の高さと存在する段落の多さに応じて、より大きく
    重み付けすることを特徴とする請求項14記載の情報要
    約装置。
  38. 【請求項38】 前記類似性のより高いキーワードで構
    成される前記キーワード関連が、前記段落内においてよ
    り多く存在するほど、そのキーワード関連に対して、類
    似性の高さと存在する段落の多さに応じて、より大きく
    重み付けすることを特徴とする請求項15記載の重み付
    け方法。
  39. 【請求項39】 前記類似性のより高いキーワードで構
    成されるキーワード関連が、前記段落内においてより多
    く存在するほど、そのキーワード関連に対して、類似性
    の高さと存在する段落の多さに応じて、より大きく重み
    付けすることを特徴とする請求項16記載の文字放送受
    信装置。
  40. 【請求項40】 前記キーワードに重み付けする際に、
    その重み付けの対象となるキーワードとの類似性が所定
    基準より高いキーワードが抽出されている単位の数と、
    前記対象となるキーワードとの類似性が所定基準より高
    いキーワードの前記各単位内での出現頻度と、前記対象
    となるキーワードの文字数とのうち、少なくとも2つ以
    上を利用して重み付けすることを特徴とする請求項9ま
    たは13記載の情報要約方法。
  41. 【請求項41】 前記キーワードに重み付けする際に、
    その重み付けの対象となるキーワードとの類似性が所定
    基準より高いキーワードが抽出されている単位の数と、
    前記各単位内での前記対象となるキーワードとの類似性
    が所定基準より高いキーワードの出現頻度と、前記対象
    となるキーワードの文字数とのうち、少なくとも2つ以
    上を利用して重み付けすることを特徴とする請求項10
    または14記載の情報要約装置。
  42. 【請求項42】 前記キーワードに重み付けする際に、
    その重み付けの対象となるキーワードとの類似性が所定
    基準より高いキーワードが抽出されている単位の数と、
    前記対象となるキーワードとの類似性が所定基準より高
    いキーワードの前記各単位内での出現頻度と、前記対象
    となるキーワードの文字数とのうち、少なくとも2つ以
    上を利用して重み付けすることを特徴とする請求項11
    または15記載の重み付け方法。
  43. 【請求項43】 前記キーワードに重み付けする際に、
    その重み付けの対象となるキーワードとの類似性が所定
    基準より高いキーワードが抽出されている単位の数と、
    前記対象となるキーワードとの類似性が所定基準より高
    いキーワードの前記各単位内での出現頻度と、前記対象
    となるキーワードの文字数とのうち、少なくとも2つ以
    上を利用して重み付けすることを特徴とする請求項12
    または16記載の文字放送受信装置。
  44. 【請求項44】 任意のキーワードの入力を受け付け、 前記情報要約を出力した後に、前記単位の段落のデータ
    内容が更新され、且つその更新されたデータ内に前記入
    力されたキーワードが存在する場合に、 そのキーワードを含む前記データの全部又は一部を出力
    し、もしくは、 蓄積し、 又は、そのキーワードを含む前記データが存在したこと
    を出力し、もしくは、蓄積することを特徴とする請求項
    1、5、9、13、17、21、25または29記載の
    情報要約方法。
  45. 【請求項45】 任意のキーワードを入力するキーワー
    ド入力手段と、 データを蓄積するためのデータ蓄積手段とを有し、 前記出力手段により情報要約が出力された後に、前記単
    位の段落のデータ内容が更新され、且つその更新された
    データ内に前記入力されたキーワードが存在する場合
    に、 そのキーワードを含む前記データの全部又は一部を、前
    記出力手段により出力し、もしくは、前記データ蓄積手
    段に蓄積し、 又は、そのキーワードを含む前記データが存在したこと
    を、前記出力手段により出力し、もしくは、前記データ
    蓄積手段に蓄積することを特徴とする請求項2、6、1
    0、14、18、22、26または30記載の情報要約
    装置。
  46. 【請求項46】 任意のキーワードを入力するキーワー
    ド入力手段と、 データを蓄積するためのデータ蓄積手段とを有し、 前記表示手段により情報要約が表示された後に、前記番
    組の段落のデータ内容が更新され、且つその更新された
    データ内に前記入力されたキーワードが存在する場合
    に、 そのキーワードを含む前記データの全部又は一部を、前
    記表示手段により表示し、もしくは、前記データ蓄積手
    段に蓄積し、 又は、そのキーワードを含む前記データが存在したこと
    を、前記表示手段により表示し、もしくは、前記データ
    蓄積手段に蓄積することを特徴とする請求項4、8、1
    2、16、20、24、28または32記載の文字放送
    受信装置。
  47. 【請求項47】 前記情報要約を出力した後に、その出
    力された情報要約を構成するキーワードの中からキーワ
    ードを指定し、 その後、前記単位の段落のデータ内容が更新され、且つ
    その更新されたデータ内に前記指定されたキーワードが
    存在する場合に、 そのキーワードを含む前記データの全部又は一部を出力
    し、もしくは、 蓄積し、 又は、そのキーワードを含む前記データが存在したこと
    を出力し、もしくは、蓄積することを特徴とする請求項
    1、5、9、13、17、21、25または29記載の
    情報要約方法。
  48. 【請求項48】 キーワードを指定するキーワード指定
    手段と、 データを蓄積するためのデータ蓄積手段とを有し、 前記出力手段により情報要約が出力された後に、その出
    力された情報要約を構成するキーワードの中から、前記
    キーワード指定手段によってキーワードが指定されて、
    その後、前記単位の段落のデータ内容が更新され、且つ
    その更新されたデータ内に前記指定されたキーワードが
    存在する場合に、 そのキーワードを含む前記データの全部又は一部を、前
    記出力手段により出力し、もしくは、前記データ蓄積手
    段に蓄積し、 又は、そのキーワードを含む前記データが存在したこと
    を、前記出力手段により出力し、もしくは、前記データ
    蓄積手段に蓄積することを特徴とする請求項2、6、1
    0、14、18、22、26または30記載の情報要約
    装置。
  49. 【請求項49】 キーワードを指定するキーワード指定
    手段と、 データを蓄積するためのデータ蓄積手段とを有し、 前記表示手段により情報要約が表示された後に、その表
    示された情報要約を構成するキーワードの中から、前記
    キーワード指定手段によってキーワードが指定されて、
    その後、前記番組の段落のデータ内容が更新され、且つ
    その更新されたデータ内に前記指定されたキーワードが
    存在する場合に、 そのキーワードを含む前記データの全部又は一部を、前
    記表示手段により表示し、もしくは、前記データ蓄積手
    段に蓄積し、 又は、そのキーワードを含む前記データが存在したこと
    を、前記表示手段により表示し、もしくは、前記データ
    蓄積手段に蓄積することを特徴とする請求項4、8、1
    2、16、20、24、28または32記載の文字放送
    受信装置。
  50. 【請求項50】 前記情報要約として互いに関連する複
    数のキーワードを実質的に一固まりに配置し、その配置
    された状態で前記出力することを特徴とする請求項5、
    13、25または29記載の情報要約方法。
  51. 【請求項51】 前記情報要約として互いに関連する複
    数のキーワードが実質的に一固まりに配置され、その配
    置された状態で前記出力手段により出力することを特徴
    とする請求項6、14、26または30記載の情報要約
    装置。
  52. 【請求項52】 前記情報要約として互いに関連する複
    数のキーワードを表示部を用いて出力する場合、それら
    複数のキーワードのうち、1つ目のキーワードの表示位
    置を基準として、残りのキーワードを前記基準となる表
    示位置より所定の文字数だけ字下げした位置に改行して
    表示し、前記互いに関連する複数のキーワードを視覚的
    に一固まりに表示することを特徴とする請求項5、1
    3、25または29記載の情報要約方法。
  53. 【請求項53】 前記出力手段は、前記情報要約として
    互いに関連する複数のキーワードを表示する表示部を有
    し、 その表示部に表示される前記複数のキーワードのうち、
    1つ目のキーワードの表示位置を基準として、残りのキ
    ーワードを前記基準となる表示位置よりより所定の文字
    数だけ字下げした位置に改行して表示し、前記互いに関
    連する複数のキーワードを視覚的に一固まりに表示する
    ための表示制御部を備えたことを特徴とする請求項6、
    14、26または30記載の情報要約装置。
JP7253981A 1994-11-18 1995-09-29 情報要約方法、情報要約装置、重み付け方法、および文字放送受信装置。 Expired - Fee Related JP2809341B2 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP7253981A JP2809341B2 (ja) 1994-11-18 1995-09-29 情報要約方法、情報要約装置、重み付け方法、および文字放送受信装置。
US08/560,394 US6064952A (en) 1994-11-18 1995-11-17 Information abstracting method, information abstracting apparatus, and weighting method
CNB951188496A CN1178164C (zh) 1994-11-18 1995-11-17 信息提取方法和设备,加权方法和图文电视广播接收设备
KR1019950041892A KR960018990A (ko) 1994-11-18 1995-11-17 정보요약방법, 정보요약장치, 가중화방법, 및 문자방송수신장치
US09/211,385 US6240378B1 (en) 1994-11-18 1998-12-14 Weighting method for use in information extraction and abstracting, based on the frequency of occurrence of keywords and similarity calculations
US09/754,470 US6502065B2 (en) 1994-11-18 2001-01-03 Teletext broadcast receiving apparatus using keyword extraction and weighting

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP6-285718 1994-11-18
JP28571894 1994-11-18
JP6634095 1995-03-24
JP7-66340 1995-03-24
JP7253981A JP2809341B2 (ja) 1994-11-18 1995-09-29 情報要約方法、情報要約装置、重み付け方法、および文字放送受信装置。

Publications (2)

Publication Number Publication Date
JPH08329118A JPH08329118A (ja) 1996-12-13
JP2809341B2 true JP2809341B2 (ja) 1998-10-08

Family

ID=27299089

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7253981A Expired - Fee Related JP2809341B2 (ja) 1994-11-18 1995-09-29 情報要約方法、情報要約装置、重み付け方法、および文字放送受信装置。

Country Status (4)

Country Link
US (3) US6064952A (ja)
JP (1) JP2809341B2 (ja)
KR (1) KR960018990A (ja)
CN (1) CN1178164C (ja)

Families Citing this family (151)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2809341B2 (ja) * 1994-11-18 1998-10-08 松下電器産業株式会社 情報要約方法、情報要約装置、重み付け方法、および文字放送受信装置。
US6112201A (en) * 1995-08-29 2000-08-29 Oracle Corporation Virtual bookshelf
US5778367A (en) * 1995-12-14 1998-07-07 Network Engineering Software, Inc. Automated on-line information service and directory, particularly for the world wide web
WO1998016889A1 (fr) * 1996-10-16 1998-04-23 Sharp Kabushiki Kaisha Appareil d'entree de caracteres et support de donnees dans lequel le programme d'entree de caracteres est mis en memoire
JP3282976B2 (ja) * 1996-11-15 2002-05-20 株式会社キングジム 文字情報処理装置及び方法
JPH10187752A (ja) * 1996-12-24 1998-07-21 Kokusai Denshin Denwa Co Ltd <Kdd> 言語間情報検索支援システム
US6104802A (en) 1997-02-10 2000-08-15 Genesys Telecommunications Laboratories, Inc. In-band signaling for routing
US7031442B1 (en) 1997-02-10 2006-04-18 Genesys Telecommunications Laboratories, Inc. Methods and apparatus for personal routing in computer-simulated telephony
US6480600B1 (en) 1997-02-10 2002-11-12 Genesys Telecommunications Laboratories, Inc. Call and data correspondence in a call-in center employing virtual restructuring for computer telephony integrated functionality
JPH1125091A (ja) * 1997-07-09 1999-01-29 Just Syst Corp 文書要約支援装置およびその装置としてコンピュータを機能させるためのコンピュータ読み取り可能な記録媒体
US6985943B2 (en) 1998-09-11 2006-01-10 Genesys Telecommunications Laboratories, Inc. Method and apparatus for extended management of state and interaction of a remote knowledge worker from a contact center
US6711611B2 (en) 1998-09-11 2004-03-23 Genesis Telecommunications Laboratories, Inc. Method and apparatus for data-linking a mobile knowledge worker to home communication-center infrastructure
US6961954B1 (en) 1997-10-27 2005-11-01 The Mitre Corporation Automated segmentation, information extraction, summarization, and presentation of broadcast news
USRE46528E1 (en) 1997-11-14 2017-08-29 Genesys Telecommunications Laboratories, Inc. Implementation of call-center outbound dialing capability at a telephony network level
US7907598B2 (en) 1998-02-17 2011-03-15 Genesys Telecommunication Laboratories, Inc. Method for implementing and executing communication center routing strategies represented in extensible markup language
US6332154B2 (en) 1998-09-11 2001-12-18 Genesys Telecommunications Laboratories, Inc. Method and apparatus for providing media-independent self-help modules within a multimedia communication-center customer interface
US6346952B1 (en) * 1999-12-01 2002-02-12 Genesys Telecommunications Laboratories, Inc. Method and apparatus for summarizing previous threads in a communication-center chat session
JP3609252B2 (ja) * 1998-03-23 2005-01-12 沖電気工業株式会社 文字列自動分類装置およびその方法
KR100686622B1 (ko) * 1998-05-22 2007-02-23 코닌클리케 필립스 일렉트로닉스 엔.브이. 키워드 검출수단을 구비한 기록장치
JP3665480B2 (ja) * 1998-06-24 2005-06-29 富士通株式会社 文書整理装置および方法
USRE46153E1 (en) 1998-09-11 2016-09-20 Genesys Telecommunications Laboratories, Inc. Method and apparatus enabling voice-based management of state and interaction of a remote knowledge worker in a contact center environment
US6317708B1 (en) * 1999-01-07 2001-11-13 Justsystem Corporation Method for producing summaries of text document
US6266094B1 (en) * 1999-06-14 2001-07-24 Medialink Worldwide Incorporated Method and apparatus for the aggregation and selective retrieval of television closed caption word content originating from multiple geographic locations
US7929978B2 (en) 1999-12-01 2011-04-19 Genesys Telecommunications Laboratories, Inc. Method and apparatus for providing enhanced communication capability for mobile devices on a virtual private network
US6845369B1 (en) * 2000-01-14 2005-01-18 Relevant Software Inc. System, apparatus and method for using and managing digital information
AU2001249240A1 (en) * 2000-03-17 2001-10-03 Jeffrey Williams Dahms Method and system for accessing medical information
US7035864B1 (en) * 2000-05-18 2006-04-25 Endeca Technologies, Inc. Hierarchical data-driven navigation system and method for information retrieval
US7617184B2 (en) 2000-05-18 2009-11-10 Endeca Technologies, Inc. Scalable hierarchical data-driven navigation system and method for information retrieval
US7325201B2 (en) * 2000-05-18 2008-01-29 Endeca Technologies, Inc. System and method for manipulating content in a hierarchical data-driven search and navigation system
US7062483B2 (en) * 2000-05-18 2006-06-13 Endeca Technologies, Inc. Hierarchical data-driven search and navigation system and method for information retrieval
DE10031351A1 (de) * 2000-06-28 2002-01-17 Guru Netservices Gmbh Verfahren zur automatischen Recherche
WO2002021324A1 (en) * 2000-09-07 2002-03-14 Intel Corporation Method and apparatus for summarizing multiple documents using a subsumption model
US20020083468A1 (en) * 2000-11-16 2002-06-27 Dudkiewicz Gil Gavriel System and method for generating metadata for segments of a video program
US20020092022A1 (en) * 2000-11-16 2002-07-11 Dudkicwicz Gil Gavriel System and method for using programming event timing data in a recording device
US7444660B2 (en) * 2000-11-16 2008-10-28 Meevee, Inc. System and method for generating metadata for video programming events
JP2002230035A (ja) * 2001-01-05 2002-08-16 Internatl Business Mach Corp <Ibm> 情報整理方法、情報処理装置、情報処理システム、記憶媒体、およびプログラム伝送装置
US8156051B1 (en) * 2001-01-09 2012-04-10 Northwest Software, Inc. Employment recruiting system
KR100404322B1 (ko) * 2001-01-16 2003-11-01 한국전자통신연구원 멀티모달 특징 기반의 뉴스 비디오 요약 방법
US6903782B2 (en) * 2001-03-28 2005-06-07 Koninklijke Philips Electronics N.V. System and method for performing segmentation-based enhancements of a video image
EP1413131B1 (en) * 2001-07-19 2013-06-19 Koninklijke Philips Electronics N.V. Method and apparatus for providing a user interface
KR100451004B1 (ko) * 2001-08-13 2004-10-06 한국전자통신연구원 폐쇄자막 기반의 뉴스 비디오 데이터베이스 생성 장치 및방법과 그에 따른 내용기반 검색/탐색 방법
US7096179B2 (en) * 2001-08-15 2006-08-22 Siemens Corporate Research, Inc. Text-based automatic content classification and grouping
KR100435442B1 (ko) * 2001-11-13 2004-06-10 주식회사 포스코 문서 요약 방법 및 시스템
AU2006203729B2 (en) * 2001-11-26 2008-07-31 Fujitsu Limited Information analyzing method and apparatus
US7814043B2 (en) * 2001-11-26 2010-10-12 Fujitsu Limited Content information analyzing method and apparatus
JP3624186B2 (ja) * 2002-03-15 2005-03-02 Tdk株式会社 スイッチング電源装置用の制御回路及びこれを用いたスイッチング電源装置
JP4406815B2 (ja) * 2002-06-26 2010-02-03 ソニー株式会社 情報処理装置および方法、記録媒体、並びにプログラム
US20040186704A1 (en) * 2002-12-11 2004-09-23 Jiping Sun Fuzzy based natural speech concept system
US8037496B1 (en) 2002-12-27 2011-10-11 At&T Intellectual Property Ii, L.P. System and method for automatically authoring interactive television content
US7783617B2 (en) * 2003-04-16 2010-08-24 Yahoo! Inc. Personals advertisement affinities in a networked computer system
US6873996B2 (en) * 2003-04-16 2005-03-29 Yahoo! Inc. Affinity analysis method and article of manufacture
US20050033771A1 (en) * 2003-04-30 2005-02-10 Schmitter Thomas A. Contextual advertising system
AU2004271623A1 (en) * 2003-09-05 2005-03-17 Stephen D. Grody Methods and apparatus for providing services using speech recognition
US20050106539A1 (en) * 2003-11-17 2005-05-19 International Business Machines Corporation Self-configuring keyword derivation
US7844589B2 (en) * 2003-11-18 2010-11-30 Yahoo! Inc. Method and apparatus for performing a search
CN1629833A (zh) * 2003-12-17 2005-06-22 国际商业机器公司 实现问与答功能和计算机辅助写作的方法及装置
JP2005228016A (ja) * 2004-02-13 2005-08-25 Hitachi Ltd 文字表示方法
US8676830B2 (en) * 2004-03-04 2014-03-18 Yahoo! Inc. Keyword recommendation for internet search engines
US7428528B1 (en) 2004-03-31 2008-09-23 Endeca Technologies, Inc. Integrated application for manipulating content in a hierarchical data-driven search and navigation system
US8914383B1 (en) 2004-04-06 2014-12-16 Monster Worldwide, Inc. System and method for providing job recommendations
US11409812B1 (en) * 2004-05-10 2022-08-09 Google Llc Method and system for mining image searches to associate images with concepts
US7739142B2 (en) * 2004-05-17 2010-06-15 Yahoo! Inc. System and method for providing automobile marketing research information
US7672845B2 (en) * 2004-06-22 2010-03-02 International Business Machines Corporation Method and system for keyword detection using voice-recognition
US7617176B2 (en) * 2004-07-13 2009-11-10 Microsoft Corporation Query-based snippet clustering for search result grouping
CA2574554A1 (en) * 2004-07-21 2006-01-26 Equivio Ltd. A method for determining near duplicate data objects
JP4650927B2 (ja) * 2004-08-13 2011-03-16 ソニー株式会社 情報処理装置および方法、並びにプログラム
US20080250452A1 (en) * 2004-08-19 2008-10-09 Kota Iwamoto Content-Related Information Acquisition Device, Content-Related Information Acquisition Method, and Content-Related Information Acquisition Program
US7386542B2 (en) * 2004-08-30 2008-06-10 The Mitre Corporation Personalized broadcast news navigator
US20060085181A1 (en) * 2004-10-20 2006-04-20 Kabushiki Kaisha Toshiba Keyword extraction apparatus and keyword extraction program
KR100746074B1 (ko) * 2004-12-20 2007-08-06 엘지전자 주식회사 디지털 방송 수신기에서 텍스트 콘텐츠 변환 저장장치와방법
US7769579B2 (en) 2005-05-31 2010-08-03 Google Inc. Learning facts from semi-structured text
US7536389B1 (en) * 2005-02-22 2009-05-19 Yahoo ! Inc. Techniques for crawling dynamic web content
WO2006099300A2 (en) 2005-03-11 2006-09-21 Yahoo!Inc. System and method for listing data acquisition
US7587387B2 (en) 2005-03-31 2009-09-08 Google Inc. User interface for facts query engine with snippets from information sources that include query terms and answer terms
US9208229B2 (en) * 2005-03-31 2015-12-08 Google Inc. Anchor text summarization for corroboration
US8682913B1 (en) 2005-03-31 2014-03-25 Google Inc. Corroborating facts extracted from multiple sources
US8433713B2 (en) 2005-05-23 2013-04-30 Monster Worldwide, Inc. Intelligent job matching system and method
US8527510B2 (en) 2005-05-23 2013-09-03 Monster Worldwide, Inc. Intelligent job matching system and method
US8375067B2 (en) 2005-05-23 2013-02-12 Monster Worldwide, Inc. Intelligent job matching system and method including negative filtration
US8996470B1 (en) 2005-05-31 2015-03-31 Google Inc. System for ensuring the internal consistency of a fact repository
US7831545B1 (en) * 2005-05-31 2010-11-09 Google Inc. Identifying the unifying subject of a set of facts
JP4752623B2 (ja) * 2005-06-16 2011-08-17 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
US7610267B2 (en) * 2005-06-28 2009-10-27 Yahoo! Inc. Unsupervised, automated web host dynamicity detection, dead link detection and prerequisite page discovery for search indexed web pages
US20070022085A1 (en) * 2005-07-22 2007-01-25 Parashuram Kulkarni Techniques for unsupervised web content discovery and automated query generation for crawling the hidden web
JP2007072646A (ja) * 2005-09-06 2007-03-22 Internatl Business Mach Corp <Ibm> 検索装置、検索方法およびプログラム
KR100880663B1 (ko) * 2005-10-04 2009-02-02 정길남 그리드에서 요약화면 생성방법 및 시스템
US8019752B2 (en) 2005-11-10 2011-09-13 Endeca Technologies, Inc. System and method for information retrieval from object collections with complex interrelationships
JP2007133809A (ja) * 2005-11-14 2007-05-31 Canon Inc 情報処理装置、コンテンツ処理方法、記憶媒体およびプログラム
US7752190B2 (en) * 2005-12-21 2010-07-06 Ebay Inc. Computer-implemented method and system for managing keyword bidding prices
US7792858B2 (en) * 2005-12-21 2010-09-07 Ebay Inc. Computer-implemented method and system for combining keywords into logical clusters that share similar behavior with respect to a considered dimension
US8036937B2 (en) 2005-12-21 2011-10-11 Ebay Inc. Computer-implemented method and system for enabling the automated selection of keywords for rapid keyword portfolio expansion
US9008075B2 (en) 2005-12-22 2015-04-14 Genesys Telecommunications Laboratories, Inc. System and methods for improving interaction routing performance
US8195657B1 (en) 2006-01-09 2012-06-05 Monster Worldwide, Inc. Apparatuses, systems and methods for data entry correlation
US7644373B2 (en) 2006-01-23 2010-01-05 Microsoft Corporation User interface for viewing clusters of images
US7836050B2 (en) 2006-01-25 2010-11-16 Microsoft Corporation Ranking content based on relevance and quality
US8260785B2 (en) 2006-02-17 2012-09-04 Google Inc. Automatic object reference identification and linking in a browseable fact repository
US7814040B1 (en) 2006-01-31 2010-10-12 The Research Foundation Of State University Of New York System and method for image annotation and multi-modal image retrieval using probabilistic semantic models
US7689554B2 (en) * 2006-02-28 2010-03-30 Yahoo! Inc. System and method for identifying related queries for languages with multiple writing systems
JP2007266827A (ja) * 2006-03-28 2007-10-11 Funai Electric Co Ltd 放送受信装置
US8600931B1 (en) 2006-03-31 2013-12-03 Monster Worldwide, Inc. Apparatuses, methods and systems for automated online data submission
US20070288308A1 (en) * 2006-05-25 2007-12-13 Yahoo Inc. Method and system for providing job listing affinity
JP5067370B2 (ja) * 2006-08-08 2012-11-07 ソニー株式会社 受信装置、表示制御方法、及びプログラム
US7996393B1 (en) 2006-09-29 2011-08-09 Google Inc. Keywords associated with document categories
US7707208B2 (en) * 2006-10-10 2010-04-27 Microsoft Corporation Identifying sight for a location
US8122026B1 (en) 2006-10-20 2012-02-21 Google Inc. Finding and disambiguating references to entities on web pages
US20080120257A1 (en) * 2006-11-20 2008-05-22 Yahoo! Inc. Automatic online form filling using semantic inference
US8676802B2 (en) * 2006-11-30 2014-03-18 Oracle Otc Subsidiary Llc Method and system for information retrieval with clustering
US8347202B1 (en) 2007-03-14 2013-01-01 Google Inc. Determining geographic locations for place names in a fact repository
US20080235148A1 (en) * 2007-03-20 2008-09-25 Jiezhou Liu Online Dynamic Evaluation and Search for Products and Services
JP2009010797A (ja) * 2007-06-29 2009-01-15 Hitachi Ltd 情報提示方法及び装置
US20090012984A1 (en) * 2007-07-02 2009-01-08 Equivio Ltd. Method for Organizing Large Numbers of Documents
US7970766B1 (en) 2007-07-23 2011-06-28 Google Inc. Entity type assignment
US8073682B2 (en) 2007-10-12 2011-12-06 Palo Alto Research Center Incorporated System and method for prospecting digital information
US8671104B2 (en) * 2007-10-12 2014-03-11 Palo Alto Research Center Incorporated System and method for providing orientation into digital information
US8165985B2 (en) * 2007-10-12 2012-04-24 Palo Alto Research Center Incorporated System and method for performing discovery of digital information in a subject area
US20090119276A1 (en) * 2007-11-01 2009-05-07 Antoine Sorel Neron Method and Internet-based Search Engine System for Storing, Sorting, and Displaying Search Results
US7856434B2 (en) * 2007-11-12 2010-12-21 Endeca Technologies, Inc. System and method for filtering rules for manipulating search results in a hierarchical search and navigation system
US8812435B1 (en) 2007-11-16 2014-08-19 Google Inc. Learning objects and facts from documents
WO2009084757A1 (en) * 2007-12-31 2009-07-09 Dki Technology Co., Ltd. Method and apparatus for extracting keyword data
US10387837B1 (en) 2008-04-21 2019-08-20 Monster Worldwide, Inc. Apparatuses, methods and systems for career path advancement structuring
JP2009277183A (ja) * 2008-05-19 2009-11-26 Hitachi Ltd 情報識別装置及び情報識別システム
CN101615182A (zh) * 2008-06-27 2009-12-30 西门子公司 中医症状信息存储系统及中医症状信息存储方法
US8010545B2 (en) * 2008-08-28 2011-08-30 Palo Alto Research Center Incorporated System and method for providing a topic-directed search
US20100057536A1 (en) * 2008-08-28 2010-03-04 Palo Alto Research Center Incorporated System And Method For Providing Community-Based Advertising Term Disambiguation
US8209616B2 (en) * 2008-08-28 2012-06-26 Palo Alto Research Center Incorporated System and method for interfacing a web browser widget with social indexing
US20100057577A1 (en) * 2008-08-28 2010-03-04 Palo Alto Research Center Incorporated System And Method For Providing Topic-Guided Broadening Of Advertising Targets In Social Indexing
US7730061B2 (en) * 2008-09-12 2010-06-01 International Business Machines Corporation Fast-approximate TFIDF
US20100082356A1 (en) * 2008-09-30 2010-04-01 Yahoo! Inc. System and method for recommending personalized career paths
TWI377478B (en) * 2008-10-07 2012-11-21 Mitac Int Corp Self-learning method for keyword based human machine interaction and portable navigation device using the method
US8549016B2 (en) * 2008-11-14 2013-10-01 Palo Alto Research Center Incorporated System and method for providing robust topic identification in social indexes
JP5488475B2 (ja) * 2008-12-15 2014-05-14 日本電気株式会社 トピック遷移解析システム、トピック遷移解析方法およびプログラム
US8356044B2 (en) * 2009-01-27 2013-01-15 Palo Alto Research Center Incorporated System and method for providing default hierarchical training for social indexing
US8452781B2 (en) * 2009-01-27 2013-05-28 Palo Alto Research Center Incorporated System and method for using banded topic relevance and time for article prioritization
US8239397B2 (en) * 2009-01-27 2012-08-07 Palo Alto Research Center Incorporated System and method for managing user attention by detecting hot and cold topics in social indexes
US20100235314A1 (en) * 2009-02-12 2010-09-16 Decisive Analytics Corporation Method and apparatus for analyzing and interrelating video data
US8458105B2 (en) * 2009-02-12 2013-06-04 Decisive Analytics Corporation Method and apparatus for analyzing and interrelating data
WO2010106660A1 (ja) * 2009-03-19 2010-09-23 コニカミノルタホールディングス株式会社 特徴語提示装置及び特徴語提示プログラム
US8266006B2 (en) 2009-11-03 2012-09-11 Ebay Inc. Method, medium, and system for keyword bidding in a market cooperative
US20110208738A1 (en) * 2010-02-23 2011-08-25 Kenshoo Ltd. Method for Determining an Enhanced Value to Keywords Having Sparse Data
US9031944B2 (en) 2010-04-30 2015-05-12 Palo Alto Research Center Incorporated System and method for providing multi-core and multi-level topical organization in social indexes
JP5012981B2 (ja) 2010-09-09 2012-08-29 カシオ計算機株式会社 電子辞書装置およびプログラム
US20120185332A1 (en) * 2011-01-14 2012-07-19 Google Inc. Serving Advertisements Based on Article Availability
WO2012150637A1 (ja) * 2011-05-02 2012-11-08 富士通株式会社 抽出方法、情報処理方法、抽出プログラム、情報処理プログラム、抽出装置、および情報処理装置
CN103198057B (zh) * 2012-01-05 2017-11-07 深圳市世纪光速信息技术有限公司 一种自动给文档添加标签的方法和装置
US20140123178A1 (en) * 2012-04-27 2014-05-01 Mixaroo, Inc. Self-learning methods, entity relations, remote control, and other features for real-time processing, storage, indexing, and delivery of segmented video
US20170330153A1 (en) 2014-05-13 2017-11-16 Monster Worldwide, Inc. Search Extraction Matching, Draw Attention-Fit Modality, Application Morphing, and Informed Apply Apparatuses, Methods and Systems
JP6413597B2 (ja) * 2014-10-10 2018-10-31 富士通株式会社 分析プログラム、分析方法及び分析装置
US9922116B2 (en) * 2014-10-31 2018-03-20 Cisco Technology, Inc. Managing big data for services
US10902192B2 (en) * 2017-11-20 2021-01-26 Adobe Inc. Dynamic digital document visual aids in a digital medium environment
CN110555202A (zh) * 2018-05-30 2019-12-10 微软技术许可有限责任公司 文摘播报的生成方法和设备
CN109582967B (zh) * 2018-12-03 2023-08-18 深圳前海微众银行股份有限公司 舆情摘要提取方法、装置、设备及计算机可读存储介质

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4270182A (en) * 1974-12-30 1981-05-26 Asija Satya P Automated information input, storage, and retrieval system
US4930077A (en) * 1987-04-06 1990-05-29 Fan David P Information processing expert system for text analysis and predicting public opinion based information available to the public
JPH0682370B2 (ja) * 1987-05-26 1994-10-19 シャープ株式会社 文字処理装置
JP2783558B2 (ja) * 1988-09-30 1998-08-06 株式会社東芝 要約生成方法および要約生成装置
JPH02202674A (ja) * 1989-02-01 1990-08-10 Fuji Xerox Co Ltd 情報検索方式
EP0470988B1 (de) * 1989-05-03 1994-12-14 Thomson Consumer Electronics Sales GmbH Verfahren zum übertragen von teletextdaten und einrichtung zur durchführung des verfahrens
US5258909A (en) * 1989-08-31 1993-11-02 International Business Machines Corporation Method and apparatus for "wrong word" spelling error detection and correction
JPH0418673A (ja) * 1990-05-11 1992-01-22 Hitachi Ltd テキスト情報抽出方法および装置
JPH0471067A (ja) * 1990-07-12 1992-03-05 Fuji Xerox Co Ltd データベース通信方式
JP2943447B2 (ja) * 1991-01-30 1999-08-30 三菱電機株式会社 テキスト情報抽出装置とテキスト類似照合装置とテキスト検索システムとテキスト情報抽出方法とテキスト類似照合方法、及び、質問解析装置
US5251131A (en) * 1991-07-31 1993-10-05 Thinking Machines Corporation Classification of data records by comparison of records to a training database using probability weights
JPH0581327A (ja) * 1991-09-19 1993-04-02 Fujitsu Ltd 情報検索支援処理装置
ES2134822T3 (es) * 1992-04-21 1999-10-16 Koninkl Philips Electronics Nv Decodificador de teletexto y receptor de television provisto de un decodificador de teletexto.
JPH06282587A (ja) * 1993-03-24 1994-10-07 Tokyo Electric Power Co Inc:The 文書の自動分類方法及び装置並びに分類用の辞書作成方法及び装置
US5384703A (en) * 1993-07-02 1995-01-24 Xerox Corporation Method and apparatus for summarizing documents according to theme
DE4323241A1 (de) * 1993-07-12 1995-02-02 Ibm Verfahren und Computersystem zur Suche fehlerhafter Zeichenketten in einem Text
US5873056A (en) * 1993-10-12 1999-02-16 The Syracuse University Natural language processing system for semantic vector representation which accounts for lexical ambiguity
US5799268A (en) * 1994-09-28 1998-08-25 Apple Computer, Inc. Method for extracting knowledge from online documentation and creating a glossary, index, help database or the like
JP2809341B2 (ja) * 1994-11-18 1998-10-08 松下電器産業株式会社 情報要約方法、情報要約装置、重み付け方法、および文字放送受信装置。
US5758257A (en) * 1994-11-29 1998-05-26 Herz; Frederick System and method for scheduling broadcast of and access to video programs and other data using customer profiles
US5689716A (en) * 1995-04-14 1997-11-18 Xerox Corporation Automatic method of generating thematic summaries
US5778397A (en) * 1995-06-28 1998-07-07 Xerox Corporation Automatic method of generating feature probabilities for automatic extracting summarization
JPH0993550A (ja) * 1995-09-22 1997-04-04 Toshiba Corp 補完番組検知及び表示装置
US5931907A (en) * 1996-01-23 1999-08-03 British Telecommunications Public Limited Company Software agent for comparing locally accessible keywords with meta-information and having pointers associated with distributed information

Also Published As

Publication number Publication date
KR960018990A (ko) 1996-06-17
JPH08329118A (ja) 1996-12-13
US6502065B2 (en) 2002-12-31
CN1133460A (zh) 1996-10-16
CN1178164C (zh) 2004-12-01
US6240378B1 (en) 2001-05-29
US6064952A (en) 2000-05-16
US20020072895A1 (en) 2002-06-13

Similar Documents

Publication Publication Date Title
JP2809341B2 (ja) 情報要約方法、情報要約装置、重み付け方法、および文字放送受信装置。
US7519590B2 (en) Method and system for performing phrase/word clustering and cluster merging
JPH09101990A (ja) 情報フィルタリング装置
US20090119274A1 (en) Named entity extracting apparatus, method, and program
JP2011529600A (ja) 意味ベクトルおよびキーワード解析を使用することによるデータセットを関係付けるための方法および装置
JP5587821B2 (ja) 文書トピック抽出装置及び方法及びプログラム
US7284006B2 (en) Method and apparatus for browsing document content
TW200805095A (en) Data product search using related concepts
JP2669601B2 (ja) 情報検索方法及びシステム
CN115794995A (zh) 目标答案获取方法及相关装置、电子设备和存储介质
JP3584848B2 (ja) 文書処理装置、項目検索装置及び項目検索方法
JP3864687B2 (ja) 情報分類装置
Giri et al. A survey of automatic text summarization system for different regional language in India
JP5415369B2 (ja) 番組検索装置および番組検索プログラム
Amalia et al. Indonesian-Translated Hadith Content Weighting in Pseudo-Relevance Feedback Query Expansion
JP2000105769A (ja) 文書表示方法
CN111831922B (zh) 一种基于互联网信息的推荐系统与方法
JP2008203997A (ja) 文書検索装置及びプログラム
JPH08166961A (ja) 情報提供装置、および文字放送受信装置
JP2000339342A (ja) 文書検索方法および文書検索装置
JP2002140357A (ja) 文書検索装置及び文書検索方法
JP3638161B2 (ja) 情報抽出装置及び情報抽出機能付き文字放送受信装置
WO2010106660A1 (ja) 特徴語提示装置及び特徴語提示プログラム
JPH08241328A (ja) 関連項目の蓄積・提示装置、関連項目の蓄積・提示方法及びデータベース検索システム
WO1992009960A1 (en) Data retrieving device

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees