JP3638161B2 - 情報抽出装置及び情報抽出機能付き文字放送受信装置 - Google Patents

情報抽出装置及び情報抽出機能付き文字放送受信装置 Download PDF

Info

Publication number
JP3638161B2
JP3638161B2 JP14620895A JP14620895A JP3638161B2 JP 3638161 B2 JP3638161 B2 JP 3638161B2 JP 14620895 A JP14620895 A JP 14620895A JP 14620895 A JP14620895 A JP 14620895A JP 3638161 B2 JP3638161 B2 JP 3638161B2
Authority
JP
Japan
Prior art keywords
character string
character
format
page
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP14620895A
Other languages
English (en)
Other versions
JPH08340519A (ja
Inventor
鉄也 八木
今中  武
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP14620895A priority Critical patent/JP3638161B2/ja
Publication of JPH08340519A publication Critical patent/JPH08340519A/ja
Application granted granted Critical
Publication of JP3638161B2 publication Critical patent/JP3638161B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Television Systems (AREA)

Description

【0001】
【産業上の利用分野】
本発明は、例えば、時系列に従って順次送られてくる文字列データを処理する場合に利用可能な情報抽出装置及び情報抽出機能付き文字放送受信装置に関するものである。
【0002】
【従来の技術】
近年、数多くの情報が通信や放送などを通じて提供されてきている。これらの情報の中には、テレビ、ラジオなど映像、音声に関するものに加えて文字放送などの文字情報がある。文字情報はASCIIコード、JISコードなど計算機で容易に処理できる文字コードで表現されているため、提供する側にとっては複写や再利用がしやすいなどの利点がある。しかしながら、人間にとってはそれらの複写・再利用された文字情報を何度も読まされる場合があり、最低限読みたい情報のみを手に入れるために必要な時間が多い、あるいは共通の話題を追跡することが困難となる、といった問題がある。この問題は、情報化社会が進展する中、提供される情報はますます増えていくことを考えれば、さらに深刻になる。このような問題に対し、自動的に文書内容を解釈することにより文書同士を関連付けたり、情報のフィルタリングを行うための技術への取り組みが考えられる。このような取り組みの例として、人工知能研究分野における自然言語処理の研究がある。しかしながら、大規模な辞書情報、文法情報などが必要である上に文書内容を誤って解釈する確率を実用レベルにまで引き下げるのが困難など現実的問題に適用するには問題点が多く、実際的な応用例は少ない。
【0003】
一方、近年では文字コードが放送として送られてくる文字放送を対象とした受信装置が開発、販売されており、家庭内に向けて提供される文字情報は急激に増えてきている。文字放送では、情報の形態が文字なので、利用者はテレビに映し出される文章を読むことによって情報を得ることができる。しかし、文字放送の番組はいくつかの頁が1画面ごとに表示され、どの番組のどの頁に必要な情報が含まれているかは予め把握することができない。この結果、必要な情報を得るためには大量の文字を読まなければならない、頁をめくりながら順に読まなければならない、などの問題が生じる。また、文字放送の番組は時時刻刻と更新されるが、必ずしも更新のタイミングは予測できず、新しい情報を知りたい場合に画面の前でじっと待つ必要がある。このため、文字放送において多くの文字情報の中から一覧性のあるものだけを取り出したり、全く新規の情報のみを表示するなどの機能の必要性が高まっている。
【0004】
また従来より、文書データの重要性を検出する技術として実用化されているものとしてキーワード検索技術がある。この技術は、学術論文などを対象とし、ある特定のキーワードを含む論文を全て抽出するものである。このような技術が実用化された背景には、検索者の興味がいくつかのキーワードの組み合わせで表すことができ、自然言語処理のような文書の意味内容による検索ではなくごく短い文字列の検出により比較的容易に検索が行えることがある。
【0005】
【発明が解決しようとする課題】
まず文字放送において多くの文字情報の中から人間にとって一覧性のあるものを取り出す技術が必要である。また、全く新規の情報のみを利用者に提供するためのフィルタリング技術に関しても、以前に入力された文書と全文一致する文書を取り除くだけでは不十分である。特に利用者にとって価値の高い速報性のある情報を抽出するために、以前に入力された文書との類似性を判別し、微妙に違っている情報を抜き出して提供する技術が必要である。
【0006】
さらに上述のキーワード検索技術を文字放送番組に適用した場合、まずどういったキーワードを検索に用いるかということが問題となる。文字放送において利用者が注目したいキーワードを設定する場合、例えば株式ニュースでは企業名、スポーツニュースではチーム名といった固有名詞が多く用いられるといった特徴がある。これに対して、企業がいつ上場するか、球団の身売りなどによるチーム名の変更がいつあるかといった予測がたてられないことや、例えば「川崎」「ヴェルディ」「読売」などチーム名の表記の曖昧さから、従来の自然言語処理技術のように予め単語辞書を準備することはできない。従って、単語辞書を用いることなく自動的にキーワードを抽出する技術が必要である。
【0007】
本発明は、このような従来の課題を考慮し、例えば、文字放送受信装置などに関し、時系列に従って順次得られる複数の文字列データから特徴的な形式を持つデータを検出し、重複の度合いを調べることにより、膨大なデータの中から一覧性のある話題や速報性のある話題、利用者の興味のある特定の話題などをいち早く知ることが従来に比べてよりいっそう容易にできる情報提供装置、および文字放送受信装置を提供することを目的とする。
【0008】
【課題を解決するための手段】
請求項1の本発明は、1又は複数のブロックを構成している、文字コードからなる文字列を入力する文字列入力手段と、その文字列入力手段に入力された文字列から前記ブロック毎に文字列を取り出す文字列取り出し手段と、前記文字コードを複数の字種に大別したとき、前記文字列取り出し手段により取り出されるブロックの文字列について、同一の字種が連続する範囲を一つの表項目の領域とみなし、前記表項目の領域の配置情報に基づいて、前記ブロックの文字列の書式が表形式であるかどうかを判定する表形式判定手段と、その表形式判定手段により書式が表形式であると判定されたブロックの文字列を表示する表示手段とを備えたことを特徴とする情報抽出装置である。
【0009】
請求項2の本発明は、1又は複数のブロックを構成している、文字コードからなる文字列を入力する文字列入力手段と、その文字列入力手段に入力された文字列から前記ブロック毎に文字列を取り出す文字列取り出し手段と、前記文字コードを複数の字種に大別したとき、前記文字列取り出し手段により取り出されるブロックの文字列について、同一の字種が連続する範囲を一つの表項目の領域とみなし、前記表項目の領域の配置情報に基づいて、前記ブロックの文字列の書式が表形式であるかどうかを判定する表形式判定手段と、その表形式判定手段により書式が表形式であると判定されたブロックの文字列を記憶する表形式文字列記憶手段と、その表形式文字列記憶手段に記憶されるブロックの文字列を、それより前の時刻にその表形式文字列記憶手段に記憶されたブロックの文字列と比較し、比較結果に所定の比率の範囲内の変化が見られた場合に、その記憶されるブロックの文字列が速報性を有する情報を含んでいると判定する速報性文字列判定手段と、その速報性文字列判定手段により速報性を有する情報を含んでいると判定されたブロックの文字列を表示する表示手段とを備えたことを特徴とする情報抽出装置である。
【0010】
請求項3記載の本発明は、1又は複数のブロックを構成している、文字コードからなる文字列を入力する文字列入力手段と、その文字列入力手段に入力された文字列から前記ブロック毎に文字列を取り出す文字列取り出し手段と、前記文字コードを複数の字種に大別したとき、前記文字列取り出し手段により取り出されるブロックの文字列について、同一の字種が連続する範囲を一つの表項目の領域とみなし、前記表項目の領域の配置情報に基づいて、前記ブロックの文字列の書式が表形式であるかどうかを判定する表形式判定手段と、その表形式判定手段により書式が表形式であると判定されたブロックの文字列を時刻を付して記憶する表形式文字列記憶手段と、その表形式文字列記憶手段に記憶されるブロックの文字列を、それより前の時刻にその表形式文字列記憶手段に記憶されたブロックの文字列と比較し、比較結果に所定の比率の範囲内の変化が見られた場合に、その記憶されるブロックの文字列が速報性を有する情報を含んでいると判定する速報性文字列判定手段と、前記表形式文字列記憶手段に記憶されるブロックの文字列から、表形式判定手段において検出された表項目のうち所定の字種からなる表項目を、所望するブロックを呼び出すためのキーワードとして抽出するキーワード抽出手段と、そのキーワード抽出手段により抽出されたキーワードを表示する第1の表示手段と、その第1の表示手段により表示されたキーワードから、利用者の指示に基づきキーワードを選択するキーワード選択手段と、前記速報性文字列判定手段により速報性を有する情報を含んでいると判定されたブロックの文字列が、前記キーワード選択手段により選択されたキーワードを含むかどうかを判定するキーワードブロック判定手段と、そのキーワードブロック判定手段により速報性を有する情報およびキーワードをともに含んでいると判定されたブロックの文字列を表示する第2の表示手段とを備えたことを特徴とする情報抽出装置である。
【0011】
なお、本発明の情報抽出装置の前記表形式判定手段は、前記表項目の領域の配置情報の1つである、前記表項目の領域の切れ目が、前記ブロックの文字列内の連続した複数の行にわたって存在したときに、前記表項目の領域の切れ目の個数と切れ目の連続する行の数とを掛け合わせた数が、所定の値以上である場合、前記ブロックの文字列の書式が表形式であると判定するとしてもよい。
【0012】
請求項5の本発明は、複数の文字放送に対応する複数のチャンネルを記憶するチャンネル記憶手段と、そのチャンネル記憶手段に記憶されている所定のチャンネルの番組を受信する文字放送受信手段と、その文字放送受信手段により受信された文字放送から1又は複数の頁を構成している、文字コードからなる文字列を入力する文字列入力手段と、その文字列入力手段に入力された文字列から前記頁毎に文字列を取り出す文字列取り出し手段と、前記文字コードを複数の字種に大別したとき、前記文字列取り出し手段により取り出される頁の文字列について、同一の字種が連続する範囲を一つの表項目の領域とみなし、前記表項目の領域の配置情報に基づいて、前記頁の文字列の書式が表形式であるかどうかを判定する表形式判定手段と、その表形式判定手段により書式が表形式であると判定された頁の文字列を表示する表示手段とを備えたことを特徴とする情報抽出機能付き文字放送受信装置である。
【0013】
請求項6の本発明は、複数の文字放送に対応する複数のチャンネルを記憶するチャンネル記憶手段と、そのチャンネル記憶手段に記憶されている所定のチャンネルの番組を受信する文字放送受信手段と、その文字放送受信手段により受信された文字放送から1又は複数の頁を構成している、文字コードからなる文字列を入力する文字列入力手段と、その文字列入力手段に入力された文字列から前記頁毎に文字列を取り出す文字列取り出し手段と、前記文字コードを複数の字種に大別したとき、前記文字列取り出し手段により取り出される頁の文字列について、同一の字種が連続する範囲を一つの表項目の領域とみなし、前記表項目の領域の配置情報に基づいて、前記頁の文字列の書式が表形式であるかどうかを判定する表形式判定手段と、その表形式判定手段により書式が表形式であると判定された頁の文字列を記憶する表形式文字列記憶手段と、その表形式文字列記憶手段に記憶される頁の文字列を、それより前の時刻にその表形式文字列記憶手段に記憶された頁の文字列と比較し、比較結果に所定の比率の範囲内の変化が見られた場合に、その記憶される頁の文字列が速報性を有する情報を含んでいると判定する速報性文字列判定手段と、その速報性文字列判定手段により速報性を有する情報を含んでいると判定された頁の文字列を表示する表示手段とを備えたことを特徴とする情報抽出機能付き文字放送受信装置である。
【0014】
請求項7の本発明は、複数の文字放送に対応する複数のチャンネルを記憶するチャンネル記憶手段と、そのチャンネル記憶手段に記憶されている所定のチャンネルの番組を受信する文字放送受信手段と、その文字放送受信手段により受信された文字放送から1又は複数の頁を構成している、文字コードからなる文字列を入力する文字列入力手段と、その文字列入力手段に入力された文字列から前記頁毎に文字列を取り出す文字列取り出し手段と、前記文字コードを複数の字種に大別したとき、前記文字列取り出し手段により取り出される頁の文字列について、同一の字種が連続する範囲を一つの表項目の領域とみなし、前記表項目の領域の配置情報に基づいて、前記頁の文字列の書式が表形式であるかどうかを判定する表形式判定手段と、その表形式判定手段により書式が表形式であると判定された頁の文字列を時刻を付して記憶する表形式文字列記憶手段と、その表形式文字列記憶手段に記憶される頁の文字列を、それより前の時刻にその表形式文字列記憶手段に記憶された頁の文字列と比較し、比較結果に所定の比率の範囲内の変化が見られた場合に、その記憶される頁の文字列が速報性を有する情報を含んでいると判定する速報性文字列判定手段と、前記表形式文字列記憶手段に記憶される頁の文字列から、表形式判定手段において検出された表項目のうち所定の字種からなる表項目を、所望する頁を呼び出すためのキーワードとして抽出するキーワード抽出手段と、そのキーワード抽出手段により抽出されたキーワードを表示する第1の表示手段と、その第1の表示手段により表示されたキーワードから、利用者の指示に基づきキーワードを選択するキーワード選択手段と、前記速報性文字列判定手段により速報性を有する情報を含んでいると判定された頁の文字列が、前記キーワード選択手段により選択されたキーワードを含むかどうかを判定するキーワード頁判定手段と、そのキーワード頁判定手段により速報性を有する情報およびキーワードをともに含んでいると判定された頁の文字列を表示する第2の表示手段とを備えたことを特徴とする情報抽出機能付き文字放送受信装置である。
【0015】
なお、本発明の情報抽出機能付き文字放送受信装置の前記表形式判定手段は、前記表項目の領域の配置情報の1つである、前記表項目の領域の切れ目が、前記頁の文字列内の連続した複数の行にわたって存在したときに、前記表項目の領域の切れ目の個数と切れ目の連続する行の数とを掛け合わせた数が、所定の値以上である場合、前記頁の文字列の書式が表形式であると判定するとしてもよい。
【0016】
【作用】
請求項1の本発明では、文字列入力手段は、1又は複数のブロックを構成している、文字コードからなる文字列を入力する。文字列取り出し手段は、その文字列入力手段に入力された文字列から前記ブロック毎に文字列を取り出す。表形式判定手段は、前記文字コードを複数の字種に大別したとき、前記文字列取り出し手段により取り出されるブロックの文字列について、同一の字種が連続する範囲を一つの表項目の領域とみなし、前記表項目の領域の配置情報に基づいて、前記ブロックの文字列の書式が表形式であるかどうかを判定する。表示手段は、その表形式判定手段により書式が表形式であると判定されたブロックの文字列を表示する。
【0017】
請求項2の本発明では、文字列入力手段は、1又は複数のブロックを構成している、文字コードからなる文字列を入力する。文字列取り出し手段は、その文字列入力手段に入力された文字列から前記ブロック毎に文字列を取り出す。表形式判定手段は、前記文字コードを複数の字種に大別したとき、前記文字列取り出し手段により取り出されるブロックの文字列について、同一の字種が連続する範囲を一つの表項目の領域とみなし、前記表項目の領域の配置情報に基づいて、前記ブロックの文字列の書式が表形式であるかどうかを判定する。表形式文字列記憶手段は、その表形式判定手段により書式が表形式であると判定されたブロックの文字列を記憶する。速報性文字列判定手段は、その表形式文字列記憶手段に記憶されるブロックの文字列を、それより前の時刻にその表形式文字列記憶手段に記憶されたブロックの文字列と比較し、比較結果に所定の比率の範囲内の変化が見られた場合に、その記憶されるブロックの文字列が速報性を有する情報を含んでいると判定する。表示手段は、その速報性文字列判定手段により速報性を有する情報を含んでいると判定されたブロックの文字列を表示する。
【0018】
請求項3の本発明では、文字列入力手段は、1又は複数のブロックを構成している、文字コードからなる文字列を入力する。文字列取り出し手段は、その文字列入力手段に入力された文字列から前記ブロック毎に文字列を取り出す。表形式判定手段は、前記文字コードを複数の字種に大別したとき、前記文字列取り出し手段により取り出されるブロックの文字列について、同一の字種が連続する範囲を一つの表項目の領域とみなし、前記表項目の領域の配置情報に基づいて、前記ブロックの文字列の書式が表形式であるかどうかを判定する。表形式文字列記憶手段は、その表形式判定手段により書式が表形式であると判定されたブロックの文字列を時刻を付して記憶する。速報性文字列判定手段は、その表形式文字列記憶手段に記憶されるブロックの文字列を、それより前の時刻にその表形式文字列記憶手段に記憶されたブロックの文字列と比較し、比較結果に所定の比率の範囲内の変化が見られた場合に、その記憶されるブロックの文字列が速報性を有する情報を含んでいると判定する。キーワード抽出手段は、前記表形式文字列記憶手段に記憶されるブロックの文字列から、表形式判定手段において検出された表項目のうち所定の字種からなる表項目を、所望するブロックを呼び出すためのキーワードとして抽出する。第1の表示手段は、そのキーワード抽出手段によって抽出されたキーワードを表示する。キーワード選択手段は、その第1の表示手段により表示されたキーワードから、利用者の指示に基づいてキーワードを選択する。キーワードブロック判定手段は、前記速報性文字列判定手段により速報性を有する情報を含んでいると判定されたブロックの文字列が、前記キーワード選択手段により選択されたキーワードを含むかどうかを判定する。第2の表示手段は、そのキーワードブロック判定手段により速報性を有する情報およびキーワードをともに含んでいると判定されたブロックの文字列を表示する。
【0019】
なお、本発明の情報抽出装置では、前記表形式判定手段は、前記表項目の領域の配置情報の1つである、前記表項目の領域の切れ目が、前記ブロックの文字列内の連続した複数の行にわたって存在したときに、前記表項目の領域の切れ目の個数と切れ目の連続する行の数とを掛け合わせた数が、所定の値以上である場合、前記ブロックの文字列の書式が表形式であると判定するとしてもよい。
【0020】
請求項5の本発明では、チャンネル記憶手段は、複数の文字放送に対応する複数のチャンネルを記憶する。文字放送受信手段は、そのチャンネル記憶手段に記憶されている所定のチャンネルの番組を受信する。文字列入力手段は、その文字放送受信手段により受信された文字放送から1又は複数の頁を構成している、文字コードからなる文字列を入力する。文字列取り出し手段は、その文字列入力手段に入力された文字列から前記頁毎に文字列を取り出す。表形式判定手段は、前記文字コードを複数の字種に大別したとき、前記文字列取り出し手段により取り出される頁の文字列について、同一の字種が連続する範囲を一つの表項目の領域とみなし、前記表項目の領域の配置情報に基づいて、前記頁の文字列の書式が表形式であるかどうかを判定する。表示手段は、その表形式判定手段により書式が表形式であると判定された頁の文字列を表示する。
【0021】
請求項6の本発明では、チャンネル記憶手段は、複数の文字放送に対応する複数のチャンネルを記憶する。文字放送受信手段は、そのチャンネル記憶手段に記憶されている所定のチャンネルの番組を受信する。文字列入力手段は、その文字放送受信手段により受信された文字放送から1つ又は複数の頁を構成している、文字コードからなる文字列を入力する。文字列取り出し手段は、その文字列入力手段に入力された文字列から前記頁毎に文字列を取り出す。表形式判定手段は、前記文字コードを複数の字種に大別したとき、前記文字列取り出し手段により取り出される頁の文字列について、同一の字種が連続する範囲を一つの表項目の領域とみなし、前記表項目の領域の配置情報に基づいて、前記頁の文字列の書式が表形式であるかどうかを判定する。表形式文字列記憶手段は、その表形式判定手段により書式が表形式であると判定された頁の文字列を記憶する。速報性文字列判定手段は、その表形式文字列記憶手段に記憶される頁の文字列を、それより前の時刻にその表形式文字列記憶手段に記憶された頁の文字列と比較し、比較結果に所定の比率の範囲内の変化が見られた場合に、その記憶される頁の文字列が速報性を有する情報を含んでいると判定する。表示手段は、その速報性文字列判定手段により速報性を有する情報を含んでいると判定された頁の文字列を表示する。
【0022】
請求項7の本発明では、チャンネル記憶手段は、複数の文字放送に対応する複数のチャンネルを記憶する。文字放送受信手段は、そのチャンネル記憶手段に記憶されている所定のチャンネルの番組を受信する。文字列入力手段は、その文字放送受信手段により受信された文字放送から1又は複数の頁を構成している、文字コードからなる文字列を入力する。文字列取り出し手段は、その文字列入力手段に入力された文字列から前記頁毎に文字列を取り出す。表形式判定手段は、前記文字コードを複数の字種に大別したとき、前記文字列取り出し手段により取り出される頁の文字列について、同一の字種が連続する範囲を一つの表項目の領域とみなし、前記表項目の領域の配置情報に基づいて、前記頁の文字列の書式が表形式であるかどうかを判定する。表形式文字列記憶手段は、その表形式判定手段により書式が表形式であると判定された頁の文字列を時刻を付して記憶する。速報性文字列判定手段は、その表形式文字列記憶手段に記憶される頁の文字列を、それより前の時刻にその表形式文字列記憶手段に記憶された頁の文字列と比較し、比較結果に所定の比率の範囲内の変化が見られた場合に、その記憶される頁の文字列が速報性を有する情報を含んでいると判定する。キーワード抽出手段は、前記表形式文字列記憶手段に記憶される頁の文字列から、表形式判定手段において検出された表項目のうち所定の字種からなる表項目を、所望する頁を呼び出すためのキーワードとして抽出する。第1の表示手段は、そのキーワード抽出手段により抽出されたキーワードを表示する。キーワード選択手段は、その第1の表示手段により表示されたキーワードから、利用者の指示に基づいてキーワードを選択する。キーワード頁判定手段は、速報性文字列判定手段により速報性を有する情報を含んでいると判定された頁の文字列が、前記キーワード選択手段により選択されたキーワードを含むかどうかを判定する。第2の表示手段は、そのキーワード頁判定手段により速報性を有する情報およびキーワードをともに含んでいると判定された頁の文字列を表示する。
【0023】
なお、本発明の情報抽出機能付き文字放送受信装置では、前記表形式判定手段は、前記表項目の領域の配置情報の1つである、前記表項目の領域の切れ目が、前記頁の文字列内の連続した複数の行にわたって存在したときに、前記表項目の領域の切れ目の個数と切れ目の連続する行の数とを掛け合わせた数が、所定の値以上である場合、前記頁の文字列の書式が表形式であると判定するとしてもよい。
【0024】
【実施例】
以下、本発明の実施例について図面を参照しながら説明する。
【0025】
図1は、本発明の請求項1記載の情報抽出装置に係る第1の実施例のシステム構成図である。データ入力部1は、各文字が文字コードで表された文字列データを入力するための入力部である。その文字列はブロックに分けられており、様々な情報を含んだ各ブロックの行数や文字数は不定である。データ入力部1は、その文字列データから各ブロックの文字列データを取り出す。表形式ブロック判定プロセス部3は、データ入力部1で取り出された各ブロックの文字列データの書式が表形式であるかどうかの判定を行い、その書式が表形式である場合には、該当する文字列データを出力部2に出力させるものである。出力部2は、表形式ブロック判定プロセス部3により表形式であると判定されたブロックの文字列データを表示するための周辺装置と表示装置である。
【0026】
データ入力部1は、本発明の請求項1記載の情報抽出装置の文字列入力手段と文字列取り出し手段に対応する。表形式ブロック判定プロセス部3及び出力部2は、それぞれ同発明の表形式判定手段及び表示手段に対応する。
【0027】
次に、本実施例の動作について説明する。図3は、情報の一覧性を考慮した本実施例の動作を示すフローチャートである。本実施例の動作については、図1と図3の2つの図面を参照しながら説明する。即ち、データ入力部1は、文字列データを入力する(ステップa1)。ここで、図4にその入力された文字列データの例を示す。この場合、入力された文字列データは、n個のブロックから構成されており、各ブロックの行数や文字数は一定ではない。図5は、図4で示した文字列データのすべてのブロックを改めて表示した図であり、それは現在放送されている文字放送のデータに基づいて作成されたものである。図5のデータは4個のブロックから構成されており、各ブロックは文字放送における1頁にあたる。図3のステップa1で処理する文字列データは、図4のブロック1〜ブロックnに分類されたスポーツニュースの記事であるものとする。
【0028】
この他にも例えば、スポーツ新聞の内容が記事ごとにブロック1〜ブロックnまでに格納されて入力されるなどの例が考えられる。別の例としては、特定の分野の研究論文が学会ごとにブロック1〜ブロックnに格納されて入力されるなどの例が考えられる。前者の例では、ある日時におけるチーム対戦表や選手の成績などが一覧性のある情報として得られ、後者の例では、研究における実験結果の表などを一覧性のある情報として得ることができる。
【0029】
再度、図1及び図3に戻ってステップa1以降の動作について説明する。データ入力部1は、入力した文字列データから各ブロックの文字列データを取り出す(ステップa2)。各ブロックの文字列データを取り出す順番は、入力された順番であるとする。
【0030】
表形式ブロック判定プロセス部3は、データ入力部1で取り出された各ブロックの文字列データの書式が表形式であるかどうかを判定する(ステップa3)。書式が表形式であるかどうかの判定については、現在の文字放送における表形式の書式には、必ずしも罫線が使用されているわけではないこと、更に、判定のために全ての表形式フォーマットを予め想定し、その準備をすることは事実上困難であることの理由に基づき、字種の違いに基づいて表項目を認識することによって、書式が表形式であるかどうかを判定する方法を用いることにする。具体的には、漢字、カタカナ、ひらがな、アルファベット又はそれに準じるもの、数字又はそれに準じるもの、記号などそれ以外のものに文字を大別し、同じ字種が続く範囲を一つの表項目の領域とみなす。そして、表項目の領域の切れ目が、あるブロック中の連続した複数の行にわたって存在したとき、その表項目の領域の切れ目の個数と切れ目の連続する行の数とを掛け合わせた数が、予め定めた定数S以上であるならば、そのブロックを表形式ブロックであると判定する。例えば、データ入力部1で取り出されたデータが、図4のブロック1であった場合、字種を用いて認識できる表項目の領域の切れ目の個数は4であり、その切れ目の連続する行数は6である。この場合、定数Sを10とすれば、4×6=24なのでS以上となり、表形式であると判定される。
【0031】
表形式ブロック判定プロセス部3は、ブロックの文字列データの書式が表形式であると判定した場合には、該当するブロックの文字列データを出力部2に出力させる。
【0032】
以上のステップa2から以降の処理は、データ入力部1が入力した文字列データから取り出されるブロックが無くなるまで繰り返される。
【0033】
出力部2は、書式が表形式であると判定されたブロックの文字列データを表示する(ステップa4)。結果として、図5に示した入力データについては、図6のような表示がなされる。ところで、図5の文字データのような例ではなく、書式が表形式である複数のブロックが出力部2に出力される場合には、画面を分割して一度に複数のブロックを表示する方法や、一定時間の経過により自動的に表示ブロックを切り替える方法などにより対応させることができる。
【0034】
なお、本実施例では、文字列データから各ブロックを取り出す順番を先入れ先出しの順番であるとしたが、必ずしもこれに限らず、ランダムでも、先入れ後出しであってもよい。
【0035】
また、本実施例では、字種の違いに基づいて表項目を認識することによって、各ブロックに含まれる文字列データの書式が表形式であるかどうかを判定するとしたが、必ずしもこれに限らず、罫線又は定型フォーマットに基づき、各ブロックに含まれる文字列データの書式が表形式であるかどうかを判定するとしてもよい。
【0036】
図2は、本発明の請求項1記載の情報抽出装置に係る第2の実施例のシステム構成図であり、図1のシステムを実行するためのものである。この基本となる構成要素は、汎用の計算機システムと同じである。データ入力部1は、各文字が文字コードで表された文字列データを入力する入力部である。その文字列は各ブロックに分けられており、様々な情報を含んだそのブロックの行数や文字数は不定である。外部記憶装置13は、図3の処理を行うためのプログラムやその処理の過程のデータ等を記憶する記憶装置である。主記憶装置12は、図3の処理を行うためのプログラムやデータを実行時に記憶する主記憶装置である。CPU14は、外部記憶装置13に記憶されている図3の処理を行うためのプログラムを主記憶装置12に転送し、その処理を実行するものである。VRAM11は、出力部2に表示されるデータを記憶するメモリーである。出力部2は、VRAM11に記憶するデータを表示するための表示装置である。
【0037】
データ入力部1は、本発明の請求項1記載の情報抽出装置の文字列入力手段と文字列取り出し手段に対応する。CPU14と主記憶装置12は、同発明の表形式判定手段に対応する。出力部2とVRAM11は、同発明の表示手段に対応する。
【0038】
図7は、本発明の請求項5記載の情報抽出機能付き文字放送受信装置に係る第1の実施例のシステム構成図である。チャンネル記憶部23は、所定の番組のチャンネルを記憶する記憶装置である。文字放送受信部21は、チャンネル記憶部23に記憶されているチャンネルの番組の文字放送を受信する受信装置である。頁切り出しプロセス部24は、文字放送受信部21で受信した番組における文字列データから頁を切り出すものである。この頁とは、文字放送において通常表示される1画面分の文字列データのことであり、前記実施例におけるブロックと同じ概念のものである。表形式頁判定プロセス部25は、頁切り出しプロセス部24で切り出された頁の文字列データを入力し、その文字列データの書式が表形式であるかどうかの判定を行い、そして、その書式が表形式である場合には、該当する文字列データを表示部22に出力させるものである。表示部22は、表形式であると判定された頁を表示するための周辺装置と表示装置である。
【0039】
文字放送受信部21は、本発明の請求項5記載の情報抽出機能付き文字放送受信装置の文字放送受信手段と文字列入力手段に対応する。頁切り出しプロセス部24と表形式頁判定プロセス部25は、それぞれ同発明の文字列取り出し手段と表形式判定手段に対応する。
【0040】
次に、本実施例の動作について説明する。図9は、情報の一覧性を考慮した本実施例の動作を示したフローチャートである。本実施例の動作については、図7及び図9の2つの図面を参照しながら説明する。チャンネル記憶部23は、次の表1に示すように、放送チャンネルを記憶している。
【0041】
【表1】
Figure 0003638161
このようなチャンネルになっているのは、現在の文字放送においてチャンネルの数字と#が付く数字で番組を指定するようになっているためである。チャンネル記憶部23に記憶させるチャンネルの例としては、複数のニュース番組のチャンネルや複数のスポーツ番組のチャンネルなど、特定のジャンルの番組が放送されているチャンネルが考えられる。
【0042】
文字放送受信部21は、放送チャンネルを記憶しているチャンネル記憶部23から各チャンネルを取り出す(ステップb1)。表1の場合、最初のステップb1の処理では、4chと02#が取り出される。この処理は、チャンネル記憶部23で記憶されている一通りのチャンネルが処理されるまで繰り返される。文字放送受信部21は、取り出した各チャンネルの文字放送の番組を受信する(ステップb2)。受信しているチャンネルの文字放送の番組の内容は、主記憶装置12または外部記憶装置13に一時記憶される。頁切り出しプロセス部24は、文字放送受信部21で受信しているチャンネルの文字放送の番組から順番に頁を取り出し、そして、各頁の文字列データを表形式頁判定プロセス部25に出力する(ステップb3)。頁切り出しプロセス部24は、受信している番組から一通りの頁を取り出すまで処理を繰り返す。その処理が終わればステップb1へ進む。表形式頁判定プロセス部25は、頁切り出しプロセス部24で取り出された各頁の文字列データの書式が表形式であるかどうかを判定する(ステップb4)。書式が表形式である場合では、該当する頁の文字列データを表示部22に出力させる。表示部22は、書式が表形式であると判定された頁の文字列データを表示する(ステップb5)。
【0043】
図8は、本発明の請求項5記載の情報抽出機能付き文字放送受信装置に係る第2の実施例のシステム構成図であり、図7のシステムを実行するためのものである。この基本となる構成要素は、汎用の計算機システムと同じである。チャンネル記憶部23は、所定の番組のチャンネルを記憶する記憶部であり、外部記憶装置13に記憶されている。外部記憶装置13は、図9の処理を行うためのプログラムやその処理の過程のデータ等も記憶している。文字放送受信部21は、文字放送を受信するための受信装置である。主記憶装置12は、図9の処理を行うためのプログラムやデータを実行時に記憶する主記憶装置である。CPU14は、外部記憶装置13に記憶されている図9の処理を行うためのプログラムを主記憶装置12に転送し、その処理を実行するものである。VRAM11は、表示部22に表示されるデータを記憶するメモリーである。表示部22は、VRAM11に記憶するデータを表示するための表示装置である。
【0044】
文字放送受信部21は、本発明の請求項5記載の情報抽出機能付き文字放送受信装置の文字放送受信手段と文字列入力手段に対応する。CPU14と主記憶装置12は、同発明の文字列取り出し手段と表形式判定手段に対応する。表示部22とVRAM11は、同発明の表示手段に対応する。
【0045】
図10は、本発明の請求項2記載の情報抽出装置に係る第1の実施例のシステム構成図であり、情報の一覧性及び速報性を考慮したものである。即ち、表形式ブロック記憶部31は、表形式であると判定されたブロックを記憶する記憶装置である。データ入力部1は、各文字が文字コードで表された文字列データを入力するための入力部である。データ入力部1は、文字列データからから各ブロックの文字列データを取り出す。表形式ブロック判定プロセス部3は、データ入力部1により取り出された各ブロックの文字列データの書式が表形式であるかどうかの判定を行うものである。速報表形式ブロック判定プロセス部32は、表形式であると判定された各ブロックを、それより前に表形式であると判定され、表形式ブロック記憶部31に記憶されている各ブロックと比較することにより、そのブロックが速報性を有した表形式であるかどうかを判定して、速報性を有した表形式であると判定されたブロックの文字列データを出力部2に出力させるものである。出力部2は、速報性を有した表形式であると判定されたブロックの文字列データを表示するための周辺装置と表示装置である。
【0046】
データ入力部1は、本発明の請求項2記載の情報抽出装置の文字列入力手段と文字列取り出し手段に対応する。表形式ブロック判定プロセス部3と速報表形式ブロック判定プロセス部32は、それぞれ同発明の表形式判定手段と速報性文字列判定手段に対応する。表形式ブロック記憶部31と出力部2は、それぞれ同発明の表形式文字列記憶手段と表示手段に対応する。
【0047】
次に、本実施例の動作について説明する。図12は、情報の一覧性および速報性を考慮した本実施例の動作を示したフローチャートである。本実施例の動作については、図10及び図12の2つの図面を参照しながら説明する。即ち、データ入力部1は、文字列データを入力する(ステップc1)。そして、データ入力部1は、入力した文字列データから各ブロックの文字列データを取り出す(ステップc2)。表形式ブロック判定プロセス部3は、図3の実施例のステップa3と同様の方法により、各ブロックの文字列データの書式が表形式であるかどうかを判定する(ステップc3)。表形式ブロック判定プロセス部3は、判定したブロックの書式が表形式である場合には、そのブロックをタイムスタンプ付きで表形式ブロック記憶部31に記憶させて、次の処理を速報表形式ブロック判定プロセス部32に委ねる。そうでない場合は、ステップc2に進む。
【0048】
速報表形式ブロック判定プロセス部32は、表形式ブロック判定プロセス部3により、文字列データの書式が表形式であると判定されたブロックが、速報性を有する表形式であるかどうかを判定する(ステップc4)。判定方法としては、表形式ブロック記憶部31に記憶されたブロックのうち、比較的近いタイムスタンプの付されたブロック、すなわち現在処理中の入力データの直前に入力された表形式ブロックと比較し、全く同じではなく、全く違うこともない場合、すなわち若干の変化が見られた場合に速報表形式であると判定する。比較については、二つのブロックを文字コード単位で比較し、差分の総数が予め定めた値の範囲におさまるかどうかを見ることによって判定を行うものとする。但し、比較の方法はこれに限らず、従来より記号処理の分野で検討されている種々の方法や、後述の実施例のステップe8と同様の処理を行うことで取り出せる表項目を比較する方法などがあり、いずれの方法でもかまわない。
【0049】
速報表形式ブロック判定プロセス部32は、ブロックの文字列データが速報性を有する表形式であると判定した場合、該当するブロックの文字列データを出力部2に出力させる。出力部2は、速報性を有する表形式である文字列データを表示する(ステップc5)。例えば、図13に示した入力データについては、表形式ブロック記憶部31に記憶されている図4に示したブロック1と比較することにより、図14のような表示がなされる。
【0050】
図11は、本発明の請求項2記載の情報抽出装置に係る第2の実施例のシステム構成図であり、図10のシステムを実行するためのものである。この基本の構成要素は、汎用の計算機システムと同じである。データ入力部1は、各文字が文字コードで表された文字列データを入力するための入力部である。表形式ブロック記憶部31は、表形式であると判定されたブロックを記憶する記憶部であり、外部記憶装置13に記憶されている。外部記憶装置13は、図12の処理を行うためのプログラムやその処理の過程のデータ等も記憶している。主記憶装置12は、図12の処理を行うためのプログラムやデータを実行時に記憶する主記憶装置である。CPU14は、外部記憶装置13に記憶されている図12の処理を行う為のプログラムを主記憶装置12に転送し、その処理を実行するものである。VRAM11は、出力部2に表示されるデータを記憶するメモリーである。出力部2は、VRAM11に記憶しているデータを表示するための表示装置である。
【0051】
データ入力部1は、本発明の請求項2記載の情報抽出装置の文字列入力手段と文字列取り出し手段に対応する。CPU14と主記憶装置12は、同発明の表形式判定手段及び速報性文字列判定手段に対応する。外部記憶装置13の表形式ブロック記憶部31は、同発明の表形式文字列記憶手段に対応する。出力部2とVRAM11は、同発明の表示手段に対応する。
【0052】
図15は、本発明の請求項6記載の情報抽出機能付き文字放送受信装置に係る第1の実施例のシステム構成図であり、情報の一覧性および速報性を考慮したものである。チャンネル記憶部23は、所定の番組のチャンネルを記憶する記憶装置である。文字放送受信部21は、文字放送を受信するための受信装置である。頁切り出しプロセス部24は、チャンネル記憶部23に記憶されているチャンネルの番組を文字放送受信部21で受信し、その受信した番組における文字列データから頁を切り出すものである。表形式頁判定プロセス部25は、頁切り出しプロセス部24で切り出された頁の文字列データを入力し、その文字列データの書式が表形式であるかどうかの判定を行うものである。表形式頁記憶部41は、表形式であると判定された頁を記憶する記憶装置である。速報表形式頁判定プロセス部42は、表形式であると判定された各頁を、それより前に表形式であると判定され、表形式頁記憶部41に記憶されている各頁と比較することにより、その頁が速報性を有した表形式であるかどうかを判定して、速報性を有した表形式であると判定された場合には、該当する頁の文字列データを表示部2で表示させるものである。表示部22は、速報性を有する表形式であると判定された頁を表示するための周辺装置と表示装置である。
【0053】
文字放送受信部21は、本発明の請求項6記載の情報抽出機能付き文字放送受信装置の文字放送受信手段及び文字列入力手段に対応する。頁切り出しプロセス部24と表形式頁判定プロセス部25は、それぞれ同発明の文字列取り出し手段と表形式判定手段に対応する。速報性表形式頁判定プロセス部42と表形式頁記憶部41は、それぞれ同発明の速報性文字列判定手段と表形式文字列記憶手段に対応する。
【0054】
次に、本実施例の動作について説明する。図17は、情報の一覧性および速報性を考慮した本実施例の動作を示したフローチャートである。本実施例の動作については、図15及び図17の2つの図面を参照しながら説明する。即ち、文字放送受信部21は、放送チャンネルを記憶しているチャンネル記憶部23から各チャンネルを取り出す(ステップd1)。この処理は、チャンネル記憶部23で記憶されている一通りのチャンネルが処理されるまで繰り返される。文字放送受信部21は、取り出した各チャンネルの文字放送の番組を受信する(ステップd2)。頁切り出しプロセス部24は、文字放送受信部21で受信しているチャンネルの文字放送の番組から順番に頁を取り出し、そして、各頁の文字列データを表形式頁判定プロセス部25に出力する(ステップd3)。
表形式頁判定プロセス部25は、図3の実施例のステップa3と同様の方法により、各ブロックの文字列データの書式が表形式であるかどうかを判定する(ステップd4)。表形式頁判定プロセス部25は、判定した頁の書式が表形式である場合には、その頁をタイムスタンプ付きで表形式頁記憶部41に記憶させて、次の処理を速報表形式頁判定プロセス部42に委ねる。そうでない場合は、ステップd3に進む。速報表形式頁判定プロセス部42は、表形式頁判定プロセス部25によって、文字列データの書式が表形式であると判定された頁が、速報性を有する表形式であるかどうかを判定する(ステップd5)。速報表形式頁判定プロセス部42は、頁の文字列データが速報性を有する表形式であると判定した場合、該当する頁の文字列データを出力部2に出力させる。出力部2は、速報性を有する表形式である文字列データを表示する(ステップd6)。
【0055】
図16は、本発明の請求項6記載の情報抽出機能付き文字放送受信装置に係る第2の実施例のシステム構成図であり、図15のシステムを実行するためのものである。この基本の構成要素は、汎用の計算機システムと同じである。チャンネル記憶部23は、所定の番組のチャンネルを記憶する記憶部であり、外部記憶装置13に記憶されている。表形式頁記憶部41は、表形式であると判定された頁を記憶する記憶部であり、これも外部記憶装置13に記憶される。外部記憶装置13は、図17の処理を行う為のプログラムやその処理の過程のデータ等も記憶している。文字放送受信部21は、文字放送を受信するための受信装置である。主記憶装置12は、図17の処理を行うためのプログラムやデータを実行時に記憶する主記憶装置である。CPU14は、外部記憶装置13に記憶されている図17の処理を行うためのプログラムを主記憶装置12に転送し、その処理を実行するものである。VRAM11は、表示部22に表示されるデータを記憶するメモリーである。表示部22は、VRAM11に記憶するデータを表示するための表示装置である。
【0056】
文字放送受信部21は、本発明の請求項6記載の情報抽出機能付き文字放送受信装置の文字放送受信手段と文字列入力手段に対応する。CPU14と主記憶装置12は、同発明の文字列取り出し手段、表形式判定手段そして速報性文字列判定手段に対応する。表形式頁記憶部41は、同発明の表形式文字列記憶手段に対応する。表示部22とVRAM11は、同発明の表示手段に対応する。
【0057】
図18は、本発明の請求項3記載の情報抽出装置に係る第1の実施例のシステム構成図であり、情報の一覧性、速報性および利用者の興味を考慮したものである。データ入力部1は、各文字が文字コードで表された文字列データを入力するための入力部である。また、データ入力部1は、文字列データから各ブロックの文字列データを取り出す。表形式ブロック判定プロセス部3は、データ入力部1により取り出されて各ブロックの文字列データの書式が表形式であるかどうかの判定を行うものである。表形式ブロック記憶部31は、表形式であると判定されたブロックを記憶する記憶装置である。速報表形式ブロック判定プロセス部32は、表形式であると判定された各ブロックを、それより前に表形式であると判定され、表形式ブロック記憶部31に記憶されている各ブロックと比較することにより、そのブロックが速報性を有した表形式であるかどうかを判定するものである。ユーザ入力部51は、利用者が選択した事項を受け付ける入力部である。キーワード選択プロセス部55は、ユーザ入力部51から入力された利用者からの選択入力によりキーワードを選択し、選択されたキーワードをキーワード記憶部52に記憶させるものである。キーワード記憶部52は、選択されたキーワードを記憶する記憶装置である。キーワード速報表形式ブロック判定プロセス部53は、速報表形式であると判定されたブロックごとに、キーワード記憶部52に記憶されたキーワードの有無を調べることにより、そのブロックがキーワード速報表形式であるかどうかを判定し、キーワード速報表形式であると判定されたブロックを出力部2に出力するものである。キーワード抽出プロセス部54は、表形式ブロック記憶部31に記憶された表形式ブロックごとにキーワードを抽出し、抽出されたキーワードを出力部2に出力するものである。出力部2は、キーワード速報表形式であると判定されたブロックや抽出されたキーワードを表示するための周辺装置と表示装置である。
【0058】
データ入力部1は、本発明の請求項3記載の情報抽出装置の文字列入力手段及び文字列取り出し手段に対応する。表形式ブロック判定プロセス部3と表形式ブロック記憶部31は、それぞれ同発明の表形式判定手段と表形式文字列記憶手段に対応する。キーワード抽出プロセス部54は、同発明のキーワード抽出手段に対応する。ユーザー入力部51とキーワード選択プロセス部55は、同発明のキーワード選択手段に対応する。速報表形式ブロック判定プロセス部32とキーワード速報表形式ブロック判定プロセス部53は、それぞれ同発明の速報性文字列判定手段とキーワードブロック判定手段に対応する。出力部2は、同発明の第1及び第2の表示手段に対応する。
【0059】
次に、本実施例の動作について説明する。図20は、本実施例の動作を示したフローチャートである。本実施例の動作については、図18及び図20の2つの図面を参照しながら説明する。データ入力部1は、文字列データを入力する(ステップe1)。そして、データ入力部1は、入力した文字列データから各ブロックの文字列データを取り出す(ステップe2)。表形式ブロック判定プロセス部3は、図3の実施例のステップa3と同様の方法により、各ブロックの文字列データの書式が表形式であるかどうかを判定する(ステップe3)。表形式ブロック判定プロセス部3は、判定したブロックの書式が表形式である場合には、そのブロックをタイムスタンプ付きで表形式ブロック記憶部31に記憶させて、次の処理を速報表形式ブロック判定プロセス部32に委ねる。そうでない場合は、ステップe2に戻る。表形式ブロック判定プロセス部3は、キーワードがキーワード記憶部52に存在するかどうかを調べる(ステップe4)。その次の処理は、キーワードが存在すればステップe5に移り、存在しなければステップe8に移る。速報表形式ブロック判定プロセス部32は、図12の実施例のステップc4と同様の方法により、ブロックが速報表形式であるかどうかを判定する(ステップe5)。速報表形式であればステップe6へ、そうでなければステップe2へ進む。
【0060】
キーワード速報表形式ブロック判定プロセス部53は、ステップe5で速報表形式であると判定されたブロックがキーワード速報表形式であるかどうかを判定する(ステップe6)。判定方法としては、キーワード記憶部52に記憶されたキーワードごとに、判定されるブロックに含まれるかどうかを調べることによって行う。比較は、処理量と判定結果の厳密さのトレードオフを考慮し、後述のステップe8と同様の処理方法をとるものとする。例えば、図21に示す各ブロックが速報表形式であると判定された場合は、キーワード記憶部52にキーワード「鹿島」が記憶されていれば、図21のブロック1だけをキーワード速報表形式ブロックであると判定する。但し、比較方法は、単純な文字列マッチング等のいずれの方法でもかまわない。
【0061】
出力部2は、ステップe6でキーワード速報表形式であると判定されたブロックを表示する(ステップe7)。
【0062】
キーワード抽出プロセス部54は、ステップe3で表形式であると判定されたブロックからキーワードを抽出する(ステップe8)。図3の実施例のステップa3で用いた方法をこのキーワードの抽出方法に用いて、その方法が、表項目の領域の切れ目を検出すること利用する。この方法で認識された各表項目のうち、漢字、カタカナ、ひらがな、アルファベットから成る領域をキーワードとみなすものとする。例えば、ステップe3で表形式であると判定されたブロックが、図4に示すデータのブロック1であった場合、「鹿島」「市原」「浦和」などがキーワードとして抽出される。但し、キーワードの抽出方法は、上述の方法に限定されることはなく、いずれの方法でもかまわない。そして、抽出されたキーワードは出力部2に出力されて、出力部2により図22のような表示がなされる。
【0063】
利用者は、ステップe8で抽出されて画面に表示された情報に基づき、見たい情報を選択し、ユーザー入力部51にそのキーワードを入力する。キーワード選択プロセス部55は、利用者により選択されたキーワードをキーワード記憶部52に記憶する(ステップe9)。利用者によるキーワードの選択方法としては、リモートコントロール装置のテンキー入力による方法をとるものとし、図22の各キーワードに対応する数字を入力することによりキーワードを選択する。ただし、キーワードの選択方法は、この方法に限定されることはなく、ユーザ入力部51をマウス入力装置とし、キーワード表示位置でのクリックによる方法や、ユーザ入力部52をテンキーボタンや方向キーボタン、決定キーボタンなどを持つリモートコントロール装置とし、キーワードに割り当てた数字に対応するテンキー入力、あるいは方向キー操作によるキーワード表示位置の移動および決定キー入力による方法など、いずれの方法でもかまわない。
【0064】
図19は、本発明の請求項3記載の情報抽出装置に係る第2の実施例のシステム構成図であり、図18のシステムを実行するためのものである。この基本の構成要素は、汎用の計算機システムと同じである。データ入力部1は、各文字が文字コードで表された文字列データを入力するための入力部である。表形式ブロック記憶部31は、表形式であると判定されたブロックを記憶する記憶部であり、外部記憶装置13に記憶されている。キーワード記憶部52は、選択されたキーワードを記憶する記憶部であり、外部記憶装置13に記憶されている。外部記憶装置13は、図20の処理を行うためのプログラムやその処理の過程のデータ等も記憶している。主記憶装置12は、図20の処理を行うためのプログラムやデータを実行時に記憶する主記憶装置である。CPU14は、外部記憶装置13に記憶されている図20の処理を行うためのプログラムを主記憶装置12に転送して、その処理を実行するものである。VRAM11は、出力部2に表示されるデータを記憶するメモリーである。出力部2は、VRAM11に記憶しているデータを表示するための表示装置である。
【0065】
データ入力部1は、本発明の請求項3記載の情報抽出装置の文字列入力手段と文字列取り出し手段に対応する。ユーザー入力部51は、同発明のキーワード選択手段に対応する。CPU14と主記憶装置12は、同発明の表形式判定手段、速報性文字列判定手段、キーワード抽出手段及びキーワードブロック判定手段に対応する。表形式ブロック記憶部31は、同発明の表形式文字列記憶手段に対応する。出力部2とVRAM11は、同発明の第1及び第2の表示手段に対応する。
【0066】
図23は、本発明の請求項7記載の情報抽出機能付き文字放送受信装置に係る第1の実施例のシステム構成図であり、情報の一覧性、速報性及び利用者の興味を考慮したものである。チャンネル記憶部23は、所定の番組のチャンネルを記憶する記憶装置である。文字放送受信部21は、文字放送を受信するための受信装置である。頁切り出しプロセス部24は、チャンネル記憶部23に記憶されているチャンネルの番組を文字放送受信部21で受信し、その受信した番組における文字列データから頁を切り出すものである。表形式頁判定プロセス部25は、頁切り出しプロセス部24で切り出された頁の文字列データを入力し、その文字列データの書式が表形式であるかどうかの判定を行うものである。表形式頁記憶部41は、表形式であると判定された頁を記憶する記憶装置である。速報表形式頁判定プロセス部42は、表形式であると判定された各頁を、それより前に表形式であると判定され、表形式頁記憶部41に記憶されている各頁と比較することにより、その頁が速報性を有した表形式であるかどうかを判定するものである。ユーザ入力部51は、利用者が選択した事項を受け付ける入力部である。キーワード選択プロセス部55は、利用者の選択により入力されたキーワードをユーザ入力部51から入力し、その選択されたキーワードをキーワード記憶部52に記憶させるものである。キーワード記憶部52は、選択されたキーワードを記憶する記憶装置である。キーワード速報表形式頁判定プロセス部61は、速報表形式であると判定された頁ごとに、キーワード記憶部52に記憶されたキーワードの有無を調べることにより、その頁がキーワード速報表形式であるかどうかを判定し、キーワード速報表形式であると判定された頁を表示部22に出力するものである。キーワード抽出プロセス部54は、表形式頁記憶部41に記憶された表形式頁ごとにキーワードを抽出し、抽出されたキーワードを表示部22に出力するものである。表示部22は、キーワード速報表形式であると判定された頁や抽出されたキーワードを表示するための周辺装置と表示装置である。
【0067】
文字放送受信部21は、本発明の請求項7記載の情報抽出機能付き文字放送受信装置の文字放送受信手段と文字列入力手段に対応する。頁切り出しプロセス部24と表形式頁判定プロセス部25は、それぞれ同発明の文字列取り出し手段と表形式判定手段に対応する。表形式頁記憶部41は、同発明の表形式文字列記憶手段に対応する。キーワード抽出プロセス部54は、同発明のキーワード抽出手段に対応する。ユーザー入力部51とキーワード選択プロセス部55は、同発明のキーワード選択手段に対応する。速報表形式頁判定プロセス部42とキーワード速報表形式頁判定プロセス部61は、それぞれ同発明の速報性文字列判定手段とキーワード頁判定手段に対応する。表示部22は、同発明の第1及び第2の表示手段に対応する。
【0068】
次に、本実施例の動作について説明する。図25は、本実施例の動作を示したフローチャートである。本実施例の動作については、図23及び図25の2つの図面を参照しながら説明する。文字放送受信部21は、放送チャンネルを記憶しているチャンネル記憶部23から各チャンネルを取り出す(ステップf1)。この処理は、チャンネル記憶部23で記憶されている一通りのチャンネルが処理されるまで繰り返される。文字放送受信部21は、取り出した各チャンネルの文字放送の番組を受信する(ステップf2)。頁切り出しプロセス部24は、文字放送受信部21で受信しているチャンネルの文字放送の番組から順番に頁を取り出し、そして、各頁の文字列データを表形式頁判定プロセス部25に出力する(ステップf3)。表形式頁判定プロセス部25は、図3の実施例のステップa3と同様の方法により、各頁の文字列データの書式が表形式であるかどうかを判定する(ステップf4)。
【0069】
表形式頁判定プロセス部25は、キーワードがキーワード記憶部52に存在するかどうかを調べる(ステップf5)。その次の処理は、キーワードが存在すればステップf6に移り、存在しなければステップf9に移る。速報表形式頁判定プロセス部42は、図12の実施例のステップc4と同様の方法によって、ブロックが速報表形式であるかどうかを判定する(ステップf6)。速報表形式であればステップf7へ、そうでなければステップf3へ進む。キーワード速報表形式頁判定プロセス部61は、ステップf6で速報表形式であると判定された頁がキーワード速報表形式であるかどうかを判定する(ステップf7)。表示部22は、ステップf7でキーワード速報表形式であると判定された頁を表示する(ステップf8)。キーワード抽出プロセス部54は、ステップf4で表形式であると判定された頁からキーワードを抽出する(ステップf9)。抽出されたキーワードは表示部22に出力されて、表示部22により表示がなされる。
【0070】
利用者は、ステップ9で抽出されて画面に表示された情報に基づき、見たい情報を選択し、ユーザー入力部51にそのキーワードを入力する。キーワード選択プロセス部55は、利用者により選択されたキーワードをキーワード記憶部52に記憶する(ステップf10)。
【0071】
図24は、本発明の請求項7記載の情報抽出機能付き文字放送受信装置に係る第2の実施例のシステム構成図であり、図23のシステムを実行するためのものである。この基本の構成要素は、汎用の計算機システムと同じである。チャンネル記憶部23は、所定の番組のチャンネルを記憶する記憶部であり、外部記憶装置13に記憶されている。表形式頁記憶部41は、表形式であると判定された頁を記憶する記憶部であり、外部記憶装置13に記憶されている。キーワード記憶部52は、選択されたキーワードを記憶する記憶部であり、外部記憶装置13に記憶されている。外部記憶装置13は、図25の処理を行うためのプログラムやその処理の過程のデータ等も記憶している。文字放送受信部21は、文字放送を受信するための受信装置である。主記憶装置12は、図25の処理を行うためのプログラムやデータを実行時に記憶する主記憶装置である。CPU14は、外部記憶装置13に記憶されている図25の処理を行うためのプログラムを主記憶装置12に転送し、その処理を実行するものである。VRAM11は、表示部22に表示されるデータを記憶するメモリーである。表示部22は、VRAM11に記憶するデータを表示するための表示装置である。ユーザ入力部51は、利用者が選択した事項を受け付ける入力部である。
【0072】
文字放送受信部21は、本発明の請求項7記載の情報抽出機能付き文字放送受信装置の文字放送受信手段と文字列入力手段に対応する。CPU14と主記憶装置12は、同発明の文字列取り出し手段、表形式判定手段、速報性文字列判定手段、キーワード抽出手段及びキーワード頁判定手段に対応する。表形式頁記憶部41は、同発明の表形式文字列記憶手段に対応する。表示部22とVRAM11は、同発明の第1及び第2の表示手段に対応する。
【0073】
【発明の効果】
以上述べたところから明らかなように、請求項1の本発明は、入力された複数のブロックのうち一覧性のある、すなわち利用者にとって見やすいブロックだけを表示できるという長所を有する。
【0074】
また、請求項2の本発明は、新たに入力された文字列データのうち、一覧性があり、かつ速報性のある、すなわち時系列的に生じる微妙な変化が情報量を持つブロックだけを表示できるという長所を有する。
【0075】
また、請求項3の本発明は、新たに入力された文字列データのうち、一覧性および速報性があり、かつ利用者によって選択されたキーワードの存在する、すなわち利用者の興味のあるブロックだけを表示できるという長所を有する。
【0076】
また、請求項5の本発明は、受信された文字放送の番組から、例えば株式情報や競馬のオッズ、スポーツニュースの対戦表などの一覧性のある頁だけを表示できるという長所を有する。
【0077】
また、請求項6の本発明は、受信された文字放送の番組から、一覧性があり、かつ速報性のある頁、例えば、株式情報における株価や、スポーツニュースの対戦表における得点経過などに変化のあった頁、だけを表示できるという長所を有する。
【0078】
また、請求項7の本発明は、受信された文字放送の番組から、一覧性及び速報性があり、かつ利用者の興味のある頁、例えば、株式情報における特定の銘柄の株価や、スポーツニュースの対戦表における特定のチームの得点経過などに変化のあった頁だけを表示できるという長所を有する。
【図面の簡単な説明】
【図1】本発明の請求項1記載の情報抽出装置に係る第1の実施例のシステム構成図
【図2】本発明の請求項1記載の情報抽出装置に係る第2の実施例のシステム構成図
【図3】図1の実施例の動作を示すフローチャート
【図4】同実施例における入力データのデータ例
【図5】同実施例における入力データのデータ例
【図6】同実施例における出力例
【図7】本発明の請求項5記載の情報抽出機能付き文字放送受信装置に係る第1の実施例のシステム構成図
【図8】本発明の請求項5記載の情報抽出機能付き文字放送受信装置に係る第2の実施例のシステム構成図
【図9】図7の実施例の動作を示すフローチャート
【図10】本発明の請求項2記載の情報抽出装置に係る第1の実施例のシステム構成図
【図11】本発明の請求項2記載の情報抽出装置に係る第2の実施例のシステム構成図
【図12】図10の実施例の動作を示すフローチャート
【図13】同実施例における入力データのデータ例
【図14】同実施例における出力例
【図15】本発明の請求項6記載の情報抽出装置に係る第1の実施例のシステム構成図
【図16】本発明の請求項6記載の情報抽出装置に係る第2の実施例のシステム構成図
【図17】図15の実施例の動作を示すフローチャート
【図18】本発明の請求項3記載の情報抽出装置に係る第1の実施例のシステム構成図
【図19】本発明の請求項3記載の情報抽出装置に係る第2の実施例のシステム構成図
【図20】図18の実施例の動作を示すフローチャート
【図21】同実施例における処理データのデータ例
【図22】同実施例における出力例
【図23】本発明の請求項7記載の情報抽出装置に係る第1の実施例のシステム構成図
【図24】本発明の請求項7記載の情報抽出装置に係る第2の実施例のシステム構成図
【図25】図23の実施例の動作を示すフローチャート
【符号の説明】
1 データ入力部
2 出力部
3 表形式ブロック判定プロセス部
11 VRAM
12 主記憶装置
13 外部記憶装置
14 CPU
21 文字放送受信部
22 表示部
23 チャンネル記憶部
24 頁切り出しプロセス部
25 表形式頁判定プロセス部
31 表形式ブロック記憶部
32 速報表形式ブロック判定プロセス部
41 表形式頁記憶部
42 速報表形式頁判定プロセス部
51 ユーザ入力部
52 キーワード記憶部
53 キーワード速報表形式ブロック判定プロセス部
54 キーワード抽出プロセス部
55 キーワード選択プロセス部
61 キーワード速報表形式頁判定プロセス部

Claims (8)

  1. 1又は複数のブロックを構成している、文字コードからなる文字列を入力する文字列入力手段と、
    その文字列入力手段に入力された文字列から前記ブロック毎に文字列を取り出す文字列取り出し手段と、
    前記文字コードを複数の字種に大別したとき、前記文字列取り出し手段により取り出されるブロックの文字列について、同一の字種が連続する範囲を一つの表項目の領域とみなし、前記表項目の領域の配置情報に基づいて、前記ブロックの文字列の書式が表形式であるかどうかを判定する表形式判定手段と、
    その表形式判定手段により書式が表形式であると判定されたブロックの文字列を表示する表示手段と
    を備えたことを特徴とする情報抽出装置。
  2. 1又は複数のブロックを構成している、文字コードからなる文字列を入力する文字列入力手段と、
    その文字列入力手段に入力された文字列から前記ブロック毎に文字列を取り出す文字列取り出し手段と、
    前記文字コードを複数の字種に大別したとき、前記文字列取り出し手段により取り出されるブロックの文字列について、同一の字種が連続する範囲を一つの表項目の領域とみなし、前記表項目の領域の配置情報に基づいて、前記ブロックの文字列の書式が表形式であるかどうかを判定する表形式判定手段と、
    その表形式判定手段により書式が表形式であると判定されたブロックの文字列を記憶する表形式文字列記憶手段と、
    その表形式文字列記憶手段に記憶されるブロックの文字列を、それより前の時刻にその表形式文字列記憶手段に記憶されたブロックの文字列と比較し、比較結果に所定の比率の範囲内の変化が見られた場合に、その記憶されるブロックの文字列が速報性を有する情報を含んでいると判定する速報性文字列判定手段と、
    その速報性文字列判定手段により速報性を有する情報を含んでいると判定されたブロックの文字列を表示する表示手段と
    を備えたことを特徴とする情報抽出装置。
  3. 1又は複数のブロックを構成している、文字コードからなる文字列を入力する文字列入力手段と、
    その文字列入力手段に入力された文字列から前記ブロック毎に文字列を取り出す文字列取り出し手段と、
    前記文字コードを複数の字種に大別したとき、前記文字列取り出し手段により取り出されるブロックの文字列について、同一の字種が連続する範囲を一つの表項目の領域とみなし、前記表項目の領域の配置情報に基づいて、前記ブロックの文字列の書式が表形式であるかどうかを判定する表形式判定手段と、
    その表形式判定手段により書式が表形式であると判定されたブロックの文字列を時刻を付して記憶する表形式文字列記憶手段と、
    その表形式文字列記憶手段に記憶されるブロックの文字列を、それより前の時刻にその表形式文字列記憶手段に記憶されたブロックの文字列と比較し、比較結果に所定の比率の範囲内の変化が見られた場合に、その記憶されるブロックの文字列が速報性を有する情報を含んでいると判定する速報性文字列判定手段と、
    前記表形式文字列記憶手段に記憶されるブロックの文字列から、表形式判定手段において検出された表項目のうち所定の字種からなる表項目を、所望するブロックを呼び出すためのキーワードとして抽出するキーワード抽出手段と、
    そのキーワード抽出手段により抽出されたキーワードを表示する第1の表示手段と、
    その第1の表示手段により表示されたキーワードから、利用者の指示に基づきキーワードを選択するキーワード選択手段と、
    前記速報性文字列判定手段により速報性を有する情報を含んでいると判定されたブロックの文字列が、前記キーワード選択手段により選択されたキーワードを含むかどうかを判定するキーワードブロック判定手段と、
    そのキーワードブロック判定手段により速報性を有する情報およびキーワードをともに含んでいると判定されたブロックの文字列を表示する第2の表示手段と
    を備えたことを特徴とする情報抽出装置。
  4. 前記表形式判定手段は、前記表項目の領域の配置情報の1つである、前記表項目の領域の切れ目が、前記ブロックの文字列内の連続した複数の行にわたって存在したときに、前記表項目の領域の切れ目の個数と切れ目の連続する行の数とを掛け合わせた数が、所定の値以上である場合、前記ブロックの文字列の書式が表形式であると判定することを特徴とする請求項1、2又は3記載の情報抽出装置。
  5. 複数の文字放送に対応する複数のチャンネルを記憶するチャンネル記憶手段と、
    そのチャンネル記憶手段に記憶されている所定のチャンネルの番組を受信する文字放送受信手段と、
    その文字放送受信手段により受信された文字放送から1又は複数の頁を構成している、文字コードからなる文字列を入力する文字列入力手段と、
    その文字列入力手段に入力された文字列から前記頁毎に文字列を取り出す文字列取り出し手段と、
    前記文字コードを複数の字種に大別したとき、前記文字列取り出し手段により取り出される頁の文字列について、同一の字種が連続する範囲を一つの表項目の領域とみなし、前記表項目の領域の配置情報に基づいて、前記頁の文字列の書式が表形式であるかどうかを判定する表形式判定手段と、
    その表形式判定手段により書式が表形式であると判定された頁の文字列を表示する表示手段と
    を備えたことを特徴とする情報抽出機能付き文字放送受信装置。
  6. 複数の文字放送に対応する複数のチャンネルを記憶するチャンネル記憶手段と、
    そのチャンネル記憶手段に記憶されている所定のチャンネルの番組を受信する文字放送受信手段と、
    その文字放送受信手段により受信された文字放送から1又は複数の頁を構成している、文字コードからなる文字列を入力する文字列入力手段と、
    その文字列入力手段に入力された文字列から前記頁毎に文字列を取り出す文字列取り出し手段と、
    前記文字コードを複数の字種に大別したとき、前記文字列取り出し手段により取り出される頁の文字列について、同一の字種が連続する範囲を一つの表項目の領域とみなし、前記表項目の領域の配置情報に基づいて、前記頁の文字列の書式が表形式であるかどうかを判定する表形式判定手段と、
    その表形式判定手段により書式が表形式であると判定された頁の文字列を記憶する表形式文字列記憶手段と、
    その表形式文字列記憶手段に記憶される頁の文字列を、それより前の時刻にその表形式文字列記憶手段に記憶された頁の文字列と比較し、比較結果に所定の比率の範囲内の変化が見られた場合に、その記憶される頁の文字列が速報性を有する情報を含んでいると判定する速報性文字列判定手段と、
    その速報性文字列判定手段により速報性を有する情報を含んでいると判定された頁の文字列を表示する表示手段と
    を備えたことを特徴とする情報抽出機能付き文字放送受信装置。
  7. 複数の文字放送に対応する複数のチャンネルを記憶するチャンネル記憶手段と、
    そのチャンネル記憶手段に記憶されている所定のチャンネルの番組を受信する文字放送受信手段と、
    その文字放送受信手段により受信された文字放送から1又は複数の頁を構成している、文字コードからなる文字列を入力する文字列入力手段と、
    その文字列入力手段に入力された文字列から前記頁毎に文字列を取り出す文字列取り出し手段と、
    前記文字コードを複数の字種に大別したとき、前記文字列取り出し手段により取り出される頁の文字列について、同一の字種が連続する範囲を一つの表項目の領域とみなし、前記表項目の領域の配置情報に基づいて、前記頁の文字列の書式が表形式であるかどうかを判定する表形式判定手段と、
    その表形式判定手段により書式が表形式であると判定された頁の文字列を時刻を付して記憶する表形式文字列記憶手段と、
    その表形式文字列記憶手段に記憶される頁の文字列を、それより前の時刻にその表形式文字列記憶手段に記憶された頁の文字列と比較し、比較結果に所定の比率の範囲内の変化が見られた場合に、その記憶される頁の文字列が速報性を有する情報を含んでいると判定する速報性文字列判定手段と、
    前記表形式文字列記憶手段に記憶される頁の文字列から、表形式判定手段において検出された表項目のうち所定の字種からなる表項目を、所望する頁を呼び出すためのキーワードとして抽出するキーワード抽出手段と、
    そのキーワード抽出手段により抽出されたキーワードを表示する第1の表示手段と、
    その第1の表示手段により表示されたキーワードから、利用者の指示に基づきキーワードを選択するキーワード選択手段と、
    前記速報性文字列判定手段により速報性を有する情報を含んでいると判定された頁の文字列が、前記キーワード選択手段により選択されたキーワードを含むかどうかを判定するキーワード頁判定手段と、
    そのキーワード頁判定手段により速報性を有する情報およびキーワードをともに含んでいると判定された頁の文字列を表示する第2の表示手段と
    を備えたことを特徴とする情報抽出機能付き文字放送受信装置。
  8. 前記表形式判定手段は、前記表項目の領域の配置情報の1つである、前記表項目の領域の切れ目が、前記頁の文字列内の連続した複数の行にわたって存在したときに、前記表項目の領域の切れ目の個数と切れ目の連続する行の数とを掛け合わせた数が、所定の値以上である場合、前記頁の文字列の書式が表形式であると判定することを特徴とする請求項5、6又は7記載の情報抽出機能付き文字放送受信装置。
JP14620895A 1995-06-13 1995-06-13 情報抽出装置及び情報抽出機能付き文字放送受信装置 Expired - Fee Related JP3638161B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP14620895A JP3638161B2 (ja) 1995-06-13 1995-06-13 情報抽出装置及び情報抽出機能付き文字放送受信装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP14620895A JP3638161B2 (ja) 1995-06-13 1995-06-13 情報抽出装置及び情報抽出機能付き文字放送受信装置

Publications (2)

Publication Number Publication Date
JPH08340519A JPH08340519A (ja) 1996-12-24
JP3638161B2 true JP3638161B2 (ja) 2005-04-13

Family

ID=15402571

Family Applications (1)

Application Number Title Priority Date Filing Date
JP14620895A Expired - Fee Related JP3638161B2 (ja) 1995-06-13 1995-06-13 情報抽出装置及び情報抽出機能付き文字放送受信装置

Country Status (1)

Country Link
JP (1) JP3638161B2 (ja)

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58168393A (ja) * 1982-03-29 1983-10-04 Matsushita Electric Ind Co Ltd 文字多重放送受信装置
EP0298166B1 (en) * 1987-07-08 1992-09-23 International Business Machines Corporation Data processing machine for automatically changing data formats
JPH0740275B2 (ja) * 1987-10-26 1995-05-01 日本電信電話株式会社 キーワード重要度自動評価装置
JPH0575984A (ja) * 1991-09-12 1993-03-26 Hitachi Ltd 受信情報蓄積型文字放送受信装置
JPH0591436A (ja) * 1991-09-25 1993-04-09 Casio Comput Co Ltd 放送受信装置
GB9213328D0 (en) * 1992-06-23 1992-08-05 Ibm System and method to process tabular data
JPH06203020A (ja) * 1992-12-29 1994-07-22 Hitachi Ltd テキストフォーマット認識生成方法および装置
JP3428068B2 (ja) * 1993-04-30 2003-07-22 オムロン株式会社 文書処理装置および方法,ならびにデータ・ベース検索装置および方法
JPH06332893A (ja) * 1993-05-21 1994-12-02 Hitachi Ltd 文章加工装置
JP3351058B2 (ja) * 1993-11-09 2002-11-25 松下電器産業株式会社 映像機器における録画および選局方法

Also Published As

Publication number Publication date
JPH08340519A (ja) 1996-12-24

Similar Documents

Publication Publication Date Title
JP2809341B2 (ja) 情報要約方法、情報要約装置、重み付け方法、および文字放送受信装置。
KR101465769B1 (ko) 사전 단어 및 어구 판정
US5696963A (en) System, method and computer program product for searching through an individual document and a group of documents
US7433893B2 (en) Method and system for compression indexing and efficient proximity search of text data
US20240019989A1 (en) Information presentation method and apparatus, and computer storage medium
US6219665B1 (en) Retrieval menu creation device, a retrieval menu creation method, and a recording medium that stores a retrieval menu creation program
CN101715579A (zh) 语言独立的索引存储系统和检索方法
JP2007042069A (ja) 情報処理装置,情報処理方法および情報処理プログラム
Grigas et al. Letter frequency analysis of languages using latin alphabet
JPH07160727A (ja) 電子マニュアルの表示方法
CN112269475A (zh) 文字显示方法、装置和电子设备
KR20050096107A (ko) 예문을 갖는 전자 사전
JPH0581327A (ja) 情報検索支援処理装置
JP2000148748A (ja) 仮名漢字変換及び画像検索表示システム
JP2957875B2 (ja) 文書情報検索装置及び文書検索結果表示方法
JP3638161B2 (ja) 情報抽出装置及び情報抽出機能付き文字放送受信装置
JP2002189744A (ja) Webページ検索システム
CN103744884A (zh) 一种整理信息碎片的方法及系统
JP2007293377A (ja) 主観的ページと非主観的ページを分離する入出力装置
JP4463925B2 (ja) インデックス生成装置及びその方法、記憶媒体
JP2005011301A (ja) 文書処理装置及び文書処理プログラム
JPH11154164A (ja) 全文検索処理における適合度算出方法および該方法に係るプログラムを格納した記憶媒体
JP5326781B2 (ja) 抽出規則作成システム、抽出規則作成方法及び抽出規則作成プログラム
JP2008117310A (ja) 辞書検索装置および辞書検索処理プログラム
JP2009104520A (ja) 商標検索システム及び商標検索サーバ

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040427

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040625

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050105

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050107

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080121

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090121

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090121

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100121

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110121

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110121

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120121

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130121

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130121

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees