JP2002279080A - Method for providing news story scrap - Google Patents

Method for providing news story scrap

Info

Publication number
JP2002279080A
JP2002279080A JP2001073500A JP2001073500A JP2002279080A JP 2002279080 A JP2002279080 A JP 2002279080A JP 2001073500 A JP2001073500 A JP 2001073500A JP 2001073500 A JP2001073500 A JP 2001073500A JP 2002279080 A JP2002279080 A JP 2002279080A
Authority
JP
Japan
Prior art keywords
scrap
article
user
keyword
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001073500A
Other languages
Japanese (ja)
Inventor
Yoshihisa Oguro
慶久 大黒
Toshihiro Suzuki
俊博 鈴木
Hideaki Yamagata
秀明 山形
Toshio Miyazawa
利夫 宮澤
Junichi Hara
潤一 原
Koichi Inoue
浩一 井上
Yukihisa Uchiyama
幸央 内山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2001073500A priority Critical patent/JP2002279080A/en
Publication of JP2002279080A publication Critical patent/JP2002279080A/en
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a news story on a network in such form as a scrap of news stories of a paper medium. SOLUTION: Image data of the news story are stored in a storage area E in accordance with a retrieval keyword, e.g. a hole text, a keyword by hand and classification, etc. When a user unit 102 designates the keyword via the network 101, the news story which coincides with the designated keyword is retrieved based on the designated keyword, one or >=2 retrieved news stories are reconstituted to generate the scrap and the scrap is provided to the user.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、ネットワークを通
じて、記事のスクラップを利用者に提供する技術に関す
る。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a technique for providing articles to users through a network.

【0002】[0002]

【従来の技術】近年のインターネット環境の整備に伴
い、新聞や雑誌等のマスメディアによって、インターネ
ットを介して記事を電子的に公開したり配信したりする
ようなことが広く行なわれるようになってきている。
2. Description of the Related Art With the improvement of the Internet environment in recent years, articles such as newspapers and magazines have been widely published and distributed electronically via the Internet by mass media. ing.

【0003】これに対し、利用者の中には、新聞や雑誌
等のマスメディアが提供する紙媒体としての記事をスク
ラップ形式でまとめている者も数多く存在する。
[0003] On the other hand, there are many users who collect articles in a scrap format as paper media provided by mass media such as newspapers and magazines.

【0004】そこで、インターネット等のネットワーク
環境を利用しつつ、電子的な記事をスクラップ形式でま
とめることができれば便利である。
Therefore, it is convenient if electronic articles can be collected in a scrap format while using a network environment such as the Internet.

【0005】記事を検索し、再構成するサービスに関し
ては、例えば特開2000−076473公報に、自動
文書再オーサリング方法およびシステムが開示されてい
る。
[0005] For a service for retrieving and reconfiguring articles, for example, Japanese Patent Application Laid-Open No. 2000-076473 discloses an automatic document reauthoring method and system.

【0006】また、記事スクラップサービスに関して
は、特開2000−082066公報に、ユーザ毎にス
クラップ機能を備えたネットワーク上の検索システムが
開示されている。
As for the article scrap service, Japanese Patent Application Laid-Open No. 2000-082066 discloses a search system on a network having a scrap function for each user.

【0007】[0007]

【発明が解決しようとする課題】しかしながら、特開2
000−076473公報で示されている方法(自動文
書再オーサリング方法およびシステム)は、インターネ
ットで広く普及しているWWW(World Wide
Web)において、複数のページを見易くまとめる方法
であり、一般的な紙媒体の記事に関して言及していな
い。
SUMMARY OF THE INVENTION However, Japanese Patent Application Laid-Open
The method (automatic document re-authoring method and system) disclosed in 000-076473 discloses a WWW (World Wide) widely used on the Internet.
Web) is a method of grouping a plurality of pages in an easy-to-view manner, and does not mention general paper-based articles.

【0008】また、特開2000−082066公報で
示されている方法(ユーザ毎にスクラップ機能を備えた
ネットワーク上の検索システム)も、WWWの検索の履
歴を蓄積していく方法であり、一般的な紙媒体に関して
スクラップ機能を供するものではない。
A method disclosed in Japanese Patent Application Laid-Open No. 2000-082066 (a search system on a network having a scrap function for each user) is also a method of accumulating WWW search histories. It does not provide a scrap function for a simple paper medium.

【0009】一方、インターネットの普及が進んだと言
え、紙媒体による文書の公開は多く、紙媒体によっての
みしか存在しない記事(情報)も多い。また、現在のW
WWにおいて一般的に用いられているHTMLでは、文
書レイアウトまで明確に定義することは困難であり、紙
媒体上での自由なレイアウトを再現できていない場合が
ほとんどであり、ブラウザ(閲覧ソフト)を介して見る
文書の視認性が悪いことも加わって、これが、いまだに
紙媒体が支持を集める理由になっていると思われる。
On the other hand, it can be said that the Internet has become widespread, and many documents are published on paper media, and many articles (information) exist only on paper media. Also, the current W
In HTML generally used in the WW, it is difficult to clearly define a document layout, and in most cases, a free layout on a paper medium cannot be reproduced. This, combined with the poor visibility of documents viewed through it, seems to still be the reason paper media is gaining support.

【0010】したがって、紙媒体をも検索対象とし、利
用者が所望する記事のみを抽出して再構成する、いわゆ
るスクラップサービスを提供することは大いに有益であ
ると思われる。
[0010] Therefore, providing a so-called scrap service in which a paper medium is searched for, and only a desired article of a user is extracted and reconstructed, is considered to be very useful.

【0011】本発明の目的は、紙媒体である記事のスク
ラップのような形態での記事の提供をネットワーク上で
可能とすることである。
An object of the present invention is to enable provision of an article in a form such as scrap of an article as a paper medium on a network.

【0012】[0012]

【課題を解決するための手段】請求項1記載の記事スク
ラップ提供方法の発明は、ネットワークを介したアクセ
スを許容するサーバ装置が、メディアによって提供され
る記事について記事単位での読み取り画像データとその
記事に含まれるキーワードとを対応付けて記憶領域に蓄
積するステップと、前記ネットワークを介して前記サー
バ装置にアクセスする利用者の装置から送信された指定
キーワードに基づいて前記記憶領域を検索し、その指定
キーワードと規定の関係を有する前記キーワードと対応
付けられた前記記事を集めてスクラップを生成するステ
ップと、前記ネットワークを介して前記サーバ装置にア
クセスする前記利用者に対して、生成した前記スクラッ
プを提供するステップと、を具備する。
According to a first aspect of the present invention, there is provided an article scrap providing method, wherein a server apparatus which permits access via a network reads an image provided by a medium and reads the image data of the article in units of articles. Storing in a storage area in association with a keyword included in an article; and searching the storage area based on a designated keyword transmitted from a user apparatus accessing the server apparatus via the network, Generating a scrap by collecting the articles associated with the keyword having a specified relationship with a specified keyword; and generating the scrap for the user accessing the server device via the network. Providing.

【0013】請求項2記載の発明は、請求項1記載の記
事スクラップ提供方法において、前記キーワードは、記
事の画像データを文字認識したテキストデータに基づい
て得られたものである。
According to a second aspect of the present invention, in the article scrap providing method according to the first aspect, the keyword is obtained based on text data obtained by character recognition of image data of the article.

【0014】請求項3記載の発明は、請求項1記載の記
事スクラップ提供方法において、前記スクラップを提供
するステップは、前記スクラップを紙媒体として利用者
に提供する。
According to a third aspect of the present invention, in the article scrap providing method according to the first aspect, the step of providing the scrap provides the user with the scrap as a paper medium.

【0015】請求項4記載の発明は、請求項1記載の記
事スクラップ提供方法において、前記サーバ装置におい
て前記ネットワークを介して前記サーバ装置にアクセス
する利用者の装置から送信された指定キーワードをその
利用者を特定する利用者特定情報と対応付けて保存する
ステップと、定期的に、保存した前記指定キーワードに
基づいて前記記憶領域を検索し、その指定キーワードと
規定の関係を有する前記キーワードと対応付けられた前
記記事を集めてスクラップを生成するステップと、前記
指定キーワードに対応する前記利用者特定情報によって
特定される利用者に対して、前記ネットワークを介して
生成した前記スクラップを提供するステップと、を具備
する。
According to a fourth aspect of the present invention, in the article scrap providing method according to the first aspect, the specified keyword transmitted from a device of a user accessing the server device via the network in the server device is used. Storing the specified keyword in association with the user specifying information, and periodically searching the storage area based on the stored specified keyword, and associating the keyword with the keyword having a specified relationship with the specified keyword. Collecting the generated articles and generating a scrap, and providing the generated scrap via the network to a user specified by the user specifying information corresponding to the specified keyword, Is provided.

【0016】請求項5記載の発明は、請求項1記載の記
事スクラップ提供方法において、前記ネットワークを介
して前記サーバ装置にアクセスする利用者の装置から送
信された指定キーワードの数に応じて課金金額を決定す
るステップを具備する。
According to a fifth aspect of the present invention, in the article scrap providing method according to the first aspect, a billing amount is set according to the number of designated keywords transmitted from a device of a user accessing the server device via the network. Is determined.

【0017】請求項6記載の発明は、請求項1記載の記
事スクラップ提供方法において、生成した前記スクラッ
プに含まれる記事の量に応じて課金金額を決定するステ
ップを具備する。
According to a sixth aspect of the present invention, there is provided the article scrap providing method according to the first aspect, further comprising a step of determining a billing amount according to the amount of articles included in the generated scrap.

【0018】請求項7記載の発明は、請求項1記載の記
事スクラップ提供方法において、検索の履歴情報を利用
者別に記憶領域に蓄積するステップを具備する。
According to a seventh aspect of the present invention, there is provided the article scrap providing method according to the first aspect, further comprising a step of storing search history information in a storage area for each user.

【0019】[0019]

【発明の実施の形態】本発明の実施の形態を図面に基づ
いて説明する。
Embodiments of the present invention will be described with reference to the drawings.

【0020】〔基本的なシステムの内容〕図1は、本実
施の形態のシステム構成例を示す模式図である。本実施
の形態のシステムは、インターネットを代表例とするネ
ットワーク101を介してブラウズソフトウエア等の必
要な閲覧環境を備えた利用者の装置102(利用者のク
ライアントコンピュータ)に記事スクラップのサービス
を提供する。このようなサービスの提供は、ネットワー
ク101を介してアクセス可能なサーバ装置103のデ
ータ処理によって実現可能である。つまり、サーバ装置
103は、記事スクラップ提供用のコンピュータプログ
ラムがインストールされたコンピュータであり、記憶領
域としてのデータ蓄積部Eに蓄積されているデータを利
用して利用者の装置102にネットワーク101上から
記事スクラップを提供する。
[Basic System Contents] FIG. 1 is a schematic diagram showing an example of a system configuration according to the present embodiment. The system according to the present embodiment provides an article scrap service to a user device 102 (user client computer) having a required browsing environment such as browsing software via a network 101 typified by the Internet. I do. The provision of such a service can be realized by data processing of the server device 103 accessible via the network 101. In other words, the server device 103 is a computer in which a computer program for providing article scrap is installed, and the data is stored in the data storage unit E as a storage area. Provide article scrap.

【0021】ここで、サーバ装置102について説明す
る。図1中、Aは利用者からの指定キーワードの入力
(所望する記事を指定するキーワード、分類コード、検
索文字など)を受け付ける入力受付部、Bはシステム全
体を司る制御部、Cは検索結果を整形して利用者に提示
する出力作成部、Dは蓄積された記事データから指定さ
れた条件で記事検索する検索処理部、Eは記事画像デー
タと検索用の書誌的情報、分類コード及び記事テキスト
等とを関係付ける記事関連データを蓄積しているデータ
蓄積部、FはEに蓄積するためのデータを作成し入力す
る記事スクラップ入力部である。
Here, the server device 102 will be described. In FIG. 1, A is an input receiving unit that receives an input of a specified keyword (a keyword for specifying a desired article, a classification code, a search character, etc.) from the user, B is a control unit that controls the entire system, and C is a search result. An output creation unit for shaping and presenting to the user, D is a search processing unit for searching articles from the stored article data under specified conditions, E is article image data and bibliographic information for search, classification code and article text F is an article scrap input unit for creating and inputting data to be stored in E, and storing data relating to the article related data relating to E.

【0022】サーバ装置103を管理するサービス提供
者は、図1に示す記事スクラップ入力部Fを介してデー
タ蓄積部Eに記事データを蓄積する。この作業は、一例
として、人手によって記事を切り抜いてスキャナー等で
画像をスキャンして画像データを作成し、加えて、新聞
名、発行年月日、分類コードなどの書誌的情報、そして
記事テキストなどを人手によって作成し、これらの情報
をスキャンした画像データとリンクさせた状態で蓄積す
ることによって行なう。この作業を定期的に行い、新し
い記事を追加することによって、利用者には最新の情報
を提供することとする。
The service provider managing the server device 103 stores article data in the data storage unit E via the article scrap input unit F shown in FIG. This is done, for example, by manually cutting out an article and scanning the image with a scanner to create image data, as well as bibliographic information such as newspaper name, date of publication, classification code, and article text. Is manually created and stored in a state where the information is linked with the scanned image data. This work will be done regularly and new articles will be added to keep users up to date.

【0023】図2は、データ蓄積部における蓄積データ
のデータ構造を例示する模式図である。蓄積の具体的な
実現方法に関しては、本発明の言及するところではな
く、一般的なデータベースで採用されている方法によっ
て構わない。
FIG. 2 is a schematic diagram illustrating the data structure of data stored in the data storage unit. The specific method of realizing the accumulation is not mentioned in the present invention, but may be a method adopted in a general database.

【0024】利用者は、図1に示すネットワーク101
を介して記事スクラップサービスシステムに検索条件を
伝達し、所望する記事のまとまり(いわゆるスクラッ
プ)の提示を受ける。
The user operates the network 101 shown in FIG.
The search condition is transmitted to the article scrap service system via the web browser, and a desired group of articles (so-called scrap) is presented.

【0025】ネットワーク101を介することによっ
て、多くの利用者に対し、個々の所望する条件を満足す
る記事スクラップのサービスを実現することができる。
By using the network 101, an article scrap service that satisfies individual desired conditions can be realized for many users.

【0026】このような記事スクラップのサービスは、
ネットワーク101を介したアクセスを許容するサーバ
装置103が、メディアによって提供される記事につい
て記事単位での読み取り画像データとその記事に含まれ
るキーワード(検索用の書誌的情報、分類コード及び記
事テキスト等)とを対応付けてデータ蓄積部Eに蓄積し
ておき、ネットワーク101を介してサーバ装置301
にアクセスする利用者の装置102から送信された指定
キーワードに基づいてデータ蓄積部Eを検索し、その指
定キーワードと規定の関係を有するキーワードと対応付
けられた記事を集めてスクラップを生成し、ネットワー
ク101を介してサーバ装置103にアクセスする利用
者の装置102に対して、生成したスクラップを提供す
ることによって実現する。
The article scrap service is as follows.
The server device 103 that permits access via the network 101 reads image data of articles provided by media in units of articles and keywords included in the articles (bibliographic information for search, classification codes, article texts, etc.) Is stored in the data storage unit E in association with the server device 301 via the network 101.
Search the data storage unit E based on the designated keyword transmitted from the device 102 of the user who accesses the designated keyword, collect articles associated with the keyword having a specified relationship with the designated keyword, generate a scrap, and generate a scrap. This is realized by providing the generated scrap to the device 102 of the user who accesses the server device 103 via 101.

【0027】〔記事蓄積手法〕サービス提供者が、検索
用の情報(書誌的情報、テキストデータなど)を人手に
よって準備するには多大なコストがかかり、利用者には
安価にサービスを提供できなくなる恐れがある。
[Article Accumulation Method] A large cost is required for a service provider to manually prepare search information (bibliographic information, text data, and the like), and a service cannot be provided to users at low cost. There is fear.

【0028】そこで、検索用の情報として、記事を文字
認識し、つまり、記事をOCRして得たテキストデータ
を利用すれば、人手を介することなく、検索用の情報を
画像データに付与することが可能になる。したがって、
蓄積データの作成にかかるコストが低減され、ひいては
利用者に安価にサービスを提供できるようになる。
Therefore, if text data obtained by character recognition of an article, that is, OCR of an article is used as search information, the search information can be added to the image data without human intervention. Becomes possible. Therefore,
The cost for creating the stored data is reduced, and the service can be provided to the user at low cost.

【0029】図3は、記事とこの記事についてのOCR
結果を利用する蓄積データの内容とを示す模式図であ
る。
FIG. 3 shows an article and the OCR for this article.
It is a schematic diagram which shows the content of the accumulation | storage data using a result.

【0030】当然のことながら、OCRが正しい認識結
果をもたらさない場合もあるが、検索条件を緩めて指定
することによって、検索漏れをある程度、回避すること
は可能である。
Naturally, there are cases where the OCR does not give a correct recognition result. However, it is possible to avoid search omission to some extent by loosely specifying the search conditions.

【0031】〔記事スクラップ提供手法〕デジタルデー
タは、劣化することなく複製することが可能であり、オ
リジナルデータの価値を守りながら、複製を許可するこ
とは非常にコストのかかる仕組みが必要である。
[Method of Providing Article Scrap] Digital data can be copied without deterioration, and permitting copying while protecting the value of the original data requires a very expensive mechanism.

【0032】そこで、記事検索結果を利用者に提示する
方法として、紙媒体を用いる。
Therefore, a paper medium is used as a method of presenting the article search results to the user.

【0033】図4は、利用者に提示される記事スクラッ
プページの一例を示す模式図である。
FIG. 4 is a schematic diagram showing an example of an article scrap page presented to a user.

【0034】利用者には、第4図に示すような記事スク
ラップページの紙媒体のみが、郵送などの手段によって
提供されるので、電子的な複製を行うことは困難であ
る。
Since only the paper medium of the article scrap page as shown in FIG. 4 is provided by means such as mailing, it is difficult for the user to make an electronic copy.

【0035】また、紙媒体の記事を、そのまま紙媒体で
読むことができるので、電子化による情報ヌケが避けら
れることに加え、目視に対する親和性も高く、利用者が
読むにあたっての負担が軽減される効果もある。
Further, since articles on a paper medium can be read as they are on a paper medium, information loss due to digitization can be avoided, the affinity for visual observation is high, and the burden on the user for reading is reduced. There is also an effect.

【0036】〔記事スクラップ定期送信サービス〕記事
に関する情報は、日々更新されており、利用者は、自身
の興味のある分野に関して、常に最新の情報を欲する場
合が多い。そこで、利用者が記事スクラップサービスの
利用を開始する際に、検索条件を指定した後は、定期的
に、前回の検索からの更新データを検索し、検索結果を
利用者に提供するサービスを供することは、利用者の利
便を図る上で大いに有益である。
[Article Scrap Periodic Transmission Service] Information on articles is updated every day, and users often want the latest information in their field of interest. Therefore, when the user starts using the article scrap service, after specifying the search conditions, a service is provided that periodically searches for updated data from the previous search and provides the search results to the user. This is very useful for the convenience of the user.

【0037】例えば、利用者は、最初に、興味のあるキ
ーワードを指定しておき、月刊/週刊/日刊など、記事
スクラップサービス更新期間も指定する。
For example, the user first specifies a keyword of interest, and also specifies an article scrap service update period such as monthly / weekly / daily.

【0038】月刊を望めば、利用者は所望する記事がス
クラップされた冊子を、月に一度、定期的に手にするこ
とになる。よって、利用者は常に最新の情報を効率的に
獲得することが可能になる。
If a monthly publication is desired, the user regularly obtains a booklet in which the desired article is scrapped once a month. Therefore, the user can always efficiently obtain the latest information.

【0039】また、図4に例示するように、記事スクラ
ップは、自身の所望する記事のみ関連性のあるものがま
とめられてレイアウトされたいわゆるスクラップブック
様の冊子であるから、関連性のあるもの記事を比較して
読み進むことができ、情報を理解する上で都合がよい。
As illustrated in FIG. 4, the article scrap is a so-called scrapbook-like booklet in which only relevant articles are collected and laid out. You can compare articles and read them, which is convenient for understanding information.

【0040】このような記事スクラップ定期送信サービ
スは、サーバ装置103においてネットワーク101を
介してサーバ装置103にアクセスする利用者の装置1
02の装置から送信された指定キーワードをその利用者
を特定する利用者特定情報と対応付けて保存しておき、
定期的に、保存した指定キーワードに基づいてデータ蓄
積部Eを検索し、その指定キーワードと規定の関係を有
するキーワードと対応付けられた記事を集めてスクラッ
プを生成し、指定キーワードに対応する利用者特定情報
によって特定される利用者に対して、ネットワーク10
1を介して、生成したスクラップを提供することによっ
て、実現する。
Such an article scrap periodic transmission service is provided by a user device 1 accessing the server device 103 via the network 101 in the server device 103.
02 is stored in association with the specified keyword transmitted from the device No. 02 and the user specifying information for specifying the user,
The user periodically searches the data storage unit E based on the stored designated keyword, collects articles associated with the keyword having a prescribed relationship with the designated keyword, generates a scrap, and generates a scrap corresponding to the designated keyword. For the user specified by the specific information, the network 10
1 by providing the generated scrap.

【0041】〔課金〕利用者の指定する検索条件によっ
て、記事スクラップサービスの処理量が増減する。サー
ビスを供するにあたり、計算機的および経済的資源は有
限であるから、利用者の要求に無制限に応えることは不
可能である。そこで、利用者の指定する検索条件に含ま
れるキーワード数に応じて、従量制の課金体系を設定す
ることによって、資源と処理量とのバランスをとること
ができる。
[Accounting] The processing amount of the article scrap service increases or decreases depending on the search conditions specified by the user. In providing services, the computational and economic resources are limited, so that it is impossible to meet the user's requirements without limit. Therefore, by setting a pay-as-you-go system based on the number of keywords included in the search conditions specified by the user, it is possible to balance resources and processing amount.

【0042】ここで、キーワード数による従量制による
課金方法によっては、キーワード数が同じでも、一般性
の高いキーワード(例えば、自動車)に合致する記事は
多く、専門性の高いキーワード(例えば、ウィッシュボ
ーン)に合致する記事は少ないことが予想される。ま
た、キーワード「自動車」を指定した場合には、多くの
場合、指定キーワード「ウィッシュボーン」(注:ウィ
ッシュボーンは自動車のサスペンションの種類)の記事
も含有されるであろう。
Here, depending on the billing method based on the pay-as-you-go system based on the number of keywords, even if the number of keywords is the same, there are many articles that match highly general keywords (for example, automobiles) and highly specialized keywords (for example, wishbones). It is expected that there are few articles that match ()). Also, if the keyword "car" is specified, articles with the specified keyword "wishbone" (note: wishbone is a type of car suspension) will often be included.

【0043】そこで、最終的に利用者に提示される記事
スクラップの量に対する従量制の課金体系を設定するこ
とによって、資源と処理量とのバランスをとることも考
えられる。
Therefore, it is conceivable to balance the resources and the processing amount by setting a pay-as-you-go billing system for the amount of article scrap finally presented to the user.

【0044】〔検索履歴情報の蓄積及び管理〕記事スク
ラップサービスのシステム側に、利用者の検索履歴の情
報を利用者別に蓄積しておけば、利用者は、自身の過去
の検索結果を、自身で管理することなく、効率的に取り
出すことが可能になり、大いに便宜が図れる。
[Accumulation and Management of Search History Information] If information on the search history of the user is stored for each user in the article scrap service system, the user can store his or her own past search results. It is possible to take out efficiently without management by using, and it is possible to achieve great convenience.

【0045】具体的には、利用者ごとに、検索日時と検
索条件の履歴情報を管理しておき、これを利用者に開放
すればよい。
More specifically, search date and time and search condition history information may be managed for each user and released to the user.

【0046】[0046]

【発明の効果】以上に説明したように、請求項1〜7記
載の発明によれば、記事単位で記事の画像データを、検
索用のキーワード、例えば、テキスト全文、人手による
キーワード、分類等と対応させて蓄積しておき、利用者
からネットワークを介して指定された指定キーワードに
基づいて合致する記事を検索し、適当な単位にまとめて
スクラップを生成し、このスクラップを利用者に提供す
るようにしたので、利用者は、ネットワークを介して、
記事そのものに近い情報を得ることが可能である。
As described above, according to the first to seventh aspects of the present invention, image data of an article is converted into a keyword for search, for example, a full text, a keyword by hand, a classification, and the like. The corresponding articles are stored and searched for matching articles based on the specified keywords specified by the user via the network, scraps are generated in appropriate units, and this scrap is provided to the user. User, via the network,
It is possible to obtain information close to the article itself.

【0047】また、OCR等の文字認識技術を利用すれ
ば、記事の読み取り画像データとその記事に含まれるキ
ーワードとを対応付けて記憶領域に蓄積するために必要
な作業を軽減することができる。
If a character recognition technique such as OCR is used, the work required for storing read image data of an article and keywords contained in the article in a storage area in association with each other can be reduced.

【0048】また、請求項3記載の発明のように、検索
結果を紙媒体によって利用者に提示するようにすれば、
デジタルデータの複写に関わる問題、例えば、著作権な
どの権利関係等を回避することができる。
According to the third aspect of the present invention, if the retrieval result is presented to the user on a paper medium,
Problems associated with copying digital data, for example, rights such as copyrights, can be avoided.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本実施の形態のシステム構成例を示す模式図で
ある。
FIG. 1 is a schematic diagram illustrating an example of a system configuration according to an embodiment.

【図2】データ蓄積部における蓄積データのデータ構造
を例示する模式図である。
FIG. 2 is a schematic diagram illustrating a data structure of data stored in a data storage unit.

【図3】記事とこの記事についてのOCR結果を利用す
る蓄積データの内容とを示す模式図である。
FIG. 3 is a schematic diagram showing an article and contents of stored data using an OCR result of the article.

【図4】利用者に提示される記事スクラップページの一
例を示す模式図である。
FIG. 4 is a schematic diagram illustrating an example of an article scrap page presented to a user.

【符号の説明】[Explanation of symbols]

101 ネットワーク 103 サーバ装置 102 利用者の装置 E 記憶領域(データ蓄積部) Reference Signs List 101 network 103 server device 102 user device E storage area (data storage unit)

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G06F 17/30 210 G06F 17/30 210A 340 340A (72)発明者 山形 秀明 東京都大田区中馬込1丁目3番6号 株式 会社リコー内 (72)発明者 宮澤 利夫 東京都大田区中馬込1丁目3番6号 株式 会社リコー内 (72)発明者 原 潤一 東京都大田区中馬込1丁目3番6号 株式 会社リコー内 (72)発明者 井上 浩一 東京都大田区中馬込1丁目3番6号 株式 会社リコー内 (72)発明者 内山 幸央 東京都大田区中馬込1丁目3番6号 株式 会社リコー内 Fターム(参考) 5B075 ND20 NK13 NK32 PP22 PQ05 5B082 EA08 ──────────────────────────────────────────────────続 き Continued on the front page (51) Int.Cl. 7 Identification symbol FI Theme coat ゛ (Reference) G06F 17/30 210 G06F 17/30 210A 340 340A (72) Inventor Hideaki Yamagata 1-chome Nakamagome, Ota-ku, Tokyo No. 3-6 Ricoh Co., Ltd. (72) Inventor Toshio Miyazawa 1-3-6 Nakamagome, Ota-ku, Tokyo Japan Ricoh Co., Ltd. (72) Junichi Hara 1-3-6, Nakamagome, Ota-ku, Tokyo Ricoh Co., Ltd. (72) Inventor Koichi Inoue 1-3-6 Nakamagome, Ota-ku, Tokyo Inside Ricoh Co., Ltd. (72) Yukio Uchiyama 1-3-6 Nakamagome, Ota-ku, Tokyo Ricoh Co., Ltd. F term (reference) 5B075 ND20 NK13 NK32 PP22 PQ05 5B082 EA08

Claims (7)

【特許請求の範囲】[Claims] 【請求項1】 ネットワークを介したアクセスを許容す
るサーバ装置が、メディアによって提供される記事につ
いて記事単位での読み取り画像データとその記事に含ま
れるキーワードとを対応付けて記憶領域に蓄積するステ
ップと、 前記ネットワークを介して前記サーバ装置にアクセスす
る利用者の装置から送信された指定キーワードに基づい
て前記記憶領域を検索し、その指定キーワードと規定の
関係を有する前記キーワードと対応付けられた前記記事
を集めてスクラップを生成するステップと、 前記ネットワークを介して前記サーバ装置にアクセスす
る前記利用者に対して、生成した前記スクラップを提供
するステップと、を具備する記事スクラップ提供方法。
A step of storing, in a storage area, a server device permitting access via a network, relating read image data of an article provided by a medium in units of articles and keywords included in the article in association with each other; A search for the storage area based on a designated keyword transmitted from a device of a user who accesses the server device via the network, and the article associated with the keyword having a specified relationship with the designated keyword. And generating a scrap by collecting the generated scrap. The method according to claim 1, further comprising: providing the user accessing the server device via the network with the generated scrap.
【請求項2】 前記キーワードは、記事の画像データを
文字認識したテキストデータに基づいて得られたもので
ある請求項1記載の記事スクラップ提供方法。
2. The article scrap providing method according to claim 1, wherein the keyword is obtained based on text data obtained by character-recognizing image data of the article.
【請求項3】 前記スクラップを提供するステップは、
前記スクラップを紙媒体として利用者に提供する請求項
1記載の記事スクラップ提供方法。
3. The step of providing scrap comprises:
The article scrap providing method according to claim 1, wherein the scrap is provided to a user as a paper medium.
【請求項4】 前記サーバ装置において前記ネットワー
クを介して前記サーバ装置にアクセスする利用者の装置
から送信された指定キーワードをその利用者を特定する
利用者特定情報と対応付けて保存するステップと、 定期的に、保存した前記指定キーワードに基づいて前記
記憶領域を検索し、その指定キーワードと規定の関係を
有する前記キーワードと対応付けられた前記記事を集め
てスクラップを生成するステップと、 前記指定キーワードに対応する前記利用者特定情報によ
って特定される利用者に対して、前記ネットワークを介
して生成した前記スクラップを提供するステップと、を
具備する請求項1記載の記事スクラップ提供方法。
4. a step of storing, in the server device, a designated keyword transmitted from a device of a user accessing the server device via the network in association with user identification information for identifying the user; Periodically retrieving the storage area based on the stored specified keyword, collecting the articles associated with the keyword having a specified relationship with the specified keyword, and generating a scrap, 2. The article scrap providing method according to claim 1, further comprising: providing the scrap generated through the network to a user specified by the user specifying information corresponding to the information.
【請求項5】 前記ネットワークを介して前記サーバ装
置にアクセスする利用者の装置から送信された指定キー
ワードの数に応じて課金金額を決定するステップを具備
する請求項1記載の記事スクラップ提供方法。
5. The article scrap providing method according to claim 1, further comprising a step of determining a charge amount according to the number of designated keywords transmitted from a device of a user accessing the server device via the network.
【請求項6】 生成した前記スクラップに含まれる記事
の量に応じて課金金額を決定するステップを具備する請
求項1記載の記事スクラップ提供方法。
6. The article scrap providing method according to claim 1, further comprising the step of determining a billing amount according to the amount of articles included in the generated scrap.
【請求項7】 検索の履歴情報を利用者別に記憶領域に
蓄積するステップを具備する請求項1記載の記事スクラ
ップ提供方法。
7. The article scrap providing method according to claim 1, further comprising the step of storing search history information in a storage area for each user.
JP2001073500A 2001-03-15 2001-03-15 Method for providing news story scrap Pending JP2002279080A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001073500A JP2002279080A (en) 2001-03-15 2001-03-15 Method for providing news story scrap

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001073500A JP2002279080A (en) 2001-03-15 2001-03-15 Method for providing news story scrap

Publications (1)

Publication Number Publication Date
JP2002279080A true JP2002279080A (en) 2002-09-27

Family

ID=18930916

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001073500A Pending JP2002279080A (en) 2001-03-15 2001-03-15 Method for providing news story scrap

Country Status (1)

Country Link
JP (1) JP2002279080A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006236140A (en) * 2005-02-25 2006-09-07 Toshiba Corp Information managing device, information management method and information management program
JP2007323369A (en) * 2006-05-31 2007-12-13 Yappa Corp Electronic newspaper display device and electronic newspaper display system
JP2010033267A (en) * 2008-07-28 2010-02-12 Jq:Kk Information management server, information management method, information management system, and program
US10997255B2 (en) 2018-04-25 2021-05-04 Coocon Co., Ltd. Apparatus, method and computer program for cloud scraping using pre-scraped big data

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006236140A (en) * 2005-02-25 2006-09-07 Toshiba Corp Information managing device, information management method and information management program
JP2007323369A (en) * 2006-05-31 2007-12-13 Yappa Corp Electronic newspaper display device and electronic newspaper display system
JP4552005B2 (en) * 2006-05-31 2010-09-29 株式会社ヤッパ Electronic newspaper display device
JP2010033267A (en) * 2008-07-28 2010-02-12 Jq:Kk Information management server, information management method, information management system, and program
US10997255B2 (en) 2018-04-25 2021-05-04 Coocon Co., Ltd. Apparatus, method and computer program for cloud scraping using pre-scraped big data
US11550855B2 (en) 2018-04-25 2023-01-10 Coocon Co., Ltd. Apparatus, method and computer program for cloud scraping using pre-scraped big data
US11586687B2 (en) 2018-04-25 2023-02-21 Coocon Co., Ltd. Apparatus, method and computer program for cloud scraping using pre-scraped big data

Similar Documents

Publication Publication Date Title
US5649186A (en) System and method for a computer-based dynamic information clipping service
US6775665B1 (en) System for treating saved queries as searchable documents in a document management system
US8484205B1 (en) System and method for generating sources of prioritized content
JP3936862B2 (en) Recommendation system and recommendation method
JP4952964B2 (en) Electronic publishing system
US20040122811A1 (en) Method for searching media
US9116927B2 (en) Methods and apparatuses for publication of unconsciously captured documents
US20030149684A1 (en) Search and index hosting system
JP2007122685A (en) Information processing apparatus, information processing method and information processing program
JP2001142908A (en) Method, device and system for retrieving document and recording medium
JP3910236B2 (en) Hyperlink automatic generator
JP2002288214A (en) Search system and search service
US20090310164A1 (en) Image forming apparatus, printing method, publicized information aggregating apparatus and method, and computer-readable storage medium for computer program
KR20000054312A (en) Establishing provide Method for ordered web information
GB2386219A (en) Customized document production using intelligent templates
US20070211293A1 (en) Document management system, method and program therefor
JP2002279080A (en) Method for providing news story scrap
JP2002149668A (en) Internet auxiliary software and recording medium having the same software recorded
EP1104901B1 (en) A system for treating saved queries as searchable documents in a document management system
JP2000029869A (en) Document management system, its method and recording medium recording program for the method
JPH0944516A (en) Information filtering device
JP2001297300A (en) System and device for document management
Shaw et al. Making of America: Online searching and page presentation at the University of Michigan
Heery et al. Metadata
KR20030004653A (en) Information support system and the method using real-time web search

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20040930

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20051021

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060823

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060811

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090313

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090324

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090514

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090623