JP2009110506A - 情報処理装置及び情報処理プログラム - Google Patents
情報処理装置及び情報処理プログラム Download PDFInfo
- Publication number
- JP2009110506A JP2009110506A JP2008237138A JP2008237138A JP2009110506A JP 2009110506 A JP2009110506 A JP 2009110506A JP 2008237138 A JP2008237138 A JP 2008237138A JP 2008237138 A JP2008237138 A JP 2008237138A JP 2009110506 A JP2009110506 A JP 2009110506A
- Authority
- JP
- Japan
- Prior art keywords
- document
- comment
- document element
- unit
- annotation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【解決手段】 クライアントコンピュータからのリクエストを受け、サーバから取得した処理対象の文書から文書解析部230で文書要素が切り出され、切り出された文書要素にクライアントの注釈(コメント)が付与される。文書要素は、画像表現形式の文書から意味のある部分要素として、例えば、文章の行、段落で区切られる領域、図表、写真の領域、区切り線などによって分けられた領域等で定義される。この文書要素をコメントを文書要素DBとDBに格納して、オリジナル文書の蓄積部とは別に管理する。
【選択図】図3
Description
・ 特定のタグが関連づけられたURL群
・ あるURLに関連づけて、タグ群やコメントを付与したユーザ
・ あるURLをブックマークしているユーザというように複数の観点から情報へのアクセスができるようになっている。
・コメントは、URLの示すリソース(文書)全体に対して付与されており、当該コメントを付与した利用者が当該文書のどの文書要素に着目したかが示されない場合が普通であり、文書に付与されたコメントがどの文書要素に対するものかを把握することができず、情報の利用性が不十分となる場合があった、
・ブックマークの対象となる文書が削除されることがあり、このように文書が削除されると、文書に関連付けて保管されているブックマークが無効になり、文書に対し付与したコメントが保存されず削除されていた、といった点への対応策が提案されていないのが現状で、情報の保存や共有を行う上で不具合が生じる可能性は、否めない。
・連なった複数行の文章で文書が構成される場合には、行、段落(図1(A)の要素a1、a2、a3、b1、b2及びb4、参照)
・図表、写真の領域(図1(A)の要素b3、参照)
・区切り線などによって分けられた領域に含まれる文章等
を対象として切り出すことが適当である。このような画像表現要素に着目した解析方法による1つの利点は、文書の電子フォーマットによらない解析方法を採用することができる点にある。
(例1)識別番号12345の文書: http://s1.example.com/docs/12345
(例2)識別番号12345の文書に属する、先頭から20番目の文書要素:
http://s1.example.com/docs/12345/20
図3のデータ抽出部240は、HTTPサーバ部250が受け付けたクライアントコンピュータ100からのリクエストに従い、当該リクエストにおいて指示された条件に応じ、文書注釈DB部245及び文書要素DB部235にそれぞれ格納された注釈及び文書要素を抽出してHTTPサーバ部250内の文書表示部252に渡す。
例えば、図1(A)の文書の例の場合、文書aが文書要素a1、a2、a3、三つの文書要素に分割されており、同図(B)に示すように、それぞれ、要素a1に対し0個、要素a2に対し3個、要素a3に対し4個の注釈が付与されている。ここで、一つの文書要素である要素a2のみを抽出条件として設定すると、要素a2に付与された3個の注釈を抽出できる。この抽出条件を用いることで、特定の文書要素に関する注釈だけを抽出するができ、この要素に絞った注釈の集約等が容易に行える。図7Aは上記一つの文書要素に付与された注釈の抽出する際の処理の流れを示す。
例えば、図1(A)の文書bを対象とし、この抽出条件を与えると、要素b1に2個、要素b2に0個、要素b3に0個、要素b4に1個の注釈が付与されているので、注釈のついた要素b1及び要素b4に付与された注釈だけを抽出できる。この抽出条件を用いることで、レビューなどにおいて修正点を瞬時に把握することができる。図7Bは上記注釈の付与された文書要素のみの抽出を行う場合の処理の流れを示す。
例えば、図1(A)の文書a及び文書bを対象とし、この抽出条件を与えると、要素a2には3個、要素a3には4個、要素b1には2個、要素b4には1個の注釈が付与されているので、これらの要素に付与された注釈からキーワードを含むものだけを抽出できる。この抽出条件を用いることで、注釈の利用における利便性が向上する。また、ソーシャルブックマークのタギング(Tagging)のように、ユーザが独自の観点で集めた文書要素の集合を定義することができる。図7Cは上記特定のキーワードを含む注釈の抽出を行う場合の処理の流れを示す。
なお、上記URLにおいて、s1は文書要素管理サーバ(s1)であり、w1は文書管理サーバ(w1)である。
http://s1.example.com/comments/docs/12345/20
上記リクエストに対するレスポンスは、例えば下記(XMLの例)に示すようなXML(eXtensible Markup Language)として返される。
<?xml version="1.0" encoding="utf-8"?>
<commentList about="http://s1.example.com/docs/12345/20">
<comment>コメント1</comment>
<comment>コメント2</comment>
</commentList>
これを受信したクライアントコンピュータ100のウェブブラウザは、ECMA(European Computer Manufacturers Association)ScriptやXSLT(XML Stylesheet Language Transformations)を利用して、当該XMLを、画面上に表示可能な形式に変換する。
http://s1.example.com/comments/docs/12345
このリクエストに対するレスポンスは、下記(XMLの例)に示すようなXMLとして返され得る。
<?xml version="1.0" encoding="utf-8"?>
<commentList about="http://s1.example.com/docs/12345">
<comment about="http://s1.example.com/docs/12345/20">コメント1</comment>
<comment about="http://s1.example.com/docs/12345/20">コメント2</comment>
</commentList>
また、下記(URLの例)に示すようなURLを呼び出すリクエストが送られると、注釈に文字列「WORD」(すなわち上記「キーワード」)が含まれる文書要素だけが抽出されて出力される。
http://s1.example.com/comments/docs?query=WORD
文書注釈管理システム210(図3)の動作としてクライアントのリクエストに応じて行われる、文書要素、注釈等のデータ抽出、送信処理について、図5の処理フローを参照して、説明する。
・クライアントコンピュータ100から例えば以下のURLへのGETアクセスが行われる。
http://s1.example.com/12345/13
・文書要素管理サーバ(s1)200は当該URLに応じ、当該URLの特定部分、すなわち後半の部分を参照することで、上記文書ID'12345'と、文書要素ID'13'とを取り出す。
・次に文書要素管理サーバ(s1)200は、上記文書要素管理テーブルを参照し、当該文書要素管理テーブル中、以下の条件を満たす行を選択する。
そして文書要素管理サーバ(s1)200は、文書要素管理テーブル中の上記選択された行のdata_pathの項目を参照することで、前記URLで指定された文書要素が格納されたファイルシステム上のパス名を取り出す。以下にその際に使用される命令の記述例を示す。
SELECT data_path FROM 文書要素管理テーブル
WHERE document_id = 12345
AND element_id = 13;
・上記取り出されたパス名であるdata_path値(例えば$data_pathとする)と、システム固有のデータ保存ディレクトリパス(例えばDATA_DIRとする)とから、目的とする文書要素の画像の格納位置を特定する。以下に上記目的とする文書要素の画像の格納位置を特定する情報の記述方法の例を示す。
DATA_DIR + "/" + $data_path
上記記述方法に沿った、当該目的とする文書要素の画像の格納位置を特定する情報の実際の記述は、例えば以下のようなものである。
C:/data/12345/13.png
・文書要素管理サーバ(s1)200は上記目的とする文書要素の画像の格納位置を特定する情報の記述にしたがい、該当する文書要素の画像のデータにアクセスし、当該文書要素の画像の内容をHTTPレスポンスとしてクライアントコンピュータ100に送信する。
http://s1.example.com/docs/12345
・クライアントコンピュータ100から上記URLの指定を受け、文書要素管理サーバ(s1)200は上記注釈管理テーブルを参照し、当該注釈管理テーブル中、URL項目が上記URLで始まる行を選択する。以下に注釈管理テーブル中、URL項目が上記URLで始まる行を選択するための命令の記述例を示す。
SELECT url,comment FROM 注釈管理テーブル
WHERE url LIKE 'http://s1.example.com/docs/12345/%';
・文書要素管理サーバ(s1)200は前記選択した行のcomment項目の内容、すなわち注釈の内容をHTTPレスポンスとしてクライアントコンピュータ100に送信する。
200・・文書要素管理サーバ(s1)、
210・・文書注釈管理システム、
230・・文書解析部、
235・・文書要素データベース部、
240・・データ(文書要素・注釈)抽出部、
245・・文書注釈データベース部、
300・・文書管理サーバ(w1)、
400・・文書管理サーバ(w2)。
Claims (12)
- 文書を当該文書の文書要素ごとに文書要素記憶手段に格納する文書要素格納手段と、
前記文書要素に対するコメントをコメント格納手段に入力するコメント入力手段と、
前記コメント入力手段によって入力された前記文書要素に対するコメントを、当該コメントが、前記文書要素を有する文書及び前記文書要素に関するコメントであることを識別し得る形態でコメント記憶手段に格納するコメント格納手段とを有する情報処理装置。 - 抽出要求に応じ、前記文書要素記憶手段又は前記コメント記憶手段から文書要素又はコメントを抽出する情報抽出手段を有する請求項1に記載の情報処理装置。
- 前記情報抽出手段は、文書要素を指定したコメントの一括抽出要求に応じ、当該指定に係る文書要素に関するコメントを一括して前記コメント記憶手段から抽出する請求項1又は2に記載の情報処理装置。
- 前記情報抽出手段は、コメントが入力された文書要素の抽出要求に応じ、コメントをコメント記憶手段から抽出するとともに、当該コメントが入力された文書要素を文書要素記憶手段から抽出する請求項1乃至3のうちの何れか一項に記載の情報処理装置。
- 前記情報抽出手段は、キーワードを指定した文書要素の抽出要求に応じ、当該キーワードを含むコメントを前記コメント記憶手段から抽出するとともに、当該コメントが入力された文書要素を文書要素記憶手段から抽出する請求項1乃至3のうちの何れか一項に記載の情報処理装置。
- 文書を解析して当該文書から文書要素を切り出す文書解析手段を有し、
前記文書要素格納手段は、前記文書解析手段により切り出された文書要素を前記文書要素記憶手段に格納する請求項1乃至5のうちの何れか一項に記載の情報処理装置。 - 情報処理を行うためのコンピュータを、
文書を当該文書の文書要素ごとに文書要素記憶手段に格納する文書要素格納手段と、
前記文書要素に対するコメントをコメント格納手段に入力するコメント入力手段と、
前記コメント入力手段によって入力された前記文書要素に対するコメントを、当該コメントが、前記文書要素を有する文書及び前記文書要素に関するコメントであることを識別し得る形態でコメント記憶手段に格納するコメント格納手段として機能させるための情報処理プログラム。 - 前記コンピュータを、更に、抽出要求に応じ、前記文書要素記憶手段又は前記コメント記憶手段から文書要素又はコメントを抽出する情報抽出手段として機能させるための請求項7に記載の情報処理プログラム。
- 前記情報抽出手段は、文書要素を指定したコメントの一括抽出要求に応じ、当該指定に係る文書要素に関するコメントを一括して前記コメント記憶手段から抽出する請求項7又は8に記載の情報処理プログラム。
- 前記情報抽出手段は、コメントが入力された文書要素の抽出要求に応じ、コメントをコメント記憶手段から抽出するとともに、当該コメントが入力された文書要素を文書要素記憶手段から抽出する請求項7乃至9のうちの何れか一項に記載の情報処理プログラム。
- 前記情報抽出手段は、キーワードを指定した文書要素の抽出要求に応じ、当該キーワードを含むコメントを前記コメント記憶手段から抽出するとともに、当該コメントが入力された文書要素を文書要素記憶手段から抽出する請求項7乃至9のうちの何れか一項に記載の情報処理プログラム。
- 前記コンピュータを、更に、文書を解析して当該文書から文書要素を切り出す文書解析手段として機能させるための情報処理プログラムであって、
前記文書要素格納手段は、前記文書解析手段により切り出された文書要素を前記文書要素記憶手段に格納する請求項7乃至11のうちの何れか一項に記載の情報処理プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008237138A JP2009110506A (ja) | 2007-10-11 | 2008-09-16 | 情報処理装置及び情報処理プログラム |
US12/248,468 US20090100023A1 (en) | 2007-10-11 | 2008-10-09 | Information processing apparatus and computer readable information recording medium |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007265655 | 2007-10-11 | ||
JP2008237138A JP2009110506A (ja) | 2007-10-11 | 2008-09-16 | 情報処理装置及び情報処理プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009110506A true JP2009110506A (ja) | 2009-05-21 |
Family
ID=40778884
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008237138A Pending JP2009110506A (ja) | 2007-10-11 | 2008-09-16 | 情報処理装置及び情報処理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2009110506A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011039997A (ja) * | 2009-08-18 | 2011-02-24 | Fuji Xerox Co Ltd | 情報処理装置及びコンピュータプログラム |
CN116911264A (zh) * | 2023-09-12 | 2023-10-20 | 中贸促信息技术有限责任公司 | 一种大型pdf批注方法及装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0668085A (ja) * | 1992-08-21 | 1994-03-11 | Sharp Corp | 注釈機能付文書処理装置 |
JPH1153361A (ja) * | 1997-08-05 | 1999-02-26 | Hitachi Ltd | 文書と付加情報間の対応付け方法 |
JP2004151899A (ja) * | 2002-10-29 | 2004-05-27 | Fuji Xerox Co Ltd | 情報提供方法、情報提供処理システム、プログラム |
JP2004199407A (ja) * | 2002-12-18 | 2004-07-15 | Fuji Xerox Co Ltd | 情報表示処理方法、情報表示処理システム、管理サーバ、クライアント端末、プログラム |
WO2005091904A2 (en) * | 2004-03-04 | 2005-10-06 | Mathsoft Engineering & Education, Inc. | A method for automatically enabling traceability of engineering calculations |
JP2006244467A (ja) * | 2005-02-01 | 2006-09-14 | Canon Inc | 文書処理装置及び方法と文書処理システム |
JP2007226769A (ja) * | 2006-01-24 | 2007-09-06 | Ricoh Co Ltd | 情報管理装置、情報管理方法、情報管理プログラム、記録媒体及び情報管理システム |
-
2008
- 2008-09-16 JP JP2008237138A patent/JP2009110506A/ja active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0668085A (ja) * | 1992-08-21 | 1994-03-11 | Sharp Corp | 注釈機能付文書処理装置 |
JPH1153361A (ja) * | 1997-08-05 | 1999-02-26 | Hitachi Ltd | 文書と付加情報間の対応付け方法 |
JP2004151899A (ja) * | 2002-10-29 | 2004-05-27 | Fuji Xerox Co Ltd | 情報提供方法、情報提供処理システム、プログラム |
JP2004199407A (ja) * | 2002-12-18 | 2004-07-15 | Fuji Xerox Co Ltd | 情報表示処理方法、情報表示処理システム、管理サーバ、クライアント端末、プログラム |
WO2005091904A2 (en) * | 2004-03-04 | 2005-10-06 | Mathsoft Engineering & Education, Inc. | A method for automatically enabling traceability of engineering calculations |
JP2007535028A (ja) * | 2004-03-04 | 2007-11-29 | マスソフト・エンジニアリング・アンド・エデユケーシヨン・インコーポレーテツド | 技術計算のトレーサビリティを自動的に可能にする方法 |
JP2006244467A (ja) * | 2005-02-01 | 2006-09-14 | Canon Inc | 文書処理装置及び方法と文書処理システム |
JP2007226769A (ja) * | 2006-01-24 | 2007-09-06 | Ricoh Co Ltd | 情報管理装置、情報管理方法、情報管理プログラム、記録媒体及び情報管理システム |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011039997A (ja) * | 2009-08-18 | 2011-02-24 | Fuji Xerox Co Ltd | 情報処理装置及びコンピュータプログラム |
CN116911264A (zh) * | 2023-09-12 | 2023-10-20 | 中贸促信息技术有限责任公司 | 一种大型pdf批注方法及装置 |
CN116911264B (zh) * | 2023-09-12 | 2023-11-28 | 中贸促信息技术有限责任公司 | 一种大型pdf批注方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7715625B2 (en) | Image processing device, image processing method, and storage medium storing program therefor | |
US7315848B2 (en) | Web snippets capture, storage and retrieval system and method | |
JP5383234B2 (ja) | 情報処理装置及び印刷制御方法 | |
JP5023715B2 (ja) | 情報処理システム、情報処理装置及びプログラム | |
US20090172520A1 (en) | Method of managing web services using integrated document | |
JP2000222394A (ja) | 文書管理装置及びその文書管理方法並びにその制御プログラムを記録した記録媒体 | |
JP4398454B2 (ja) | アノテーション管理プログラム、アノテーション管理装置、アノテーション編集プログラム及びアノテーション編集装置 | |
JP2009301335A (ja) | 画像処理装置、画像処理方法及びコンピュータプログラム | |
US20090100023A1 (en) | Information processing apparatus and computer readable information recording medium | |
KR20060101803A (ko) | 동적 열람이 가능한 전자 문서의 제작 및 열람 방법 | |
US20070185832A1 (en) | Managing tasks for multiple file types | |
JP2008269069A (ja) | 情報処理システム及び情報処理方法 | |
JP2019040260A (ja) | 情報処理装置及びプログラム | |
TWI438638B (zh) | Integration of Easy Information Aggregate Files | |
JP2001109741A (ja) | Htmlデータ作成方法及びhtmlデータ作成システム | |
JP2009140020A (ja) | アノテーションプログラム、アノテーション装置及びアノテーション方法 | |
JP2007233698A (ja) | ウェブ表示端末および注釈処理モジュール | |
JP2007233695A (ja) | 注釈管理装置、ウェブ表示端末、注釈管理方法およびウェブ表示方法 | |
JP2009110506A (ja) | 情報処理装置及び情報処理プログラム | |
JP4879612B2 (ja) | 注釈管理装置、ウェブ表示端末、注釈管理方法およびウェブ表示方法 | |
JP2004326626A (ja) | 構造化文書ファイル管理装置および構造化文書ファイル管理方法 | |
JP2005339580A (ja) | 文書データ管理装置およびプログラム | |
JP2010049598A (ja) | ウェブサイト作成支援装置及びウェブサイト作成支援プログラム | |
JP4996504B2 (ja) | Sbmサーバ、登録用画面生成方法及びプログラム | |
JP2005222237A (ja) | 文書検索表示システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110804 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130121 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130205 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130405 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130521 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130719 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20130813 |