JP6192603B2 - 文書処理装置および文書処理プログラム - Google Patents

文書処理装置および文書処理プログラム Download PDF

Info

Publication number
JP6192603B2
JP6192603B2 JP2014130954A JP2014130954A JP6192603B2 JP 6192603 B2 JP6192603 B2 JP 6192603B2 JP 2014130954 A JP2014130954 A JP 2014130954A JP 2014130954 A JP2014130954 A JP 2014130954A JP 6192603 B2 JP6192603 B2 JP 6192603B2
Authority
JP
Japan
Prior art keywords
document
evaluation
unit
data
document processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2014130954A
Other languages
English (en)
Other versions
JP2016009417A (ja
Inventor
徹 保井
徹 保井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Document Solutions Inc
Original Assignee
Kyocera Document Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Document Solutions Inc filed Critical Kyocera Document Solutions Inc
Priority to JP2014130954A priority Critical patent/JP6192603B2/ja
Priority to US14/751,155 priority patent/US20150381849A1/en
Publication of JP2016009417A publication Critical patent/JP2016009417A/ja
Application granted granted Critical
Publication of JP6192603B2 publication Critical patent/JP6192603B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、メタデータに基づいて文書を処理する文書処理装置および文書処理プログラムに関する。
近年、文書を登録し管理するサーバーや画像形成装置(MFP、Multifunction Peripheral)などの情報機器では、扱う文書数の増大に伴い、登録した文書の管理を効率化できる仕組みが求められていた。そして、以下のような仕組みが開発された。
例えば、特許文献1において開示された技術では、まず、画像形成装置に登録する文書とその文書のメタデータをメモリーカードから読み込み、画像形成装置で扱う文書形式に変換して、文書とそのメタデータを蓄積する。そして、ユーザーが入力したキーワードとメタデータに登録しているキーワードとを照合して、登録した文書を検索する。
また、特許文献2に開示された技術では、分析する文章に対して、検索に用いるキーワードと、そのキーワードに対する評価を表す語句と、その語句が文中に現れた際に集計する評価値とを用いて様々な分析を行う。文章中のキーワードを検索し、探し出したキーワードの周囲にある評価を表す語句を抽出し、その語句の内容により、検索されたキーワードに対する著者の評価を得る。そして得た多くの評価を集計して分析するものである。
また、特許文献3に開示された技術では、ウェブ・ページに広告を配信する際に、ウェブ・ページ内の単語を評価し、単語の評価から製品に対する意見を判定する。判定した意見に基づき、抽出要約または記述的要約を作成してテンプレートに入力することにより、その製品に対する広告を形成する。
また、特許文献4に開示された技術では、ユーザーがある文書(閲覧文書)を閲覧中に、その文書中の単語等をキーワードとして他の文書を検索し、検索結果として挙がった文書のうちユーザーが参照した文書を参照文書とする。閲覧文書と参照文書との関係をメタデータとして蓄積し、各種分析を行う。
特開2008−299432号公報 特開2011−70252号公報 特表2011−519444号公報 特開2007−102767号公報
上述したように、数多くの文書を管理したり分析したりするために、メタデータが活用されてきた。しかし、文書の内容を評価するためのメタデータの作成は、非常に手間のかかるものであった。
以上のような事情に鑑み、本発明の目的は、文書の内容を評価するためのメタデータを容易に作成し、作成したメタデータに基づき文書を要約できる文書処理装置および文書処理プログラムを提供することにある。
上記目的を達成するため、本発明の一形態に係る文書処理装置は、文字データおよびイメージデータのうち少なくとも一方を含む文書データが記憶された記憶部と、前記記憶された前記文書データを出力する出力部と、前記記憶された文書データを1人以上の評価者に評価させるために前記出力部に出力させる制御部と、前記出力された文書を評価した前記1人以上の評価者により選択された1以上の評価箇所の前記文書データ内での位置情報と前記評価箇所ごとに付与された評価結果とを受け付ける入力部とを備え、前記制御部は更に、前記入力部が受け付けた前記位置情報および前記評価結果を前記記憶部に記憶させ、前記記憶された前記位置情報に基づき、前記評価箇所を前記文書データから抽出して要約を作成する。そのため、文書の内容を評価するためのメタデータを容易に作成し、作成したメタデータに基づき文書を要約できる。
上記目的を達成するため、本発明の一形態に係る文書処理装置では、前記制御部は、前記位置情報に加え、前記評価結果に基づき、前記評価箇所を前記文書データから抽出して要約を作成する構成でもよい。
上記目的を達成するため、本発明の一形態に係る文書処理装置では、前記制御部は、前記評価箇所のうち、前記付与された評価結果の数が特定のしきい値を超えた評価箇所を前記要約として抽出する構成でもよい。
上記目的を達成するため、本発明の一形態に係る文書処理装置では、前記制御部は、前記評価箇所を前記文書データから抽出するとき、前記評価箇所を含む文章全体を抽出する構成でもよい。
上記目的を達成するため、本発明の一形態に係る文書処理装置では、前記制御部は、前記評価結果として、前記入力部に、高評価および低評価のいずれか一方を受け付けさせる構成でもよい。
上記目的を達成するため、本発明の一形態に係る文書処理装置では、前記制御部は、前記作成する要約に、前記評価箇所ごとの、前記高評価および前記低評価の数を含める構成でもよい。
上記目的を達成するため、本発明の一形態に係る文書処理プログラムは、記憶部に記憶された、文字データおよびイメージデータのうち少なくとも一方を含む文書データを1人以上の評価者に評価させるために出力部に出力させ、入力部に、前記出力された文書データを評価した前記1人以上の評価者により選択された評価箇所の前記文書データ内での位置情報と前記評価箇所に対して付与された評価結果とを受け付けさせ、前記受け付けられた前記位置情報および前記評価結果を前記記憶部に記憶させ、前記記憶された前記位置情報に基づき、前記評価箇所を前記文書データから抽出して要約を作成する制御部としてコンピューターを機能させる。
以上のように、本発明によれば、文書の内容を評価するためのメタデータを容易に作成し、作成したメタデータに基づき文書を要約できる。
、本発明の一実施形態に係る文書処理装置を、一般的なコンピューターを文書処理サーバー1として用いて実現する場合の、利用環境の具体的な例の構成図である。 文書処理装置として用いる文書処理サーバー1の構成図である。 本発明の一実施形態に係る文書処理装置を、画像形成装置20として実現する場合の、利用環境の具体的な例の構成図である。 文書処理装置として用いる画像形成装置20の構成図である。 文書処理サーバー1または画像形成装置20において、登録された文書の、評価者が指定した特定の箇所に対して、評価者がLike属性またはDislike属性を付加する様子を示す具体例である。 XMLなどの構造化言語フォーマットを用いて生成したメタデータの具体例である。 評価者Cが文書Dの特定の箇所「MAXで8192KB」にLike属性を付与し、評価者Dが文書Dの特定の箇所(Test4のグラフ)にLike属性を付与する様子を示す図である。 評価者B、C、およびDによる評価結果として生成されるメタデータ17bの例をまとめて示す図である。 集められたメタデータに基づいて生成される要約の例を示す図である。 要約D2にさらに属性付与の内訳を記載した要約D3の例を示す図である。 評価する文書を画像形成装置20に登録する第1の段階の処理の流れについて説明するためのフローチャートである。 画像形成装置20に登録した文書を評価する第2の段階の処理の流れについて説明するためのフローチャートである。 2人の評価者(評価者Aおよび評価者B)が、画像形成装置20において文書を評価する処理の具体例を説明するためのシーケンス図である。 第1の段階として文書を登録するユーザーが、第2の段階の評価者を兼ね、第1の段階と第2の段階をまとめて処理する具体例を説明するためのシーケンス図である。 収集された評価に関するメタデータに基づき、文書の要約を作成する第3の段階の処理の流れについて説明するためのフローチャートである。 第3の段階において、ユーザーの指示により要約が印刷されて出力されるまでの具体例を説明するためのシーケンス図である。
以下、図面を参照しながら、本発明の実施形態を説明する。
[概要]
最初に、本発明の概要について説明する。本発明は、「文書の登録」、「登録した文書の評価」、および「文書の評価をメタデータとして活用」の、3つの段階から構成される。
第1の段階では、「文書の登録」を行う。具体的には、ユーザーが文書処理装置により処理したい文書を、文書処理装置に登録する。登録は、紙媒体に印刷された文書をスキャナーで読取り、OCR(Optical Character Recognition)処理して電子的な文字データやイメージデータとしたものを文書処理装置に登録してもよいし、最初から電子データである文書をそのまま文書処理装置に登録してもよい。
第2の段階では、第1の段階で「登録した文書の評価」を行う。評価は、文書を登録したユーザーが属するグループのメンバーが文書処理装置にアクセスして行ってもよいし、文書を登録したユーザーとは無関係な一般の人が文書処理装置にアクセス出来るようにして評価を集めてもよい。評価は、評価者が文書管理装置に登録された文書の一部を指定し、指定した箇所に対して「Like」(好き、高評価)属性または「Dislike」(嫌い、低評価)属性を付与することにより行う。
第3の段階では、第2の段階で集めた「文書の評価をメタデータとして活用」する。具体的には、登録された文書のうち、Like属性やDislike属性が多くの評価者により付与された箇所は、注目度が高い重要な箇所であると判断し、その部分を抽出することにより、登録された文書の要約を作成する。
上述した3段階を経ることにより、登録された文書の内容を評価するためのメタデータを容易に作成し、作成したメタデータに基づき文書を要約することが出来る。
以上、本発明の概要について説明した。
[文書処理装置を利用する環境(その1)]
次に、本発明の一実施形態に係る文書処理装置を、一般的なコンピューターを文書処理サーバーとして用いて実現する場合の、利用環境の具体的な構成例を説明する。図1は、本発明の一実施形態に係る文書処理装置を、一般的なコンピューターを文書処理サーバー1として用いて実現する場合の、利用環境の具体的な例の構成図である。
この利用環境では、文書処理装置である文書処理サーバー1が、ネットワーク4を介して、PC(Personal Computer)2や画像形成装置3と接続されている。PC2および画像形成装置3は複数台あっても構わない。
「文書の登録」を行う第1の段階では、例えば、ユーザーが画像形成装置3のスキャナー機能を用いて紙文書をスキャンし、画像形成装置3の有するOCR機能により文書を文字データおよびイメージデータとして電子化し、電子化した文書をネットワーク4経由で文書処理サーバー1に登録する。
また、第1の段階では、PC2から文字データやイメージデータを含む電子的な文書をネットワーク4経由で文書処理サーバー1に登録してもよい。
「登録した文書の評価」を行う第2の段階では、文書処理サーバー1に登録された文書を評価するために、評価者は、文書処理サーバー1に備えられた表示部や操作入力部を用いて文書に直接アクセスするか、PC2からネットワーク4を介して文書にアクセスする。
「文書の評価をメタデータとして活用」する第3の段階では、第2の段階で文書内の特定の箇所に紐付けられたLike属性およびDislike属性を集計し、文書の要約を作成する。作成された要約を見るために、ユーザーは、文書処理サーバー1に備えられた表示部や操作入力部を用いて要約に直接アクセスするか、PC2を用いてネットワーク4経由で要約にアクセスする。
以上、本発明の一実施形態に係る文書処理装置を、一般的なコンピューターを文書処理サーバー1として用いて実現する場合の、利用環境の具体的な構成例を説明した。
[文書処理装置の構成(その1)]
次に、文書処理装置として用いる文書処理サーバー1の構成について説明する。図2は、文書処理装置として用いる文書処理サーバー1の構成図である。
図2に示すように、文書処理サーバー1は、CPU(Central Processing Unit)11、ROM(Read Only Memory)12、RAM(Random Access Memory)13、操作入力部(入力部)14、ネットワークインターフェイス部(出力部)15、表示部(出力部)16、および記憶部17を有し、これら各ブロックがバス18を介して接続されている。
ROM12は、各種の処理を実行するためのファームウェア等の複数のプログラムやデータを記憶する。RAM13は、CPU11の作業用領域として用いられ、OS(Operating System)、実行中の各種アプリケーション、処理中の各種データを一時的に保持する。
記憶部17は、例えばHDD(Hard Disk Drive)や、フラッシュメモリー、その他の不揮発性メモリーである。記憶部17には、OSや各種アプリケーションに加え、登録し評価される文書の文書データ17aや、文書を評価する事により特定の箇所に付加されたLike属性やDislike属性などのメタデータ17b、文書データ17aをメタデータ17bに基づいて処理して作成された要約データ17cが記憶される。
ネットワークインターフェイス部15は、ネットワーク4と接続されており、PC2や画像形成装置3と情報のやりとりを行う。
CPU11は、ROM12や記憶部17に記憶された複数のプログラムのうち、操作入力部14やネットワーク4経由で与えられる命令に対応するプログラムをRAM13に展開し、この展開されたプログラムにしたがって、表示部16及び記憶部17を適宜制御する。
また、CPU11は、ネットワーク4およびネットワークインターフェイス部15を介してユーザーが登録するために入力した電子的な文書データを記憶部17に記憶する。そして、CPU11は、評価者に対し、記憶した文書データ17aを提示し、評価者が提示された文書の特定の箇所に付加したLike属性およびDislike属性をメタデータ17bとして記憶部17に記憶する。
そして、CPU11は、記憶されたメタデータ17bに基づいて、文書の要約を要約データ17cとして作成し、作成した要約をユーザーに提供する。
操作入力部14は、例えばマウス等のポインティングデバイス、キーボード、タッチパネル、その他の操作装置である。
表示部16は、例えば液晶ディスプレイ、EL(Electro-Luminescence)ディスプレイ、プラズマディスプレイ、CRT(Cathode Ray Tube)ディスプレイ等である。表示部16は、文書処理サーバー1に内蔵されていてもよいし、外部接続されていてもよい。
以上、文書処理装置として用いる文書処理サーバー1の構成について説明した。
[文書処理装置を利用する環境(その2)]
次に、本発明の一実施形態に係る文書処理装置を、画像形成装置として実現する場合の、利用環境の具体的な構成例を説明する。図3は、本発明の一実施形態に係る文書処理装置を、画像形成装置20として実現する場合の、利用環境の具体的な例の構成図である。
この利用環境では、文書処理装置である画像形成装置20が、上述した例の文書処理サーバー1を兼ねている。すなわち、画像形成装置20は、上述した文書処理サーバー1と一般的な画像形成装置3の機能を統合したものである。
画像形成装置20が文書処理サーバー1の機能を兼ねている点を除けば、図1に示した構成と同じなので、詳細な説明は省略する。
以上、本発明の一実施形態に係る文書処理装置を、画像形成装置20として実現する場合の、利用環境の具体的な構成例を説明した。
[文書処理装置の構成(その2)]
次に、文書処理装置として用いる画像形成装置20の構成について説明する。図4は、文書処理装置として用いる画像形成装置20の構成図である。
画像形成装置20は、制御部21を備える。制御部21は、CPU、RAM、ROM、および専用のハードウェア回路等から構成され、画像形成装置20の全体的な動作制御を司る。
制御部21は、原稿読取部(スキャナー)22、画像処理部24、画像メモリー25、画像形成部(出力部)26、操作部(入力部)27、ファクシミリ通信部28、ネットワークインターフェイス部(出力部)29、記憶部31等と接続されている。制御部21は、接続されている上記各部の動作制御や、各部との間での信号又はデータの送受信を行う。
また、制御部21は、ネットワーク4およびネットワークインターフェイス部15を介してユーザーが登録するためにPC2から入力した電子的な文書データを記憶部17に記憶する。または、制御部21は、ユーザーが登録するために原稿読取部22に読み取らせたイメージデータをOCR処理し、電子的な文書データ31aとして記憶部31に記憶させる。
そして、制御部21は、評価者に対し、記憶した文書データ31aを、表示部27aまたはネットワーク4経由で提示し、評価者が提示された文書の特定の箇所に付加したLike属性およびDislike属性をメタデータ31bとして記憶部31に記憶する。
そして、制御部21は、記憶されたメタデータ31bに基づいて、文書の要約を要約データ31cとして作成し、作成した要約をユーザーに提供する。
制御部21は、ユーザーから、操作部27またはネッワーク接続されたPC2等を通じて入力されるジョブの実行指示に従って、スキャナー機能、印刷機能、コピー機能、およびファクシミリ送受信機能などの各機能についての動作制御を実行するために必要な機構の駆動及び処理を制御する。
また、制御部21は、OCR処理部21a等を有している。OCR処理部21a等は、ROMなどからRAMにロードされたプログラムがCPUにより実行されることで実現される機能ブロックである。
OCR処理部21aは、原稿読取部22により読み込まれたイメージデータをOCR処理し、文書データに変換したり、グラフや写真などのイメージデータを抽出したりする。
原稿読取部22は、原稿から画像を読み取る。
画像処理部24は、原稿読取部22で読み取られた画像のイメージデータを必要に応じて画像処理する。例えば、画像処理部24は、原稿読取部22により読み取られた画像が画像形成された後の品質を向上させるために、シェーディング補正等の画像処理を行う。
画像メモリー25は、原稿読取部22による読み取りで得られた原稿画像のデータを一時的に記憶したり、画像形成部26での印刷対象となるデータを一時的に記憶したりする領域である。
画像形成部26は、原稿読取部22で読み取られたイメージデータ等の画像形成を行う。
操作部27は、画像形成装置20が実行可能な各種動作及び処理についてユーザーからの指示を受け付けるタッチパネル部および操作キー部を備える。タッチパネル部は、タッチパネルが設けられたLCD(Liquid Crystal Display)等の表示部(出力部)27aを備えている。
ファクシミリ通信部28は、図示しない符号化/復号化部、変復調部、およびNCU(Network Control Unit)を備え、公衆電話回線網を用いてのファクシミリの送信を行う。
ネットワークインターフェイス部29は、LANボード等の通信モジュールから構成され、ネットワークインターフェイス部29に接続されたLAN等を介して、ローカルエリア内の装置(PC等)と種々のデータの送受信を行う。
記憶部31は、原稿読取部22によって読み取られた原稿画像や、文書データ31a、メタデータ31b、要約データ31cを記憶する。記憶部31は、HDDなどの大容量の記憶装置である。なお、文書データ31a、メタデータ31b、および要約データ31cは、上述した文書データ17a、メタデータ17b、および要約データ17cと同じものである。
以上、文書処理装置として用いる画像形成装置20の構成について説明した。
[Like属性およびDislike属性の付加方法]
次に、上述した第2の段階において、文書処理サーバー1または画像形成装置20に登録された文書の、評価者が指定した特定の箇所に対して、評価者がLike属性またはDislike属性を付加する様子を具体例で説明する。図5は、文書処理サーバー1または画像形成装置20において、登録された文書の、評価者が指定した特定の箇所に対して、評価者がLike属性またはDislike属性を付加する様子を示す具体例である。なお、以下の例では、文書処理装置として文書処理サーバー1を用いて説明する。
最初に、ユーザーAが、「評価結果レポート」という文書Dを文書処理サーバー1に登録しているとする。
次に、評価者Bが、文書評価用アプリケーションプログラムを用いて、閲覧画面D1上で文書Dを閲覧する。そして、「4章 結果レポート」内の「Test2」の項目に記述されている、「パフォーマンス」の値が「3,000msec」である事を見て、この数値が気に入らないとする。
評価者Bは、この数値が気に入らないという評価をするために、閲覧画面D1上で、「3,000msec」の箇所を選択し、Dislikeボタン(図示せず)をクリックする。
評価者がLikeボタン(図示せず)またはDislikeボタンをクリックすると、文書評価用アプリケーションプログラムは、例えば、図6に示すように、XML(Extensible Markup Language)などの構造化言語フォーマットを用いてメタデータ17bを生成する。
この構造化言語フォーマットのメタデータ17bでは、評価者が選択した箇所が文字列(text)であることや、章番号、選択開始位置のXY座標、選択終了位置のXY座標、選択された文字列が記録される。なお、さらに、選択された文字列を含み、意味のあるまとまりである1文として、<sentence>タグに対して「パフォーマンス : 3,000msec」が記録されてもよい。
同様にして、評価者Cが文書Dの特定の箇所「MAXで8192KB」にLike属性を付与し、評価者Dが文書Dの特定の箇所(Test4のグラフ)にLike属性を付与する様子を図7に示す。
また、評価者B、C、およびDによる評価結果として生成されるメタデータ17bの例をまとめて図8に示す。なお、図8の上段に示すLike属性の部分が、評価者DによるTest4のグラフの特定箇所に対するLike属性の付加を示すものであり、<type>タグに対してイメージデータであることを示す「image」が指定されている。
以上、文書処理サーバー1または画像形成装置20において、登録された文書の、評価者が指定した特定の箇所に対して、評価者がLike属性またはDislike属性を付加する様子を具体例で説明した。
[生成される要約の例]
次に、上述した第3の段階において、集められたメタデータに基づいて生成される要約の例を説明する。図9は、集められたメタデータに基づいて生成される要約の例を示す図である。
図9に示す要約D2は、上述した文書Dに対して評価者がLike属性またはDislike属性を付加して生成されたメタデータ17bに基づいて生成されたものである。
文書Dには、Like属性が「MAXで8192KB」の箇所とTest4のグラフに付与され、Dislike属性が「3,000msec」の箇所に付与されている。
そのため、要約D2では、「Like」の項目に、「MAXで8192KB」を含んだ1文である「メモリー消費は、MAXで8192KB、MINで4096KB。」と、Test4のグラフの全体とが記述されている。また、「Dislike」の項目には、「3,000msec」を含んだ1文である「パフォーマンス : 3,000msec」が記述されている。
文書を要約する際には、評価者が選択した箇所だけではなく、選択した箇所を含む、まとまった意味のある単位(例えば1文や1段落)を抽出することにより、生成される要約を理解し易いものとすることが出来る。
なお、要約には、文書中のどの箇所にどれだけのLike属性およびDislike属性が付与されたかの内訳を記述してもよい。図10は、上述した要約D2にさらに属性付与の内訳を記載した要約D3の例を示す図である。
図10に示す内訳を見ると、第1章から第3章までの内容については、評価者によるLike属性またはDislike属性の付与は行われておらず、第4章では8個のLike属性および3個のDislike属性が付与されていることが分かる。また、第4章に付与された8個のLike属性のうち、4個が「MAXで8192KB」の箇所に付与されたものであり、残り4個がTest4のグラフに付与されたものであることが分かる。
以上、上述した第3の段階において、集められたメタデータに基づいて生成される要約の例を説明した。
[要約への採用基準]
次に、文書中で、Like属性やDislike属性が付与された箇所のうち、どの箇所を要約に採用するかの基準について説明する。
採用基準として、例えば、Like属性が特定数以上の評価者から付与されていることや、Dislike属性が特定数以上の評価者から付与されていることなどを定めることが出来る。
本発明では、評価者が高評価や低評価を与えて注目している箇所が、要約に採用すべき箇所であるという前提に立っている。そのため、Like属性およびDislike属性の付与数に基づいて、特定の箇所を要約に採用するか否かを判断している。
以上、文書中で、Like属性やDislike属性が付与された箇所のうち、どの箇所を要約に採用するかの基準について説明した。
[要約の作成開始基準]
次に、集められたメタデータに基づいて要約を作成するタイミングの基準について説明する。
要約を作成するタイミングとしては、例えば、ユーザーから明示的に特定の文書に対する要約を作成する指示があった場合や、1つの文書に対し特定数以上の評価者により評価が行われた場合、1箇所に対して付与されるLike属性またはDislike属性が基準値を超えた場合、予め定められた評価期間が満了した場合などが考えられる。
以上、集められたメタデータに基づいて要約を作成するタイミングの基準について説明した。
[処理の流れ]
次に、文書処理装置である文書処理サーバー1および画像形成装置20で行われる処理の流れについて説明する。図11から図16は、文書処理装置である文書処理サーバー1および画像形成装置20で行われる処理の流れについて説明するためのフローチャートおよびシーケンス図である。
なお、以下の説明では、画像形成装置20を例に説明する。また、説明は、第1の段階から第3の段階までに分けて説明する。
<第1の段階(文書の登録)>
最初に、評価する文書を画像形成装置20に登録する第1の段階の処理の流れについて説明する。図11は、評価する文書を画像形成装置20に登録する第1の段階の処理の流れについて説明するためのフローチャートである。
まず、ユーザーが、評価のために登録する文書は紙に印刷したものであるか否かを判断する(ステップS1)。
紙に印刷したものである場合(ステップS1のY)、ユーザーは操作部27を介して制御部21に指示を与え、原稿読取部22に紙媒体をスキャンさせる(ステップS2)。
次に、制御部21は、OCR処理部21aにスキャンデータをOCR処理させる(ステップS3)。OCR処理後のデータは記憶部31に記憶される。
文書が紙媒体に印刷されたものでない場合(ステップS1のN)、またはOCR処理の終了後、文書を構成する文書データは、電子的な文字データやイメージデータにより構成され、そのまま記憶部31に記憶される(ステップS4)。
<第2の段階(登録した文書の評価)>
次に、画像形成装置20に登録した文書を評価する第2の段階の処理の流れについて説明する。図12は、画像形成装置20に登録した文書を評価する第2の段階の処理の流れについて説明するためのフローチャートである。
まず、文書を評価する評価者が、画像形成装置20に指示を与え、評価する文書を選択する(ステップS10)。
次に、画像形成装置20の制御部21が、表示部27aを介して、評価者に、選択された文書を提示する(ステップS11)。
次に、評価者が、高評価または低評価の属性を付与したい箇所を、提示された文書中で選択する(ステップS12)。
次に、評価者が、前ステップで選択した箇所に対し、LikeボタンまたはDislikeボタンを押して評価の属性を付与する(ステップS13)。
次に、画像形成装置20の制御部21は、評価者により選択された箇所の位置情報を付与された評価の属性とをメタデータ31bとして、記憶部31に記憶させる(ステップS14)。
<第2の段階の具体例>
次に、2人の評価者(評価者Aおよび評価者B)が、画像形成装置20において文書を評価する処理の具体例を説明する。図13は、2人の評価者(評価者Aおよび評価者B)が、画像形成装置20において文書を評価する処理の具体例を説明するためのシーケンス図である。
なお、図13に示す例では、評価者Aおよび評価者Bは、別のPC2から画像形成装置にアクセスしており、PC2上では、上述した文書評価用アプリケーションプログラムを使用して選択した文書の評価を行うものとする。
まず、評価者Aが、文書IDを指定して、画像形成装置20のネットワークインターフェイス部29および制御部21を介して、記憶部31に記憶されている文書データ31aを取得する。
具体的には、図13に示すように、まず、評価者Aが、評価者AのPC2を介して、文書IDを指定して文書取得要求をネットワークインターフェイス部29に送信する。次いで、ネットワークインターフェイス部29が文書IDを制御部21に送信する。制御部21は、文書IDを受信すると文書BOXサービスを起動し、記憶部31から文書IDに対応する文書データ31aを取得する。制御部21は、ネットワークインターフェイス部29を介して、取得した文書データ31aを評価者AのPC2に送信する。これにより、評価者Aは、文書データ31aを取得する。なお、文書BOXサービスは、記憶部31に記憶されている文書データ31aの入出力等の管理を行うために提供される。
次に、評価者Bが、評価者Aにおける処理と同様にして文書データ31aを取得する。
次に、評価者Aが、取得した文書データ31aについて、評価の属性を付与したい箇所を選択し、Likeボタンを押して評価の属性を付与すると、PC2において稼働する文書評価用アプリケーションプログラムがメタデータ31bを生成する。(メタデータ31bは、画像形成装置20上で生成されてもよいし、PC2上で生成されてもよい。)
次に、評価者Aが使用している文書評価用アプリケーションプログラムが、文書IDを指定して、生成されたメタデータ31bを画像形成装置20のネットワークインターフェイス部29および制御部21を介して、記憶部31に記憶させる。
具体的には、図13に示すように、まず、評価者AのPC2が文書IDとメタデータ31bをネットワークインターフェイス部29に送信する。次いで、ネットワークインターフェイス部29が文書IDとメタデータ31bを制御部21に送信する。制御部21は、文書IDとメタデータ31bを受信すると、文書BOXサービスを起動し、メタデータ31bを文書IDと関連付けて記憶部31に記憶させる。その後、制御部21は、ネットワークインターフェイス部29を介して、評価者Aの評価を登録したことを評価者AのPC2に通知する。
次に、評価者Bに関しても、Dislikeボタンを押す以外は評価者Aにおける処理と同様にして処理が行われる。
なお、メタデータ31bを画像形成装置20上で生成する場合は、PC2が文書IDとメタデータ31bの生成要求(付与された評価の属性と箇所の情報を含む。)をネットワークインターフェイス部29に送信し、ネットワークインターフェイス部29が文書IDとメタデータ31bの生成要求を制御部21に送信する。制御部21は、生成要求に応じて、メタデータ31bを生成する。
<第1の段階と第2の段階をまとめて行う具体例>
次に、第1の段階として文書を登録するユーザーが、第2の段階の評価者を兼ね、第1の段階と第2の段階をまとめて処理する具体例を説明する。図14は、第1の段階として文書を登録するユーザーが、第2の段階の評価者を兼ね、第1の段階と第2の段階をまとめて処理する具体例を説明するためのシーケンス図である。
まず、ユーザーが操作部27を介して、制御部21に紙に印刷した文書の電子化を指示する。
次に、制御部21が、原稿読取部22に指示を与え、文書のスキャンが行われる。
次に、制御部21が、OCR処理部21aに指示を与え、スキャンしたイメージデータから文字データへの変換が行われ、文書データが生成される。
次に、制御部21が、プレビュー確認のために、生成した文書データを操作部27の表示部27aに表示する。
次に、ユーザーが評価者として、評価の属性を付与したい箇所を選択し、選択した箇所に、高評価または低評価の属性を付与する。
次に、制御部21が、ユーザーの選択した箇所の位置情報を評価の属性を含んだメタデータ31bを生成する。
次に、ユーザーの指示に基づき、制御部21は、生成した文書データ31aおよびメタデータ31bを記憶部31に記憶させる。
最後に、制御部21は、評価者Aの評価を登録したことを表示部27aに表示する。
<第3段階(文書の評価をメタデータとして活用)>
次に、収集された評価に関するメタデータに基づき、文書の要約を作成する第3の段階の処理の流れについて説明する。図15は、収集された評価に関するメタデータに基づき、文書の要約を作成する第3の段階の処理の流れについて説明するためのフローチャートである。
まず、制御部21が、要約を作成する文書に関し、メタデータ31bが付与された箇所の位置情報を検索し、検索結果に基づいて、メタデータ31bが付与されている箇所のうち1つを選択する(ステップS20)。
次に、制御部21は、選択した箇所に付与されている高評価の合計数または低評価の合計数が特定のしきい値を超えているか否かを判断する(ステップS21)。
選択した箇所に付与されている高評価の合計数または低評価の合計数が特定のしきい値を超えている場合(ステップS21のY)、選択された箇所を含む意味のある単位(ここでは1文)を要約に入れるために採用し抽出する(ステップS22)。
次に、制御部21は、メタデータ31bの付与された箇所がまだあるか否かを判断する(ステップS23)。
メタデータ31bの付与された箇所がまだある場合(ステップS23のY)、制御部21は、メタデータ31bが付与された次の箇所を選択し(ステップS24)、ステップS21の処理に戻る。
メタデータ31bの付与された箇所がもう無い場合(ステップS23のN)、制御部21は、抽出したデータをまとめて要約を作成する(ステップS25)。
<第3の段階の具体例>
次に、第3の段階において、ユーザーの指示により要約が印刷されて出力されるまでの具体例を説明する。図16は、第3の段階において、ユーザーの指示により要約が印刷されて出力されるまでの具体例を説明するためのシーケンス図である。
まず、ユーザーが、画像形成装置20の操作部27を介して、制御部21に、特定の文書の要約を印刷するよう、指示を出す。
次に、制御部21が、記憶部31から該当する文書の文書データ31aおよびメタデータ31bを取得する。
次に、制御部21が、取得した文書データ31aおよびメタデータ31bを用いて、要約を作成する。
次に、制御部21が、画像形成部26に印刷指示を出し、要約が印刷され、出力される。
以上、文書処理装置である文書処理サーバー1および画像形成装置20で行われる処理の流れについて説明した。
[補足事項]
その他、本発明は、上述の実施形態にのみ限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々変更を加え得ることは勿論である。
1 … 文書処理サーバー
2 … PC
3 … 画像形成装置
4 … ネットワーク
11 … CPU
12 … ROM
13 … RAM
14 … 操作入力部
15 … ネットワークインターフェイス部
16 … 表示部
17 … 記憶部
18 … バス
20 … 画像形成装置
21 … 制御部
22 … 原稿読取部
24 … 画像処理部
25 … 画像メモリー
26 … 画像形成部
27 … 操作部
27a… 表示部
28 … ファクシミリ通信部
29 … ネットワークインターフェイス部
31 … 記憶部

Claims (5)

  1. 文字データおよびイメージデータのうち少なくとも一方を含む文書データが記憶された記憶部と、
    前記記憶された前記文書データを出力する出力部と、
    前記記憶された文書データを1人以上の評価者に評価させるために前記出力部に出力させる制御部と、
    前記出力された文書データを評価した前記1人以上の評価者により選択された1以上の評価箇所の前記文書データ内での位置情報と前記評価箇所ごとに付与された評価結果とを受け付ける入力部と
    を備え、
    前記制御部は更に、
    前記入力部が受け付けた前記位置情報および前記評価結果を前記記憶部に記憶させ、
    前記評価箇所に対して付与された前記評価結果の数がしきい値を超えているか否かを判断し、
    前記評価箇所に対して付与された前記評価結果の数がしきい値を超えている場合、前記記憶された前記位置情報に基づき、前記評価箇所を前記文書データから抽出して要約を作成する
    文書処理装置。
  2. 請求項1に記載の文書処理装置であって、
    前記制御部は、
    前記評価箇所を前記文書データから抽出するとき、前記評価箇所を含む、まとまった意味のある単位を抽出する
    文書処理装置。
  3. 請求項1又は2に記載の文書処理装置であって、
    前記制御部は、
    前記評価結果として、前記入力部に、前記評価結果として高評価および低評価のいずれか一方を受け付けさせる
    文書処理装置。
  4. 請求項3に記載の文書処理装置であって、
    前記制御部は、
    前記作成する要約に、前記評価箇所ごとの、前記高評価および前記低評価の数を含める
    文書処理装置。
  5. 記憶部に記憶された、文字データおよびイメージデータのうち少なくとも一方を含む文書データを1人以上の評価者に評価させるために出力部に出力させ、
    入力部に、前記出力された文書データを評価した前記1人以上の評価者により選択された評価箇所の前記文書データ内での位置情報と前記評価箇所に対して付与された評価結果とを受け付けさせ、
    前記受け付けられた前記位置情報および前記評価結果を前記記憶部に記憶させ、
    前記評価箇所に対して付与された前記評価結果の数がしきい値を超えているか否かを判断し、
    前記評価箇所に対して付与された前記評価結果の数がしきい値を超えている場合、前記記憶された前記位置情報に基づき、前記評価箇所を前記文書データから抽出して要約を作成する
    制御部としてコンピューターを機能させるための
    文書処理プログラム。
JP2014130954A 2014-06-26 2014-06-26 文書処理装置および文書処理プログラム Expired - Fee Related JP6192603B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2014130954A JP6192603B2 (ja) 2014-06-26 2014-06-26 文書処理装置および文書処理プログラム
US14/751,155 US20150381849A1 (en) 2014-06-26 2015-06-26 Document Processing Device That Facilitates Evaluation of Document, Document Processing Method, and Recording Medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014130954A JP6192603B2 (ja) 2014-06-26 2014-06-26 文書処理装置および文書処理プログラム

Publications (2)

Publication Number Publication Date
JP2016009417A JP2016009417A (ja) 2016-01-18
JP6192603B2 true JP6192603B2 (ja) 2017-09-06

Family

ID=55226911

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014130954A Expired - Fee Related JP6192603B2 (ja) 2014-06-26 2014-06-26 文書処理装置および文書処理プログラム

Country Status (1)

Country Link
JP (1) JP6192603B2 (ja)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0764979A (ja) * 1993-08-31 1995-03-10 Hitachi Ltd 文書情報処理装置
JP2004199408A (ja) * 2002-12-18 2004-07-15 Fuji Xerox Co Ltd 文書処理方法、情報表示処理方法、情報表示処理システム、管理サーバ、クライアント端末、プログラム
JP3982451B2 (ja) * 2003-05-21 2007-09-26 株式会社日立製作所 レビュー支援装置、方法及びプログラム
JP5218544B2 (ja) * 2010-12-24 2013-06-26 大日本印刷株式会社 電子書籍の試読データ作成装置および作成方法

Also Published As

Publication number Publication date
JP2016009417A (ja) 2016-01-18

Similar Documents

Publication Publication Date Title
US7715625B2 (en) Image processing device, image processing method, and storage medium storing program therefor
US10114940B2 (en) Information processing system, information processing apparatus, and information processing method
JP2006120125A (ja) ドキュメント画像情報管理装置及びドキュメント画像情報管理プログラム
KR101814120B1 (ko) 이미지를 전자문서에 삽입하는 방법 및 이를 수행하는 장치
JP2007286864A (ja) 画像処理装置、画像処理方法、プログラムおよび記録媒体
JP2009003802A (ja) 情報表示装置及び情報表示方法
US8150799B2 (en) Document management apparatus, document management method and computer readable storage medium
US10839146B2 (en) Information processing system, information processing apparatus, control method, and storage medium
US20120050802A1 (en) Interaction system, image processing apparatus and interaction control method
JP2007058622A (ja) 文書管理装置及び文書管理方法
JP4956319B2 (ja) 画像処理装置、その制御方法、ならびにそのプログラムおよび記憶媒体
US20120215864A1 (en) Document management apparatus and method of controlling the same
JP2020024303A (ja) 画像処理装置及びその制御方法、並びにプログラム
JP2009075977A (ja) 携帯端末閲覧文書配信サーバ、携帯端末、及び携帯端末閲覧文書配信システム
JP6262708B2 (ja) 深い検索性を有するオブジェクト化及びハードコピーからオリジナルの電子ファイルを検出するドキュメント検出方法
US20170154022A1 (en) Information processing apparatus, method for controlling the same, and storage medium
US9798724B2 (en) Document discovery strategy to find original electronic file from hardcopy version
US20160188612A1 (en) Objectification with deep searchability
JP2010092383A (ja) 電子文書ファイル検索装置、電子文書ファイル検索方法及びコンピュータプログラム
JP4747828B2 (ja) 履歴管理装置
JP6192603B2 (ja) 文書処理装置および文書処理プログラム
US20120239662A1 (en) Document management apparatus and document management method
JP6175414B2 (ja) 文書処理装置および文書処理プログラム
US20120144169A1 (en) Information processing apparatus, information processing method, and computer readable medium
JP2007249700A (ja) 文書管理装置、文書検索方法、文書検索プログラム及び記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160721

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170421

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170509

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170629

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170711

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170808

R150 Certificate of patent or registration of utility model

Ref document number: 6192603

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees