JP2007142631A - 画像形成装置 - Google Patents

画像形成装置 Download PDF

Info

Publication number
JP2007142631A
JP2007142631A JP2005331467A JP2005331467A JP2007142631A JP 2007142631 A JP2007142631 A JP 2007142631A JP 2005331467 A JP2005331467 A JP 2005331467A JP 2005331467 A JP2005331467 A JP 2005331467A JP 2007142631 A JP2007142631 A JP 2007142631A
Authority
JP
Japan
Prior art keywords
image data
document
image
unit
forming apparatus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2005331467A
Other languages
English (en)
Inventor
Masaru Sekiguchi
優 関口
Yoshibumi Sakuramata
義文 櫻又
Junichi Takami
淳一 鷹見
Tetsuya Sakayori
哲也 酒寄
Iwao Saeki
巌 佐伯
Yoshinaga Kato
喜永 加藤
Akira Ro
彬 呂
Toshio Miyazawa
利夫 宮澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2005331467A priority Critical patent/JP2007142631A/ja
Publication of JP2007142631A publication Critical patent/JP2007142631A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Facsimiles In General (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

【課題】複数枚の原稿が順番通りになっていなくても、ページ番号の認識あるいは原稿内の文書のつながりから原稿を順番通りに整えて表示または出力する画像形成装置を提供することを目的とする。
【解決手段】画像形成装置100は、原稿読取部101は、例えばユーザが図示しないADF(原稿自動給紙装置)に載置した複数枚の原稿を読み取り、原稿画像データを画像記憶部102へ送信し、画像記憶部102は、原稿読取部101から送信された原稿画像データを画像解析部103、仕上がり画像生成部105へ送信する。画像解析部103は、画像記憶部102から送信された原稿画像データから文字のつながりやページ番号の有無を解析し、複数枚の原稿の原稿特性値を抽出して仕上がり画像生成部105へ送信する。
【選択図】図1

Description

本発明は、原稿の画像を読み取って、その画像データを記憶保存し、必要に応じてその記憶した画像データを編集処理して要し上に画像形成して出力する画像形成装置に関し、特に、画像データを出力する画像の順番を変更可能な画像処理を行うことができる画像形成装置に関する。
従来の画像形成装置では、複数枚の原稿の画像を読み取る際に、原稿の先頭ページから順番に読み取って記憶し、出力する場合は、記憶した画像データを読み取った順に出力するようにしていた。その際、複数枚の原稿を読み取る際に、原稿のページの順番がページ番号順でなかった場合には、読み取りを行う際にユーザがページ番号順に整理してから読み取りを行うため、手間を必要としていた。
そういった手間を解消するために、読み取る原稿のページが順番通りになっていなくても順番通りに出力を行う画像形成装置がある(特許文献1)。
特許文献1の発明は、複数枚の原稿を読み取り、読み取った画像データから原稿のページ番号を示すデータを認識し、認識したデータを記憶手段に記憶する。画像データを出力する際には、記憶手段に記憶されているページ番号を示すデータからページ番号の小さい順、または大きい順、すなわち、ページ番号に従って出力するものである。
また、どういう順番で画像データを出力するかは、出力する度にユーザに画面上で選択させるものである。
特開2003−234858号公報
しかしながら、原稿にページ番号は記載されていなかったり、ページ番号は不鮮明な場合には、原稿の内容に沿った順番に整えたり、ページ番号順に整えたりして出力することが困難となる。
本発明は、係る問題に鑑みて、複数枚の原稿が順番通りになっていなくても、ページ番号の認識あるいは原稿内の文書のつながりから原稿を順番通りに整えて表示または出力する画像形成装置を提供することを目的とする。
上記目的を達成するために、請求項1記載の画像形成装置は、複数枚の原稿を読み取る読取手段と、読取手段で読み取った原稿画像データを記憶する記憶手段と、記憶手段に記憶した原稿画像データを出力する出力手段とを備えた画像形成手段において、記憶手段に記憶した原稿画像データから所定の順番に並べ替えるための画像データを解析する解析手段と、解析手段で得られた画像データから所定の順番に並べ替えた原稿画像データを生成する生成手段と、原稿画像データに特定の処理を行うための特定情報を生成手段へ送信する特定情報処理手段と生成手段で生成された原稿画像データを表示する表示手段とを有することを特徴とする。
請求項2記載の発明は、請求項1記載の画像形成装置であって、解析手段は、複数枚の原稿にページ番号が印字されている場合には、読取手段で読み取った原稿画像データからページ番号を示す画像データを検出する検出手段を有することを特徴とする。
請求項3記載の発明は、請求項1または2記載の画像形成装置であって、生成手段は、解析手段で得られた画像データからページ番号に従って原稿画像データを生成することを特徴とする。
請求項4記載の発明は、請求項1記載の画像形成装置であって、解析手段は、原稿画像データ内の文字列を形態素に分割する分割手段と、形態素の構文上における修飾関係を記憶したデータベースと、分割手段によって分割された形態素をデータベース内の形態素の修飾関係とを比較する比較手段とを備えることを特徴とする。
請求項5記載の発明は、請求項4記載の画像形成装置であって、分割手段では、対象となるページ内の文書の最後の文字列と残りのページ内の文書の最初の文字列を形態素に分割し、比較手段が、形態素に分割された対象となるページ内の文書の最後の文字列の修飾関係をデータベースに記憶されたものと比較し、該当する修飾関係に適応する文字列を含むページを検索することを特徴とする。
請求項6記載の発明は、請求項1から5のいずれか1項に記載の画像形成装置であって、特定情報処理手段は、原稿画像データを画像処理する設定項目が記憶されており、原稿画像データに対応する設定項目を検索する検索手段を有することを特徴とする。
以上の説明から、本発明では、複数枚の原稿を読み取る際に、原稿が順番通りになっていなくても、ページ番号の認識するか原稿の文書のつながりから複数枚の原稿を正しい順番に整えて表示または出力することができる。
次に、図面を参照して、本実施形態について説明する。
図1は、本実施形態に係る画像形成装置のシステム構成を示すブロック図である。
図1に示すように、画像形成装置100は、原稿読取部101と画像記憶部102、画像解析部103、ユーザインタフェース部104、仕上がり画像生成部105、プレビュー画像表示部106、トラップ設定領域定義テーブル107、キーワード入力部108、画像印刷部109から構成されている。
原稿読取部101は、例えばユーザが図示しないADF(原稿自動給紙装置)に載置した複数枚の原稿を読み取り、原稿画像データを画像記憶部102へ送信する。画像記憶部102は、原稿読取部101から送信された原稿画像データを記憶、保持すると共に、画像解析部103、仕上がり画像生成部105へ送信する。画像解析部103は、画像記憶部102から送信された原稿画像データから文字のつながりやページ番号の有無を解析し、複数枚の原稿の原稿特性値を抽出して仕上がり画像生成部105へ送信する。ユーザインタフェース部104は、画像解析部103が生成する原稿特性値に関連する機能の一覧である関連機能対応表(表1を参照)を有する関連機能対応部104aと関連機能検索部104bとを備えている。
図2に示すように、文書のページ番号、タイトル、文章、図面といった箇所をエリアに分け、各エリアに関連する処理が関連機能対応表に記されている。ユーザは、関連機能検索部104bから各エリアに適した関連機能を検索することができる。
Figure 2007142631
仕上がり画像生成部105は、プレビュー画像表示部106にプレビューするための画像を生成するものである。プレビュー画像表示部106は、仕上がり画像生成部105で生成された画像を表示するものである。
トラップ設定領域定義テーブル107は、プレビュー画像表示部106に表示された原稿画像に対し、タイトルや図などがある場合に、各要素に対応した領域を定義するための領域情報を保持している。キーワード入力部108は、ユーザがキーワードを入力することで、プレビュー画像表示部に、そのキーワードを含んだページが表示される。画像印刷部109は、複数枚の原稿をユーザが設定した順番で出力する。
ここで、画像解析部103から仕上がり画像生成部105へ送信される原稿特性値について説明する。
原稿特性値とは、例えば、原稿に印字されているページ番号やページをまたいでいる文字列のつながりである。画像解析部103は、原稿画像データから原稿に印字されているページ番号や文字列のつながりを取得し、原稿特性値として仕上がり画像生成部105へ送信する。
図3を参照して、画像解析部103の詳細な構成を説明する。
画像解析部103は、記憶部201とテキスト分割部202、比較部203、辞書データベース204、検出部205から構成されている。記憶部201は、画像記憶部102から送信された原稿画像データを一次的に記憶する。テキスト分割部202は、原稿画像データから文字列を形態素に分割する。比較部203は、形態素に分割された文字列を辞書データベース204に記憶されている修飾関係と比較する。辞書データベース204は、形態素の修飾関係が記憶されている。検出部205は、原稿画像データから所定の位置に印字されているページ番号を検出する。
ここで、テキスト分割部203が行う形態素解析について説明する。
日本語などの文書では、単語間に空白がなく区切られていないので、そのままの文書では基本とする検索インデックスを作成することができない。そこで、形態素辞書と形態素に関する文法の知識を用いて、文書を単語単位に「分かち書き」し、それぞれにおける語の構文上の役割を決める形態素解析を用いる。「分かち書き」とは、文書を書く時に語と語、または、文節と文節の間に空白を置く書き方である。
なお、形態素とは、それ以上分割できない語の単位であり、一般的には、意味を持つ最初の要素のことをいい、文はこの形態素で構成される。例えば、「文書を検索する」という文を、「文書」、「を」、「検索」、「する」、という形態素に分割することで、それぞれの形態素に意味を与え、構文解析や意味解析、文脈理解などの自然言語処理に活用する。
次に、図4を参照して、ページ番号の取得及び並べ替えについて説明する。
原稿読取部101が複数枚の原稿を読み取る(ステップS100)。原稿読取部101は、読み取った原稿の原稿画像データを画像記憶部102へ送信する。画像記憶部102は、送信された原稿画像データを記憶すると共に、画像解析部103へ送信する。画像解析部103では、送信された原稿画像データを記憶部201で保持し、検出部205にて原稿に印字されたページ番号を検出する(ステップS101)。
検出部205は、検出したページ番号を原稿特性値として仕上がり画像生成部105へ送信する。仕上がり画像生成部105は、送信された原稿特性値からページ番号が順番通りか否かを判断する(ステップS102)。ページ番号が順番通りの場合(ステップS102/YES)、送信された原稿特性値に従って仕上がり原稿データを生成し、プレビュー画像表示部へ送信し、プレビュー画面に表示する(ステップS103)。
また、ページ番号が順番通りでない場合(ステップS102/NO)、仕上がり画像生成部105において、ページ番号を予め決められた設定(例えば、ページ番号を小さい順に、または大きい順)に従って並べ替える(ステップS104)。並べ替えられた仕上がり画像データをプレビュー画像表示部106へ送信し、プレビュー表示する(ステップS103)。
次に、図4を参照して、文字列のつながりでページを整える処理動作について説明する。
まず、原稿読取部101で複数枚の原稿を読み取る(ステップS200)。次に、読み取った原稿の原稿画像データを画像記憶部102に記憶させると共に、画像解析部103へ送信する。画像解析部103では、送信された原稿画像データを記憶部201へ記憶する(ステップS201)。
記憶部201へ記憶された原稿画像データからテキスト分割部202では、まず、対象となるページのテキスト分割を行う(ステップS202)。テキスト分割202では、対象となるページの最後の文字列をテキスト分割する。図5に示すように、例えば、1ページ目の「今日の関東地方の天気は、午後から雨が降る」という文字列を形態素に分割する。形態素に分割された文字列は、「今日」、「の」、「関東」、「地方」、「天気」、「は」、「、」、「午後」、「から」、「雨」、「が」、「降る」となる。
テキスト分割部202は、対象となるページ(本実施形態では、1ページ目とする)の文字列を形態素に分割する。次に、対象となるページ以外のページ(2ページ目以降:比較対象ページとする)の最初の文字列をテキスト分割する(ステップS203)。
次に、比較部203では、比較対象ページの文字列のテキスト分割された形態素を辞書データベース204に問い合わせる(ステップS204)。比較対象ページのテキスト分割された文字列は、図5に示すように、2ページ目では、「して」、「、」、「私」、「は」となり、3ページ目では、「予定」、「で」、「ある」、「。」となり、4ページ目では、「日」、「、」、「6時半」、「に」となる。
ここで、比較部203は、辞書データベース204に形態素の修飾関係を問い合わせ、1ページ目の「降る」に続く文字列と比較対象ページの形態素に分割された文字列とを比較し、「降る」に続く最も適合した文字列を検索し、その文字列を含むページを1ページ目の次に続くページとする(ステップS205)。同様に、2ページ目以降に続くページの検索も上記の処理動作を繰り返すことで、正しいページ順に原稿を整えることができる。画像解析部103は、仕上がり画像生成部105へ原稿を順番通り並べ替えるための原稿特性値を送信するために、ステップS205における比較結果を原稿特性値として仕上がり画像生成部105へ送信する。
次に、仕上がり画像生成部105の処理動作について説明する。
まず、仕上がり画像生成部105は、画像記憶部102から原稿画像データを取得し、画像解析部103から原稿特性値を取得する(ステップS300)。次に、原稿特性値を基に原稿を並べ替える(ステップS301)。仕上がり画像生成部105は、画像記憶部102から送信された原稿画像データを画像解析部103内の比較部203から送信された原稿特性値を基に順番通りに並べ替える。また、仕上がり画像生成部105では、送信された原稿特性値105を補正済み原稿特性値としてプレビュー画像表示部106へ送信する。
プレビュー画像表示部106は、トラップ設定領域定義テーブル107から送信された領域情報に従って、原稿画像を図8(a)に示すように領域を表示する。図8(a)では、本文の外枠の部分やタイトル、図や表、写真といった要素を領域で区分されている。そこで、図8(b)に示すように、例えば、各領域にマウスのポインタを合わせることで、メニュー画面を表示させることができる。また、下記の表2に示すように、座標を指定することで、その座標にマウスのポインタを合わせることで、設定項目に示されているメニューを表示することができる。
Figure 2007142631
本実施形態に係る画像形成装置の構成を示したブロック図である。 原稿の構成を示した図である。 図1に示す画像解析部の構成を示したブロック図である。 本実施形態に係る処理動作を示したフローチャートである。 本実施形態に係る処理動作を示したフローチャートである。 原稿の文字列のつながりを示した図である。 本実施形態に係る処理動作を示したフローチャートである。 原稿の領域を示した図である。
符号の説明
100 画像形成装置
101 原稿読取部
102 画像記憶部
103 画像解析部
104 ユーザインタフェース部
104a 関連機能対応部
104b 関連機能検索部
105 仕上がり画像生成部
106 プレビュー画像表示部
107 トラップ設定領域定義テーブル
108 キーワード入力部
109 プレビュー画像表示部
201 記憶部
202 テキスト分割部
203 比較部
204 辞書データベース
205 検出部

Claims (6)

  1. 複数枚の原稿を読み取る読取手段と、
    前記読取手段で読み取った原稿画像データを記憶する記憶手段と、
    前記記憶手段に記憶した原稿画像データを出力する出力手段とを備えた画像形成手段において、
    前記記憶手段に記憶した原稿画像データから所定の順番に並べ替えるための画像データを解析する解析手段と、
    前記解析手段で得られた画像データから所定の順番に並べ替えた原稿画像データを生成する生成手段と、
    前記原稿画像データに特定の処理を行うための特定情報を前記生成手段へ送信する特定情報処理手段と
    前記生成手段で生成された原稿画像データを表示する表示手段とを有することを特徴とする画像形成装置。
  2. 前記解析手段は、前記複数枚の原稿にページ番号が印字されている場合には、前記読取手段で読み取った原稿画像データからページ番号を示す画像データを検出する検出手段を有することを特徴とする請求項1記載の画像形成装置。
  3. 前記生成手段は、前記解析手段で得られた画像データからページ番号に従って前記原稿画像データを生成することを特徴とする請求項1または2記載の画像形成装置。
  4. 前記解析手段は、
    前記原稿画像データ内の文字列を形態素に分割する分割手段と、
    形態素の構文上における修飾関係を記憶したデータベースと、
    前記分割手段によって分割された形態素を前記データベース内の形態素の修飾関係とを比較する比較手段とを備えることを特徴とする請求項1記載の画像形成装置。
  5. 前記分割手段では、対象となるページ内の文書の最後の文字列と残りのページ内の文書の最初の文字列を形態素に分割し、
    前記比較手段が、形態素に分割された前記対象となるページ内の文書の最後の文字列の修飾関係を前記データベースに記憶されたものと比較し、該当する修飾関係に適応する文字列を含むページを検索することを特徴とする請求項4記載の画像形成装置。
  6. 前記特定情報処理手段は、前記原稿画像データを画像処理する設定項目が記憶されており、前記原稿画像データに対応する設定項目を検索する検索手段を有することを特徴とする請求項1から5のいずれか1項に記載の画像形成装置。
JP2005331467A 2005-11-16 2005-11-16 画像形成装置 Withdrawn JP2007142631A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005331467A JP2007142631A (ja) 2005-11-16 2005-11-16 画像形成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005331467A JP2007142631A (ja) 2005-11-16 2005-11-16 画像形成装置

Publications (1)

Publication Number Publication Date
JP2007142631A true JP2007142631A (ja) 2007-06-07

Family

ID=38204998

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005331467A Withdrawn JP2007142631A (ja) 2005-11-16 2005-11-16 画像形成装置

Country Status (1)

Country Link
JP (1) JP2007142631A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019038115A (ja) * 2017-08-22 2019-03-14 株式会社東芝 消色装置および画像処理システム
JP2020120308A (ja) * 2019-01-25 2020-08-06 セイコーエプソン株式会社 画像処理装置および画像処理プログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019038115A (ja) * 2017-08-22 2019-03-14 株式会社東芝 消色装置および画像処理システム
JP7005225B2 (ja) 2017-08-22 2022-01-21 株式会社東芝 消色装置および画像処理システム
JP2020120308A (ja) * 2019-01-25 2020-08-06 セイコーエプソン株式会社 画像処理装置および画像処理プログラム
JP7172649B2 (ja) 2019-01-25 2022-11-16 セイコーエプソン株式会社 画像処理装置および画像処理プログラム

Similar Documents

Publication Publication Date Title
CN101178725B (zh) 用于信息检索的设备和方法
US20070171482A1 (en) Method and apparatus for managing information, and computer program product
US20060206305A1 (en) Translation system, translation method, and program
US8565526B2 (en) Method and system for converting image text documents in bit-mapped formats to searchable text and for searching the searchable text
US9785707B2 (en) Method and system for converting audio text files originating from audio files to searchable text and for processing the searchable text
WO2006046523A1 (ja) 文書解析システム、及び文書適応システム
EP2779613A1 (en) Document processing apparatus, document processing method, and document processing computer program product
JPH05303590A (ja) 自動翻訳装置
US9881001B2 (en) Image processing device, image processing method and non-transitory computer readable recording medium
US20060210171A1 (en) Image processing apparatus
US20060218495A1 (en) Document processing device
CN114281979A (zh) 生成文本摘要的文本处理方法、装置、设备以及存储介质
JP2007142631A (ja) 画像形成装置
JP2007011973A (ja) 情報検索装置及び情報検索プログラム
JP2007011683A (ja) 文書管理支援装置
WO1997004409A1 (fr) Dispositif de recherche de fichiers
JP2008225676A (ja) 辞書検索装置及びその制御プログラム
JP7338328B2 (ja) データ構造、コンピュータプログラム及び画像処理装置
JP2017083920A (ja) 印刷装置
JP2007052614A (ja) 文書管理装置、文書管理システムおよび文書管理方法
JP5298484B2 (ja) 文書処理装置
KR20070076126A (ko) 전자 사전
JP2008102802A (ja) 文書支援システム及び文書支援プログラム
Paiders et al. Use of place names in the subtitle corpus of highest-grossing movies of the past 20 years
JP2007241473A (ja) 情報処理装置、情報処理方法、プログラム、記憶媒体

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20090203