JPH09160907A - 文書処理装置及び方法 - Google Patents

文書処理装置及び方法

Info

Publication number
JPH09160907A
JPH09160907A JP7322779A JP32277995A JPH09160907A JP H09160907 A JPH09160907 A JP H09160907A JP 7322779 A JP7322779 A JP 7322779A JP 32277995 A JP32277995 A JP 32277995A JP H09160907 A JPH09160907 A JP H09160907A
Authority
JP
Japan
Prior art keywords
item
bibliographic
data
input
correction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7322779A
Other languages
English (en)
Inventor
Yoshitane Nishimura
美苗 西村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP7322779A priority Critical patent/JPH09160907A/ja
Publication of JPH09160907A publication Critical patent/JPH09160907A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 読取原稿から文書データを読み取ってデータ
ベースに登録する際、検索キーとなる書誌事項を簡易か
つ正確に登録する。 【解決手段】 読取原稿からイメージデータを読取走査
してテキストデータに認識し、イメージデータとテキス
トデータとの少なくとも一方を文書データとしてデータ
ベース13に格納する。認識されたテキストデータから
書誌事項を抽出して表示し、入力に対応して修正した書
誌事項を文書データに対応させてデータベース13に登
録する。書誌事項を文書データから自動的に抽出するこ
とでユーザの作業負担を軽減し、自動的に抽出した書誌
事項を表示して修正を受け付けることで、適正な書誌事
項を簡易に生成する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文書データをデー
タベースに格納する文書処理装置に関する。
【0002】
【従来の技術】現在、学術論文等の文書をデータ化し、
自在に検索できるように保存することが要望されてい
る。このようなことを実現する電子ファイルシステム等
の文書処理装置は、複数の文書データを検索キーと共に
データベースに格納する。文書データを要望するユーザ
が、キーボード等により文書データの検索条件を入力操
作すると、この検索条件に従ってデータベースから文書
データが読み出される。
【0003】このように所望の文書データを良好に読み
出すためには、その検索キーが適正に設定されている必
要がある。例えば、特開平6-342483号公報に開示されて
いる文書ファイルシステムでは、読取原稿の画面をドッ
トマトリクスのイメージデータとして読取走査し、この
イメージデータからキャラクタのパターンマッチングに
よりテキストデータを認識し、このテキストデータから
所定の文字列として検索キーを抽出する。このようにテ
キストデータから検索キーを生成すれば、文書データを
内容的に直接に検索することができるが、これは複雑な
データ処理を必要として実用的でない。
【0004】このため、一般的には文書データの書誌事
項を検索キーとすることが一般的であり、特開平6-3424
83号公報の文書ファイルシステムでも、これを上記方式
に併用している。つまり、読取原稿から読取走査したイ
メージデータが表示されるので、これを読み取ったユー
ザが所望の書誌事項を検索キーとして設定する。このよ
うな書誌事項は検索キーとして適正なので、これにより
文書データを良好に検索することができる。
【0005】
【発明が解決しようとする課題】上述のような文書処理
装置では、書誌事項を検索キーとして文書データを検索
することができる。
【0006】しかし、上述のように文書データの本文を
ユーザが読み取って書誌事項を手作業で設定すること
は、作業が煩雑で処理が遅滞する。このような課題を解
決するため、文書データから書誌事項を自動的に抽出す
ることが提案されている。一般的に書誌事項は出現位置
や前後関係が予測できるので、文書データのテキストデ
ータから所定のパラメータにより抽出することができ
る。
【0007】しかし、このように自動的に抽出した書誌
事項は精度が低い。まず、その前提として文書データの
イメージデータからテキストデータを認識するが、この
認識が完全ではなく、現在の技術では文字の誤認識を排
除できない。そして、書誌事項の抽出も完全ではなく、
現在の技術では書誌事項でない文字列の誤抽出を排除で
きない。
【0008】
【課題を解決するための手段】請求項1記載の文書処理
装置は、読取原稿からイメージデータを読取走査する画
像読取手段と、読取走査されたイメージデータからテキ
ストデータを認識する文字認識手段と、イメージデータ
とテキストデータとの少なくとも一方を文書データとし
てデータベースに格納する文書登録手段と、認識された
テキストデータから書誌事項を抽出する事項抽出手段
と、抽出された書誌事項を表示する事項表示手段と、表
示された書誌事項の修正の入力を受け付ける修正入力手
段と、入力に対応して書誌事項を修正する事項修正手段
と、修正された書誌事項を文書データに対応させて前記
データベースに登録する事項登録手段とを有する。画像
読取手段が読取原稿からイメージデータを読取走査する
と、このイメージデータから文字認識手段がテキストデ
ータを認識し、イメージデータとテキストデータとの少
なくとも一方を文書データとして文書登録手段がデータ
ベースに格納する。事項抽出手段がテキストデータから
書誌事項を抽出し、この書誌事項を事項表示手段が表示
した状態で、この表示された書誌事項の修正の入力を修
正入力手段が受け付ける。この入力に対応して事項修正
手段が書誌事項を修正すると、この修正された書誌事項
を事項登録手段が文書データに対応させてデータベース
に登録する。従って、検索キーとなる書誌事項が文書デ
ータから自動的に抽出され、この自動的に抽出された書
誌事項はユーザに表示されて修正される。
【0009】請求項2記載の文書処理装置では、請求項
1記載の文書処理装置において、文字認識手段は、イメ
ージデータからテキストデータの複数の候補を出力し、
事項表示手段は、書誌事項の複数の候補のテキストデー
タを表示し、修正入力手段は、複数のテキストデータの
選択の入力を受け付け、事項修正手段は、入力に対応し
てテキストデータを選択する。文字認識手段がイメージ
データから認識するテキストデータは確実ではないの
で、このテキストデータとして複数の候補を出力する。
この複数のテキストデータの各々で事項抽出手段が書誌
事項を生成するので、この書誌事項の複数のテキストデ
ータを事項表示手段が表示する。この表示された書誌事
項の修正の入力として修正入力手段が複数のテキストデ
ータの選択の入力を受け付けるので、この入力に対応し
た書誌事項の修正として事項修正手段がテキストデータ
を選択する。従って、表示された複数のテキストデータ
をユーザが選択すれば、書誌事項が適正に修正される。
【0010】請求項3記載の文書処理装置では、請求項
1記載の文書処理装置において、事項抽出手段は、テキ
ストデータから書誌事項の複数の候補を抽出し、事項表
示手段は、書誌事項の複数の候補を表示し、修正入力手
段は、複数の候補の選択の入力を受け付け、事項修正手
段は、入力に対応して書誌事項を選択する。事項抽出手
段がテキストデータから抽出する書誌事項は確実ではな
いので、この書誌事項として複数の候補を出力する。こ
の複数の書誌事項を事項表示手段が表示した状態で、そ
の修正の入力として修正入力手段が複数の書誌事項の選
択の入力を受け付けるので、この入力に対応した修正と
して事項修正手段が書誌事項を選択する。従って、表示
された複数の書誌事項をユーザが選択すれば、書誌事項
が適正に修正される。
【0011】請求項4記載の文書処理装置では、請求項
1記載の文書処理装置において、修正された書誌事項を
表示する修正表示手段を設けた。ユーザが修正した書誌
事項を修正表示手段が表示するので、修正中の書誌事項
が修正後の状態でユーザに提示される。
【0012】請求項5記載の文書処理方法は、読取原稿
からイメージデータを読取走査し、この読取走査された
イメージデータからテキストデータを認識し、イメージ
データとテキストデータとの少なくとも一方を文書デー
タとしてデータベースに格納し、認識されたテキストデ
ータから書誌事項を抽出し、この抽出された書誌事項を
表示し、この表示された書誌事項の修正の入力を受け付
け、この入力に対応して書誌事項を修正し、この修正さ
れた書誌事項を文書データに対応させてデータベースに
登録するようにした。従って、検索キーとなる書誌事項
を文書データから自動的に抽出することができ、この自
動的に抽出された書誌事項は表示され、文字の誤認識や
文字列の誤抽出を修正することができる。
【0013】
【発明の実施の形態】本発明の実施の一形態を図面に基
づいて以下に説明する。まず、本実施の形態の文書処理
装置1は、図2に示すように、イメージスキャナ2とマ
イクロコンピュータ3と電子ファイルシステム4とを有
している。
【0014】前記マイクロコンピュータ3は、CPU(C
entral Processing Unit)5を有している。このCPU
5には、ROM(Read Only Memory)6、RAM(Random
Access Memory)7、マウス8が装備されたキーボード
9、ディスプレイ10、通信I/F(Interface)11,
12が接続されている。第一の前記通信I/F11に
は、前記イメージスキャナ2が接続されており、第二の
前記通信I/F12には、前記電子ファイルシステム4
が接続されている。
【0015】前記マイクロコンピュータ2は、前記キー
ボード8から適宜入力されるコマンドや前記ROM5に
予め設定されたプログラム等に従って、前記CPU4が
各種のデータ処理を実行する。このため、前記イメージ
スキャナ2は、前記マイクロコンピュータ2の動作制御
に対応して読取原稿からイメージデータを読取走査し、
前記電子ファイルシステム4は、前記マイクロコンピュ
ータ2の動作制御に対応して文書データを格納する。
【0016】より詳細には、前記電子ファイルシステム
4は、データベース13を有しており、図1に示すよう
に、このデータベース13は、イメージファイル14と
テキストファイル15と書誌事項ファイル16とを有し
ている。前記イメージファイル14は、読取原稿のイメ
ージデータを文書データとして格納し、前記テキストフ
ァイル15は、イメージデータから認識されたテキスト
データを文書データとして格納する。前記書誌事項ファ
イル16は、文書データの書誌事項をキャラクタコード
により格納し、これは文書データの検索キーとしてイメ
ージデータとテキストデータとにリンクされている。
【0017】本実施の形態の文書処理装置1は、前記デ
ータベース13に各種データを入出力する処理実行手段
17を有しており、この処理実行手段17は、画像読取
手段18、文書登録手段であるイメージ登録手段19、
文字認識手段20、文書表示手段21、テキストデータ
の修正入力手段22、文字修正手段23、文書登録手段
であるテキスト登録手段24、事項抽出手段25、事項
表示手段26、書誌事項の修正入力手段27、事項修正
手段28、修正表示手段29、書誌事項登録手段30、
条件入力手段31、検索実行手段32、を有している。
【0018】前記画像読取手段18は、前記イメージス
キャナ14により読取原稿からイメージデータを読取走
査し、前記イメージ登録手段19は、読取走査されたイ
メージデータを文書データとして、前記データベース1
3のイメージファイル14に格納する。前記文字認識手
段20は、読取走査されたイメージデータをパターンマ
ッチングによりテキストデータに認識し、このテキスト
データを文字データであるキャラクタコードとして出力
するので、前記文書表示手段21は、テキストデータを
キャラクタコードに従って前記ディスプレイ10により
表示する。前記修正入力手段22は、表示されたテキス
トデータの修正の入力を前記キーボード9により受け付
け、前記文字修正手段23は、入力に対応してキャラク
タコードを置換することによりテキストデータを修正す
る。
【0019】このようなテキストデータの修正は、完全
な誤認識に対するキャラクタの手入力でも実行される
が、ここではイメージデータからテキストデータを認識
する場合に確度により複数の候補を検出し、この複数の
候補のテキストデータを表示して選択の入力を受け付け
る。例えば、イメージデータの“5月”がテキストデー
タとして“5月”“6月”に同等な確度で認識される場
合、これらは両方とも候補として表示され、ユーザの入
力に対応して“5月”に選択される。
【0020】前記テキスト登録手段24は、修正された
テキストデータを文書データとして、前記イメージファ
イル14のイメージデータとリンクさせ、前記データベ
ース13のテキストファイル15に格納する。
【0021】前記事項抽出手段25は、修正されたテキ
ストデータから書誌事項を抽出する。この書誌事項の自
動的な抽出は、例えば、冒頭に出現する数文字の文字列
はタイトルであり、“××月××日”なる文字列は作成
年月日であり、年月日の後段の文字列は作成者である
等、従来の既存の方法と同様に実行され、このような作
業を実現するアルゴリズムやパラメータが前記事項抽出
手段25に設定されている。前記事項表示手段26は、
抽出された書誌事項を前記ディスプレイ10に表示し、
前記書誌事項の修正入力手段27は、表示された書誌事
項の修正の入力を受け付け、前記事項修正手段28は、
入力に対応して書誌事項を修正する。
【0022】このような書誌事項の修正は、文字の誤認
識と文字列の誤抽出との両方に対応して実行される。書
誌事項を抽出するテキストデータは、その前段で上述の
ように修正が実行されるが、これは完全ではないので書
誌事項に文字の誤認識が残存することがある。また、テ
キストデータの文字が完全でも、これから書誌事項とし
て不適な文字列が誤抽出されることもある。前述のよう
に認識の確度が低い文字に対しては複数の候補が検出さ
れ、これが表示されて選択の入力を受け付ける。一方、
文字列の誤抽出の場合も、その確度に対応して複数の候
補が検出され、これが表示されて選択の入力を受け付け
る。
【0023】前記修正表示手段29は、修正された書誌
事項を前記ディスプレイ10に表示するので、この状態
でも前記手段27,28による書誌事項の修正は機能す
る。前記書誌事項登録手段30は、修正が完了した書誌
事項を文書データの検索キーとして、前記ファイル1
4,15の文書データに対応させて前記データベース1
3の書誌事項ファイル16に登録する。
【0024】前記条件入力手段31は、文字列と演算子
とを組み合わせた検索条件の入力を前記キーボード9に
より受け付け、前記検索実行手段32は、入力された検
索条件に前記書誌事項ファイル16の書誌事項が整合す
る文書データを前記ファイル14,15から検索する。
【0025】このような構成において、本実施の形態の
文書処理装置1は、ユーザが所望する読取原稿から文書
データを読み取り、これを書誌事項に対応させてデータ
ベース13に格納することができる。ユーザが所望によ
り検索条件を入力すれば、この検索条件に書誌事項が整
合する文書データをデータベース13から検索すること
ができる。このため、ユーザが所望する文書データを的
確に提供することができ、文書データを有効に活用する
ことができる。
【0026】このように文書データを良好に検索するた
めには、その書誌事項が適正に設定されている必要があ
る。本実施の形態の文書処理装置1は、文書データから
書誌事項を自動的に抽出し、この書誌事項をユーザによ
り修正させるので、簡易な操作で適正な書誌事項が登録
される。
【0027】このような文書処理装置1の文書処理方法
を、図3ないし図7に基づいて以下に説明する。まず、
ユーザが所望の読取原稿をイメージスキャナ2に装填し
てからキーボード9により所定のコマンドを入力する
と、読取原稿からイメージデータが読取走査され、この
イメージデータは文書データとしてデータベース13の
イメージファイル14に格納される。
【0028】さらに、イメージデータはパターンマッチ
ングによりテキストデータに認識され、このテキストデ
ータはディスプレイ10に表示される。この状態で、表
示されたテキストデータの修正や承認をキーボード9に
より入力することができるので、ユーザが所望により修
正を入力すれば、テキストデータは入力に対応して修正
され、承認を入力すればテキストデータは確定されてデ
ータベース13のテキストファイル15に格納される。
【0029】このようにしてイメージデータとテキスト
データとの文書データがデータベース13に格納される
と、図3に示すように、その文書データの書誌事項がテ
キストデータから抽出される(ステップS1)。これは
前述のように従来の既存の方法と同様に実行され、その
確度により複数の候補として検出される。例えば、図4
に示すように、各種の書誌事項が紙面に散在した読取原
稿を読取走査した場合、タイトル、作成者、作成年月
日、等の書誌事項が確度により複数検出され、図5に示
すように、このように検出された複数の候補の書誌事項
はディスプレイ10に表示されるので(ステップS
2)、所望する候補をキーボード9やマウス8の手動操
作により指定すれば、図6に示すように、それが書誌事
項として選択される(ステップS3)。
【0030】ここでは、図5に示すように、テキストデ
ータから抽出された書誌事項の各々の先頭にポインタが
表示されるので、図6に示すように、このポインタをオ
ンオフすれば書誌事項が選択される。さらに、ポインタ
をオンした書誌事項は、編集処理を受け付ける状態とな
るので、誤認識された文字の修正、不要な文字の削除、
必要な文字の挿入、等を実行することもできる(ステッ
プS3)。
【0031】例えば、図5に示すように、“マルチメデ
ィア研究所創立記念”“マルチメデイアセミナー開催の
お知らせ”の二つがタイトルの候補として表示された場
合、“マルチメディア研究所創立記念”のポインタをオ
フにして書誌事項から排除し、“マルチメデイアセミナ
ー開催のお知らせ”の“イ”を“ィ”に修正すれば、書
誌事項であるタイトルとして“マルチメディアセミナー
開催のお知らせ”が確定される。
【0032】また、ディスプレイ10には、前画面、再
表示、書誌事項登録、なるスイッチも表示されるので、
これらも書誌事項の修正に利用することができる。“再
表示”が指定された場合(ステップS7)、現状の書誌
事項が一時記憶され(ステップS8)、この書誌事項が
修正の入力に対応した状態で表示される(ステップS
2)。例えば、図6に示すように、書誌事項に所望の修
正を入力した状態で“再表示”を指定すれば、図7に示
すように、修正された状態の書誌事項がディスプレイ1
0に表示される。
【0033】このような状態で修正が不適ならば、“前
画面”を指定すれば(ステップS4)、一時記憶された
書誌事項の有無が判定され(ステップS5)、これが存
在するとディスプレイ10に表示される(ステップS
6)。このような作業を繰り返すことにより書誌事項が
適正に修正されるので、これを確認したユーザが“書誌
事項登録”を指定すると(ステップS9)、現状の書誌
事項が確定されてデータベース13の書誌事項ファイル
16に登録される。
【0034】このように登録される書誌事項は、文書デ
ータのテキストデータから抽出された文字列からなり、
ユーザによる検閲と修正も実行されているので、文書デ
ータの検索キーとして最適である。書誌事項はテキスト
データから自動的に抽出されるので、この作業をユーザ
が実行する必要がなく、ユーザの負担を軽減することが
できる。書誌事項の修正はユーザに一任するが、複数の
候補を表示してユーザに選択させるので、書誌事項の修
正作業は極めて容易である。しかも、修正された書誌事
項を表示するので、ユーザは書誌事項の修正の適否も容
易に確認することができる。
【0035】
【発明の効果】請求項1記載の文書処理装置は、読取原
稿からイメージデータを読取走査する画像読取手段と、
読取走査されたイメージデータからテキストデータを認
識する文字認識手段と、イメージデータとテキストデー
タとの少なくとも一方を文書データとしてデータベース
に格納する文書登録手段と、認識されたテキストデータ
から書誌事項を抽出する事項抽出手段と、抽出された書
誌事項を表示する事項表示手段と、表示された書誌事項
の修正の入力を受け付ける修正入力手段と、入力に対応
して書誌事項を修正する事項修正手段と、修正された書
誌事項を文書データに対応させて前記データベースに登
録する事項登録手段とを有することにより、検索キーと
なる書誌事項を文書データから自動的に抽出することが
できるので、この作業をユーザが実行する必要がなく、
書誌事項を表示して修正を受け付けるので、書誌事項の
自動的な抽出には間違いが多発するが、適正に修正され
た状態で登録することができる。
【0036】請求項2記載の文書処理装置では、文字認
識手段は、イメージデータからテキストデータの複数の
候補を出力し、事項表示手段は、書誌事項の複数の候補
のテキストデータを表示し、修正入力手段は、複数のテ
キストデータの選択の入力を受け付け、事項修正手段
は、入力に対応してテキストデータを選択することによ
り、表示された複数の候補を所望により指定すれば、こ
の指定された候補が書誌事項として選択されるので、簡
易な操作で書誌事項を適正に修正することができる。
【0037】請求項3記載の文書処理装置では、事項抽
出手段は、テキストデータから書誌事項の複数の候補を
抽出し、事項表示手段は、書誌事項の複数の候補を表示
し、修正入力手段は、複数の候補の選択の入力を受け付
け、事項修正手段は、入力に対応して書誌事項を選択す
ることにより、表示された複数の候補を所望により指定
すれば、この指定された候補が書誌事項として選択され
るので、簡易な操作で書誌事項を適正に修正することが
できる。
【0038】請求項4記載の文書処理装置では、修正さ
れた書誌事項を表示する修正表示手段を設けたことによ
り、修正中の書誌事項を修正後の状態で表示することが
できるので、書誌事項の修正の適否を簡易に確認するこ
とができる。
【0039】請求項5記載の文書処理方法は、読取原稿
からイメージデータを読取走査し、この読取走査された
イメージデータからテキストデータを認識し、イメージ
データとテキストデータとの少なくとも一方を文書デー
タとしてデータベースに格納し、認識されたテキストデ
ータから書誌事項を抽出し、この抽出された書誌事項を
表示し、この表示された書誌事項の修正の入力を受け付
け、この入力に対応して書誌事項を修正し、この修正さ
れた書誌事項を文書データに対応させてデータベースに
登録するようにしたことにより、検索キーとなる書誌事
項を文書データから自動的に抽出することができるの
で、この作業をユーザが実行する必要がなく、書誌事項
を表示して修正を受け付けるので、書誌事項の自動的な
抽出には間違いが多発するが、適正に修正された状態で
登録することができる。
【図面の簡単な説明】
【図1】本発明の実施の一形態の文書処理装置を示す模
式図である。
【図2】文書処理装置の回路構造を示すブロック図であ
る。
【図3】テキストデータから書誌事項を抽出する処理動
作を示すフローチャートである。
【図4】読取原稿を示す平面図である。
【図5】複数の候補の書誌事項をディスプレイに表示し
た状態を示す正面図である。
【図6】ディスプレイに表示された書誌事項を修正した
状態を示す正面図である。
【図7】修正された書誌事項をディスプレイに表示した
状態を示す正面図である。
【符号の説明】
1 文書処理装置 13 データベース 18 画像読取手段 19,24 文書登録手段 20 文字認識手段 25 事項抽出手段 26 事項表示手段 27 修正入力手段 28 事項修正手段 29 修正表示手段 30 事項登録手段
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 G06F 15/403 310C

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 読取原稿からイメージデータを読取走査
    する画像読取手段と、読取走査されたイメージデータか
    らテキストデータを認識する文字認識手段と、イメージ
    データとテキストデータとの少なくとも一方を文書デー
    タとしてデータベースに格納する文書登録手段と、認識
    されたテキストデータから書誌事項を抽出する事項抽出
    手段と、抽出された書誌事項を表示する事項表示手段
    と、表示された書誌事項の修正の入力を受け付ける修正
    入力手段と、入力に対応して書誌事項を修正する事項修
    正手段と、修正された書誌事項を文書データに対応させ
    て前記データベースに登録する事項登録手段と、を有す
    ることを特徴とする文書処理装置。
  2. 【請求項2】 文字認識手段は、イメージデータからテ
    キストデータの複数の候補を出力し、事項表示手段は、
    書誌事項の複数の候補のテキストデータを表示し、修正
    入力手段は、複数のテキストデータの選択の入力を受け
    付け、事項修正手段は、入力に対応してテキストデータ
    を選択することを特徴とする請求項1記載の文書処理装
    置。
  3. 【請求項3】 事項抽出手段は、テキストデータから書
    誌事項の複数の候補を抽出し、事項表示手段は、書誌事
    項の複数の候補を表示し、修正入力手段は、複数の候補
    の選択の入力を受け付け、事項修正手段は、入力に対応
    して書誌事項を選択することを特徴とする請求項1記載
    の文書処理装置。
  4. 【請求項4】 修正された書誌事項を表示する修正表示
    手段を設けたことを特徴とする請求項1記載の文書処理
    装置。
  5. 【請求項5】 読取原稿からイメージデータを読取走査
    し、この読取走査されたイメージデータからテキストデ
    ータを認識し、イメージデータとテキストデータとの少
    なくとも一方を文書データとしてデータベースに格納
    し、認識されたテキストデータから書誌事項を抽出し、
    この抽出された書誌事項を表示し、この表示された書誌
    事項の修正の入力を受け付け、この入力に対応して書誌
    事項を修正し、この修正された書誌事項を文書データに
    対応させてデータベースに登録するようにしたことを特
    徴とする文書処理方法。
JP7322779A 1995-12-12 1995-12-12 文書処理装置及び方法 Pending JPH09160907A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7322779A JPH09160907A (ja) 1995-12-12 1995-12-12 文書処理装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7322779A JPH09160907A (ja) 1995-12-12 1995-12-12 文書処理装置及び方法

Publications (1)

Publication Number Publication Date
JPH09160907A true JPH09160907A (ja) 1997-06-20

Family

ID=18147552

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7322779A Pending JPH09160907A (ja) 1995-12-12 1995-12-12 文書処理装置及び方法

Country Status (1)

Country Link
JP (1) JPH09160907A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011081583A (ja) * 2009-10-07 2011-04-21 Nomura Research Institute Ltd 商品登録プログラム
JP2015212907A (ja) * 2014-05-07 2015-11-26 株式会社リコー 出力システム、端末装置、プログラム及び出力方法
JP2018072985A (ja) * 2016-10-26 2018-05-10 富士通株式会社 イメージスキャンシステム、イメージスキャナ、情報取得方法及び情報取得プログラム
JP2019079554A (ja) * 2019-01-04 2019-05-23 富士通株式会社 イメージスキャンシステム、イメージスキャナ、情報取得方法及び情報取得プログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011081583A (ja) * 2009-10-07 2011-04-21 Nomura Research Institute Ltd 商品登録プログラム
JP2015212907A (ja) * 2014-05-07 2015-11-26 株式会社リコー 出力システム、端末装置、プログラム及び出力方法
JP2018072985A (ja) * 2016-10-26 2018-05-10 富士通株式会社 イメージスキャンシステム、イメージスキャナ、情報取得方法及び情報取得プログラム
JP2019079554A (ja) * 2019-01-04 2019-05-23 富士通株式会社 イメージスキャンシステム、イメージスキャナ、情報取得方法及び情報取得プログラム

Similar Documents

Publication Publication Date Title
JPH09160907A (ja) 文書処理装置及び方法
JPH1040247A (ja) データ処理装置
US20040139056A1 (en) Information display control apparatus and recording medium having recorded information display control program
JPH10334084A (ja) 情報処理装置
JPH06162107A (ja) 電子ファイリングシステム
JP3193249B2 (ja) キーワード検索方法
JPH0764991A (ja) 定型文書入力装置
JPH08147329A (ja) 読み取りイメージ処理装置
JPH09259132A (ja) 情報登録検索装置及びその方法
JPH04104367A (ja) ファイルシステム
JPH117492A (ja) キー入力編集方法及び編集装置
JPH03174660A (ja) イメージデータによる文書タイトル検索機能を備えた電子フアイリング装置
JP2967995B2 (ja) 文書処理装置および文書処理方法
JPH08202859A (ja) 電子ファイリング装置及びその方法
JP3237709B2 (ja) 文書処理装置及び文書処理方法
JPH0678119A (ja) 画像ファイリング装置および画像読取処理装置
JPH04286063A (ja) 文書処理装置及び方法
JPH02195474A (ja) 名刺情報管理システム
JPH09259148A (ja) 符号照合装置及び符合照合方法
JPH08305713A (ja) 電子ファイリング装置
JPH11328200A (ja) 画像検索装置および方法ならびに情報記録媒体
JPH07296002A (ja) データ管理システム及び重複チェック方法
JPH0237471A (ja) 情報検索装置
JPH06149889A (ja) 電子ファイリングシステム
JPH06301809A (ja) 文字情報処理装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040224