JP4135659B2 - フォーマット変換装置およびファイル検索装置 - Google Patents

フォーマット変換装置およびファイル検索装置 Download PDF

Info

Publication number
JP4135659B2
JP4135659B2 JP2004066220A JP2004066220A JP4135659B2 JP 4135659 B2 JP4135659 B2 JP 4135659B2 JP 2004066220 A JP2004066220 A JP 2004066220A JP 2004066220 A JP2004066220 A JP 2004066220A JP 4135659 B2 JP4135659 B2 JP 4135659B2
Authority
JP
Japan
Prior art keywords
file
conversion
format conversion
attribute
format
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004066220A
Other languages
English (en)
Other versions
JP2005258592A (ja
Inventor
香美 森脇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Business Technologies Inc
Original Assignee
Konica Minolta Business Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Business Technologies Inc filed Critical Konica Minolta Business Technologies Inc
Priority to JP2004066220A priority Critical patent/JP4135659B2/ja
Priority to US10/862,454 priority patent/US8566366B2/en
Publication of JP2005258592A publication Critical patent/JP2005258592A/ja
Application granted granted Critical
Publication of JP4135659B2 publication Critical patent/JP4135659B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems

Description

この発明は、フォーマット変換装置およびファイル検索装置に関し、特に、フォーマット変換後のファイルをフォーマット変換前の属性に基づいて検索することができるフォーマット変換装置およびファイル検索装置に関する。
以下の特許文献1には、文書画像に属性を付与して管理する文書管理システムが開示されている。この文書管理システムにおいては、文書画像に、識別されたフォーム種類に対応する文書タイプの属性(報告書、日時等)が付加される。これにより、効率的に文書画像に属性を付加することができる。なお、文書タイプごとに割当てる属性は予め定義されている。
一方、文書や画像ファイルをPDF(portable document format)ファイルへ変換するアプリケーションソフトとして、Adobe社のPDFWriterなどのソフトウェアが存在する。
特開2002−269126号公報
コンピュータに記録された文書ファイルの中から所望のファイルを探すときに、作成したアプリケーション(拡張子)を頼りに探すことがある。しかし、ワードやエクセルで作成した文書をPDFファイルに変換すると、拡張子がすべて「.pdf」になってしまう。このため、エクスプローラー等を用いて、拡張子をキーワードに検索できなくなる。すなわち従来技術においては、ファイルのフォーマットを変更してしまうと、ファイルを作成したアプリケーションの種類でファイルの検索を行なうことができないという問題があった。
この発明は上記問題点を解決するためになされたものであり、ファイルフォーマットの変換後も変換前の拡張子等のファイル属性から簡単にファイルを検索できるフォーマット変換装置およびファイル検索装置を提供することを目的としている。
上記目的を達成するためこの発明のある局面に従うと、フォーマット変換装置は、入力または作成されたファイルのファイルフォーマットを変換する変換手段と、変換手段によるファイルフォーマット変換の前に、ファイルの属性を判別する判別手段と、変換手段によるファイルフォーマット変換の際に、ファイルフォーマット変換前のファイルの属性を付加情報として、ファイルフォーマット変換後のファイルに付加する付加手段とを備える
好ましくは、変換前のファイルの属性は、当該ファイルを作成したアプリケーションを示す情報である。
好ましくは、変換後のファイルは複数ページを含み、付加情報はページ毎に付加される。
好ましくは、判別手段は、変換前のファイルの属性を、変換前のファイルの拡張子に基づいて判別する。
好ましくは、変換前のファイルは、文書画像ファイルであり、判別手段は、変換前の文書画像ファイルの属性を、変換前の文書画像ファイルの文字、写真、表、または図領域の位置またはサイズを含む構成に基づいて判別する。
好ましくは、変換手段は、変換前のファイルをPDFに変換し、付加手段は、付加情報をファイルフォーマット変換後のPDFファイルに透明なテキストオブジェクトとして付加する。
好ましくは、変換手段は、変換後のファイルの拡張子を変換前のファイルの拡張子を含まない特定の同じ値に変換する。
この発明の他の局面に従うと、ファイル検索装置は、上記のフォーマット変換装置によってファイルフォーマット変換されたファイルを複数格納する格納手段と、格納手段に格納されたファイルの中から所望のファイルを検索するために、ユーザから、検索対象であるファイルのファイルフォーマット変換前の属性を入力する第1の入力手段と、格納手段に格納されたファイルの属性を読出す読出手段と、第1の入力手段で入力されたファイルフォーマット変換前のファイルの属性、および読出手段により読出されたファイルの属性に基づいて、格納手段から所望のファイルを検索する検索手段とを備える。
好ましくは、ファイル検索装置は、ユーザから、検索対象であるファイルのファイルフォーマット変換後の属性を入力する第2の入力手段をさらに備え、検索手段は、第1の入力手段で入力されたファイルフォーマット変換前のファイルの属性、第2の入力手段で入力されたファイルフォーマット変換後のファイルの属性、および読出手段により読出されたファイルの属性に基づいて、格納手段から所望のファイルを検索する。
好ましくは、格納手段は、ファイルフォーマット変換前のファイルを作成したアプリケーションを示す情報を付加情報として記録し、検索手段は、アプリケーションを示す情報に基づいて検索されたファイルを順に表示する。
この発明のさらに他の局面に従うと、フォーマット変換プログラムは、入力または作成されたファイルのファイルフォーマットを変換する変換ステップと、ファイルフォーマット変換の前に、ファイルの属性を判別する判別ステップと、ファイルフォーマット変換の際に、ファイルフォーマット変換前のファイルの属性を付加情報として、ファイルフォーマット変換後のファイルに付加する付加ステップとをコンピュータに実行させる
好ましくは、変換前のファイルの属性は、当該ファイルを作成したアプリケーションを示す情報である。
好ましくは、判別ステップは、変換前のファイルの属性を、変換前のファイルの拡張子に基づいて判別する。
好ましくは、変換ステップは、変換前のファイルをPDFに変換し、付加ステップは、付加情報をファイルフォーマット変換後のPDFファイルに透明なテキストオブジェクトとして付加する。
好ましくは、変換ステップは、変換後のファイルの拡張子を変換前のファイルの拡張子を含まない特定の同じ値に変換する。
この発明のさらに他の局面に従うと、ファイル検索プログラムは、上記のフォーマット変換プログラムの実行によってファイルフォーマット変換されたファイルを複数格納する格納手段から、ファイルを検索するファイル検索プログラムであって、格納手段に格納されたファイルの中から所望のファイルを検索するために、ユーザから、検索対象であるファイルのファイルフォーマット変換前の属性を入力する入力ステップと、格納手段に格納されたファイルの属性を読出す読出ステップと、第1の入力ステップで入力されたファイルフォーマット変換前のファイルの属性、および読出ステップにより読出されたファイルの属性に基づいて、格納手段から所望のファイルを検索する検索ステップとをコンピュータに実行させる。
この発明に従うと、変換前のファイルの属性を付加情報として、変換後のファイルに付加することができるため、それを用いた検索やソートを容易に行なうことができるようになるという効果がある。
以下に、本発明の実施の形態の1つにおける文書ファイルのフォーマット変換装置およびファイルソート装置について説明する。
本実施の形態におけるフォーマット変換装置は、変換前の文書の属性情報をテキスト化して変換後のファイルに付加することを特徴とする。これにより、フォーマット変換後も元のファイルの属性を参照できるので、文書作成時のアプリケーション種類等のファイル属性を用いたファイルのソートや検索が容易に可能となる。
図1は、本発明の実施の形態の1つにおける文書フォーマット変換装置およびファイルソート装置のハードウェア構成を示すブロック図である。
図を参照して、装置は、PC(パーソナルコンピュータ)により構成される。PCは、装置全体の制御を行なうCPU601と、ディスプレイ605と、ネットワークに接続したり外部と通信を行なうためのLAN(ローカルエリアネットワーク)カード607(またはモデムカード)と、キーボードやマウスなどにより構成される入力装置609と、フレキシブルディスクドライブ611と、CD−ROMドライブ613と、ハードディスクドライブ615と、RAM617と、ROM619とを備えている。
フレキシブルディスクドライブ611により、フレキシブルディスクFに記録されたプログラムなどのデータを読取ることが可能であり、CD−ROMドライブ613により、CD−ROM613aに記録されたプログラムなどのデータを読取ることが可能である。
図2は、文書フォーマット変換装置の機能ブロック図である。
図を参照して、文書フォーマット変換装置は、変換ファイル指定部101と、ファイル読込部103と、ファイル属性識別部105と、ファイルフォーマット変換部107と、ファイル属性付加・ファイル書出部109とを備えている。
変換ファイル指定部101は、フォーマット変換する対象ファイル(ワード文書、スキャナで読取った文書画像等)、および変換後のファイル種類(PDF、TIFF等)を選択する。
ファイル読込部103は、変換ファイル指定部101で選択したファイルを読込み、メモリに展開する。
ファイル属性識別部105は、メモリに読み込んだファイルの属性を識別する。
ファイルフォーマット変換部107は、メモリに展開されたデータを変換ファイル指定部101で選択されたフォーマットに変換する。
ファイル属性付加・ファイル書出部109は、ファイル属性識別部105で識別したファイル属性をテキストとして付加し、フォーマット変換部107で変換したデータと共にファイルに書き出す。
文書フォーマット変換装置は、変換前の文書の属性情報をテキスト化して変換後のファイルに付加するファイル属性付加・ファイル書出部109を備えているため、フォーマット変換後も元のファイルの属性を参照することができる。これにより、文書作成時のアプリケーション種類等のファイル属性によるファイルのソートや検索が容易に可能となる。
図3は、文書フォーマット変換装置が行なう処理を示すフローチャートである。
図を参照して、ステップS101で、変換するファイルと変換後のファイルフォーマットの指定をユーザから受付ける。なお、例えば変換後のファイルフォーマットとして、PDF、高圧縮PDF、TIFFなどがある。
ステップS103で、ファイルを読込み、メモリに展開する。ステップS105で、読込んだファイルの属性を識別する。
このファイル属性の識別においては、ファイルが文書ファイルであれば、図4に示すルールに従い、拡張子から作成アプリケーションの種類を決定し、ファイル属性とする。すなわち、変換前のファイルの拡張子が、「doc」、「xls」、「ppt」であれば、それぞれそのファイルを作成したアプリケーションは、ワード、エクセル、パワーポイントとし、それをファイルの属性とする。また、レジストリを参照して、決定しても良い。
ファイルが文書画像の場合は、文字・写真・表・図領域を判別し、領域の位置やサイズなどからアプリケーション種類の適合度(アプリケーション適合度)を決定し、ファイル属性とする。アプリケーション適合度の決定方法に関しては、後述する。
ステップS107で、ファイルフォーマットの変換処理を行なう。高圧縮PDFファイルに変換する場合は、ファイル属性識別ステップ(S105)の結果を使って、文字・表は2値化、写真と図はJPEGで圧縮して、PDFに出力する。
なお、高圧縮PDFとは、画像を文字、写真領域に分け、それぞれの領域に適した圧縮方法(写真であればJPEG、文字であれば2値化してMMR符号化など)を採用して各領域の圧縮化を行ない、それを合成することで、圧縮率を高めることを特徴とするファイルフォーマットである。これに対し、通常のPDFは、1枚の画像をそのまま圧縮(カラーならJPEG、モノクロ2値ならMMR符号化などで圧縮)し、ファイルに書き出すフォーマットである(高圧縮PDFよりも低圧縮となる)。
ステップS109で、変換後のファイルに対するファイル属性の付加、およびファイルの書出しを行なう。例えばPDFに変換する場合は、ファイル属性をテキストオブジェクトとして変換後のファイルに付加し、変換後のデータと共にファイルに書き出す。
図5は、文書画像を変換した後のPDFファイルの構成の具体例を示す図である。
ここでは、文書画像をPDFに変換してファイル属性を付加した場合のファイルの構造を示している。
図を参照して、ページごとにそのページの変換後の画像データが保存されている。ここでは、1ページ目の画像データを画像データ1、2ページ目の画像データを画像データ2と呼んでいる。
ファイルの属性は、透明なテキストオブジェクトとしてページごとに付加している。すなわち、画像データに透明な文字で、ファイル属性を記録している。ここでは、属性として、ページごとに「ワード度」、「エクセル度」、「パワーポイント度」を記録することとしている。ここでは、「ワード度」、「エクセル度」、「パワーポイント度」のそれぞれは、0〜100%の値をとりうるデータであり、そのページが何のアプリケーションで作成されたと考えられるかを確率として記録するもの(アプリケーション適合度)である。
すなわち、図中の1ページ目であれば、「ワード度:30%」、「エクセル度90%」、「パワーポイント度:10%」がファイル属性である。これにより、1ページ目はエクセルで作成されたものである確率が最も高いことが示されている。
図6は、文書ファイルを変換した後のPDFファイルの構成の具体例を示す図である。
ここでは、ワードの文書ファイルを変換した場合を示している。文書ファイルを変換する場合、ファイルを作成したアプリケーション名が拡張子より明確であるため、「ワード度」、「エクセル度」、「パワーポイント度」のいずれか1つが100%となり、残りは0%となる。また、すべてのページに同じ属性が付加されている。
なお、TIFFファイルに変換する場合は、ファイルのプロパティに属性を埋め込んだり、タグに属性を入れたりすることができる。
次に、図5で示された、文書画像のページごとのアプリケーション適合度の求め方について説明する。
文書画像は、画像データから構成されるため、拡張子からその文書を作成したアプリケーションを知ることができない。そこで、次の方法で、画像のページ毎にアプリケーション適合度を決める。
・ワード度=文字領域面積のページ全体に占める割合*100
・エクセル度=表領域面積のページ全体に占める割合*100
パワーポイント度に関しても、同様にして、パワーポイントである可能性を百分率で示す関数を用いる。
なお、パワーポイント度として、以下の計算式を用いることもできる。この式を用いると、パワーポイント度が「0」であるときが、最もその文書画像のパワーポイント適合性が高いこととなる。また、値が大きくなる程、適合度が低くなる。
・パワーポイント度=([ページの一番上の文字のサイズ]/[パワーポイントでよく使うフォントサイズ]−1)*100、の絶対値
なお、上式において、ページの一番上の文字のサイズとは、スライドのタイトルなどを想定するものである。
このようにして、本実施の形態に従うと、ファイルのフォーマット変換時に、変換前の属性、アプリケーション適合率、作成した元のアプリケーション種類(文書画像の場合は、表・写真・文字領域などから推定)を変換後のファイルに付加することができる。また、この付加する情報をテキストとすることで、変換後の検索が容易になるという効果がある。
図7は、ファイルソート装置の機能ブロック図である。
図を参照して、ファイルソート装置は、文書ファイル、PDFファイル、画像ファイルなどを蓄積するファイル蓄積部201と、ファイルリスト表示順用キーワード指定部203と、フォルダ選択部205と、ファイルリスト表示順決定部207と、ファイルリスト表示部209とから構成される。
ファイルリスト表示順用キーワード指定部203では、GUIでファイルリスト表示順を決めるキーワードを指定する。
フォルダ選択部205では、GUIでファイルリストを表示するフォルダを選択する。
ファイルリスト表示順決定部207は、ファイルリスト表示順用キーワード指定部203で指定したキーワードで、フォルダ選択部205で選択したフォルダにあるファイルをソートする。
ファイルリスト表示部209は、ファイルリスト表示順決定部207で決定した順にファイルリストを表示する。
図8は、ファイルソート装置の動作を示すフローチャートである。
図を参照して、ステップS201で、ファイルリスト表示順用キーワードとフォルダの選択をユーザから受付ける。キーワードには、拡張子や作成したアプリケーション名(ワード・エクセル・パワーポイントなど)、変換後のファイルのフォーマット、日時等がある。
ステップS203で、ファイルリスト表示順の決定を行なう。これは、ファイル蓄積部201に蓄積された各ファイルに埋め込まれたキーワード(属性)を参照し、ファイルリスト表示順を決定する処理である。作成したアプリケーション名が検索キーワードとして選択されたときは、ファイルに付加されたアプリケーション適合度(図5、6参照)を取り出し、表示順を決定する。
ステップS205で、決定した表示順に従ってファイルリストを表示する。表示する内容は、各ファイルのファイル名、拡張子、作成日、アプリケーション種類などである。
図9は、図8のステップS201でのキーワード入力処理を示すフローチャートである。
図を参照して、ステップS301で、キーワードとして、検索を行ないたいファイルの変換前の属性(変換前の拡張子、作成したアプリケーション名、作成日時など)を入力する。ステップS303で、キーワードとして、検索を行ないたいファイルの変換後の属性(変換後の拡張子、変換に用いたアプリケーション名、変換日時など)を入力する。
ステップS305で、その他の属性を入力する。
なお、ステップS303、S305での処理は、キャンセルすることとしてもよい。
図10は、図7のファイル蓄積部201に蓄積されたファイルを作成日でソートしたファイルリストの具体例を示す図である。
図を参照して、ここではファイル蓄積部201にPDFファイルが記録されているものとし、それぞれのファイルに、ワード、エクセル、パワーポイントのそれぞれのアプリケーション適合度が記録されている。また、それぞれのファイルに作成日が記録されている。
なお、アプリケーション適合度は、図5および6に示されるように、ファイルのページごとに記録されるものであるが、図10においては、1つのファイル内のアプリケーション適合度の平均値がファイルごとに管理されているものとする。
図10においては、ユーザの指示に基づき、作成日の若い順にファイルが検索され、ソートされて表示されている。
図11は、図7のファイル蓄積部201に蓄積されたファイルをアプリケーション種類でソートしたファイルリストの具体例を示す図である。
ここではユーザの指示に基づき、ワード度の高いものから表示を行なうこととされており、ワード度の高い順にファイルが検索され、ソートされて表示されている。
なお、ステップS201で受付けられたキーワードに合致するファイルのみを抽出して、検索結果として表示する、いわゆる検索処理を行なうことも勿論可能である。
このような処理により、たとえPDFなどに変換されたファイルであっても、変換前の属性に基づいてファイルの検索、ソートを行なえるというメリットがある。
[変形例]
なお、図10および11では、アプリケーション適合度を複数ページの平均値として管理することとしたが、ページにより適合度のばらつきがあるときは、近接するページで適合度が近い物同士で平均値を計算するようにしてもよい。これにより、例えばファイルの前半がワードにより作成されたページであり、後半がエクセルで作成されたページであるファイルなど(複数のファイルを統合したファイル)も適切に管理することが可能となる。また、この場合において、リスト表示するときは、ファイルを適合度の近い物で分割してもよい。
図12は、本変形例の処理を示すフローチャートである。
図を参照して、ステップS401で、1つのファイル中の適合度のばらつき(偏り)を調べる。ステップS403で、適合度のばらつきがある一定値以上であると判断されると、ステップS405で傾向が偏っているページ同士で平均を求め、それをアプリケーション適合度とする。ステップS407で必要に応じてファイルを分割する。
図13は、図12のフローチャートによる処理の具体例を示す図である。
図を参照して、ファイル名が「サンプル.pdf」である5ページからなるPDFの処理を行ない、ワード度でソートする例を説明する。図に示されるように、1ページから5ページのそれぞれのアプリケーション適合度のうち、ワード適合度が、100、100、100、0、0であったとする。この場合、1ページ〜3ページと、4ページおよび5ページとの間には、アプリケーション適合度の偏りが存在する。そこで、1ページ〜3ページは、ワード度100(平均値)のファイルとして扱い、4ページおよび5ページは、ワード度0(平均値)のファイルとして扱う。ファイルを分割する場合、例えば自動的に前者にはサンプル(1−3).pdfのファイル名を付与し、後者にはサンプル(4−5).pdfのファイル名を付与する。このファイル名は、元のファイル名と、ファイルのページ数とから作成されるものである。
なお、ファイルの分割は、アプリケーション適合度の平均値の差がしきい値以上の場合に行なうようにしてもよい。
[その他]
なお、上述の実施の形態におけるフローチャートの処理を実行するプログラムを提供することもできるし、そのプログラムをCD−ROM、フレキシブルディスク、ハードディスク、ROM、RAM、メモリカードなどの記録媒体に記録してユーザに提供することにしてもよい。また、プログラムはインターネットなどの通信回線を介して装置にダウンロードするようにしてもよい。
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
本発明の実施の形態の1つにおける文書フォーマット変換装置およびファイルソート装置のハードウェア構成を示すブロック図である。 文書フォーマット変換装置の機能ブロック図である。 文書フォーマット変換装置が行う処理を示すフローチャートである。 ファイル属性の識別方法を説明するための図である。 文書画像を変換した後のPDFファイルの構成の具体例を示す図である。 文書ファイルを変換した後のPDFファイルの構成の具体例を示す図である。 ファイルソート装置の機能ブロック図である。 ファイルソート装置の動作を示すフローチャートである。 図8のステップS201でのキーワード入力処理を示すフローチャートである。 図7のファイル蓄積部201に蓄積されたファイルを作成日でソートしたファイルリストの具体例を示す図である。 図7のファイル蓄積部201に蓄積されたファイルをアプリケーション種類でソートしたファイルリストの具体例を示す図である。 変形例での処理を示すフローチャートである。 図12のフローチャートによる処理の具体例を示す図である。
符号の説明
101 変換ファイル指定部、103 ファイル読込部、105 ファイル属性識別部、107 ファイルフォーマット変換部、109 ファイル属性付加・ファイル書出部、201 ファイル蓄積部、203 ファイルリスト表示順用キーワード指定部、205 フォルダ選択部、207 ファイルリスト表示順決定部、209 ファイルリスト表示部。

Claims (17)

  1. 入力または作成されたファイルのファイルフォーマットを変換する変換手段と、
    前記変換手段によるファイルフォーマット変換の前に、前記ファイルの属性を判別する判別手段と、
    前記変換手段によるファイルフォーマット変換の際に、前記ファイルフォーマット変換前のファイルの属性を付加情報として、前記ファイルフォーマット変換後のファイルに付加する付加手段とを備え、フォーマット変換装置。
  2. 前記変換前のファイルの属性は、当該ファイルを作成したアプリケーションを示す情報である、請求項1に記載のフォーマット変換装置。
  3. 前記変換後のファイルは複数ページを含み、前記付加情報はページ毎に付加される、請求項1または2に記載のフォーマット変換装置。
  4. 前記判別手段は、変換前のファイルの属性を、変換前のファイルの拡張子に基づいて判別する、請求項1〜3のいずれかに記載のフォーマット変換装置。
  5. 前記変換前のファイルは、文書画像ファイルであり、
    前記判別手段は、変換前の文書画像ファイルの属性を、変換前の文書画像ファイルの文字、写真、表、または図領域の位置またはサイズを含む構成に基づいて判別する、請求項1〜3のいずれかに記載のフォーマット変換装置。
  6. 前記判別手段は、ファイルフォーマット変換前の文書画像ファイルの文字領域または表領域の面積に基づいて、ファイルフォーマット変換前の文書画像ファイルの属性を判別する、請求項5に記載のフォーマット変換装置。
  7. 前記変換手段は、前記変換前のファイルをPDFに変換し、
    前記付加手段は、前記付加情報を前記ファイルフォーマット変換後のPDFファイルに透明なテキストオブジェクトとして付加する、請求項1〜6のいずれか1項に記載のフォーマット変換装置。
  8. 前記変換手段は、前記変換後のファイルの拡張子を変換前のファイルの拡張子を含まない特定の同じ値に変換する、請求項1〜7のいずれか1項に記載のフォーマット変換装置。
  9. 請求項1〜8のいずれか1項に記載のフォーマット変換装置によってファイルフォーマット変換されたファイルを複数格納する格納手段と、
    前記格納手段に格納されたファイルの中から所望のファイルを検索するために、ユーザから、検索対象であるファイルのファイルフォーマット変換前の属性を入力する第1の入力手段と、
    前記格納手段に格納されたファイルの属性を読出す読出手段と、
    前記第1の入力手段で入力されたファイルフォーマット変換前のファイルの属性、および前記読出手段により読出されたファイルの属性に基づいて、前記格納手段から所望のファイルを検索する検索手段とを備えた、ファイル検索装置。
  10. 前記ユーザから、検索対象であるファイルのファイルフォーマット変換後の属性を入力する第2の入力手段をさらに備え、
    前記検索手段は、前記第1の入力手段で入力されたファイルフォーマット変換前のファイルの属性、前記第2の入力手段で入力されたファイルフォーマット変換後のファイルの属性、および前記読出手段により読出されたファイルの属性に基づいて、前記格納手段から所望のファイルを検索する、請求項9に記載のファイル検索装置。
  11. 前記格納手段は、ファイルフォーマット変換前のファイルを作成したアプリケーションを示す情報を付加情報として記録し、
    前記検索手段は、前記アプリケーションを示す情報に基づいて検索されたファイルを順に表示する、請求項9または10に記載のファイル検索装置。
  12. 入力または作成されたファイルのファイルフォーマットを変換する変換ステップと、
    前記ファイルフォーマット変換の前に、前記ファイルの属性を判別する判別ステップと、
    前記ファイルフォーマット変換の際に、前記ファイルフォーマット変換前の前記ファイルの属性を付加情報として、前記ファイルフォーマット変換後のファイルに付加する付加ステップとをコンピュータに実行させる、フォーマット変換プログラム。
  13. 前記変換前のファイルの属性は、当該ファイルを作成したアプリケーションを示す情報である、請求項12に記載のフォーマット変換プログラム。
  14. 前記判別ステップは、変換前のファイルの属性を、変換前のファイルの拡張子に基づいて判別する、請求項12または13に記載のフォーマット変換プログラム。
  15. 前記変換ステップは、前記変換前のファイルをPDFに変換し、
    前記付加ステップは、前記付加情報を前記ファイルフォーマット変換後のPDFファイルに透明なテキストオブジェクトとして付加する、請求項12〜14のいずれか1項に記載のフォーマット変換プログラム。
  16. 前記変換ステップは、前記変換後のファイルの拡張子を変換前のファイルの拡張子を含まない特定の同じ値に変換する、請求項12〜15のいずれか1項に記載のフォーマット変換プログラム。
  17. 請求項12〜16のいずれか1項に記載のフォーマット変換プログラムの実行によってファイルフォーマット変換されたファイルを複数格納する格納手段から、ファイルを検索するファイル検索プログラムであって、
    前記格納手段に格納されたファイルの中から所望のファイルを検索するために、ユーザから、検索対象であるファイルのファイルフォーマット変換前の属性を入力する入力ステップと、
    前記格納手段に格納されたファイルの属性を読出す読出ステップと、
    前記入力ステップで入力されたファイルフォーマット変換前のファイルの属性、および前記読出ステップにより読出されたファイルの属性に基づいて、前記格納手段から所望のファイルを検索する検索ステップとをコンピュータに実行させる、ファイル検索プログラム。
JP2004066220A 2004-03-09 2004-03-09 フォーマット変換装置およびファイル検索装置 Expired - Fee Related JP4135659B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2004066220A JP4135659B2 (ja) 2004-03-09 2004-03-09 フォーマット変換装置およびファイル検索装置
US10/862,454 US8566366B2 (en) 2004-03-09 2004-06-08 Format conversion apparatus and file search apparatus capable of searching for a file as based on an attribute provided prior to conversion

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004066220A JP4135659B2 (ja) 2004-03-09 2004-03-09 フォーマット変換装置およびファイル検索装置

Publications (2)

Publication Number Publication Date
JP2005258592A JP2005258592A (ja) 2005-09-22
JP4135659B2 true JP4135659B2 (ja) 2008-08-20

Family

ID=34918316

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004066220A Expired - Fee Related JP4135659B2 (ja) 2004-03-09 2004-03-09 フォーマット変換装置およびファイル検索装置

Country Status (2)

Country Link
US (1) US8566366B2 (ja)
JP (1) JP4135659B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2005277150B2 (en) * 2004-08-21 2011-05-26 Directworks, Inc. Methods, systems, and apparatuses for extended enterprise commerce
JP5020698B2 (ja) * 2007-05-09 2012-09-05 キヤノン株式会社 画像処理装置、画像処理方法、画像処理プログラム
US20090240628A1 (en) * 2008-03-20 2009-09-24 Co-Exprise, Inc. Method and System for Facilitating a Negotiation
JP2014199659A (ja) * 2013-03-15 2014-10-23 株式会社リコー データ形式変換システム、情報管理システム及び情報システム、並びに、データ形式変換方法、情報システムの制御方法、それらの方法のプログラム及びそのプログラムを記録した記録媒体
JP6191256B2 (ja) * 2013-06-10 2017-09-06 富士ゼロックス株式会社 画像処理装置及びプログラム
WO2016010545A1 (en) * 2014-07-17 2016-01-21 Hewlett-Packard Development Company, L.P. Data load from a data source into a target file
WO2020205810A1 (en) * 2019-03-29 2020-10-08 Devbridge Group, LLC Smart procedure parser
JP7404715B2 (ja) 2019-08-30 2023-12-26 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5386564A (en) * 1993-02-24 1995-01-31 Hewlett-Packard Company Conversion of data and objects across classes in an object management system
US5729741A (en) * 1995-04-10 1998-03-17 Golden Enterprises, Inc. System for storage and retrieval of diverse types of information obtained from different media sources which includes video, audio, and text transcriptions
JPH09190330A (ja) 1996-01-12 1997-07-22 Canon Inc 情報処理装置及び該装置におけるアイコン表示方法
US6195664B1 (en) * 1997-02-21 2001-02-27 Micrografx, Inc. Method and system for controlling the conversion of a file from an input format to an output format
JPH113296A (ja) 1997-06-12 1999-01-06 Matsushita Electric Ind Co Ltd メディア変換システム
US6012068A (en) * 1997-06-30 2000-01-04 International Business Machines Corporation Media manager for access to multiple media types
JP4035872B2 (ja) 1997-10-27 2008-01-23 株式会社日立製作所 ファイルフォーマット変換方法とこれを用いたファイルシステム及び情報システム及び電子商取引システム
JPH11312231A (ja) 1998-04-28 1999-11-09 Omron Corp データ処理プログラムを記録した記録媒体、データ処理装置およびデータ処理方法
US6260043B1 (en) * 1998-11-06 2001-07-10 Microsoft Corporation Automatic file format converter
JP2000315209A (ja) 1999-04-30 2000-11-14 Ricoh Co Ltd 画像ファイリング装置、画像ファイリング方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
US20020016800A1 (en) * 2000-03-27 2002-02-07 Victor Spivak Method and apparatus for generating metadata for a document
US20020103717A1 (en) * 2001-01-31 2002-08-01 Swart Stacey J. Systems and methods for ensuring deliverable quality compliance
JP2002259173A (ja) 2001-02-27 2002-09-13 Minolta Co Ltd ファイル管理プログラム、ファイル管理プログラムを記録したコンピュータ読取可能な記録媒体、ファイル管理装置およびファイル管理方法
JP2002269126A (ja) 2001-03-13 2002-09-20 Ricoh Co Ltd 文書管理システム
US20020144239A1 (en) * 2001-03-30 2002-10-03 Ray Bentley Method and system for modifying data in foreign formats
WO2002084531A2 (en) * 2001-04-10 2002-10-24 Univ Carnegie Mellon Systems and methods for deidentifying entries in a data source
JP2003196270A (ja) * 2001-12-27 2003-07-11 Sharp Corp 文書情報処理方法、文書情報処理装置、通信システム、コンピュータプログラム、及び記録媒体
JP3707685B2 (ja) * 2002-05-08 2005-10-19 ソニー株式会社 光ディスク装置、光ディスクの記録方法、光ディスクの記録方法のプログラム及び光ディスクの記録方法のプログラムを記録した記録媒体
JP4388929B2 (ja) * 2002-12-27 2009-12-24 富士通株式会社 構造化文書の構造変換装置、構造変換方法、記録媒体
US20040177159A1 (en) * 2003-03-04 2004-09-09 Webpost Enterprises Ltd. Systems for uploading and automatically processing computer files
US7313754B2 (en) * 2003-03-14 2007-12-25 Texterity, Inc. Method and expert system for deducing document structure in document conversion
JP2004362091A (ja) * 2003-06-03 2004-12-24 Toshiba Corp データ変換装置、データ変換システム及びデータ格納制御プログラム

Also Published As

Publication number Publication date
US8566366B2 (en) 2013-10-22
US20050203936A1 (en) 2005-09-15
JP2005258592A (ja) 2005-09-22

Similar Documents

Publication Publication Date Title
US8380012B2 (en) Document imaging and indexing system
Strobelt et al. Document cards: A top trumps visualization for documents
US9659013B2 (en) System and method for indexing electronic discovery data
JP4859025B2 (ja) 類似画像検索装置、類似画像検索処理方法、プログラム及び情報記録媒体
US7593961B2 (en) Information processing apparatus for retrieving image data similar to an entered image
US20160259805A1 (en) Method for graphical representation of a content collection
US7555729B2 (en) Signal bearing medium bearing image display program and image display apparatus
CN101739224A (zh) 略图创建方法以及图像形成装置
JP4135659B2 (ja) フォーマット変換装置およびファイル検索装置
JP4261988B2 (ja) 画像処理装置及び方法
JP5430312B2 (ja) データ処理装置、データ名生成方法及びコンピュータプログラム
JP2005151127A5 (ja)
CN117171331B (zh) 基于大型语言模型的专业领域信息交互方法、装置及设备
JP2010211688A (ja) 文書編集装置、データ処理方法及びプログラム
CN1312610C (zh) 文档信息处理方法,文档信息处理装置,通信系统和存储器产品
JP2004334341A (ja) 文書検索装置、文書検索方法及び記録媒体
JP2016018279A (ja) 文書ファイル検索プログラム、文書ファイル検索装置、文書ファイル検索方法、文書情報出力プログラム、文書情報出力装置及び文書情報出力方法
CN112650870A (zh) 一种训练图片排序模型的方法、图片排序的方法以及装置
JP4480109B2 (ja) 画像管理装置および画像管理方法
JP5217513B2 (ja) 情報解析処理方法、情報解析処理プログラム、情報解析処理装置、情報登録処理方法、情報登録処理プログラム、情報登録処理装置、情報登録解析処理方法、および情報登録解析処理プログラム。
JP6181890B2 (ja) 文献解析装置、文献解析方法およびプログラム
JP4823049B2 (ja) 文書画像検索装置及びプログラム
JPH10198683A (ja) 文書画像分類方法
WO2023281707A1 (ja) データ収集装置、データ収集方法、及びプログラム
EP4024235A1 (en) Method for segmenting pdf document and method for loading pdf document in webpage

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070626

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070817

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071030

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071213

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080219

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080416

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080513

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080526

R150 Certificate of patent or registration of utility model

Ref document number: 4135659

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110613

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120613

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130613

Year of fee payment: 5

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees