JPH11134342A - 文書検索装置および文書検索方法および文書検索プログラムを記録した記録媒体 - Google Patents

文書検索装置および文書検索方法および文書検索プログラムを記録した記録媒体

Info

Publication number
JPH11134342A
JPH11134342A JP9292907A JP29290797A JPH11134342A JP H11134342 A JPH11134342 A JP H11134342A JP 9292907 A JP9292907 A JP 9292907A JP 29290797 A JP29290797 A JP 29290797A JP H11134342 A JPH11134342 A JP H11134342A
Authority
JP
Japan
Prior art keywords
information
document
numerical information
numerical
date
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9292907A
Other languages
English (en)
Inventor
Tsutomu Miyoshi
力 三好
Natsuki Yuasa
夏樹 湯浅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP9292907A priority Critical patent/JPH11134342A/ja
Publication of JPH11134342A publication Critical patent/JPH11134342A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 属性情報に基づく単純なソートでは不可能な
使用者のあいまいな記憶情報による検索を可能とし、全
ての表現形式の検索キーを作成せず、キーワードを用い
ず文書検索を行う文書検索装置,方法及びその検索プロ
グラムを記録した記録媒体を提供する。 【解決手段】 情報抽出部402は、対象のテキスト文
書内容を情報記録部401から取得し文書内容から数値
情報を抽出し形式変換部405は抽出結果を統一的な表
現形式に変換し情報比較部403では抽出情報を比較し
一文書で同一数値情報の複数抽出は一つにし、情報補完
部406は抽出結果に日付の省略がある場合、文書の属
性情報から日付を推定して補完し、指示入力部407か
らの使用者による情報種類の指示で情報をソートし、表
示部404に表示することにより、使用者はあいまいな
記憶が基でも目的の文書を発見できる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文書の検索に関
し、より詳細には、テキスト文書の全文を数値情報をも
とに検索する技術に関する。
【0002】
【従来の技術】文書検索には、文書名,作成や変更の日
時,作成者,変更者,文書サイズ等の属性情報による検
索と、本文の全文を対象にしたキーワードによる検索が
一般的に利用されている。一方、全文を検索対象とする
場合の検索方法として、「文書,文字列検索方法及び該
方法に用いる記録媒体」(特願平9−247052号)
を出願中で、これは数値情報の抽出に適用し得る手法で
ある。また、サーバマシンに蓄積されているたくさんの
データを、クライアントマシンより指定されたソート条
件に従ってソートして、そのソート結果をクライアント
マシンの表示装置に表示することで、検索を速くした
「情報処理システム」(特開平5−342285号公
報)がある。これは、メールのアドレスやサブジェクト
の情報をもとにソートを行い、その順番に表示を行うと
いうものである。
【0003】
【発明が解決しようとする課題】しかし、この「情報処
理システム」(特開平5−342285号公報)では、
メールのアドレスやサブジェクト等をもとに単純なソー
トを行うだけであったため、それ以外のテキスト文書内
に記述された日付,時刻などの数値情報を手がかりに、
或いは、あいまいに記憶した日付,値段等の数値情報に
基づいて文書検索を行いたい場合には、これを利用でき
ない。
【0004】テキスト文書中に記述された日付,時刻,
値段,電話番号などの数値情報を手がかりに、あいまい
な記憶に基づいて文書検索を行うについて、従来のキー
ワード検索方法を用いた場合を考える。このキーワード
による全文検索では、以下の点で検索が困難となる問題
点が生じる。 ・数値情報の表現には複数種、かつ多様な形式、例え
ば、元号,西暦,12時間制,24時間制,通貨単位,
半角,全角,英数字,漢数字などが混在しているため、
全ての形式の検索キーを作成する必要がある。 ・年や日といった、日付等の表現に省略がある場合、省
略を考慮して検索キーを作成する必要がある。 ・ある期間、或いは区分の数値情報を検索する場合、そ
の期間、或いは区分内の可能性のある全ての値を全ての
形式で検索する検索キーを作成する必要がある。 ・同一内容の数値情報を意味する表現形式が複数あるた
め、検索結果は形式毎に分散して表示される。そのた
め、検索結果から求める文書を探すために全ての形式に
よる検索結果を調べる必要がある。
【0005】この発明は、従来技術におけるかかる問題
点に鑑みてなされたものであって、属性情報をもとに単
純なソートを行っていたのでは不可能な使用者のあいま
いな記憶情報にもとづく検索を可能とし、さらに、全て
の表現形式を考慮して検索キーを作成し、キーワードを
入力することなく文書検索を行うことを目的とする文書
検索装置および文書検索方法並びに該装置及び該方法を
実行するための文書検索プログラムを記録した記録媒体
を提供することをその解決すべき課題とする。
【0006】
【課題を解決するための手段】請求項1の発明は、情報
記録手段に蓄積された検索対象のテキスト文書群から数
値ベースの情報である日付,時刻・時間,値段,電話番
号などの数値情報を抽出する抽出手段と、検索結果とし
て、該抽出手段より抽出した数値情報を含むテキスト文
書について情報の種類分けをし数値順に表示する文書表
示手段を有する文書検索装置であって、一つのテキスト
文書から前記抽出手段により抽出された複数の数値情報
の異同を判断し、検索結果を前記文書表示手段に表示す
るにあたり、異なる数値情報の場合に該一つのテキスト
文書を数値情報毎に複数回表示し、同じ数値情報の場合
に一つのテキスト文書を1回だけ表示するための情報比
較手段を備えるようにしたものである。請求項1の文書
検索装置において、情報抽出手段では、情報記録手段に
記録されているテキスト文書群の本文情報を解析し、数
値情報を抽出して、抽出結果を情報記録手段に記録す
る。情報比較手段では、情報記録手段に記録されている
抽出結果を比較し、比較結果を文書表示手段に伝達す
る。この時、一つのテキスト文書から抽出された数値情
報が複数ある場合、検索結果の表示にあたって、抽出さ
れた数値情報種類順に一つの文書を複数回表示するよう
に文書表示手段に伝達する。文書表示手段では、情報比
較手段からの比較結果を受け情報記録手段に記録されて
いる文書やその属性情報を検索結果の一つとして表示す
る。
【0007】請求項2の発明は、情報記録手段に蓄積さ
れた検索対象のテキスト文書群から数値ベースの情報で
ある日付,時刻・時間,値段,電話番号などの数値情報
を抽出する抽出手段と、検索結果として、該抽出手段よ
り抽出した数値情報を含むテキスト文書について情報の
種類分けをし数値順に表示する文書表示手段を有する文
書検索装置であって、前記抽出手段により抽出された数
値情報が同一の情報種類に対し複数の表現形式をとり、
形式の変更を要する情報であるかを判断し、表現形式の
変更を要する場合に、該数値情報を統一的な表現形式へ
と変換を行う形式変換手段を備え、該形式変換手段によ
り変換された表現形式の数値情報を含むテキスト文書を
前記文書表示手段により表示するようにしたものであ
る。請求項2の文書検索装置において、情報抽出手段で
は、情報記録手段に記録されているテキスト文書群の本
文情報を解析し、数値情報を抽出して、抽出結果を情報
記録手段に記録する。形式変換手段では、情報記録手段
に記録されている抽出結果を解析し、同一の情報種類で
あっても複数の表現形式をとる情報である場合に、数値
情報を統一的な形式に変換して、情報記録手段に抽出結
果として再記録する。文書表示手段では、情報記録手段
からの抽出結果を受けて、情報記録手段に記録されてい
る文書やその属性情報を検索結果の一つとして表示す
る。
【0008】請求項3の発明は、請求項1の発明におい
て、前記抽出手段により抽出された数値情報が同一の情
報種類に対し複数の表現形式をとり、形式の変更を要す
る情報であるかを判断し、表現形式の変更を要する場合
に、該数値情報を統一的な表現形式へと変換を行う形式
変換手段を備え、該形式変換手段により変換された表現
形式の数値情報を含む文書を前記文書表示手段により表
示するようにしたものである。請求項3の文書検索装置
において、情報抽出手段では、情報記録手段に記録され
ているテキスト文書群の本文情報を解析し、数値情報を
抽出して、抽出結果を情報記録手段に記録する。形式変
換手段では、情報記録手段に記録されている抽出結果を
解析し、同一の情報種類であっても複数の表現形式をと
る情報である場合に、数値情報を統一的な形式に変換し
て、情報記録手段に抽出結果として再記録する。情報比
較手段では、情報記録手段に記録されている抽出結果を
比較し、比較結果を文書表示手段に伝達する。この時、
一つのテキスト文書から抽出された数値情報が複数ある
場合、検索結果の表示にあたって、抽出された数値情報
種類順に一つの文書を複数回表示するように文書表示手
段に伝達する。文書表示手段では、情報比較手段からの
比較結果を受け、再記録された情報を含め情報記録手段
に記録されている文書やその属性情報を検索結果の一つ
として表示する。
【0009】請求項4の発明は、請求項1ないし3のい
ずれか1の発明において、前記抽出手段により抽出され
た数値情報中の日付に省略がある場合に、省略された該
日付に係わるテキスト文書の属性情報を利用して該日付
を補完する情報補完部を備えるようにしたものである。
請求項4の文書検索装置において、請求項1ないし3の
文書検索装置の動作に加え、情報補完部では、情報記録
部に記録されている抽出結果を解析し、数値情報に省略
がある場合に属性情報を情報記録部から取得し、それを
手がかりに抽出結果の数値の省略部分を補完して、情報
記録部に抽出結果として再記録する。
【0010】請求項5の発明は、蓄積された検索対象の
テキスト文書群から数値ベースの情報である日付,時刻
・時間,値段,電話番号などの数値情報を抽出する抽出
ステップと、検索結果として、該抽出ステップで抽出し
た数値情報を含むテキスト文書について数値情報の種類
分けをし数値順に表示する文書表示ステップを有する文
書検索方法であって、前記抽出ステップにより一つの文
書から抽出された複数の数値情報の異同を判断し、前記
文書表示ステップにおいて検索結果を表示するにあた
り、異なる数値情報と判断される場合に該一つの文書を
数値情報毎に複数回表示し、同じ数値情報と判断される
場合に一つの文書を1回だけ表示するための文書ソート
処理ステップを備えるようにしたものである。請求項5
の文書検索方法では、テキスト文書を解析し、数値ベー
スの情報である日付,時刻・時間,値段,電話番号など
の数値情報を抽出し、検索結果として、抽出した数値情
報をその種類順に表示する。この時、一つのテキスト文
書から抽出された数値情報が複数ある場合、検索結果の
表示にあたって、抽出された数値情報をその種類順に一
つの文書を複数回表示し、あいまいな数字の記憶をもと
に行う検索を容易にする。
【0011】請求項6の発明は、蓄積された検索対象の
テキスト文書群から数値ベースの情報である日付,時刻
・時間,値段,電話番号などの数値情報を抽出する抽出
ステップと、検索結果として、該抽出ステップで抽出し
た数値情報を含むテキスト文書について数値情報の種類
分けを数値順に表示する文書表示ステップを有する文書
検索方法であって、前記抽出ステップで抽出された数値
情報が同一の情報種類に対し複数の表現形式をとる情報
であり、かつ形式の変更を必要とする情報かを判断し、
表現形式の変更を必要とする場合に該数値情報を統一的
な表現形式へと変換を行う形式変換処理ステップを備
え、該形式変換処理ステップにより変換された表現形式
の数値情報を含むテキスト文書を前記文書表示ステップ
により表示するようにしたものである。請求項6の文書
検索方法では、テキスト文書を解析し、数値ベースの情
報である日付,時刻・時間,値段,電話番号などの数値
情報を抽出するが、抽出された数値情報が同一の情報種
類であるにもかかわらず複数の表現形式をとっている場
合、数値情報の種類に応じて統一的な形式に変換を行う
ことで、統一的な形式の数値情報種類毎,数値順に文書
を表示する。
【0012】請求項7の発明は、請求項5の発明におい
て、前記抽出ステップで抽出された数値情報が同一の情
報種類に対し複数の表現形式をとる情報であり、かつ形
式の変更を必要とする情報かを判断し、表現形式の変更
を必要とする場合に該数値情報を統一的な表現形式へと
変換を行う形式変換処理ステップを備え、該形式変換処
理ステップにより変換された表現形式の数値情報を含む
テキスト文書を前記文書表示ステップにより表示するよ
うにしたものである。請求項7の文書検索方法では、テ
キスト文書を解析し、数値ベースの情報である日付,時
刻・時間,値段,電話番号などの数値情報を抽出し、検
索結果として、抽出した数値情報をその種類順に表示す
る。この時、抽出された数値情報が同一の情報種類であ
るにもかかわらず複数の表現形式をとっている場合、数
値情報の種類に応じて統一的な形式に変換を行うこと
で、統一的な形式の数値情報種類順に文書を表示する。
一つのテキスト文書から抽出された数値情報が複数ある
場合、検索結果の表示にあたって、抽出された数値情報
をその種類順に一つの文書を複数回表示し、あいまいな
数字の記憶をもとに行う検索を容易にする。
【0013】請求項8の発明は、請求項5ないし7のい
ずれか1の発明において、前記抽出ステップで抽出され
た数値情報中の日付に省略がある場合に、省略された該
日付に係わるテキスト文書の属性情報を利用して該日付
を補完する情報補完処理ステップを備えるようにしたも
のである。請求項8の文書検索方法は、請求項5ないし
7の文書検索方法に加えて、抽出された日付に省略があ
る場合、文書の属性情報を利用して日付を補完する。
【0014】請求項9の発明は、請求項1ないし4のい
ずれか1記載の文書検索装置を構成する手段を動作さ
せ、検索機能を実行するためのプログラム及びデータを
記録したコンピュータ読み取り可能な文書検索プログラ
ムを記録した記録媒体としたものである。
【0015】請求項10の発明において、請求項5ない
し8のいずれか1記載の文書検索方法を実行するための
プログラム及びデータを記録したコンピュータ読み取り
可能な文書検索プログラムを記録した記録媒体としたも
のである。
【0016】
【発明の実施の形態】
(第1の実施例形態)図1は、本発明による文書検索装
置の実施形態の概要を示すブロック図である。図1に基
づきこの発明による文書検索装置の第1の実施形態を説
明する。電子メールの形式で多量の報告書が保存されて
いる状態で、報告書本文中の日付情報を手がかりに目的
とする報告書を検索する場合であり、利用者は報告書作
成の日時と関連のない、報告内容中に含まれる日付をあ
いまいに記憶しているものと想定し、こうした条件で本
実施形態が構成されるものとする。
【0017】本実施形態の装置は、検索を行う時点で数
値情報抽出処理を完了しているものとする。これを行う
タイミングは規定しないが、例えば、メール受信時,検
索開始時といった一定期間ごとにチェックする方法が考
えられる。抽出処理を行うタイミングで、情報抽出部1
02は対象となる文書内容を情報記録部101から取得
し文書内容から数値ベースの数値情報を抽出する。抽出
方法は規定しないが、例えば、「文字,文字列検索方法
及び該方法に用いる記録媒体」(特願平8−31110
8号)に開示されている方法を利用することができる。
抽出された数値情報は情報比較部103で比較され、同
一の数値情報が複数抽出されている場合は抽出結果のデ
ータを一つとする。比較されデータの重複を排除された
数値情報は、情報記録部101に抽出結果として記録さ
れる。
【0018】指示入力部105から数値情報の中の日付
情報を基に検索するようにその指示が入力されると、情
報比較部103は、情報記録部101に記録された各文
書の数値情報の抽出結果から日付に関する情報を取り出
し、取り出した情報同士相互に日付を比較する。表示部
104は、情報記録部101からの各文書のサブジェク
ト情報を取り出して、情報比較部103での比較結果を
利用して日付の順にソートを行い、日付とともに表示す
る。一つの文書から複数の日付が抽出されている場合、
一つの日付に対して一項目としてソートを行い、同じ文
書のサブジェクトを抽出された日付に応じ複数回表示す
る。利用者はあいまいな記憶を基にその近辺の日付まで
表示を移動させ、日付とサブジェクトを手がかりに目的
の文書を発見することができる。
【0019】図2は、図1の装置による処理動作のプロ
セスを示すフローチャートである。この処理プロセス
を、図2を参照して説明するが、このプロセスは、本願
で開示される文書検索方法や文書検索プログラムを書い
た媒体を用い実施されることになる。まず、ステップS
201で検索対象の文書から数値情報を情報抽出部10
2で抽出する。これを行うタイミングは規定しないの
で、検索を行うたびにステップS201を実行しても良
いし、新規文書が入力されるたびにステップS201を
実行し、その抽出結果を情報記録部101に記録するよ
うにしておいてもよい。次に、ステップS202で、同
一の数値情報が複数抽出されている場合は抽出結果のデ
ータを一つにする。次に、ステップS203では、ユー
ザ等から何を基に検索,表示を行うのかが指示される。
ステップS204では、ステップS203で指示された
種別の数値情報について、数値を比較し、例えば、「日
付を基に検索」という指示が入力されたなら日付順にソ
ートするし、「値段を基に検索」という指示が入力され
たなら値段順にソートすることになる。ステップS20
5では、そのソート結果を出力する。一つの文書から複
数の日付が抽出されている場合、一つの日付に対して一
項目として同じ文書のサブジェクトを複数回表示する。
ユーザはあいまいな記憶を基に近辺の日付まで表示を移
動させ、日付とサブジェクトを手がかりに目的の文書を
発見することが可能となる。
【0020】上記した処理のプロセスをより具体的に以
下に説明する。図3は、一つの文書から抽出された数値
情報が複数ある場合に、その文書のサブジェクトを複数
回表示させる処理のフローチャートである。抽出された
各数値情報と抽出元の文書とのペアを、数値情報をキー
にしてソートすることでこの処理が実現できる。この処
理を図3のフローチャートを参照しながら説明する。ま
ず、ステップS301で、作業用変数iに1をセットす
る。そして、ステップS302で、第i番目の文書に含
まれる数値情報の個数をnにセットする。そして、ステ
ップS303で、作業用変数jを1にセットする。ステ
ップS304で、第i番目の文書に含まれる第j番目の
数値情報をIjとすると、(Ij,i)というペアを作成
する。そして、ステップS305でjに1を加えて、ス
テップS306でjがn以下の間、ステップS304か
らの処理を繰り返す。これにより、(I1,i),
(I2,i),…というペアが用意されることになる。
【0021】jがnを越えたなら、ステップS307で
iに1を加え、iが文書数以下の間、ステップS302
からの処理を繰り返す。これにより、(I1,1),
(I2,1),…,(I1,2),(I2,2),…とい
うペアが用意されることになる。iが文書数を越えた
ら、ステップS309で数値情報と文書番号のペアを数
値情報をキーにソートする。つまり、用意されたペア全
部((I1,1),(I2,1),…,(I1,2),
(I2,2),…)をIjの大きさの順にソートする。そ
して、ステップS310でIjの大きの順番に「文書番
号に対応したサブジェクト」を表示する。これにより、
利用者はあいまいな記憶を基にその近辺の数値情報の位
置まで表示を移動させ、数値情報とサブジェクトを手が
かりに目的の文書を発見することが可能となる。
【0022】なお、以上の処理を機能させるプログラム
を記録したコンピュータ読み取り可能な記録媒体として
は、フロッピーディスクやCD−ROMが代表例にあげ
られるが、他にも光磁気ディスクを初め、今後出現する
記録媒体も含め、あらゆる記録媒体を用いることができ
る。コンピュータ等の情報処理装置にこうした記録媒体
をインストールすることによって、簡単に当該文書検索
方法を実行できる装置を構成することができ、本装置に
より、記録媒体から読み出されたプログラムに従って文
書を検索することができる。そして、プログラムやデー
タを記録した記録媒体を上記した形式のものとして流通
させることにより、当該方法および装置の実施化を容易
にする。
【0023】(第2の実施形態)この実施形態を図4に
もとづき説明する。第1の実施形態の方法では、日付情
報に関して目的の日付が複数の部分に分散してしまう可
能性がある。すなわち、本文中に記述された日付情報に
は利用者が直接打ち込んだ物が多く含まれ、これには、
元号,西暦,半角,全角,英数字,漢数字,複数の日付
形式などが混在し、更に、年月日のいずれかを省略した
物が含まれる。これをそのままソートすると、同一の日
付であっても表記が異なるために異なるグループに別
れ、同一の日付として扱うべき情報が複数の部分に散っ
てしまう。この問題点に対する解決手段をこの実施形態
は備える。
【0024】電子メールにおいて、利用者が日付の一部
を省略する場合、省略された部分は送り手と受け手の双
方で明白な場合であり、それは電子メールの送受信され
た日付を手がかりに省略部分を推論できる場合がほとん
どである。この性質を利用して、メールの属性情報のう
ち、作成・変更日付に基づいて本文中の日付の省略部分
の補完を行うことができる。また、形式の違いに関して
は、それを統一的な形式に変換することが可能である。
【0025】図4は、本発明による文書検索装置の実施
形態の概要を示すブロック図である。以下に、図4に基
づき第2の実施形態を説明する。ここでも、第1の実施
形態と同一の条件で構成される。情報抽出部402は対
象となる文書内容を情報記録部401から取得し文書内
容から数値ベースの数値情報を抽出し、情報記録部40
1に抽出結果として記録する。形式変換部405は、情
報記録部401から抽出結果を取得し、統一的な形式に
変換したのち抽出結果として情報記録部401に記録す
る。変換方法は規定しないが、例えば、元号,西暦,半
角,全角,英数字,漢数字などの変換は予め対応表を作
成しておき、それを参照することで変換可能である。ま
た、日付形式の変換は、数字自身とその前後の文字や文
字列を手がかりに各数字の意味を同定することで可能で
ある。すなわち、年,月,日などの文字があればその前
の数字はそれぞれ年月日を特定する数字を表す、32以
上の数字は年を表す、13以上の数字は年か日を表す、
などの条件をルールとして登録しておき、それを手がか
りに日付形式を同定する。
【0026】この形式変換処理のフローチャートを図
5,図6及び図7に示す。図5は、数値情報が日付の場
合の形式変換処理で、図6は、数値情報が値段等の数値
の場合の形式変換処理で、図7は、数値情報が時刻の場
合の形式変換処理である。最初に、数値情報が日付の場
合の形式変換処理を図5のフローチャートを参照しなが
ら説明する。まず、ステップS501で、数値情報の形
式をチェックする。数値情報の表現形式が「x年y月z
日」という記述だった場合は、ステップS502からス
テップS503へ行き、xの値を調べる。xが平成で表
した時の現在の年(あるいは適当に定めた数値(例:2
0))以下であるなら、ステップS504へ行き、xを
平成の年として処理する。つまり、西暦では(x+19
88)年(y)月(z)日と表されるので、ステップS
717では、(x+1988)の四桁、yの二桁、zの
二桁を連続して記述した八桁の文字列を返す。
【0027】ステップS503でxが平成で表した時の
現在の年(あるいは適当に定めた数値)を越えていた場
合はステップS505へ行き、xを西暦の年として処理
する。つまり、西暦では、(x+1000)年(y)月
(z)日と表されるので、ステップS517では、(x
+1900)の四桁、yの二桁、zの二桁を連続して記
述した八桁の文字列を返す。ただし、これは西暦199
9年までの処理であり、西暦2000年以降になった場
合は、現在の年を平成(あるいはその時の和歴)で表し
た年と、西暦で表した時の下二桁とで、記述されていた
年に近い方を採用する。例えば、西暦2013年(平成
25年)に「14年月11日」という記述を抽出した
ら、それは西暦2014年とみなす。もちろん「14
年」の前に「平成」,「H」等の年号を表わす文字列や
記号がついていた場合は、その年号での年とみなす。
【0028】数値情報の表現形式が「x−y−z」とい
う記述だった場合は、ステップS506からステップS
503へ行き、その後は上述した処理を行う。数値情報
の表現形式が「平成x年y月z日」という記述だった場
合は、ステップS507からステップS508へ行き、
xを平成の年、yを月、zを日として処理を行う。つま
り、西暦では、(x+1988)年(y)月(z)日と
なるので、ステップS517では、(x+1988)の
四桁、yの二桁、zの二桁を連続して記述した八桁の文
字列を返す。
【0029】数値情報の表現形式が、「昭和x年y月z
日」という記述だった場合は、ステップS509からス
テップS510へ行き、xを昭和の年、yを月、zを日
として処理を行う。つまり、西暦では、(x+192
5)年(y)月(z)日となるので、ステップS517
では、(x+1925)の四桁、yの二桁、zの二桁を
連続して記述した八桁の文字列を返す。
【0030】数値情報の表現形式が「大正x年y月z
日」という記述だった場合は、ステップS511からス
テップS512へ行き、xを大正の年、yを月、zを日
として処理を行う。つまり、西暦では、(x+191
1)年(y)月(z)日となるので、ステップS517
では、(x+1911)の四桁、yの二桁、zの二桁を
連続して記述した八桁の文字列を返す。
【0031】数値情報の表現形式が、「z■■■■x」
(■■■■:月の英語名(y),例.「z April
x」)という記述だった場合は、ステップS513から
ステップS514へ行き、zを西暦の年、月の英語名で
表される月の値をy、xを日として処理を行う。つま
り、西暦では(z)年(y)月(x)日となるので、ス
テップ717では、zの四桁、yの二桁、xの二桁を連
続して記述した八桁の文字列を返す。
【0032】数値情報の表現形式が、「■■■■yz」
(「■■■■:月の英語名(x),例.「April
yz」)という記述だった場合は、ステップS515か
らステップS516へ行き、zを西暦の年、月の英語名
で表される月の値をx、yを日として処理を行う。つま
り、西暦では、(z)年(x)月(y)日となるので、
ステップS517では、zの四桁、xの二桁、yの二桁
を連続して記述した八桁の文字列を返す。
【0033】上記で説明した表現形式以外でも、例え
ば、「明治○年○月○日」ならば明治の年号で表された
年を西暦に直して処理すればよいし、「H○年○月○
日」,「S○年○月○日」,「T○年○月○日」,「M
○年○月○日」等は、それぞれ平成・昭和・大正・明治
で表された年を西暦に直して処理すればよい。他の表現
形式でも、年と月と日の値がわかるものについては、そ
れを西暦で表す処理を加えることで対応できる。また、
処理を記述していない(未定義の)表現形式だった場合
は、ステップS550でその旨を知らせる処理を書いて
おくことにより、未定義の表現形式が出現した時に対応
が取れるようにしておくことができる。
【0034】次に、数値情報が値段の場合の形式変換処
理を図6のフローチャートを参照しながら説明する。ま
ず、ステップS601で、作業用変数sn,sn2,n
eに0をセットする。そして、抽出された数値情報を先
頭の文字から見ていく。注目している文字が数字ならス
テップS602からステップS603へ行き、neを1
0倍してから先頭の数字で表される数値をneに加え、
ステップS616で読み込み文字を一つ進め、まだ抽出
文字が残っているなら、ステップS617からステップ
S602へ戻って処理を繰り返す。抽出文字を全部読み
込んだなら、ステップS618へ行き、(ne+sn+
sn2)の値を値段として返す。
【0035】次に読み込む数値情報として注目する文字
が数字ではなく(ステップS602)、その文字が
「兆」なら、ステップS604からステップS605へ
行く。ここでは、(ne+sn2)が0なら1兆をsn
に加え、(ne+sn2)が0でないなら、(ne+s
n2)×1兆をsnに加える。そして、neとsn2に
0をセットしてから、ステップS616へ行き読み込み
文字を一つ進める。この後の処理は上述した通りであ
る。
【0036】次に読み込み注目する文字が「億」なら、
ステップS606からステップS607へ行く。ここで
は、(nc+sn2)が0なら1億をsnに加え、(n
e+sn2)が0でないなら、(ne+sn2)×1億
をsnに加える。そして、neとsn2に0をセットし
てから、ステップS616へ行き読み込み文字を一つ進
める。この後の処理は上述した通りである。
【0037】次に読み込み注目する文字が「万」なら、
ステップS608からステップS609へ行く。ここで
は、(ne+sn2)が0なら1万をsnに加え、(n
e+sn2)が0でないなら、(ne+sn2)×1万
をsnに加える。そして、neとsn2に0をセットし
てから、ステップS616へ行き読み込み文字を一つ進
める。この後の処理は上述した通りである。
【0038】次に読み込み注目する文字が「千」なら、
ステップS610からステップS611へ行く。ここで
は、neが0なら千をsn2に加え、neが0でないな
ら、ne×千をsn2に加える。そして、neに0をセ
ットしてから、ステップS616へ行き読み込み文字を
一つ進める。この後の処理は上述した通りである。
【0039】次に読み込み注目する文字が「百」なら、
ステップS612からステップS613へ行く。ここで
は、neが0なら百をsn2に加え、neが0でないな
ら、ne×百をsn2に加える。そして、neに0をセ
ットしてから、ステップS616へ行き読み込み文字を
一つ進める。この後の処理は上述した通りである。
【0040】次に読み込み注目する文字が「十」なら、
ステップS614からS615へ行く。ここでは、ne
が0なら十をsn2へ加え、neが0でないなら、n×
十をsn2に加える。そして、neに0をセットしてか
ら、ステップS616へ行き、読み込み文字を一つ進め
る。この後の処理は上述した通りである。
【0041】次に読み込み注目する文字がそれ以外なら
無視して、ステップS616で読み込み文字を一つ進め
る。この後の処理は上述した通りである。なお、「京」
やそれ以上の大きな単位の場合の処理も「兆」の処理に
準じてその処理のプログラムを容易に書くことができ
る。
【0042】次に、数値情報が時刻の場合の形式変換処
理を図7のフローチャートを参照しながら説明する。ま
ず、ステップS701で、数値情報の形式をチェックす
る。数値情報の形式が「x時y分z秒」という記述だっ
た場合は、ステップS702からステップS703へ行
き、xを時、yを分、zを秒として処理する。そして、
ステップS714でx,y,zをそれぞれ二桁で表し、
コロンで区切って「hh:mm:ss」という形にして
返す。
【0043】数値情報の表現形式が、「pmx時y分z
秒」という記述だった場合は、ステップS704からス
テップS705へ行き、(x+12)を時,yを分、z
を秒として処理し、ステップS714でx,y,zをそ
れぞれ二桁で表し、コロンで区切って「hh:mm:s
s」という形にして返す。
【0044】数値情報の表現形式が、「午後x時y分z
秒」という記述だった場合は、ステップS706からス
テップS707へ行き、(x+12)を時、yを分、z
を秒として処理し、ステップS714でx,y,zをそ
れぞれ二桁で表し、コロンで区切って「hh:mm:s
s」という形にして返す。
【0045】数値情報の表現形式が、「x:y:z」と
いう記述だった場合は、ステップS708からステップ
S709へ行き、xを時、yを分、zを秒として処理
し、ステップS714でx,y,zをそれぞれ二桁で表
し、コロンで区切って「hh:mm:ss」という形に
して返す。
【0046】数値情報の表現形式が、「pm x:y:
z」という記述だった場合は、ステップS710からス
テップS711へ行き、(x+12)を時、yを分、z
を秒として処理し、ステップS714でx,y,zをそ
れぞれ二桁で表し、コロンで区切って「hh:mm:s
s」という形にして返す。
【0047】数値情報の表現形式が、「午後x:y:
z」という記述だった場合は、ステップS712からス
テップS713へ行き、(x+12)を時、yを分、z
を秒として処理し、ステップS714でx,y,zをそ
れぞれ二桁で表し、コロンで区切って「hh:mm:s
s」という形にして返す。
【0048】上記で説明した表現形式以外でも、例え
ば、「x:y:z pm」なら、午後x時とみなして
(x+12)を時、yを分、zを秒として処理すればよ
いし、他の表現形式でも時と分と秒の値がわかるものに
ついてはそれを24時間制で表す処理を加えることで対
応できる。また、処理を記述していない(未定義の)表
現形式だった場合は、ステップS750でその旨を知ら
せる処理を書いておくことにより、未定義の表現形式が
出現した時に対応が取れるようにしておくことができ
る。
【0049】図4の装置において、補完処理動作は次の
ように行われる。情報比較部403では、情報記録部4
01から情報抽出部402により得た抽出結果を取得
し、抽出された情報を比較し、同一の数値情報が複数抽
出されている場合は抽出結果のデータを一つにし、情報
記録部401に抽出結果として記録する。情報補完部4
06は、情報記録部401から抽出結果を取得し、抽出
結果に日付の省略があるかどうかを調べる。省略がない
場合、数値情報抽出処理を完了する。省略がある場合、
情報補完部406は、情報記録部401から対象文書の
作成日付を取得し、これを基に省略された日付を推論し
補完した後、抽出結果として情報記録部401に保存す
る。推論・補完方法は規定しないが、例えば、年が省略
されている場合は、作成年と同じとみなす、年末に年始
の日付がある場合は1年後、年始に年末の日付がある場
合は1年前とみなす、などの条件をルールとして登録し
ておき、それを手がかりに日付形式を同定することがで
きる。
【0050】この情報補完処理のフローチャートを図8
に示す。数値情報が日付の場合の情報補完処理をより具
体的に図8のフローチャートを参照しながら説明する。
まず、ステップS801で、数値情報の形式をチェック
する。数値情報の表現形式が「y月z日」という記述だ
った(年がなかった)場合は、ステップS803で、y
を月、zを日として処理し、ステップS812で、現在
の年を省略しているとみなし、現在の年の西暦での表現
(四桁)、yの二桁、zの二桁を連続して記述した八桁
の文字列を返す。ただし、その時の月が1月で、yが1
2だった場合などは、年としては現在の年の前の年を想
定した方がよい場合がある。このための処理としては、
現日付と、抽出した数値情報の日付とができるだけ近く
なるように省略されている年を補完すればよい。この処
理は年の省略だけでなく、月も省略されている場合にも
応用できる。
【0051】数値情報の表現形式が、「y−z」という
記述だった場合は、ステップS804から、ステップS
805へ行き、yを月zを日として処理し、ステップS
812へ行く。その後の処理は、上述した通りである。
【0052】数値情報の表現形式が、「y/z」という
記述だった場合は、ステップS806からステップS8
07へ行く。ステップS807では、基本的には、yを
月,zを日として処理するが、yが13以上の場合は、
yを日、zを月として処理する。yもzも13以上の場
合は日付ではない(分数か何か)とみなすことができ
る。その後の処理は、上述した通りである。
【0053】数値情報の表現形式が、「x月の英語名
(例.April)」という記述だった場合は、ステッ
プS808からステップS809へ行く。ステップS8
09では、xを日、月の英語名を数値にしたものを月と
して処理する(例.April→4)。その後の処理
は、上述した通りである。
【0054】数値情報の表現形式が、「月の英語名y」
という記述だった場合は、ステップS810からステッ
プS811へ行く。ステップS811では、yを日、月
の英語名を数値に直したものを月として処理する。その
後の処理は、上述した通りである。
【0055】上記で説明した表現形式以外でも、月と日
の値がわかるものについては、それに現在の日付から想
定できる年を補完する処理を加えることで対応できる。
また、処理を記述していない(未定義の)表現形式だっ
た場合は、ステップS850でその旨を知らせる処理を
書いておくことにより、未定義の表現形式が出現した時
に対応が取れるようにしておくことができる。指示入力
部407から日付情報を基に検索する指示が入力される
と、第1の実施形態と同様の処理を行い表示することに
より、利用者はあいまいな記憶を基に目的の文書を発見
することができる。
【0056】図9は、形式変換処理及び情報補完処理を
含む第2の実施形態の処理全体のフローチャートを示
す。この処理フローを、図9を参照して説明する。ま
ず、ステップS901で検索対象のテキスト文書から数
値情報を抽出する。これを行うタイミングは規定しない
ので、検索を行うたびにステップS901を実行しても
よいし、新規文書が入力されるたびにステップS901
を実行し、その抽出結果を情報記録部401に記録する
ようにしておいてもよい。次に、ステップS902で
は、数値情報を統一的な形式に変換する。変換方法は規
定しないが、例えば、元号,西暦,半角,全角,英数
字,漢数字などの変換は予め対応表を作成しておき、そ
れを参照することで変換可能である。また、日付形式の
変換は、数字自身とその前後の文字や文字列を手がかり
に各数字の意味を同定することで可能である。すなわ
ち、年,月,日などの文字があれば、その前の数字はそ
れぞれ年月日を特定する数字を表す、32以上の数字は
年を表す、13以上の文字は年か日を表す、などの条件
をルールとして登録しておき、それを手がかりに日付形
式を同定する。この形式変換処理のフローチャートを図
5,図6及び図7に示す。図5は、数値情報が日付の場
合の処理で、図6は、数値情報が値段等の数値の場合の
処理で、図7は、数値情報が時刻の場合の処理である。
これらの処理の詳細については前述した通りである。
【0057】次に、ステップS903では、一つのテキ
スト文書中から同一の数値情報が複数抽出されている場
合はそれを一つにする。次に、ステップS904では、
抽出結果に日付の省略があるかどうかを調べる。省略が
ない場合、数値情報抽出処理を完了してステップS90
5へ進む。省略がある場合は、対象文書の作成日付を取
得し、これを基に省略された日付を推論し補完する。推
論・補完方法は規定しないが、例えば、年が省略されて
いる場合は、作成年と同じとみなす。年末に年始の日付
がある場合は1年後、年始に年末の日付がある場合は1
年前とみなす、などの条件をルールとして登録してお
き、それを手がかりに日付形式を同定することができ
る。
【0058】ステップS905では、ユーザ等から何を
基に検索を行うのかが指示される。ステップS906で
は、ステップS905で指示されて数値情報について、
数値を比較し、例えば、「日付を基に検索」という指示
が入力されたなら日付順にソートするし、「値段を基に
検索」という指示が入力されたなら値段順にソートする
ことになる。ステップS907では、そのソート結果を
出力する。一つの文書から複数の日付が抽出されている
場合、一つの日付に対して一項目として同じ文書のサブ
ジェクトを複数回表示する。利用者はあいまいな記憶を
基にその近辺の日付まで表示を移動させ、日付とサブジ
ェクトを手がかりに目的の文書を発見することができ
る。
【0059】図3は、一つのテキスト文書から抽出され
た数値情報が複数ある場合に、その文書のサブジェクト
を複数回表示させる処理のフローチャートである。抽出
された各数値情報と抽出元の文書とのペアを、数値情報
をキーにしてソートすることでこの処理が実現できる。
図3の処理の詳細については前述した通りである。
【0060】なお、以上の処理を機能させるプログラム
を記録したコンピュータ読み取り可能な記録媒体として
は、プロッピーディスクやCD−ROMが代表例にあげ
られるが、他にも光磁気ディスクを初め、今後出現する
記録媒体も含め、あらゆる記録媒体を用いることができ
る。コンピュータ等の情報処理装置にこうした記録媒体
をインストールすることによって、簡単に当該文書検索
方法を実行できる装置を構成することができ、本装置に
より、記録媒体から読み出されたプログラムに従って文
書を検索することができる。そして、プログラムやデー
タを記録した記録媒体を上記した形式のものとして流通
させることにより、当該方法および装置の実施化を容易
にする。
【0061】図10は、本発明による検索結果を示し、
「日付」という数値情報で並べ替えて表示した図であ
る。ここで、先頭行の左から項目の説明をしておく。
「未読」に「Y」があるのは「まだ読んでいないメー
ル」を表し、「分類」が「A」なのは自動的に分類した
記事、「H」なのはユーザが手作業で分類した記事を表
している。「日付」はそのメールのヘッダ情報に付いて
いる「発信日」であり、「To」はそのメールのヘッダ
情報に付いている「宛先」であり、「Fr」はそのメー
ルヘッダ情報に付いている「発信者」であり、「概要」
はそのメールのヘッダ情報に付いている題名である。四
角で囲まれた「本文」をクリックすると、数値情報の種
類を選択する画面になり、ここでは「日付」を選択した
場合の画面を示している。この例では、一番上のメール
と下から二番目のメールは同一のメールであるが、本文
中から「日付」として「8月23日」と「9月24日」
が抽出されているので、別の項目としてソートが行わ
れ、同じ文書のヘッダ情報を複数回表示している。これ
により、ユーザはこのメールについては、「8月20月
頃の日付が書いてあったはず」いうあいまいな情報だけ
からでもこのメールを検索できるし、また、「9月25
日頃の日付が書いてあったはず」というあいまいな情報
だけからでもこのメールを検索できることになるのであ
る。
【0062】
【発明の効果】請求項1,5に対応する効果:使用者が
キーワードを選択し入力することなく、テキスト文書の
本文内に記述された各種の数値ベースの情報である数値
情報を基に検索を可能とするもので、数値情報を種類分
けし、数値順に整理して提示し、その中から使用者が文
書検索を行うものである。この場合、同一文書中に複数
の数値情報がある場合、複数の項目として異なる数値情
報ごとに文書を表示するようにしている。従って、数値
情報の本来の大小関係の順に文書を表示することによ
り、数値情報の大小関係だけで容易に文書検索が可能と
なり、あいまいな記憶によってでも文書検索が可能とな
る。
【0063】請求項2,6に対応する効果:使用者がキ
ーワードを選択し入力することなく、テキスト文書の本
文内に記述された各種の数値ベースの情報である数値情
報を基に検索を可能とするもので、数値情報を種類分け
し、数値順に整理して提示し、その中から使用者が文書
検索を行うものである。この場合、元号や西暦,12時
間制や24時間制,通貨単位,半角や全角,英数字や漢
数字などが混在しており、同一種類の情報が異なる表現
形式をとっていても、形式の変換を行い表現形式を統一
し本文内で異なる表現を用いた場合でも、本来の大小関
係によって数値情報を集中させて表示することにより、
使用者は、数値情報の大小関係だけで容易に検索が可能
となる。
【0064】請求項3,7に対応する効果:上記請求項
1,5に対応する効果に、さらに、上記請求項2,6に
対応する効果を加えることにより、文書検索がより容易
になる。
【0065】請求項4,8に対応する効果:上記請求項
1ないし3及び請求項5ないし7の効果に加えて、文書
に付属している属性情報をもとにして不完全な数値情報
を補完することで、検索用に提示される情報を本来ある
べき所に完全な形式で集中させ、より整理された形で見
ることができ、文書検索がさらに容易になり、有効な実
用化手段が提供される。
【0066】請求項9,10に対応する効果:請求項1
ないし4のいずれかに記載の文書検索装置を構成する手
段を動作させ、請求項5ないし8のいずれかに記載の文
書検索方法を実行するためのプログラムをコンピュータ
読み取り可能な記録媒体に記録することで、プログラム
が保持された記録媒体を扱うコンピュータ等の情報処理
装置で、当該文書検索を実行することが可能になる。
【図面の簡単な説明】
【図1】本発明による文書検索装置の実施形態の概要を
示すブロック図である。
【図2】図1の装置による処理動作のプロセスを示すフ
ローチャートである。
【図3】一つのテキスト文書から抽出された数値情報が
複数ある場合に、その文書のサブジェクトを複数回表示
させる処理のフローチャートである。
【図4】本発明による文書検索装置の実施形態の概要を
示すブロック図である。
【図5】形式変換処理のフローチャートで数値情報が日
付の場合の処理である。
【図6】形式変換処理のフローチャートで数値情報が値
段等の数値の場合の処理である。
【図7】形式変換処理のフローチャートで数値情報が時
刻の場合の処理である。
【図8】情報補完処理のフローチャートを示す図であ
る。
【図9】形式変換処理及び情報補完処理を含む第2の実
施形態の処理全体のフローチャートを示す。
【図10】本発明による検索結果を示し、「日付」とい
う数値情報で並べ替えて表示した図である。
【符号の説明】
101,401…情報記録部、102,402…情報抽
出部、103,403…情報比較部、104,404…
表示部、105,407…指示入力部、405…形式変
換部、406…情報補完部。

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 情報記録手段に蓄積された検索対象のテ
    キスト文書群から数値ベースの情報である日付,時刻・
    時間,値段,電話番号などの数値情報を抽出する抽出手
    段と、検索結果として、該抽出手段より抽出した数値情
    報を含むテキスト文書について情報の種類分けをし数値
    順に表示する文書表示手段を有する文書検索装置であっ
    て、一つのテキスト文書から前記抽出手段により抽出さ
    れた複数の数値情報の異同を判断し、検索結果を前記文
    書表示手段に表示するにあたり、異なる数値情報の場合
    に該一つのテキスト文書を数値情報毎に複数回表示し、
    同じ数値情報の場合に一つのテキスト文書を1回だけ表
    示するための情報比較手段を備えることを特徴とする文
    書検索装置。
  2. 【請求項2】 情報記録手段に蓄積された検索対象のテ
    キスト文書群から数値ベースの情報である日付,時刻・
    時間,値段,電話番号などの数値情報を抽出する抽出手
    段と、検索結果として、該抽出手段より抽出した数値情
    報を含むテキスト文書について情報の種類分けをし数値
    順に表示する文書表示手段を有する文書検索装置であっ
    て、前記抽出手段により抽出された数値情報が同一の情
    報種類に対し複数の表現形式をとり、形式の変更を要す
    る情報であるかを判断し、表現形式の変更を要する場合
    に、該数値情報を統一的な表現形式へと変換を行う形式
    変換手段を備え、該形式変換手段により変換された表現
    形式の数値情報を含むテキスト文書を前記文書表示手段
    により表示することを特徴とする文書検索装置。
  3. 【請求項3】 前記抽出手段により抽出された数値情報
    が同一の情報種類に対し複数の表現形式をとり、形式の
    変更を要する情報であるかを判断し、表現形式の変更を
    要する場合に、該数値情報を統一的な表現形式へと変換
    を行う形式変換手段を備え、該形式変換手段により変換
    された表現形式の数値情報を含む文書を前記文書表示手
    段により表示することを特徴とする請求項1記載の文書
    検索装置。
  4. 【請求項4】 前記抽出手段により抽出された数値情報
    中の日付に省略がある場合に、省略された該日付に係わ
    るテキスト文書の属性情報を利用して該日付を補完する
    情報補完部を備えることを特徴とする請求項1ないし3
    のいずれか1記載の文書検索装置。
  5. 【請求項5】 蓄積された検索対象のテキスト文書群か
    ら数値ベースの情報である日付,時刻・時間,値段,電
    話番号などの数値情報を抽出する抽出ステップと、検索
    結果として、該抽出ステップで抽出した数値情報を含む
    テキスト文書について数値情報の種類分けをし数値順に
    表示する文書表示ステップを有する文書検索方法であっ
    て、前記抽出ステップにより一つの文書から抽出された
    複数の数値情報の異同を判断し、前記文書表示ステップ
    において検索結果を表示するにあたり、異なる数値情報
    と判断される場合に該一つの文書を数値情報毎に複数回
    表示し、同じ数値情報と判断される場合に一つの文書を
    1回だけ表示するための文書ソート処理ステップを備え
    ることを特徴とする文書検索方法。
  6. 【請求項6】 蓄積された検索対象のテキスト文書群か
    ら数値ベースの情報である日付,時刻・時間,値段,電
    話番号などの数値情報を抽出する抽出ステップと、検索
    結果として、該抽出ステップで抽出した数値情報を含む
    テキスト文書について数値情報の種類分けを数値順に表
    示する文書表示ステップを有する文書検索方法であっ
    て、前記抽出ステップで抽出された数値情報が同一の情
    報種類に対し複数の表現形式をとる情報であり、かつ形
    式の変更を必要とする情報かを判断し、表現形式の変更
    を必要とする場合に該数値情報を統一的な表現形式へと
    変換を行う形式変換処理ステップを備え、該形式変換処
    理ステップにより変換された表現形式の数値情報を含む
    テキスト文書を前記文書表示ステップにより表示するこ
    とを特徴とする文書検索方法。
  7. 【請求項7】 前記抽出ステップで抽出された数値情報
    が同一の情報種類に対し複数の表現形式をとる情報であ
    り、かつ形式の変更を必要とする情報かを判断し、表現
    形式の変更を必要とする場合に該数値情報を統一的な表
    現形式へと変換を行う形式変換処理ステップを備え、該
    形式変換処理ステップにより変換された表現形式の数値
    情報を含むテキスト文書を前記文書表示ステップにより
    表示することを特徴とする請求項5載の文書検索方法。
  8. 【請求項8】 前記抽出ステップで抽出された数値情報
    中の日付に省略がある場合に、省略された該日付に係わ
    るテキスト文書の属性情報を利用して該日付を補完する
    情報補完処理ステップを備えることを特徴とする請求項
    5ないし7のいずれか1記載の文書検索方法。
  9. 【請求項9】 請求項1ないし4のいずれか1記載の文
    書検索装置を構成する手段を動作させ、検索機能を実行
    するためのプログラム及びデータを記録したコンピュー
    タ読み取り可能な文書検索プログラムを記録した記録媒
    体。
  10. 【請求項10】 請求項5ないし8のいずれか1記載の
    文書検索方法を実行するためのプログラム及びデータを
    記録したコンピュータ読み取り可能な文書検索プログラ
    ムを記録した記録媒体。
JP9292907A 1997-10-24 1997-10-24 文書検索装置および文書検索方法および文書検索プログラムを記録した記録媒体 Pending JPH11134342A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9292907A JPH11134342A (ja) 1997-10-24 1997-10-24 文書検索装置および文書検索方法および文書検索プログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9292907A JPH11134342A (ja) 1997-10-24 1997-10-24 文書検索装置および文書検索方法および文書検索プログラムを記録した記録媒体

Publications (1)

Publication Number Publication Date
JPH11134342A true JPH11134342A (ja) 1999-05-21

Family

ID=17787950

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9292907A Pending JPH11134342A (ja) 1997-10-24 1997-10-24 文書検索装置および文書検索方法および文書検索プログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JPH11134342A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001125995A (ja) * 1999-10-29 2001-05-11 Toshiba Corp 医用レポートシステム
JP2003099304A (ja) * 2001-09-20 2003-04-04 Fujitsu Ltd 複数の場所に登録された情報を管理するシステムおよび方法
JP2007122732A (ja) * 2005-10-25 2007-05-17 Internatl Business Mach Corp <Ibm> ウェブドキュメントの集合において効率的に日付を検索する方法、コンピュータプログラム、およびサービス方法(ウェブドキュメントの集合において効率的に日付を検索するシステムおよび方法)
JP2015090610A (ja) * 2013-11-06 2015-05-11 コヨミ株式会社 スケジュール登録プログラム、スケジュール登録装置、スケジュール登録方法及びスケジュール登録システム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05327762A (ja) * 1992-05-18 1993-12-10 Ricoh Co Ltd 電子メールシステム
JPH06342409A (ja) * 1993-06-01 1994-12-13 Kobe Steel Ltd 電子メール管理装置
JPH09269940A (ja) * 1996-03-29 1997-10-14 Sharp Corp 日時等を抽出する装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05327762A (ja) * 1992-05-18 1993-12-10 Ricoh Co Ltd 電子メールシステム
JPH06342409A (ja) * 1993-06-01 1994-12-13 Kobe Steel Ltd 電子メール管理装置
JPH09269940A (ja) * 1996-03-29 1997-10-14 Sharp Corp 日時等を抽出する装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001125995A (ja) * 1999-10-29 2001-05-11 Toshiba Corp 医用レポートシステム
JP4718658B2 (ja) * 1999-10-29 2011-07-06 株式会社東芝 医用レポートシステム
JP2003099304A (ja) * 2001-09-20 2003-04-04 Fujitsu Ltd 複数の場所に登録された情報を管理するシステムおよび方法
JP2007122732A (ja) * 2005-10-25 2007-05-17 Internatl Business Mach Corp <Ibm> ウェブドキュメントの集合において効率的に日付を検索する方法、コンピュータプログラム、およびサービス方法(ウェブドキュメントの集合において効率的に日付を検索するシステムおよび方法)
JP2015090610A (ja) * 2013-11-06 2015-05-11 コヨミ株式会社 スケジュール登録プログラム、スケジュール登録装置、スケジュール登録方法及びスケジュール登録システム

Similar Documents

Publication Publication Date Title
CN102959578B (zh) 取证系统、取证方法及取证程序
US6023528A (en) Non-edit multiple image font processing of records
JP4129048B2 (ja) 固有表現抽出装置、方法、及びプログラム
CN113987212A (zh) 一种数控加工领域工艺数据的知识图谱构建方法
JP5302759B2 (ja) 文書作成支援装置、文書作成支援方法及び文書作成支援プログラム
WO1989002118A1 (en) Data processing apparatus and editing apparatus using the same
JP2006091994A (ja) 文書情報処理装置および方法、文書情報処理プログラム
JP4931114B2 (ja) データ表示装置、データ表示方法及びデータ表示プログラム
JP2023015766A (ja) 検索装置、検索方法及び検索プログラム
JPH11134342A (ja) 文書検索装置および文書検索方法および文書検索プログラムを記録した記録媒体
JP3864687B2 (ja) 情報分類装置
JP2001216311A (ja) イベント分析装置、及びイベント分析プログラムが格納されたプログラム装置
JPH11110409A (ja) 情報分類方法及び装置
JPH0581326A (ja) データベース検索装置
JPH0236019B2 (ja)
JP2005321849A (ja) データ分析支援プログラム、データ分析支援方法、およびデータ分析支援装置
JP7160432B2 (ja) 画像処理装置、画像処理方法、プログラム
JPH0782497B2 (ja) 文書処理装置
JP2008123423A (ja) 電文データの監査用保管・検索システム、電文データの監査用保管・検索方法、および電文データの監査用保管・検索プログラム
JP3543726B2 (ja) 書籍などの検索を支援する知識検索サービス方法および装置
JP3660423B2 (ja) 関連除籍一括検索方法及びシステム
JP2001184351A (ja) 文書情報抽出装置および文書分類装置
JPS63175965A (ja) 文書処理装置
JPH07302347A (ja) グラフ生成装置
JP3210842B2 (ja) 情報処理装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040217