JP4361655B2 - 文章入力装置及び記録媒体 - Google Patents

文章入力装置及び記録媒体 Download PDF

Info

Publication number
JP4361655B2
JP4361655B2 JP2000000556A JP2000000556A JP4361655B2 JP 4361655 B2 JP4361655 B2 JP 4361655B2 JP 2000000556 A JP2000000556 A JP 2000000556A JP 2000000556 A JP2000000556 A JP 2000000556A JP 4361655 B2 JP4361655 B2 JP 4361655B2
Authority
JP
Japan
Prior art keywords
related information
sentence
expression
generality
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000000556A
Other languages
English (en)
Other versions
JP2001195399A (ja
Inventor
亮 落谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2000000556A priority Critical patent/JP4361655B2/ja
Publication of JP2001195399A publication Critical patent/JP2001195399A/ja
Application granted granted Critical
Publication of JP4361655B2 publication Critical patent/JP4361655B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は文章入力装置及び記録媒体に関する。一般に、広い範囲の読み手を対象にした文章を書く際には、読者の理解を助けるために、或る事物がこれまでどういう風に表現されてきたのか、同様のものは何があるのかなどの情報を参照し、作成中の文章に表現して行く必要が頻繁に生じる。
【0002】
例えば、新聞記事のような文章を書く場合を考えると、ある会社について書く際に「XX社」とだけ書くと判りづらいが、修飾語句として「旅行業大手のXX社」等と修飾語句を補って表現することで、XX社を直接知らない読者でも少しは内容を理解できるような文章にすることができる。
【0003】
また、「○○業界第2位のYY社」というような時間の経過に従って、変動し易い表現を文章中に記述する場合には、YY社が何時の時点で業界2位であったか、最近も同じように扱われているのかを、他の文書情報から調べた上で文章を書く必要が生じる。従って、文章入力作業は、手間と時間のかかる作業であり、このような文章入力時の作業を軽減する技術の開発が要望されていた。
【0004】
【従来の技術】
以下、従来例を説明する。文章入力装置における従来の技術では、文書執筆中に書こうとしている特定の事物に関する情報、例えば、特定の人物や企業に関する情報など、を調べ、比較し、さらに結果を文章中に表現していくような場合、文書データベースシステムの利用が一般的である。
【0005】
しかし、データベース検索の場合には、入力キーワードを検索システムに入力し、検索処理を起動する必要があり、また、検索結果から執筆者が手作業でコピーし、修正し、作成中の文章へ取り入れる必要があり、文章入力中に簡単に利用できるようにはなっていなかった。
【0006】
一方、文章入力の手間を削減するために、文章中に自動的に表現を挿入するための手段が以下のように提案されている。
【0007】
▲1▼:手紙文等の導入表現など、非常に限定された慣用表現を予め用意し、執筆時の状況や執筆者の指示により文章中に埋め込む。
【0008】
▲2▼:語句の最初の部分文字列の入力を受けた後、後続の連続文字列の補完、予測を行う。
【0009】
▲3▼:文章の特徴を元に単語を推定する。
【0010】
▲4▼:語彙の出現確率や予測確率の組み合わせにより、次の語を予測する。
【0011】
【発明が解決しようとする課題】
前記のような従来のものにおいては、次のような課題があった。すなわち、前記▲1▼の方法では、予め様々な状況を想定して慣用表現を用意する必要があり、用意できる慣用表現の量も少なく、想定できる状況も非常に限られたものになってしまう。また、前記▲2▼の方法では、執筆者が先頭の何文字かを思い浮かべ入力しなければならず、補完できる表現も連続した文字列に限られてしまう。
【0012】
前記▲3▼の方法では、入力途中の文章や文章全体の文章の特徴では、推定のできる単語の候補が十分絞り込めない。前記▲4▼の方法では、逆に、2、3語程度の語の組み合わせ確率を用いるが、語数の文脈から予測できる語も候補が非常に多くなってしまう。
【0013】
本発明はこのような従来の課題を解決し、既存の文章データベースから表現の典型度の高い情報を抽出しておき、文章執筆時にはその抽出情報を利用して、執筆者に知識が無い場合でも、このような関連情報や典型的な修飾表現方法を執筆者に自動的に一覧表示し、執筆者が一覧から必要な表現を選択することにより、文章中に挿入したり、最大の挿入量など予め設定した挿入条件に従って、自動挿入する機能を実現することを目的とする。
【0014】
【課題を解決するための手段】
本発明は前記の目的を達成するため、次のように構成した。
【0015】
(1) :文章入力装置において、文章データ中から互いに関連する関連情報及び文章の表す時刻情報を抽出し、関連情報を時刻情報と共に蓄積する第1の関連情報抽出手段と、文章データ中から互いに関連する関連情報を抽出し、該関連情報の出現頻度を求め、関連情報と該関連情報が示す一般度判定係数とを関連付けて持つ一般度判定パターンと該抽出した関連情報とから一般度判定係数を求め、該求めた出現頻度と該求めた一般度判定係数とから該抽出した関連情報の一般度を求めて、該抽出した関連情報と該求めた一般度と共に蓄積する第2の関連情報抽出手段を備えている(第1、第2の関連情報抽出手段は、図1の抽出フェーズの各手段)。
【0017】
(2) :前記(1) の文章入力装置において、文章の編集中に、文章中の表現に対し、前記第2の関連情報抽出手段で蓄積した関連情報と照合し、一致する部分を含む関連情報を出現頻度と一般度から計算した優先度の順に表示する第3の文章作成編集手段を備えている。
【0018】
(3) :前記(1) の文章入力装置において、文章の入力、編集中に、文章中の表現に対し前記第1の関連情報抽出手段で蓄積した関連情報と照合し、一致する部分を含む関連情報を時刻順に表示し、利用者に選択された関連表現を文章中に埋め込む第4の文章作成編集手段と、文章の入力、編集中に、文章中の表現に対し前記第2の関連情報抽出手段で蓄積した関連情報と照合し、一致する部分を含む関連情報を出現頻度と一般度から計算した優先度の順に表示し、利用者に選択された関連表現を文章中に埋め込む第5の文章作成編集手段を備えている。
【0019】
(4) :前記(1) の文章入力装置において、文章の入力、編集中に、文章中の表現に対し前記第1の関連情報抽出手段で蓄積した関連情報を、利用者が定めた量的な挿入条件を満たす範囲で、時刻順の優先度の高いものから順に自動的に文章中へ埋め込む第6の文章作成編集手段と、文章の入力、編集中に、文章中の表現に対し前記第2の抽出手段で蓄積した関連情報と照合し、一致する部分を含む関連情報を、利用者が定めた量的な挿入条件を満たす範囲で、出現頻度と一般度から計算した優先度の高いものから順に自動的に文章中へ埋め込む第7の文章作成編集手段を備えている(前記第1〜第7の文章作成編集手段は、図2の文章作成編集フェーズの各手段)。
【0020】
(5) :文章入力装置を構成するコンピュータ装置を、文章データ中から互いに関連する関連情報及び文章の表す時刻情報を抽出し、該関連情報を時刻情報と共に蓄積する第1の関連情報抽出手段と、文章データ中から互いに関連する関連情報を抽出し、該関連情報の出現頻度を求め、関連情報と該関連情報が示す一般度判定係数とを関連付けて持つ一般度判定パターンと該抽出した関連情報とから一般度判定係数を求め、該求めた出現頻度と該求めた一般度判定係数とから該抽出した関連情報の一般度を求めて、該抽出した関連情報と該求めた一般度と共に蓄積する第2の関連情報抽出手段として機能させるプログラムを記録したコンピュータ読み取り可能な記録媒体。
【0021】
(作用)
前記構成に基づく本発明の作用を、図1に基づいて説明する。
【0022】
(a) :前記(1) では、第1の関連情報抽出手段は、文章データ中から互いに関連する関連情報及び文章の表す時刻情報を抽出し、関連情報を時刻情報と共に蓄積する。また、第2の関連情報抽出手段は、文章データ中から互いに関連する関連情報を抽出し、該関連情報の出現頻度を求め、関連情報と該関連情報が示す一般度判定係数とを関連付けて持つ一般度判定パターンと該抽出した関連情報とから一般度判定係数を求め、該求めた出現頻度と該求めた一般度判定係数とから該抽出した関連情報の一般度を求めて、該抽出した関連情報と該求めた一般度と共に蓄積する。
【0024】
(b) :前記(2) では、第3の文章作成編集手段は、文章の編集中に、文章中の表現に対し、第2の関連情報抽出手段で蓄積した関連情報と照合し、一致する部分を含む関連情報を出現頻度と一般度から計算した優先度の順に表示する。
【0025】
(c) :前記(3) では、第4の文章作成編集手段は、文章の入力、編集中に、文章中の表現に対し第1の関連情報抽出手段で蓄積した関連情報と照合し、一致する部分を含む関連情報を時刻順に表示し、利用者に選択された関連表現を文章中に埋め込む。
【0026】
また、第5の文章作成編集手段は、文章の入力、編集中に、文章中の表現に対し第2の関連情報抽出手段で蓄積した関連情報と照合し、一致する部分を含む関連情報を出現頻度と一般度から計算した優先度の順に表示し、利用者に選択された関連表現を文章中に埋め込む。
【0027】
(d) :前記(4) では、第6の文章作成編集手段は、文章の入力、編集中に、文章中の表現に対し第1の関連情報抽出手段で蓄積した関連情報を、利用者が定めた量的な挿入条件を満たす範囲で、時刻順の優先度の高いものから順に自動的に文章中へ埋め込む。
【0028】
また、第7の文章作成編集手段は、文章の入力、編集中に、文章中の表現に対し第2の抽出手段で蓄積した関連情報と照合し、一致する部分を含む関連情報を、利用者が定めた量的な挿入条件を満たす範囲で、出現頻度と一般度から計算した優先度の高いものから順に自動的に文章中へ埋め込む。
【0029】
(e) :前記(5) では、文章入力装置が記録媒体のプログラムを読み出して実行することにより、文章データ中から互いに関連する関連情報及び文章の表す時刻情報を抽出し、関連情報を時刻情報と共に蓄積する。また、文章データ中から互いに関連する関連情報を抽出し、該関連情報の出現頻度を求め、関連情報と該関連情報が示す一般度判定係数とを関連付けて持つ一般度判定パターンと該抽出した関連情報とから一般度判定係数を求め、該求めた出現頻度と該求めた一般度判定係数とから該抽出した関連情報の一般度を求めて、該抽出した関連情報と該求めた一般度と共に蓄積する処理を実行する。
【0030】
以上のように、既存の文章データベースから表現の典型度の高い情報を抽出しておき、文章執筆時にはその抽出情報を利用して、執筆者に知識が無い場合でも、関連情報や典型的な修飾表現方法を執筆者に自動的に一覧表示し、執筆者が一覧から必要な表現を選択することにより、文章中に挿入したり、最大の挿入量など予め設定した挿入条件に従って、自動挿入する機能を実現できる。
【0031】
すなわち、本文章入力装置によれば、既存の文章で良く使われる関連情報を文章の入力、編集中に参照することができるようになり、修飾表現などの執筆が容易になる。修飾表現の新旧など更新による変化も入力中に知ることができ、最新の情報の利用や、過去のある時点での情報の利用も図ることができる。
【0032】
また、自動的に適切な量の修飾表現を文章に挿入することや、修飾表現の中から適切と思われるものを選ぶ操作だけで、文章に挿入することが可能であり、タイプ入力の手間を省き、誤字脱字などの入力ミスを減少させる効果がある。文書中のある表現と関連する部分の情報をキーにして、表現と比較の対象になる情報を表示する、比較情報を文章中に埋め込むことができる。
【0033】
【発明の実施の形態】
以下、本発明の実施の形態を図面に基づいて詳細に説明する。なお、以下の説明において、「時刻情報」は、時、分、秒等の時刻情報だけでなく、年月日、及び時刻(時、分、秒等)を含む。
【0034】
§1:文章入力装置の概要説明
本実施の形態における文章入力装置は、大量の既存文書の中にある慣用表現の表現パターンのバリエーションをカバーする抽出規則により、新聞記事のような文章から慣用的な表現(例えば、人物に関する「小説家の○○氏」、企業に関する「大手電機メーカの○○社」など)から、関連情報(例えば、人物では名前、職業、身分、役職など、企業では社名、業種、規模など)を抽出し、文章入力時に執筆時に、これら既存の情報を容易に参照可能とする。
【0035】
更に、入力、編集中の文章を解析することにより、関連情報を検索するキーとなる表現を自動的に発見し、抽出保存してある関連情報の検索、表示、文章への自動挿入を可能とする。また、抽出された関連情報の表現の使用頻度などから表現の一般度の判断を可能にし、また、関連情報を出現時刻と対応付けることで、関連情報の変化履歴を文章中に示すことを可能とする。このため、文章入力装置は、次の各手段を備えている。
【0036】
(1) :文章データ中から互いに関連する情報及び文章の表す時刻情報を抽出し、それらの関連情報を時刻情報と共に蓄積する手段を備えている。
【0037】
(2) :文章データ中から互いに関連する情報を抽出し、文章データ中での関連表現の出現頻度とその表現から決める一般性の度合い(一般度)と共に蓄積する手段を備えている。
【0038】
(3) :文章の入力、編集中に、文章の表現に対し、前記(1) で蓄積した関連情報と照合し、一致する場合を含む関連情報を時刻順に表示する手段、及び、同一関連情報が継続する期間を表示する手段を備えている。
【0039】
(4) :文章の編集中に、文章中の表現に対し、前記(2) で蓄積した関連情報と照合し、一致する部分を含む関連情報を出現頻度と一般度から計算した優先度の順に表示する手段を備えている。
【0040】
(5) :文章の入力、編集中に、文章中の表現に対し前記(1) で蓄積した関連情報と照合し、一致する部分を含む関連情報を時刻順に表示し、利用者に選択された関連表現を文章中に埋め込む手段を備えている。
【0041】
(6) :文章の入力、編集中に、文章中の表現に対し前記(2) で蓄積した関連情報と照合し、一致する部分を含む関連情報を出現頻度と一般度から計算した優先度の順に表示し、利用者に選択された関連表現を文章中に埋め込む手段を備えている。
【0042】
(7) :文章の入力、編集中に、文章中の表現に対し前記(1) で蓄積した関連情報を、利用者が定めた量的な挿入条件を満たす範囲で、時刻順の優先度の高いものから順に自動的に文章中へ埋め込む手段を備えている。
【0043】
(8) :文章の入力、編集中に、文章中の表現に対し前記(2) で蓄積した関連情報を照合し、一致する部分を含む関連情報を、利用者が定めた量的な挿入条件を満たす範囲で、出現頻度と一般度から計算した優先度の高いものから順に自動的に文章中へ埋め込む手段を備えている。
【0044】
§2:文章入力装置の具体的な構成の説明
図1は文章入力装置の説明図1(抽出フェーズ)、図2は文章入力装置の説明図2(文章作成編集フェーズ)を示す。
【0045】
図1、2に示したように、文章入力装置には、時刻情報を抽出する時刻情報抽出部P1と、関連情報を抽出する関連情報抽出部P2と、一般度を計算する一般度計算部P12と、文章入力処理を行う文章入力処理部P3と、文章の表示処理を行う文章表示部P4と、入力文章の解析と抽出を行う入力文章解析・抽出部P5と、関連情報を検索する関連情報検索部P6と、検索結果の整列を行う検索結果整列部P7と、関連情報を表示する関連情報表示部P8と、ユーザの選択処理を行うユーザ選択部P9と、文章への自動挿入処理を行う自動挿入処理部P10と、関連情報を自動的に選択する関連情報自動選択部P11の各処理手段を備えている。なお、前記各処理手段は、それぞれプログラムの実行により実現される手段である。
【0046】
また、文章入力装置には、パターン照合規則R1と、一般度判定パターンR2と、挿入パターン規則R3の各ルールデータを備えている。更に、文章入力装置には、文書データベースD1と、時刻情報付き文書データD2と、関連情報抽出結果D3と、処理対象文章D4と、抽出結果データD5と、関連情報検索結果D6と、関連情報候補D7と、挿入対象関連情報D8等の文章入力・編集時のデータ(処理途中のデータ)を有する。
【0047】
前記構成により、文章入力装置では、既存の多量の文章から特徴的な表現パターンを用いて、ある対象と、その対象に関連した情報や対象の修飾情報を予め抽出する。例えば、新聞記事等で、ある会社について文章中に記述する場合、その前後に、業種、規模、代表者、所在地、資本金等の情報が、例えば、「旅行業大手のAA(社長XX、東京都新宿区)」のように慣用的に定着した表現に従って書かれていることが多く、このような表現からパターン処理による情報抽出処理により、業種、規模、企業名などの情報を抽出しておくことができる。
【0048】
文章入力装置では、このような抽出情報を用いて、文章を入力中に「旅行業大手の」と書かれた場合に、後ろに来る「AA社」、「BB社」等の会社名候補を推測し、会社名の表現される率や、知名度の順に関連情報を並べて表示する機能を備えている。
【0049】
また、逆に、会社名だけを入力した場合に、その前後に挿入可能な関連情報を優先度順に表示し、利用者の指示により文章を挿入する機能を持つ。更に、文章を解析し、関連情報の存在する全ての表現に対し、利用者が設定した文章の長さなどの条件を満たす範囲で、自動的に修飾表現を追加する機能を備えている。
【0050】
§3:文章入力装置の処理機能の説明
以下、図1、図2に基づいて、文章入力装置の具体的な処理機能を説明する。文章入力装置の処理機能は、既存の文書データベースの中から関連情報を抽出し検索可能な形式に変換する関連情報データ抽出フェーズ(単に、「抽出フェーズ」とも記す)の処理(図1参照)と、抽出された関連情報を利用して文章の作成や編集処理を行う文章作成編集フェーズの処理(図2参照)に大きく処理が別れる。各フェーズの処理は次の通りである。
【0051】
(1) :抽出フェーズでは、時刻情報抽出部P1は、既存の文書データベースD1から文書を取り出し、文章表現(文章中に書かれた日付、時刻など)や、文書情報(作成日付)から文章の内容が指す日付を推定し、時刻情報付き文章データD2を作成する。
【0052】
時刻情報抽出部P1の処理の流れを図3、図4に示す。関連情報抽出部P2では、図11のA図で示す内容を記述したパターン照合規則R1により、関連情報(例えば、会社名、規模、業種などの企業情報)を抽出し、関連情報抽出結果D3とする。関連情報抽出部P2の処理を図5に示す。
【0053】
一般度計算部P12は、関連情報抽出結果D3の出現頻度を計算し、図11のB図に示すような形式の一般度判定パターンR2に表現を照合することで一般度判定係数を求め、出現頻度と掛け合わせることで関連情報の一般度を推定し、時刻情報と共に、図11のC図に示す内容の関連情報データベースD9に蓄積する。図6に一般度計算部の処理の流れを示す。
【0054】
(2) :抽出された関連情報を利用した文章作成編集フェーズでは、キーボードからの入力やファイルやネットワークから来るデータを、文章入力処理部P3で取り込み、処理対象文章D4とし、入力文章解析・抽出部P5は、処理対象文章D4の文章データを解析し、入力中に企業名や企業規模表現など先の抽出フェーズで用意した関連情報へのトリガーとなる表現を抽出し、関連情報検索部P6へ抽出結果データD5を送り、関連情報検索部P6は、関連情報データベースD9の検索を行う。関連情報検索部P6の処理の流れを図8のA図に示す。
【0055】
検索された関連情報は、検索結果整列部P7で過去における表現の時刻順、優先度の2つの尺度の順に並べられ、関連情報表示部P8へ送られ、関連情報表示ウィンドウ(W2)上に表示される。これらの関連情報を、文章中に挿入するにあたっては、利用者(ユーザ)が直接選択することにより関連情報を選ぶ場合は、ユーザ選択部P9に利用者の表示情報が与えられ、ユーザに指示された関連情報が選ばれ挿入対象関連情報D8とされる。
【0056】
利用者が挿入量に従って自動的に挿入情報を選ぶ場合には、関連情報自動選択部P11が処理対象文章に対して、挿入可能な条件を満たす関連情報候補D7の中から量的な条件を満たす範囲で関連情報を選択し、挿入対象関連情報D8とする。関連情報自動選択部P11の処理の流れを図10に示す。
【0057】
自動挿入処理部P10では、挿入パターン規則R3により挿入すべき表現を生成し、処理対象文章D4に生成された表現を埋め込む。自動挿入処理部P10の処理を図8のB図に示す。文章の更新により文章表示部P4は、文章データ表示ウィンドウW1の表示内容を更新する。
【0058】
前記の処理により、既存の文章で良く使われる関連情報を文章の入力、編集中に参照することができるようになり、修飾表現などの執筆が容易になる。修飾表現の新旧など更新による変化も入力中に知ることができ、最新の情報の利用や、過去のある時点での情報の利用も図ることができる。
【0059】
また、自動的に適切な量の修飾表現を文章に挿入することや、修飾表現の中から適切と思われるものを選ぶ操作だけで、文章に挿入することが可能であり、タイプ入力の手間を省き、誤字脱字などの入力ミスを減少させる効果がある。文書中のある表現と関連する部分の情報をキーにして、表現と比較の対象になる情報を表示する、比較情報を文章中に埋め込むことができる。
【0060】
§4:具体例による処理の説明
以下、図面に基づいて、具体例による処理を説明する。
【0061】
(1) :処理例1
処理例1は、新聞記事の文書データベースD1を対象として関連情報を抽出する場合の抽出フェーズ(図1参照)の処理である。図12のB図に示すように、文書データベースD1中の既存の記事は、発行日付(発行日:1995年9月30日)を文書情報として持っており、文章中にも日付情報を含んでいる。
【0062】
時刻情報抽出部P1では、文章中の日付の省略を補うために、記事中の他の日付表現からの補完、及び文脈処理、記事発行日付による補完を行ない、図13のA図に示す時刻情報付き文書データD2を出力する。関連情報抽出部P2は、図13のB図に示した抽出パターン規則に従って、図14のA図に示すような関連情報、及び時刻情報の組を関連情報データベースD9へ出力する。
【0063】
(2) :処理例2
処理例2は、会社名などの文章作成編集フェーズ(図2参照)の処理である。キーボードからの入力(ネットワークからの文書ファイル転送などの入力の場合も同様)により、図14のC図に示す処理対象文章が作成、編集され、その結果は、文章表示部P4により直ちに文章データ表示ウィンドウW1上に表示される。
【0064】
処理対象文章D4に対し、入力文章解析・抽出部P5は、企業名や人名、および関連情報の抽出処理を行ない、関連情報検索を行うべき要素である抽出結果データD5を抽出する。例では、解析の結果、会社名「JN信用金庫」、「DK銀行」の2つの企業名が選ばれる。これらは元々関連情報検索部P6が、関連情報抽出結果D3を含む関連情報データベースD9の検索を行い、関連情報検索結果D6を検索結果整列部P7へ送る。
【0065】
検索結果整列部P7は、時刻順に出力の場合には、関連情報を出現時期に従って並べ替えた後、図15のB図のように関連情報表示ウィンドウW2へ表示する。優先度順の場合は、関連情報の一般度判定パターンR2と照合され、出現頻度と一般度から優先順位が計算され、図16のA図、B図の様に、優先度の高い順に関連情報表示ウィンドウW2へ表示される。
【0066】
処理対象文章に対しての挿入を行う場合は、関連情報自動選択部P11により、優先度の高い情報から挿入可能性の判定が行われ、処理対象文章と情報の重複がない候補が、挿入条件として設定された文字量の上限を超えない範囲で図17のA図のように選ばれる。この結果を、挿入条件パターンと挿入候補位置の推測結果位置に自動挿入処理部P10で書き込み、処理対象文章が、図17のC図のように更新される。
【0067】
§5:抽出フェーズの詳細な処理の説明
(1) :時刻情報抽出部P1の処理
図3は時刻情報抽出部の処理フローチャート(その1)、図4は時刻情報抽出部の処理フローチャート(その2)である。以下、図3、図4に基づいて、時刻情報抽出部P1の処理を説明する。なお、図3、図4において、S1〜S23は各処理ステップを示す。
【0068】
時刻情報抽出部P1は、文書データベースD1から文章データを取り出すと、該文章の発行年月日、時刻を取り出し(S1)、文章を「。」で区切り、文を取り出す(S2)。そして、文が年表現を含むかどうかを判断し(S3)、文が年表現を含まなければ、文が月表現を含むかどうかを判断する(S7)。
【0069】
また、前記S3の処理で、文が年表現を含めば、年が具体的な数値かどうかを判断する(S4)。その結果、年が具体的な数値ならば、その数値を年の値として(S5)、S7の処理へ移行し、年が具体的な数値でなければ、年表現→数値変換規則により、年表現を数値化して(S6)、S7の処理へ移行する。
【0070】
次に、S7の処理で、文が月表現を含まなければ、文が日表現を含むかどうかを判断する(S11)。また、S7の処理で、文が月表現を含めば、月が具体的な数値かどうかを判断する(S8)。その結果、月が具体的な数値であれば、その数値を月の値として(S9)、S11の処理へ移行し、月が具体的な数値でなければ、月表現→数値変換規則により、月表現を数値化して(S10)、S11の処理へ移行する。
【0071】
次に、S11の処理で、文が日表現を含まなければ、文が時表現を含むかどうかを判断する(S15)。また、S11の処理で、文が日表現を含めば、日が具体的な数値かどうかを判断する(S12)。その結果、日が具体的な数値であれば、その数値を日の値として(S13)、S15の処理へ移行し、日が具体的な数値でなければ、日表現→数値変換規則により、日表現を数値化して(S14)、S15の処理へ移行する。
【0072】
次に、S15の処理で、文が時表現を含まなければ、文が分表現を含むかどうかを判断する(S19)。また、S15の処理で、文が時表現を含めば、時が具体的な数値かどうかを判断する(S16)。その結果、時が具体的な数値であれば、その数値を時の値として(S17)、S19の処理へ移行し、時が具体的な数値でなければ、時表現→数値変換規則により、時表現を数値化して(S18)、S19の処理へ移行する。
【0073】
次に、S19の処理で、文が分表現を含まなければ、文が年、月、時、分の値を原文章情報に付加して(S23)、時刻情報付き文章データを出力する。また、S19の処理で、文が分表現を含めば、分が具体的な数値かどうかを判断する(S20)。その結果、分が具体的な数値であれば、その数値を分の値として(S21)、S23の処理へ移行し、分が具体的な数値でなければ、分表現→数値変換規則により、分表現を数値化して(S22)、S23の処理へ移行する。
【0074】
(2) :関連情報抽出部P2の処理
図5は関連情報抽出部の処理フローチャートである。以下、図5に基づいて、関連情報抽出部P2の処理を説明する。なお、図5において、S31〜S37は各処理ステップを示す。
【0075】
関連情報抽出部P2は、時刻情報付き文書データD2から、文章中の文を取り出す(S31)。そして、パターン照合規則R1から抽出規則を順に取り出して照合し(S32)、文中の表現と照合したかどうかを判断する(S33)。その結果、文中の表現と照合しなければ、抽出規則の最後まで照合したかどうかを判断し(S36)、最後まで照合しない場合は、前記S32の処理へ移行する。
【0076】
また、前記S33の処理で、文中の表現と照合したら、関連情報があるかどうかを判断し(S34)、関連情報がなければS36の処理へ移行し、関連情報があれば、関連情報を取り出し(S35)、S36の処理へ移行する。次に、S36の処理で抽出規則の最後まで照合した場合は、文章中の文を全て処理したかどうかを判断し(S37)、全て処理していない場合はS31の処理へ移行し、全て処理した場合は、関連情報抽出結果D3を出力してこの処理を終了する。
【0077】
(3) :一般度計算部P12の処理
図6は一般度計算部の処理フローチャートである。以下、図6に基づいて一般度計算部P12の処理を説明する。なお、図6において、S41〜S45は各処理ステップを示す。
【0078】
一般度計算部P12は、関連情報抽出結果D3から、関連情報毎に同じ関連情報の出現頻度を計算し(S41)、関連情報を順に取り出す(S42)。そして、関連情報の要素で一般度判定パターンR2を検索し、最大の一般度判定係数を選ぶ(S43)。次に、一般度計算部P12は、関連情報の一般度を、一般度係数×関連情報の頻度の計算式により計算し(S44)、関連情報全てを処理したかどうかを判断する(S45)。
【0079】
その結果、関連情報全てを処理していなければ、前記S42の処理へ移行し、関連情報全てを処理したら、関連情報の一般度の計算結果を関連情報データベースD9へ出力して、この処理を終了する。
【0080】
§6:文書作成編集フェーズの詳細な処理の説明
(1) :入力文章解析・抽出部P5の処理
図7は入力文章解析・抽出部の処理フローチャートである。以下、図7に基づいて、入力文章解析・抽出部P5の処理を説明する。なお、図7において、S51〜S57は各処理ステップを示す。
【0081】
入力文章解析・抽出部P5は、処理対象文章D4(入力中の文章データから、文章中の文を取り出し(S51)、抽出規則を順に取り出して照合する(S52)。そして、文中の表現と照合するかどうかを判断する(S53)。その結果、文中の表現と照合しなければ、抽出規則の最後まで照合したかどうかを判断し(S56)、抽出規則の最後まで照合していなければ、前記S52の処理へ移行する。
【0082】
また、S53の処理で、文中の表現と照合すれば、関連情報があるかどうかを判断し(S54)、関連情報がなければS56の処理へ移行し、関連情報があれば、関連情報を取り出し(S55)、S56の処理へ移行する。また、S56の処理で、抽出規則の最後まで照合したら、文章中の文を全て処理したかどうかを判断し(S57)、全て処理していなければS51の処理へ移行し、全て処理したら、抽出結果データD5を出力してこの処理を終了する。
【0083】
(2) :関連情報検索部P6の処理
図8のA図は関連情報検索部P6の処理フローチャートである。以下、図8のA図に基づいて、関連情報検索部P6の処理を説明する。なお、図8のA図において、S61〜S63は各処理ステップを示す。
【0084】
関連情報検索部P6は、抽出結果データD5から関連情報要素を取り出し(S61)、取り出した関連情報要素を関連情報データベースD9中で検索し(S62)関連情報要素は全て検索したかどうかを判断する(S63)。その結果、関連情報要素を全て検索していなければ、S61の処理へ移行する。また、関連情報要素を全て検索したら、関連情報検索結果D6を出力して、この処理を終了する。
【0085】
(3) :自動挿入処理部P10の処理
図8のB図は自動挿入処理部の処理フローチャートである。以下、図8のB図に基づいて、自動挿入処理部P10の処理を説明する。なお、図8のB図において、S71〜S74は各処理ステップを示す。
【0086】
自動挿入処理部P10は、挿入対象関連情報D8を取り込み、挿入パターン規則R3を一つ取り出す(S71)。そして、挿入パターン規則の適用条件の全てについて、条件を満たす関連情報があるかどうかを判断し(S72)、条件を満たす関連情報があれば、挿入対象に合わせて関連情報要素を処理対象文章D4に埋め込み(S74)、この処理を終了する。
【0087】
また、S72の処理で、条件を満たす関連情報がなければ、挿入パターン規則R3を全てチェックしたかどうかを判断し(S73)、全てチェックしていなければ、S71の処理へ移行し、全てチェックしたら、この処理を終了する。
【0088】
(4) :検索結果整列部P7の処理
図9は検索結果整列部の処理フローチャートである。以下、図9に基づいて、検索結果整列部P7の処理を説明する。なお、図9において、S81〜S91は各処理ステップを示す。
【0089】
検索結果整列部P7は、関連情報検索結果D6が時間順出力かどうかを判断し(S81)、時間順出力ならば、検索結果の関連情報を時間順に並べて(S91)、関連情報候補D7を出力し、この処理を終了する。しかし、S81の処理で、時間順出力でなければ、関連情報検索結果D6中の候補を順に取り出し(S82)、優先度=0とし(S83)、関連情報要素を順に取り出す(S84)。
【0090】
そして、前記取り出した関連情報要素が一般度判定パターンR2に含まれるかどうかを判断し(S85)、一般度判定パターンR2に含まれない場合は、関連情報要素を全てチェックしたかどうかを判断する(S87)。また、S85の処理で、一般度判定パターンに含まれる場合は、優先度を、優先度←優先度+一般度の演算により求め(S86)、S87の処理へ移行する。
【0091】
そして、S87の処理で、関連情報要素を全てチェックしていなければ、S84の処理へ移行し、全てチェックしたら、検索結果の候補中の優先度を、前記S86の処理で求めた優先度として(S88)、検索結果中の全ての候補に優先度を決定したかどうかを判断する(S89)。その結果、検索結果中の全ての候補に優先度を決定していなければ、S82の処理へ移行し、検索結果中の全ての候補に優先度を決定していれば、検索結果の関連情報を優先度順に並べ(S90)、関連情報候補D7を出力し、この処理を終了する。
【0092】
(5) :関連情報自動選択部P11の処理
図10は関連情報自動選択部の処理フローチャートである。以下、図10に基づいて、関連情報自動選択部P11の処理を説明する。なお、図10において、S101〜S110は各処理ステップを示す。
【0093】
関連情報自動選択部P11は、関連情報候補D7から優先度の高い関連情報を取り出し(S101)、更に、関連情報要素を取り出す(S102)。そして、関連情報要素は抽出結果データD5に含まれるかどうかを判断し(S103)、含まれていればS102の処理へ移行し、含まれていなければ、前記関連情報要素を挿入対象関連情報D8に加える(S104)。
【0094】
次に、挿入量指定条件は件数かどうかを判断し(S105)、件数なら、挿入対象関連情報D8の件数は指定の挿入件数以下かどうかを判断する(S106)。その結果、指定の挿入件数以下ならS102の処理へ移行し、指定の挿入件数以下でなければ、挿入対象関連情報D8を出力して、この処理を終了する。
【0095】
また、S105の処理で、挿入量指定条件が件数でなければ、挿入量指定条件は語数かどうかを判断し(S107)、語数なら、挿入対象関連情報D8の件数は指定の挿入語数以下かどうかを判断する(S108)。その結果、指定の挿入語数以下ならS102の処理へ移行し、指定の挿入語数以下でなければ、挿入対象関連情報D8を出力して、この処理を終了する。
【0096】
また、S107の処理で、挿入量指定条件が語数でなければ、挿入量指定条件は文字数かどうかを判断し(S109)、文字数なら、挿入対象関連情報D8の件数は指定の挿入文字数以下かどうかを判断する(S110)。その結果、指定の挿入文字数以下ならS102の処理へ移行し、指定の挿入文字数以下でなければ、挿入対象関連情報D8を出力して、この処理を終了する。
【0097】
§7:抽出フェーズ及び文章作成編集フェーズのその他の説明
図11〜図17は処理の具体例(その1)〜(その7)を示す。以下、これらの図を用いて、処理の具体例を説明する。
【0098】
(1) :パターン照合規則R1の記述
パターン照合規則R1の記述を図11のA図に示す。パターン集合規則R1には、例えば、図11のA図に示したような記述がある。この記述例としては、次のようなものである。
【0099】
「1.パターン名は[ ]で囲んで記述する。
【0100】
2.連続する表現を記述するパターンは、パターン名と表現文字列を繰り返し並べてパターン名::=パターン名または表現文字列、パターン名または表現文字列...のように記述する。
【0101】
3.パターンの候補はOR表現で、パターン名::={パターン名または表現文字列|パターン名または表現文字列|...}のように記述する。
【0102】
4.任意文字列に照合する表現は「*」で表す。」
(2) :一般度判定パターンR2
一般度判定パターンR2の例を図11のB図に示す。一般度判定パターンR2は、例えば、図11のB図に示すように、表現パターン1〜表現パターンnに対し、それぞれ一般度判定係数1〜一般度判定係数nが対応している。
【0103】
(3) :関連情報データベースD9
関連情報データベースD9の例を図11のC図に示す。関連情報データベースD9は、例えば、時刻情報1〜時刻情報nに対し、一般度1〜一般度nと、関連情報1〜関連情報nがそれぞれ対応している。
【0104】
(4) :挿入パターン規則R3
挿入パターン規則R3の例を図12のA図に示す。この例では、挿入パターン規則R3として、挿入条件1〜挿入条件nに対し、それぞれ、挿入表現1〜挿入表現nが対応している。この場合、挿入条件は、挿入すべき表現を組み立てるための関連情報要素の集合で、〔関連情報要素1〕,〔関連情報要素2〕,・・・〔関連情報要素n〕の形式で記述する。
【0105】
また、挿入表現は、関連情報要素の組み合わせ方を、〔関連情報要素1〕文字列表現〔関連情報要素m〕文字列表現,・・・〔関連情報要素z〕の様に関連情報要素と文字列表現の並びで記述する。
【0106】
(5) :記事データ例
文書データベースD1中の記事データ例を図12のB図に示す。この記事データ例は、発行日が1995年9月30日の新聞記事の例であり、発行日付を文書情報として持っている例である。
【0107】
(6) :時刻付き記事データの例
時刻付き記事データの例を図13のA図に示す。この例は、時刻情報付き文書データD2の例であり、時刻と文書データを対応させてある。例えば、時刻=1995/09/30の場合、文書データは「城南信金、預金総額3兆円超。」のようになっている。
【0108】
(7) :抽出パターン規則の例
関連情報抽出部P2が時刻情報付き文書データD2から関連情報を抽出する場合の抽出パターン規則(パターン照合規則R1中の規則)の例を図13のB図に示す。
【0109】
この例では、前記抽出パターン規則を、[組織関連情報]::=[業種表現][規模表現]の[企業名]([所在地]、[代表者表現])のようにする。この場合、[業種表現]::={[金融機関]|[製造業]|[販売業]}、[金融機関]::={銀行|信用金庫|*金融|*ローン}、[規模表現]::={最大手|大手|最大|中堅}、[代表者表現]::=[代表者名][役職]、[企業名]::=*、[所在地]::=*、[代表者名]::=*、[役職]::={社長|会長|理事長|副社長}のようにする。
【0110】
(8) :関連情報抽出結果D3の例
関連情報抽出結果D3の例を図14のA図に示す。関連情報抽出部P2が抽出した関連情報抽出結果D3の1例として、例えば、1995/09/29については、[業種表現]信用金庫、[規模表現]最大手、[企業名]JN信用金庫、[所在地]東京、[代表者表現][代表者名]○○一郎、[代表者表現][役職]理事長、のようになる。
【0111】
(9) :一般度判定パターンR2の例
一般度判定パターンR2の例を図14のB図に示す。この例では、表現が[規模]最大手の場合、一般度=4、表現が[規模]トップの場合、一般度=4、表現が[業種表現]、[規模]最大手の場合、一般度=2、[修飾表現]の場合、一般度=1となっている。
【0112】
(10):処理対象文章D4の例
処理対象文章D4の例を図14のC図に示す。この例では、処理対象文章D4は、「JN信用金庫がDK銀行と業務提携した。」となっている。
【0113】
(11):時刻順の関連情報表示の例1(JN信用金庫)
時刻順の関連情報表示の例1(JN信用金庫)を図15のA図に示す。この例では、例えば、日付が931019(西暦1993年10月19日)の関連情報は、[業種表現]信用金庫、[規模]最大手、[企業名]JN信用金庫、[所在地]東京となる。
【0114】
また、日付が941215(西暦1994年12月15日)の関連情報は、[修飾表現]先べんをつけた、[企業名]JN信用金庫、[所在地]東京・品川、[代表者表現]○○一郎、となる。更に、日付が950103(西暦1995年1月3日)の関連情報は、[業種表現]信用金庫、[規模]大手、[企業名]JN信用金庫、[所在地]東京・品川、[代表者表現]○○一郎となる。
【0115】
(12):時刻順の関連情報表示の例2(DK銀行)
時刻順の関連情報表示の例2(DK銀行)を図15のB図に示す。この例では、例えば、日付が910913(西暦1991年9月13日)の関連情報は、[規模]都市銀行トップ、[企業名]DK銀行、となる。また、日付が921206(西暦1992年12月6日)の関連情報は、[規模]都市銀行トップ、[企業名]DK銀行となる。
【0116】
(13):優先度順の関連情報表示の例1(JN信用金庫)
優先度順の関連情報表示の例1(JN信用金庫)を図16のA図に示す。この例では、一般度が44の関連情報は、[規模]最大手、[企業名]JN信用金庫、[所在地]東京、となる。また、一般度が20の関連情報は、[業種表現]信用金庫、[規模]最大手、[企業名]JN信用金庫、[所在地]東京、[代表者表現]○○一郎、となる。
【0117】
(14):優先度順の関連情報表示の例2(DK銀行)
優先度順の関連情報表示の例2(DK銀行)を図16のB図に示す。この例では、優先度が64の関連情報は、[規模]都市銀行トップ、[企業名]DK銀行、となる。
【0118】
(15):選択された関連情報の例
選択された関連情報の例を図17のA図に示す。この例では、JN信用金庫の選択された関連情報は、[業種表現]信用金庫、[規模]最大手、[企業名]JN信用金庫、[所在地]東京、[代表者表現]○○一郎、となる。また、DK銀行の選択された関連情報は、[業種表現]都市銀行、[規模]トップ、[企業名]DK銀行、となる。
【0119】
(16):挿入パターン規則R3の例
挿入パターン規則R3の例を図17のB図に示す。この例では、挿入条件が、[業種表現]、[規模]、[企業名]、[所在地]、[代表者表現]の場合の挿入パターンは、[業種表現][規模]の[企業名]([所在地]、[代表者表現])、のようになる。また、挿入条件が、[業種表現]、[規模]、[企業名]の場合の挿入パターンは、[業種表現][規模]の[企業名]、のようになる。
【0120】
(17):自動挿入された文章の例
自動挿入された文章の例を図17のC図に示す。この例では、自動挿入処理部P10により自動挿入された文章は、「信用金庫最大手のJN信用金庫(東京、○○一郎)が都市銀行トップのDK銀行と業務提携した。」のようになる。
【0121】
§8:具体的な装置例とプログラムの説明
図18は具体的な装置例である。前記文章入力装置は、パーソナルコンピュータ、ワークステーション等の任意のコンピュータにより実現することができる。この装置は、コンピュータ本体1と、該コンピュータ本体1に接続されたディスプレイ装置2、入力装置(キーボード/マウス等)3、リムーバブルディスクドライブ(「RDD」という)4、磁気ディスク装置(「MDD」という)5等で構成されている。
【0122】
そして、コンピュータ本体1には、内部の各種制御や処理を行うCPU11と、プログラムや各種データを格納しておくためのROM12(不揮発性メモリ)と、メモリ13と、インタフェース制御部(「I/F制御部」という)14と、通信制御部15等が設けてある。なお、前記RDD4には、フレキシブルディスクドライブや光ディスクドライブ等が含まれる。
【0123】
前記構成の装置において、例えば、前記ROM12、或いはMDD5の磁気ディスク(記録媒体)に、前記文章入力装置の処理を実現するためのプログラムを格納しておき、このプログラムをCPU12が読み出して実行することにより、前記文章入力処理を実行する。
【0124】
しかし、本発明は、このような例に限らず、例えば、MDD5の磁気ディスクに、次のようにしてプログラムを格納し、このプログラムをCPU11が実行することで前記文章入力処理を行うことも可能である。
【0125】
▲1▼:他の装置で作成されたリムーバブルディスクに格納されているプログラム(他の装置で作成したプログラムデータ)を、RDD4により読み取り、MDD5の記録媒体に格納する。
【0126】
▲2▼:LAN等の通信回線を介して他の装置から伝送されたプログラム等のデータを、通信制御部15を介して受信し、そのデータをMDD5の記録媒体(磁気ディスク)に格納する。
【0127】
【発明の効果】
以上説明したように、本発明によれば次のような効果がある。
【0128】
(1) :既存の文章データベースから表現の典型度の高い情報を抽出しておき、文章執筆時にはその抽出情報を利用して、執筆者に知識が無い場合でも、関連情報や典型的な修飾表現方法を執筆者に自動的に一覧表示し、執筆者が一覧から必要な表現を選択することにより、文章中に挿入したり、最大の挿入量など予め設定した挿入条件に従って、自動挿入する機能を実現できる。
【0129】
(2) :既存の文章で良く使われる関連表現を文章の入力、編集中に参照することができるようになり、修飾表現などの執筆が容易になる。修飾表現の新旧など更新による変化も文章入力中に知ることができ、最新の情報の利用や、過去のある時点での情報の利用も図ることができる。
【0130】
(3) :自動的に適切な量の修飾表現を文章に挿入することや、修飾表現の中から適切と思われるものを選ぶ操作だけで、文章に挿入することが可能であり、タイプ入力の手間を省き、誤字脱字などの入力ミスを減少させる効果がある。また、文書中のある表現と関連する部分の情報をキーにして、表現と比較の対象になる情報を表示する、比較情報を文章中に埋め込むことができる。
【図面の簡単な説明】
【図1】本発明の実施の形態における文章入力装置の説明図1(抽出フェーズ)である。
【図2】本発明の実施の形態における文章入力装置の説明図2(文章作成編集フェーズ)である。
【図3】本発明の実施の形態における時刻情報抽出部の処理フローチャート(その1)である。
【図4】本発明の実施の形態における時刻情報抽出部の処理フローチャート(その2)である。
【図5】本発明の実施の形態における関連情報抽出部の処理フローチャートである。
【図6】本発明の実施の形態における一般度計算部の処理フローチャートである。
【図7】本発明の実施の形態における入力文章解析・抽出部の処理フローチャートである。
【図8】本発明の実施の形態における関連情報検索部/自動挿入処理部の処理フローチャートである。
【図9】本発明の実施の形態における検索結果整列部の処理フローチャートである。
【図10】本発明の実施の形態における関連情報自動選択部の処理フローチャートである。
【図11】本発明の実施の形態における処理の具体例(その1)である。
【図12】本発明の実施の形態における処理の具体例(その2)である。
【図13】本発明の実施の形態における処理の具体例(その3)である。
【図14】本発明の実施の形態における処理の具体例(その4)である。
【図15】本発明の実施の形態における処理の具体例(その5)である。
【図16】本発明の実施の形態における処理の具体例(その6)である。
【図17】本発明の実施の形態における処理の具体例(その7)である。
【図18】本発明の実施の形態における具体的な装置例である。
【符号の説明】
1 コンピュータ本体
2 ディスプレイ装置
3 入力装置
4 リムーバブルディスクドライブ(RDD)
5 磁気ディスク装置
11 CPU(中央演算処理装置)
12 ROM(リードオンリメモリ)
13 メモリ
14 インターフェイス制御部(I/F制御部)
15 通信制御部
D1 文書データベース
D2 時刻情報付き文書データ
D3 関連情報抽出結果
D4 処理対象文章
D5 抽出結果データ
D6 関連情報検索結果
D7 関連情報候補
D8 挿入対象関連情報
D9 関連情報データベース
P1 時刻情報抽出部
P2 関連情報抽出部
P3 文章入力処理部
P4 文章表示部
P5 入力文章解析・抽出部
P6 関連情報検索部
P7 検索結果整列部
P8 関連情報表示部
P9 ユーザ選択部
P10 自動挿入処理部
P11 関連情報自動選択部
R1 パターン照合規則
R2 一般度判定パターン
R3 挿入パターン規則
W1 文章データ表示ウィンドウ
W2 関連情報表示ウィンドウ

Claims (5)

  1. 文章データ中から互いに関連する関連情報及び文章の表す時刻情報を抽出し、関連情報を時刻情報と共に蓄積する第1の関連情報抽出手段と、
    文章データ中から互いに関連する関連情報を抽出し、該関連情報の出現頻度を求め、関連情報と該関連情報が示す一般度判定係数とを関連付けて持つ一般度判定パターンと該抽出した関連情報とから一般度判定係数を求め、該求めた出現頻度と該求めた一般度判定係数とから該抽出した関連情報の一般度を求めて、該抽出した関連情報と該求めた一般度と共に蓄積する第2の関連情報抽出手段を備えていることを特徴とする文章入力装置。
  2. 文章の入力、編集中に、文章中の表現に対し、前記第2の関連情報抽出手段で蓄積した関連情報と照合し、一致する部分を含む関連情報を出現頻度と一般度から計算した優先度の順に表示する第3の文章作成編集手段を備えていることを特徴とする請求項1記載の文章入力装置。
  3. 文章の入力、編集中に、文章中の表現に対し前記第1の関連情報抽出手段で蓄積した関連情報と照合し、一致する部分を含む関連情報を時刻順に表示し、利用者により選択された関連表現を文章中に埋め込む第4の文章作成編集手段と、
    文章の入力、編集中に、文章中の表現に対し前記第2の関連情報抽出手段で蓄積した関連情報と照合し、一致する部分を含む関連情報を出現頻度と一般度から計算した優先度の順に表示し、利用者により選択された関連表現を文章中に埋め込む第5の文章作成編集手段を備えていることを特徴とする請求項1記載の文章入力装置。
  4. 文章の入力、編集中に、文章中の表現に対し前記第1の関連情報抽出手段で蓄積した関連情報を、利用者が定めた量的な挿入条件を満たす範囲で、時刻順の優先度の高いものから順に自動的に文章中へ埋め込む第6の文章作成編集手段と、
    文章の入力、編集中に、文章中の表現に対し前記第2の抽出手段で蓄積した関連情報と照合し、一致する部分を含む関連情報を、利用者が定めた量的な挿入条件を満たす範囲で、出現頻度と一般度から計算した優先度の高いものから順に自動的に文章中へ埋め込む第7の文章作成編集手段を備えていることを特徴とする請求項1記載の文章入力装置。
  5. 文章入力装置を構成するコンピュータ装置を、
    文章データ中から互いに関連する関連情報及び文章の表す時刻情報を抽出し、該関連情報を時刻情報と共に蓄積する第1の関連情報抽出手段と、
    文章データ中から互いに関連する関連情報を抽出し、該関連情報の出現頻度を求め、関連情報と該関連情報が示す一般度判定係数とを関連付けて持つ一般度判定パターンと該抽出した関連情報とから一般度判定係数を求め、該求めた出現頻度と該求めた一般度判定係数とから該抽出した関連情報の一般度を求めて、該抽出した関連情報と該求めた一般度と共に蓄積する第2の関連情報抽出手段
    として機能させるプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2000000556A 2000-01-06 2000-01-06 文章入力装置及び記録媒体 Expired - Fee Related JP4361655B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000000556A JP4361655B2 (ja) 2000-01-06 2000-01-06 文章入力装置及び記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000000556A JP4361655B2 (ja) 2000-01-06 2000-01-06 文章入力装置及び記録媒体

Publications (2)

Publication Number Publication Date
JP2001195399A JP2001195399A (ja) 2001-07-19
JP4361655B2 true JP4361655B2 (ja) 2009-11-11

Family

ID=18529891

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000000556A Expired - Fee Related JP4361655B2 (ja) 2000-01-06 2000-01-06 文章入力装置及び記録媒体

Country Status (1)

Country Link
JP (1) JP4361655B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4965766B2 (ja) * 2001-03-26 2012-07-04 株式会社リコー 関係情報抽出装置および属性情報抽出装置

Also Published As

Publication number Publication date
JP2001195399A (ja) 2001-07-19

Similar Documents

Publication Publication Date Title
AU2005201758B2 (en) Method of learning associations between documents and data sets
US7814111B2 (en) Detection of patterns in data records
US7519607B2 (en) Computer-based system and method for generating, classifying, searching, and analyzing standardized text templates and deviations from standardized text templates
US6279018B1 (en) Abbreviating and compacting text to cope with display space constraint in computer software
US7739111B2 (en) Pattern matching method and apparatus and speech information retrieval system
EP1623344B1 (en) Presentation of data using meta-morphing
JP2669601B2 (ja) 情報検索方法及びシステム
CN112364645A (zh) 一种自动审核erp财务系统业务单据的方法及设备
CN112395851A (zh) 一种文本比对方法、装置、计算机设备及可读存储介质
CN112149387A (zh) 财务数据的可视化方法、装置、计算机设备及存储介质
JP2003524258A (ja) 電子ドキュメントを処理する方法および装置
JP3812818B2 (ja) データベース生成装置、データベース生成方法及びデータベース生成処理プログラム
CN110188340B (zh) 一种研报文本实体名词自动识别方法
JP4361655B2 (ja) 文章入力装置及び記録媒体
US20070172154A1 (en) Data medium discrimination information database creating apparatus, data medium discrimination information database managing apparatus, computer readable recording medium recorded thereon data medium discrimination information database creating program, and data medium discriminating apparatus
WO2021176648A1 (ja) 文書評価プログラム、文書評価方法および文書評価装置
JP5550959B2 (ja) 文書処理システム、及びプログラム
CN114328536A (zh) 一种表格处理方法和系统
JP2018120284A (ja) 決算分析システムおよび決算分析プログラム
JPH10187751A (ja) 認識データ処理装置およびそのプログラム記録媒体
JP3548372B2 (ja) 文字認識装置
KR102639207B1 (ko) 자동 문서작성 시스템, 그 방법 및, 그 방법을 수행하는프로그램을 저장하는 기록매체
JP7377565B2 (ja) 図面検索装置、図面データベース構築装置、図面検索システム、図面検索方法、及びプログラム
JPH06103402A (ja) 名刺認識装置
JP4922030B2 (ja) 文字列検索装置、方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061218

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20081219

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090113

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090305

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20090305

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20090305

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090811

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090813

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120821

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120821

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130821

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees