JPH08190570A - 文書データの比較検証システム - Google Patents

文書データの比較検証システム

Info

Publication number
JPH08190570A
JPH08190570A JP7001947A JP194795A JPH08190570A JP H08190570 A JPH08190570 A JP H08190570A JP 7001947 A JP7001947 A JP 7001947A JP 194795 A JP194795 A JP 194795A JP H08190570 A JPH08190570 A JP H08190570A
Authority
JP
Japan
Prior art keywords
document
comparison
module
document data
verification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7001947A
Other languages
English (en)
Inventor
Takaharu Hatsutori
宇春 服部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP7001947A priority Critical patent/JPH08190570A/ja
Publication of JPH08190570A publication Critical patent/JPH08190570A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 文書データの比較検証システムに関し、改訂
された文書データの内容の妥当性チェックに必要な労力
と時間の軽減を図る。 【構成】 識別不要の空白文字を定義し、空白文字除外
手段によって比較検証の対象から除外する。そして、ア
ンマッチ処理手段によって句点“。”で区切られる
“文”単位での有意な比較処理を行うとともに、モジュ
ール区分入力手段によって章節項を表すタイトルなどで
区切られるモジュール単位での有意な比較処理を行う。
さらに、比較処理中の文書モジュールの一方の入力満了
によってモジュールマークが検出された後、他方の文書
モジュールについても入力が満了して同様のモジュール
マークが検出されるまで、アンマッチ出力抑止手段によ
ってアンマッチ部分の出力を抑止する。以上により、ア
ンマッチ部分の出力量を最小限にして、新文書データの
チェックに必要な労力と時間の軽減を図ることができ
る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は文書データの比較検証シ
ステムに係り、特に、改訂作業にともなって“文”の挿
入・削除・変更などが行われた新旧文書間における変更
箇所の特定を行う文書データの比較検証システムに関す
る。
【0002】
【従来の技術】従来、ユーザが作成した文書について、
その形式的な記述(送り仮名,一文の長さなど)や表現
の分かり易さの検証を行う機能を有するワープロが提供
されている。この場合の検証は単独の文書について行わ
れるものであり、その目的は一定の基準によって文書の
評価を行うことにあった。
【0003】これに対して最近では、ビジネス文書など
の作成に際してワープロを用いるのが一般的な作業形態
となっており、以前に作成および保存されていた旧バー
ジョンのビジネス文書を一部改訂することにより、目的
とする新バージョンのビジネス文書を作成することが日
常的に行われている。この場合、新バージョンのビジネ
ス文書の内容の妥当性について、人手によって直接チェ
ック作業を行う必要がある。そこで、本出願人は特願平
6-14610号「文書データの一致検証方式」において、ハ
ッシュコードなどを用いることで複数の文書(改訂前後
の新旧ビジネス文書など)に対する“文”単位での一致
検証を行って互いに内容が一致しない箇所を抽出した
後、該当する箇所についてのみ人手によるチェック作業
を行うことにより、このようなチェック作業に必要な労
力と時間の軽減を図る方式を提案している。
【0004】
【発明が解決しようとする課題】ある文書を改訂して新
たな文書を作成する場合、個々の“文”を構成する字句
の変更に加えて、既存の“文”の削除や新たな“文”の
追加などが行われるのが通例であり、このような削除や
追加のために文書の先頭からの個々の“文”の位置が改
訂の前後で変化することが多い。しかしながら上記従来
技術では、比較される新旧文書を構成するすべての
“文”について、上述した“文”単位の一致検証が順次
的に行われるので、新旧文書の比較検証中に最初のアン
マッチ(対応位置にある“文”の不一致)が検出される
と、当該アンマッチの原因が“文”の削除や追加による
ものであって新旧文書間で位置のみが異なる“文”が多
数続いていたとしても、アンマッチ検出点(アンマッチ
が検出された“文”の位置)以降のすべての“文”につ
いてアンマッチと判定され、アンマッチ部分の出力が文
書の最後まで無制限に行われる可能性が高い。また、従
来からのコンピュータによる文書の比較では基本的に文
字コードが一致するか否かの判定を行うので、印刷物と
しての文書を読むユーザにとっては無意味な文字コード
(制御コードや空白コードなど)の相違についてもアン
マッチと判定され、記述内容は同一であるにも関わらず
アンマッチ部分として出力されてしまう。
【0005】以上のように上記従来技術では、新旧文書
間における変更箇所を調べることを目的とするユーザに
とっては一見して無意味なアンマッチ部分が大量に出力
されてしまうので、新文書の内容の妥当性チェックに必
要な労力と時間が十分に軽減されないという問題点があ
った。
【0006】したがって本発明の目的は、上記の問題点
を解決して、ユーザにとって意味のある比較検証を新旧
文書全体を通して行うことにより、新文書の内容の妥当
性チェックに必要な労力と時間を十分に軽減することの
できる文書データの比較検証システムを提供することに
ある。
【0007】
【課題を解決するための手段】上記の目的を達成するた
め、本発明の文書データの比較検証システムは、連続的
に入力される文字列中に含まれる所定の空白文字を処理
対象から除外する空白文字除外手段と、所定の区切りマ
ークで区分される“文”単位で前記文字列からなる一対
の文書データを相互に比較し、“文”の不一致が検出さ
れたアンマッチ検出点から次の前記区切りマークまでの
文字列をアンマッチ部分として出力するアンマッチ処理
手段と、各々の前記文書データにおける所定のモジュー
ルマークの有無あるいは所定の目次モジュールの内容に
基づいて前記文書データを一以上の“文”を含む有意な
文書モジュールごとに区分して入力するモジュール区分
入力手段と、文書モジュール相互間におけるアンマッチ
処理に際して一方の文書モジュールの入力満了から他方
の文書モジュールの入力満了までの間は前記アンマッチ
部分の出力を抑止するアンマッチ出力抑止手段とを具備
する構成としたものである。
【0008】
【作用】上記構成に基づく作用を説明する。
【0009】本発明の文書データの比較検証システム
は、連続的に入力される文字列中に含まれる所定の空白
文字を処理対象から除外する空白文字除外手段と、所定
の区切りマークで区分される“文”単位で前記文字列か
らなる一対の文書データを相互に比較し、“文”の不一
致が検出されたアンマッチ検出点から次の前記区切りマ
ークまでの文字列をアンマッチ部分として出力するアン
マッチ処理手段と、各々の前記文書データにおける所定
のモジュールマークの有無あるいは所定の目次モジュー
ルの内容に基づいて前記文書データを一以上の“文”を
含む有意な文書モジュールごとに区分して入力するモジ
ュール区分入力手段と、文書モジュール相互間における
アンマッチ処理に際して一方の文書モジュールの入力満
了から他方の文書モジュールの入力満了までの間は前記
アンマッチ部分の出力を抑止するアンマッチ出力抑止手
段とを具備している。
【0010】すなわち、所定の空白文字(例えば、“ス
ペース”,各種制御文字,タブコードなど)を定義して
おけば、空白文字除外手段によってユーザが識別する必
要のない文字が比較検証の対象から除外されるので、ユ
ーザにとって有意な文字のみを自動的に選別して比較
し、新文書データのチェックに必要な労力と時間の軽減
を図ることができる。
【0011】また、アンマッチ処理手段により、文字ご
とのアンマッチ処理が区切りマーク(一般的には、句点
“。”やピリオド“.”を区切りマークとする。)を越
えて波及することがなくなり、文書データの改訂に伴う
文字の増減のために“文”が変形した場合でもその影響
範囲は該当する“文”のみに留まるようになるので、
“文”単位での有意な比較処理が行われ、新文書データ
のチェックに必要な労力と時間の軽減を図ることができ
る。
【0012】また、モジュールの区切りや開始点を示す
特定の文字列をモジュールマークとして文書データ中に
記述したり、あるいは、モジュールの区切りを示す情報
を記述した目次モジュールを文書データ中に設けておけ
ば、モジュール区分入力手段によって“文”の場合と同
様に“文”の集まりであるモジュール単位での有意な比
較処理が行われ、新文書データのチェックに必要な労力
と時間の軽減を図ることができる。
【0013】さらに、アンマッチ出力抑止手段により、
比較処理中の文書モジュールの一方の入力満了によって
モジュールマークが検出された後、他方の文書モジュー
ルについても入力が満了して同様のモジュールマークが
検出されるまで、アンマッチ部分の出力が抑止されるの
で、従来のように文書データ全体について無制限に表示
されるアンマッチの結果を確認するという手間がなくな
り、新文書データのチェックに必要な労力と時間の軽減
を図ることができる。
【0014】
【実施例】以下、本発明の文書データの比較検証システ
ムの一実施例を図面を用いて詳細に説明する。
【0015】図1は、本発明の文書データの比較検証シ
ステムを実現するシステムの一構成例を示すブロック図
である。同図中、本発明の文書データの比較検証システ
ムを実現する文書比較検証プログラムは、プログラムラ
イブラリ8から主記憶装置5にロードされる。文書比較
検証プログラムに対する文書比較についての指示は、キ
ーボード2から投入される。また、文書比較検証プログ
ラムからのメッセージは表示装置1に表示出力され、比
較検証の結果は表示装置1またはプリンタ3に出力され
る。なお、旧文書データとして比較の基準となる比較基
準文書A9および新文書データとして比較の対象となる
比較対象文書B11は、それぞれに対応する目次モジュ
ール10および12とともに文書保管用ディスク4に格
納されている。
【0016】図2は、本発明の文書データの比較検証シ
ステムにおける“文”の単位の一例を示す図である。同
図中、空白文字以外の文字で始まり、区切りマークであ
る句点“。”で終わる文字列をひとつの“文”と認識す
る。この場合の空白文字は、文書データ中に文字コード
として含まれてはいるが、人が文章を読んでその意味を
理解しようとするときに見ることのできない文字コード
のことであり、例えば“スペース”(図中では
“△”),“改行コード”(図中では“NL”),“改
ページコード”(図中では“NP”)などの制御文字が
これに相当する。本実施例は、文書は人が読んで理解す
るためのものであるという立場から、空白文字をすべて
読み飛ばして(空白文字除外手段による)、人間が理解
可能な文字列のみを比較検証の対象とする。
【0017】図3は、本発明の文書データの比較検証シ
ステムにおける文書モジュールの単位の一例を示す図で
あり、モジュール区分入力手段が、章節項などを表すタ
イトル(モジュールマーク)から次に現れる章節項のタ
イトルの直前までをひとつの文書モジュールと認識す
る。すなわち、図3(a)に示す文書データの場合は、
“改行コード”で前のモジュールが終わり、次のモジュ
ールとして「2. 」のポイントシステムで表される2
章が始まるものと認識される。また、図3(b)に示す
文書データの場合は、“改ページコード”で前のモジュ
ールが終わり、次のモジュールとして「2. 」のポイ
ントシステムで表される2章が始まるものと認識され
る。
【0018】図4は、本発明の文書データの比較検証シ
ステムにおける目次モジュールの内容の一例を示す図で
あり、モジュール区分手段から参照される図1中の目次
モジュール10および12の具体例を示す。この例もポ
イントシステムを採用した例であり、章節項を表す数
字,セパレータである“スペース”,タイトルの3種類
の目次情報のみが連続して格納されている。
【0019】図5〜図15は、本発明の文書データの比
較検証システムを実現する文書比較検証プログラムによ
る処理の流れを示すフローチャートであり、図5は文書
比較検証プログラムのメインルーチンの処理フローを、
図6はメインルーチンから呼び出されるサブルーチン
〔Routine 10〕の処理フローを、図7〜図9は〔Routin
e 10〕からさらに呼び出されるサブルーチン〔Routine5
00〕の処理フローを、図10〜図11は〔Routine500〕
からさらに呼び出されるサブルーチン〔Routine600〕の
処理フローを、図12は〔Routine500〕からさらに呼び
出されるサブルーチン〔 Skip A to just before B tit
le〕の処理フローを、図13は〔Routine500〕からさら
に呼び出されるサブルーチン〔 Skip B to just before
A title〕の処理フローを、図14は〔Routine500〕か
らさらに呼び出されるサブルーチン〔Skip B to just b
efore next B title〕の処理フローを、図15は〔Rout
ine500〕からさらに呼び出されるサブルーチン〔Skip A
to just before next A title〕の処理フローを、それ
ぞれ示す。
【0020】図5〜図15において、ボックス〔2〕〜
〔5〕では、比較基準文書Aと比較対象文書Bを頭から
読み出して比較する。ボックス〔10〕〜〔15〕で
は、比較検証システムのユーザが表示装置に表示された
目次項目を見て、それぞれの文書で比較すべき項目を選
択する。これに基づいて比較検証プログラムでは、選択
された目次項目のモジュールどうしを比較する。一つの
モジュールの比較が完了したら、文書比較を終了する。
サブルーチン〔Routine 10〕では、比較基準文書Aと比
較対象文書Bを比較する。
【0021】文書の比較の基本は1文字ごとの比較であ
り、これが繰り返されてひとつの文の比較となる。さら
に、ひとつの文ごとの比較が繰り返されてひとつのモジ
ュールの比較が完了となる。
【0022】ボックス〔50〕〜〔58〕では、比較基
準文書Aから1文字を読んで文単位の比較を始めるとい
う処理を行う。このとき、比較基準文書Aで“EOF”
( End of file)が検出された場合にはボックス〔7
0〕〜〔82〕を実行する。この処理は、比較対象文書
Bの残りの部分をアンマッチ部分としてプリントすると
いう処理である。また、ボックス〔54〕で、“NL”
あるいは“NP”が検出された場合には当該文書モジュ
ールの終了マークであるか否かをチェックする。ボック
ス〔60〕〜〔66〕では、1文字を読み込んだ比較基
準文書A中の後続する文字列が文書モジュールの始まり
を示すマークであった場合、当該モジュールを識別する
ためのIDである章節項番号を現在処理中の文のモジュ
ール名として、ワークエリアにコピーする。一方、ボッ
クス〔50〕〜〔58〕において読み込んだ1文字が
“NL”,“NP”,“EOF”のいずれでもなかった
場合には、サブルーチン〔Routine500〕を呼び出して文
単位の比較処理を開始する。
【0023】文書モジュールの頭出しルーチンである
〔Routine500〕におけるボックス〔100〕〜〔12
2〕では、比較基準文書A中でアンマッチである文に引
き続いてモジュールのタイトルが読み込まれた場合、比
較基準文書Aおよび比較対象文書Bの両方で同一のタイ
トルを有する同等の文書モジュールが比較されるよう
に、比較基準文書Aおよび比較対象文書Bの両方から同
一のタイトルが読み込まれるまで、文字のスキップ入力
(空読み)を行う。
【0024】ボックス〔100〕において、直前に比較
基準文書Aから読み込まれた文字が“NL”および“N
P”のいずれでもなかった場合にはボックス〔140〕
に分岐する。ボックス〔140〕〜〔162〕では、比
較対象文書Bを基準として、比較対象文書B中の後続す
る文字列が章節項タイトルであり、かつ、現時点で比較
基準文書Aおよび比較対象文書Bにアンマッチが発生し
ていた場合、比較基準文書Aおよび比較対象文書Bの両
方の文書モジュールの頭出しを行ってから文書の比較検
証を再開する。このように、文書モジュールの頭出し後
に各々の文書モジュールの比較検証を行うことにより、
ユーザにとって有意な比較検証が行われる。なお、比較
検証プログラムは、アンマッチ部分のスキップを行った
ことを示すメッセージを表示またはプリントしておくも
のとする。
【0025】一方、比較基準文書Aおよび比較対象文書
Bの両方について、読み込んだ文字が“NL”,“N
P”,“EOF”のいずれでもなかった場合、ボックス
〔400〕〜〔448〕で1文字ごとの比較を行う。こ
のとき、比較基準文書Aおよび比較対象文書Bから読み
込んだ1文字を比較して一致した場合には、後続する文
字について処理を行うために読み込みを行ったルーチン
に戻り、後続する文字についての処理を開始する。ま
た、いずれか一方の文書のみで句点を検出した場合に
は、他方の文書で句点が検出されるまで文字をスキップ
するとともに、それらの文字をアンマッチ文字としてプ
リンタまたは表示装置に出力する。
【0026】ボックス〔500〕〜〔514〕では、比
較対象文書B中で現在処理中のタイトルと同一のタイト
ルが比較基準文書Aから検出されるまで、比較基準文書
A中の文字をスキップする。同様に、ボックス〔60
0〕〜〔614〕では、比較基準文書A中で現在処理中
のタイトルと同一のタイトルが比較対象文書Bから検出
されるまで、比較対象文書B中の文字をスキップする。
また、ボックス〔700〕〜〔714〕では、比較対象
文書B中で後続するタイトルが検出されるまで、比較対
象文書B中の文字をスキップする。同様に、ボックス
〔800〕〜〔814〕では、比較基準文書A中で後続
するタイトルが検出されるまで、比較基準文書A中の文
字をスキップする。
【0027】
【発明の効果】以上詳しく説明したように、本発明の文
書データの比較検証システムによれば、所定の空白文字
(例えば、“スペース”,各種制御文字,タブコードな
ど)を定義しておけば、空白文字除外手段によってユー
ザが識別する必要のない文字が比較検証の対象から除外
されるので、ユーザにとって有意な文字のみを自動的に
選別して比較し、新文書データのチェックに必要な労力
と時間の軽減を図ることができるという効果が得られ
る。
【0028】また、アンマッチ処理手段により、文字ご
とのアンマッチ処理が区切りマーク(一般的には、句点
“。”やピリオド“.”を区切りマークとする。)を越
えて波及することがなくなり、文書データの改訂に伴う
文字の増減のために“文”が変形した場合でもその影響
範囲は該当する“文”のみに留まるようになるので、
“文”単位での有意な比較処理が行われ、新文書データ
のチェックに必要な労力と時間の軽減を図ることができ
るという効果が得られる。
【0029】また、モジュールの区切りや開始点を示す
特定の文字列をモジュールマークとして文書データ中に
記述したり、あるいは、モジュールの区切りを示す情報
を記述した目次モジュールを文書データ中に設けておけ
ば、モジュール区分入力手段によって“文”の場合と同
様に“文”の集まりであるモジュール単位での有意な比
較処理が行われ、新文書データのチェックに必要な労力
と時間の軽減を図ることができるという効果が得られ
る。
【0030】さらに、アンマッチ出力抑止手段により、
比較処理中の文書モジュールの一方の入力満了によって
モジュールマークが検出された後、他方の文書モジュー
ルについても入力が満了して同様のモジュールマークが
検出されるまで、アンマッチ部分の出力が抑止されるの
で、従来のように文書データ全体について無制限に表示
されるアンマッチの結果を確認するという手間がなくな
り、新文書データのチェックに必要な労力と時間の軽減
を図ることができるという効果が得られる。
【図面の簡単な説明】
【図1】本発明の文書データの比較検証システムを実現
するシステムの一構成例を示すブロック図である。
【図2】本発明の文書データの比較検証システムにおけ
る“文”の単位の一例を示す図である。
【図3】本発明の文書データの比較検証システムにおけ
る文書モジュールの単位の一例を示す図である。
【図4】本発明の文書データの比較検証システムにおけ
る目次モジュールの内容の一例を示す図である。
【図5】本発明の文書データの比較検証システムを実現
する文書比較検証プログラムによる処理の流れを示すフ
ローチャート(その1)である。
【図6】本発明の文書データの比較検証システムを実現
する文書比較検証プログラムによる処理の流れを示すフ
ローチャート(その2)である。
【図7】本発明の文書データの比較検証システムを実現
する文書比較検証プログラムによる処理の流れを示すフ
ローチャート(その3)である。
【図8】本発明の文書データの比較検証システムを実現
する文書比較検証プログラムによる処理の流れを示すフ
ローチャート(その4)である。
【図9】本発明の文書データの比較検証システムを実現
する文書比較検証プログラムによる処理の流れを示すフ
ローチャート(その5)である。
【図10】本発明の文書データの比較検証システムを実
現する文書比較検証プログラムによる処理の流れを示す
フローチャート(その6)である。
【図11】本発明の文書データの比較検証システムを実
現する文書比較検証プログラムによる処理の流れを示す
フローチャート(その7)である。
【図12】本発明の文書データの比較検証システムを実
現する文書比較検証プログラムによる処理の流れを示す
フローチャート(その8)である。
【図13】本発明の文書データの比較検証システムを実
現する文書比較検証プログラムによる処理の流れを示す
フローチャート(その9)である。
【図14】本発明の文書データの比較検証システムを実
現する文書比較検証プログラムによる処理の流れを示す
フローチャート(その10)である。
【図15】本発明の文書データの比較検証システムを実
現する文書比較検証プログラムによる処理の流れを示す
フローチャート(その11)である。
【符号の説明】
1 表示装置 2 キーボード 3 プリンタ 4 文書保管用ディスク 5 主記憶装置 6 文書比較処理用ワークエリア 7 ワードプロセシングプログラム 8 プログラムライブラリ 9 比較基準文書A 10 比較基準文書Aの目次モジュール 11 比較対象文書B 12 比較対象文書Bの目次モジュール

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 連続的に入力される文字列中に含まれる
    所定の空白文字を処理対象から除外する空白文字除外手
    段と、 所定の区切りマークで区分される“文”単位で前記文字
    列からなる一対の文書データを相互に比較し、“文”の
    不一致が検出されたアンマッチ検出点から次の前記区切
    りマークまでの文字列をアンマッチ部分として出力する
    アンマッチ処理手段と、 各々の前記文書データにおける所定のモジュールマーク
    の有無あるいは所定の目次モジュールの内容に基づいて
    前記文書データを一以上の“文”を含む有意な文書モジ
    ュールごとに区分して入力するモジュール区分入力手段
    と、 文書モジュール相互間におけるアンマッチ処理に際して
    一方の文書モジュールの入力満了から他方の文書モジュ
    ールの入力満了までの間は前記アンマッチ部分の出力を
    抑止するアンマッチ出力抑止手段とを具備する構成とし
    たことを特徴とする文書データの比較検証システム。
JP7001947A 1995-01-10 1995-01-10 文書データの比較検証システム Pending JPH08190570A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7001947A JPH08190570A (ja) 1995-01-10 1995-01-10 文書データの比較検証システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7001947A JPH08190570A (ja) 1995-01-10 1995-01-10 文書データの比較検証システム

Publications (1)

Publication Number Publication Date
JPH08190570A true JPH08190570A (ja) 1996-07-23

Family

ID=11515813

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7001947A Pending JPH08190570A (ja) 1995-01-10 1995-01-10 文書データの比較検証システム

Country Status (1)

Country Link
JP (1) JPH08190570A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013045437A (ja) * 2011-08-26 2013-03-04 Konica Minolta Business Technologies Inc 文書ファイルの差分抽出システム、画像処理装置、文書ファイルの差分抽出方法及びプログラム
CN111104788A (zh) * 2019-12-05 2020-05-05 东软集团股份有限公司 文档差分内容的对齐方法、装置、存储介质、电子设备

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013045437A (ja) * 2011-08-26 2013-03-04 Konica Minolta Business Technologies Inc 文書ファイルの差分抽出システム、画像処理装置、文書ファイルの差分抽出方法及びプログラム
CN111104788A (zh) * 2019-12-05 2020-05-05 东软集团股份有限公司 文档差分内容的对齐方法、装置、存储介质、电子设备
CN111104788B (zh) * 2019-12-05 2023-09-22 东软集团股份有限公司 文档差分内容的对齐方法、装置、存储介质、电子设备

Similar Documents

Publication Publication Date Title
US8484238B2 (en) Automatically generating regular expressions for relaxed matching of text patterns
US7584093B2 (en) Method and system for generating spelling suggestions
US7293229B2 (en) Ensuring proper rendering order of bidirectionally rendered text
JPH1153384A (ja) キーワード抽出装置及びキーワード抽出方法並びにキーワード抽出プログラムを格納したコンピュータ読み取り可能な記録媒体
JP2007287134A (ja) 情報抽出装置、及び情報抽出方法
JP2007265458A (ja) 複数の圧縮オプションを生成する方法およびコンピュータ
WO1999062000A2 (en) Spelling and grammar checking system
JPH07325827A (ja) ハイパーテキスト自動生成装置
US7398196B1 (en) Method and apparatus for summarizing multiple documents using a subsumption model
US7346488B2 (en) Automatic translator and computer-readable storage medium having automatic translation program recorded thereon
US7389220B2 (en) Correcting incomplete negation errors in French language text
JPH08190570A (ja) 文書データの比較検証システム
KR101052004B1 (ko) 번역서비스 제공방법 및 그 시스템
JP3398729B2 (ja) キーワード自動抽出装置およびキーワード自動抽出方法
JPH11272671A (ja) 機械翻訳装置及び機械翻訳方法
JPH06290209A (ja) 文切り装置
JPH0869469A (ja) 機械翻訳の方法
JP3206600B2 (ja) 文書生成装置
JP2575947B2 (ja) 文節切出し装置
JPH04330565A (ja) 自然言語処理システム
JP2020184218A (ja) 検索プログラム、検索方法及び検索装置
JP2005157853A (ja) テキスト文から抽出した情報を利用したリンク設定装置およびその方法
JP2004206631A (ja) 検索チューニング方法および情報検索システム
JPH07200592A (ja) 文章処理装置
JPS6366665A (ja) 文書解析整形装置