JP2994336B1 - 文書解析装置およびその方法 - Google Patents

文書解析装置およびその方法

Info

Publication number
JP2994336B1
JP2994336B1 JP10190410A JP19041098A JP2994336B1 JP 2994336 B1 JP2994336 B1 JP 2994336B1 JP 10190410 A JP10190410 A JP 10190410A JP 19041098 A JP19041098 A JP 19041098A JP 2994336 B1 JP2994336 B1 JP 2994336B1
Authority
JP
Japan
Prior art keywords
document
numerical value
numerical
program
storage medium
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP10190410A
Other languages
English (en)
Other versions
JP2000020521A (ja
Inventor
博喜 阿望
Original Assignee
株式会社ジャストシステム
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社ジャストシステム filed Critical 株式会社ジャストシステム
Priority to JP10190410A priority Critical patent/JP2994336B1/ja
Application granted granted Critical
Publication of JP2994336B1 publication Critical patent/JP2994336B1/ja
Publication of JP2000020521A publication Critical patent/JP2000020521A/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

【要約】 【課題】 数値を含む文書について、数値入力が間違っ
ていないかを判断する。 【解決手段】 校正対象文章を読み込む(ST3)。校
正辞書部26bに記憶された辞書データを用いて、形態
素解析、形態素解析された文字列から文節の認定および
各文節間の係り受けを決定する(ST5、ST7、ST
9)。全文節について、数詞、助数詞、および図4に示
す関係キーワードが存在しているか否かを確認し、存在
していればその文節を抽出する(ST11)。前記抽出
した文節間に適用する計算式を、助数詞および係り関係
に基づいて決定する(ST13)。この計算式を用いて
演算する(ST15)。計算結果が間違っている計算式
があるか否か判断する(ST17)。正しくない場合に
は、変更処理を行う(ST19)。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、文書の解析装置
に関し、特に数値を含む文章の入力ミス指摘、修正に関
する。
【0002】
【従来技術およびその課題】特開平4−130571号
公報には、別途電卓等を用いることなく、入力されてい
る数値を含む文字列について、検算処理を実行できる文
書作成装置が開示されている。
【0003】上記文書作成装置は、入力された文字列中
の数値部分を特定するとともに、その演算式を特定する
と、演算結果が表示されるというものである。これによ
り、電卓等に別途数値を入力する煩雑を避けることがで
きる。
【0004】しかし、上記文書作成装置においても、や
はり、操作者が、数値部分がどこか、さらに演算式とし
て何を用いるかを特定しなければならない。かかる特定
は、数値部分が多い場合には非常に煩雑である。
【0005】この発明は上記問題を解決し、数値を含む
文書について数値が誤って入力されていないかを判断で
きる文書解析装置またはその方法を提供することを目的
とする。
【0006】
【課題を解決するための手段および発明の効果】1,
4,5)本発明にかかる文書解析装置またはその方法に
おいては、1)数値を含有する数値含有文書構成要素間
の関係を決定する関係キーワードと演算式との対応テー
ブルおよび、2)前記文書を文書構成要素に分割する第
1のデータと各文書構成要素間の係り受け関係を決定す
る第2のデータとを記憶するかな漢字変換辞書を、前記
記憶装置に記憶させ、校正対象の文書が与えられると、
前記かな漢字変換辞書の前記第1のデータを用いて、当
該文書を文書構成要素に分割し、前記文書構成要素から
数値を含有する数値含有文書構成要素を抽出して、前記
かな漢字変換辞書の前記第2のデータを用いて前記数値
含有文書構成要素間の係り受け関係を決定するととも
に、前記対応テーブルに基づいて、前記数値含有文書構
成要素に存在する関係キーワードに対応する演算式を抽
出し、この演算式および前記数値含有文書構成要素の数
値を用いて前記数値含有文書構成要素間の 数値の関係を
表す要素関係演算式を決定する。したがって、操作者が
数値含有文書構成要素およびその関係を特定することな
く、数値含有文書構成要素の数値の関係を表す要素関係
演算式が自動的に決定される。これにより、数値を含有
する文書に関する数値について、操作者の作業の煩雑を
除去できる文書解析装置またはその方法を提供すること
ができる。
【0007】2、7)本発明にかかる文書解析装置にお
いては、前記要素間係演算式は四則演算である。したが
って、操作者が把握し易い数値の関係を得ることができ
る。
【0008】3、16)本発明にかかる文書解析装置ま
たはプログラムを記憶した記憶媒体においては、自動演
算記号が存在する文書構成要素は数値含有文書構成要素
であると判断して、前記かな漢字変換辞書の前記第2の
データを用いて係り側と受け側の数値含有文書構成要素
間の係り受け関係を決定するとともに、前記第2の記憶
手段に記憶された対応テーブルに基づいて、前記数値含
有文書構成要素に存在する関係キーワードに対応する演
算式を抽出し、この演算式および前記数値含有文書構成
要素の数値を用いて前記数値含有文書構成要素間の数値
の関係を表す要素関係演算式を決定し、この要素関係演
算式を用いて、前記受け側の数値含有文書構成要素の数
値を演算して、前記自動演算記号に代えて演算結果を挿
入する。したがって、操作者は係り受け関係にある文書
構成要素の内、受け側の数値を入力せずに自動演算記号
を入力するだけで、正しい演算結果が得られる。
【0009】6)本発明にかかるプログラムを記憶した
記憶媒体においては、さらに前記数値含有文書構成要素
に含まれる助数詞を考慮して、前記要素関係演算式を
定する。したがって、助数詞をさらに用いて要素間係演
算式を決定できる。
【0010】8)本発明にかかるプログラムを記憶した
記憶媒体においては、前記要素関係演算式が報知され
る。したがって、操作者が前記数値の関係を把握するこ
とができる。
【0011】9)本発明にかかるプログラムを記憶した
記憶媒体においては、さらに、前記数値含有文書構成要
素も併せて報知される。したがって、操作者が前記数値
の関係を容易に把握することができる。
【0012】10)本発明にかかるプログラムを記憶し
た記憶媒体においては、前記決定した要素関係演算式を
用いて、前記数値含有文書構成要素中の数値に矛盾がな
いかが判断される。したがって、操作者は前記数値含有
文書構成要素中の数値に矛盾がないかを自ら判断する必
要がない。
【0013】11)本発明にかかるプログラムを記憶し
た記憶媒体においては、要素関係演算式を用いて係り受
け関係にある文書構成要素の内、受け側の数値に誤りが
ないか判断される。したがって、操作者は前記数値含有
文書構成要素中の数値に矛盾がないかを自ら判断する必
要がない。
【0014】12)本発明にかかるプログラムを記憶し
た記憶媒体においては、誤りありと判断した場合には、
前記受け側の数値自動修正される。したがって、前記
数値含有文書構成要素中の数値を自動的に修正すること
ができる。
【0015】13)本発明にかかるプログラムを記憶し
た記憶媒体においては、受け側の数値に誤りがある場合
には、これを報知する。したがって、操作者は前記数値
含有文書構成要素中の数値に矛盾がないかを自ら判断す
る必要がない。
【0016】14)本発明にかかるプログラムを記憶し
た記憶媒体においては、前記文書は、かな漢字変換確定
後の文書である。したがって、かな漢字変換確定後の文
書を校正することができる。
【0017】15)本発明にかかるプログラムを記憶し
た記憶媒体においては、前記文書は、かな漢字変換前の
文書である。したがって、かな漢字変換中に校正するこ
とができる。
【0018】17、18)本発明にかかる文書解析装置
またはその方法においては、前記決定した演算式および
前記数値含有文書構成要素の数値を用いて、前記数値含
有要素中の数値に誤りがないかを判断する。したがっ
て、前記数値含有文書構成要素中の数値に矛盾がないか
を自ら判断する必要がない。
【0019】
【発明の実施の態様】1.機能ブロック図の説明 本発明の一実施例を図面に基づいて説明する。図1に示
す文書解析装置1は、文書記憶手段3、要素分割手段
5、決定手段7、キーワード記憶手段8、関係報知手段
11、判断手段9、自動修正手段13を備えている。
【0020】文書記憶手段3は、数値を含む文書構成要
素を複数有する文書を記憶する。要素分割手段5は、前
記文書を文書構成要素に分割する。キーワード記憶手段
8は数値含有文書構成要素間の関係を決定する関係キー
ワードを記憶する。決定手段7は、前記複数の数値含有
文書構成要素間の関係を決定するとともに、決定した関
係に基づいて、数値含有文書構成要素の数値の関係を決
定する。例えば、前記意味解析結果および前記関係キー
ワードを用いて、前記数値含有文書構成要素間の関係を
決定する。
【0021】関係報知手段11は、前記数値含有文書構
成要素に含まれる数値の関係を報知する。決定手段7
は、意味解析結果に基づいて、数値含有文書構成要素間
の関係を決定する様にしてもよい。また、決定手段7
は、前記数値含有文書構成要素に含まれる助数詞に基づ
いて、前記数値含有文書構成要素間の関係を決定しても
よい。数値含有文書構成要素の数値の関係は演算式、例
えば、四則演算である。
【0022】また、決定手段7は、前記数値含有文書構
成要素に含まれる助数詞を考慮して、前記数値含有文書
構成要素間の関係を決定してもよい。
【0023】関係報知手段11は、前記数値の関係につ
いて、さらに、前記数値含有文書構成要素も併せて報知
する。
【0024】判断手段9は、前記決定された数値の関係
に基づいて、前記数値含有文書構成要素中の数値に矛盾
がないかを判断する。例えば、決定手段7が決定した要
素間関係に基づいて、受け側の数値に誤りがないか判断
する。自動修正手段15は、判断手段9が矛盾ありと判
断した場合には、これを自動修正する。
【0025】修正情報報知手段は17は、判断手段9に
よってなされた判断または、自動修正手段によって修正
された修正情報を報知する。
【0026】修正情報とは、例えば、修正後のデータま
たは修正処理を行った旨の表示情報をいう。また、文書
構成要素とは、実施形態では文節に該当するが、これに
限定されない。また、実施形態では、複合語処理をし
て、1文節として文節認識するようにしたが、かかる複
合語処理は行わなくてもよい。
【0027】2.ハードウェア構成 (2.1)概略 図2に示す文書解析装置40は、入力装置41、制御装
置43、表示装置45および記憶装置47を備えてい
る。入力装置41は、各種の命令を入力するためのもの
である。記憶装置47には、校正対象となる文書が記憶
される。制御装置43は、記憶装置47に記憶された
から、数値を含んだ部分を複数検出して、これらの数
値を含む部分の関係を決定するとともに、決定した関係
に基づいて、前記数値の関係を決定する。
【0028】(2.2)詳細 図3に、図2に示す文書解析装置40をCPUを用いて
実現したハードウェア構成の一例を示す。
【0029】文書解析装置40は、CPU23、メモリ
27、ハードディスク26、CRT30、FDD25、
キーボード28、マウス31およびバスライン29を備
えている。CPU23は、ハードディスク26に記憶さ
れた制御プログラムにしたがいバスライン29を介し
て、各部を制御する。
【0030】この制御プログラムは、FDD25を介し
て、プログラムが記憶されたフレキシブルディスク25
aから読み出されてハードディスク26にインストール
されたものである。なお、フレキシブルディスク以外
に、CD−ROM、ICカード等のプログラムを実体的
に一体化したコンピュータ可読の記憶媒体から、ハード
ディスクにインストールさせるようにしてもよい。さら
に、通信回線を用いてダウンロードするようにしてもよ
い。
【0031】本実施形態においては、プログラムをフレ
キシブルディスクからハードディスク26にインストー
ルさせることにより、フレキシブルディスクに記憶させ
たプログラムを間接的にコンピュータに実行させるよう
にしている。しかし、これに限定されることなく、フレ
キシブルディスクに記憶させたプログラムをFDD25
から直接的に実行するようにしてもよい。なお、コンピ
ュータによって、実行可能なプログラムとしては、その
ままのインストールするだけで直接実行可能なものはも
ちろん、一旦他の形態等に変換が必要なもの(例えば、
データ圧縮されているものを、解凍する等)、さらに
は、他のモジュール部分と組合して実行可能なものも含
む。
【0032】ハードディスク26には、さらに、校正辞
書部26b、キーワード記憶部26cを有する。校正辞
書部26bは、校正対象の文書を各文節に分割するとと
もに、各文節間の係り受けを決定するためのデータが記
憶されている。本実施形態においては、かな漢字変換の
時に用いる変換辞書を用いた。キーワード記憶部26c
には、図4に示すような関係キーワードと演算式の対応
テーブルが記憶されている。
【0033】メモリ27には、文書バッファ27a、作
業バッファ27bを有する。文書バッファ27aは入力
された校正対象文字列が記憶される。作業バッファ27
bには、後述する校正処理において生成される中間デー
タが記憶される。なお、メモリ27にはその他、各種の
演算結果等が記憶される。
【0034】CRT30には、修正情報等が表示され
る。
【0035】3.フローチャート つぎに、ハードディスク26に記憶されているプログラ
ムについて、図5、図6を用いて説明する。なお、以下
では、図7Aに示す文書を校正する場合を例として説明
する。
【0036】まず、CPU23は、校正対象文書を読み
込む(図5ステップST3)。これにより、図7Aに示
す文字列が、文書バッファ27aに記憶される。CPU
23は、校正辞書部26bに記憶された辞書データを用
いて、文書バッファ27aに記憶された文字列を形態素
解析する(図5ステップST5)。これにより、文書バ
ッファ27aに記憶された文字列は、図7Bに示すよう
に、形態素に分割されて作業バッファ27bに記憶され
る。
【0037】CPU23は、校正辞書部26bに記憶さ
れた辞書データを用いて、形態素解析された文字列から
文節の認定を行う(図5ステップST7)。これによ
り、作業バッファ27bに記憶された文字列は、図7C
に示すように、文節に区切られる。
【0038】CPU23は、校正辞書部26bに記憶さ
れた辞書データを用いて、各文節間の係り受けを決定す
る(図5ステップST9)。この場合、図8A,B,C
に示すように、各文節間の係り受けが決定されたとす
る。
【0039】CPU23は、全文節について、数詞、助
数詞、および図4に示すキーワードが存在しているか否
かを確認し、存在していればその文節を抽出する(図5
ステップST11)。この場合であれば、文節「750
万台」、「1.85兆円」、「13%増」、「800万
台」、「8%増」、「2兆円」が抽出され、作業バッフ
ァ26bに記憶される。
【0040】CPU23は、前記抽出した文節間に適用
する演算式を決定する(図5ステップST13)。本実
施形態においては、各文節間の係り受け、助数詞の種類
および図4に示す関係キーワードに基づいて、演算式を
決定した。
【0041】例えば、この場合、文節「750万台」と
文節「800万台」とは助数詞が同じである。また、文
節「1.85兆円」と文節「2兆円」とも同様である。
一方、文節「13%増」は文節「800万台」にかかっ
ている。また、文節「8%増」は文節「2兆円」にかか
っている。したがって、文節「750万台」と文節「8
00万台」との関係は、文節「13%増」で特定される
演算式で表されると判断する。この場合、文節「13%
増」はキーワード「%増」を含んでいるので、対応する
演算式「B=A*(100+x)/100」で表され
る。ここで、B:第2数詞文節の値、A:第1数詞文節
の値、x:キーワードを含む数詞の値である。すなわ
ち、文節「750万台」と文節「800万台」との関係
は、「800万=750万*(100+13)/10
0」で表されると判断する。また、文節「1.85兆
円」と文節「2兆円」との関係は、文節「8%増」で特
定される演算式で表されると判断する。したがって、同
様にして、「2兆=1.85兆*(100+8)/10
0」で表されると判断する。決定した演算式は作業バッ
ファ26bに記憶される。
【0042】CPU23は、ステップST13で決定し
演算式を用いて演算をする(図5ステップST1
5)。前記2つの演算式のうち、1つめの演算式「75
0万*(100+13)/100」の正しい結果は、
「847.5万」である。なお、演算結果「847.5
万」を同じ桁数となるように四捨五入して、演算結果
「850万」が得られる。また、2つめの演算式「1.
85兆*(100+8)/100」の正しい結果は
「1.998兆」である。これを四捨五入して「2兆」
が得られる。演算結果は作業バッファ26bに記憶され
る。
【0043】CPU23は、演算結果が間違っている
式があるか否か判断する(ステップST17)。この
場合、1つめの演算式「800万=750万*(100
+13)/100」は正しくないので、ステップST1
9に進み、変更処理を行う。
【0044】変更処理のフローチャートについて、図6
を用いて説明する。CPU23は、まず、図9に示すよ
うなダイアログボックスを表示する(ステップST2
1)。本実施形態においては、図9に示すように、誤り
対象の文節「800万台」とそのページ数および行数、
関連する表記「750万台」「13%増」とそのページ
数および行数、演算式、および正しい表記「850万
台」を表示した。
【0045】このダイアログボックスをみて、操作者は
変更操作を行う。正しい表記として示されている「85
0万台」に変更するのであれは、スイッチ51をマウス
31でクリックする。CPU23は、ステップST23
にてクリックされたと判断して、ステップST25でど
のスイッチがクリックされたかを判断する。この場合、
スイッチ51であるので、正しい表記に置換する(ステ
ップST27)。具体的には、1頁3行の文字列「80
0万台」を「850万台」に変更する。
【0046】つぎに、CPU23は、次表記の演算式が
あるか否かを判断する(ステップST29)。この場
合、もう1つの演算式は、四捨五入すると「2兆円」と
なり、正しいので、変更処理は終了する。
【0047】なお、誤っている演算式がある場合には、
ステップST31に進み、ダイアログボックス内の表示
を次表記の演算式に関係するものに変更し、以下ステッ
プST23以下の処理を繰り返す。
【0048】なお、表示されたダイアログボックスによ
る校正対象に誤りがない場合には、操作者は次チェック
ボタン50をクリックすればよい。CPU23は、ステ
ップST25にて次チェックボタン50がクリックされ
た場合には、ステップST29に進み、次表記の演算
があるか否かを判断する。この場合、次表記の演算式が
あるので、ダイアログボックスの表記を変更する(ステ
ップST31)。
【0049】また、ステップST25にてヘルプボタン
53がクリックされた場合には、ヘルプを表示する(ス
テップST27)。また、ステップST25にて、キャ
ンセルボタンがクリックされた場合には、変更処理は終
了する。
【0050】変更処理が終了すると、校正処理は終了す
る。
【0051】このように、本実施形態においては、キー
ワードおよび文節の係り受けに基づいて、演算式を決定
するようにしている。したがって、操作者が演算対象文
節及び演算式を特定することなく、数値を含む文節にお
ける入力ミスを検査およびその修正ができる。
【0052】なお、本実施形態においては、キーワード
および文節間の係り受け情報に基づいて、前記演算式を
決定するようにしたが、キーワードだけで決定するよう
にしてもよい。
【0053】4.他の実施形態 上記実施形態においては、キーワードおよび文節間の係
り受け情報に基づいて、前記演算式を決定するようにし
たが、以下のように、意味解析に基づいて前記演算式を
決定するようにしてもよい。
【0054】例えば、図8Aに示す文節「来年度の/パ
ソコンの/国内/出荷/予測」については、以下の文書
のタイトルであると認識して、「来年度」「パソコン」
「国内」「出荷」「予測」が意味解釈単語の候補と認識
する。この文書では、単語「年度」が何度も登場するの
で、意味解釈単語として決定する。また、「予測」値が
並べられている文書であり、対比するのは「年度」であ
ると認識する。また、「国内」「出荷」は全体の前提に
すぎないと認識する。これは、反対の単語である「国
外」、「入荷」でも、意味をなすからである。
【0055】図8Bに示す文節「パソコン分野では」
は、文の調子から入っているだけで、重要でないと判断
する。文節「今年度は/750万台、1.85兆円/で
あった。」については、今年度=xx台、今年度xx
円、の2つを述べていると判断する。具体的には、「で
ある」をキーとして特別処理、「xxはyyである」と
すればよい。また、「xx台」「yy円」が、今後の文
脈で(=主題にそって)重要である可能性は非常に高い
ので重要単語として抽出する。
【0056】図8Bに示す文節「来年度は」は、前の文
の文節「今年度」への対比相手として登場するので、重
要単語として抽出する。
【0057】なお、文体(先の文の調子)や展開からし
ても「である」が省略されていると解釈する。すなわ
ち、文書の末尾が名詞で終わっているけれども、「であ
る」が省略された文節であると解釈をする。
【0058】つぎに、図8Cに示す文節「来年度は/台
数で/対前年比/13%増の/800万台」について、
文節「台数で」は、前段の「xx台」に関係すると解釈
する。なお、文節「対前年比」から文意を決定する。な
お、文意は文節「対前年比」からでなくとも決定できる
が、先行の文節「今年度=750万台」「来年度」から
の数値関係づけに必要となる。これにより文節「750
万台」、「13%」、「800万台」についての関係
演算式)を特定できる。
【0059】また、「%増」の増がなければ「113
%」となるべきと理解すればよい。
【0060】文節「金額で同8%増の2兆円」について
は、文節「金額で」は、前段の「xx円」に関係すると
して判断する。そして、文節「同」は、その前後の文節
(この場合は後ろ)「%増」に基づいて、前の句から
「対前年比」に相当すると判断する。
【0061】このように、意味解析をし、校正対象の
の主題に即して文節間の関係を特定し、数字が含まれ
た文節間の演算式を特定することができる。
【0062】5.その他 本実施形態においては、かけ算の場合について説明した
が、その他、図4に示す演算式についても同様に適用で
きる。図4において、関係キーワード「合計」の場合に
は、でてくる数値を総計するようにすればよい。例え
ば、文書「乗客123名、乗務員8名、合計・・・」と
いうような場合である。
【0063】この実施形態においては、各文節間の係り
受けを決定してから、数詞、助数詞、キーワードの抽出
等を行ったが、逆でもよい。
【0064】上記実施形態においては、前記文書とし
て、かな漢字変換確定後の文書を採用したが、かな漢字
変換確定前の未確定文書であってもよい。
【0065】上記実施形態においては、操作者が入力し
た数値を検算するようにしたが、自動演算記号を仮に記
載しておき、かかる自動演算記号があると、前記決定し
文書構成要素間の関係に基づいて、係り受け側の数値
含有文書構成要素として決定し、この係り受け側の数値
含有文書構成要素の数値に代えて自動演算記号が存在す
る場合には、係り受け側の数値含有文書構成要素の数値
を演算して、前記自動演算記号に代えて演算結果を挿入
するようにしてもよい。
【0066】上記実施形態においては、ダイアログボッ
クスを自動表示するようにしたが、一旦、該当部分をハ
イライト表示し、ハイライト表示している文字列をクリ
ックすると、ダイアログボックスを表示するようにして
もよい。
【0067】なお、自動修正後、修正処理を行った旨を
表示するようにしてもよい。また、警告表示だけでもよ
い。また、ハイライト表示等の他の部分と区別できるよ
うに表示するだけでもよい。
【0068】上記実施形態においては、報知の一例とし
て表示するようにしたが、その他音声等を用いてもよ
い。
【0069】上記実施形態においては、演算式として四
則演算の例を示したが、演算式として表されるものであ
ればどのようなものであってもよく、その他、平均や標
準偏差等を求めることもできる。
【0070】本実施形態においては、図1に示す機能を
実現する為に、CPU23を用い、ソフトウェアによっ
てこれを実現している。しかし、その一部もしくは全て
を、ロジック回路等のハードウェアによって実現しても
よい。
【図面の簡単な説明】
【図1】本発明にかかる文書解析装置1の機能ブロック
図である。
【図2】図1に示す文書解析装置1のハードウエア構成
の一例を示す図である。
【図3】図2に示す文書解析装置40をCPU23を用
いて実現したハードウエア構成の一例を示す図である。
【図4】関係キーワードとその演算式との関係を特定す
るテーブルを示す図である。
【図5】変換処理のフローチャートである。
【図6】変換処理のフローチャートである。
【図7】校正対象文書を示す。
【図8】校正対象文書を示す。
【図9】ダイアログボックスを示す図である。
【符号の説明】
3・・・・・文書記憶手段 5・・・・・要素分割手段 7・・・・・決定手段 8・・・・・キーワード記憶手段 9・・・・・判断手段 11・・・・関係報知手段 15・・・・自動修正手段 17・・・・修正情報報知手段 23・・・CPU 27・・・メモリ

Claims (18)

    (57)【特許請求の範囲】
  1. 【請求項1】文書を記憶する第1の記憶手段、数値を含有する数値含有文書構成要素間の関係を決定す
    る関係キーワードと演算式との対応テーブルを記憶する
    第2の記憶手段前記文書を文書構成要素に分割する第1のデータおよび
    各文書構成要素間の係り受け関係を決定する第2のデー
    タを記憶するかな漢字変換辞書を記憶する変換辞書記憶
    手段、前記かな漢字変換辞書の前記第1のデータに基づいて、
    前記第1の記憶手段に記憶された文書 を文書構成要素に
    分割する要素分割手段、前記文書構成要素から数値を含有する数値含有文書構成
    要素を抽出して、前記かな漢字変換辞書の前記第2のデ
    ータを用いて前記数値含有文書構成要素間の係り受け関
    係を決定するとともに、前記第2の記憶手段に記憶され
    た対応テーブルに基づいて、前記数値含有文書構成要素
    に存在する関係キーワードに対応する演算式を抽出し、
    この演算式および前記数値含有文書構成要素の数値を用
    いて前記数値含有文書構成要素間の数値の関係を表す要
    素関係演算式を 決定する決定手段、 を備えたことを特徴とする文書解析装置。
  2. 【請求項2】請求項1の文書解析装置において、 前記演算式は四則演算であることを特徴とする文書解析
    装置
  3. 【請求項3】請求項1の文書解析装置において、 前記決定手段は、自動演算記号が存在する文書構成要素
    は数値含有文書構成要素であると判断して、前記かな漢
    字変換辞書の前記第2のデータを用いて係り側と受け側
    の数値含有文書構成要素間の係り受け関係を決定すると
    ともに、前記第 2の記憶手段に記憶された対応テーブル
    に基づいて、前記数値含有文書構成要素に存在する関係
    キーワードに対応する演算式を抽出し、この演算式およ
    び前記数値含有文書構成要素の数値を用いて前記数値含
    有文書構成要素間の数値の関係を表す要素関係演算式を
    決定し、この要素関係演算式を用いて、前記受け側の数
    値含有文書構成要素の数値を演算して、前記自動演算記
    号に代えて演算結果を挿入すること、 を特徴とする文書解析装置
  4. 【請求項4】記憶装置を備えたコンピュータを用いた文
    解析方法であって、1)数値を含有する数値含有文書構成要素間の関係を決
    定する関係キーワードと演算式との対応テーブルおよ
    び、2)前記文書を文書構成要素に分割する第1のデー
    タと各文書構成要素間の係り受け関係を決定する第2の
    データとを記憶するかな漢字変換辞書を、前記記憶装置
    に記憶させ、 校正対象の文書が与えられると、前記かな漢字変換辞書
    の前記第1のデータを用いて、当該文書を文書構成要素
    に分割し、 前記文書構成要素から数値を含有する数値含有文書構成
    要素を抽出して、前記かな漢字変換辞書の前記第2のデ
    ータを用いて数値を含有する数値含有文書構成要素間の
    係り受け関係を決定し、 前記対応テーブルを用いて、前記数値含有文書構成要素
    中に存在する関係キーワードに対応する演算式を抽出
    し、この演算式および前記数値含有文書構成要素の数値
    を用いて前記数値含有文書構成要素間の数値の関係を表
    す要素関係演算式を決定すること、 を特徴とするコンピュータを用いた文書解析方法。
  5. 【請求項5】1)数値を含有する数値含有文書構成要素
    間の関係を決定する関係キーワードと演算式との対応テ
    ーブルおよび、2)文書を文書構成要素に分割する第1
    のデータと各文書構成要素間の係り受け関係を決定する
    第2のデータとを記憶するかな漢字変換辞書を記憶する
    記憶装置を備えたコンピュータを用いて文書解析装置を
    実現するプログラムを記憶した記憶媒体であって、 前記かな漢字変換辞書の前記第1のデータを用いて、前
    記記憶装置から読み出した文書を文書構成要素に分割
    し、 前記文書構成要素から数値を含有する数値含有文書構成
    要素を抽出して、前記かな漢字変換辞書の第2のデータ
    を用いて数値を含有する数値含有文書構成要素間の係り
    受け関係を決定し、 前記対応テーブルを用いて前記数値含有文書構成要素
    に存在する関係キーワードに対応する演算式を抽出し、
    この演算式および前記数値含有文書構成要素の数値を用
    いて前記数値含有文書構成要素間の数値の関係を表す要
    素関係演算式を決定する、 処理を前記コンピュータに実行させるためのプログラム
    を記憶した記憶媒体。
  6. 【請求項6】請求項5のプログラムを記憶した記憶媒体
    において、 前記プログラムは、さらに、前記数値含有文書構成要素
    に含まれる助数詞を考慮して、前記要素関係演算式を
    定する処理を前記コンピュータに実行させること、 を特徴とするプログラムを記憶した記憶媒体
  7. 【請求項7】請求項5または請求項6のプログラムを記
    憶した記憶媒体において、 前記演算式は四則演算であることを特徴とするプログラ
    ムを記憶した記憶媒体
  8. 【請求項8】請求項5〜請求項7のいずれかのプログラ
    ムを記憶した記憶媒体において、 前記プログラムは、前記要素関係演算式を報知する処理
    を前記コンピュータに実行させること、 を特徴とするプログラムを記憶した記憶媒体
  9. 【請求項9】請求項8のプログラムを記憶した記憶媒体
    において、 前記プログラムは、さらに、前記数値含有文書構成要素
    も併せて報知する処理を前記コンピュータに実行させる
    こと、 を特徴とするプログラムを記憶した記憶媒体
  10. 【請求項10】請求項〜請求項9のいずれかのプログ
    ラムを記憶した記憶媒体において、 前記プログラムは、前記決定した要素関係演算式を用い
    、前記数値含有文書構成要素中の数値に矛盾がないか
    を判断する処理を前記コンピュータに実行させること、 を備えたことを特徴とするプログラムを記憶した記憶媒
  11. 【請求項11】請求項10のプログラムを記憶した記憶
    媒体において、 前記プログラムは、前記決定した要素関係演算式を用い
    て、係り受け関係にある文書構成要素の内、受け側の
    値に誤りがないか判断すること、 を特徴とするプログラムを記憶した記憶媒体
  12. 【請求項12】請求項11のプログラムを記憶した記憶
    媒体において、 前記プログラムは、前記受け側の数値に誤りがあると判
    断した場合には、前記受け側の数値を自動修正する処理
    を前記コンピュータに実行させること、 を特徴とするプログラムを記憶した記憶媒体
  13. 【請求項13】請求項11のプログラムを記憶した記憶
    媒体において、 前記プログラムは、前記受け側の数値に誤りがある場合
    には、これを報知する処理を前記コンピュータに実行さ
    せること、 を特徴とするプログラムを記憶した記憶媒体
  14. 【請求項14】請求項5〜請求項13のいずれかのプロ
    グラムを記憶した記憶媒体において、 前記文書は、かな漢字変換確定後の文書であること、 を特徴とするプログラムを記憶した記憶媒体
  15. 【請求項15】請求項5〜請求項13のいずれかのプロ
    グラムを記憶した記憶媒体において、 前記文書は、かな漢字変換前の文書であること、 を特徴とするプログラムを記憶した記憶媒体
  16. 【請求項16】請求項5のプログラムを記憶した記憶媒
    体において、 前記プログラムは、自動演算記号が存在する文書構成要
    素は数値含有文書構成要素であると判断して、前記かな
    漢字変換辞書の前記第2のデータを用いて係り側と受け
    側の数値含有文書構成要素間の係り受け関係を決定する
    とともに、前記第2の記憶手段に記憶された対応テーブ
    ルに基づいて、前記数値含有文書構成要素に存在する関
    係キーワードに対応する演算式を抽出し、この演算式お
    よび前記数値含有文書構成要素の数値を用いて前記数値
    含有文書構成要素間の数値の関係を表す要素関係演算式
    決定し、この要素関係演算式を用いて、前記受け側の
    値含有文書構成要素の数値を演算して、前記自動演算
    記号に代えて演算結果を挿入する処理を前記コンピュー
    タに実行させること、 を特徴とするプログラムを記憶した記憶媒体
  17. 【請求項17】請求項1の文書解析装置において、 前記決定した要素関係演算式を用いて、受け側の数値に
    誤りがないかを判断する判断手段、 を備えたことを特徴とする文書解析装置。
  18. 【請求項18】請求項4の文書解析方法において、 前記決定した要素関係演算式を用いて、前記数値含有要
    素中の数値に誤りがないかを判断すること、 を特徴とするコンピュータを用いた文書解析方法。
JP10190410A 1998-07-06 1998-07-06 文書解析装置およびその方法 Expired - Fee Related JP2994336B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10190410A JP2994336B1 (ja) 1998-07-06 1998-07-06 文書解析装置およびその方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10190410A JP2994336B1 (ja) 1998-07-06 1998-07-06 文書解析装置およびその方法

Publications (2)

Publication Number Publication Date
JP2994336B1 true JP2994336B1 (ja) 1999-12-27
JP2000020521A JP2000020521A (ja) 2000-01-21

Family

ID=16257688

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10190410A Expired - Fee Related JP2994336B1 (ja) 1998-07-06 1998-07-06 文書解析装置およびその方法

Country Status (1)

Country Link
JP (1) JP2994336B1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002140468A (ja) * 2000-10-31 2002-05-17 Hitachi Ltd 化学物質の排出量・移動量の届出支援方法および化学物質の排出量・移動量の届出支援装置
US6449814B1 (en) * 2001-09-13 2002-09-17 Summit Polymers, Inc. Trim fastener clip employing multiple lines-of-contact stabilization
JP4397221B2 (ja) * 2003-11-27 2010-01-13 株式会社 日立システムアンドサービス テキスト文から抽出した情報を利用したリンク設定装置およびその方法
JP6421160B2 (ja) * 2016-10-28 2018-11-07 ブライス トーマス 医療報告を生成するための方法及びシステム
JP6813549B2 (ja) * 2018-10-15 2021-01-13 ブライス トーマス 医療報告を生成するための方法及びシステム
JP2021047905A (ja) * 2020-12-17 2021-03-25 ブライス トーマス 医療報告を生成するための方法及びシステム
CN112560430B (zh) * 2020-12-25 2024-04-02 北京百度网讯科技有限公司 文本中数值内容的纠错方法、装置及电子设备

Also Published As

Publication number Publication date
JP2000020521A (ja) 2000-01-21

Similar Documents

Publication Publication Date Title
US5642522A (en) Context-sensitive method of finding information about a word in an electronic dictionary
JPH07325828A (ja) 文法チェックシステム
WO2001082111A2 (en) Computer-aided reading system and method with cross-language reading wizard
JP3372532B2 (ja) 感情情報抽出方法および感情情報抽出プログラムの計算機読み取り可能な記録媒体
Glass et al. A naive salience-based method for speaker identification in fiction books
JP2994336B1 (ja) 文書解析装置およびその方法
JP2007122660A (ja) 文書データ処理装置および文書データ処理プログラム
JPH0816597A (ja) 単語辞書登録装置及び文書認識装置
JPS63163956A (ja) 文書作成・校正支援装置
JP2621999B2 (ja) 文書処理装置
JP2002091961A (ja) コーパス誤りの検出・修正システム,コーパス誤りの検出・修正処理方法およびそのプログラム記録媒体
JP3102636B2 (ja) 表記文字列変換装置および表記文字列変換方法
JP3856515B2 (ja) 文書校正装置
JP3924899B2 (ja) テキスト検索装置およびテキスト検索方法
JP3935374B2 (ja) 辞書構築支援方法、装置及びプログラム
JP3061855B2 (ja) かな漢字変換装置及びかな漢字変換方法
JP2776069B2 (ja) 文章検査装置
JPH09223143A (ja) 文書情報処理装置
JPH07129577A (ja) 文書校正支援装置
JP3524189B2 (ja) 文字処理装置
JPS62212767A (ja) 辞書更新機能付き自然言語処理方式
JPH1139347A (ja) テキスト検索システム,インデックス作成装置,テキスト検索装置及びコンピュータ読み取り可能な記録媒体
JPH02136959A (ja) 日本文訂正候補抽出装置
JPH10187724A (ja) 文書作成支援方法及び装置
JPS63163957A (ja) 文書作成・校正支援装置

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081022

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111022

Year of fee payment: 12

LAPS Cancellation because of no payment of annual fees