JP2000020521A - 文書解析装置およびその方法 - Google Patents

文書解析装置およびその方法

Info

Publication number
JP2000020521A
JP2000020521A JP10190410A JP19041098A JP2000020521A JP 2000020521 A JP2000020521 A JP 2000020521A JP 10190410 A JP10190410 A JP 10190410A JP 19041098 A JP19041098 A JP 19041098A JP 2000020521 A JP2000020521 A JP 2000020521A
Authority
JP
Japan
Prior art keywords
document
numerical value
relationship
determined
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10190410A
Other languages
English (en)
Other versions
JP2994336B1 (ja
Inventor
Hiroki Amo
博喜 阿望
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JustSystems Corp
Original Assignee
JustSystems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JustSystems Corp filed Critical JustSystems Corp
Priority to JP10190410A priority Critical patent/JP2994336B1/ja
Application granted granted Critical
Publication of JP2994336B1 publication Critical patent/JP2994336B1/ja
Publication of JP2000020521A publication Critical patent/JP2000020521A/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 数値を含む文書について、数値入力が間違っ
ていないかを判断する。 【解決手段】 校正対象文章を読み込む(ST3)。校
正辞書部26bに記憶された辞書データを用いて、形態
素解析、形態素解析された文字列から文節の認定および
各文節間の係り受けを決定する(ST5、ST7、ST
9)。全文節について、数詞、助数詞、および図4に示
す関係キーワードが存在しているか否かを確認し、存在
していればその文節を抽出する(ST11)。前記抽出
した文節間に適用する計算式を、助数詞および係り関係
に基づいて決定する(ST13)。この計算式を用いて
演算する(ST15)。計算結果が間違っている計算式
があるか否か判断する(ST17)。正しくない場合に
は、変更処理を行う(ST19)。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、文書の解析装置
に関し、特に数値を含む文章の入力ミス指摘、修正に関
する。
【0002】
【従来技術およびその課題】特開平4−130571号
公報には、別途電卓等を用いることなく、入力されてい
る数値を含む文字列について、検算処理を実行できる文
書作成装置が開示されている。
【0003】上記文書作成装置は、入力された文字列中
の数値部分を特定するとともに、その計算式を特定する
と、演算結果が表示されるというものである。これによ
り、電卓等に別途数値を入力する煩雑を避けることがで
きる。
【0004】しかし、上記文書作成装置においても、や
はり、操作者が、数値部分がどこか、さらに計算式とし
て何を用いるかを特定しなければならない。かかる特定
は、数値部分が多い場合には非常に煩雑である。
【0005】この発明は上記問題を解決し、数値を含む
文書について数値が誤って入力されていないかを判断で
きる文章解析装置またはその方法を提供することを目的
とする。
【0006】
【課題を解決するための手段および発明の効果】本発明
にかかる文章解析装置または文章解析方法においては、
数値を含む文書構成要素を複数有する文書を文書構成要
素に分割し、前記複数の数値含有文書構成要素間の関係
を決定するとともに、決定した関係に基づいて、数値含
有文書構成要素の数値の関係を決定する。したがって、
操作者が数値を含む文書構成要素の特定およびその関係
を入力することなく、数値含有文書構成要素の数値の関
係が自動的に決定される。これにより、操作者の作業の
煩雑を除去できる文章解析装置を提供することができ
る。
【0007】本発明にかかる文章解析装置においては、
意味解析結果に基づいて、数値含有文書構成要素間の関
係を決定する。したがって、意味解析結果に基づき、数
値含有文書構成要素の数値の関係が決定できる。
【0008】本発明にかかる文章解析装置においては、
数値含有文書構成要素間の関係を決定する関係キーワー
ドを記憶するキーワード記憶手段を備え、前記決定手段
は、意味解析結果および前記関係キーワードを用いて、
前記数値含有文書構成要素間の関係を決定する。したが
って、意味解析結果だけでなく、前記関係キーワードを
参照して、数値含有文書構成要素の数値の関係が決定で
きる。これにより、より正確に、前記関係を決定するこ
とができる。
【0009】本発明にかかる文章解析装置においては、
前記決定手段は、前記数値含有文書構成要素に含まれる
助数詞に基づいて、前記数値含有文書構成要素間の関係
を決定する。したがって、助数詞に基づき、数値含有文
書構成要素の数値の関係が決定できる本発明にかかる文
章解析装置においては、数値含有文書構成要素間の関係
を決定する関係キーワードを記憶するキーワード記憶手
段を備え、前記決定手段は、前記関係キーワードを用い
て、前記数値含有文書構成要素間の関係を決定する。し
たがって、関係キーワードに基づき、数値含有文書構成
要素の数値の関係が決定できる。
【0010】本発明にかかる文章解析装置においては、
前記数値含有文書構成要素の数値の関係は、演算式であ
る。したがって、操作者が把握し易い前記数値の関係を
得ることができる。
【0011】本発明にかかる文章解析装置においては前
記演算式は四則演算である。したがって、操作者が把握
し易い数値の関係を得ることができる。
【0012】本発明にかかる文章解析装置においては、
関係報知手段は、前記数値含有文書構成要素に含まれる
数値の関係を報知する。したがって、操作者が前記数値
の関係を把握することができる。
【0013】本発明にかかる文章解析装置においては、
前記関係報知手段は、前記数値の関係について、さら
に、前記数値含有文書構成要素も併せて報知する。した
がって、操作者が前記数値の関係を容易に把握すること
ができる。
【0014】本発明にかかる文章解析装置においては、
前記判断手段は、前記決定手段が決定した数値の関係に
基づいて、前記数値含有文書構成要素中の数値に矛盾が
ないかを判断する。したがって、操作者は前記数値含有
文書構成要素中の数値に矛盾がないかを自ら判断する必
要がない。
【0015】本発明にかかる文章解析装置においては、
前記判断手段は、決定手段が決定した要素間関係に基づ
いて、係り受け側の数値に誤りがないか判断する。した
がって、操作者は前記数値含有文書構成要素中の数値に
矛盾がないかを自ら判断する必要がない。
【0016】本発明にかかる文章解析装置においては、
前記自動修正手段は前記判断手段が矛盾ありと判断した
場合には、自動修正する。したがって、操作者は前記数
値含有文書構成要素中の数値が自動的に修正される。
【0017】本発明にかかる文章解析装置においては、
前記文書は、かな漢字変換確定後の文書である。したが
って、かな漢字変換確定後の文書を校正することができ
る。
【0018】本発明にかかる文章解析装置においては、
前記文書は、かな漢字変換前の文書である。したがっ
て、かな漢字変換中に校正することができる。
【0019】本発明にかかる文章解析装置においては、
前記決定手段が決定した要素間関係に基づいて、係り受
け側の数値含有文書構成要素を決定し、この係り受け側
の数値含有文書構成要素に数値に代えて自動演算記号が
存在する場合には、係り受け側の数値含有文書構成要素
の数値を演算して、前記自動演算記号に代えて演算結果
を挿入する。したがって、操作者は係り受け側の数値を
入力せずに自動演算記号を入力するだけで、正しい演算
結果が得られる。
【0020】本発明にかかる文章解析方法においては、
ある計算式を意味する文章について、その文章の意味す
る計算式を求める文章解析方法であって、前記文章の文
書構成を特定し、文章構成要素間の関係を推定し、推定
した関係に基づいて、前記計算式を決定する。したがっ
て、操作者が検算対象の数値を入力することなく、演算
式が自動的に決定される。これにより、操作者の作業の
煩雑を除去できる文章解析装置を提供することができ
る。
【0021】
【発明の実施の態様】1.機能ブロック図の説明 本発明の一実施例を図面に基づいて説明する。図1に示
す文書解析装置1は、文書記憶手段3、要素分割手段
5、決定手段7、キーワード記憶手段8、関係報知手段
11、判断手段9、自動修正手段13を備えている。
【0022】文書記憶手段3は、数値を含む文書構成要
素を複数有する文書を記憶する。要素分割手段5は、前
記文書を文書構成要素に分割する。キーワード記憶手段
8は数値含有文書構成要素間の関係を決定する関係キー
ワードを記憶する。決定手段7は、前記複数の数値含有
文書構成要素間の関係を決定するとともに、決定した関
係に基づいて、数値含有文書構成要素の数値の関係を決
定する。例えば、前記意味解析結果および前記関係キー
ワードを用いて、前記数値含有文書構成要素間の関係を
決定する。
【0023】関係報知手段11は、前記数値含有文書構
成要素に含まれる数値の関係を報知する。決定手段7
は、意味解析結果に基づいて、数値含有文書構成要素間
の関係を決定する様にしてもよい。また、決定手段7
は、前記数値含有文書構成要素に含まれる助数詞に基づ
いて、前記数値含有文書構成要素間の関係を決定しても
よい。数値含有文書構成要素の数値の関係は演算式、例
えば、四則演算である。
【0024】また、決定手段7は、前記数値含有文書構
成要素に含まれる助数詞を考慮して、前記数値含有文書
構成要素間の関係を決定してもよい。
【0025】関係報知手段11は、前記数値の関係につ
いて、さらに、前記数値含有文書構成要素も併せて報知
する。
【0026】判断手段9は、前記決定された数値の関係
に基づいて、前記数値含有文書構成要素中の数値に矛盾
がないかを判断する。例えば、決定手段7が決定した要
素間関係に基づいて、係り受け側の数値に誤りがないか
判断する。自動修正手段15は、判断手段9が矛盾あり
と判断した場合には、これを自動修正する。例えば、判
断手段9は、決定した要素間関係に基づいて、係り受け
側の数値に誤りがないか判断する。
【0027】修正情報報知手段は17は、判断手段9に
よってなされた判断または、自動修正手段によって修正
された修正情報を報知する。修正情報とは、例えば、修
正後のデータまたは修正処理を行った旨の表示情報をい
う。また、文書構成要素とは、実施形態では文節に該当
するが、これに限定されない。また、実施形態では、複
合語処理をして、1文節として文節認識するようにした
が、かかる複合語処理は行わなくてもよい。
【0028】2.ハードウェア構成 (2.1)概略 図2に示す文書解析装置40は、入力装置41、制御装
置43、表示装置45および記憶装置47を備えてい
る。入力装置41は、各種の命令を入力するためのもの
である。記憶装置47には、校正対象となる文章が記憶
される。制御装置43は、記憶装置47に記憶された文
章から、数値を含んだ部分を複数検出して、これらの数
値を含む部分の関係を決定するとともに、決定した関係
に基づいて、前記数値の関係を決定する。
【0029】(2.2)詳細 図3に、図2に示す文書解析装置40をCPUを用いて
実現したハードウェア構成の一例を示す。
【0030】文書解析装置40は、CPU23、メモリ
27、ハードディスク26、CRT30、FDD25、
キーボード28、マウス31およびバスライン29を備
えている。CPU23は、ハードディスク26に記憶さ
れた制御プログラムにしたがいバスライン29を介し
て、各部を制御する。
【0031】この制御プログラムは、FDD25を介し
て、プログラムが記憶されたフレキシブルディスク25
aから読み出されてハードディスク26にインストール
されたものである。なお、フレキシブルディスク以外
に、CD−ROM、ICカード等のプログラムを実体的
に一体化したコンピュータ可読の記憶媒体から、ハード
ディスクにインストールさせるようにしてもよい。さら
に、通信回線を用いてダウンロードするようにしてもよ
い。
【0032】本実施形態においては、プログラムをフレ
キシブルディスクからハードディスク26にインストー
ルさせることにより、フレキシブルディスクに記憶させ
たプログラムを間接的にコンピュータに実行させるよう
にしている。しかし、これに限定されることなく、フレ
キシブルディスクに記憶させたプログラムをFDD25
から直接的に実行するようにしてもよい。なお、コンピ
ュータによって、実行可能なプログラムとしては、その
ままのインストールするだけで直接実行可能なものはも
ちろん、一旦他の形態等に変換が必要なもの(例えば、
データ圧縮されているものを、解凍する等)、さらに
は、他のモジュール部分と組合して実行可能なものも含
む。
【0033】ハードディスク26には、さらに、校正辞
書部26b、キーワード記憶部26cを有する。校正辞
書部26bは、校正対象の文章を各文節に分割するとと
もに、各文節間の係り受けを決定するためのデータが記
憶されている。本実施形態においては、かな漢字変換の
時に用いる変換辞書を用いた。キーワード記憶部26c
には、図4に示すような関係キーワードと計算式の対応
テーブルが記憶されている。
【0034】メモリ27には、文章バッファ27a、作
業バッファ27bを有する。文章バッファ27aは入力
された校正対象文字列が記憶される。作業バッファ27
bには、後述する校正処理において生成される中間デー
タが記憶される。なお、メモリ27にはその他、各種の
演算結果等が記憶される。
【0035】CRT30には、修正情報等が表示され
る。
【0036】3.フローチャート つぎに、ハードディスク26に記憶されているプログラ
ムについて、図5、図6を用いて説明する。なお、以下
では、図7Aに示す文章を校正する場合を例として説明
する。
【0037】まず、CPU23は、校正対象文章を読み
込む(図5ステップST3)。これにより、図7Aに示
す文字列が、文書バッファ27aに記憶される。CPU
23は、校正辞書部26bに記憶された辞書データを用
いて、文書バッファ27aに記憶された文字列を形態素
解析する(図5ステップST5)。これにより、文書バ
ッファ27aに記憶された文字列は、図7Bに示すよう
に、形態素に分割されて作業バッファ27bに記憶され
る。
【0038】CPU23は、校正辞書部26bに記憶さ
れた辞書データを用いて、形態素解析された文字列から
文節の認定を行う(図5ステップST7)。これによ
り、作業バッファ27bに記憶された文字列は、図7C
に示すように、文節に区切られる。
【0039】CPU23は、校正辞書部26bに記憶さ
れた辞書データを用いて、各文節間の係り受けを決定す
る(図5ステップST9)。この場合、図8A,B,C
に示すように、各文節間の係り受けが決定されたとす
る。
【0040】CPU23は、全文節について、数詞、助
数詞、および図4に示すキーワードが存在しているか否
かを確認し、存在していればその文節を抽出する(図5
ステップST11)。この場合であれば、文節「750
万台」、「1.85兆円」、「13%増」、「800万
台」、「8%増」、「2兆円」が抽出され、作業バッフ
ァ26bに記憶される。
【0041】CPU23は、前記抽出した文節間に適用
する計算式を決定する(図5ステップST13)。本実
施形態においては、各文節間の係り受け、助数詞の種類
および図4に示す関係キーワードに基づいて、計算式を
決定した。
【0042】例えば、この場合、文節「750万台」と
文節「800万台」とは助数詞が同じである。また、文
節「1.85兆円」と文節「2兆円」とも同様である。
一方、文節「13%増」は文節「800万台」にかかっ
ている。また、文節「8%増」は文節「2兆円」にかか
っている。したがって、文節「750万台」と文節「8
00万台」との関係は、文節「13%増」で特定される
計算式で表されると判断する。この場合、文節「13%
増」はキーワード「%増」を含んでいるので、対応する
計算式「B=A*(100+x)/100」で表され
る。ここで、B:第2数詞文節の値、A:第1数詞文節
の値、x:キーワードを含む数詞の値である。すなわ
ち、文節「750万台」と文節「800万台」との関係
は、「800万=750万*(100+13)/10
0」で表されると判断する。また、文節「1.85兆
円」と文節「2兆円」との関係は、文節「8%増」で特
定される計算式で表されると判断する。したがって、同
様にして、「2兆=1.85兆*(100+8)/10
0」で表されると判断する。決定した計算式は作業バッ
ファ26bに記憶される。
【0043】CPU23は、ステップST13で決定し
た計算式を用いて演算をする(図5ステップST1
5)。前記2つの計算式のうち、1つめの計算式「75
0万*(100+13)/100」の正しい結果は、
「847.5万」である。なお、計算結果「847.5
万」を同じ桁数となるように四捨五入して、計算結果
「850万」が得られる。また、2つめの計算式「1.
85兆*(100+8)/100」の正しい結果は
「1.998兆」である。これを四捨五入して「2兆」
が得られる。計算結果は作業バッファ26bに記憶され
る。
【0044】CPU23は、計算結果が間違っている計
算式があるか否か判断する(ステップST17)。この
場合、1つめの計算式「800万=750万*(100
+13)/100」は正しくないので、ステップST1
9に進み、変更処理を行う。
【0045】変更処理のフローチャートについて、図6
を用いて説明する。CPU23は、まず、図9に示すよ
うなダイアログボックスを表示する(ステップST2
1)。本実施形態においては、図9に示すように、誤り
対象の文節「800万台」とそのページ数および行数、
関連する表記「750万台」「13%増」とそのページ
数および行数、計算式、および正しい表記「850万
台」を表示した。
【0046】このダイアログボックスをみて、操作者は
変更操作を行う。正しい表記として示されている「85
0万台」に変更するのであれは、スイッチ51をマウス
31でクリックする。CPU23は、ステップST23
にてクリックされたと判断して、ステップST25でど
のスイッチがクリックされたかを判断する。この場合、
スイッチ51であるので、正しい表記に置換する(ステ
ップST27)。具体的には、1頁3行の文字列「80
0万台」を「850万台」に変更する。
【0047】つぎに、CPU23は、次表記の計算式が
あるか否かを判断する(ステップST29)。この場
合、もう1つの計算式は、四捨五入すると「2兆円」と
なり、正しいので、変更処理は終了する。
【0048】なお、誤っている計算式がある場合には、
ステップST31に進み、ダイアログボックス内の表示
を次表記の計算式に関係するものに変更し、以下ステッ
プST23以下の処理を繰り返す。
【0049】なお、表示されたダイアログボックスによ
る校正対象に誤りがない場合には、操作者は次チェック
ボタン50をクリックすればよい。CPU23は、ステ
ップST25にて次チェックボタン50がクリックされ
た場合には、ステップST29に進み、次表記の計算式
があるか否かを判断する。この場合、次表記の計算式が
あるので、ダイアログボックスの表記を変更する(ステ
ップST31)。
【0050】また、ステップST25にてヘルプボタン
53がクリックされた場合には、ヘルプを表示する(ス
テップST27)。また、ステップST25にて、キャ
ンセルボタンがクリックされた場合には、変更処理は終
了する。
【0051】変更処理が終了すると、校正処理は終了す
る。
【0052】このように、本実施形態においては、キー
ワードおよび文節の係り受けに基づいて、計算式を決定
するようにしている。したがって、操作者が計算対象文
節及び計算式を特定することなく、数値を含む文節にお
ける入力ミスを検査およびその修正ができる。
【0053】なお、本実施形態においては、キーワード
および文節間の係り受け情報に基づいて、前記計算式を
決定するようにしたが、キーワードだけで決定するよう
にしてもよい。
【0054】4.他の実施形態 上記実施形態においては、キーワードおよび文節間の係
り受け情報に基づいて、前記計算式を決定するようにし
たが、以下のように、意味解析に基づいて前記計算式を
決定するようにしてもよい。
【0055】例えば、図8Aに示す文節「来年度の/パ
ソコンの/国内/出荷/予測」については、以下の文章
のタイトルであると認識して、「来年度」「パソコン」
「国内」「出荷」「予測」が意味解釈単語の候補と認識
する。この文章では、単語「年度」が何度も登場するの
で、意味解釈単語として決定する。また、「予測」値が
並べられている文章であり、対比するのは「年度」であ
ると認識する。また、「国内」「出荷」は全体の前提に
すぎないと認識する。これは、反対の単語である「国
外」、「入荷」でも、意味をなすからである。
【0056】図8Bに示す文節「パソコン分野では」
は、文の調子から入っているだけで、重要でないと判断
する。文節「今年度は/750万台、1.85兆円/で
あった。」については、今年度=xx台、今年度xx
円、の2つを述べていると判断する。具体的には、「で
ある」をキーとして特別処理、「xxはyyである」と
すればよい。また、「xx台」「yy円」が、今後の文
脈で(=主題にそって)重要である可能性は非常に高い
ので重要単語として抽出する。
【0057】図8Bに示す文節「来年度は」は、前の文
の文節「今年度」への対比相手として登場するので、重
要単語として抽出する。
【0058】なお、文体(先の文の調子)や展開からし
ても「である」が省略されていると解釈する。すなわ
ち、文章の末尾が名詞で終わっているけれども、「であ
る」が省略された文節であると解釈をする。
【0059】つぎに、図8Cに示す文節「来年度は/台
数で/対前年比/13%増の/800万台」について、
文節「台数で」は、前段の「xx台」に関係すると解釈
する。なお、文節「対前年比」から文意を決定する。な
お、文意は文節「対前年比」からでなくとも決定できる
が、先行の文節「今年度=750万台」「来年度」から
の数値関係づけに必要となる。これにより文節「750
万台」、「13%」、「800万台」についての関係
(計算式)を特定できる。
【0060】また、「%増」の増がなければ「113
%」となるべきと理解すればよい。
【0061】文節「金額で同8%増の2兆円」について
は、文節「金額で」は、前段の「xx円」に関係すると
して判断する。そして、文節「同」は、その前後の文節
(この場合は後ろ)「%増」に基づいて、前の句から
「対前年比」に相当すると判断する。
【0062】このように、意味解析をし、校正対象の文
章の主題に即して文節間の関係を特定し、数字が含まれ
た文節間の計算式を特定することができる。
【0063】5.その他本実施形態においては、かけ算
の場合について説明したが、その他、図4に示す計算式
についても同様に適用できる。図4において、関係キー
ワード「合計」の場合には、でてくる数値を総計するよ
うにすればよい。例えば、文章「乗客123名、乗務員
8名、合計・・・」というような場合である。
【0064】この実施形態においては、各文節間の係り
受けを決定してから、数詞、助数詞、キーワードの抽出
等を行ったが、逆でもよい。
【0065】上記実施形態においては、前記文書とし
て、かな漢字変換確定後の文書を採用したが、かな漢字
変換確定前の未確定文書であってもよい。
【0066】上記実施形態においては、操作者が入力し
た数値を検算するようにしたが、自動演算記号を仮に記
載しておき、かかる自動演算記号があると、前記決定し
た要素間関係に基づいて、係り受け側の数値含有文書構
成要素を決定し、この係り受け側の数値含有文書構成要
素の数値に代えて自動演算記号が存在する場合には、係
り受け側の数値含有文書構成要素の数値を演算して、前
記自動演算記号に代えて演算結果を挿入するようにして
もよい。
【0067】上記実施形態においては、ダイアログボッ
クスを自動表示するようにしたが、一旦、該当部分をハ
イライト表示し、ハイライト表示している文字列をクリ
ックすると、ダイアログボックスを表示するようにして
もよい。
【0068】なお、自動修正後、修正処理を行った旨を
表示するようにしてもよい。また、警告表示だけでもよ
い。また、ハイライト表示等の他の部分と区別できるよ
うに表示するだけでもよい。
【0069】上記実施形態においては、報知の一例とし
て表示するようにしたが、その他音声等を用いてもよ
い。
【0070】上記実施形態においては、計算式として四
則演算の例を示したが、計算式として表されるものであ
ればどのようなものであってもよく、その他、平均や標
準偏差等を求めることもできる。
【0071】本実施形態においては、図1に示す機能を
実現する為に、CPU23を用い、ソフトウェアによっ
てこれを実現している。しかし、その一部もしくは全て
を、ロジック回路等のハードウェアによって実現しても
よい。
【図面の簡単な説明】
【図1】本発明にかかる文書解析装置1の機能ブロック
図である。
【図2】図1に示す文書解析装置1のハードウエア構成
の一例を示す図である。
【図3】図2に示す文書解析装置40をCPU23を用
いて実現したハードウエア構成の一例を示す図である。
【図4】関係キーワードとその計算式との関係を特定す
るテーブルを示す図である。
【図5】変換処理のフローチャートである。
【図6】変換処理のフローチャートである。
【図7】校正対象文書を示す。
【図8】校正対象文書を示す。
【図9】ダイアログボックスを示す図である。
【符号の説明】
3・・・・・文章記憶手段 5・・・・・要素分割手段 7・・・・・決定手段 8・・・・・キーワード記憶手段 9・・・・・判断手段 11・・・・関係報知手段 15・・・・自動修正手段 17・・・・修正情報報知手段 23・・・CPU 27・・・メモリ
─────────────────────────────────────────────────────
【手続補正書】
【提出日】平成11年5月21日(1999.5.2
1)
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】特許請求の範囲
【補正方法】変更
【補正内容】
【特許請求の範囲】
【請求項】数値を含む文書構成要素を複数有する文書
を記憶する文書記憶手段、 前記文書を文書構成要素に分割する要素分割手段、 前記数値を含有する文書構成要素間の関係を決定すると
ともに、決定した関係に基づいて、数値含有文書構成要
素の演算式を決定する決定手段、を備え、 前記数値含有文書構成要素の数値の関係は、演算式であ
ること、 を特徴とする文章解析装置。
【請求項】請求項の文章解析装置において、 前記演算式は四則演算であることを特徴とするもの。
【請求項】請求項の文章解析装置において、 前記決定手段は、前記数値含有文書構成要素に含まれる
助数詞に基づいて、係り受け側の数値含有文書構成要素
を決定し、この係り受け側の数値含有文書構成要素に、
数値に代えて自動演算記号が存在する場合には、係り受
け側の数値含有文書構成要素の数値を演算して、前記自
動演算記号に代えて演算結果を挿入すること、 を特徴とするもの。
【請求項】ある計算式を意味する文章について、その
文章の意味する計算式を求める文章解析方法であって、 前記文章の文書構成を特定し、 文章構成要素間の関係を推定し、 推定した関係に基づいて、前記計算式を決定すること、 を特徴とする文章解析方法。
【請求項】入力装置、制御装置、出力装置および記憶
装置を備えたコンピュータを、文書解析装置として機能
させるプログラムを記憶した記憶媒体であって、 前記プログラムは、前記コンピュータに、以下の処理を
実行させること、ある計算式を意味する文章について、前記文章の文書構
成を特定し、 文章構成要素間の関係を推定し、 推定した関係に基づいて、前記計算式を決定し、その文
章の意味する計算式を求める、 を特徴とするプログラムを記憶した記憶媒体。
【請求項6】請求項5のプログラムを記憶した記憶媒体
において、 前記プログラムは、意味解析結果に基づいて、数値含有
文書構成要素間の関係を決定すること、 を特徴とするもの。
【請求項7】請求項のプログラムを記憶した記憶媒体
において、 前記プログラムは、数値含有文書構成要素間の関係を決
定する関係キーワードおよび前記意味解析結果を用い
て、前記数値含有文書構成要素間の関係を決定するこ
と、 を特徴とするもの。
【請求項】請求項のプログラムを記憶した記憶媒体
において、 前記プログラムは、前記数値含有文書構成要素に含まれ
る助数詞に基づいて、前記数値含有文書構成要素間の関
係を決定すること、 を特徴とするもの。
【請求項】請求項のプログラムを記憶した記憶媒体
において、 前記プログラムは、数値含有文書構成要素間の関係を決
定する関係キーワードを用いて、前記数値含有文書構成
要素間の関係を決定すること、 を特徴とするもの。
【請求項10】請求項のプログラムを記憶した記憶媒
体において、 前記プログラムは、さらに、前記数値含有文書構成要素
に含まれる助数詞を考慮して、前記数値含有文書構成要
素間の関係を決定すること、 を特徴とするもの。
【請求項11】請求項5〜請求項10のいずれかのプロ
グラムを記憶した記憶媒体において、 前記数値含有文書構成要素の数値の関係は、演算式であ
ること、 を特徴とするもの。
【請求項12】請求項11のプログラムを記憶した記憶
媒体において、 前記演算式は四則演算であることを特徴とするもの。
【請求項13】請求項5〜請求項12のいずれかのプロ
グラムを記憶した記憶媒体において、 前記プログラムは、前記数値含有文書構成要素に含まれ
る数値の関係を報知すること、 を特徴とするもの。
【請求項14】請求項13のプログラムを記憶した記憶
媒体において、 前記プログラムは、前記数値の関係について、さらに、
前記数値含有文書構成要素も併せて報知すること、 を特徴とするもの。
【請求項15】請求項1〜請求項14のいずれかのプロ
グラムを記憶した記憶媒体において、 前記プログラムは、前記決定した数値の関係に基づい
て、前記数値含有文書構成要素中の数値に矛盾がないか
を判断すること、 を備えたことを特徴とするもの。
【請求項16】請求項15のプログラムを記憶した記憶
媒体において、 前記プログラムは、前記決定した要素間関係に基づい
て、係り受け側の数値に誤りがないか判断すること、 を特徴とするもの。
【請求項17】請求項16のプログラムを記憶した記憶
媒体において、 前記プログラムは、前記判断手段が矛盾ありと判断した
場合には、前記係り受け側の数値を自動修正すること、 を特徴とするもの。
【請求項18】請求項14のプログラムを記憶した記憶
媒体において、 前記プログラムは、前記決定した要素間関係に基づい
て、係り受け側の数値に誤りがないか判断すること、 を特徴とするもの。
【請求項19】請求項5〜請求項12のいずれかのプロ
グラムを記憶した記憶媒体において、 前記文書は、かな漢字変換確定後の文書であること、 を特徴とするもの。
【請求項20】請求項5〜請求項12のいずれかのプロ
グラムを記憶した記憶媒体において、 前記文書は、かな漢字変換前の文書であること、 を特徴とするもの。
【請求項21請求項8または10のプログラムを記憶
した記憶媒体において、 前記プログラムは、前記決定した要素間関係に基づい
て、係り受け側の数値含有文書構成要素を決定し、この
係り受け側の数値含有文書構成要素に数値に代えて自動
演算記号が存在する場合には、係り受け側の数値含有文
書構成要素の数値を演算して、前記自動演算記号に代え
て演算結果を挿入すること、 を特徴とするもの。
【請求項22数値を含む文書構成要素を複数有する文
書を記憶しておき、 前記文書を文書構成要素に分割し、 前記数値を含有する文書構成要素間の関係を決定すると
ともに、決定した関係に基づいて、数値含有文書構成要
素の演算式を決定する文書解析方法であって、 前記数値含有文書構成要素の数値の関係は、演算式であ
ること、 を特徴とする文章解析方法。
【請求項23ある計算式を意味する文章について、そ
の文章の意味する計算式を求める文章解析装置であっ
て、 前記文章の文書構成を特定し、 文章構成要素間の関係を推定し、 推定した関係に基づいて、前記計算式を決定すること、 を特徴とする文章解析装置。
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】0006
【補正方法】変更
【補正内容】
【0006】
【課題を解決するための手段および発明の効果】1,2
2)本発明にかかる文章解析装置または文章解析方法に
おいては、 数値を含む文書構成要素を複数有する文書
を記憶しておき、前記文書を文書構成要素に分割し、前
記数値を含有する文書構成要素間の関係を決定するとと
もに、決定した関係に基づいて、数値含有文書構成要素
の演算式を決定する文書解析装置またはその方法であっ
て、前記数値含有文書構成要素の数値の関係は、演算式
であることを特徴とする。したがって、操作者が数値を
含む文書構成要素の特定およびその関係を入力すること
なく、数値含有文書構成要素の数値の関係が自動的に決
定される。これにより、操作者の作業の煩雑を除去でき
る文章解析方法またはその装置を提供することができ
る。
【手続補正3】
【補正対象書類名】明細書
【補正対象項目名】0007
【補正方法】変更
【補正内容】
【0007】2)本発明にかかる文章解析装置において
は、前記演算式は四則演算である。したがって、操作者
が把握し易い数値の関係を得ることができる。
【手続補正4】
【補正対象書類名】明細書
【補正対象項目名】0008
【補正方法】変更
【補正内容】
【0008】3)本発明にかかる文章解析装置において
は、前記数値含有文書構成要素に含まれる助数詞に基づ
いて、係り受け側の数値含有文書構成要素を決定し、こ
の係り受け側の数値含有文書構成要素に、数値に代えて
自動演算記号が存在する場合には、係り受け側の数値含
有文書構成要素の数値を演算して、前記自動演算記号に
代えて演算結果を挿入する。したがって、操作者は係り
受け側の数値を入力せずに自動演算記号を入力するだけ
で、正しい演算結果が得られる。
【手続補正5】
【補正対象書類名】明細書
【補正対象項目名】0009
【補正方法】変更
【補正内容】
【0009】4)本発明にかかる文章解析方法において
は、ある計算式を意味する文章について、その文章の意
味する計算式を求める文章解析方法または装置であっ
て、前記文章の文書構成を特定し、文章構成要素間の関
係を推定し、推定した関係に基づいて、前記計算式を決
定する。したがって、操作者が検算対象の数値を入力す
ることなく、演算式が自動的に決定される。これによ
り、操作者の作業の煩雑を除去することができる。 5)本発明にかかるプログラムを記憶した記憶媒体にお
いては、入力装置、制御装置、出力装置および記憶装置
を備えたコンピュータを、文書解析装置として 機能させ
るプログラムを記憶した記憶媒体であって、前記プログ
ラムは、前記コンピュータに、以下の処理を実行させる
こと、ある計算式を意味する文章について、前記文章の
文書構成を特定し、文章構成要素間の関係を推定させ、
推定した関係に基づいて、前記計算式を決定し、その文
章の意味する計算式を求める。したがって、操作者が検
算対象の数値を入力することなく、演算式が自動的に決
定される。これにより、操作者の作業の煩雑を除去する
ことができる。
【手続補正6】
【補正対象書類名】明細書
【補正対象項目名】0010
【補正方法】変更
【補正内容】
【0010】6)本発明にかかるプログラムを記憶した
記憶媒体においては、意味解析結果に基づいて、数値含
有文書構成要素間の関係を決定する。したがって、意味
解析結果に基づき、数値含有文書構成要素の数値の関係
が決定できる。
【手続補正7】
【補正対象書類名】明細書
【補正対象項目名】0011
【補正方法】変更
【補正内容】
【0011】7)本発明にかかるプログラムを記憶した
記憶媒体においては、数値含有文書構成要素間の関係を
決定する関係キーワードおよび前記意味解析結果を用い
て、前記数値含有文書構成要素間の関係を決定する。し
たがって、意味解析結果だけでなく、前記関係キーワー
ドを参照して、数値含有文書構成要素の数値の関係が決
定できる。これにより、より正確に、前記関係を決定す
ることができる。
【手続補正8】
【補正対象書類名】明細書
【補正対象項目名】0012
【補正方法】変更
【補正内容】
【0012】8)本発明にかかるプログラムを記憶した
記憶媒体においては、前記数値含有文書構成要素に含ま
れる助数詞に基づいて、前記数値含有文書構成要素間の
関係を決定する。したがって、助数詞に基づき、数値含
有文書構成要素の数値の関係が決定できる。
【手続補正9】
【補正対象書類名】明細書
【補正対象項目名】0013
【補正方法】変更
【補正内容】
【0013】9)本発明にかかるプログラムを記憶した
記憶媒体においては、数値含有文書構成要素間の関係を
決定する関係キーワードを用いて、前記数値含有文書構
成要素間の関係を決定する。したがって、関係キーワー
ドに基づき、数値含有文書構成要素の数値の関係が決定
できる。
【手続補正10】
【補正対象書類名】明細書
【補正対象項目名】0014
【補正方法】変更
【補正内容】
【0014】10)本発明にかかるプログラムを記憶し
た記憶媒体においては、さらに、前記数値含有文書構成
要素に含まれる助数詞を考慮して、前記数値含有文書構
成要素間の関係を決定する。したがって、助数詞に基づ
き、数値含有文書構成要素の数値の関係が決定できる。
【手続補正11】
【補正対象書類名】明細書
【補正対象項目名】0015
【補正方法】変更
【補正内容】
【0015】11)本発明にかかるプログラムを記憶し
た記憶媒体においては、前記数値含有文書構成要素の数
値の関係は、演算式である。したがって、操作者が把握
し易い前記数値の関係を得ることができる。
【手続補正12】
【補正対象書類名】明細書
【補正対象項目名】0016
【補正方法】変更
【補正内容】
【0016】13)本発明にかかるプログラムを記憶し
た記憶媒体においては、前記数値含有文書構成要素に含
まれる数値の関係を報知する。したがって、操作者が前
記数値の関係を把握することができる
【手続補正13】
【補正対象書類名】明細書
【補正対象項目名】0017
【補正方法】変更
【補正内容】
【0017】14)本発明にかかるプログラムを記憶し
た記憶媒体においては、前記数値の関係について、さら
に、前記数値含有文書構成要素も併せて報知する。した
がって、操作者が前記数値の関係を容易に把握すること
ができる。
【手続補正14】
【補正対象書類名】明細書
【補正対象項目名】0018
【補正方法】変更
【補正内容】
【0018】15)本発明にかかるプログラムを記憶し
た記憶媒体においては、前記決定した数値の関係に基づ
いて、前記数値含有文書構成要素中の数値に矛盾がない
かを判断する。したがって、操作者は前記数値含有文書
構成要素中の数値に矛盾がないかを自ら判断する必要が
ない。
【手続補正15】
【補正対象書類名】明細書
【補正対象項目名】0019
【補正方法】変更
【補正内容】
【0019】16)本発明にかかるプログラムを記憶し
た記憶媒体においては、前記決定手段が決定した要素間
関係に基づいて、係り受け側の数値に誤りがないか判断
する。したがって、操作者は前記数値含有文書構成要素
中の数値に矛盾がないかを自ら判断する必要がない。
【手続補正16】
【補正対象書類名】明細書
【補正対象項目名】0020
【補正方法】変更
【補正内容】
【0020】17)本発明にかかるプログラムを記憶し
た記憶媒体においては、矛盾ありと判断した場合には、
前記係り受け側の数値を自動修正する。したがって、前
記数値含有文書構成要素中の数値を自動的に修正するこ
とができる。 18)本発明にかかるプログラムを記憶した記憶媒体に
おいては、前記決定した要素間関係に基づいて、係り受
け側の数値に誤りがないか判断する。したがっ て、操作
者は前記数値含有文書構成要素中の数値に矛盾がないか
を自ら判断する 必要がない。 19)本発明にかかるプログラムを記憶した記憶媒体に
おいては、前記文書は、かな漢字変換確定後の文書であ
る。したがって、かな漢字変換確定後の文書を校正する
ことができる。 20)本発明にかかるプログラムを記憶した記憶媒体に
おいては、前記文書は、かな漢字変換前の文書である。
したがって、かな漢字変換中に校正することができる。 23)本発明にかかる文章解析装置においては、ある計
算式を意味する文章について、その文章の意味する計算
式を求める文章解析装置であって、前記文章の 文書構成
を特定し、文章構成要素間の関係を推定し、推定した関
係に基づいて、 前記計算式を決定する。 ─────────────────────────────────────────────────────
【手続補正書】
【提出日】平成11年8月25日(1999.8.2
5)
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】全文
【補正方法】変更
【補正内容】
【書類名】 明細書
【発明の名称】 文書解析装置およびその方法
【特許請求の範囲】
【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、文書の解析装置
に関し、特に数値を含む文章の入力ミス指摘、修正に関
する。
【0002】
【従来技術およびその課題】特開平4−130571号
公報には、別途電卓等を用いることなく、入力されてい
る数値を含む文字列について、検算処理を実行できる文
書作成装置が開示されている。
【0003】上記文書作成装置は、入力された文字列中
の数値部分を特定するとともに、その演算式を特定する
と、演算結果が表示されるというものである。これによ
り、電卓等に別途数値を入力する煩雑を避けることがで
きる。
【0004】しかし、上記文書作成装置においても、や
はり、操作者が、数値部分がどこか、さらに演算式とし
て何を用いるかを特定しなければならない。かかる特定
は、数値部分が多い場合には非常に煩雑である。
【0005】この発明は上記問題を解決し、数値を含む
文書について数値が誤って入力されていないかを判断で
きる文書解析装置またはその方法を提供することを目的
とする。
【0006】
【課題を解決するための手段および発明の効果】1,
4,5)本発明にかかる文書解析装置またはその方法に
おいては、1)数値を含有する数値含有文書構成要素間
の関係を決定する関係キーワードと演算式との対応テー
ブルおよび、2)前記文書を文書構成要素に分割する第
1のデータと各文書構成要素間の係り受け関係を決定す
る第2のデータとを記憶するかな漢字変換辞書を、前記
記憶装置に記憶させ、校正対象の文書が与えられると、
前記かな漢字変換辞書の前記第1のデータを用いて、当
該文書を文書構成要素に分割し、前記文書構成要素から
数値を含有する数値含有文書構成要素を抽出して、前記
かな漢字変換辞書の前記第2のデータを用いて前記数値
含有文書構成要素間の係り受け関係を決定するととも
に、前記対応テーブルに基づいて、前記数値含有文書構
成要素に存在する関係キーワードに対応する演算式を抽
出し、この演算式および前記数値含有文書構成要素の数
値を用いて前記数値含有文書構成要素間の数値の関係を
表す要素関係演算式を決定する。したがって、操作者が
数値含有文書構成要素およびその関係を特定することな
く、数値含有文書構成要素の数値の関係を表す要素関係
演算式が自動的に決定される。これにより、数値を含有
する文書に関する数値について、操作者の作業の煩雑を
除去できる文書解析装置またはその方法を提供すること
ができる。
【0007】2、7)本発明にかかる文書解析装置にお
いては、前記要素間係演算式は四則演算である。したが
って、操作者が把握し易い数値の関係を得ることができ
る。
【0008】3、16)本発明にかかる文書解析装置ま
たはプログラムを記憶した記憶媒体においては、自動演
算記号が存在する文書構成要素は数値含有文書構成要素
であると判断して、前記かな漢字変換辞書の前記第2の
データを用いて係り側と受け側の数値含有文書構成要素
間の係り受け関係を決定するとともに、前記第2の記憶
手段に記憶された対応テーブルに基づいて、前記数値含
有文書構成要素に存在する関係キーワードに対応する演
算式を抽出し、この演算式および前記数値含有文書構成
要素の数値を用いて前記数値含有文書構成要素間の数値
の関係を表す要素関係演算式を決定し、この要素関係演
算式を用いて、前記受け側の数値含有文書構成要素の数
値を演算して、前記自動演算記号に代えて演算結果を挿
入する。したがって、操作者は係り受け関係にある文書
構成要素の内、受け側の数値を入力せずに自動演算記号
を入力するだけで、正しい演算結果が得られる。
【0009】6)本発明にかかるプログラムを記憶した
記憶媒体においては、さらに前記数値含有文書構成要素
に含まれる助数詞を考慮して、前記要素関係演算式を
定する。したがって、助数詞をさらに用いて要素間係演
算式を決定できる。
【0010】8)本発明にかかるプログラムを記憶した
記憶媒体においては、前記要素関係演算式が報知され
る。したがって、操作者が前記数値の関係を把握するこ
とができる。
【0011】9)本発明にかかるプログラムを記憶した
記憶媒体においては、さらに、前記数値含有文書構成要
素も併せて報知される。したがって、操作者が前記数値
の関係を容易に把握することができる。
【0012】10)本発明にかかるプログラムを記憶し
た記憶媒体においては、前記決定した要素関係演算式を
用いて、前記数値含有文書構成要素中の数値に矛盾がな
いかが判断される。したがって、操作者は前記数値含有
文書構成要素中の数値に矛盾がないかを自ら判断する必
要がない。
【0013】11)本発明にかかるプログラムを記憶し
た記憶媒体においては、要素関係演算式を用いて係り受
け関係にある文書構成要素の内、受け側の数値に誤りが
ないか判断される。したがって、操作者は前記数値含有
文書構成要素中の数値に矛盾がないかを自ら判断する必
要がない。
【0014】12)本発明にかかるプログラムを記憶し
た記憶媒体においては、誤りありと判断した場合には、
前記受け側の数値自動修正される。したがって、前記
数値含有文書構成要素中の数値を自動的に修正すること
ができる。
【0015】13)本発明にかかるプログラムを記憶し
た記憶媒体においては、受け側の数値に誤りがある場合
には、これを報知する。したがって、操作者は前記数値
含有文書構成要素中の数値に矛盾がないかを自ら判断す
る必要がない。
【0016】14)本発明にかかるプログラムを記憶し
た記憶媒体においては、前記文書は、かな漢字変換確定
後の文書である。したがって、かな漢字変換確定後の文
書を校正することができる。
【0017】15)本発明にかかるプログラムを記憶し
た記憶媒体においては、前記文書は、かな漢字変換前の
文書である。したがって、かな漢字変換中に校正するこ
とができる。
【0018】17、18)本発明にかかる文書解析装置
またはその方法においては、前記決定した演算式および
前記数値含有文書構成要素の数値を用いて、前記数値含
有要素中の数値に誤りがないかを判断する。したがっ
て、前記数値含有文書構成要素中の数値に矛盾がないか
を自ら判断する必要がない。
【0019】
【発明の実施の態様】1.機能ブロック図の説明 本発明の一実施例を図面に基づいて説明する。図1に示
す文書解析装置1は、文書記憶手段3、要素分割手段
5、決定手段7、キーワード記憶手段8、関係報知手段
11、判断手段9、自動修正手段13を備えている。
【0020】文書記憶手段3は、数値を含む文書構成要
素を複数有する文書を記憶する。要素分割手段5は、前
記文書を文書構成要素に分割する。キーワード記憶手段
8は数値含有文書構成要素間の関係を決定する関係キー
ワードを記憶する。決定手段7は、前記複数の数値含有
文書構成要素間の関係を決定するとともに、決定した関
係に基づいて、数値含有文書構成要素の数値の関係を決
定する。例えば、前記意味解析結果および前記関係キー
ワードを用いて、前記数値含有文書構成要素間の関係を
決定する。
【0021】関係報知手段11は、前記数値含有文書構
成要素に含まれる数値の関係を報知する。決定手段7
は、意味解析結果に基づいて、数値含有文書構成要素間
の関係を決定する様にしてもよい。また、決定手段7
は、前記数値含有文書構成要素に含まれる助数詞に基づ
いて、前記数値含有文書構成要素間の関係を決定しても
よい。数値含有文書構成要素の数値の関係は演算式、例
えば、四則演算である。
【0022】また、決定手段7は、前記数値含有文書構
成要素に含まれる助数詞を考慮して、前記数値含有文書
構成要素間の関係を決定してもよい。
【0023】関係報知手段11は、前記数値の関係につ
いて、さらに、前記数値含有文書構成要素も併せて報知
する。
【0024】判断手段9は、前記決定された数値の関係
に基づいて、前記数値含有文書構成要素中の数値に矛盾
がないかを判断する。例えば、決定手段7が決定した要
素間関係に基づいて、受け側の数値に誤りがないか判断
する。自動修正手段15は、判断手段9が矛盾ありと判
断した場合には、これを自動修正する。
【0025】修正情報報知手段は17は、判断手段9に
よってなされた判断または、自動修正手段によって修正
された修正情報を報知する。
【0026】修正情報とは、例えば、修正後のデータま
たは修正処理を行った旨の表示情報をいう。また、文書
構成要素とは、実施形態では文節に該当するが、これに
限定されない。また、実施形態では、複合語処理をし
て、1文節として文節認識するようにしたが、かかる複
合語処理は行わなくてもよい。
【0027】2.ハードウェア構成 (2.1)概略 図2に示す文書解析装置40は、入力装置41、制御装
置43、表示装置45および記憶装置47を備えてい
る。入力装置41は、各種の命令を入力するためのもの
である。記憶装置47には、校正対象となる文書が記憶
される。制御装置43は、記憶装置47に記憶された
から、数値を含んだ部分を複数検出して、これらの数
値を含む部分の関係を決定するとともに、決定した関係
に基づいて、前記数値の関係を決定する。
【0028】(2.2)詳細 図3に、図2に示す文書解析装置40をCPUを用いて
実現したハードウェア構成の一例を示す。
【0029】文書解析装置40は、CPU23、メモリ
27、ハードディスク26、CRT30、FDD25、
キーボード28、マウス31およびバスライン29を備
えている。CPU23は、ハードディスク26に記憶さ
れた制御プログラムにしたがいバスライン29を介し
て、各部を制御する。
【0030】この制御プログラムは、FDD25を介し
て、プログラムが記憶されたフレキシブルディスク25
aから読み出されてハードディスク26にインストール
されたものである。なお、フレキシブルディスク以外
に、CD−ROM、ICカード等のプログラムを実体的
に一体化したコンピュータ可読の記憶媒体から、ハード
ディスクにインストールさせるようにしてもよい。さら
に、通信回線を用いてダウンロードするようにしてもよ
い。
【0031】本実施形態においては、プログラムをフレ
キシブルディスクからハードディスク26にインストー
ルさせることにより、フレキシブルディスクに記憶させ
たプログラムを間接的にコンピュータに実行させるよう
にしている。しかし、これに限定されることなく、フレ
キシブルディスクに記憶させたプログラムをFDD25
から直接的に実行するようにしてもよい。なお、コンピ
ュータによって、実行可能なプログラムとしては、その
ままのインストールするだけで直接実行可能なものはも
ちろん、一旦他の形態等に変換が必要なもの(例えば、
データ圧縮されているものを、解凍する等)、さらに
は、他のモジュール部分と組合して実行可能なものも含
む。
【0032】ハードディスク26には、さらに、校正辞
書部26b、キーワード記憶部26cを有する。校正辞
書部26bは、校正対象の文書を各文節に分割するとと
もに、各文節間の係り受けを決定するためのデータが記
憶されている。本実施形態においては、かな漢字変換の
時に用いる変換辞書を用いた。キーワード記憶部26c
には、図4に示すような関係キーワードと演算式の対応
テーブルが記憶されている。
【0033】メモリ27には、文書バッファ27a、作
業バッファ27bを有する。文書バッファ27aは入力
された校正対象文字列が記憶される。作業バッファ27
bには、後述する校正処理において生成される中間デー
タが記憶される。なお、メモリ27にはその他、各種の
演算結果等が記憶される。
【0034】CRT30には、修正情報等が表示され
る。
【0035】3.フローチャート つぎに、ハードディスク26に記憶されているプログラ
ムについて、図5、図6を用いて説明する。なお、以下
では、図7Aに示す文書を校正する場合を例として説明
する。
【0036】まず、CPU23は、校正対象文書を読み
込む(図5ステップST3)。これにより、図7Aに示
す文字列が、文書バッファ27aに記憶される。CPU
23は、校正辞書部26bに記憶された辞書データを用
いて、文書バッファ27aに記憶された文字列を形態素
解析する(図5ステップST5)。これにより、文書バ
ッファ27aに記憶された文字列は、図7Bに示すよう
に、形態素に分割されて作業バッファ27bに記憶され
る。
【0037】CPU23は、校正辞書部26bに記憶さ
れた辞書データを用いて、形態素解析された文字列から
文節の認定を行う(図5ステップST7)。これによ
り、作業バッファ27bに記憶された文字列は、図7C
に示すように、文節に区切られる。
【0038】CPU23は、校正辞書部26bに記憶さ
れた辞書データを用いて、各文節間の係り受けを決定す
る(図5ステップST9)。この場合、図8A,B,C
に示すように、各文節間の係り受けが決定されたとす
る。
【0039】CPU23は、全文節について、数詞、助
数詞、および図4に示すキーワードが存在しているか否
かを確認し、存在していればその文節を抽出する(図5
ステップST11)。この場合であれば、文節「750
万台」、「1.85兆円」、「13%増」、「800万
台」、「8%増」、「2兆円」が抽出され、作業バッフ
ァ26bに記憶される。
【0040】CPU23は、前記抽出した文節間に適用
する演算式を決定する(図5ステップST13)。本実
施形態においては、各文節間の係り受け、助数詞の種類
および図4に示す関係キーワードに基づいて、演算式を
決定した。
【0041】例えば、この場合、文節「750万台」と
文節「800万台」とは助数詞が同じである。また、文
節「1.85兆円」と文節「2兆円」とも同様である。
一方、文節「13%増」は文節「800万台」にかかっ
ている。また、文節「8%増」は文節「2兆円」にかか
っている。したがって、文節「750万台」と文節「8
00万台」との関係は、文節「13%増」で特定される
演算式で表されると判断する。この場合、文節「13%
増」はキーワード「%増」を含んでいるので、対応する
演算式「B=A*(100+x)/100」で表され
る。ここで、B:第2数詞文節の値、A:第1数詞文節
の値、x:キーワードを含む数詞の値である。すなわ
ち、文節「750万台」と文節「800万台」との関係
は、「800万=750万*(100+13)/10
0」で表されると判断する。また、文節「1.85兆
円」と文節「2兆円」との関係は、文節「8%増」で特
定される演算式で表されると判断する。したがって、同
様にして、「2兆=1.85兆*(100+8)/10
0」で表されると判断する。決定した演算式は作業バッ
ファ26bに記憶される。
【0042】CPU23は、ステップST13で決定し
演算式を用いて演算をする(図5ステップST1
5)。前記2つの演算式のうち、1つめの演算式「75
0万*(100+13)/100」の正しい結果は、
「847.5万」である。なお、演算結果「847.5
万」を同じ桁数となるように四捨五入して、演算結果
「850万」が得られる。また、2つめの演算式「1.
85兆*(100+8)/100」の正しい結果は
「1.998兆」である。これを四捨五入して「2兆」
が得られる。演算結果は作業バッファ26bに記憶され
る。
【0043】CPU23は、演算結果が間違っている
式があるか否か判断する(ステップST17)。この
場合、1つめの演算式「800万=750万*(100
+13)/100」は正しくないので、ステップST1
9に進み、変更処理を行う。
【0044】変更処理のフローチャートについて、図6
を用いて説明する。CPU23は、まず、図9に示すよ
うなダイアログボックスを表示する(ステップST2
1)。本実施形態においては、図9に示すように、誤り
対象の文節「800万台」とそのページ数および行数、
関連する表記「750万台」「13%増」とそのページ
数および行数、演算式、および正しい表記「850万
台」を表示した。
【0045】このダイアログボックスをみて、操作者は
変更操作を行う。正しい表記として示されている「85
0万台」に変更するのであれは、スイッチ51をマウス
31でクリックする。CPU23は、ステップST23
にてクリックされたと判断して、ステップST25でど
のスイッチがクリックされたかを判断する。この場合、
スイッチ51であるので、正しい表記に置換する(ステ
ップST27)。具体的には、1頁3行の文字列「80
0万台」を「850万台」に変更する。
【0046】つぎに、CPU23は、次表記の演算式が
あるか否かを判断する(ステップST29)。この場
合、もう1つの演算式は、四捨五入すると「2兆円」と
なり、正しいので、変更処理は終了する。
【0047】なお、誤っている演算式がある場合には、
ステップST31に進み、ダイアログボックス内の表示
を次表記の演算式に関係するものに変更し、以下ステッ
プST23以下の処理を繰り返す。
【0048】なお、表示されたダイアログボックスによ
る校正対象に誤りがない場合には、操作者は次チェック
ボタン50をクリックすればよい。CPU23は、ステ
ップST25にて次チェックボタン50がクリックされ
た場合には、ステップST29に進み、次表記の演算
があるか否かを判断する。この場合、次表記の演算式が
あるので、ダイアログボックスの表記を変更する(ステ
ップST31)。
【0049】また、ステップST25にてヘルプボタン
53がクリックされた場合には、ヘルプを表示する(ス
テップST27)。また、ステップST25にて、キャ
ンセルボタンがクリックされた場合には、変更処理は終
了する。
【0050】変更処理が終了すると、校正処理は終了す
る。
【0051】このように、本実施形態においては、キー
ワードおよび文節の係り受けに基づいて、演算式を決定
するようにしている。したがって、操作者が演算対象文
節及び演算式を特定することなく、数値を含む文節にお
ける入力ミスを検査およびその修正ができる。
【0052】なお、本実施形態においては、キーワード
および文節間の係り受け情報に基づいて、前記演算式を
決定するようにしたが、キーワードだけで決定するよう
にしてもよい。
【0053】4.他の実施形態 上記実施形態においては、キーワードおよび文節間の係
り受け情報に基づいて、前記演算式を決定するようにし
たが、以下のように、意味解析に基づいて前記演算式を
決定するようにしてもよい。
【0054】例えば、図8Aに示す文節「来年度の/パ
ソコンの/国内/出荷/予測」については、以下の文書
のタイトルであると認識して、「来年度」「パソコン」
「国内」「出荷」「予測」が意味解釈単語の候補と認識
する。この文書では、単語「年度」が何度も登場するの
で、意味解釈単語として決定する。また、「予測」値が
並べられている文書であり、対比するのは「年度」であ
ると認識する。また、「国内」「出荷」は全体の前提に
すぎないと認識する。これは、反対の単語である「国
外」、「入荷」でも、意味をなすからである。
【0055】図8Bに示す文節「パソコン分野では」
は、文の調子から入っているだけで、重要でないと判断
する。文節「今年度は/750万台、1.85兆円/で
あった。」については、今年度=xx台、今年度xx
円、の2つを述べていると判断する。具体的には、「で
ある」をキーとして特別処理、「xxはyyである」と
すればよい。また、「xx台」「yy円」が、今後の文
脈で(=主題にそって)重要である可能性は非常に高い
ので重要単語として抽出する。
【0056】図8Bに示す文節「来年度は」は、前の文
の文節「今年度」への対比相手として登場するので、重
要単語として抽出する。
【0057】なお、文体(先の文の調子)や展開からし
ても「である」が省略されていると解釈する。すなわ
ち、文書の末尾が名詞で終わっているけれども、「であ
る」が省略された文節であると解釈をする。
【0058】つぎに、図8Cに示す文節「来年度は/台
数で/対前年比/13%増の/800万台」について、
文節「台数で」は、前段の「xx台」に関係すると解釈
する。なお、文節「対前年比」から文意を決定する。な
お、文意は文節「対前年比」からでなくとも決定できる
が、先行の文節「今年度=750万台」「来年度」から
の数値関係づけに必要となる。これにより文節「750
万台」、「13%」、「800万台」についての関係
演算式)を特定できる。
【0059】また、「%増」の増がなければ「113
%」となるべきと理解すればよい。
【0060】文節「金額で同8%増の2兆円」について
は、文節「金額で」は、前段の「xx円」に関係すると
して判断する。そして、文節「同」は、その前後の文節
(この場合は後ろ)「%増」に基づいて、前の句から
「対前年比」に相当すると判断する。
【0061】このように、意味解析をし、校正対象の
の主題に即して文節間の関係を特定し、数字が含まれ
た文節間の演算式を特定することができる。
【0062】5.その他 本実施形態においては、かけ算の場合について説明した
が、その他、図4に示す演算式についても同様に適用で
きる。図4において、関係キーワード「合計」の場合に
は、でてくる数値を総計するようにすればよい。例え
ば、文書「乗客123名、乗務員8名、合計・・・」と
いうような場合である。
【0063】この実施形態においては、各文節間の係り
受けを決定してから、数詞、助数詞、キーワードの抽出
等を行ったが、逆でもよい。
【0064】上記実施形態においては、前記文書とし
て、かな漢字変換確定後の文書を採用したが、かな漢字
変換確定前の未確定文書であってもよい。
【0065】上記実施形態においては、操作者が入力し
た数値を検算するようにしたが、自動演算記号を仮に記
載しておき、かかる自動演算記号があると、前記決定し
文書構成要素間の関係に基づいて、係り受け側の数値
含有文書構成要素として決定し、この係り受け側の数値
含有文書構成要素の数値に代えて自動演算記号が存在す
る場合には、係り受け側の数値含有文書構成要素の数値
を演算して、前記自動演算記号に代えて演算結果を挿入
するようにしてもよい。
【0066】上記実施形態においては、ダイアログボッ
クスを自動表示するようにしたが、一旦、該当部分をハ
イライト表示し、ハイライト表示している文字列をクリ
ックすると、ダイアログボックスを表示するようにして
もよい。
【0067】なお、自動修正後、修正処理を行った旨を
表示するようにしてもよい。また、警告表示だけでもよ
い。また、ハイライト表示等の他の部分と区別できるよ
うに表示するだけでもよい。
【0068】上記実施形態においては、報知の一例とし
て表示するようにしたが、その他音声等を用いてもよ
い。
【0069】上記実施形態においては、演算式として四
則演算の例を示したが、演算式として表されるものであ
ればどのようなものであってもよく、その他、平均や標
準偏差等を求めることもできる。
【0070】本実施形態においては、図1に示す機能を
実現する為に、CPU23を用い、ソフトウェアによっ
てこれを実現している。しかし、その一部もしくは全て
を、ロジック回路等のハードウェアによって実現しても
よい。
【図面の簡単な説明】
【図1】本発明にかかる文書解析装置1の機能ブロック
図である。
【図2】図1に示す文書解析装置1のハードウエア構成
の一例を示す図である。
【図3】図2に示す文書解析装置40をCPU23を用
いて実現したハードウエア構成の一例を示す図である。
【図4】関係キーワードとその演算式との関係を特定す
るテーブルを示す図である。
【図5】変換処理のフローチャートである。
【図6】変換処理のフローチャートである。
【図7】校正対象文書を示す。
【図8】校正対象文書を示す。
【図9】ダイアログボックスを示す図である。
【符号の説明】 3・・・・・文書記憶手段 5・・・・・要素分割手段 7・・・・・決定手段 8・・・・・キーワード記憶手段 9・・・・・判断手段 11・・・・関係報知手段 15・・・・自動修正手段 17・・・・修正情報報知手段 23・・・CPU 27・・・メモリ
【手続補正2】
【補正対象書類名】図面
【補正対象項目名】図4
【補正方法】変更
【補正内容】
【図4】
【手続補正3】
【補正対象書類名】図面
【補正対象項目名】図5
【補正方法】変更
【補正内容】
【図5】
【手続補正4】
【補正対象書類名】図面
【補正対象項目名】図6
【補正方法】変更
【補正内容】
【図6】
【手続補正5】
【補正対象書類名】図面
【補正対象項目名】図9
【補正方法】変更
【補正内容】
【図9】

Claims (20)

    【特許請求の範囲】
  1. 【請求項1】数値を含む文書構成要素を複数有する文書
    を記憶する文書記憶手段、 前記文書を文書構成要素に分割する要素分割手段、 前記数値を含有する文書構成要素間の関係を決定すると
    ともに、決定した関係に基づいて、数値含有文書構成要
    素の数値の関係を決定する決定手段、 を備えたことを特徴とする文章解析装置。
  2. 【請求項2】請求項1の文章解析装置において、 意味解析結果に基づいて、数値含有文書構成要素間の関
    係を決定すること、 を特徴とするもの。
  3. 【請求項3】請求項2の文章解析装置において、 数値含有文書構成要素間の関係を決定する関係キーワー
    ドを記憶するキーワード記憶手段を備え、 前記決定手段は、前記意味解析結果および前記関係キー
    ワードを用いて、前記数値含有文書構成要素間の関係を
    決定すること、 を特徴とするもの。
  4. 【請求項4】請求項2の文章解析装置において、 前記決定手段は、前記数値含有文書構成要素に含まれる
    助数詞に基づいて、前記数値含有文書構成要素間の関係
    を決定すること、 を特徴とするもの。
  5. 【請求項5】請求項1の文章解析装置において、 数値含有文書構成要素間の関係を決定する関係キーワー
    ドを記憶するキーワード記憶手段を備え、 前記決定手段は、前記関係キーワードを用いて、前記数
    値含有文書構成要素間の関係を決定すること、 を特徴とするもの。
  6. 【請求項6】請求項5の文章解析装置において、 前記決定手段は、さらに、前記数値含有文書構成要素に
    含まれる助数詞を考慮して、前記数値含有文書構成要素
    間の関係を決定すること、 を特徴とするもの。
  7. 【請求項7】請求項1〜請求項6のいずれかの文章解析
    装置において、 前記数値含有文書構成要素の数値の関係は、演算式であ
    ること、 を特徴とするもの。
  8. 【請求項8】請求項7の文章解析装置において、 前記演算式は四則演算であることを特徴とするもの。
  9. 【請求項9】請求項1〜請求項8のいずれかの文章解析
    装置において、 前記数値含有文書構成要素に含まれる数値の関係を報知
    する関係報知手段、 を備えたことを特徴とするもの。
  10. 【請求項10】請求項9の文章解析装置において、 前記関係報知手段は、前記数値の関係について、さら
    に、前記数値含有文書構成要素も併せて報知すること、 を特徴とするもの。
  11. 【請求項11】請求項1〜請求項10のいずれかの文章
    解析装置において、 前記決定手段が決定した数値の関係に基づいて、前記数
    値含有文書構成要素中の数値に矛盾がないかを判断する
    判断手段、 を備えたことを特徴とするもの。
  12. 【請求項12】請求項11の文章解析装置において、 前記判断手段は、前記決定手段が決定した要素間関係に
    基づいて、係り受け側の数値に誤りがないか判断するこ
    と、 を特徴とするもの。
  13. 【請求項13】請求項11の文章解析装置において、 前記判断手段が矛盾ありと判断した場合には、自動修正
    する自動修正手段、 を備えたことを特徴とするもの。
  14. 【請求項14】請求項13の文章解析装置において、 前記判断手段は、前記決定手段が決定した要素間関係に
    基づいて、係り受け側の数値に誤りがないか判断するこ
    と、 を特徴とするもの。
  15. 【請求項15】請求項1の文章解析装置において、 前記文書は、かな漢字変換確定後の文書であること、 を特徴とするもの。
  16. 【請求項16】請求項1の文章解析装置において、 前記文書は、かな漢字変換前の文書であること、 を特徴とするもの。
  17. 【請求項17】請求項4または6の文章解析装置におい
    て、 前記決定した要素間関係に基づいて、係り受け側の数値
    含有文書構成要素を決定し、この係り受け側の数値含有
    文書構成要素に数値に代えて自動演算記号が存在する場
    合には、係り受け側の数値含有文書構成要素の数値を演
    算して、前記自動演算記号に代えて演算結果を挿入する
    こと、 を特徴とするもの。
  18. 【請求項18】数値を含む文書構成要素を複数有する文
    書を文書構成要素に分割し、 前記複数の数値含有文書構成要素間の関係を決定すると
    ともに、決定した関係に基づいて、数値含有文書構成要
    素の数値の関係を決定すること、 を特徴とする文章解析方法。
  19. 【請求項19】ある計算式を意味する文章について、そ
    の文章の意味する計算式を求める文章解析方法であっ
    て、 前記文章の文書構成を特定し、 文章構成要素間の関係を推定し、 推定した関係に基づいて、前記計算式を決定すること、 を特徴とする文章解析方法。
  20. 【請求項20】入力装置、制御装置、出力装置および記
    憶装置を備えたコンピュータを、文書解析装置として機
    能させるプログラムを記憶した記憶媒体において、 前記プログラムは、前記コンピュータを、以下の手段を
    備えた装置として機能させること、 数値を含む文書構成要素を複数有する文書を記憶する文
    書記憶手段、 前記文書を文書構成要素に分割する要素分割手段、 前記複数の数値含有文書構成要素間の関係を決定すると
    ともに、決定した関係に基づいて、数値含有文書構成要
    素の数値の関係を決定する決定手段、 を特徴とするプログラムを記憶した記憶媒体。
JP10190410A 1998-07-06 1998-07-06 文書解析装置およびその方法 Expired - Fee Related JP2994336B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10190410A JP2994336B1 (ja) 1998-07-06 1998-07-06 文書解析装置およびその方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10190410A JP2994336B1 (ja) 1998-07-06 1998-07-06 文書解析装置およびその方法

Publications (2)

Publication Number Publication Date
JP2994336B1 JP2994336B1 (ja) 1999-12-27
JP2000020521A true JP2000020521A (ja) 2000-01-21

Family

ID=16257688

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10190410A Expired - Fee Related JP2994336B1 (ja) 1998-07-06 1998-07-06 文書解析装置およびその方法

Country Status (1)

Country Link
JP (1) JP2994336B1 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002140468A (ja) * 2000-10-31 2002-05-17 Hitachi Ltd 化学物質の排出量・移動量の届出支援方法および化学物質の排出量・移動量の届出支援装置
US6449814B1 (en) * 2001-09-13 2002-09-17 Summit Polymers, Inc. Trim fastener clip employing multiple lines-of-contact stabilization
JP2005157853A (ja) * 2003-11-27 2005-06-16 Hitachi Systems & Services Ltd テキスト文から抽出した情報を利用したリンク設定装置およびその方法
JP2017021858A (ja) * 2016-10-28 2017-01-26 ブライス トーマス 医療報告を生成するための方法及びシステム
JP2019036338A (ja) * 2018-10-15 2019-03-07 ブライス トーマス 医療報告を生成するための方法及びシステム
JP2021047905A (ja) * 2020-12-17 2021-03-25 ブライス トーマス 医療報告を生成するための方法及びシステム
JP2022024093A (ja) * 2020-12-25 2022-02-08 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド テキスト内の数値コンテンツの誤り訂正方法、装置及び電子機器

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002140468A (ja) * 2000-10-31 2002-05-17 Hitachi Ltd 化学物質の排出量・移動量の届出支援方法および化学物質の排出量・移動量の届出支援装置
US6449814B1 (en) * 2001-09-13 2002-09-17 Summit Polymers, Inc. Trim fastener clip employing multiple lines-of-contact stabilization
JP2005157853A (ja) * 2003-11-27 2005-06-16 Hitachi Systems & Services Ltd テキスト文から抽出した情報を利用したリンク設定装置およびその方法
JP2017021858A (ja) * 2016-10-28 2017-01-26 ブライス トーマス 医療報告を生成するための方法及びシステム
JP2019036338A (ja) * 2018-10-15 2019-03-07 ブライス トーマス 医療報告を生成するための方法及びシステム
JP2021047905A (ja) * 2020-12-17 2021-03-25 ブライス トーマス 医療報告を生成するための方法及びシステム
JP2022024093A (ja) * 2020-12-25 2022-02-08 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド テキスト内の数値コンテンツの誤り訂正方法、装置及び電子機器
JP7268119B2 (ja) 2020-12-25 2023-05-02 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド テキスト内の数値コンテンツの誤り訂正方法、装置及び電子機器

Also Published As

Publication number Publication date
JP2994336B1 (ja) 1999-12-27

Similar Documents

Publication Publication Date Title
US6602300B2 (en) Apparatus and method for retrieving data from a document database
JPH07325828A (ja) 文法チェックシステム
JP2002215617A (ja) 品詞タグ付けをする方法
JPH0844719A (ja) 辞書アクセスシステム
Glass et al. A naive salience-based method for speaker identification in fiction books
JP2020190970A (ja) 文書処理装置およびその方法、プログラム
JP2002117027A (ja) 感情情報抽出方法および感情情報抽出プログラムの記録媒体
Zhang et al. Automated Deep Lexical Acquisition for Robust Open Texts Processing.
Tufiş et al. DIAC+: A professional diacritics recovering system
JP2994336B1 (ja) 文書解析装置およびその方法
JPH11328166A (ja) 文字入力装置及び文字入力処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2007122660A (ja) 文書データ処理装置および文書データ処理プログラム
KR100631086B1 (ko) Xml을 이용한 텍스트 정규화 방법 및 장치
JPH05233730A (ja) 関係情報抽出・表示装置
JP4033089B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP4300056B2 (ja) 概念表現生成方法、プログラム、記憶媒体及び概念表現生成装置
JPS63163956A (ja) 文書作成・校正支援装置
JP3856515B2 (ja) 文書校正装置
JP3197110B2 (ja) 自然言語解析装置および機械翻訳装置
JP2000200268A (ja) 手書き文字入力変換装置及び文書作成装置とコンピュ―タ読み取り可能な記録媒体
JP3061855B2 (ja) かな漢字変換装置及びかな漢字変換方法
JPH07129577A (ja) 文書校正支援装置
JP3244286B2 (ja) 翻訳処理装置
JP3308723B2 (ja) 統語解析装置
JP3873299B2 (ja) 仮名漢字変換装置および仮名漢字変換方法

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081022

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111022

Year of fee payment: 12

LAPS Cancellation because of no payment of annual fees