JPH08329076A - 校正支援装置及び方法 - Google Patents

校正支援装置及び方法

Info

Publication number
JPH08329076A
JPH08329076A JP7130549A JP13054995A JPH08329076A JP H08329076 A JPH08329076 A JP H08329076A JP 7130549 A JP7130549 A JP 7130549A JP 13054995 A JP13054995 A JP 13054995A JP H08329076 A JPH08329076 A JP H08329076A
Authority
JP
Japan
Prior art keywords
occurrence
word
information
error
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7130549A
Other languages
English (en)
Inventor
Yuuji Shimizu
勇詞 清水
Kenichiro Kobayashi
賢一郎 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba AVE Co Ltd
Original Assignee
Toshiba Corp
Toshiba AVE Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba AVE Co Ltd filed Critical Toshiba Corp
Priority to JP7130549A priority Critical patent/JPH08329076A/ja
Publication of JPH08329076A publication Critical patent/JPH08329076A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】「単語の並び情報」の不適切箇所を容易に発見
して、修正変更が行えるようにする。 【構成】入力文書から切り出された文の形態素解析が形
態素解析部102にて行われると、同音語誤りチェック
部105は共起辞書検索部104にて共起辞書103を
検索させ、その検索結果と形態素解析結果とを比較する
ことで、同音語誤りのある単語が存在するかを判断す
る。ここで同音語誤りが判断された場合、制御部111
は同音語誤りの判断結果とその判断の根拠となった共起
情報を取得して出力部107,108により逐次表示装
置106に表示させた状態で、入力部101からの変更
指示の受付けを行い、変更指示を受付けた場合には、そ
の指示内容を共起情報変更指示部109により共起情報
変更再登録部110に与えさせて、共起辞書103内の
該当する共起情報を修正変更させる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、例えば、日本語ワード
プロセッサやOCR装置等の入力手段によって入力され
た文章に対して、文法的な誤りや用法の誤り、或いは不
適切な表現等のチェックを行い、利用者に警告をし、必
要な場合は修正する手段を利用者に与える校正支援装置
及び方法を提供することにある。
【0002】
【従来の技術】従来から、日本語ワードプロセッサやO
CR装置等の入力手段によって入力された文章を対象に
形態素解析を行い、その形態素解析によって得られる単
語列に対して、単語の並び情報をもとに文法的な誤り、
或いは用法の誤り等を判断して、表示画面等を通して利
用者に警告を提示し、必要な場合にはその文法的な誤り
や用法の誤り等を修正する手段を利用者に与える文書作
成システムが知られている。この種のシステムは、例え
ば、「小林賢一郎他:“文章作成システムにおける日本
語処理(I)”情報処理学会 第35回(5.62後)全国
大会講演論文集(II),4S-5,p.1261」にて提案されて
いる。
【0003】
【発明が解決しようとする課題】上記した従来のシステ
ムでは、日本語ワードプロセッサやOCR装置等の入力
手段によって入力された文字列に対する文法的な誤り、
或いは用法の誤り等が「単語の並び情報」をもとに判断
されて、利用者に警告が提示されるものの、もし誤り指
摘の指針となる当該「単語の並び情報」が不適切であっ
た場合には、実際には誤りではないのに誤りだとする過
剰な誤り指摘の原因となる。ことに、「単語の並び情
報」のユーザ登録が可能なシステムにおいては、このよ
うな問題が多発する。
【0004】本発明は上記事情を考慮してなされたもの
でその目的は、「単語の並び情報」の不適切箇所を容易
に発見して、修正変更が行える校正支援装置及び方法を
提供することにある。
【0005】
【課題を解決するための手段】本発明の第1の観点に係
る構成は、入力文字列を、単語の見出し、品詞及び読み
情報に切り分ける形態素解析を行うと共に、一文中に同
時に用いられやすい単語の組に、その単語組が文中に用
いられる場合に必要とされる形態的条件情報を付加した
共起情報の群からなる共起辞書を検索して、上記形態素
解析の結果と当該共起辞書検索結果とを比較し、形態素
解析の結果が持つ単語の組のうち、検索された共起情報
の持つ一方の単語と見出し及び読みが一致し、他方の単
語とは読みは一致するが見出しが一致せず、且つ当該共
起情報の持つ単語組の形態的条件に一致する場合に、後
者の単語を同音異義語誤りであると判断し、この判断の
都度、誤り判断結果とその判断の根拠となった共起情報
を記憶しておき、外部からの出力指示に応じ、上記記憶
しておいた全ての誤り判断結果とその判断の根拠となっ
た共起情報を出力するようにしたことを特徴とするもの
である。
【0006】本発明の第2の観点に係る構成は、上記第
1の観点に係る構成とは異なり、同音異義語誤りである
と判断する都度、その誤り判断結果を出力して、外部か
らの選択指示の受付けを行い、この選択指示を受付けた
場合にのみ、指示された誤り判断結果を選択してその誤
り判断結果とその判断の根拠となった共起情報を記憶
し、外部からの出力指示に応じ、上記記憶しておいた全
ての誤り判断結果とその判断の根拠となった共起情報を
出力するようにしたことを特徴とする。
【0007】本発明の第3の観点に係る構成は、共起辞
書の再構築(修正変更)を支援するために、校正支援装
置における同音異義語誤り誤り判断結果とその判断の根
拠となった共起辞書中の共起情報を取得し、この取得し
た誤り判断結果とその判断の根拠となった共起情報を出
力して、外部からの変更指示の受付けを行い、この変更
指示を受付けた場合には、その変更指示に応じて指示さ
れた共起情報を修正変更して、共起辞書に再登録するこ
とを特徴とする。
【0008】
【作用】上記本発明の第1の観点に係る構成において
は、形態素解析によって切り出された入力文字列中の単
語が同音異義語誤りであると判断される毎に、その誤り
判断結果と判断の根拠(基準)となった共起情報(「単
語の並び情報」)が記憶されて、利用者から出力指示が
あると、それまでに記憶されていた全ての誤り判断結果
とその判断の根拠となった「単語の並び情報」が出力さ
れるため、利用者は、その出力内容からシステムが持つ
「単語の並び情報」の不適切箇所を容易に発見すること
ができ、修正変更することが可能となる。
【0009】上記本発明の第2の観点に係る構成におい
ては、形態素解析によって切り出された入力文字列中の
単語が同音異義語誤りであると判断される毎に、その誤
り判断結果と判断の根拠となった「単語の並び情報」が
無条件で記憶されるのではなく、まずその誤り判断結果
が利用者に対して警告として出力されて利用者による選
択指示の受付けが行われ、利用者からの選択指示がなさ
れた誤り判断結果だけが、その判断の根拠となった「単
語の並び情報」と共に記憶される。即ち、上記第2の観
点に係る構成においては、上記第1の観点に係る構成と
は異なって、利用者が必要とする誤り判断結果とその判
断の根拠となった「単語の並び情報」だけが選択的に記
憶される。そして利用者から出力指示があると、それま
でに選択的に記憶されていた全ての誤り判断結果とその
判断の根拠となった「単語の並び情報」が出力されるた
め、利用者は、その出力内容からシステムが持つ「単語
の並び情報」の不適切箇所を容易に発見することがで
き、修正変更することが可能となる。
【0010】上記本発明の第3の観点に係る構成におい
ては、同音異義語誤り判断結果とその判断の根拠となっ
た共起情報を、当該共起情報が登録されている共起辞書
を備えた校正支援装置等から入手することにより、その
入手した誤り判断結果とその判断の根拠となった共起情
報が出力されて、利用者による共起情報変更指示の受付
けが行われることから、利用者は上記校正支援装置とは
別の装置からでも、上記出力内容をもとに共起辞書中の
共起情報(「単語の並び情報」)の不適切箇所を容易に
発見することができ、その不適切な共起辞書中の共起情
報を修正変更することができる。
【0011】
【実施例】以下、本発明の一実施例を図面を参照して説
明する。図1は本発明の一実施例に係る校正支援装置の
全体構成を示すブロック図である。
【0012】図1の校正支援装置は、入力部101、形
態素解析部102、共起辞書103、共起辞書検索部1
04、同音語誤りチェック部105、表示装置106、
チェック結果出力部107、共起情報出力部108、共
起情報変更指示部109、共起情報変更再登録部110
及び制御部111から構成されている。
【0013】入力部101は、文字列及び(後述する共
起情報に対する)修正情報を入力するためのもので、例
えばキーボード等の入力手段である。なお、文字列の入
力手段としては、キーボードの他に、OCR(光学的文
字読取装置)、通信装置などがある。
【0014】形態素解析部102は、入力部101によ
る入力文字列を対象とする形態素解析(入力文字列を、
見出し、品詞及び読み情報からなる単語に切り出す処
理)を制御部111の指示に従って実行する。
【0015】共起辞書103は、一文中で同時に現われ
やすい(同時に用いられやすい)単語の組と、その単語
組が文中に同時に現われるときの形態的条件の情報とか
らなる、図2に示すような共起情報103a,103
b,103c…の群を登録しておく。図2中の前方単語
は上記単語組のうち同一文中の前側に出現する単語を、
後方単語は上記単語組のうち同一文中の後側に出現する
単語を表す。各単語は、その単語の見出しと読み(の情
報)からなる。また、付属する助詞は、前方単語と後方
単語が同一文中で同時に現われるときの形態的条件、具
体的には前方単語に後続する(前方単語と後方単語を接
続する)助詞の条件を表す。
【0016】共起辞書検索部104は、共起辞書103
から共起情報を検索する。同音語誤りチェック部105
は、共起辞書検索部104の検索結果と形態素解析部1
02の形態素解析結果とを比較し、形態素解析の結果が
持つ単語の組のうち、共起辞書検索部104により検索
された共起情報の持つ一方の単語と見出し及び読みが一
致し、他方の単語とは読みは一致するが見出しが一致せ
ず、且つ当該共起情報の持つ単語組の形態的条件に一致
する場合に、後者の単語を同音異義語誤り(同音語誤
り)であると判断する。
【0017】表示装置106は、同音語誤りチェック部
105による同音語誤り誤り判断結果等の表示に用いら
れるもので、CRTディスプレイ装置、液晶ディスプレ
イ装置などである。
【0018】チェック結果出力部107は、同音語誤り
チェック部105で誤りと判断された結果(同音語誤り
判断結果)を表示装置106に表示出力して、利用者に
対し同音語誤りを指摘(警告)する。
【0019】共起情報出力部108は、同音語誤り指摘
の根拠となった共起情報を表示装置106に表示出力す
る。共起情報変更指示部109は、共起情報出力部10
8によって表示装置106に表示されている共起情報を
対象とする、利用者操作に従う入力部101からの共起
情報修正変更指示をもとに、当該共起情報を修正変更す
るように共起情報変更再登録部110に指示を与える。
【0020】共起情報変更再登録部110は、共起情報
変更指示部109からの指示に従って指示された共起情
報を修正変更して、共起辞書103に再登録する。制御
部111は、図1の校正支援装置全体を制御する。
【0021】次に、図1の構成の動作を、図3及び図4
のフローチャートを参照して説明する。まず入力部10
1により、例えば図5(a)に示すような文「運を点に
任せる。」及び文「問題となる点は君に任せた。」から
なる文書が入力されたものとする(ステップS1)。
【0022】すると制御部111は、入力された文書か
ら切り出される文がなくなるまで、以下に述べる処理の
制御を繰り返す。まず制御部111は、形態素解析部1
02を起動する。これにより形態素解析部102は、入
力部101により入力された文書から句点、コンマ、感
嘆符等によって区切られる文を文書頭から一文ずつ切り
出し(ステップS2)、その切り出した文を対象とする
形態素解析を行う(ステップS3)。
【0023】この形態素解析により、例えば図5(a)
に示す文書の先頭の文「運を点に任せる。」が切り出さ
れた場合には、図5(b)に示す「運(うん,名詞)/
を(を,助詞)/点(てん,名詞)/に(に,助詞)/
任せる(まかせる,動詞)/。(句点)」のように文字
列が単語に分割され、単語の属性として、括弧内に示す
ように読み情報及び品詞情報を付加した形態素解析結果
が得られる。
【0024】制御部111は、形態素解析部102によ
る形態素解析が行われると、その形態素解析結果(図5
(b)参照)を同音語誤りチェック部105に渡して当
該チェック部105を起動する。
【0025】すると同音語誤りチェック部105は、共
起辞書検索部104により共起辞書103を検索させ
て、形態素解析部102の形態素解析結果と、共起辞書
検索部104によって検索された各共起情報とを比較す
ることで、同音語誤りのチェックを行う(ステップS
4)。そして同音語誤りチェック部105は、形態素解
析結果が持つ単語の組のうち、共起情報の持つ一方の単
語と見出し(の語幹と品詞)及び読みが一致し、他方の
単語とは読みは一致するが見出しが一致せず、且つ当該
共起情報の持つ単語組の形態的条件に一致する場合に、
後者の単語を同音語誤りであると判断する。
【0026】今、図2中の共起情報103aが共起辞書
検索部104により検索されたものとする。この共起情
報103aは、単語(前方単語)「天(てん)」と単語
(後方単語)「任せる(まかせる)」が一文中に同時に
現われやすく、現われる条件として「天」の後に「に」
のグループ(「に」に代表されるグループ)に含まれる
助詞(「に」の他には「の」など)を伴うことを表して
いる。
【0027】もし、図5(b)に示す形態素解析結果
と、図2中の共起情報103a(検索結果)とが同音語
誤りチェック部105により比較された場合には、図5
(c)において符号50で示す「点」と「任せる」の単
語組について、共起情報103aの一方つまり「任せ
る」と図5(c)において符号51に示すように見出し
及び読みが一致し、他方つまり「天」とは図5(c)に
おいて符号52に示すように読みは一致するが符号53
に示すように見出しは一致せず、しかも「点」に後続す
る助詞「に」が共起情報103aの持つ形態的条件(後
続する助詞の条件)に図5(c)において符号54に示
すように一致することが検出される。この比較結果は上
述の同音語誤りの条件を満たすことから、図5(c)に
おいて符号55に示すように「点」は「天」の誤りであ
ると判断される。
【0028】この同音語誤りチェック部105での同音
語誤り判断結果は、制御部111に渡される。制御部1
11は、同音語誤りチェック部105により同音語誤り
であると判断された場合(ステップS5)、同音語誤り
チェック部105での同音語誤り判断結果をチェック結
果出力部107に渡して当該出力部107を起動する。
これによりチェック結果出力部107は、同音語誤りチ
ェック部105での同音語誤り判断結果として、例えば
“「点」は「天」の誤りです”といった警告メッセージ
を、図6に示すように表示装置106に表示する(ステ
ップS6)。
【0029】この状態で制御部111は、利用操作に従
う入力部101からの入力を待つ(ステップS7)。こ
こで利用者が、システムから提示された警告メッセージ
による、入力文字列(切り出された文)「運を点に任せ
る」中の「点」が「天」の誤り(同音語誤り)との指摘
(警告)を尤もであると判断し、指摘(警告)された単
語(誤りのあった単語)の修正を入力部101から指示
入力したものとする。
【0030】制御部111は、入力部101から単語修
正指示(入力文字列の修正指示)が入力されると(ステ
ップS8)、利用者操作による誤り箇所の修正を受付け
て、その誤り箇所を利用者指定の単語に置き換えて修正
する(ステップS9)。即ち制御部111は、入力文書
を表示装置106に表示すると共に、その入力文書中の
誤りであると指摘された単語部分にカーソルを移動して
(ブリンク等の)所定の表示修飾を施すことで、利用者
に対して修正箇所を明示し、システムが持つエディタ機
能を用いた利用者操作による誤り箇所の修正を可能とす
るインタフェースを提供する。ここで利用者は、入力部
101を操作して、エディタ機能を用いて誤りのあった
箇所の単語を直接正しい単語に修正する単語の置き換え
を行う。ここでは、切り出された文「運を点に任せる」
中の(誤りであると指摘された)単語「点」が正しい単
語「天」に修正され(置き換えられ)、正しい文「運を
天に任せる。」が得られる。
【0031】制御部111は、ステップS9での単語の
修正を終了すると、切り出すべき文がなくなったか否
か、即ち入力文書中の文を全て処理したか否かを調べ
(ステップS10)、切り出すべき文が残っているなら
ば、ステップS2に戻って形態素解析部102により入
力文書から後続の文を切り出させる。ここでは、図5
(a)から明らかなように、文「運を点に任せる。」に
後続する文「問題となる点は君に任せた。」が切り出さ
れる。このとき共起辞書103には、図2に示した共起
情報103aではなくて、図7に示すような共起情報1
03a′が登録されているものとする。この共起情報1
03a′は、単語(前方単語)「天(てん)」と単語
(後方単語)「任せる(まかせる)」が一文中に同時に
現われやすく、現われる条件として「天」の後に「は」
のグループに含まれる助詞(「は」の他には「が」
「も」など)を伴うことを表している。
【0032】形態素解析部102は、入力文書から切り
出した文「問題となる点は君に任せた。」を対象とする
形態素解析を行う(ステップS3)。これにより、形態
素解析結果として、図8(a)に示す「問題(もんだ
い,名詞)/と(と,助詞)/なる(なる,動詞)/点
(てん,名詞)/は(は,助詞)/君(きみ,名詞)/
に(に,助詞)/任せた(まかせた/動詞)/。(句
点)」が得られる。
【0033】制御部111は、形態素解析部102によ
る形態素解析が行われると、その形態素解析結果(図8
(a)参照)を同音語誤りチェック部105に渡して当
該チェック部105を起動する。
【0034】すると同音語誤りチェック部105は、共
起辞書検索部104により共起辞書103を検索させ
て、形態素解析部102の形態素解析結果と、共起辞書
検索部104によって検索された各共起情報とを比較す
ることで、同音語誤りのチェックを行う(ステップS
4)。
【0035】ここで共起辞書103には、前記したよう
に(図2に示す共起情報103aではなくて)図7に示
す共起情報103a′が登録されている。このため同音
語誤りチェック部105では、図8(b)において符号
80で示す「点」と「任せ(た)」の単語組について、
共起情報103a′の一方つまり「任せ(る)」と図8
(b)において符号81に示すように見出し(の語幹と
品詞)及び読みが一致し、他方つまり「天」とは図8
(b)において符号82に示すように読みは一致するが
符号83に示すように見出しは一致せず、しかも「点」
に後続する助詞「は」が共起情報103aの持つ形態的
条件(後続する助詞の条件)に図8(b)において符号
84に示すように一致することが検出される。この比較
結果は上述の同音語誤りの条件を満たすことから、図8
(b)において符号85に示すように「点」は「天」の
誤りであると判断される。
【0036】制御部111は、同音語誤りチェック部1
05により同音語誤りであると判断された場合(ステッ
プS5)、同音語誤りチェック部105での同音語誤り
判断結果をチェック結果出力部107に渡して当該出力
部107を起動する。これによりチェック結果出力部1
07は、同音語誤りチェック部105での同音語誤り判
断結果として、例えば“「点」は「天」の誤りです”と
いった警告メッセージを、図9に示すように表示装置1
06に表示する(ステップS6)。
【0037】この場合、利用者は、システムから提示さ
れた警告メッセージによる、入力文字列(切り出された
文)「問題となる点は君に任せた」中の「点」が「天」
の誤り(同音語誤り)との指摘に対し、「点」は「天」
の誤りでない(即ちシステム側の過剰な誤り指摘であ
る)と判断できる。
【0038】そこで利用者は、入力部101を操作し
て、同音語誤り指摘の根拠となった共起情報を修正変更
するための指示を入力する。制御部111は、入力部1
01から単語の修正指示が入力されずに、共起情報の修
正変更指示が入力された場合には(ステップS7,S
8,S11)、以下に述べる共起辞書修正処理を図4の
フローチャートに従って実行する(ステップS12)。
【0039】まず制御部111は、同音語誤り指摘の根
拠となった共起情報(ここでは、図7中の共起情報10
3a′)を、共起情報出力部108により図10に示す
ように表示装置106の表示画面の例えば上部に表示さ
せる(ステップS21)。
【0040】また制御部111は、予め用意している共
起情報の修正変更候補のリストを、共起情報出力部10
8により図11に示すように表示装置106の表示画面
の例えば下部(共起情報の下方)に表示させる(ステッ
プS22)。この修正変更候補リストは、「共起情報を
(共起辞書103から)抹消する」ことを指示するため
の番号(候補番号)0の候補(メニュー項目)と、共起
情報中の「付属する助詞(形態的条件情報)の条件を
「に」のグループに変更」することを指示するための番
号1の候補と、共起情報中の「付属する助詞の条件を
「は」のグループに変更」することを指示するための番
号2の候補とからなる。
【0041】制御部111は、図11に示す(共起情報
とその共起情報を対象とする)修正変更候補の画面表示
状態において、利用操作に従う入力部101からの修正
変更候補選択入力を待つ(ステップS23)。
【0042】一方、利用者は、図11に示すように表示
されている修正変更候補リストの中から、適当と思われ
る候補を決定する。そして利用者は、決定した候補の番
号を入力部101を操作して入力することで、決定した
候補を選択指定する。
【0043】制御部111は、図11に示す修正変更候
補の画面表示状態において、入力部101から候補番号
が入力されると(ステップS23)、その候補番号を共
起情報変更指示部109に渡して、当該変更指示部10
9を起動する。
【0044】すると共起情報変更指示部109は、制御
部111から渡された候補番号の示す変更内容に従う共
起情報変更指示を共起情報変更再登録部110に与え
る。これにより共起情報変更再登録部110は、共起情
報変更指示部109からの指示に応じて、共起辞書10
3内の対象となっている共起情報(ここでは図7中の共
起情報103′)を変更する(ステップS24)。例え
ば、図11に示す修正変更候補リストの中から候補番号
0の変更候補が選択された場合であれば、共起情報変更
再登録部110は、図7中の共起情報103′を抹消す
る。また、候補番号1の変更候補が選択された場合であ
れば、共起情報変更再登録部110は、図7中の共起情
報103′の持つ「天」と「任せる」の単語組の助詞の
条件(形態的条件情報)を、図12(a)に示す「は」
のグループから、図12(b)に示すように「に」のグ
ループに修正変更し、共起情報103として共起辞書1
03に再登録する。
【0045】制御部111は、共起情報変更再登録部1
10により上記ステップS24が実行されると、共起辞
書修正処理(ステップS12)の終了を判断する。この
場合、制御部111は、切り出すべき文がなくなったか
否かを調べ(ステップS10)、切り出すべき文が残っ
ていないならば、即ち入力文書中の文を全て処理したな
らば、一連の処理を終了する。
【0046】以上のように本実施例では、同音語誤りチ
ェック部105にて同音語誤りが判断される毎に、その
判断結果とその判断の根拠となった共起情報を制御部1
11にて取得し、その判断結果(警告メッセージ)をチ
ェック結果出力部107により表示出力させることで、
誤りと判断された単語またはその判断の根拠となった共
起情報の修正の指示の受付けを行い、共起情報修正指示
を受付けた場合には、対象となる共起情報と修正変更候
補リストを共起情報出力部108により表示出力させて
修正変更候補の選択指定の受付けを行い、選択指定され
た修正変更候補に従って共起情報を修正変更して共起辞
書103に再登録するようにしている。
【0047】このように本実施例では、同音語誤り判断
結果とその判断の根拠となった共起情報を取得する毎
に、この取得した誤り判断結果とその判断の根拠となっ
た共起情報を出力して、外部からの変更指示の受付けを
行い、この変更指示を受付けた場合には、その変更指示
に応じて指示された共起情報を修正変更して共起辞書1
03に再登録するようにしているが、これに限るもので
はない。
【0048】例えば、同音語誤りが判断されて、その判
断の根拠となった共起情報の修正変更が指示される都
度、その変更対象となる共起情報を記憶手段、例えば入
力文書とは別のファイル等に記憶しておき、後で記憶し
ておいた共起情報を全て呼び出して出力(例えば画面表
示)し、その呼び出した各共起情報に対して、前記実施
例と同様の手続きで修正変更を行って共起辞書103に
再登録するようにしてもよい。このとき、同音語誤りの
判断結果を、その判断の根拠となった共起情報と共に記
憶しておき、共起情報の呼び出し時には対応する同音語
誤り判断結果を例えば対にして表示すると、利用者は同
音語誤り判断結果をもとに、その判断の根拠となった共
起情報に対してどのような変更を加えるかを決定するこ
とができるため、適切な共起情報修正操作が行える。
【0049】また、同音語誤りが判断される都度、無条
件で(その同音語誤りの判断結果及び)その判断の根拠
となった共起情報を記憶しておき、後で記憶しておいた
共起情報を全て呼び出して出力し、その呼び出した各共
起情報のうち、利用者が選択指定した共起情報に対し
て、前記実施例と同様の手続きで修正変更を行って共起
辞書103に再登録するようにしてもよい。
【0050】また、記憶しておいた(同音語誤りの判断
結果及びその判断の根拠となった)共起情報を全て呼び
出して単に出力するだけであっても構わない。この場
合、共起情報の修正変更の形態は問わないが、出力され
た(同音語誤りの判断結果及び)共起情報のリストをも
とに、例えば通常の共起情報のユーザ登録/削除機能を
用いて、該当する共起情報を削除した後、修正変更後の
共起情報を登録することも可能である。
【0051】また、共起辞書103がフロッピーディス
ク等の着脱自在な記憶媒体に保存されている場合に、当
該共起辞書103を他の校正支援装置等に再配置し、
(同音語誤りの判断結果及びその判断の根拠となった)
共起情報のリストをファイル等から取得してその装置内
で出力し、その出力リストから利用者操作により選択指
定された共起情報の修正変更を受付けて、共起辞書10
3に再登録するようにしても構わない。
【0052】また前記実施例では、共起情報を規定する
形態的情報として、付属する助詞のみを例に挙げたが、
その他に単語の並びの条件を条件情報とするようにして
も構わない。その他、本発明はその要旨を逸脱しない範
囲で、種々変形して実施することができる。
【0053】
【発明の効果】以上詳述したように本発明によれば、形
態素解析によって切り出された入力文字列中の単語が同
音異義語誤りであると判断される毎に、その誤り判断結
果と判断の根拠となった共起情報(「単語の並び情
報」)が記憶されて、利用者から出力指示があると、そ
れまでに記憶されていた全ての誤り判断結果とその判断
の根拠となった「単語の並び情報」が出力されるため、
利用者は、その出力内容からシステムが持つ「単語の並
び情報」の不適切箇所を容易に発見することができ、修
正変更することができる。特に、同音語誤り指摘の指針
となった「単語の並び情報」が不適切であった場合に
は、誤りではないのに誤りであるとする過剰な指摘の原
因となるため、本発明の適用により「単語の並び情報」
の不適切箇所を容易に発見して修正変更することで、こ
のような過剰な誤り指摘の発生を防止することができ
る。この効果は、「単語の並び情報」のユーザ登録が可
能な(ために不適切な「単語の並び情報」が登録される
確率が高い)システムにおいて著しい。 また本発明に
よれば、利用者が必要とする誤り判断結果とその判断の
根拠となった「単語の並び情報」だけが選択的に記憶さ
れて、利用者から出力指示があると、それまでに記憶さ
れていた全ての誤り判断結果とその判断の根拠となった
「単語の並び情報」が出力されるため、利用者は、その
出力内容からシステムが持つ「単語の並び情報」の不適
切箇所を容易に発見することができ、修正変更すること
ができる。
【0054】また本発明によれば、同音語誤りの判断結
果とその判断の根拠となった「単語の並び情報」を取得
し、その取得した情報を出力することで、外部からの変
更指示の受付けを行い、この変更指示を受付けた場合に
は、その変更指示に応じて指示された共起情報を修正変
更して辞書(共起辞書)に再登録する構成とすることに
より、同音語誤りが判断された校正支援装置とは別の装
置からでも、「単語の並び情報」の不適切箇所を容易に
発見することができ、修正変更することができる。
【図面の簡単な説明】
【図1】本発明の一実施例に係る校正支援装置の構成を
示すブロック図。
【図2】図1中の共起辞書103に登録されている共起
情報の例を示す図。
【図3】同実施例の全体の処理の流れを説明するための
フローチャート。
【図4】図3中の共起辞書修正処理(S12)の流れを
説明するためのフローチャート。
【図5】入力文書の例と、その入力文書から切り出され
た一文に対する形態素解析結果と、検索された共起情報
と当該形態素解析結果の示す単語組との比較による誤り
指摘の例とを示す図。
【図6】図5での誤り指摘例に対応する警告表示例を示
す図。
【図7】共起辞書103中の不適切な共起情報の一例を
示す図。
【図8】図5に示す入力文書から切り出された2番目
(最後)の一文に対する形態素解析結果と、検索された
共起情報と当該形態素解析結果の示す単語組との比較に
よる誤り指摘の例とを示す図。
【図9】図8での誤り指摘例に対応する警告表示例を示
す図。
【図10】図8での誤り指摘の根拠となった共起情報の
表示例を示す図。
【図11】共起情報の修正変更候補リストの表示例を示
す図。
【図12】共起辞書103における共起情報の修正変更
例を示す図。
【符号の説明】
101…入力部、102…形態素解析部、103…共起
辞書、104…共起辞書検索部、105…同音語誤りチ
ェック部、106…表示装置、107…チェック結果出
力部、108…共起情報出力部、109…共起情報変更
指示部、110…共起情報変更再登録部、111…制御
部、103a,103a′,103b,103c…共起
情報。

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 文字列を入力する入力手段と、 この入力手段により入力された文字列を、見出し、品詞
    及び読み情報からなる単語に切り出す形態素解析手段
    と、 一文中に同時に用いられやすい単語の組に、その単語組
    が文中に用いられる場合に必要とされる形態的条件情報
    を付加した共起情報の群からなる共起辞書と、 この共起辞書を検索する共起辞書検索手段と、 この共起辞書検索手段の検索結果と前記形態素解析手段
    の形態素解析結果とを比較し、形態素解析の結果が持つ
    単語の組のうち、前記共起辞書検索手段により検索され
    た共起情報の持つ一方の単語と見出し及び読みが一致
    し、他方の単語とは読みは一致するが見出しが一致せ
    ず、且つ当該共起情報の持つ単語組の形態的条件に一致
    する場合に、後者の単語を同音異義語誤りであると判断
    する同音語誤りチェック手段と、 この同音語誤りチェック手段の誤り判断結果とその判断
    の根拠となった共起情報を記憶する記憶手段と、 この記憶手段により記憶された前記誤り判断結果とその
    判断の根拠となった共起情報を出力する出力手段とを具
    備することを特徴とする校正支援装置。
  2. 【請求項2】 文字列を入力する第1の入力手段と、 この第1の入力手段により入力された文字列を、見出
    し、品詞及び読み情報からなる単語に切り出す形態素解
    析手段と、 一文中に同時に用いられやすい単語の組に、その単語組
    が文中に用いられる場合に必要とされる形態的条件情報
    を付加した共起情報の群からなる共起辞書と、 この共起辞書を検索する共起辞書検索手段と、 この共起辞書検索手段の検索結果と前記形態素解析手段
    の形態素解析結果とを比較し、形態素解析の結果が持つ
    単語の組のうち、前記共起辞書検索手段により検索され
    た共起情報の持つ一方の単語と見出し及び読みが一致
    し、他方の単語とは読みは一致するが見出しが一致せ
    ず、且つ当該共起情報の持つ単語組の形態的条件に一致
    する場合に、後者の単語を同音異義語誤りであると判断
    する同音語誤りチェック手段と、 この同音語誤りチェック手段の誤り判断結果を出力する
    チェック結果出力手段と、 利用者操作に従う指示を入力する第2の入力手段と、 この第2の入力手段からの指示入力に従って、前記同音
    語誤りチェック手段の誤り判断結果とその判断の根拠と
    なった共起情報を選択して記憶する記憶手段と、 この記憶手段により記憶された前記誤り判断結果とその
    判断の根拠となった共起情報を出力する出力手段とを具
    備することを特徴とする校正支援装置。
  3. 【請求項3】 文字列を入力する入力手段と、この入力
    手段により入力された文字列を、見出し、品詞及び読み
    情報からなる単語に切り出す形態素解析手段と、一文中
    に同時に用いられやすい単語の組に、その単語組が文中
    に用いられる場合に必要とされる形態的条件情報を付加
    した共起情報の群からなる共起辞書と、この共起辞書を
    検索する共起辞書検索手段と、この共起辞書検索手段の
    検索結果と前記形態素解析手段の形態素解析結果とを比
    較し、形態素解析の結果が持つ単語の組のうち、前記共
    起辞書検索手段により検索された共起情報の持つ一方の
    単語と見出し及び読みが一致し、他方の単語とは読みは
    一致するが見出しが一致せず、且つ当該共起情報の持つ
    単語組の形態的条件に一致する場合に、後者の単語を同
    音異義語誤りであると判断する同音語誤りチェック手段
    とを備えた校正支援装置に適用され、前記共起辞書の再
    構築を支援するための共起辞書再構築支援装置であっ
    て、 前記同音語誤りチェック手段の誤り判断結果とその判断
    の根拠となった共起情報からなるデータを取得して出力
    する出力手段と、 この出力手段により出力された共起情報の変更を利用者
    操作に従って指示する変更指示手段と、 この変更指示手段からの変更指示に応じて前記共起情報
    を修正変更して前記共起辞書に再登録する共起情報変更
    再登録手段とを具備することを特徴とする共起辞書再構
    築支援装置。
  4. 【請求項4】 入力文字列を、単語の見出し、品詞及び
    読み情報に切り分ける形態素解析を行い、 一文中に同時に用いられやすい単語の組に、その単語組
    が文中に用いられる場合に必要とされる形態的条件情報
    を付加した共起情報の群からなる共起辞書を検索し、前
    記形態素解析の結果と当該共起辞書検索結果とを比較
    し、形態素解析の結果が持つ単語の組のうち、検索され
    た共起情報の持つ一方の単語と見出し及び読みが一致
    し、他方の単語とは読みは一致するが見出しが一致せ
    ず、且つ当該共起情報の持つ単語組の形態的条件に一致
    する場合に、後者の単語を同音異義語誤りであると判断
    し、 この判断の都度、誤り判断結果とその判断の根拠となっ
    た共起情報を記憶しておき、 外部からの出力指示に応じ、上記記憶しておいた全ての
    誤り判断結果とその判断の根拠となった共起情報を出力
    することを特徴とする校正支援方法。
  5. 【請求項5】 入力文字列を、単語の見出し、品詞及び
    読み情報に切り分ける形態素解析を行い、 一文中に同時に用いられやすい単語の組に、その単語組
    が文中に用いられる場合に必要とされる形態的条件情報
    を付加した共起情報の群からなる共起辞書を検索し、前
    記形態素解析の結果と当該共起辞書検索結果とを比較
    し、形態素解析の結果が持つ単語の組のうち、検索され
    た共起情報の持つ一方の単語と見出し及び読みが一致
    し、他方の単語とは読みは一致するが見出しが一致せ
    ず、且つ当該共起情報の持つ単語組の形態的条件に一致
    する場合に、後者の単語を同音異義語誤りであると判断
    し、 この判断の都度、その誤り判断結果を出力して、外部か
    らの選択指示の受付けを行い、 この選択指示を受付けた場合にのみ、指示された誤り判
    断結果を選択してその誤り判断結果とその判断の根拠と
    なった共起情報を記憶し、 外部からの出力指示に応じ、上記記憶しておいた全ての
    誤り判断結果とその判断の根拠となった共起情報を出力
    することを特徴とする校正支援方法。
  6. 【請求項6】 入力文字列を、単語の見出し、品詞及び
    読み情報に切り分ける形態素解析を行うと共に、一文中
    に同時に用いられやすい単語の組に、その単語組が文中
    に用いられる場合に必要とされる形態的条件情報を付加
    した共起情報の群からなる共起辞書を検索して、前記形
    態素解析の結果と当該共起辞書検索結果とを比較し、形
    態素解析の結果が持つ単語の組のうち、検索された共起
    情報の持つ一方の単語と見出し及び読みが一致し、他方
    の単語とは読みは一致するが見出しが一致せず、且つ当
    該共起情報の持つ単語組の形態的条件に一致する場合
    に、後者の単語を同音異義語誤りであると判断する校正
    支援装置に適用され、前記共起辞書の再構築を支援する
    ための共起辞書再構築支援方法であって、 前記校正支援装置における同音異義語誤り判断結果とそ
    の判断の根拠となった共起情報を取得し、 この取得した誤り判断結果とその判断の根拠となった共
    起情報を出力して、外部からの変更指示の受付けを行
    い、 この変更指示を受付けた場合には、その変更指示に応じ
    て指示された共起情報を修正変更して前記共起辞書に再
    登録することを特徴とする共起辞書再構築方法。
JP7130549A 1995-05-29 1995-05-29 校正支援装置及び方法 Pending JPH08329076A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7130549A JPH08329076A (ja) 1995-05-29 1995-05-29 校正支援装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7130549A JPH08329076A (ja) 1995-05-29 1995-05-29 校正支援装置及び方法

Publications (1)

Publication Number Publication Date
JPH08329076A true JPH08329076A (ja) 1996-12-13

Family

ID=15036942

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7130549A Pending JPH08329076A (ja) 1995-05-29 1995-05-29 校正支援装置及び方法

Country Status (1)

Country Link
JP (1) JPH08329076A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001359009A (ja) * 2000-06-15 2001-12-26 Canon Inc 画像表示装置、そのメニュー表示方法、画像表示システム、及び記憶媒体

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001359009A (ja) * 2000-06-15 2001-12-26 Canon Inc 画像表示装置、そのメニュー表示方法、画像表示システム、及び記憶媒体
JP4557374B2 (ja) * 2000-06-15 2010-10-06 キヤノン株式会社 画像表示装置及びその制御方法、並びに記憶媒体

Similar Documents

Publication Publication Date Title
US7475009B2 (en) Text input support system and method
JPS5994131A (ja) ワ−ドプロセツサ
JPH08329076A (ja) 校正支援装置及び方法
JP3103179B2 (ja) 文書作成装置及び文書作成方法
JPH08185393A (ja) 再実行システム及びその方法
JP2570681B2 (ja) ワード・プロセッサ
JPH09237270A (ja) 文章推敲支援装置及び文章推敲支援方法
JPH06195328A (ja) 入力文書校正装置および入力文書の校正方法
JP2893239B2 (ja) 翻訳支援辞書検索表示システム
JPH03233669A (ja) 文書作成装置
JPS61175855A (ja) 仮名漢字変換装置
JPH05174003A (ja) 文章作成装置およびその方法
JPH05181909A (ja) 文書処理装置
JPH0799520B2 (ja) 文書編集装置
JPH10198664A (ja) 日本語入力システム及び日本語入力プログラムを記録した媒体
JP3032399B2 (ja) かな漢字変換装置
JPS6278674A (ja) 文書作成装置
JPH0877159A (ja) 学習方法
JPH05151199A (ja) 文書作成装置
JP2000285115A (ja) 文書作成装置、文書作成方法及び文書作成プログラムを記憶した記憶媒体
JPH11195022A (ja) 文字処理装置、文字処理方法および記録媒体
JPH0589140A (ja) 文書作成装置
JPS62278663A (ja) ワ−ドプロセツシング方式
JPH0981555A (ja) 文書処理装置及びその方法
JPH0258159A (ja) 日本文の校正システム