JPS6383860A - 文章用語検定装置 - Google Patents
文章用語検定装置Info
- Publication number
- JPS6383860A JPS6383860A JP61228268A JP22826886A JPS6383860A JP S6383860 A JPS6383860 A JP S6383860A JP 61228268 A JP61228268 A JP 61228268A JP 22826886 A JP22826886 A JP 22826886A JP S6383860 A JPS6383860 A JP S6383860A
- Authority
- JP
- Japan
- Prior art keywords
- word
- attribute
- conversion table
- dictionary
- terms
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 claims abstract description 38
- 238000006243 chemical reaction Methods 0.000 claims abstract description 25
- 238000012360 testing method Methods 0.000 claims description 5
- 238000012795 verification Methods 0.000 claims description 4
- 239000000284 extract Substances 0.000 claims 1
- 238000003058 natural language processing Methods 0.000 claims 1
- 238000000034 method Methods 0.000 abstract description 16
- 230000008569 process Effects 0.000 abstract description 15
- 230000008859 change Effects 0.000 abstract description 4
- 230000004044 response Effects 0.000 abstract description 3
- 238000007689 inspection Methods 0.000 abstract 1
- 238000004519 manufacturing process Methods 0.000 abstract 1
- 230000001131 transforming effect Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 4
- 238000000926 separation method Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006735 deficit Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は、大量の自然言語の文章を処理して、その中か
ら専門用語や誤用語(使い方を誤った用語、例えば誤字
)等の特定の種類の単語を抽出することにより検定を行
う文章用語検定装置に関するものである。
ら専門用語や誤用語(使い方を誤った用語、例えば誤字
)等の特定の種類の単語を抽出することにより検定を行
う文章用語検定装置に関するものである。
計算機による自然言語のデータベース化の発達に伴い、
−見計算機へ蓄積した大量の自然言語の文章を計算機で
処理しである種類の用語をチェックアウトすることが様
々な目的で要求されている。
−見計算機へ蓄積した大量の自然言語の文章を計算機で
処理しである種類の用語をチェックアウトすることが様
々な目的で要求されている。
例えば、それら大量の文書について索引を作る目的で特
定の専門用語を抽出したいという場合もあるし、或いは
誤字(「実績」と書くべき所を「実績」と書いてしまう
など、間違い易い用語は色々とある)をチェックのため
抽出したいという場合もある。
定の専門用語を抽出したいという場合もあるし、或いは
誤字(「実績」と書くべき所を「実績」と書いてしまう
など、間違い易い用語は色々とある)をチェックのため
抽出したいという場合もある。
このような要求のため、自然言語の文章中にある特定の
用語を計算機で処理してチェックアウトするには、大規
模な単語辞書を持ち、必要な単語には単語毎に重要語、
特殊専門用語、誤用語等のチェックアウトしたい属性情
報を付与しておき(例えば「実績」を「実績」の誤用語
として記憶し、誤用語表示を付しておくなど)、文章を
分かち書き等の処理で単語単位の形態素に分解した後、
単語単位のマツチングによって抽出する方法が一般的で
ある。
用語を計算機で処理してチェックアウトするには、大規
模な単語辞書を持ち、必要な単語には単語毎に重要語、
特殊専門用語、誤用語等のチェックアウトしたい属性情
報を付与しておき(例えば「実績」を「実績」の誤用語
として記憶し、誤用語表示を付しておくなど)、文章を
分かち書き等の処理で単語単位の形態素に分解した後、
単語単位のマツチングによって抽出する方法が一般的で
ある。
第2図は従来のかかる文章用語検定装置の一例を示す説
明図である。
明図である。
同図において、1は入力文、2は言語処理部、3は分か
ち書き等による形態素分割処理、4,6はそれぞれ各種
属性チェック指定判定処理、5は辞書引きによるチェッ
クフラグ設定処理、7は辞書、8は出力制御部、である
。
ち書き等による形態素分割処理、4,6はそれぞれ各種
属性チェック指定判定処理、5は辞書引きによるチェッ
クフラグ設定処理、7は辞書、8は出力制御部、である
。
第2図を参照する。先ずチェック種別(ここでは誤用語
の検出)を指定された入力文1が言語処理部2に渡され
ると(■)、言語処理部2では、処理3において辞書情
報を用いて(■)分かち書き等により単語単位に分割し
た後、処理4において指定されたチェックの種別を調べ
て、処理5に進み、そのチェック種別毎に辞書の単語の
チェックアウト属性(誤用語、専門語等)を調べて(■
)、該当する単語には認定フラグを付与する。
の検出)を指定された入力文1が言語処理部2に渡され
ると(■)、言語処理部2では、処理3において辞書情
報を用いて(■)分かち書き等により単語単位に分割し
た後、処理4において指定されたチェックの種別を調べ
て、処理5に進み、そのチェック種別毎に辞書の単語の
チェックアウト属性(誤用語、専門語等)を調べて(■
)、該当する単語には認定フラグを付与する。
言語処理部2の出力結果は出力制御部8に渡され(■)
、出力制御部8では例えばチェックアウトした単語を赤
字としてディスプレイに表示する等の制御を行う。
、出力制御部8では例えばチェックアウトした単語を赤
字としてディスプレイに表示する等の制御を行う。
上記の例では、入力文「実績がある。」の中に「実績」
を[実績]と書いた誤用語が含まれており、辞書7にも
、予めその意味で誤用語表示を施した「実績」が記憶さ
れているので、処理5においては、入力文における「実
績」を誤用語と判定して誤用語の認定フラグ誉を付し、
更に単語長「02」も付して出力制御部8に渡すことが
できる。
を[実績]と書いた誤用語が含まれており、辞書7にも
、予めその意味で誤用語表示を施した「実績」が記憶さ
れているので、処理5においては、入力文における「実
績」を誤用語と判定して誤用語の認定フラグ誉を付し、
更に単語長「02」も付して出力制御部8に渡すことが
できる。
出力制御部8では、「実績がある。」という全文を例え
ばディスプレイ表示し、そのうち「実績」の2文字を誤
用語として特に赤色などで表示してチェックアウトする
。
ばディスプレイ表示し、そのうち「実績」の2文字を誤
用語として特に赤色などで表示してチェックアウトする
。
ところで、同一の文章を処理する場合でも利用者によっ
て抽出したい単語の属性種別が違ったり、目的に応じて
抽出したい単語が異なることが多(、言語処理部設計時
、予想される全ての抽出種別を考慮すると設計が複雑と
なり、設計時に予想できなかったものについては、言語
処理部の改造が必要になるという問題があった。
て抽出したい単語の属性種別が違ったり、目的に応じて
抽出したい単語が異なることが多(、言語処理部設計時
、予想される全ての抽出種別を考慮すると設計が複雑と
なり、設計時に予想できなかったものについては、言語
処理部の改造が必要になるという問題があった。
そこで本発明では、文章中の種々の属性を持つ単語をチ
ェックアウトする文章用語検定装置において、利用者が
チェックアウトしたい属性に応じて言語処理部を改造す
ることなく、柔軟にチェックアウトを可能ならしめるこ
と、を解決すべき問題点としている。
ェックアウトする文章用語検定装置において、利用者が
チェックアウトしたい属性に応じて言語処理部を改造す
ることなく、柔軟にチェックアウトを可能ならしめるこ
と、を解決すべき問題点としている。
本発明は、単語単位に必要な属性制御コードを付与して
記憶する辞書を持ち、言語処理部では単語単位に付与さ
れた属性制御コードの意味を何も考慮することなく、た
だ機械的に分割した単語に辞書からもってきた属性制御
コードを付与し、言語処理部の出力結果に対し、変換テ
ーブルを用いて利用者が必要とする属性制御コードのみ
有効として付与するフィルター制御部と、さらに利用者
がその変換テーブルを端末等から自由に変更できる変換
テーブル作成制御部を持つことによってチェックアウト
する属性を自由に制御可能にした。
記憶する辞書を持ち、言語処理部では単語単位に付与さ
れた属性制御コードの意味を何も考慮することなく、た
だ機械的に分割した単語に辞書からもってきた属性制御
コードを付与し、言語処理部の出力結果に対し、変換テ
ーブルを用いて利用者が必要とする属性制御コードのみ
有効として付与するフィルター制御部と、さらに利用者
がその変換テーブルを端末等から自由に変更できる変換
テーブル作成制御部を持つことによってチェックアウト
する属性を自由に制御可能にした。
その結果、新たな属性に対するチェックアウト要求に対
して言語処理部等のプログラムの変更が不要になり、変
換テーブルの変更が端末等からダイナミックに指定でき
るため、利用者の要求に応じて柔軟にチェックアウトが
指定できる。
して言語処理部等のプログラムの変更が不要になり、変
換テーブルの変更が端末等からダイナミックに指定でき
るため、利用者の要求に応じて柔軟にチェックアウトが
指定できる。
次に図を参照して本発明の詳細な説明する。
第1図は本発明の一実施例を示す説明図である。
同図において、(1−1)は入力文、(2−1)は言語
処理部で、3は分かち書き等により単語単位の形態素に
分割する処理、(5−1)は辞書引きにより単語の属性
制御コードを該当単語に付与する処理、(7−1)は単
語の見出し対応に品詞や属性制御コード等を持つ辞書、
9は変換テーブル10により、単語毎の属性を変換する
フィルター処理部、10は属性制御コード毎に有効/無
効や変換したい制御コードを定義した変換テーブル、1
1は端末から変換テーブルの定義を自由に変更できる変
換テーブル作成制御部、8はフィルター処理部からの出
力結果を出力装置に応じてチェックアウトした単語を注
意語として出力する等の制御を行う出力制御部である。
処理部で、3は分かち書き等により単語単位の形態素に
分割する処理、(5−1)は辞書引きにより単語の属性
制御コードを該当単語に付与する処理、(7−1)は単
語の見出し対応に品詞や属性制御コード等を持つ辞書、
9は変換テーブル10により、単語毎の属性を変換する
フィルター処理部、10は属性制御コード毎に有効/無
効や変換したい制御コードを定義した変換テーブル、1
1は端末から変換テーブルの定義を自由に変更できる変
換テーブル作成制御部、8はフィルター処理部からの出
力結果を出力装置に応じてチェックアウトした単語を注
意語として出力する等の制御を行う出力制御部である。
次に動作を説明する。
まず利用者は変換テーブル作成制御部11に対し、端末
からチェックアウトしたい単語属性制御コードを指定し
て(■)、出力制御部8に注意出力の要/否やそのレベ
ル(例えば絶対駄目という意味での赤字出力はレベル0
1、要注意程度の意味を表す黄色出力はレベル02等)
を指示するコードを定義する変換テーブルを作成する。
からチェックアウトしたい単語属性制御コードを指定し
て(■)、出力制御部8に注意出力の要/否やそのレベ
ル(例えば絶対駄目という意味での赤字出力はレベル0
1、要注意程度の意味を表す黄色出力はレベル02等)
を指示するコードを定義する変換テーブルを作成する。
第1図の例では、誤用語についてのみレベル01の表示
を行い、その他の属性については何も指定をしない(無
効とする)ようにしている(■)。
を行い、その他の属性については何も指定をしない(無
効とする)ようにしている(■)。
入力文「実績がある。J (1−1)が言語処理部(
2−1)に入力されると(■)、辞書引きをしながら(
■)、分かち書き等による形態素分割により、「実績/
が/ある/。」と分割され、さらに分割された単語毎に
辞書(7−1)から属性制御コードを持って来て(■)
、その単語の単語長と共に単語に付与し、rFAO2実
積AKOIがある。」の出力文を出力する。
2−1)に入力されると(■)、辞書引きをしながら(
■)、分かち書き等による形態素分割により、「実績/
が/ある/。」と分割され、さらに分割された単語毎に
辞書(7−1)から属性制御コードを持って来て(■)
、その単語の単語長と共に単語に付与し、rFAO2実
積AKOIがある。」の出力文を出力する。
ここでFA、AKはそれぞれ誤用語、格助詞を示す属性
制御コードであり、「ある」には辞書上属性制御コード
が付与されていないため何も付与しない(もし文章中の
動詞をすべてチェックアウトしたい場合等は、動詞を示
す適当な属性制御コードを定義して辞書中の動詞の全単
語に付与しておけば良い)。
制御コードであり、「ある」には辞書上属性制御コード
が付与されていないため何も付与しない(もし文章中の
動詞をすべてチェックアウトしたい場合等は、動詞を示
す適当な属性制御コードを定義して辞書中の動詞の全単
語に付与しておけば良い)。
言語処理部(2−1)の出力文はフィルター処理部9に
渡され(■)、フィルター処理部9では変換テーブル1
0に従って渡された文中の属性制御コードを出力制御部
8への出力指示コードに変換したり、削除したりするこ
とにより、利用者が望むチェックだけを有効とし、且つ
出力されるチェックアウト結果の表示(例えば赤字表示
等)を制御する。この場合、誤用語のチェックのみ有効
であるから、rAKOIJを削除すると共に、rFAJ
を注意出力要レベル01の「01」に変換した文r01
02実積がある。」を出力制御部8へ渡す(■)。
渡され(■)、フィルター処理部9では変換テーブル1
0に従って渡された文中の属性制御コードを出力制御部
8への出力指示コードに変換したり、削除したりするこ
とにより、利用者が望むチェックだけを有効とし、且つ
出力されるチェックアウト結果の表示(例えば赤字表示
等)を制御する。この場合、誤用語のチェックのみ有効
であるから、rAKOIJを削除すると共に、rFAJ
を注意出力要レベル01の「01」に変換した文r01
02実積がある。」を出力制御部8へ渡す(■)。
このような構造になっていることにより、各処理部は単
に属性制御情報をコード情報として扱うだけで、その意
味については意識しないため、新しい属性の単語をチェ
ックアウトする必要が生じた場合は、辞書の該当する単
語へ新しく決定した制御コードを登録すると共に変換テ
ーブル作成制御部11を使って変換テーブル10へ登録
するだけでプログラムの変更なしでチェックアウト可能
となる。
に属性制御情報をコード情報として扱うだけで、その意
味については意識しないため、新しい属性の単語をチェ
ックアウトする必要が生じた場合は、辞書の該当する単
語へ新しく決定した制御コードを登録すると共に変換テ
ーブル作成制御部11を使って変換テーブル10へ登録
するだけでプログラムの変更なしでチェックアウト可能
となる。
この結果から明らかなように、従来技術に比べて利用者
の要求の変更に対する文章処理の柔軟性が飛躍的に向上
する。
の要求の変更に対する文章処理の柔軟性が飛躍的に向上
する。
以上説明したように、本発明によれば、装置の各処理部
が、利用者がチェックアウトしたい単語の属性に無関係
に処理を行うため、様々に変化する利用者の要求に改造
なしに柔軟に応えられるという利点がある。又、出力制
御部を制御するコードも変換テーブルで自由に設定でき
るため、言語処理部は、出力装置や出力制御部の変更に
対しても全く影響されることはない。さらに各利用者の
利用目的が異なるときは、それぞれの利用者対応に変換
テーブルを設定すれば、複数の利用者が同時に本装置を
使用できるという利点もある。
が、利用者がチェックアウトしたい単語の属性に無関係
に処理を行うため、様々に変化する利用者の要求に改造
なしに柔軟に応えられるという利点がある。又、出力制
御部を制御するコードも変換テーブルで自由に設定でき
るため、言語処理部は、出力装置や出力制御部の変更に
対しても全く影響されることはない。さらに各利用者の
利用目的が異なるときは、それぞれの利用者対応に変換
テーブルを設定すれば、複数の利用者が同時に本装置を
使用できるという利点もある。
第1図は本発明の一実施例を示す説明図、第2図は従来
の文章用語検定装置の一例を示す説明図、である。 符号の説明 1・・・入力文(チェック種別指定付)、2・・・言語
処理部、3・・・分かち書き等による形態素分割処理、
4.6・・・各種属性チェック指定判定処理、5・・・
辞書引きによるチェックフラグ設定処理、7・・・辞書
(従来)、8・・・出力制御部、(1−1)・・・入力
文、(2−1)・・・属性チェック種別を意識しない言
語処理部、(5−1)・・・単語属性付与処理、(7−
1)・・・属性制御コードを持った辞書、9・・・フィ
ルター処理部、10・・・変換テーブル、11・・・変
換テーブル作成制御部
の文章用語検定装置の一例を示す説明図、である。 符号の説明 1・・・入力文(チェック種別指定付)、2・・・言語
処理部、3・・・分かち書き等による形態素分割処理、
4.6・・・各種属性チェック指定判定処理、5・・・
辞書引きによるチェックフラグ設定処理、7・・・辞書
(従来)、8・・・出力制御部、(1−1)・・・入力
文、(2−1)・・・属性チェック種別を意識しない言
語処理部、(5−1)・・・単語属性付与処理、(7−
1)・・・属性制御コードを持った辞書、9・・・フィ
ルター処理部、10・・・変換テーブル、11・・・変
換テーブル作成制御部
Claims (1)
- 【特許請求の範囲】 1)計算機による自然言語の処理として、文章用語の中
から誤用語の如き特定の用語をチエックアウトすること
により文章用語の検定を行う文章用語検定装置において
、 単語単位に必要な属性制御コードを付与して記憶する辞
書と、入力された文章の用語を単語単位の形態素に分割
し、前記辞書を参照することにより、単語単位で前記辞
書において付与されている属性制御コードを取り出して
きて前記文章用語としての単語に付与して出力する言語
処理部と、単語の属性制御コード毎の有効/無効の対応
付け、或いは他の属性制御コードへの変換を可能にする
対応付けを設定する変換テーブルと、前記変換テーブル
に従って前記言語処理部からの出力結果に関してその属
性制御コードを変更するフィルター処理部と、前記変換
テーブルを端末からの操作等により自由に変更して再設
定する変換テーブル作成制御部と、を具備し、前記フィ
ルター処理部の出力を検定結果として得るようにしたこ
とを特徴とする文章用語検定装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61228268A JPH077413B2 (ja) | 1986-09-29 | 1986-09-29 | 文章用語検定装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61228268A JPH077413B2 (ja) | 1986-09-29 | 1986-09-29 | 文章用語検定装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS6383860A true JPS6383860A (ja) | 1988-04-14 |
JPH077413B2 JPH077413B2 (ja) | 1995-01-30 |
Family
ID=16873808
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP61228268A Expired - Fee Related JPH077413B2 (ja) | 1986-09-29 | 1986-09-29 | 文章用語検定装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH077413B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63103374A (ja) * | 1986-10-21 | 1988-05-09 | Canon Inc | 文書処理装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58123125A (ja) * | 1982-01-14 | 1983-07-22 | Toshiba Corp | 文書作成装置 |
-
1986
- 1986-09-29 JP JP61228268A patent/JPH077413B2/ja not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58123125A (ja) * | 1982-01-14 | 1983-07-22 | Toshiba Corp | 文書作成装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63103374A (ja) * | 1986-10-21 | 1988-05-09 | Canon Inc | 文書処理装置 |
Also Published As
Publication number | Publication date |
---|---|
JPH077413B2 (ja) | 1995-01-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6069211B2 (ja) | テキスト変換及び表現システム | |
JP2016186805A (ja) | 中国語、日本語、および韓国語の言語データを電子的形態で管理するためのモジュラーシステムと方法 | |
Kontogianni et al. | Computer-assisted translation of Egyptian-Coptic into Greek | |
JPS6383860A (ja) | 文章用語検定装置 | |
Bauman | A TEI customization for writing TEI customizations | |
Petrovčič et al. | The New Chinese Corpus of Literary Texts Litchi | |
Sinclair | 4.2 Corpus processing | |
JPS6037510B2 (ja) | ロ−マ字漢字変換方式 | |
JPH03138756A (ja) | 自然言語処理装置 | |
Alshenqeeti | Technical Terms and Processes: A Case for Transliteration | |
JP2924089B2 (ja) | 日本語発音練習機 | |
JP2817497B2 (ja) | 辞書編集装置 | |
JPH0612453A (ja) | 未知語抽出登録装置 | |
JPS63163956A (ja) | 文書作成・校正支援装置 | |
Riabtseva | Machine translation output and translation theory | |
JPH0455975A (ja) | 文書作成装置 | |
JPH06187370A (ja) | 文書読解支援装置 | |
JPS63204466A (ja) | 機械翻訳システム | |
JPH0375898B2 (ja) | ||
JPH04299759A (ja) | 外国語カタカナ表記変換方式 | |
Shinichi et al. | A Design Method for Multi-Language Support Web-Based | |
JPH03160555A (ja) | 日本語入力装置 | |
JPH02278368A (ja) | 機械翻訳入力処理方式 | |
JPH08241315A (ja) | 文書処理装置の単語登録機構 | |
JPH05266065A (ja) | 機械翻訳装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |