JPS6383860A - 文章用語検定装置 - Google Patents

文章用語検定装置

Info

Publication number
JPS6383860A
JPS6383860A JP61228268A JP22826886A JPS6383860A JP S6383860 A JPS6383860 A JP S6383860A JP 61228268 A JP61228268 A JP 61228268A JP 22826886 A JP22826886 A JP 22826886A JP S6383860 A JPS6383860 A JP S6383860A
Authority
JP
Japan
Prior art keywords
word
attribute
conversion table
dictionary
terms
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP61228268A
Other languages
English (en)
Other versions
JPH077413B2 (ja
Inventor
Tsuneo Yasuda
安田 恒雄
Koji Hara
康二 原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Nippon Telegraph and Telephone Corp
Original Assignee
Hitachi Ltd
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd, Nippon Telegraph and Telephone Corp filed Critical Hitachi Ltd
Priority to JP61228268A priority Critical patent/JPH077413B2/ja
Publication of JPS6383860A publication Critical patent/JPS6383860A/ja
Publication of JPH077413B2 publication Critical patent/JPH077413B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、大量の自然言語の文章を処理して、その中か
ら専門用語や誤用語(使い方を誤った用語、例えば誤字
)等の特定の種類の単語を抽出することにより検定を行
う文章用語検定装置に関するものである。
〔従来の技術〕
計算機による自然言語のデータベース化の発達に伴い、
−見計算機へ蓄積した大量の自然言語の文章を計算機で
処理しである種類の用語をチェックアウトすることが様
々な目的で要求されている。
例えば、それら大量の文書について索引を作る目的で特
定の専門用語を抽出したいという場合もあるし、或いは
誤字(「実績」と書くべき所を「実績」と書いてしまう
など、間違い易い用語は色々とある)をチェックのため
抽出したいという場合もある。
このような要求のため、自然言語の文章中にある特定の
用語を計算機で処理してチェックアウトするには、大規
模な単語辞書を持ち、必要な単語には単語毎に重要語、
特殊専門用語、誤用語等のチェックアウトしたい属性情
報を付与しておき(例えば「実績」を「実績」の誤用語
として記憶し、誤用語表示を付しておくなど)、文章を
分かち書き等の処理で単語単位の形態素に分解した後、
単語単位のマツチングによって抽出する方法が一般的で
ある。
第2図は従来のかかる文章用語検定装置の一例を示す説
明図である。
同図において、1は入力文、2は言語処理部、3は分か
ち書き等による形態素分割処理、4,6はそれぞれ各種
属性チェック指定判定処理、5は辞書引きによるチェッ
クフラグ設定処理、7は辞書、8は出力制御部、である
第2図を参照する。先ずチェック種別(ここでは誤用語
の検出)を指定された入力文1が言語処理部2に渡され
ると(■)、言語処理部2では、処理3において辞書情
報を用いて(■)分かち書き等により単語単位に分割し
た後、処理4において指定されたチェックの種別を調べ
て、処理5に進み、そのチェック種別毎に辞書の単語の
チェックアウト属性(誤用語、専門語等)を調べて(■
)、該当する単語には認定フラグを付与する。
言語処理部2の出力結果は出力制御部8に渡され(■)
、出力制御部8では例えばチェックアウトした単語を赤
字としてディスプレイに表示する等の制御を行う。
上記の例では、入力文「実績がある。」の中に「実績」
を[実績]と書いた誤用語が含まれており、辞書7にも
、予めその意味で誤用語表示を施した「実績」が記憶さ
れているので、処理5においては、入力文における「実
績」を誤用語と判定して誤用語の認定フラグ誉を付し、
更に単語長「02」も付して出力制御部8に渡すことが
できる。
出力制御部8では、「実績がある。」という全文を例え
ばディスプレイ表示し、そのうち「実績」の2文字を誤
用語として特に赤色などで表示してチェックアウトする
ところで、同一の文章を処理する場合でも利用者によっ
て抽出したい単語の属性種別が違ったり、目的に応じて
抽出したい単語が異なることが多(、言語処理部設計時
、予想される全ての抽出種別を考慮すると設計が複雑と
なり、設計時に予想できなかったものについては、言語
処理部の改造が必要になるという問題があった。
〔発明が解決しようとする問題点〕
そこで本発明では、文章中の種々の属性を持つ単語をチ
ェックアウトする文章用語検定装置において、利用者が
チェックアウトしたい属性に応じて言語処理部を改造す
ることなく、柔軟にチェックアウトを可能ならしめるこ
と、を解決すべき問題点としている。
〔問題点を解決するための手段〕
本発明は、単語単位に必要な属性制御コードを付与して
記憶する辞書を持ち、言語処理部では単語単位に付与さ
れた属性制御コードの意味を何も考慮することなく、た
だ機械的に分割した単語に辞書からもってきた属性制御
コードを付与し、言語処理部の出力結果に対し、変換テ
ーブルを用いて利用者が必要とする属性制御コードのみ
有効として付与するフィルター制御部と、さらに利用者
がその変換テーブルを端末等から自由に変更できる変換
テーブル作成制御部を持つことによってチェックアウト
する属性を自由に制御可能にした。
〔作用〕
その結果、新たな属性に対するチェックアウト要求に対
して言語処理部等のプログラムの変更が不要になり、変
換テーブルの変更が端末等からダイナミックに指定でき
るため、利用者の要求に応じて柔軟にチェックアウトが
指定できる。
〔実施例〕
次に図を参照して本発明の詳細な説明する。
第1図は本発明の一実施例を示す説明図である。
同図において、(1−1)は入力文、(2−1)は言語
処理部で、3は分かち書き等により単語単位の形態素に
分割する処理、(5−1)は辞書引きにより単語の属性
制御コードを該当単語に付与する処理、(7−1)は単
語の見出し対応に品詞や属性制御コード等を持つ辞書、
9は変換テーブル10により、単語毎の属性を変換する
フィルター処理部、10は属性制御コード毎に有効/無
効や変換したい制御コードを定義した変換テーブル、1
1は端末から変換テーブルの定義を自由に変更できる変
換テーブル作成制御部、8はフィルター処理部からの出
力結果を出力装置に応じてチェックアウトした単語を注
意語として出力する等の制御を行う出力制御部である。
次に動作を説明する。
まず利用者は変換テーブル作成制御部11に対し、端末
からチェックアウトしたい単語属性制御コードを指定し
て(■)、出力制御部8に注意出力の要/否やそのレベ
ル(例えば絶対駄目という意味での赤字出力はレベル0
1、要注意程度の意味を表す黄色出力はレベル02等)
を指示するコードを定義する変換テーブルを作成する。
第1図の例では、誤用語についてのみレベル01の表示
を行い、その他の属性については何も指定をしない(無
効とする)ようにしている(■)。
入力文「実績がある。J  (1−1)が言語処理部(
2−1)に入力されると(■)、辞書引きをしながら(
■)、分かち書き等による形態素分割により、「実績/
が/ある/。」と分割され、さらに分割された単語毎に
辞書(7−1)から属性制御コードを持って来て(■)
、その単語の単語長と共に単語に付与し、rFAO2実
積AKOIがある。」の出力文を出力する。
ここでFA、AKはそれぞれ誤用語、格助詞を示す属性
制御コードであり、「ある」には辞書上属性制御コード
が付与されていないため何も付与しない(もし文章中の
動詞をすべてチェックアウトしたい場合等は、動詞を示
す適当な属性制御コードを定義して辞書中の動詞の全単
語に付与しておけば良い)。
言語処理部(2−1)の出力文はフィルター処理部9に
渡され(■)、フィルター処理部9では変換テーブル1
0に従って渡された文中の属性制御コードを出力制御部
8への出力指示コードに変換したり、削除したりするこ
とにより、利用者が望むチェックだけを有効とし、且つ
出力されるチェックアウト結果の表示(例えば赤字表示
等)を制御する。この場合、誤用語のチェックのみ有効
であるから、rAKOIJを削除すると共に、rFAJ
を注意出力要レベル01の「01」に変換した文r01
02実積がある。」を出力制御部8へ渡す(■)。
このような構造になっていることにより、各処理部は単
に属性制御情報をコード情報として扱うだけで、その意
味については意識しないため、新しい属性の単語をチェ
ックアウトする必要が生じた場合は、辞書の該当する単
語へ新しく決定した制御コードを登録すると共に変換テ
ーブル作成制御部11を使って変換テーブル10へ登録
するだけでプログラムの変更なしでチェックアウト可能
となる。
この結果から明らかなように、従来技術に比べて利用者
の要求の変更に対する文章処理の柔軟性が飛躍的に向上
する。
〔発明の効果〕
以上説明したように、本発明によれば、装置の各処理部
が、利用者がチェックアウトしたい単語の属性に無関係
に処理を行うため、様々に変化する利用者の要求に改造
なしに柔軟に応えられるという利点がある。又、出力制
御部を制御するコードも変換テーブルで自由に設定でき
るため、言語処理部は、出力装置や出力制御部の変更に
対しても全く影響されることはない。さらに各利用者の
利用目的が異なるときは、それぞれの利用者対応に変換
テーブルを設定すれば、複数の利用者が同時に本装置を
使用できるという利点もある。
【図面の簡単な説明】
第1図は本発明の一実施例を示す説明図、第2図は従来
の文章用語検定装置の一例を示す説明図、である。 符号の説明 1・・・入力文(チェック種別指定付)、2・・・言語
処理部、3・・・分かち書き等による形態素分割処理、
4.6・・・各種属性チェック指定判定処理、5・・・
辞書引きによるチェックフラグ設定処理、7・・・辞書
(従来)、8・・・出力制御部、(1−1)・・・入力
文、(2−1)・・・属性チェック種別を意識しない言
語処理部、(5−1)・・・単語属性付与処理、(7−
1)・・・属性制御コードを持った辞書、9・・・フィ
ルター処理部、10・・・変換テーブル、11・・・変
換テーブル作成制御部

Claims (1)

  1. 【特許請求の範囲】 1)計算機による自然言語の処理として、文章用語の中
    から誤用語の如き特定の用語をチエックアウトすること
    により文章用語の検定を行う文章用語検定装置において
    、 単語単位に必要な属性制御コードを付与して記憶する辞
    書と、入力された文章の用語を単語単位の形態素に分割
    し、前記辞書を参照することにより、単語単位で前記辞
    書において付与されている属性制御コードを取り出して
    きて前記文章用語としての単語に付与して出力する言語
    処理部と、単語の属性制御コード毎の有効/無効の対応
    付け、或いは他の属性制御コードへの変換を可能にする
    対応付けを設定する変換テーブルと、前記変換テーブル
    に従って前記言語処理部からの出力結果に関してその属
    性制御コードを変更するフィルター処理部と、前記変換
    テーブルを端末からの操作等により自由に変更して再設
    定する変換テーブル作成制御部と、を具備し、前記フィ
    ルター処理部の出力を検定結果として得るようにしたこ
    とを特徴とする文章用語検定装置。
JP61228268A 1986-09-29 1986-09-29 文章用語検定装置 Expired - Fee Related JPH077413B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61228268A JPH077413B2 (ja) 1986-09-29 1986-09-29 文章用語検定装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61228268A JPH077413B2 (ja) 1986-09-29 1986-09-29 文章用語検定装置

Publications (2)

Publication Number Publication Date
JPS6383860A true JPS6383860A (ja) 1988-04-14
JPH077413B2 JPH077413B2 (ja) 1995-01-30

Family

ID=16873808

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61228268A Expired - Fee Related JPH077413B2 (ja) 1986-09-29 1986-09-29 文章用語検定装置

Country Status (1)

Country Link
JP (1) JPH077413B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63103374A (ja) * 1986-10-21 1988-05-09 Canon Inc 文書処理装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58123125A (ja) * 1982-01-14 1983-07-22 Toshiba Corp 文書作成装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58123125A (ja) * 1982-01-14 1983-07-22 Toshiba Corp 文書作成装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63103374A (ja) * 1986-10-21 1988-05-09 Canon Inc 文書処理装置

Also Published As

Publication number Publication date
JPH077413B2 (ja) 1995-01-30

Similar Documents

Publication Publication Date Title
JP6069211B2 (ja) テキスト変換及び表現システム
JP2016186805A5 (ja)
JP2016186805A (ja) 中国語、日本語、および韓国語の言語データを電子的形態で管理するためのモジュラーシステムと方法
JP2002117027A (ja) 感情情報抽出方法および感情情報抽出プログラムの記録媒体
JPS6383860A (ja) 文章用語検定装置
Kontogianni et al. Computer-assisted translation of Egyptian-Coptic into Greek
Bauman A TEI customization for writing TEI customizations
Petrovčič et al. The New Chinese Corpus of Literary Texts Litchi
Paramonov et al. Phonetic string matching for languages with cyrillic alphabet
Sinclair 4.2 Corpus processing
JPS6037510B2 (ja) ロ−マ字漢字変換方式
JPH03138756A (ja) 自然言語処理装置
JP2924089B2 (ja) 日本語発音練習機
JP2817497B2 (ja) 辞書編集装置
JPH0612453A (ja) 未知語抽出登録装置
JPS63163956A (ja) 文書作成・校正支援装置
JPH0455975A (ja) 文書作成装置
JPH04299759A (ja) 外国語カタカナ表記変換方式
Shinichi et al. A Design Method for Multi-Language Support Web-Based
JPH03160555A (ja) 日本語入力装置
JPH02278368A (ja) 機械翻訳入力処理方式
JPH08241315A (ja) 文書処理装置の単語登録機構
JPH05266065A (ja) 機械翻訳装置
JPH03296856A (ja) 文書処理装置
JPH03246665A (ja) ワードプロセッサのデータ入力システム

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees