JPS62282370A - 品詞のあいまい性除去装置 - Google Patents

品詞のあいまい性除去装置

Info

Publication number
JPS62282370A
JPS62282370A JP61124710A JP12471086A JPS62282370A JP S62282370 A JPS62282370 A JP S62282370A JP 61124710 A JP61124710 A JP 61124710A JP 12471086 A JP12471086 A JP 12471086A JP S62282370 A JPS62282370 A JP S62282370A
Authority
JP
Japan
Prior art keywords
speech
connection
parts
connection information
connection table
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61124710A
Other languages
English (en)
Inventor
Tomoko Kawaguchi
知子 川口
Shingo Takeda
武田 真吾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP61124710A priority Critical patent/JPS62282370A/ja
Publication of JPS62282370A publication Critical patent/JPS62282370A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 3、発明の詳細な説明 〔産業上の利用分野〕 本発明は、電子計算機を用いて自然言語を解析する際に
用いられる品詞のあいまい性除去装置に関する。
〔従来の技術〕
従来、自然言語を解析する際に行われる品詞のあいまい
性の除去においては、予め自然言語の統語に関する知識
が知識表現言語で記述され、この知識表現言語を規則と
して、記憶しておき、この規則を参照してあいまい性の
除去を行っている。
〔発明が解決しようとする問題点〕
ところで、従来の品詞のあいまい性除去装置の場合、適
用すべき規則を検索する際、知識表現言語で記述された
条件を解析し、実際の条件に合致するかどうかを調べな
ければならず、あいまい性の除去処理に時間がかかって
しまう上、上述の規則を記憶するためめ領域が大きくな
ってしまうという問題点がある。
本発明の目的は処理時間の短縮ができ、しかも統語に関
する知識を記憶するための領域の縮小ができる品詞のあ
いまい性除去装置を提供することにある。
〔間層点を解決するための手段〕
本発明による品詞のあいまい性除去装置は品詞間の接続
状況が数値で表わされた接続情報を入力する入力手段と
、該接続情報を各品詞に対応した接続表として記憶する
記憶手段と、複数の品詞を持つ単語を含む文を解析する
際、上記の接続表を検索する検索手段と、検索して得ら
れた接続情報から文中の単語の持つ品詞のおのおのにつ
いて出現しやすさの度合を算出する算出手段と、単語の
持つ品詞の集合から出現し得ない品詞を削除する削除手
段とを有することを特徴としている。
〔実施例〕
以下本発明について実施例について説明する。
第1図を参照して2本発明による品詞のあいまい性除去
装置は2品詞間の接続情報入力子設置1゜接続表記憶手
段12.接続表検索手段139品詞出現度算出手段14
.及び出現し得ない誤品詞削除手段15を備えている。
品詞と品詞とが接続する頻度(品詞同士の接続頻度)が
実際のデータ(文章等)から抽出され。
この抽出データから算出した数値(接続情報)が接続情
報入力手段11から取シ込まれる(入力される)。なお
2品詞は接続の特徴に基づいて定めておくことが望まし
い。
上述の接続情報は接続表記憶手段12に格納・記憶され
る。接続表記憶手段12は第3図に示すように行(横方
向)に後続品詞として品詞011品詞1品詞22品詞3
.・・・が記載され2列(縦方向)に先行品詞として品
詞011品詞1品詞2゜品詞3.・・・が記載された表
(接続表)を備えている。そして、この接続表に各品詞
ごとにそれぞれ先行品詞、後続品詞に対応して接続情報
が格納される。なお、第3図では、“1″が接続可能性
が最も高く、以下2.3,4.・・・の順で接続可能性
が低くなって行き、′の”(無限大)は接続可能性がま
ったくないことを表す。
接続表検索手段13は入力される解析対象文に含−止れ
る単語が持つ品詞によって接続表中の行位置9列位置を
決定し、この行及び列位置に対応する品詞の先行品詞及
び後続品詞に対する接続情報を検索する。
品詞出現度算出手段14は接続表検索手段13による検
索の結果得られた接続情報を用いて各品詞が周囲(先行
、及び後続)の単語の持つ品詞と接続する可能性の度合
を算出する。
誤品詞削除手段15は品詞出現度算出手段14による計
算の結果2周囲の品詞と接続し得ないと判断できる品詞
を削除する。
例えば、第2図に示すように”He reads bo
oks’を解析する際、単語″reads’と”boo
ks”がそれぞれ2つずつの品詞(1,2)を持ち、従
って、統語的にあいまい性がある。このようなあいまい
性を除去し、各単語の品詞を一意に決定するために。
第3図に示す接続表が用いられる。
第3図に示す接続表の場合、前述したように。
行が先行する単語の品詞1列が後続する単語の品詞に対
応しておシ、各枠内の数字は品詞lの次に品詞jがくる
可能性の度合を示している。この可能性は数字が小さい
程高い。まだ、可能性が全くないものは記号”co’で
表されている。
接続表検索手段13による検索は予め定められた品詞の
通し番号を用いて9行位置9列位置を決定して行われる
。接続表検索手段13による接続表の検索の結果9品詞
0(”He”に対応)の次に品詞1(“reads”に
対応)が来る可能性のスコアが”1″2品詞0 (”H
e”に対応)−品詞2 (” r e a ds”K対
応)のスコアが゛(1)″であるので、 ”reads
”の品詞が2番である可能性はないという情報が得られ
る。同様にして2品詞1(“reads″′に対応する
)−品詞1 (”books”に対応)の接続スコアは
“′■″でおるので、”books”の品詞は2番であ
ると判断される。
このように2本装置では品詞間の接続状況が数値で表わ
されているので、記憶領域が小さくて済む上、参照すべ
き情報が格納されている番地は品詞の通し番号で機械的
に決定できるので、高速な処理を実現することが可能で
ある。
〔発明の効果〕
以上説明したように1本発明では自然言語の統語に関す
る知識を数値の表という形で扱っているから、解析処理
時間が短縮でき、しかも知識を記憶するための記憶領域
が縮小できるという効果がある。
【図面の簡単な説明】
第1図は本発明の一実施例を示す図、第2図は品詞のあ
いまいな単語を含む文の一例を示す図。 第3図は接続表の一例を示す図である。 11・・・接続情報入力手段、12・・・接続謄記憶手
段、13・・・接続表検索手段、14・・・品詞出現度
算出手段、15・・・誤品詞削除手没。 第1図

Claims (1)

    【特許請求の範囲】
  1. 1、品詞間の接続状況が数値で表わされた接続情報を入
    力する入力手段と、該接続情報を各品詞に対応した接続
    表として記憶する記憶手段と、複数の品詞を持つ単語を
    含む文を解析する際、前記接続表を検索する検索手段と
    、該検索して得られた接続情報から文中の単語の持つ品
    詞のおのおのについて出現しやすさの度合を算出する算
    出手段と、該単語の持つ品詞の集合から出現し得ない品
    詞を削除する削除手段とを有することを特徴とする品詞
    のあいまい性除去装置。
JP61124710A 1986-05-31 1986-05-31 品詞のあいまい性除去装置 Pending JPS62282370A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61124710A JPS62282370A (ja) 1986-05-31 1986-05-31 品詞のあいまい性除去装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61124710A JPS62282370A (ja) 1986-05-31 1986-05-31 品詞のあいまい性除去装置

Publications (1)

Publication Number Publication Date
JPS62282370A true JPS62282370A (ja) 1987-12-08

Family

ID=14892186

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61124710A Pending JPS62282370A (ja) 1986-05-31 1986-05-31 品詞のあいまい性除去装置

Country Status (1)

Country Link
JP (1) JPS62282370A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6391776A (ja) * 1986-09-30 1988-04-22 インタ−ナショナル・ビジネス・マシ−ンズ・コ−ポレ−ション 自然言語解析装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6391776A (ja) * 1986-09-30 1988-04-22 インタ−ナショナル・ビジネス・マシ−ンズ・コ−ポレ−ション 自然言語解析装置
JPH0444304B2 (ja) * 1986-09-30 1992-07-21 Intaanashonaru Bijinesu Mashiinzu Corp

Similar Documents

Publication Publication Date Title
JP3820242B2 (ja) 質問応答型文書検索システム及び質問応答型文書検索プログラム
Al‐Sughaiyer et al. Arabic morphological analysis techniques: A comprehensive survey
JPH11110416A (ja) データベースからドキュメントを検索するための方法および装置
JPH01314373A (ja) 機械翻訳システムにおける訳語選択方式
JPH04271443A (ja) データベース構築方法及び装置
KR20110102358A (ko) 오역의 검출을 지원하는 장치 및 방법
JP3123836B2 (ja) テキスト型データベース装置
Fatima et al. STEMUR: An automated word conflation algorithm for the Urdu language
JPS62282370A (ja) 品詞のあいまい性除去装置
JP2007172179A (ja) 意見抽出装置、意見抽出方法、および意見抽出プログラム
KR100511409B1 (ko) 기계번역을 위한 번역단위 추출/검색장치 및 방법
JPS59140582A (ja) 自然言語翻訳援助方式
JP3483585B2 (ja) 文書検索装置及び文書検索方法
JP3783053B2 (ja) 負の例予測処理方法、処理プログラムおよび処理装置、負の例予測処理を用いた日本語表記誤り検出処理プログラムおよび処理装置、ならびに負の例予測処理を用いた外の関係検出処理プログラムおよび処理装置
JP2812511B2 (ja) キーワード抽出装置
JP2840258B2 (ja) 機械翻訳システムの対訳辞書及び共起関係辞書の作成方法
JPH0251772A (ja) 品詞のあいまい性除去装置
JP3191087B2 (ja) 意味解析方法
JP4088176B2 (ja) 質問応答装置及び質問応答プログラム
JPH0612451A (ja) 例文検索システム
JP4040233B2 (ja) 重要文抽出装置および記憶媒体
JPH0490052A (ja) 文書内容検索装置
JPS6368972A (ja) 未登録語処理方式
JPS6389976A (ja) 言語解析装置
WO2023204724A1 (ru) Способ анализа юридического документа