JPS62282370A - 品詞のあいまい性除去装置 - Google Patents
品詞のあいまい性除去装置Info
- Publication number
- JPS62282370A JPS62282370A JP61124710A JP12471086A JPS62282370A JP S62282370 A JPS62282370 A JP S62282370A JP 61124710 A JP61124710 A JP 61124710A JP 12471086 A JP12471086 A JP 12471086A JP S62282370 A JPS62282370 A JP S62282370A
- Authority
- JP
- Japan
- Prior art keywords
- speech
- connection
- parts
- connection information
- connection table
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000012217 deletion Methods 0.000 claims description 4
- 230000037430 deletion Effects 0.000 claims description 4
- 238000004458 analytical method Methods 0.000 abstract description 3
- 230000007423 decrease Effects 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 3
- 238000000034 method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 1
- 239000011229 interlayer Substances 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
Landscapes
- Machine Translation (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
3、発明の詳細な説明
〔産業上の利用分野〕
本発明は、電子計算機を用いて自然言語を解析する際に
用いられる品詞のあいまい性除去装置に関する。
用いられる品詞のあいまい性除去装置に関する。
従来、自然言語を解析する際に行われる品詞のあいまい
性の除去においては、予め自然言語の統語に関する知識
が知識表現言語で記述され、この知識表現言語を規則と
して、記憶しておき、この規則を参照してあいまい性の
除去を行っている。
性の除去においては、予め自然言語の統語に関する知識
が知識表現言語で記述され、この知識表現言語を規則と
して、記憶しておき、この規則を参照してあいまい性の
除去を行っている。
ところで、従来の品詞のあいまい性除去装置の場合、適
用すべき規則を検索する際、知識表現言語で記述された
条件を解析し、実際の条件に合致するかどうかを調べな
ければならず、あいまい性の除去処理に時間がかかって
しまう上、上述の規則を記憶するためめ領域が大きくな
ってしまうという問題点がある。
用すべき規則を検索する際、知識表現言語で記述された
条件を解析し、実際の条件に合致するかどうかを調べな
ければならず、あいまい性の除去処理に時間がかかって
しまう上、上述の規則を記憶するためめ領域が大きくな
ってしまうという問題点がある。
本発明の目的は処理時間の短縮ができ、しかも統語に関
する知識を記憶するための領域の縮小ができる品詞のあ
いまい性除去装置を提供することにある。
する知識を記憶するための領域の縮小ができる品詞のあ
いまい性除去装置を提供することにある。
本発明による品詞のあいまい性除去装置は品詞間の接続
状況が数値で表わされた接続情報を入力する入力手段と
、該接続情報を各品詞に対応した接続表として記憶する
記憶手段と、複数の品詞を持つ単語を含む文を解析する
際、上記の接続表を検索する検索手段と、検索して得ら
れた接続情報から文中の単語の持つ品詞のおのおのにつ
いて出現しやすさの度合を算出する算出手段と、単語の
持つ品詞の集合から出現し得ない品詞を削除する削除手
段とを有することを特徴としている。
状況が数値で表わされた接続情報を入力する入力手段と
、該接続情報を各品詞に対応した接続表として記憶する
記憶手段と、複数の品詞を持つ単語を含む文を解析する
際、上記の接続表を検索する検索手段と、検索して得ら
れた接続情報から文中の単語の持つ品詞のおのおのにつ
いて出現しやすさの度合を算出する算出手段と、単語の
持つ品詞の集合から出現し得ない品詞を削除する削除手
段とを有することを特徴としている。
以下本発明について実施例について説明する。
第1図を参照して2本発明による品詞のあいまい性除去
装置は2品詞間の接続情報入力子設置1゜接続表記憶手
段12.接続表検索手段139品詞出現度算出手段14
.及び出現し得ない誤品詞削除手段15を備えている。
装置は2品詞間の接続情報入力子設置1゜接続表記憶手
段12.接続表検索手段139品詞出現度算出手段14
.及び出現し得ない誤品詞削除手段15を備えている。
品詞と品詞とが接続する頻度(品詞同士の接続頻度)が
実際のデータ(文章等)から抽出され。
実際のデータ(文章等)から抽出され。
この抽出データから算出した数値(接続情報)が接続情
報入力手段11から取シ込まれる(入力される)。なお
2品詞は接続の特徴に基づいて定めておくことが望まし
い。
報入力手段11から取シ込まれる(入力される)。なお
2品詞は接続の特徴に基づいて定めておくことが望まし
い。
上述の接続情報は接続表記憶手段12に格納・記憶され
る。接続表記憶手段12は第3図に示すように行(横方
向)に後続品詞として品詞011品詞1品詞22品詞3
.・・・が記載され2列(縦方向)に先行品詞として品
詞011品詞1品詞2゜品詞3.・・・が記載された表
(接続表)を備えている。そして、この接続表に各品詞
ごとにそれぞれ先行品詞、後続品詞に対応して接続情報
が格納される。なお、第3図では、“1″が接続可能性
が最も高く、以下2.3,4.・・・の順で接続可能性
が低くなって行き、′の”(無限大)は接続可能性がま
ったくないことを表す。
る。接続表記憶手段12は第3図に示すように行(横方
向)に後続品詞として品詞011品詞1品詞22品詞3
.・・・が記載され2列(縦方向)に先行品詞として品
詞011品詞1品詞2゜品詞3.・・・が記載された表
(接続表)を備えている。そして、この接続表に各品詞
ごとにそれぞれ先行品詞、後続品詞に対応して接続情報
が格納される。なお、第3図では、“1″が接続可能性
が最も高く、以下2.3,4.・・・の順で接続可能性
が低くなって行き、′の”(無限大)は接続可能性がま
ったくないことを表す。
接続表検索手段13は入力される解析対象文に含−止れ
る単語が持つ品詞によって接続表中の行位置9列位置を
決定し、この行及び列位置に対応する品詞の先行品詞及
び後続品詞に対する接続情報を検索する。
る単語が持つ品詞によって接続表中の行位置9列位置を
決定し、この行及び列位置に対応する品詞の先行品詞及
び後続品詞に対する接続情報を検索する。
品詞出現度算出手段14は接続表検索手段13による検
索の結果得られた接続情報を用いて各品詞が周囲(先行
、及び後続)の単語の持つ品詞と接続する可能性の度合
を算出する。
索の結果得られた接続情報を用いて各品詞が周囲(先行
、及び後続)の単語の持つ品詞と接続する可能性の度合
を算出する。
誤品詞削除手段15は品詞出現度算出手段14による計
算の結果2周囲の品詞と接続し得ないと判断できる品詞
を削除する。
算の結果2周囲の品詞と接続し得ないと判断できる品詞
を削除する。
例えば、第2図に示すように”He reads bo
oks’を解析する際、単語″reads’と”boo
ks”がそれぞれ2つずつの品詞(1,2)を持ち、従
って、統語的にあいまい性がある。このようなあいまい
性を除去し、各単語の品詞を一意に決定するために。
oks’を解析する際、単語″reads’と”boo
ks”がそれぞれ2つずつの品詞(1,2)を持ち、従
って、統語的にあいまい性がある。このようなあいまい
性を除去し、各単語の品詞を一意に決定するために。
第3図に示す接続表が用いられる。
第3図に示す接続表の場合、前述したように。
行が先行する単語の品詞1列が後続する単語の品詞に対
応しておシ、各枠内の数字は品詞lの次に品詞jがくる
可能性の度合を示している。この可能性は数字が小さい
程高い。まだ、可能性が全くないものは記号”co’で
表されている。
応しておシ、各枠内の数字は品詞lの次に品詞jがくる
可能性の度合を示している。この可能性は数字が小さい
程高い。まだ、可能性が全くないものは記号”co’で
表されている。
接続表検索手段13による検索は予め定められた品詞の
通し番号を用いて9行位置9列位置を決定して行われる
。接続表検索手段13による接続表の検索の結果9品詞
0(”He”に対応)の次に品詞1(“reads”に
対応)が来る可能性のスコアが”1″2品詞0 (”H
e”に対応)−品詞2 (” r e a ds”K対
応)のスコアが゛(1)″であるので、 ”reads
”の品詞が2番である可能性はないという情報が得られ
る。同様にして2品詞1(“reads″′に対応する
)−品詞1 (”books”に対応)の接続スコアは
“′■″でおるので、”books”の品詞は2番であ
ると判断される。
通し番号を用いて9行位置9列位置を決定して行われる
。接続表検索手段13による接続表の検索の結果9品詞
0(”He”に対応)の次に品詞1(“reads”に
対応)が来る可能性のスコアが”1″2品詞0 (”H
e”に対応)−品詞2 (” r e a ds”K対
応)のスコアが゛(1)″であるので、 ”reads
”の品詞が2番である可能性はないという情報が得られ
る。同様にして2品詞1(“reads″′に対応する
)−品詞1 (”books”に対応)の接続スコアは
“′■″でおるので、”books”の品詞は2番であ
ると判断される。
このように2本装置では品詞間の接続状況が数値で表わ
されているので、記憶領域が小さくて済む上、参照すべ
き情報が格納されている番地は品詞の通し番号で機械的
に決定できるので、高速な処理を実現することが可能で
ある。
されているので、記憶領域が小さくて済む上、参照すべ
き情報が格納されている番地は品詞の通し番号で機械的
に決定できるので、高速な処理を実現することが可能で
ある。
以上説明したように1本発明では自然言語の統語に関す
る知識を数値の表という形で扱っているから、解析処理
時間が短縮でき、しかも知識を記憶するための記憶領域
が縮小できるという効果がある。
る知識を数値の表という形で扱っているから、解析処理
時間が短縮でき、しかも知識を記憶するための記憶領域
が縮小できるという効果がある。
第1図は本発明の一実施例を示す図、第2図は品詞のあ
いまいな単語を含む文の一例を示す図。 第3図は接続表の一例を示す図である。 11・・・接続情報入力手段、12・・・接続謄記憶手
段、13・・・接続表検索手段、14・・・品詞出現度
算出手段、15・・・誤品詞削除手没。 第1図
いまいな単語を含む文の一例を示す図。 第3図は接続表の一例を示す図である。 11・・・接続情報入力手段、12・・・接続謄記憶手
段、13・・・接続表検索手段、14・・・品詞出現度
算出手段、15・・・誤品詞削除手没。 第1図
Claims (1)
- 1、品詞間の接続状況が数値で表わされた接続情報を入
力する入力手段と、該接続情報を各品詞に対応した接続
表として記憶する記憶手段と、複数の品詞を持つ単語を
含む文を解析する際、前記接続表を検索する検索手段と
、該検索して得られた接続情報から文中の単語の持つ品
詞のおのおのについて出現しやすさの度合を算出する算
出手段と、該単語の持つ品詞の集合から出現し得ない品
詞を削除する削除手段とを有することを特徴とする品詞
のあいまい性除去装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61124710A JPS62282370A (ja) | 1986-05-31 | 1986-05-31 | 品詞のあいまい性除去装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61124710A JPS62282370A (ja) | 1986-05-31 | 1986-05-31 | 品詞のあいまい性除去装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS62282370A true JPS62282370A (ja) | 1987-12-08 |
Family
ID=14892186
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP61124710A Pending JPS62282370A (ja) | 1986-05-31 | 1986-05-31 | 品詞のあいまい性除去装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS62282370A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6391776A (ja) * | 1986-09-30 | 1988-04-22 | インタ−ナショナル・ビジネス・マシ−ンズ・コ−ポレ−ション | 自然言語解析装置 |
-
1986
- 1986-05-31 JP JP61124710A patent/JPS62282370A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6391776A (ja) * | 1986-09-30 | 1988-04-22 | インタ−ナショナル・ビジネス・マシ−ンズ・コ−ポレ−ション | 自然言語解析装置 |
JPH0444304B2 (ja) * | 1986-09-30 | 1992-07-21 | Intaanashonaru Bijinesu Mashiinzu Corp |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3820242B2 (ja) | 質問応答型文書検索システム及び質問応答型文書検索プログラム | |
Al‐Sughaiyer et al. | Arabic morphological analysis techniques: A comprehensive survey | |
JPH11110416A (ja) | データベースからドキュメントを検索するための方法および装置 | |
JPH01314373A (ja) | 機械翻訳システムにおける訳語選択方式 | |
JPH04271443A (ja) | データベース構築方法及び装置 | |
KR20110102358A (ko) | 오역의 검출을 지원하는 장치 및 방법 | |
JP3123836B2 (ja) | テキスト型データベース装置 | |
Fatima et al. | STEMUR: An automated word conflation algorithm for the Urdu language | |
JPS62282370A (ja) | 品詞のあいまい性除去装置 | |
JP2007172179A (ja) | 意見抽出装置、意見抽出方法、および意見抽出プログラム | |
KR100511409B1 (ko) | 기계번역을 위한 번역단위 추출/검색장치 및 방법 | |
JPS59140582A (ja) | 自然言語翻訳援助方式 | |
JP3483585B2 (ja) | 文書検索装置及び文書検索方法 | |
JP3783053B2 (ja) | 負の例予測処理方法、処理プログラムおよび処理装置、負の例予測処理を用いた日本語表記誤り検出処理プログラムおよび処理装置、ならびに負の例予測処理を用いた外の関係検出処理プログラムおよび処理装置 | |
JP2812511B2 (ja) | キーワード抽出装置 | |
JP2840258B2 (ja) | 機械翻訳システムの対訳辞書及び共起関係辞書の作成方法 | |
JPH0251772A (ja) | 品詞のあいまい性除去装置 | |
JP3191087B2 (ja) | 意味解析方法 | |
JP4088176B2 (ja) | 質問応答装置及び質問応答プログラム | |
JPH0612451A (ja) | 例文検索システム | |
JP4040233B2 (ja) | 重要文抽出装置および記憶媒体 | |
JPH0490052A (ja) | 文書内容検索装置 | |
JPS6368972A (ja) | 未登録語処理方式 | |
JPS6389976A (ja) | 言語解析装置 | |
WO2023204724A1 (ru) | Способ анализа юридического документа |