JP2774495B2 - 自然言語処理装置 - Google Patents

自然言語処理装置

Info

Publication number
JP2774495B2
JP2774495B2 JP62044930A JP4493087A JP2774495B2 JP 2774495 B2 JP2774495 B2 JP 2774495B2 JP 62044930 A JP62044930 A JP 62044930A JP 4493087 A JP4493087 A JP 4493087A JP 2774495 B2 JP2774495 B2 JP 2774495B2
Authority
JP
Japan
Prior art keywords
sentence
analysis
natural language
analysis information
characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP62044930A
Other languages
English (en)
Other versions
JPS63211463A (ja
Inventor
稔 藤田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP62044930A priority Critical patent/JP2774495B2/ja
Publication of JPS63211463A publication Critical patent/JPS63211463A/ja
Application granted granted Critical
Publication of JP2774495B2 publication Critical patent/JP2774495B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は自然言語、例えば日本語,英語に関連する情
報の処理を行う自然言語処理装置に関する。 〔従来技術〕 一般に自然言語処理装置では入力される文を特定の自
然言語と仮定し、その自然言語の文法規則や辞書を使っ
て処理するのが通常である。しかしながら入力として特
定の1つの自然言語を仮定しているものであるから、複
数の自然言語が混在して入力されると処理ができなくな
るという欠点があった。 〔発明が解決しようとしている問題点〕 この発明の目的は複数種の自然言語が混在して入力さ
れる場合に入力される自然言語に合わせた文法規則や辞
書を選択して、自然言語を処理することができる自然言
語処理装置を提供することである。 〔問題点を解決するための手段〕 上記目的を達成するために、本発明の自然言語処理装
置は、解析対象の自然言語文を入力する入力手段と、複
数種類の自然言語のそれぞれに対応して、当該種類の自
然言語の文の解析に利用する解析用情報を記憶する解析
用情報記憶手段と、前記複数種類の自然言語のうちの特
定種類の自然言語で使用される特徴語句を、該特定種類
と対応づけて記憶する特徴語句記憶手段と、該特徴語句
記憶手段を参照して、前記入力手段より入力される自然
言語文の各文より前記特徴語句を検出する検出手段と、
該検出手段により前記特徴語句が検出された文について
は、前記特徴語句記憶手段において当該検出された特徴
語句と対応づけて記憶された特定種類を同定し、該同定
された種類の自然言語に対応する解析用情報を、前記解
析用情報記憶手段より選択し、前記検出手段により前記
特徴語句が検出されなかった文については、直前に解析
した文の解析に使用した解析用情報を、前記解析用情報
記憶手段より選択する選択手段と、前記入力手段より入
力された各自然言語文を、前記選択手段により各文につ
いて選択された解析用情報を用いて解析する解析手段と
を具え、該解析手段による解析が失敗した文に対して
は、前記選択手段により異なる解析用情報を選択して前
記解析手段による解析を再実行する。 〔実施例〕 第1図は本発明の実施例で、1はキーボードKB、デイ
スクDISK、その他の装置から入力された文を保持する文
保持部で、メモリから成る。2は文保持部1から文を取
り出し、文を解析する文解析部、3は文保持部1に保持
されている文の中に、特徴文字列保持部6に保持されて
いる特徴文字列が含まれているかを検査し、そして解析
用情報保持部5に保持されている解析用情報のうちどれ
を文解析部2に接続するかを解析用情報切換部4に指示
する解析用情報選択部、4は文解析部2に接続する解析
用情報を切換える解析用情報切換部、5は自然言語の解
析に必要な文法規則、辞書などの情報を言語ごとに保持
する解析用情報保持部でメモリから成り、着脱可能なDI
SK、あるいは固定的なメモリである。6は各自然言語の
特徴となる文字列を保持する特徴文字列保持部で、第3
図のような表形式のメモリから成る。7は文解析部2の
解析結果を保持する解析結果保持部でメモリから成る。 次に第1図に示す装置の動作について、第2図に示す
動作フローを参照して説明する。ここに於いて日本語処
理がメインとし、その中に英語が一部入っているとす
る。 第2図において先ず「スタート」よりステツプS1の特
徴文字列適合処理に移る。ステツプS1では解析用情報選
択部3は文保持部1に保持されている文の中に、特徴文
字列保持部6に登録されている特徴文字列が含まれてい
るかを調べる。ここで、特徴文字列保持部6は第3図に
示すように、特徴文字列とそれに対応する自然言語の種
類が保持されている。特徴文字列適合処理が終了する
と、選択部3はステツプS2の特徴文字列適合結果のジヤ
ツジに移る。特徴文字列適合処理の結果、特徴文字列が
文中にないときはステツプS4の解析用情報保持部の日本
語に関する情報に基づく文解析処理に移る。特徴文字列
適合処理の結果、特徴文字列が文中にあるときはステツ
プS3の解析用情報切換処理に移る。ステツプS3ではステ
ツプS1の特徴文字列適合処理で適合した特徴文字列に対
応する自然言語に基づいて、解析用情報選択部3は解析
用情報の切換えを解析用情報切換部4に指示する。解析
用情報切換処理(日本語→英語)が終了すると、ステツ
プS4の英語に関する情報に基づく文解析処理に移る。ス
テツプS4では文保持部1に保持されている文を文解析部
2で解析処理し、解析結果を解析結果保持部7に出力す
る。このとき、解析用情報保持部5に保持されている解
析用情報のうち、解析用情報切換部4を介して文解析部
2に接続されている解析用情報が文解析処理に使われ
る。ステツプS4の文処理解析が終了すると、エンドとな
り処理は終了する。 以上の例では日本語→英語に切り換わる例であった
が、当然英語→日本語にも切り換わることは明らかであ
るし、また3つ以上の言語を取り扱うようにしても良
い。 なお上記実施例において、文解析処理の結果にかかわ
らず処理が終了する場合を説明したが、文解析処理に失
敗したときには解析用情報を順次変更して文解析処理を
継続するように変更してもよいものである。 又上記実施例において、解析用情報が日本語と英語と
して説明したが、他の例えば日本語の話し言葉と書き言
葉、あるいは標準語と方言としてもよいものである。 さらに上記実施例において、解析用情報が2つの場合
を説明したが、3つ以上の場合でもよいものである。 さらにまた上記実施例において、特徴文字列が適合し
ないとき解析用情報は直前の処理の際に選択・接続され
たものがそのまま使われる場合を説明したが文解析処理
後、常にある特定の解析用情報にリセツトしてもよいも
のである。 また上記実施例において、特徴文字列としてアルフア
ベツトの場合で説明したが、他の例えば、カタカナ,ひ
らがな,音素記号,漢字,句読点やハイフンなどの記号
であってもよいものである。 〔効 果〕 以上説明したように、本発明の自然言語処理装置によ
れば、複数種類の自然言語の文が混在して入力され得る
場合に、各入力文より特徴語句を検出して、検出された
特徴語句に対応づけられた種類の自然言語に対応する解
析用情報を用いて各入力文を解析するようにし、特徴語
句が検出されなかった文については、直前の解析に使用
した解析用情報を用いて解析を実行し、解析が失敗した
文に対しては、異なる解析用情報を用いて解析を再実行
するようにしている。 これにより、特徴語句が検出できれば、正しい解析用
情報を用いて入力文を解析できるとともに、特徴語句が
検出できなくても、多くの場合は同一の種類の自然言語
の文が連続して入力されるため、直前の解析に使用した
解析用情報を最初に用いることで、最初に用いる解析用
情報が正しくて入力文の解析に成功する可能性が高く、
解析用情報が正しくない解析に失敗しても、次に異なる
解析用情報を用いて解析を再実行することで入力文を正
しく解析できるので、入力された自然言語文の解析を効
率よく正確に行うことができるという効果が得られる。
【図面の簡単な説明】 第1図はこの発明の一実施例を示す自然言語処理装置の
ブロツク図、第2図は第1図実施例の動作を説明するた
めのフローチヤート、第3図は特徴文字列保持部の詳細
図である。 1……文保持部、2……文解析部、3……解析用情報選
択部、4……解析用情報切換部、5……解析用情報保持
部、6……特徴文字列保持部、7……解析結果保持部。

Claims (1)

  1. (57)【特許請求の範囲】 1.解析対象の自然言語文を入力する入力手段と、 複数種類の自然言語のそれぞれに対応して、当該種類の
    自然言語の文の解析に利用する解析用情報を記憶する解
    析用情報記憶手段と、 前記複数種類の自然言語のうちの特定種類の自然言語で
    使用される特徴語句を、該特定種類と対応づけて記憶す
    る特徴語句記憶手段と、 該特徴語句記憶手段を参照して、前記入力手段より入力
    される自然言語文の各文より前記特徴語句を検出する検
    出手段と、 該検出手段により前記特徴語句が検出された文について
    は、前記特徴語句記憶手段において当該検出された特徴
    語句と対応づけて記憶された特定種類を同定し、該同定
    された種類の自然言語に対応する解析用情報を、前記解
    析用情報記憶手段より選択し、前記検出手段により前記
    特徴語句が検出されなかった文については、直前に解析
    した文の解析に使用した解析用情報を、前記解析用情報
    記憶手段より選択する選択手段と、 前記入力手段より入力された各自然言語文を、前記選択
    手段により各文について選択された解析用情報を用いて
    解析する解析手段とを有し、 該解析手段による解析が失敗した文に対しては、前記選
    択手段により異なる解析用情報を選択して前記解析手段
    による解析を再実行することを特徴とする自然言語処理
    装置。
JP62044930A 1987-02-27 1987-02-27 自然言語処理装置 Expired - Fee Related JP2774495B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62044930A JP2774495B2 (ja) 1987-02-27 1987-02-27 自然言語処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62044930A JP2774495B2 (ja) 1987-02-27 1987-02-27 自然言語処理装置

Publications (2)

Publication Number Publication Date
JPS63211463A JPS63211463A (ja) 1988-09-02
JP2774495B2 true JP2774495B2 (ja) 1998-07-09

Family

ID=12705193

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62044930A Expired - Fee Related JP2774495B2 (ja) 1987-02-27 1987-02-27 自然言語処理装置

Country Status (1)

Country Link
JP (1) JP2774495B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02110600A (ja) * 1988-10-20 1990-04-23 Matsushita Electric Ind Co Ltd 音声規則合成装置
JPH03196198A (ja) * 1989-12-26 1991-08-27 Matsushita Electric Ind Co Ltd 音声規則合成装置
KR950008022B1 (ko) * 1991-06-19 1995-07-24 가부시끼가이샤 히다찌세이사꾸쇼 문자처리방법 및 장치와 문자입력방법 및 장치

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS601645B2 (ja) * 1978-09-25 1985-01-16 株式会社東芝 カナ漢字変換装置
JPS5745668A (en) * 1980-08-29 1982-03-15 Sharp Corp Electronic translating machine
JPS6231475A (ja) * 1985-08-02 1987-02-10 Canon Inc 自然言語処理装置

Also Published As

Publication number Publication date
JPS63211463A (ja) 1988-09-02

Similar Documents

Publication Publication Date Title
JP2774495B2 (ja) 自然言語処理装置
JPH113334A (ja) 翻訳装置及び翻訳方法
JPH0130173B2 (ja)
US6327560B1 (en) Chinese character conversion apparatus with no need to input tone symbols
JPS6394364A (ja) 日本文誤字自動修正装置
JPH0715691B2 (ja) 自動翻訳装置
JPS63163956A (ja) 文書作成・校正支援装置
JP3949874B2 (ja) 翻訳訳語学習方法、翻訳訳語学習装置、記憶媒体及び翻訳システム
JPS5818730A (ja) 文字処理装置
Ostrogonac et al. The Use of Statistical Language Models for Grammar and Semantic Error Handling in Spell Checking Applications for Serbian
JPH09288494A (ja) 音声認識装置および音声認識方法
JP2994539B2 (ja) 機械翻訳装置
JPS62271172A (ja) 仮名漢字変換処理方式
JPH07104863B2 (ja) かな漢字変換装置
JPH04296970A (ja) 文章検査装置
JPS62209663A (ja) 日本語文章校正装置
JPH0546612A (ja) 文章誤り検出装置
JPH06149872A (ja) 文章入力装置
JP2002351868A (ja) 電子辞書
JPH0262659A (ja) 日本文訂正候補文字抽出装置
JPH04365166A (ja) 文章検査装置
JPS59127150A (ja) 文章読上げ検査装置
JP2002117025A (ja) かな漢字変換装置およびかな漢字変換方法
JPH0231422B2 (ja)
JPS62209662A (ja) 日本語文章校正装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees