JPS6324458A - 自然言語処理装置 - Google Patents

自然言語処理装置

Info

Publication number
JPS6324458A
JPS6324458A JP61166669A JP16666986A JPS6324458A JP S6324458 A JPS6324458 A JP S6324458A JP 61166669 A JP61166669 A JP 61166669A JP 16666986 A JP16666986 A JP 16666986A JP S6324458 A JPS6324458 A JP S6324458A
Authority
JP
Japan
Prior art keywords
character string
processing
nouns
sentence element
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61166669A
Other languages
English (en)
Inventor
Minoru Fujita
稔 藤田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP61166669A priority Critical patent/JPS6324458A/ja
Publication of JPS6324458A publication Critical patent/JPS6324458A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は日本語、英語等の自然言語に関連する情報の処
理を行なう自然言語処理装置に関するものである。
[従来の技術] 近年、ワードプロセッサや機械翻訳機など自然言語処理
機能を有した各種電子機器が開発されている。これらの
機器に適用される自然言語処理装置では入力された文を
構文的に解析し、さらに意味的に解析し、詳しく内容を
理解するところまで開発が進んでいる。
[発明が解決しようとする問題点] しかしながら同じ内容を表現するにもいろいろな文ない
しは文字列の形態があるものである。
特に複数の名詞を連結した文字列の場合、例えば日本語
で同じ内容で「コピーの動作」と「コピー動作」、「記
録再生装器」と「記録ψ再生装置Jと「記録/再生装置
」というように複数の表現形態がある。
自然言語処理装置においてこのように同じ内容で形態が
異なる全ての表現に対応できるようにするには処理が大
規模、複雑化するという問題があった。
例えば「コピー動作」と「コピーの動作」と言う表現の
両方に対応するには、「コピー動作」という1つのまと
まった文字列の処理と、「コピー」と「の」と「動作」
というそれぞれの文字列の処理が必要になる。
〔問題ζ(を解決するための手段] 上述した問題点を解決するため本発明の自然言1i1’
f処理装置によれば、複数の名詞を所定の文要素を介し
て連結した文字列を記憶する第1の文字列保持手段と、
前記文字列保持手段に記憶された文字列から前記文要素
を除去する除去処理手段と、1ii記除去処理後の文字
列を記憶する第2の文字列保持手段と、前記第2の文字
列保持手段に記憶された文字列で辞書を検索する辞書検
索手段を有する構成を採用した。
[作 用] このような構成によれば複数の名詞を所定の文要素を介
して連結した文字列から前記文要素が除去され、複数の
名詞を直接連結した文字列で辞書検索が行なわれる。即
ち複数の名詞を連結した文字列の処理が複数の名詞を直
接連結した文字タリの処理に一本化される。複数の名詞
を直接連結した文字列の処理は、複数の名詞を所定の文
要素を介して連結した文字列をそれぞれの名詞と前記文
要素に分けて行なう処理に比べて簡単であるので処理全
体が簡略化される。
[実施例] 以下、本発明の実施例の詳細を説明する。
第1図は本発明の実施例による日本語処理装置の機能的
な構成を説明するブロック図である。
この日本語処理装置は例えば日本語ワードプロセッサ、
日本語と外国語の自動翻訳機等の機器に設けられる。ま
たこの構成全体はハードウェア的には公知のコンピュー
タのCPU (中央演算処理装置)とROM (リード
オンリメモリ)とRAM(ランダムアクセスメモリ)等
から構成される。
第1図に示す各部を説明すると、まず符号1は日本語の
複数の名詞を格助詞「の」で連結した文字列(以下「の
」連結文字列と呼ぶ)を入力され、記憶する「の」連結
タイプ保持部である。
この「の」連結タイプ保持部1は例えば1−述したRA
M内の所定の記憶領域として構成される。
また符号2は、「の」連結タイプ保持部1に記憶された
「の」連結文字列から文字「の」を除去する「の」除去
処理部2である。「の」除去処理部2は、ROM内に構
成された制御プログラム保持部8に記teされた制御プ
ログラムをCPUが実行し、それに対応する機能を果す
ことで実現される。なお[のJの除去方法は例えば格助
詞「の」を識別する訳ではなく文字列に含まれる「の」
を全て除去するという簡単な方法による。
次に符号3は上記した「の」除去処理を行なった結果の
文字列、即ち複数の名詞を直接連結した文字列(名詞中
に「の」が含まれる場合これも除去されている。)で検
索対象となる文字列を記憶する検索対象文字列保持部で
ある。これもRAM内の所定の記te領域として構成さ
れる。
次に符号4は検索対象文字列保持部3に保持された文字
列に基づいて辞書部5に格納されたデータを検索する辞
ど検索部である。辞書検索部4も「の」除去処理部2の
場合と同様に、制御プログラム保持部8に記憶された制
御プログラムをCPUが実行し、それに対応する機能を
果すことで実現される。
辞書部5はROMから構成され、例えば日本語ワードプ
ロセッサの場合には恢字の辞書として先述の直接連結さ
れた複数の名詞のそれぞれに対応する快字データ、機械
翻訳機の場合は上記直接連結された複数の名詞のそれぞ
れに対応する外国語の名詞のデータ等が、一対一のテー
ブル形式で格納される。
また、符号6は辞書検索部4により辞書部5から検索さ
れた結果のデータを記憶する検索結果保持部であり、こ
れもRAM内の所定の記te領域として構成される。
さらに符号7は検索結果を出力する検索結果出力部であ
り、CRTなどの表示装置あるいはプリンタなどから構
成される。
次に以上の構成からなる本実施例装置の処理動作につき
第2図に示す流れ図を参照して説明する。なお、この処
理動作は制御プログラム保持部8に格納された制御プロ
グラムに従ってCPUの制御のもとに以下のように行な
われる。
まず、第2図のステップSlでは「の」連結りイブ保持
部1に「の」連結文字列が保持(記憶)されたか否かが
調べられ、保持されていなければ、このステップが繰り
返される。
「の」連結文字列は1本実施例装置が設けられる機器に
入力された文字列の内から不図示の構成によりピックア
ップされ、「の」連結タイプ保持部1に入力され、保持
される。
「の」連結タイプ保持部lが「の」連結文字列を保持す
ると、ステップS2に移行し、「の」除去処理部2によ
り「の」連結タイプ保持部1に保持された「の」連結文
字列から文字「の」が除去される。除去した結果の文字
列、即ち複数の名詞を直接連結した文字列は検索対象文
字列保持部3に転送され、保持される。
例えば第3図に示すように「の」連結タイプ保持一部1
に「コピーの動作Jという「の」連結文字列が保持され
た時は、「の」除去処理部2の処理により「コピー動作
」という文字列が検索対象文字列保持部3に保持される
ステップS2の処理が終了するとステップS3に移行し
、辞書検索部4により検索対象文字列保持部3に保持さ
れた文字列に対応した辞書部5のデータが検索される0
例えば本実施例装置が日本語から英語への翻訳を行なう
機械翻訳機を構成する場合には、「コピー動作」という
日本語の文字列に対応した英語の名詞の文字列が辞書f
!B5から検索される。
検索により得られた結果のデータは検索結果保持部6に
転送されて保持され、検索結果出力部7により表示出力
ないしは記録出力などの形で出力される。
ステップS3の処理が終了するとステップSlへ戻り、
上述の動作が繰り返される。
なお上記の処理において、「の」連結文字列の名詞中に
「の」が含まれている場合、それも除去されて検索が行
なわれるので検索は失敗する。その場合は除去前の「の
」連結文字列の処理は本実施例装置以外の構成により他
の方法で行なうものとする。
以上のように本実施例装置によれば、「の」連結文字列
から「の」が除去され、複数の名詞を直接連結した文字
列として処理が行なわれる0本実施例装置の構成を従来
の日本語処理装置に付加すれば「の」連結文字列の処理
と、複数の名詞を直接連結した文字列の処理は、後者の
処理に一本化される。複数の名詞を直Pa1li結した
文字列の処理は、「の」連結文字列をそれぞれの名詞と
「の」のそれぞれを分けて行なう処理に比べて一度に簡
単に行なえるので、処理全体を大幅に簡略化させ、処理
の効率を向上させることができる。
なお上記の説明で「の」連結文字列の例として「コピー
の動作」という2つの名詞を「の」で連結した文字列を
挙げたが、例えば「コピーの動作の順序」というような
3つ以上の名詞を「の」で連結した文字列も処理の対象
に入れてよいのは勿論である。
また複数の名詞を連結する文要素は「の」に限らず、最
初に挙げたように例えば「記録φ再生装置」の間の点や
、「記録/再生装置」のスラッシュ等があり、これらの
文要素を除去して文字列を処理するようにしても良い。
なお、日本語処理装置に限らず外国語処理袋ごついても
上述のような技術が適用できるのは勿論である。
[効 果] 以北の説明から明らかなように、本発明の自然言語処理
装置によれば、複数の名詞を所定の文要、素を介して連
結した文字列を記t口する第1の文字列保持手段と、前
記文字列保持手段に記憶された文字列から前記文要素を
除去する除去処理手段と、前記除去処理後の文字列を記
憶する第2の文字列保持手段と、前記第2の文字列保持
手段に記憶された文字列で辞書を検索する辞書検索手段
を有する構成を採用したので、複数の名詞を連結した文
字列の処理全体を顕著に簡略化し、処理効率を向上でき
るという優れた効果が得られる。
【図面の簡単な説明】
第1図は本発明の実施例による日本語処理装置の機能的
構成を示すブロック図、第2図は第1図の装置の処理手
順を示す流れ図、第3図は同装置の処理動作の説明図で
ある。 1・・・「の」連結タイプ保持部 2・・・「の」除去処理部 3・・・検索対象文字列保持部 4・・・辞書検索部   5・・・辞書部6・・・検索
結果保持部 第1図

Claims (1)

    【特許請求の範囲】
  1. 複数の名詞を所定の文要素を介して連結した文字列を記
    憶する第1の文字列保持手段と、前記文字列保持手段に
    記憶された文字列から前記文要素を除去する除去処理手
    段と、前記除去処理後の文字列を記憶する第2の文字列
    保持手段と、前記第2の文字列保持手段に記憶された文
    字列で辞書を検索する辞書検索手段を有することを特徴
    とする自然言語処理装置。
JP61166669A 1986-07-17 1986-07-17 自然言語処理装置 Pending JPS6324458A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61166669A JPS6324458A (ja) 1986-07-17 1986-07-17 自然言語処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61166669A JPS6324458A (ja) 1986-07-17 1986-07-17 自然言語処理装置

Publications (1)

Publication Number Publication Date
JPS6324458A true JPS6324458A (ja) 1988-02-01

Family

ID=15835529

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61166669A Pending JPS6324458A (ja) 1986-07-17 1986-07-17 自然言語処理装置

Country Status (1)

Country Link
JP (1) JPS6324458A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03105465A (ja) * 1989-09-19 1991-05-02 Nec Corp 複合語抽出装置
US6048189A (en) * 1995-04-05 2000-04-11 Japan Synthetic Rubber Co., Ltd. Blow molding apparatus

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03105465A (ja) * 1989-09-19 1991-05-02 Nec Corp 複合語抽出装置
US6048189A (en) * 1995-04-05 2000-04-11 Japan Synthetic Rubber Co., Ltd. Blow molding apparatus
US6099285A (en) * 1995-04-05 2000-08-08 Japan Synthetic Rubber Co., Ltd. Molding apparatus

Similar Documents

Publication Publication Date Title
US5895446A (en) Pattern-based translation method and system
US20050010421A1 (en) Machine translation device, method of processing data, and program
JPH02308370A (ja) 機械翻訳システム
JP2000200291A (ja) 選択された文字列をテキスト内で自動検出する方法
JPH11110416A (ja) データベースからドキュメントを検索するための方法および装置
JPH0567144A (ja) 前編集支援方法およびその装置
JP2007157123A (ja) 改善された中国語−英語翻訳ツール
JPS6324458A (ja) 自然言語処理装置
JP2546245B2 (ja) 自然言語文生成方法
JP3236027B2 (ja) 機械翻訳装置
JP3160897B2 (ja) 機械翻訳装置
JPH0715691B2 (ja) 自動翻訳装置
KR100371135B1 (ko) 용언 굴절사전을 이용한 용언 형태소 분석장치 및 방법
JPS6337472A (ja) 冠詞設定方式
JP2588522B2 (ja) 機械翻訳辞書アクセス方法
JPH11259473A (ja) 機械翻訳装置及び機械翻訳方法
JP2006134051A (ja) 翻訳装置、翻訳方法およびプログラム
JP2000067045A (ja) テキスト変換装置およびテキスト変換プログラムを格納したコンピュータ読み取り可能な記録媒体
JP3267168B2 (ja) 自然言語変換システム
JPH0772897B2 (ja) 機械翻訳機
JPH0973454A (ja) 文書作成装置及び文書作成方法
JP2009009583A (ja) 構文パースを用いてセグメント化されていないテキストをセグメント化する方法
JP2002197086A (ja) 自然言語変換システム
JPS62282364A (ja) 文字列検索方式
JPH04180169A (ja) 形態素解析装置