JP2771976B2 - 言語解析装置 - Google Patents

言語解析装置

Info

Publication number
JP2771976B2
JP2771976B2 JP62200325A JP20032587A JP2771976B2 JP 2771976 B2 JP2771976 B2 JP 2771976B2 JP 62200325 A JP62200325 A JP 62200325A JP 20032587 A JP20032587 A JP 20032587A JP 2771976 B2 JP2771976 B2 JP 2771976B2
Authority
JP
Japan
Prior art keywords
language
notation
language notation
dictionary
kana
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP62200325A
Other languages
English (en)
Other versions
JPS6442770A (en
Inventor
紀子 小山
裕美 斎藤
公人 武田
茂美 中里
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP62200325A priority Critical patent/JP2771976B2/ja
Publication of JPS6442770A publication Critical patent/JPS6442770A/ja
Application granted granted Critical
Publication of JP2771976B2 publication Critical patent/JP2771976B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は言語表記の変換機能およびその言語の解析処
理機能を備えた言語解析装置に関する。 (従来の技術) 近時、日本語文章を解析して他国語言語に翻訳する機
械翻訳システムの研究開発が盛んに進められている。こ
の種の機械翻訳システムの多くは、日本語文章の入力手
段やその編集処理機能の一部として仮名漢字変換機能を
備えている。そしてこの仮名漢字変換された日本語文章
について、その言語を構造解析や意味解析し、その解析
結果に従って英語等の他国語に翻訳処理するものとなっ
ている。 しかして上記仮名漢字変換処理は、仮名文字列で示さ
れる第1の言語表記を見出しとして仮名・漢字混じりの
文字列で示される第2の言語表記を格納した仮名・漢字
変換辞書を用いて行われる。また前述した言語解析処理
は、言語表記を見出しとしてその品詞や意味等の知識情
報を格納した解析辞書を用いて行われる。これらの各辞
書は、共に或る表記を見出しとして多の表記や知識情報
を格納して格納されるものであるが、その用途(使用目
的)の違いから専らそれぞれ独立に作成され、システム
内に別個に構築されていることが多い。 またこの種のシステムでは仮名・漢字変換辞書を用い
て日本語文章の入力処理を行った後、前記解析辞書を用
いて言語解析を実行して翻訳処理することが多い。しか
しこのような辞書過程を辿るに際して、仮名・漢字変換
辞書を用いた日本語入力処理においてはその辞書検索に
成功し、仮名漢字変換結果が求められたのに、その後の
言語解析処理においてはその辞書項目の違い等に起因し
て辞書検索に失敗する虞れがあった。つまり前述した如
く仮名・漢字変換辞書と解析辞書とがそれぞれ独立に構
築される為、一方の辞書に登録された言語情報が他方の
辞書にとっては未登録言語となっている可能性が高かっ
た。そこで一方の辞書に言語情報を登録した場合、その
項目情報を他方の辞書にも同時に登録することが考えら
れているが、その為には辞書を構築する為の膨大なメモ
リ容量を必要とする等の問題が生じた。この為、システ
ムの効果的な運用を図ることが非常に難しかった。 (発明が解決しようとする問題点) このように従来のシステムにあっては、仮名・漢字変
換辞書と解析辞書とがそれぞれ独立に構築されているの
で、その辞書項目の違い等に起因して言語解析処理に行
き詰まりが生じる虞れがある等の不具合があった。 本発明はこのような事情を考慮してなされたもので、
その目的とするところは、辞書構築の為の無駄なメモリ
容量を必要とせず、言語表記の変換処理とその解析処理
とを効果的に実行することのできる言語解析装置を提供
することにある。 [発明の構成] (問題点を解決するための手段) 本発明は、第1の言語表記、当該第1の言語表記を見
出しとする、当該第1の言語表記に対応した当該第1の
言語表記と同一種類の言語の第2の言語表記、当該第2
の言語表記を見出しとする、当該第2の言語表記に対応
した当該第2の言語表記とは種類の異なる言語の第3の
言語表記、及び上記第2の言語表記に対応した言語解析
用の知識情報が、種々の前記第1の言語表記について、
それぞれ対応付けて記憶された辞書記憶手段と、任意の
第1の言語表記の系列が与えられた場合に、当該第1の
言語表記の系列により上記辞書記憶手段を検索すること
で、当該第1の言語表記の系列を対応する上記第2の言
語表記の系列に変換すると共に当該第2の言語表記の系
列をなす各語毎に前記知識情報を取得する第1の変換手
段と、少なくとも上記第1の変換手段によって変換され
た上記第2の言語表記の系列をなす各語により上記辞書
記憶手段を検索して、当該第2の言語表記の系列の各語
毎に対応する上記第3の言語表記を取得すると共に、当
該第2の言語表記の系列の各語に対応する知識情報をも
とに当該第2の言語表記の系列に対する言語解析処理を
行い、その解析処理結果及び上記取得した各第3の言語
表記に従って当該第2の言語表記の系列を対応する第3
の言語表記の系列に変換する第2の変換手段とを備えた
ことを特徴とする。 (作用) 本発明によれば、辞書記憶手段には、第1の言語表記
(例えば仮名表記)、当該第1の言語表記を見出しとす
る、当該第1の言語表記に対応した当該第1の言語表記
と同一種類の言語の第2の言語表記(例えば、漢字混じ
り表記)、当該第2の言語表記を見出しとする、当該第
2の言語表記に対応した当該第2の言語表記とは種類の
異なる言語の第3の言語表記(例えば英語の対応訳
語)、及び上記第2の言語表記に対応した言語解析用の
知識情報(例えば品詞情報)が、種々の上記第1の言語
表記について、それぞれ対応付けて記憶されているた
め、第1の変換手段による変換処理では、第1の言語表
記により辞書記憶部を検索することにより、当該第1の
言語表記を見出しとする第2の言語表記、及び当該第2
の言語表記に対応した知識情報を取得することができ
る。 また、第2の変換手段による言語解析処理では、得ら
れた第2の言語表記により同じ辞書記憶部を検索するこ
とにより、当該第2の言語表記を見出しとする対応する
第3の言語表記を取得すると共に、当該第2の言語表記
の系列の各語に対応する知識情報をもとに当該第2の言
語表記の系列に対する言語解析処理を行い、その解析処
理結果及び取得した各第3の言語表記に従って当該第2
の言語表記の系列を対応する種類の異なる言語の第3の
言語表記の系列に変換する。 このように本発明においては、第1の変換手段によっ
て第1の言語表記から変換される(当該第1の言語表記
と同一種類の言語の)第2の言語表記が、第1の言語表
記に対する変換情報としてだけでなく、当該第2の言語
表記に対応した(当該第2の言語表記とは種類の異なる
言語の)第3の言語表記の見出しとして、辞書記憶部に
格納され、且つこれら第1乃至第3の言語表記に対応し
て、当該第2の言語表記に対応した言語解析用の知識情
報も辞書記憶部に格納されているため、1つの辞書構造
でありながら、表記変換辞書と解析辞書を実現すること
が可能となる。しかも両辞書は、第2の言語表記を通し
てその辞書項目データを相互に共有して構築されている
ので、表記変換時(第1の変換手段による変換時)に参
照した項目データを、言語解析時に参照することが可能
となり、辞書項目のずれがなくなる。更に、辞書項目デ
ータが共有されるので、上記両辞書を構築するための辞
書記憶部のメモリ容量が少なくて済み、辞書検索に要す
る処理時間の短縮化を図り得る。また、表記変換処理で
用いられた辞書項目データをそのまま言語解析処理に用
いることも可能なので、その処理に要する手間の低減を
図ることも可能となる。 (実施例) 以下、図面を参照して本発明の一実施例につき説明す
る。 本発明に係る言語解析装置は、例えば日本語文章を入
力し、これを英語文章に翻訳する日本翻訳システム等に
適用されるもので、概略的には第1図に示すように構成
される。尚、ここでは日本語文章を読みの情報である仮
名文字列として入力し、これを仮名漢字変換した後、言
語解析して英語に翻訳するものとして説明する。 第1図において、1は文字情報や各種の制御情報等を
入力する為のキーボード等からなる入力部である。編集
制御部2はこの入力部1から与えられる入力文章情報に
対して後述する処理を施し、その処理データ等を適宜CR
Tディスプレイ等からなる表示部3にて表示している。
オペレータは、この表示部3に表示される処理データを
モニタしながら前記入力部1から適宜処理制御情報を入
力することになる。 さてこのシステムでは、前記入力部1から読み情報と
して入力される仮名文字列からなる日本語文章を仮名漢
字変換部4にて仮名漢字変換処理し、この仮名漢字変換
によって求められた仮名・漢字混じりの日本語文章を翻
訳部5にて言語解析し、その解析結果に従って英語文章
に翻訳処理するように構成されている。 しかして上記仮名漢字変換部4が入力仮名文字列を仮
名・漢字混じりの日本語文章に変換処理するときに用い
る仮名・漢字変換辞書(仮名を第1の言語表記とし漢字
を第2の言語表記とする表記変換辞書)、および前記翻
訳部5が日本語文章を言語解析する際に用いる解析辞書
(言語解析時に使用される品詞情報等の知識を格納した
辞書)は、本装置では辞書記憶部6として上記仮名漢字
変換部4および翻訳部5に対して共用化されている。 仮名漢字変換辞書検索用マッピング・テーブル(第1
のテーブル)7は上記辞書記憶部6に格納された辞書項
目の情報を前記仮名漢字変換部4が容易に検索し得るよ
うに、その言語表記の読みを順にソートして並べ、各読
み毎にその項目データが辞書記憶部6のどこに格納され
ているかをポインタによって示すものとなっている。こ
の第1のテーブル7を参照することによって仮名漢字変
換部4は前記辞書記憶部6を読みの順に検索処理し得る
ようになっている。 一方、翻訳知識辞書検索用マッピング・テーブル(第
2のテーブル)8は上記辞書記憶部6に格納された辞書
項目の情報を前記翻訳部5が容易に検索し得るように、
仮名漢字混じりの見出し語を順にソートして並べ、各見
出し語毎にその項目データが辞書記憶部6のどこに格納
されているかをポインタによって示すものとなってい
る。前記仮名漢字変換部4の前記第1のテーブル7の参
照と同様に、この第2のテーブル7を参照することによ
って前記翻訳語5は前記辞書記憶部6を見出し語の順に
検索処理し得るようになっている。 第2図は前記第1および第2のテーブル7,8にそれぞ
れ所定の順序で格納された読出し語(第1の言語表記)
と、その見出し語に対してポインタによって結ばれた辞
書記憶部6の項目データの関係を模式的に示すものであ
る。このような第1および第2のテーブル7,8によっ
て、前記辞書記憶部6に格納された複数の項目データ
は、前記仮名漢字変換部4および翻訳部5がそれぞれ都
合の良い形態で辞書検索し得るものとなっている。 尚、ここでは辞書記憶部6の各項目は、仮名漢字混じ
りの表記6a,その読みを示す仮名表記6b,その品詞の情報
6c,およびその対応訳語6dとにより構成されている。前
記第1のテーブル7は上記読みを示す仮名表記6bを見出
しとして前記仮名漢字変換部4が辞書記憶部6を検索し
得るように構成されており、また前記第2のテーブル8
は上記仮名漢字混じり表記6aを見出しとして前記翻訳部
5が辞書記憶部6を検索し得るように構成されている。 そしてこの辞書記憶部6に新たな項目データを追加登
録した場合、これに伴って前記第1および第2のテーブ
ル7,8にその項目データを検索する為のテーブル情報が
それぞれ追加登録されることになる。 第3図はこのように構成された本装置における処理手
続の流れを示すもので、この処理手続を前記入力部1か
ら、例えば 『かれはしょうねんである。』 なる文字列を与えた場合を例に説明する。 入力部1から文字列が与えられると、編集制御部2は
先ず仮名漢字変換部4を起動して上記入力文字列(読み
を示す仮名文字列)を仮名漢字変換する(ステップ
a)。この仮名漢字変換は、前述した第1のテーブル7
を介して辞書記憶部6を検索し、読みに対応した仮名漢
字混じりの表記を求めることによって行われる。この仮
名漢字変換によって前記入力文字列は 『彼は少年である。』 なる仮名漢字混じり表記の文字列に変換される。この
際、その仮名漢字変換結果に対して前記辞書記憶部6か
ら前述した品詞の情報6cやその対応訳語6d等が同時に求
められる。そして上記仮名漢字変換結果と品詞等の情報
は、翻訳部5に与えられる。 しかる後、この仮名漢字変換結果に対して、前記編集
制御部2にて適宜文字列の訂正・挿入・削除等の編集処
理が行われる(ステップb)。具体的には、上記文字列
末尾の『ある』を『す』に訂正する等の処理が適宜実行
される。 以上の仮名漢字変換手続を経た後、入力文字列の全て
に対して仮名漢字変換処理が終了したか否か、つまり入
力文の最後まで処理が進められたか否かを確認し(ステ
ップc)、文の途中である場合には現在処理中の文字列
が前記編集処理によって新たに挿入された語であるか、
また訂正された語であるかを判定する(ステップd)。
そして挿入・訂正された語である場合には、その語につ
いて前記翻訳部5にて辞書記憶部6を検索する(ステッ
プe)。つまりこの場合には、前述した編集処理によっ
て『である』が『です』に訂正され、この『です』につ
いては前述した仮名漢字変換処理時において辞書検索が
なされていないので、これについて翻訳部5にて辞書記
憶部6を検索して翻訳処理に必要な品詞の情報6c等を求
める。 以上の処理手続を語に対するポインタを進めながら
(ステップf)、入力文章の全ての語について順に実行
する。この結果、前述した仮名漢字変換処理時および翻
訳部5による辞書検索によって、入力文章の全ての後に
ついてその解析処理・翻訳処理に必要な品詞6c等の情報
がそれぞれ求められることになる。 そして文の終りが検出されたとき(ステップc)、翻
訳部5は上述した如く辞書記憶部6から検索抽出された
情報に基いてその文章構造等を解析し、その解析結果に
従って前述した日本語文章を英語文に翻訳処理している
(ステップg)。この解析・翻訳処理によって、 『He is a boy.』 なる英語翻訳結果が求められる。 このように本装置にあっては、仮名漢字変換処理に用
いる辞書と、翻訳処理に用いる辞書とが共用されている
ので、仮名漢字変換処理時に求められた辞書検索結果を
そのまま用いて翻訳処理を実行することができる。そし
て仮名漢字変換処理時に求められていなかった語につい
てのみ、翻訳処理時に辞書検索すれば良いので、その処
理効率が非常に良い。また上述したように辞書記憶部が
共用化されているので、従来のように仮名漢字変換処理
時には辞書検索に成功したが、翻訳処理時には辞書検索
に失敗する等の不具合を招来する虞れがない。しかも1
つの辞書を共用するので、辞書を構築する為のメモリ容
量が少なくて良い等の効果も奏せられる。 尚、本発明は上述した実施例に限定されるものではな
い。ここでは辞書記憶部6を検索する為にそれぞれマッ
ピング・テーブルを用いたが、その辞書構造を一方の検
索順序に合せて作成しておけば、マッピング・テーブル
の一方を省略することが可能である。またマッピング・
テーブルが単にソート順の制御を行うだけでなく、仮名
漢字混じりの見出し後を持ち、その他の情報を記憶した
辞書本体との間で相互に対応関係を持つものであっても
良い。更にはマッピング・テーブルの構造・形式も特に
限定されない。 またここでは日英翻訳を例に説明したが、これに限定
されるものでないことは云うまでもない。また表記の変
換処理や、言語の解析処理のアルゴリズムも種々変形可
能なものであり、言語解析の処理単位も後に限定されな
い。その後、本発明はその要旨を逸脱しない範囲で種々
変形して実施することができ、種々の言語解析処理に応
用可能である。 [発明の効果] 以上説明したように本発明によれば、言語表記変換用
の辞書と言語解析用の知識辞書とが、その内容を共用化
されているので内容項目のずれを生じることがない。し
かも記憶容量の低減を図ることができ、その辞書検索の
容易化、検索所要時間の短縮化を図ることができる。ま
た辞書内容の修正処理も一括して行うことができ、辞書
内容項目のずれの発生を効果的に防止することができる
等の実用上多大なる効果が奏せられる。
【図面の簡単な説明】 図は本発明の一実施例を示すもので、第1図は実施例装
置の要部概略構成図、第2図は辞書記憶部とマッピング
・テーブルとの対応関係を模式的に示す図、第3図は実
施例装置における処理手続の流れを示す図である。 1……入力部、2……編集制御部、3……出力部、4…
…仮名漢字変換部、5……翻訳部、6……辞書記憶部、
7……仮名漢字変換辞書検索用マッピングテーブル(第
1のテーブル)、8……翻訳知識辞書検索用マッピング
テーブル(第2のテーブル)。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 中里 茂美 東京都青梅市末広町2丁目9番地 株式 会社東芝青梅工場内 (56)参考文献 特開 昭63−273165(JP,A) 特開 昭62−197865(JP,A) (58)調査した分野(Int.Cl.6,DB名) G06F 17/27 G06F 17/28

Claims (1)

  1. (57)【特許請求の範囲】 1.第1の言語表記、当該第1の言語表記を見出しとす
    る、当該第1の言語表記に対応した当該第1の言語表記
    と同一種類の言語の第2の言語表記、当該第2の言語表
    記を見出しとする、当該第2の言語表記に対応した当該
    第2の言語表記とは種類の異なる言語の第3の言語表
    記、及び前記第2の言語表記に対応した言語解析用の知
    識情報が、種々の前記第1の言語表記について、それぞ
    れ対応付けて記憶された辞書記憶手段と、 任意の第1の言語表記の系列が与えられた場合に、当該
    第1の言語表記の系列により前記辞書記憶手段を検索す
    ることで、当該第1の言語表記の系列を対応する前記第
    2の言語表記の系列に変換すると共に当該第2の言語表
    記の系列をなす各語毎に前記知識情報を取得する第1の
    変換手段と、 少なくとも前記第1の変換手段によって変換された前記
    第2の言語表記の系列をなす各語により前記辞書記憶手
    段を検索して、当該第2の言語表記の系列の各語毎に対
    応する前記第3の言語表記を取得すると共に、当該第2
    の言語表記の系列の各語に対応する前記知識情報をもと
    に当該第2の言語表記の系列に対する言語解析処理を行
    い、その解析処理結果及び前記取得した各第3の言語表
    記に従って当該第2の言語表記の系列を対応する第3の
    言語表記の系列に変換する第2の変換手段とを具備する
    ことを特徴とする言語解析装置。 2.前記第1の変換手段による変換時に前記第1の言語
    表記から前記辞書記憶手段を検索するためのマッピング
    情報が登録された第1のマッピングテーブル、及び前記
    第2の変換手段による変換時に前記第2の言語表記から
    前記辞書記憶手段を検索するためのマッピング情報が登
    録された第2のマッピングテーブルの少なくとも一方を
    更に具備することを特徴とする特許請求の範囲第1項記
    載の言語解析装置。
JP62200325A 1987-08-11 1987-08-11 言語解析装置 Expired - Lifetime JP2771976B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62200325A JP2771976B2 (ja) 1987-08-11 1987-08-11 言語解析装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62200325A JP2771976B2 (ja) 1987-08-11 1987-08-11 言語解析装置

Publications (2)

Publication Number Publication Date
JPS6442770A JPS6442770A (en) 1989-02-15
JP2771976B2 true JP2771976B2 (ja) 1998-07-02

Family

ID=16422420

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62200325A Expired - Lifetime JP2771976B2 (ja) 1987-08-11 1987-08-11 言語解析装置

Country Status (1)

Country Link
JP (1) JP2771976B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0631547Y2 (ja) * 1987-10-29 1994-08-22 ブラザー工業株式会社 翻訳機
IE911774A1 (en) * 1990-06-11 1991-12-18 Akzo Nv Pyridinylpiperazine derivatives
JP6619932B2 (ja) * 2014-12-26 2019-12-11 Kddi株式会社 形態素解析装置およびプログラム
JP6390510B2 (ja) 2015-05-12 2018-09-19 コニカミノルタ株式会社 画像形成装置及びプログラム
JP6319175B2 (ja) 2015-05-12 2018-05-09 コニカミノルタ株式会社 画像形成装置及びプログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3402055A1 (de) * 1984-01-21 1985-08-01 Hochtemperatur-Reaktorbau GmbH, 4600 Dortmund Spannbeton-druckbehaelter, insbesondere fuer eine kernreaktoranlage
JPS62106238A (ja) * 1985-10-31 1987-05-16 Mitsuo Sakamoto 建物の換気装置

Also Published As

Publication number Publication date
JPS6442770A (en) 1989-02-15

Similar Documents

Publication Publication Date Title
JPS6140673A (ja) 外国語作文用翻訳方法、および翻訳機
JPS61255468A (ja) 機械翻訳処理装置
JP2848593B2 (ja) 翻訳処理方法
JP2771976B2 (ja) 言語解析装置
JPS59176823A (ja) 自然言語を用いてコンピュータに入力する方法
JPS6318458A (ja) 感情情報抽出装置
JPS58192173A (ja) 機械翻訳装置
JP3483585B2 (ja) 文書検索装置及び文書検索方法
JPS6310265A (ja) 翻訳装置
JPH0561902A (ja) 機械翻訳システム
JPS6170663A (ja) 住所翻訳装置
JPH06259423A (ja) 要約自動作成方式
JP2958044B2 (ja) かな漢字変換方法及び装置
JP4054353B2 (ja) 機械翻訳装置及び機械翻訳プログラム
JPH02253474A (ja) テキストベース検索方法
JPH0612453A (ja) 未知語抽出登録装置
JPH03229367A (ja) テキストベース検索方式
JPH02294779A (ja) 機械翻訳システム
JPS63156275A (ja) かな・カナ変換候補自動追加式氏名入力装置
JPH03161865A (ja) 文章の検索方法
JPS6180358A (ja) 翻訳装置
JPH04180167A (ja) 英語形態素解析装置
JPH0267679A (ja) 辞書作成支援機能付き翻訳処理方式および装置
JPH04241066A (ja) 文書処理装置における電子化辞書検索方式
JPH05197752A (ja) 機械翻訳装置

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080417

Year of fee payment: 10