JP2003345797A

JP2003345797A - 言語変換装置及びプログラム記録媒体

Info

Publication number: JP2003345797A
Application number: JP2003131271A
Authority: JP
Inventors: Yumi Wakita; 由実脇田
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 1998-06-04
Filing date: 2003-05-09
Publication date: 2003-12-05

Abstract

(57)【要約】【課題】入力音声文の一部に未学習部分があったり、
音声認識が一部誤りを起こした場合、目的言語への変換
が不可能となり、さらに、変換に必要なフレーズ辞書作
成やフレーズ間規則作成は人手で行なわなければなら
ず、開発効率が悪く手間がかかる。【解決手段】原言語文と目的言語文とが対になった対
訳コーパスから単語または単語列に対する文法的または
意味的制約規則を学習して得られた言語規則を格納する
格納手段３、４と、格納された言語規則を用いて入力音
声の音声認識を行い、言語変換の対象となる文で認識結
果を出力する音声認識部７と、音声認識部７で用いられ
たのと同じ言語規則を用いて言語変換の対象となる文を
言語変換された文に変換する言語変換部９とを備えたこ
とを特徴とする。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、入力音声まだは入
力テキストを、他言語または他の文体型などに変換して
出力する言語変換装置に関する。

【０００２】

【従来の技術】以下、従来の技術を言語変換装置の１つ
である、入力音声を他言語に翻訳（以下通訳と呼ぶ）す
る装置を例にして説明する。

【０００３】通訳装置は、音響信号として入力された発
声文を単語テキスト列で表示された出力文に変換するた
めの音声認識と、単語テキスト列で表示された文を入力
し他言語文に翻訳する言語翻訳とを順次実行することで
通訳を実現している。さらに上記言語翻訳部は、入力文
の統語的または意味的構造を解析する言語解析部と、解
析結果に基づいて他言語に変換する言語変換部と、翻訳
結果から自然な出力文を生成する出力文生成部とから構
成されている。

【０００４】しかし、音声認識部が発声文の一部を誤認
識した場合や、文にあいづちや言い直しなどが挿入され
たり、文として不完結なまま発声を終えてしまうなど、
発声文自体が統語的または意味的にも不自然な場合は、
音声認識結果を言語解析部に入力しても解析が失敗し、
結果的に翻訳結果が出力されないという問題があった。

【０００５】この問題を解決するために、フレーズに分
割し、フレーズ内とフレーズ間とを分けて規則化し、不
完結な発声にはフレーズ内規則のみを用いて解析し、解
析結果の出力を可能にするように構成することである。
（たとえば非特許文献１参照。）。図１４は従来のフ
レーズ内及びフレーズ間規則例である。この例では、コ
ーパス例３０１の「今晩シングルの部屋の予約お願
いね」に対して、フレーズ内規則は、書き言葉にも共通
な文法規則に基づきフレーズ内規則３０２のような木構
造で記述し、フレーズ間規則は、学習用コーパスにおけ
るフレーズ間の隣接確率で記述されている。例えばフレ
ーズ間規則はフレーズ間規則３０３のように記述され
る。

【０００６】入力文を解析する際には、文頭から順次フ
レーズ内規則を当てはめ、フレーズの終端では、各フレ
ーズ毎に隣接確率の高いフレーズ候補が隣接するように
フレーズを接続しながら入力文解析が行われる。このよ
うな文解析方法では、文の一部が誤認識を起こし通常の
文全体の解析が失敗する場合でも、誤認識を含まない部
分のフレーズ解析は正しく行われるため、解析された部
分フレーズのみを翻訳することにより、翻訳結果を部分
的に出力できる枠組みになっている。

【０００７】また、この問題に解決するために、従来の
文法に則って言語解析を行うのではなく、従来の文法で
は解析できないような発声文も含めた発声文例から、対
応する原言語文と目的言語文の対訳フレーズを抽出し、
このフレーズ対をなるべく一般化した形で記述された対
訳フレーズ辞書を作成し、この辞書を用いて言語解析と
言語変換とを行う方法も提案されている（たとえば、非
特許文献２参照。）。図１５は従来の言語変換規則作成
装置である。通訳を行う前に、予め発声文対訳コーパス
から対訳フレーズ辞書を作成する。ここでも、一部の単
語が誤ったり省略されたりすることを考慮し、発声文例
をフレーズ毎に分割し、フレーズ内規則とフレーズ間の
依存規則とを作成している。まず形態素解析部３６０
で、原言語文と目的言語文との形態素解析を行ない、各
文を形態素列に変換する。次にフレーズ決定部３６１
で、原言語及び目的言語の形態素例をフレーズ単位に分
割し、フレーズ内規則とフレーズ間の依存関係規則を作
成する。この際のフレーズ単位は、意味的にまとまった
単位であることに加えて、対訳において対応関係が明ら
かな部分文であることを考慮して人手で決定される。た
とえば、「部屋の予約をお願いしたいんですが」「 I'd
like to reserve a room」という対訳文例は、(a)「部
屋の予約」「reserve a room」,(b)「をお願いしたいん
ですが」「I'd like to」という(a)(b)２つの対訳フレ
ーズに分割され、「(a)を(b)する」「(b) to (a)」とい
う依存関係が規則化される。上記対訳フレーズは対訳フ
レーズ辞書３６２に、フレーズ間の依存関係を対訳の形
で表されたものはフレーズ間規則テーブル３６３に各々
保管される。このような処理が対訳コーパスに含まれた
全発声文分について行われる。このフレーズの分割と依
存関係は、文の意味的情報やどの程度文法的に崩れてい
ないかの度合いなどのファクターから決定されるため、
自動的に各文について決定することが難しく、従来は人
手で決定されている。

【非特許文献１】竹沢、森元、電子通信学会論文誌Ｄ−
II、Ｖｏｌ．Ｊ７９−Ｄ−II（１２）

【非特許文献２】古瀬、隅田、飯田、情報処理学会論文
誌Ｖｏｌ．３５、ｎｏ．３、１９９４年３月

【０００８】

【発明が解決しようとする課題】しかしながら、第１の
従来例における文解析手段においては、扱っているフレ
ーズは原言語のみに依存した言語依存フレーズであり、
目的言語のフレーズ単位とは合わない場合が多い。その
ため、原言語においては正しいフレーズを言語変換部に
入力しても、結局は受理できない場合が多い、という問
題を有している。この第１の従来例の枠組みは、言語非
依存フレーズを用いても可能な枠組みではあるが、その
場合は、言語非依存フレーズの解析を人手で作成する必
要があり、開発に時間がかかる、人手の作成基準の揺れ
が規則性能を歪ませるという新たな問題が生じる。

【０００９】また、第２の従来例における対訳フレーズ
辞書作成方法においては、発声文の意味的情報や文法的
情報を自動的に解析できる手段がないために、人手で作
成しなければならない。そのため、開発に時間がかか
り、人手の作成基準の揺れが規則性能を歪ませるという
問題点がある。たとえば、通訳装置の目標となるタスク
を変更したり、原言語及び目的言語の言語種が変更にな
った場合は、一度構築した規則を適応できずにはじめか
ら規則を作成しなければならず、開発効率が悪く手間が
かかる。

【００１０】また、上記フレーズ辞書３６２やフレーズ
間規則３６３は、対訳コーパスの対応関係を重視してフ
レーズ単位を決定しており、音声認識部３６４が認識す
るのに適切なフレーズ単位であるかどうかの評価がなさ
れているものではない。音声認識にとって適切なフレー
ズかどうかを人手で判断しながらフレーズ単位を決める
ことは困難であり、決定されたフレーズを用いて認識し
た場合、認識率が確保できる保証がない、という課題を
有している。

【００１１】本発明の目的は以上の問題点を解決し、入
力音声文に未学習部分があったり、音声認識が一部誤り
を起こしても、必ず目的言語への変換を可能とし、さら
に、変換に必要なフレーズ辞書作成やフレーズ間規則
を、なるべく人手をかけずに自動的に作成できる言語変
換装置、及びプログラム記録媒体を提供することにあ
る。

【００１２】

【課題を解決するための手段】上述した課題を解決する
ために、第１の本発明は、音声またはテキストで入力さ
れる言語変換の対象となる文（以下、原言語文と呼ぶ、
これに対応して言語変換された文を目的言語文と呼ぶ）
と、目的言語文とが対になった学習用データベース（以
下、対訳コーパスと呼ぶ）から単語または単語列に対す
る文法的または意味的制約規則を学習して得られた言語
規則を格納する格納手段と、格納された前記言語規則を
用いて入力音声の音声認識を行い、言語変換の対象とな
る文で認識結果を出力する音声認識部と、前記音声認識
部で用いられたのと同じ前記言語規則を用いて言語変換
の対象となる文を言語変換された文に変換する言語変換
部とを備えたことを特徴とする言語変換装置である。

【００１３】また、第２の本発明は、前記言語規則は、
言語変換の対象となる文と、変換された文とが共に意味
的なまとまりを形成する部分（体型非依存フレーズと呼
ぶ）に分割し、前記体型非依存フレーズ内の言語規則と
前記体型非依存フレーズ間の言語規則とを分けて規則化
されて作られるものであることを特徴とする第１の本発
明の言語変換装置である。

【００１４】また、第３の本発明は、前記言語規則は、
前記体型非依存フレーズ内の文法的または意味的規則と
前記体型非依存フレーズ間の共起または連接関係を規則
化されて作られるものであることを特徴とする第２の本
発明の言語変換装置である。

【００１５】また、第４の本発明は、前記言語変換部で
用いられたのと同じ言語規則を用いて前記言語変換され
た文を音声合成する音声合成部とを備えたことを特徴と
する第１の本発明の言語変換装置である。

【００１６】また、第５の本発明は、前記言語規則のう
ち、目的言語文が同じである言語規則を同じカテゴリー
としてまとめられた言語規則群に対して、前記言語規則
群に含まれる言語規則の言語変換の対象となる文の音響
的規則間距離を算出する規則間距離算出部と、音声認識
の認識レベルを上げるために、算出された前記距離が近
い言語規則どうしをマージすることで前記規則群の最適
化を行う最適規則作成部と、を備えたことを特徴とする
第１〜４の本発明のいずれかの言語変換装置である。

【００１７】また、第６の本発明は、第１〜５の本発明
のいずれかの言語変換装置の各構成要素の機能をコンピ
ュータに実行するためのプログラムを格納していること
を特徴とするプログラム記録媒体である。

【００１８】

【発明の実施の形態】以下に、本発明の実施の形態につ
いて図面を参照して説明する。

【００１９】（第１の実施の形態）まず第１の実施の形
態について説明する。

【００２０】第１の実施の形態では、言語変換装置の一
例として、従来例同様、異なる言語間の変換を行う通訳
装置を用いて説明する。図１は本実施の形態の通訳装置
のブロック図である。

【００２１】本実施の形態の通訳装置は、まず通訳する
前に、言語解析部２で予め対訳コーパスや対訳単語辞書
などを有している学習用データベース１から発声文の原
言語及び目的言語の言語規則を学習する。言語規則の学
習例を図３に示す。

【００２２】言語規則作成部２では、たとえば、品詞タ
グが付与されている対訳コーパスを用いて原言語文及び
目的言語文の内容語を品詞化する。さらに、原言語にお
けるフレーズと目的言語におけるフレーズとが一まとま
りとして対応している場合に、その一まとまりを体型非
依存フレーズとしてその境界を区切る。すなわち、原言
語における体型依存フレーズと目的言語における体型依
存フレーズとが一まとまりとして対応している場合に、
その一まとまりを体型非依存フレーズの境界とする。原
言語の体型依存フレーズに対応する目的言語の体型依存
フレーズがひとまとまりとして対応しない場合には、対
応する部分が一まとまりとして存在するまで体型依存フ
レーズの連結やフレーズ境界の修正を行い体型非依存フ
レーズとする。図３において、対訳コーパスの文「今
晩、部屋の予約をしたいんですが」「I'd like to room
-reservation tonight」２６が、内容語の品詞化３０
で、「＜普通名詞＞｜＜普通名詞＞の＜サ変名詞＞｜を
したいんですが」２７のように品詞化されている。また
「＜普通名詞＞」、「＜普通名詞＞の＜サ変名詞＞」、
「をしたいんですが」のように体型非依存フレーズとし
て境界を区切られている。次に各体型非依存フレーズに
おいて、品詞と単語の混合列、および品詞で表されてい
る部分の単語名、さらに各体型非依存フレーズの対訳コ
ーパスにおける出現頻度を体型非依存フレーズ内規則３
として記述する。対訳コーパスの全文に対して上記規則
を記述する。図３においては、上述した内容は、フレー
ズ内規則の記述３１により３に記述される。図３の３に
おいて、規則１は、日本語が「＜普通名詞＞」であり、
英語が「＜noun＞」である。品詞の内容としては、日本
語が「今晩」、英語が「tonight」となっている。対訳
コーパスに現れていれば、「明日」、「tomorrow」等も
規則１に記述されるものである。

【００２３】さらに、各フレーズ内規則の共起関係を体
型非依存フレーズ間規則４として記述する。たとえば、
共起関係をフレーズbi-gramとして規則化する場合は、
各体型非依存フレーズの隣接頻度を記述しておく。

【００２４】上述した内容は、図３において、フレーズ
間規則の記述３２が、２８を記述することを意味する。
２８がフレーズbi-gramの例である。規則番号対が例え
ば「（規則１）（規則２）」となっており、その出現頻
度が４となっている。これは対訳コーパスから学習する
過程で、規則１と規則２が文中にならんで出現する回数
が４回あったことを意味する。規則２と規則３が文中で
ならんで出現する回数は２８の例では６回あったことに
なる。

【００２５】さらに、各体型非依存フレーズ間の構文構
造も体型非依存フレーズ間規則４に記述しておく。これ
は図３において、フレーズ間規則の記述３２が２９を記
述することである。つまりフレーズ間規則の記述３２
が、日本語と英語で体型非依存フレーズが現れる順序が
違うので、順序関係の対応をつけるために２５で言語構
造をツリー状にして対応をとっている。

【００２６】文生成規則５には、上記言語規則３および
４で不足している目的言語規則を記述しておく。たとえ
ば、日英翻訳の場合には、冠詞および不定冠詞規則や三
人称単数化規則などがその内容として記述されている。

【００２７】なお、フレーズ内言語規則３及び／または
フレーズ間言語規則４が本発明の格納手段の例である。

【００２８】通訳の際には、まず発声された原言語音声
はマイクロホン６から入力され音声認識部７に入力され
る。音声認識部では、たとえば、体型非依存フレーズ内
言語規則３として記述されている品詞および単語の混合
列と体型非依存フレーズ間言語規則４としてのフレーズ
bi-gramとにより、時系列に沿って順次認識単語候補が
予測される。予め学習されている音響モデル８と入力音
声との距離値をベースとした音響スコアとフレーズbi-g
ramによる言語スコアとの和を認識スコアとし、Nbest-s
earchにより認識候補である連続単語列が決定される。
このように決定された連続単語列は言語変換部９に入力
される。フレーズ内言語規則３、フレーズ間言語規則４
では、予め原言語と目的言語とが対応しながら規則化さ
れている。言語変換部９では、上記規則を用いて、本連
続単語列は目的言語のフレーズ列に変換され出力され
る。この際、入力された原言語フレーズ列が、既に学習
されたフレーズ間の構文構造に当てはまる場合には、目
的言語のフレーズ列は構文構造に沿って修正された後出
力される。

【００２９】出力された目的言語文は出力文生成１０に
入力され、文法的な不自然さを修正する。例えば、定冠
詞や不定冠詞の付与、代名詞、動詞における３人称化や
複数化や過去形化などの最適化などが行われる。修正後
の目的言語翻訳結果文はたとえばテキストとして出力さ
れる。

【００３０】以上の実施の形態では、音声認識で使用す
る言語規則を学習する際に、原言語と目的言語とがとも
に意味をもつ一かたまりとなった部分を単位として規則
化を行い、この規則の制約に基づいて認識を行うことに
より、入力音声文に未学習部分があったり、音声認識が
一部誤りを起こしても、全文に対する翻訳結果が全く出
力されないという問題点を解決し、正しく認識された部
分については、適切な翻訳結果を出力できる言語変換装
置を実現できる。

【００３１】なお、本実施の形態では、言語変換装置の
１つの例として通訳装置を例にあげて説明したが、これ
は他の言語変換装置、例えばくだけた発話文を書き言葉
のようなテキスト文に変換する言語変換装置において
も、同様に使用することが出来る。

【００３２】（第２の実施の形態）次に第２の実施の形
態について図面を参照しながら説明する。本実施の形態
でも、第１の実施の形態同様、通訳装置を用いて説明す
る。図２は本実施の形態の通訳装置のブロック図であ
る。

【００３３】本実施の形態の通訳装置は、まず通訳する
前に、予め言語規則作成部１１で対訳コーパスや対訳単
語辞書を有している学習データベース１から発声文の原
言語及び目的言語のフレーズ内言語規則１２、フレーズ
間言語規則１３を学習する。学習される規則は、第１の
実施の形態における言語規則の学習と同様である。次に
学習された言語規則の最適化を行う。最適化の例を図４
に示す。

【００３４】まず、学習された体型非依存フレーズにお
いて、目的言語フレーズが同じであるフレーズを同カテ
ゴリーとしてまとめる。図４において、１２は言語規則
であり、規則間距離算出１４で、３３のようにカテゴリ
ーとしてまとめる。規則１、規則２、規則３は目的言語
規則が「I'd like to」と同じであるので、同カテゴリ
ーになる。また、規則４は、目的言語規則が「please」
となっているので、規則１、規則２、規則３とは別のカ
テゴリーに分類される。次に同カテゴリーに含まれる原
言語フレーズ間の音響的距離を規則間距離算出部１４で
算出する。図４において、１５が原言語フレーズ間の音
響的距離を算出した例である。１５では、規則１と規則
２の距離は７となっており、規則１と規則３の距離は２
となっている。

【００３５】同カテゴリー規則における原言語フレーズ
の音響的距離は次のように算出する。まず、カテゴリー
内の全ての目的言語フレーズにおける混合列の品詞部分
に、同品詞であれば同じ単語を当てはめ、全ての混合列
を単語列に変換する。次に各単語列の発音が類似してい
るかを調べるために、各単語列の文字列の違いに対する
距離を、（数１）を用いて算出し、規則間距離テーブル
１５に記述する。ｎ個の単語からなるフレーズＸ＝[ x
1,x2,x3,...xn]（ｘは各単語）とｍ個の単語からなるフ
レーズＹ＝[ y1,y2,y3,..ym]との間の距離をD(Xn,Ym)と
して、

【００３６】

【数１】

【００３７】次に最適規則作成部１６で、距離値が一定
値以内であるフレーズの中で、最も出現数の多い規則の
みを残し、他の規則を消去する。たとえば、図４の例で
は、上記一定値を２とした場合、３３において、同カテ
ゴリーである規則１と規則３との規則間距離は２であ
り、上記一定値２以下である。従って、この２つの規則
の出現頻度の多い規則１を採用し、規則３を規則から削
除する。それに合わせて出現数も書き換える。

【００３８】フレーズ内言語規則１２に書かれている全
ての規則に対して上記最適規則化を行った後、消去され
なかった言語規則のみをフレーズ内最適言語規則１７と
して保管する。最適化された規則に従い、フレーズ間規
則１３の中の除去された規則を採用した規則で書き換
え、合わせて出現数も修正する。図４において、最適規
則作成１６により規則３は削除され、規則１として１本
化される。それにあわせて、規則１の出現数は、１７の
ように削除された規則３との和である１５となってい
る。

【００３９】文生成規則５には、コーパスから作成され
た上記言語規則で不足している目的言語規則を記述して
おく。たとえば、日英翻訳の場合には、冠詞および不定
冠詞規則や三人称単数化規則などがその内容として記述
されている。

【００４０】通訳の際には、まず発声された原言語音声
はマイクロホン６から入力され音声認識部７に入力され
る。音声認識部では、たとえば、体型非依存フレーズ内
言語規則１７として記述されている品詞および列単語の
混合列と体型非依存フレーズ間言語規則１８としてのフ
レーズ隣接頻度とにより、時系列に沿って順次認識単語
候補が予測される。予め学習されている音響モデル８と
入力音声との距離値をベースとした音響スコアとフレー
ズbi-gramによる言語スコアとの和を認識スコアとし、N
best-searchにより認識候補である連続単語列が決定さ
れる。このように決定された連続単語列は言語変換部９
に入力される。言語規則１７、１８では、予め原言語と
目的言語とが対応しながら規則化されている。言語変換
部９では、上記規則を用いて、本連続単語列は目的言語
のフレーズ列に変換され出力される。この際、入力され
た原言語フレーズ列が、既に学習されたフレーズ間の構
文構造に当てはまる場合には、目的語のフレーズ列は構
文構造に沿って修正された後出力される。

【００４１】出力された目的言語文は出力文生成部１０
に入力され、文法的な不自然さを修正する。たとえば、
定冠詞や不定冠詞の付与、代名詞、動詞における３人称
化や複数化や過去形化などの最適化などが行われる。修
正後の目的言語翻訳結果文はたとえばテキストとして出
力される。

【００４２】以上の実施の形態では、音声認識で使用す
る言語規則を学習する際に、原言語と目的言語とがとも
に意味をもつ一かたまりとなった部分を単位として規則
化を行った後、規則化されている目的言語部分が同じで
ある原言語フレーズが音響的に類似している場合には、
類似している中から最も出現頻度の高い規則のみを採用
し残りの規則を消去することにより、なるべく言語規則
の性能を落とさずに、体型非依存フレーズを単位にする
ことによる規則数の増加を押さえ、従って高性能な認識
及び言語変換を可能にする通訳装置を実現するものであ
る。なお、本実施の形態では、言語変換装置の１つの例
として通訳装置を例にあげて説明したが、これは他の言
語変換装置、例えばくだけた発話文を書き言葉のような
テキスト文に変換する言語変換装置においても、同様に
使用することが出来る。

【００４３】（実施の形態３）本実施の形態では、言語
変換装置の一例として、従来例同様、異なる言語間の変
換を行う通訳装置を用いて説明する。図５は本実施の形
態の通訳装置のブロック図である。

【００４４】なお、本実施の形態のうち、対訳コーパス
１０１、内容語定義表１０３、対訳単語辞書１０７、形
態素解析部１０２、品詞化部１０４、フレーズ抽出部１
０５、フレーズ決定部１０６は、対訳フレーズ間規則表
１０８、対訳フレーズ辞書１０９は、本発明の言語変換
規則作成装置の例である。また、本実施の形態の対訳フ
レーズ辞書１０９は本発明の請求項６記載のフレーズ辞
書の例である。

【００４５】本実施の形態の通訳装置は、まず通訳する
前に、形態素解析部１０２で対訳コーパス１０１内の原
言語文の形態素解析を行うことで原言語文のみ品詞タグ
が付与された対訳コーパスを作成する。たとえば、図６
の１２０の「部屋の予約をお願いしたいんですが」の発
声文例では、１２１のような品詞タグが原言語文に与え
られる。次に、品詞化部１０４で、上記コーパスの品詞
タグ付き原言語文において、一部の単語名を品詞名に置
きかえた品詞化対訳コーパスを作成する。この際に品詞
名に変換される単語は以下の条件を満たすものとする。（１）内容語テーブルに記載の品詞に対応する単語であ
る。（２）対訳単語辞書に登録されている単語で、対訳単語
辞書の目的言語訳に相当する単語が、コーパス内の相当
する目的言語対訳文に存在する。

【００４６】図６の内容語定義表１０３の例では、内容
語テーブルに記載されている一般名詞、さ変名詞、動詞
の中で、対訳単語辞書１０７に登録されている「部屋」
と「予約」のみが品詞化され、１２２のようにこれらの
単語を品詞名に置き換えたコーパスが作成される。さら
に、相当する目的言語対訳文内の単語名も１２３のよう
に日本語品詞名に置き換える。

【００４７】次に、上記の一部の内容語が品詞名に置き
換えられたコーパスについて、フレーズ抽出部１０５
は、原言語文、目的言語文別々に、各単語または品詞の
２連鎖出現頻度（以後 bi-gramと呼ぶ）を算出する。算
出式を（数２）に示す。

【００４８】

【数２】

【００４９】コーパス内の全原言語文及び目的言語文を
対象にbi-gramを算出した後、フレーズ抽出部５で、最
も出現頻度の高かった２単語または品詞対を１つの単語
とみなして連結し、再度bi-gramを算出する。これによ
り、たとえば頻度高く隣接する「お」「願い」、「願
い」「し」、「し」「ます」などの単語対が連結され、
「お願いします」というフレーズ候補が形成される。目
的言語では「I'd」「like」、「like」「to」の単語対
が連結される。全原言語文及び目的言語文別々に、以上
の連結とbi-gram算出とを、bi-gramの値が全て一定閾値
を超えなくなるまで繰り返す。そして、連結された単語
も含めた個々の単語をフレーズ候補として抽出する。

【００５０】次にフレーズ決定部１０６で、原言語文と
目的言語文対において、各フレーズが同時に出現してい
る頻度を算出する。ｉ番目の原言語フレーズをＪ[ｉ]、
ｊ番目の目的言語フレーズをＥ[ｊ]とすると、フレーズ
Ｊ[ｉ]とＥ[ｊ]との共起頻度Ｋ[ｉ，ｊ]は、算出式を
（数３）にて算出される。

【００５１】

【数３】

【００５２】たとえば、図７の例では、フレーズ列とし
て記述された３つの対訳文１３０のうち、原言語フレー
ズの「お願いします」と目的言語フレーズの「I'd like
to」との共起頻度は２/（２＋３）、「したいんです
が」と目的言語フレーズの共起頻度は１/ (１＋３)とな
る。この頻度が一定値以上のフレーズ対を対訳フレーズ
として決定し、頻度と共にフレーズ番号を付けて対訳フ
レーズ辞書１０９に登録する。さらに、対訳フレーズと
して決定されなかったフレーズ候補の中で、既に品詞化
されている単語は、それ単独で対訳フレーズとして対訳
フレーズ辞書１０９に登録する。それ以外の部分は、対
訳対の中で各々の単語列どうしを一対としてフレーズ辞
書に登録する。

【００５３】たとえば、図７の例では、１３１のように
対訳フレーズ辞書１０９に登録される。

【００５４】このようにして、フレーズ登録を行なった
後、一文に共起するフレーズ番号を記録し、フレーズ番
号対として対訳フレーズ間規則表１０８に登録する。図
７の例では１３２となる。

【００５５】また、上記フレーズ番号対のフレーズbi-g
ramを求め、これも対訳フレーズ間規則表１０８に記録
する。すなわち、原言語コーパスを、対訳フレーズ辞書
に登録されたフレーズ番号列で表し、フレーズ番号で表
されたコーパスを用いてフレーズbi-gramを求め、これ
も対訳フレーズ間規則表８に記録する。フレーズiに続
くフレーズjの出現確立を表すフレーズbi-gramは（数
４）で表される。

【００５６】

【数４】

【００５７】例えば図７の１３２では、例えばフレーズ
３とフレーズ１のフレーズbi-gramを求める。またフレ
ーズ４、フレーズ５、フレーズ２のフレーズ間規則に関
してはフレーズ４、フレーズ５及びフレーズ５、フレー
ズ２のbi-gramをそれぞれ求め、対訳フレーズ間規則表
１０８に記録する。

【００５８】通訳の際には、まず発声された原言語音声
は音声認識部１１０に入力される。音声認識部１１３で
は、たとえば、対訳フレーズ辞書１０９にフレーズとし
て記述されている単語のネットワークと対訳フレーズ間
規則表１０８にて記述されているフレーズbi-gramとに
より、時系列に沿って順次認識単語候補が予測される。
予め学習されている音響モデル１１３と入力音声との距
離値をベースとした音響スコアとフレーズbi-gramによ
る言語スコアとの和を認識スコアとし、Nbest-searchに
より認識候補である連続単語列が決定される。

【００５９】認識された連続単語列は、言語変換部１１
１に入力される。言語変換部１１１では、入力された連
続単語列を対訳フレーズ辞書１０９内のフレーズ列に変
換し、各フレーズ列に相当するフレーズ間規則を探索す
る。そして、各フレーズの対訳である目的言語フレーズ
と目的言語のフレーズ間規則とから、入力原言語認識結
果文を目的言語文に変換する。

【００６０】このように本実施の形態では、音声認識部
１１０と言語変換部１１１とでともに対訳フレーズ辞書
１０９と対訳フレーズ間規則表１０８が使用される。

【００６１】変換された目的言語文は出力文生成部１１
２に入力され、統語的な不自然さを修正する。たとえ
ば、定冠詞や不定冠詞の付与、代名詞、動詞における３
人称化や複数化や過去形化などの最適化などが行われ
る。修正後の目的言語翻訳結果文はたとえばテキストと
して出力される。

【００６２】以上の実施例では、原言語フレーズと目的
言語フレーズが対応した形で規則を記述しておき、この
フレーズの単位で認識を行ないうことで、入力文の一部
が未知部分文であったり、音声認識が一部誤ったとして
も、正しく認識および解析された部分は適切に処理され
出力される言語変換装置を可能にする。また、原言語文
及び目的言語文各々における単語または品詞の隣接頻度
と、対訳における頻度の高い単語列または品詞列の共起
関係を用いて自動的に対訳フレーズとフレーズ間規則を
決定し、この対訳フレーズ規則を用いて通訳を行うこと
により、なるべく人手をかけずに、自動的に効率よくし
かも品質の高い対訳フレーズ辞書を生成できる言語規則
作成装置を可能とする。

【００６３】なお、本実施の形態では、言語変換装置の
１つの例として通訳装置を例にあげて説明したが、これ
は他の言語変換装置、例えばくだけた発話文を書き言葉
のようなテキスト文に変換する言語変換装置において
も、同様に使用することが出来る。

【００６４】（実施の形態４）本実施の形態も、言語変
換装置の一例として、第３の実施の形態同様、異なる言
語間の変換を行う通訳装置を用いて説明する。図８は本
実施の形態の通訳装置のブロック図である。

【００６５】なお、本実施の形態のうち、対訳コーパス
１０１、内容語定義表１０３、対訳単語辞書１０７、形
態素解析部１０２、品詞化部１０４、フレーズ抽出部１
４２、フレーズ決定部１４３は、対訳フレーズ間規則表
１４５、対訳フレーズ辞書１４４、フレーズ定義表１４
１は、本発明の言語変換規則作成装置の例である。ま
た、本実施の形態の対訳フレーズ辞書１４４は本発明の
請求項６記載のフレーズ辞書の例である。

【００６６】本実施の形態の通訳装置は、まず通訳する
前に、第３の実施の形態同様、形態素解析後、品詞タグ
が付与された対訳コーパスを作成する。

【００６７】次に、フレーズ抽出部１４２で、予めフレ
ーズとして抽出したい単語または品詞列を規則化して記
述してあるフレーズ定義表１４１に従い、規則に相当す
る単語または品詞を連結する。たとえば図９の１４１の
例では、「動詞＋助動詞」や「格助詞＋動詞」などの規
則により、「を＋(動詞)＋たい」が単語として連結され
る。このように、上記の一部の内容語が品詞名に置き換
えられ、さらに上記のような単語または品詞列が連結さ
れ一単語とみなされたコーパスについて、原言語文、目
的言語文別々に、各単語または品詞の２連鎖出現頻度
（以後 bi-gramと呼ぶ）を算出する。算出式は（数２）
と同様である。

【００６８】さらに、bi-gramの値が全て一定閾値を超
えなくなるまで、第３の実施の形態と同等に、処理を繰
り返す。そして、連結された単語も含めた個々の単語を
フレーズ候補として抽出し、フレーズ決定部で、第３の
実施の形態と同様に対訳フレーズ辞書１４４と対訳フレ
ーズ間規則表１４５を作成する。図９の１５１はフレー
ズ定義表１４１に従って単語または品詞が連結されたコ
ーパスの例であり、１５２が作成された対訳フレーズ辞
書１４４の例である。

【００６９】通訳の際の動作も第３の実施の形態と同様
である。

【００７０】以上の実施の形態では、予め定義されてい
るフレーズとみなしたい単語または品詞列の規則に従っ
て単語または品詞を連結した後、原言語文及び目的言語
文各々における単語または品詞の隣接頻度と、対訳にお
ける頻度の高い単語列または品詞列の共起関係を用いて
自動的に対訳フレーズとフレーズ間規則を決定し、この
対訳フレーズ規則を用いて言語または文体変換とを行う
ことにより、人手を最小限度に押さえた範囲で、さらに
効率よく品質の高い対訳フレーズ辞書を生成できる言語
変換規則作成装置を提供することが出来る。

【００７１】なお、本実施の形態の対訳フレーズは、本
発明の対応するフレーズの例である。

【００７２】さらに、本実施の形態では、言語変換装置
の１つの例として通訳装置を例にあげて説明したが、こ
れは他の言語変換装置、例えばくだけた発話文を書き言
葉のようなテキスト文に変換する言語変換装置において
も、同様に使用することが出来る。

【００７３】（実施の形態５）第３の実施の形態では、
言語規則を構築する際に、コーパスの一部の単語を品詞
化することで、より一般的で品質の高い規則の構築を実
現しているが、品詞化の代わりに意味コード化すること
でも同様の効果が期待できる。以下に図１０を参照しな
がら、本実施の形態を説明する。本実施の形態でも、異
なる言語間の変換を行う通訳装置を用いて説明する。

【００７４】なお、本実施の形態のうち、対訳コーパス
２０１、分類語彙表２１６、対訳単語辞書２０７、形態
素解析部２０２、意味コード化部２１５、フレーズ抽出
部２０５、フレーズ決定部２０６は、対訳フレーズ間規
則表２０８、対訳フレーズ辞書２０９は、本発明の言語
変換規則作成装置の例である。また、本実施の形態の対
訳フレーズ辞書２０９は本発明の請求項６記載のフレー
ズ辞書の例である。

【００７５】本実施の形態の通訳装置は、第３の実施の
形態同様、形態素解析部２０２で対訳コーパス２０１内
の原言語文の形態素解析を行うことで品詞タグが原言語
文に与えられる。次に、意味コード化部２１５で、原言
語文の形態素列において、各形態素と分類語彙表２１６
に書かれている単語とを比較し、分類語彙表２１６で意
味コードが与えられている単語と一致した形態素につい
ては、形態素名を意味コードに置きかえることで、入力
形態素列を一部の形態素が意味コード化された形態素列
に変換する。この際に意味コード化される形態素には以
下の条件を満たすものとする。（条件）対訳単語辞書に
登録されている単語で、対訳単語辞書の目的言語訳に相
当する単語が、コーパス内の相当する目的言語対訳文に
存在する。

【００７６】図１１の例では、対訳単語辞書に登録され
ておりしかも分類語彙表でコードが与えられている「部
屋」と「予約」のみが意味コード化され、２１３２のよ
うにこれらの形態素を意味コードに置き換えた形態素列
が作成される。さらに、相当する目的言語対訳文内の単
語名も２１３３のように意味コードに置き換える。

【００７７】次に、上記の一部の内容語が意味コードに
置き換えられたコーパスについて、フレーズ抽出部２０
５で、原言語文、目的言語文別々に、各単語または意味
コードの２連鎖出現頻度を算出する。算出式を（数５）
に示す。

【００７８】

【数５】

【００７９】コーパス内の全原言語文及び目的言語文を
対象にbi-gramを算出した後、フレーズ抽出部で、最も
出現頻度の高かった２単語または意味コード対を１つの
単語とみなして連結し、再度bi-gramを算出する。これ
により、たとえば頻度高く隣接する「お」「願い」、
「願い」「し」、「し」「ます」などの単語対が連結さ
れ、「お願いします」というフレーズ候補が形成され
る。目的言語では「I'd」「like」、「like」「to」の
単語対が連結される。

【００８０】全原言語文及び目的言語文別々に、以上の
連結とbi-gram算出とを、bi-gramの値が全て一定閾値を
超えなくなるまで繰り返す。そして、連結された単語も
含めた個々の単語をフレーズ候補として抽出する。

【００８１】以下第３の実施の形態と同様にフレーズ決
定部２０６にて対訳フレーズを決定し、対訳フレーズ辞
書２０９に登録する。さらに第３の実施の形態と同様に
フレーズ間言語規則及びフレーズbi-gramを作成し、対
訳フレーズ間規則表２０８に登録する。

【００８２】通訳の際も第３の実施の形態と同様に動作
する。

【００８３】以上の実施の形態では、原言語フレーズと
目的言語フレーズが対応した形で規則を記述しておき、
このフレーズの単位で認識を行ないうことで、入力文の
一部が未知部分文であったり、音声認識が一部誤ったと
しても、正しく認識および解析された部分は適切に処理
され出力される言語変換装置を可能にする。また、原言
語文及び目的言語文各々における単語または意味コード
の隣接頻度と、対訳における頻度の高い単語列または意
味コード列の共起関係を用いて自動的に対訳フレーズと
フレーズ間規則を決定し、この対訳フレーズ規則を用い
て通訳を行うことにより、なるべく人手をかけずに、自
動的に効率よくしかも品質の高い対訳フレーズ辞書を生
成できる言語規則作成装置を可能とする。

【００８４】なお、本実施の形態では、言語変換装置の
１つの例として通訳装置を例にあげて説明したが、これ
は他の言語変換装置、例えばくだけた発話文を書き言葉
のようなテキスト文に変換する言語変換装置においても
同様に使用することが出来る。

【００８５】（実施の形態６）第５の実施の形態では、
言語規則を構築する際に、隣接頻度の高い単語または品
詞、意味コードを連結してフレーズを作成していたが、
フレーズを作成した後に、文複雑度を評価することで、
より品質が高く、認識率を保証できるフレーズを形成す
ることができる。

【００８６】以下に図１２を参照しながら、言語変換規
則作成装置の実施の形態を説明する。

【００８７】なお、本実施の形態における対訳フレーズ
辞書は本発明の請求項６記載のフレーズ辞書の例であ
る。

【００８８】先の実施の形態同様、形態素解析後、意味
コード化部２１３で一部の形態素を意味コードに変換し
た対訳コーパスを作成する。さらに、フレーズ抽出部
で、原言語文、目的言語文別々に、各単語または意味コ
ードのbi-gramを算出する。算出式は（数５）と同様で
ある。

【００８９】さらに、bi-gramの値が全て一定閾値を超
えなくなるまで、先の実施の形態と同等に、処理を繰り
返す。そして、連結された単語も含めた個々の単語をフ
レーズ候補として抽出する。

【００９０】上記の処理を行う際に、文複雑度算出部２
１８で、各単語または意味コードのbi-gramを算出し、b
i-gramの値によって連結処理を行う際に、各単語対を連
結した場合と連結しない場合との文複雑度を算出し比較
する。文複雑度は（数６）で算出されるものである。

【００９１】

【数６】

【００９２】比較した結果、フレーズ抽出部２１７で各
単語または意味コードを連結することで文複雑度が増加
するものについては、フレーズ候補から除去する。

【００９３】上記処理でフレーズ候補に残ったフレーズ
を対象に、先の実施の形態と同条件でフレーズを決定
し、対訳フレーズ辞書２０９とフレーズ間規則表２０８
を決定する。

【００９４】以上の実施の形態では、対訳フレーズを決
定する際に、意味コードによる単語クラス化された対訳
コーパスの文複雑度を用いて決定することにより、コー
パスから対訳フレーズを自動的に抽出することを可能と
し、人手をなるべく用いずに、効率よく品質の高い対訳
フレーズ辞書を生成できる。また、文複雑度の尺度が、
音声認識に適切なフレーズかどうかの尺度と密接に関係
があるため、認識精度を保証しながら、自動的にフレー
ズ抽出することが可能となる。

【００９５】なお、本実施の形態では、一部の単語を意
味コード化したコーパスを扱ってフレーズ抽出する例を
説明したが、品詞化したコーパスを扱ってフレーズ抽出
する場合でも同様の効果が期待できる。

【００９６】さらに、第４の実施の形態では、品詞タグ
が付与された対訳コーパスを扱ってフレーズ定義表によ
りフレーズを抽出する例を説明したが、第５の実施の形
態で説明したように一部の単語を意味コード化したコー
パスを扱って、フレーズ定義表によりフレーズを抽出す
る場合でも同様の効果が期待できる。

【００９７】さらに、第１〜５の実施の形態では言語変
換装置は、音声認識部、言語変換部、出力文生成部から
構成されるとして説明したが、これに限らない。図１３
に示すように、出力文生成部２１２が出力した翻訳結果
文を音声合成する音声合成部を設けても構わない。そし
てこの音声合成部は、音声合成する際に音声認識部２１
０、言語変換部２１１で用いられたのと同じ対訳フレー
ズ間規則表２０８、対訳フレーズ辞書２０９を用いて音
声合成を行う。このようにすれば入力音声文に未学習部
分があったり、音声認識が一部誤りを起こしても、全文
に対する音声合成結果が全く出力されないという問題点
を解決し、正しく認識された部分については、適切な音
声を出力できることが期待できる。

【００９８】さらに、本発明の言語変換装置または言語
変換規則作成装置の各構成要素の全部または一部の機能
を専用のハードウェアを用いて実現しても構わないし、
またコンピュータのプログラムによってソフトウェア的
に実現しても構わない。

【００９９】さらに、本発明の言語変換装置または言語
変換規則作成装置の各構成要素の全部または一部の機能
をコンピュータに実行させるためのプログラムを格納し
ていることを特徴とするプログラム記録媒体も本発明に
属する。

【０１００】

【発明の効果】以上説明したところから明らかなよう
に、本発明は、必ず目的言語文に変換可能な認識結果を
出力でき、従って、入力文の一部が未知部分文であった
り、音声認識が一部誤ったとしても、正しく認識および
解析された部分は適切に処理され出力されることを可能
にする言語変換装置及びプログラム記録媒体を提供する
ことが出来る。

【０１０１】また、本発明は、入力音声文に未学習部分
があったり、音声認識が一部誤りを起こしても、正しく
認識され適切な解析規則が当てはまった部分のみの変換
が可能であり、部分的な変換結果を必ず出力することを
可能にする言語変換装置及びプログラム記録媒体を提供
することが出来る。

【図面の簡単な説明】

【図１】本発明の第１の実施の形態における言語変換装
置の構成を示すブロック図

【図２】本発明の第２の実施の形態における言語変換装
置の構成を示すブロック図

【図３】本発明の第１の実施の形態における言語規則の
作成を説明する図

【図４】本発明の第２の実施の形態における最適言語規
則の作成を説明する図

【図５】本発明の第３の実施の形態における言語変換装
置及び言語規則作成装置の構成を示すブロック図

【図６】本発明の第３の実施の形態における言語変換規
則の作成を説明する図

【図７】本発明の第３の実施の形態における対訳フレー
ズ間規則表と対訳フレーズ辞書の例を示す図。

【図８】本発明の第４の実施の形態における言語変換装
置及び言語規則作成装置の構成を示すブロック図

【図９】本発明の第４の実施の形態におけるフレーズ定
義表の例を説明する図

【図１０】本発明の第５の実施の形態における言語変換
装置及び言語規則作成装置の構成を示すブロック図

【図１１】本発明の第５の実施の形態における言語規則
の作成を説明する図

【図１２】本発明の第６の実施の形態における言語変換
規則作成装置の構成を示すブロック図

【図１３】音声合成部を有する言語変換装置の構成例を
示すブロック図

【図１４】従来の言語変換装置で用いられる言語規則の
例を示す図

【図１５】従来の言語変換装置の構成を示すブロック図

【符号の説明】

１対訳コーパス２言語規則再生部３フレーズ内言語規則４フレーズ間言語規則５文生成規則６マイクロフォン７音声認識部８音響モデル９言語変換部１０出力文生成部１０１対訳コーパス１０２形態素解析部１０３内容語定義表１０４品詞化部１０５フレーズ抽出部１０６フレーズ決定部１０７対訳単語辞書１０８対訳フレーズ間規則表１０９対訳フレーズ辞書１１０音声認識１１１言語変換１１２出力文生成１１３音響モデル１１４文生成規則

Claims

【特許請求の範囲】

【請求項１】音声またはテキストで入力される言語変
換の対象となる文（以下、原言語文と呼ぶ、これに対応
して言語変換された文を目的言語文と呼ぶ）と、目的言
語文とが対になった学習用データベース（以下、対訳コ
ーパスと呼ぶ）から単語または単語列に対する文法的ま
たは意味的制約規則を学習して得られた言語規則を格納
する格納手段と、格納された前記言語規則を用いて入力音声の音声認識を
行い、言語変換の対象となる文で認識結果を出力する音
声認識部と、前記音声認識部で用いられたのと同じ前記言語規則を用
いて言語変換の対象となる文を言語変換された文に変換
する言語変換部とを備えたことを特徴とする言語変換装
置。
【請求項２】前記言語規則は、言語変換の対象となる
文と、変換された文とが共に意味的なまとまりを形成す
る部分（体型非依存フレーズと呼ぶ）に分割し、前記体
型非依存フレーズ内の言語規則と前記体型非依存フレー
ズ間の言語規則とを分けて規則化されて作られるもので
あることを特徴とする請求項１記載の言語変換装置。
【請求項３】前記言語規則は、前記体型非依存フレー
ズ内の文法的または意味的規則と前記体型非依存フレー
ズ間の共起または連接関係を規則化されて作られるもの
であることを特徴とする請求項２記載の言語変換装置。
【請求項４】前記言語変換部で用いられたのと同じ言
語規則を用いて前記言語変換された文を音声合成する音
声合成部とを備えたことを特徴とする請求項１記載の言
語変換装置。
【請求項５】前記言語規則のうち、目的言語文が同じ
である言語規則を同じカテゴリーとしてまとめられた言
語規則群に対して、前記言語規則群に含まれる言語規則
の言語変換の対象となる文の音響的規則間距離を算出す
る規則間距離算出部と、音声認識の認識レベルを上げるために、算出された前記
距離が近い言語規則どうしをマージすることで前記規則
群の最適化を行う最適規則作成部と、を備えたことを特
徴とする請求項１〜４のいずれかに記載の言語変換装
置。
【請求項６】請求項１〜５のいずれかに記載の言語変
換装置の各構成要素の機能をコンピュータに実行するた
めのプログラムを格納していることを特徴とするプログ
ラム記録媒体。