JP2000242645A - 音声翻訳装置、音声翻訳方法及び音声翻訳制御プログラムを記録した記録媒体 - Google Patents

音声翻訳装置、音声翻訳方法及び音声翻訳制御プログラムを記録した記録媒体

Info

Publication number
JP2000242645A
JP2000242645A JP11046944A JP4694499A JP2000242645A JP 2000242645 A JP2000242645 A JP 2000242645A JP 11046944 A JP11046944 A JP 11046944A JP 4694499 A JP4694499 A JP 4694499A JP 2000242645 A JP2000242645 A JP 2000242645A
Authority
JP
Japan
Prior art keywords
sentence
speech
speech recognition
feature vector
translation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP11046944A
Other languages
English (en)
Inventor
Masanori Omote
雅則 表
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP11046944A priority Critical patent/JP2000242645A/ja
Publication of JP2000242645A publication Critical patent/JP2000242645A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 音声認識処理がそれほど高性能でなくても、
ユーザ同士で円滑でかつ十分なコミュニケーションをと
ることを実現する。 【解決手段】 履歴情報記憶部15は、文生成部12が
出力する修正結果の文章を次々と蓄積し、履歴情報を生
成する。履歴情報記憶部15は、かかる履歴情報から要
約を生成し、複数の翻訳結果と要約とのつじつまの合う
翻訳結果の順序づけ又は選択を行い、このような順序づ
け又は選択された翻訳結果と要約とを結果集約提示部1
6に供給する。結果集約提示部16は、翻訳結果と共
に、今まで翻訳された内容の要約を表示して、ユーザに
対して結果を提示する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、入力された音声を
他の言語に翻訳する音声翻訳装置、音声翻訳方法及び音
声翻訳制御プログラムを記録した記録媒体に関する。
【0002】
【従来の技術】今日、音声認識技術の進歩に伴い、認識
した音声を他の言語に翻訳する音声翻訳装置が開発され
ている。音声翻訳装置は、一般に、様々のユーザに対応
することができるように、不特定話者対応の認識エンジ
ンを使用している。
【0003】このような音声翻訳装置100は、図3に
示すように、例えばマイクからなる入力部102と、音
声から特徴を抽出する特徴抽出部103と、音声認識照
合部104と、音韻などの関係を表す音響モデルを記憶
する音響モデル記憶部105と、単語と音響モデルの対
応を表す単語辞書を記憶する単語辞書記憶部106と、
単語の接続を表す文法(一般的に統計言語モデルが使用
される。)を記憶する文法記憶部107とを備える。
【0004】入力部102は、入力される音声を音声信
号に変換し、さらにディジタル化して特徴抽出部103
に供給する。特徴抽出部103は、音声信号から特徴ベ
クトル列を算出し、これを音声認識照合部104に供給
する。
【0005】音声認識照合部104は、上記特徴ベクト
ル、音響モデル記憶部105に記憶されている音響モデ
ル、単語辞書記憶部106に記憶されている単語辞書、
文法記憶部107に記憶されている文法を用いて、どの
単語列が発声されたを照合する。
【0006】また、上記音声翻訳装置100は、音声認
識照合部104からの照合結果が供給される翻訳処理部
108と、変換情報記憶部109と、文修正部110
と、誤りのある文章を修正するための修正ルールに関す
る情報が記憶されている修正情報記憶部111と、例文
の置き換えに関する情報が記憶されている文法情報記憶
部112と、例えばCRT(Cathode Ray Tube)やLC
D(Liquid Crystal Display)からなる結果提示部11
3とを備える。
【0007】翻訳処理部108は、上記照合結果につい
て、多数の例文情報を記憶する変換情報記憶部109を
用いて粗い翻訳を実行し、この翻訳結果を文修正部11
0に供給する。文修正部110は、修正情報記憶部11
1や文法情報記憶部112に記憶されている情報を用い
て、翻訳処理部108の翻訳結果の細かい修正を実行す
る。
【0008】そして、結果提示部113は、文修正部1
10の修正結果を表示することによって、入力音声の翻
訳結果を表示している。
【0009】
【発明が解決しようとする課題】このような音声翻訳装
置100は、一の入力された音声に対して、一の翻訳結
果しか提示することができない。したがって、音声翻訳
装置100は、その音声翻訳処理の性能が低いときに
は、ユーザに対して誤った翻訳結果を提示してしまう可
能性がある。これでは、上記音声翻訳装置100を用い
てコミュニケーションを行っている場合には、うまくコ
ミュニケーションをとることができないことがある。
【0010】また、音声翻訳装置100は、「私は〜」
という音声が入力されてそれを英語に翻訳するとき
は、”I.....”としか翻訳することができない。この
場合、周囲の状況から分かる補足内容を表現することが
困難である。
【0011】さらに、上記音声翻訳装置100は、一文
の音声が入力されると一文の翻訳結果しか表示せず、以
前に表示していた翻訳結果を消去していた。一方、一般
に会話の際には、既に話しをした内容から現在相手が話
しをしている内容を推測する傾向がある。しかし、例え
ばユーザが以前の翻訳結果の内容を忘れてしまったとき
には、つじつまの合わないコミュニケーションがなって
しまう可能性があり、ユーザインターフェースを向上さ
せる必要があった。
【0012】本発明は、このような実情に鑑みて提案さ
れたものであり、音声認識処理の性能が低くても十分で
かつ円滑なコミュニケーションをとることができる音声
翻訳装置、音声翻訳方法及び音声翻訳制御プログラムを
記録した記録媒体を提供することを目的とする。
【0013】
【課題を解決するための手段】上述の課題を解決するた
めに、本発明に係る音声翻訳装置は、入力された音声の
特徴を抽出して特徴ベクトルを出力する特徴抽出手段
と、特徴抽出手段からの特徴ベクトルに対して音声認識
用の複数の照合情報をそれぞれ照合して音声認識を行
い、入力された音声についての複数の候補文章を出力す
る音声認識照合手段と、音声認識照合手段からの複数の
候補文章を、入力された音声の言語と異なる言語の文章
に翻訳する翻訳処理手段と、翻訳処理手段で翻訳された
複数の候補文章を同時に出力する出力手段とを備える。
【0014】本発明に係る音声翻訳方法は、入力された
音声から特徴ベクトルを抽出し、抽出された特徴ベクト
ルに対して音声認識用の複数の照合情報をそれぞれ照合
して音声認識を行い、入力された音声についての複数の
候補文章を生成し、生成された複数の候補文章を入力さ
れた音声の言語と異なる言語の文章に翻訳し、翻訳され
た複数の候補文章を同時に出力することを特徴とする。
【0015】本発明に係る音声翻訳制御プログラムを記
録した記録媒体は、入力された音声から特徴ベクトルを
抽出し、抽出された特徴ベクトルに対して音声認識用の
複数の照合情報をそれぞれ照合して音声認識を行い、入
力された音声についての複数の候補文章を生成し、生成
された複数の候補文章を入力された音声の言語と異なる
言語の文章に翻訳し、翻訳された複数の候補文章を同時
に出力する音声翻訳制御プログラムが記録されているこ
とを特徴とする。
【0016】本発明に係る音声翻訳装置は、入力された
音声の特徴を抽出して特徴ベクトルを出力する特徴抽出
手段と、特徴抽出手段からの特徴ベクトルに対して、音
声認識用の複数の照合情報をそれぞれ照合して音声認識
を行う音声認識照合手段と、音声認識照合手段で音声認
識の行われた文章を、入力された音声の言語と異なる言
語の文章に翻訳する翻訳処理手段と、翻訳処理手段によ
り翻訳された文章の1人称を3人称に修正する文修正手
段と、文修正手段で修正された文章を出力する出力手段
とを備える。
【0017】本発明に係る音声翻訳方法は、入力された
音声から特徴ベクトルを抽出し、抽出された特徴ベクト
ルに対して、音声認識用の複数の照合情報をそれぞれ照
合して音声認識を行い、音声認識の行われた文章を入力
された音声の言語と異なる言語の文章に翻訳し、翻訳さ
れた文章の1人称を3人称に修正し、修正された文章を
出力することを特徴とする。
【0018】本発明に係る音声翻訳制御プログラムを記
録した記録媒体は、入力された音声から特徴ベクトルを
抽出し、抽出された特徴ベクトルに対して、音声認識用
の複数の照合情報をそれぞれ照合して音声認識を行い、
音声認識の行われた文章を入力された音声の言語と異な
る言語の文章に翻訳し、翻訳された文章の1人称を3人
称に修正し、修正された文章を出力する音声翻訳制御プ
ログラムが記録されたことを特徴とする。
【0019】本発明に係る音声翻訳装置は、入力された
音声の特徴を抽出して特徴ベクトルを出力する特徴抽出
手段と、特徴抽出手段からの特徴ベクトルに対して、音
声認識用の複数の照合情報をそれぞれ照合して音声認識
を行う音声認識照合手段と、音声認識照合手段で音声認
識の行われた文章を、入力された音声の言語と異なる言
語の文章に翻訳する翻訳処理手段と、翻訳処理手段によ
り翻訳された文章の誤記を修正する文修正手段と、文修
正手段で修正された文章を要約して履歴情報として次々
に記憶する履歴情報記憶手段と、文修正手段で修正され
た文章と、履歴情報記憶手段に記憶されている履歴情報
とを出力する出力手段とを備える。
【0020】本発明に係る音声翻訳方法は、入力された
音声から特徴ベクトルを抽出し、特徴された特徴ベクト
ルに対して、音声認識用の複数の照合情報をそれぞれ照
合して音声認識を行い、音声認識の行われた文章を入力
された音声の言語と異なる言語の文章に翻訳し、翻訳さ
れた文章の誤記を修正し、修正された文章を要約して履
歴情報として次々に記憶手段に記憶し、文修正手段で修
正された文章と、記憶手段に記憶されている履歴情報と
を出力することを特徴とする。
【0021】本発明に係る音声翻訳制御プログラムを記
録した記録媒体は、入力された音声から特徴ベクトルを
抽出し、特徴された特徴ベクトルに対して、音声認識用
の複数の照合情報をそれぞれ照合して音声認識を行い、
音声認識の行われた文章を、入力された音声の言語と異
なる言語の文章に翻訳し、翻訳された文章の誤記を修正
し、修正された文章を要約して履歴情報として次々に記
憶手段に記憶し、文修正手段で修正された文章と、記憶
手段に記憶されている履歴情報とを出力する音声翻訳制
御プログラムが記録されたことを特徴とする。
【0022】
【発明の実施の形態】以下、本発明の実施の形態につい
て、図面を参照しながら説明する。本発明は、例えば図
1に示す構成の音声翻訳装置1に適用することができ
る。なお、上記音声翻訳装置1の動作内容を示すフロー
チャートを図2に示す。
【0023】上記音声翻訳装置1は、音声が入力される
入力部2と、入力された音声の特徴を抽出する特徴抽出
部3と、音声認識照合により候補文章の生成する第1の
音声認識照合部4と、HMM( Hidden Markov Model)
モデルが記憶されている音響モデル記憶部5と、単語の
接続関係を表す文法等を記憶する第1の文法記憶部6
と、単語と音響モデルの対応を表す単語辞書を記憶する
単語辞書記憶部7と、第1の音声認識照合部4で音声認
識された候補文章をさらに絞るための照合を行う第2の
音声認識照合部8と、詳細な文法情報を記憶する第2の
文法記憶部9とを備える。
【0024】なお、上記音声翻訳装置1は、音声翻訳制
御用プログラムが記録されている図示しないROM(Re
ad Only Memory)を備えている。そして、各回路は、上
記制御プログラムに従って所定の動作を実行する。ま
た、上記音声翻訳制御プログラムは、当該制御プログラ
ムが記録された記録媒体からインストールしてもよいの
は勿論である。
【0025】入力部2は、例えばマイクからなり、入力
された音声を音声信号に変換し、さらにこれをアナログ
/ディジタル変換して(図2に示すステップST1)、
特徴抽出部3に供給する。
【0026】特徴抽出部3は、上記音声信号の周波数分
析を行って音声信号のパワースペクトルを得る。そし
て、音声区間ではない信号区間をノイズ区間としてこの
ノイズ区間のスペクトルを求めておいて、音声区間でこ
のノイズスペクトルを引く処理を行う。さらに、周波数
分析結果のパワースペクトルをそのまま持っていたので
はパラメータの次元が多いことから、適当な次元に圧縮
処理して特徴量たる特徴ベクトルを時系列的に抽出する
(ステップST2)。
【0027】第1の音声認識照合部4は、上記特徴ベク
トルについて、音響モデル記憶部5、第1の文法記憶部
6、単語辞書記憶部7に記憶されている情報を用いて、
どの単語列が発声されたかの音響的照合を行う(ステッ
プST3)。
【0028】ここで、第1の文法記憶部6及び第2の文
法記憶部9は、統計的(ストキャスティック:stochast
ic)言語モデルを記憶している。これにより、例えば、
Head-Driven Phrase Structure Grammar等の汎用の言語
解析理論を利用することができる。単語辞書記憶部7
は、名詞、動詞、接続詞等の様々の単語に関する情報を
記憶しているものである。
【0029】第2の音声認識照合部8は、単語辞書記憶
部7の単語辞書と第2の文法記憶部9に記憶されている
文法情報とを用いて、第1の音声認識照合部4の音響照
合結果との文法的照合を行う(ステップST4)。これ
により、第1の音声認識照合部4の認識結果をさらに詳
細に選別し、複数の候補文章を後述する変換処理部10
に供給する。なお、候補文章は、音声認識処理時の認識
スコアの高いものが選択される。また、上記複数の候補
の文章の各単語には、その意味を示す意味情報が付加さ
れている。
【0030】また、上記音声翻訳装置1は、第2の音声
認識照合部8の音声認識結果を所定の言語に変換する変
換処理部10と、例文情報や人称を変換するための人称
情報が記憶されている変換・人称情報記憶部11と、言
語変換済みの文章に細やかな修正を行って文を生成する
文生成部12と、詳しい文章を生成するための情報が記
憶されている生成情報記憶部13と、文法に関する情報
が記憶されている文法情報記憶部14と、履歴情報を記
憶する履歴情報記憶部15と、正確に翻訳された文章を
集約してユーザに結果集約提示部16とを備える。
【0031】変換処理部10は、変換・人称情報部11
に記憶されている多数の例文情報を用いて例文検索を行
い(ステップST5)、各候補文章と近似する文章をサ
ーチすることで粗い翻訳を実行する。さらに、変換処理
部10は、上記変換・人称情報部11に記憶されている
人称情報に基づいて、サーチされた文章の1人称を3人
称に変換する変換処理を行って(ステップST6)、こ
の変換処理結果を文生成部12に供給する。
【0032】文生成部12は、生成情報記憶部13に記
憶されている修正情報を用いて粗く翻訳された文章の助
詞等の修正を行ったり(ステップST7)、文法情報記
憶部14に記憶されている文法上の誤りを訂正するため
の情報を用いて既知のミスの修正を施して(ステップS
T8)、この修正処理結果を履歴情報記憶部15に供給
する。
【0033】履歴情報記憶部15は、文生成部12が出
力する修正結果の文章を次々と蓄積し(ステップST
9)、履歴情報を生成する。履歴情報記憶部15は、か
かる履歴情報から要約を生成し(ステップST10)、
複数の翻訳結果と要約とのつじつまの合う翻訳結果の順
序づけ又は選択を行い、このような順序づけ又は選択さ
れた翻訳結果と要約とを結果集約提示部16に供給す
る。
【0034】結果集約提示部16は、例えばCRT(Ca
thode Ray Tube)やLCD(LiquidCrystal Display)
からなり、翻訳結果と共に、今まで翻訳された内容の要
約を表示して、ユーザに対して結果を提示する(ステッ
プST11)。これにより、ユーザは、過去の翻訳結果
を考慮しながら現在の翻訳結果を見ることができるの
で、当該音声翻訳装置1の性能を認識して、相手の会話
内容を判断することができる。
【0035】例えば、入力部2に「駅に行きたいのです
が」という音声が入力された場合について考えてみる。
この場合、ユーザは、入力文として「駅に行きたい」旨
を示している。
【0036】一方、第2の音声認識照合部8は、「駅に
行きたい」の認識スコアに近い認識スコアとして「席に
行きたい」や「敵に行きたい」も認識して、これらを音
声認識候補として変換処理部10に供給する。
【0037】変換処理部10は、これらの入力候補文全
部を3人称で翻訳する。文生成部12は、その程度に関
して翻訳機側の立場を示す助動詞を付加して、複数の翻
訳結果文を出力する。この結果、結果集約提示部16に
提示される翻訳結果文は、例えば以下に示すようなもの
がある。
【0038】a)"He wants to get to the station." b)"He wants to seat himself." c)"He seems to want to seat himself." d)"He might want to see enemies." このとき、履歴情報記憶部15は、例えば認識スコアが
最も高かったもの、a)の文章に基づいて、以下のよう
な要約文を作成して履歴情報として記憶する。
【0039】a)([user1][ask][way to station]) つぎに、入力部2に、"If you would like to follow m
e."という音声が入力された場合について考えてみる。
このとき、結果集約提示部16に提示される翻訳結果文
は、例えば以下に示すものである。
【0040】1.「こちらにきてください、だそうで
す。」 2.「もしきてくれたら、と尋ねています。」 このとき、履歴情報記憶部15は、認識スコアが最も高
かったもの、例えば「2.」の文章に基づいて、以下の
ような要約文を作成して履歴情報として記憶する。
【0041】2.([user2][agree]) そして、履歴情報を結果集約提示部16に提示するとき
は、上記要約文からユーザの利用可能な言語に変換す
る。
【0042】以上のように、上記音声翻訳装置1は、入
力音声文の翻訳結果を複数提示するので、出力側のユー
ザ(出力結果の受信者)は翻訳結果の信頼性を認識する
ことができ、発話者がどのような音声を入力したのかを
容易に想定することができる。
【0043】また、上記音声翻訳装置1は、入力音声文
の1人称を3人称に変換して翻訳するので、入力側のユ
ーザにも出力側のユーザにも当該音声翻訳装置1を別の
エージェントとして意識させることができ、当該音声翻
訳装置1が提示する状況説明を、入力側ユーザの入力音
声文に対する翻訳結果に対して違和感なく分離して提示
することができる。
【0044】さらに、上記音声翻訳装置1は、翻訳結果
を提示する際に、過去の履歴又は要約を提示することに
よって、出力側ユーザは容易に当該音声翻訳装置1の信
頼性を認識することができ、入力側ユーザがどのように
入力したかを過去の履歴等を参考にしながら容易に想定
することができる。
【0045】また、本実施の形態では、結果集約提示部
16はCRTやLCDからなるディスプレイとして説明
したが、例えば翻訳された結果のデータを外部に送信す
る送信回路等、特に限定されるものではない。
【0046】
【発明の効果】以上詳細に説明したように、本発明に係
る音声翻訳装置、音声翻訳方法及び音声翻訳制御プログ
ラムを記録した記録媒体によれば、入力された音声を認
識して複数の候補文章を生成し、候補文章をそれぞれ翻
訳して出力することによって、出力側のユーザは翻訳結
果の信頼性を認識することができ、入力側のユーザがど
のようなことを発話したのかを容易に想定することがで
きる。
【0047】本発明に係る音声翻訳装置、音声翻訳方法
及び音声翻訳制御プログラムを記録した記録媒体によれ
ば、音声認識された文章を翻訳し、翻訳された文章の1
人称を3人称に修正して出力することによって、入力側
のユーザも出力側のユーザも別のエージェントを介して
音声翻訳が行われていると意識させることができ、音声
翻訳処理によってが提示する状況説明を、入力側ユーザ
の入力音声文に対する翻訳結果に対して違和感なく分離
することができる。
【0048】本発明に係る音声翻訳装置、音声翻訳方法
及び音声翻訳制御プログラムを記録した記録媒体によれ
ば、音声認識されて翻訳された文章を要約して履歴情報
として次々に記憶手段に記憶し、音声翻訳された文章と
上記記憶手段に記憶されている履歴情報とを出力するこ
とにより、翻訳結果を提示する際に過去の履歴又は要約
を提示するので、出力側ユーザは容易に当該音声翻訳処
理の信頼性を認識することができ、当該出力側ユーザは
入力側ユーザがどのような発話をしたかを過去の履歴等
を参考にしながら容易に想定することができる。
【0049】すなわち、本発明は、音声認識処理の性能
が低くても十分でかつ円滑なコミュニケーションをとる
ことができるものである。
【図面の簡単な説明】
【図1】本発明を適用した音声翻訳装置の構成を示すブ
ロック図である。
【図2】上記音声翻訳装置の処理手順を示すフローチャ
ートである。
【図3】従来の音声翻訳装置の構成を示すブロック図で
ある。
【符号の説明】
1 音声翻訳装置、2 入力部、3 特徴抽出部、4
第1の音声認識照合部、5 音響モデル記憶部、6 第
1の文法記憶部、7 単語辞書記憶部、8 第2の音声
認識照合部、9 第2の文法記憶部、10 変換処理
部、11 変換・人称情報部、12 文生成部、13
生成情報記憶部、14 文法情報記憶部、15 履歴情
報記憶部、16 結果集約提示部

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 入力された音声の特徴を抽出して特徴ベ
    クトルを出力する特徴抽出手段と、 上記特徴抽出手段からの特徴ベクトルに対して音声認識
    用の複数の照合情報をそれぞれ照合して音声認識を行
    い、入力された音声についての複数の候補文章を出力す
    る音声認識照合手段と、 上記音声認識照合手段からの複数の候補文章を、入力さ
    れた音声の言語と異なる言語の文章に翻訳する翻訳処理
    手段と、 上記翻訳処理手段で翻訳された複数の候補文章を同時に
    出力する出力手段とを備える音声翻訳装置。
  2. 【請求項2】 入力された音声から特徴ベクトルを抽出
    し、 上記抽出された特徴ベクトルに対して音声認識用の複数
    の照合情報をそれぞれ照合して音声認識を行い、入力さ
    れた音声についての複数の候補文章を生成し、 上記生成された複数の候補文章を入力された音声の言語
    と異なる言語の文章に翻訳し、 上記翻訳された複数の候補文章を同時に出力することを
    特徴とする音声翻訳方法。
  3. 【請求項3】 入力された音声から特徴ベクトルを抽出
    し、上記抽出された特徴ベクトルに対して音声認識用の
    複数の照合情報をそれぞれ照合して音声認識を行い、入
    力された音声についての複数の候補文章を生成し、上記
    生成された複数の候補文章を入力された音声の言語と異
    なる言語の文章に翻訳し、上記翻訳された複数の候補文
    章を同時に出力する音声翻訳制御プログラムを記録した
    記録媒体。
  4. 【請求項4】 入力された音声の特徴を抽出して特徴ベ
    クトルを出力する特徴抽出手段と、 上記特徴抽出手段からの特徴ベクトルに対して、音声認
    識用の複数の照合情報をそれぞれ照合して音声認識を行
    う音声認識照合手段と、 上記音声認識照合手段で音声認識の行われた文章を、入
    力された音声の言語と異なる言語の文章に翻訳する翻訳
    処理手段と、 上記翻訳処理手段により翻訳された文章の1人称を3人
    称に修正する文修正手段と、 上記文修正手段で修正された文章を出力する出力手段と
    を備える音声翻訳装置。
  5. 【請求項5】 入力された音声から特徴ベクトルを抽出
    し、 上記抽出された特徴ベクトルに対して、音声認識用の複
    数の照合情報をそれぞれ照合して音声認識を行い、 上記音声認識の行われた文章を入力された音声の言語と
    異なる言語の文章に翻訳し、 上記翻訳された文章の1人称を3人称に修正し、 上記修正された文章を出力することを特徴とする音声翻
    訳方法。
  6. 【請求項6】 入力された音声から特徴ベクトルを抽出
    し、上記抽出された特徴ベクトルに対して、音声認識用
    の複数の照合情報をそれぞれ照合して音声認識を行い、
    上記音声認識の行われた文章を入力された音声の言語と
    異なる言語の文章に翻訳し、上記翻訳された文章の1人
    称を3人称に修正し、上記修正された文章を出力する音
    声翻訳制御プログラムを記録した記録媒体。
  7. 【請求項7】 入力された音声の特徴を抽出して特徴ベ
    クトルを出力する特徴抽出手段と、 上記特徴抽出手段からの特徴ベクトルに対して、音声認
    識用の複数の照合情報をそれぞれ照合して音声認識を行
    う音声認識照合手段と、 上記音声認識照合手段で音声認識の行われた文章を、入
    力された音声の言語と異なる言語の文章に翻訳する翻訳
    処理手段と、 上記翻訳処理手段により翻訳された文章の誤記を修正す
    る文修正手段と、 上記文修正手段で修正された文章を要約して履歴情報と
    して次々に記憶する履歴情報記憶手段と、 上記文修正手段で修正された文章と、上記履歴情報記憶
    手段に記憶されている履歴情報とを出力する出力手段と
    を備える音声翻訳装置。
  8. 【請求項8】 入力された音声から特徴ベクトルを抽出
    し、 上記特徴された特徴ベクトルに対して、音声認識用の複
    数の照合情報をそれぞれ照合して音声認識を行い、 上記音声認識の行われた文章を入力された音声の言語と
    異なる言語の文章に翻訳し、 上記翻訳された文章の誤記を修正し、 上記修正された文章を要約して履歴情報として次々に記
    憶手段に記憶し、 上記文修正手段で修正された文章と、上記記憶手段に記
    憶されている履歴情報とを出力することを特徴とする音
    声翻訳方法。
  9. 【請求項9】 入力された音声から特徴ベクトルを抽出
    し、上記特徴された特徴ベクトルに対して、音声認識用
    の複数の照合情報をそれぞれ照合して音声認識を行い、
    上記音声認識の行われた文章を、入力された音声の言語
    と異なる言語の文章に翻訳し、上記翻訳された文章の誤
    記を修正し、上記修正された文章を要約して履歴情報と
    して次々に記憶手段に記憶し、上記文修正手段で修正さ
    れた文章と、上記記憶手段に記憶されている履歴情報と
    を出力する音声翻訳制御プログラムを記録した記録媒
    体。
JP11046944A 1999-02-24 1999-02-24 音声翻訳装置、音声翻訳方法及び音声翻訳制御プログラムを記録した記録媒体 Withdrawn JP2000242645A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11046944A JP2000242645A (ja) 1999-02-24 1999-02-24 音声翻訳装置、音声翻訳方法及び音声翻訳制御プログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11046944A JP2000242645A (ja) 1999-02-24 1999-02-24 音声翻訳装置、音声翻訳方法及び音声翻訳制御プログラムを記録した記録媒体

Publications (1)

Publication Number Publication Date
JP2000242645A true JP2000242645A (ja) 2000-09-08

Family

ID=12761422

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11046944A Withdrawn JP2000242645A (ja) 1999-02-24 1999-02-24 音声翻訳装置、音声翻訳方法及び音声翻訳制御プログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP2000242645A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8082142B2 (en) 2007-03-14 2011-12-20 Nec Corporation Speech recognition method, speech recognition system and server thereof
US8954333B2 (en) 2007-02-27 2015-02-10 Kabushiki Kaisha Toshiba Apparatus, method, and computer program product for processing input speech

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8954333B2 (en) 2007-02-27 2015-02-10 Kabushiki Kaisha Toshiba Apparatus, method, and computer program product for processing input speech
US8082142B2 (en) 2007-03-14 2011-12-20 Nec Corporation Speech recognition method, speech recognition system and server thereof

Similar Documents

Publication Publication Date Title
US8275618B2 (en) Mobile dictation correction user interface
US6952665B1 (en) Translating apparatus and method, and recording medium used therewith
US9753918B2 (en) Lexicon development via shared translation database
JP4481972B2 (ja) 音声翻訳装置、音声翻訳方法及び音声翻訳プログラム
US5832428A (en) Search engine for phrase recognition based on prefix/body/suffix architecture
US6374224B1 (en) Method and apparatus for style control in natural language generation
US7890325B2 (en) Subword unit posterior probability for measuring confidence
US8346553B2 (en) Speech recognition system and method for speech recognition
US8180640B2 (en) Grapheme-to-phoneme conversion using acoustic data
US7124080B2 (en) Method and apparatus for adapting a class entity dictionary used with language models
US9070363B2 (en) Speech translation with back-channeling cues
US20060149551A1 (en) Mobile dictation correction user interface
US7818166B2 (en) Method and apparatus for intention based communications for mobile communication devices
US20160147740A1 (en) Adapting machine translation data using damaging channel model
US20080208597A1 (en) Apparatus, method, and computer program product for processing input speech
JP2002244688A (ja) 情報処理方法及び装置、情報伝送システム、情報処理プログラムを情報処理装置に実行させる媒体、情報処理プログラム
JP2002287787A (ja) 明確化言語モデル
JPWO2011033834A1 (ja) 音声翻訳システム、音声翻訳方法および記録媒体
Prasad et al. BBN TransTalk: Robust multilingual two-way speech-to-speech translation for mobile platforms
US7752045B2 (en) Systems and methods for comparing speech elements
JP2003029779A (ja) 自動通訳システム及びその方法並びにプログラム
Zong et al. Toward practical spoken language translation
JP2000242645A (ja) 音声翻訳装置、音声翻訳方法及び音声翻訳制御プログラムを記録した記録媒体
Stallard et al. The BBN transtalk speech-to-speech translation system
JP2003162524A (ja) 言語処理装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20060509