JP4935158B2

JP4935158B2 - 音声自動翻訳装置、音声自動翻訳方法、音声自動翻訳プログラム

Info

Publication number: JP4935158B2
Application number: JP2006106776A
Authority: JP
Inventors: 勇輝吉村
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2006-04-07
Filing date: 2006-04-07
Publication date: 2012-05-23
Anticipated expiration: 2026-04-07
Also published as: JP2007280137A

Description

本発明は、音声を自動的に他の言語による音声に翻訳する技術に関し、特に、処理能力の低い携帯端末に好適な音声自動翻訳方法等に関する。

ある言語で入力された音声データを他の言語による音声データに変換して出力する自動翻訳システムは、その実用化がされ始めている。
特許文献１には、このような自動翻訳システムが記載されている。このシステムは、音声認識部と翻訳部と音声合成部を備えている。音声認識部は、第１の言語により入力された音声を認識し第１の言語で記述された文字列を得る。翻訳部は、この文字列を第２の言語で記述された翻訳文に変換する。音声合成部は、翻訳文を第２の言語による音声に変換して出力する。

このような翻訳システムの課題は、いかに高速にリアルタイムで翻訳を行うかということである。翻訳時間を短縮するため、漢字辞書のように、よく使用されている単語や単語列がライブラリの先頭にくるようにメモリ内の配置を変えながら翻訳する手法が一般的である。

特開２００５−２７５８８７号公報

しかし、上記の翻訳高速化の手法は、パーソナルコンピュータのように高性能のＣＰＵ(Central Processing Unit)と大量のメモリ（たとえば、数ＧＨｚのクロックで動作するＣＰＵと数百ＭＢのメモリ）を備えた比較的処理能力の高い装置には適用できるが、コストや装置の大きさの制限のため処理能力が低くならざるを得ない携帯電話端末等の携帯型の装置には適用できないという問題があった。

そこで、本発明は、処理能力の低い装置にも適用することができる翻訳の高速化方法等を提供することを目的とする。

本発明の、音声自動翻訳装置は、単語または語句を話題別にグループ分けして登録した翻訳ライブラリと標準翻訳時間を記憶する記憶部と、第１の言語により入力された音声情報を音声認識して第１の言語によるテキストを生成する音声認識手段と、グループに設定された検索優先順に従って翻訳ライブラリを検索し、第１の言語による単語または語句に対応する第２の語句による単語または語句を取得してテキストを第２の原語による翻訳テキストに翻訳する翻訳手段と、翻訳テキストを第２の言語による翻訳音声情報に変換する音声合成手段と、により音声を自動的に翻訳する。
検索優先順序変更手段は、翻訳手段による翻訳に要した翻訳時間を複数回計測し、複数の翻訳時間と標準翻訳時間とを比較し、その比較結果が所定の条件を満たす場合に入力音声の話題を判定し、その判定結果に対応するグループの検索優先順を上げる方向に変更する（請求項１ないし請求項４）。

上記音声自動翻訳装置によれば、検索優先順変更手段は、翻訳時間が標準翻訳時間と比較して長いと判断した場合には、会話中の話題を判断し、翻訳ライブラリの検索優先順の変更を行い、翻訳手段は変更された優先順に従って翻訳ライブラリを検索して翻訳を行う。
そのため、翻訳の時間を短縮することができるという効果がある。
また、翻訳ライブラリを話題によりグループ分けし、そのグループの検索優先順を変えることにより検索時間の短縮を実現しているから、よく使用されている単語や語句がライブラリの先頭にくるようにメモリ内の配置をリアルタイムに変えながら翻訳する必要はなくなる。
そのため、それに伴うＣＰＵの処理能力とメモリ容量への要求は不要になり、装置サイズやコストへのインパクトを抑制できる効果がある。

上記音声自動翻訳装置において、所定の条件を、予め定めた回数の比較において翻訳時間が標準翻訳時間よりも大きいと判定した回数がそうでないと判定した回数以上である、という条件としてもよい（請求項２）。
このようにすれば、検索優先順を変更するか否かを判定する区切りとなる翻訳時間の計測回数を適切に定め、検索優先順の変更処理によるオーバヘッドと検索優先順を変更することによる検索の高速化のバランスをとり最適化することが出来る。

上記音声自動翻訳装置において、所定の条件を、比較において予め定めた基準回数以上連続して翻訳時間が標準翻訳時間よりも大きいと判定した、という条件としてもよい（請求項３）。
このようにすれば、基準回数を適切に定めて、話題の判定の精度を向上させることが出来る。

上記音声自動翻訳装置において、話題には日常話題が含まれ、この日常話題のグループの検索優先順は最上位に固定されているようにしてもよい（請求項４）。
このようにすれば、翻訳手段は、話者によらず会話中の出現頻度が高い日常話題に関する単語等を優先的に検索することができる。
そのため、翻訳の時間を短縮することができる。

本発明の音声自動翻訳方法は、第１の言語により入力された音声情報を音声認識して第１の言語によるテキストを生成する音声認識工程と、単語または語句を話題別にグループ分けして登録し記憶装置に予め格納された翻訳ライブラリをグループに設定された検索優先順に従って検索し、第１の言語による単語または語句に対応する第２の言語による単語または語句を取得してテキストを第２の言語による翻訳テキストに翻訳する翻訳工程と、翻訳テキストを第２の言語による翻訳音声情報に変換する音声合成工程と、翻訳工程における翻訳に要した翻訳時間を複数回計測し、翻訳時間と記憶装置に予め記憶された標準翻訳時間とを比較し、その比較結果が所定の条件を満たす場合に入力音声の話題を判定し、その判定結果に対応するグループの検索優先順を上げる方向に変更する検索優先順変更工程とにより音声の自動翻訳を行う（請求項５ないし請求項８）。

上記音声自動翻訳方法によれば、検索優先順変更工程では、翻訳時間が標準翻訳時間と比較して長いと判断した場合には、会話中の話題を判断し、翻訳ライブラリの検索優先順の変更を行い、翻訳工程では、変更された優先順に従って翻訳ライブラリを検索して翻訳を行う。
そのため、翻訳の時間を短縮することができるという効果がある。
また、翻訳ライブラリを話題によりグループ分けし、そのグループの検索優先順を変えることにより検索時間の短縮を実現しているから、よく使用されている単語や語句がライブラリの先頭にくるようにメモリ内の配置をリアルタイムに変えながら翻訳する必要はなくなる。
そのため、それに伴うＣＰＵの処理能力とメモリ容量への要求は不要になり、装置サイズやコストへのインパクトを抑制できる効果がある。

上記音声自動翻訳方法において、所定の条件を、予め定めた回数の比較において翻訳時間が標準翻訳時間よりも大きいと判定した回数がそうでないと判定した回数以上である、という条件としても良い（請求項６）。
このようにすれば、検索優先順を変更するか否かを判定する区切りとなる翻訳時間の計測回数を適切に定め、検索優先順の変更処理によるオーバヘッドと検索優先順を変更することによる検索の高速化のバランスをとり最適化することが出来る。

上記音声自動翻訳方法において、所定の条件は、比較において予め定めた基準回数以上連続して翻訳時間が標準翻訳時間よりも大きいと判定した、という条件としても良い（請求項７）。
このようにすれば、基準回数を適切に定めて、話題の判定の精度を向上させることが出来る。

上記音声自動翻訳方法において、グループには日常話題のグループが含まれ、この日常話題のグループの検索優先順は最上位に固定されているようにしても良い（請求項８）。
このようにすれば、翻訳手段は、話者によらず会話中の出現頻度が高い日常話題に関する単語等を優先的に検索することができる。
そのため、翻訳の時間を短縮することができる。

本発明の音声自動翻訳プログラムは、コンピュータに、第１の言語により入力された音声情報を音声認識して第１の言語によるテキストを生成する音声認識機能と、単語または語句を話題別にグループ分けして登録し記憶装置に予め格納された翻訳ライブラリをグループに設定された検索優先順に従って検索し、第１の言語による単語または語句に対応する第２の言語による単語または語句を取得してテキストを第２の言語による翻訳テキストに翻訳する翻訳機能と、翻訳テキストを第２の言語による翻訳音声情報に変換する音声合成機能と、翻訳工程における翻訳に要した翻訳時間を複数回計測し、翻訳時間と記憶装置に予め記憶された標準翻訳時間とを比較し、その比較結果が所定の条件を満たす場合に入力音声の話題を判定し、その判定結果に対応するグループの検索優先順を上げる方向に変更する検索優先順変更機能とを実行させることにより音声の自動翻訳を行う（請求項９ないし請求項１２）。

上記音声自動翻訳プログラムによれば、検索優先順変更機能は、翻訳時間が標準翻訳時間と比較して長いと判断した場合には、会話中の話題を判断し、翻訳ライブラリの検索優先順の変更を行い、翻訳機能は、変更された優先順に従って翻訳ライブラリを検索して翻訳を行う。
そのため、翻訳の時間を短縮することができるという効果がある。
また、翻訳ライブラリを話題によりグループ分けし、そのグループの検索優先順を変えることにより検索時間の短縮を実現しているから、よく使用されている単語や語句がライブラリの先頭にくるようにメモリ内の配置をリアルタイムに変えながら翻訳する必要はなくなる。
そのため、それに伴うＣＰＵの処理能力とメモリ容量への要求は不要になり、装置サイズやコストへのインパクトを抑制できる効果がある。

上記音声自動翻訳プログラムにおいて、所定の条件を、予め定めた回数の比較において翻訳時間が標準翻訳時間よりも大きいと判定した回数がそうでないと判定した回数以上である、という条件としても良い（請求項１０）。
このようにすれば、検索優先順を変更するか否かを判定する区切りとなる翻訳時間の計測回数を適切に定め、検索優先順の変更処理によるオーバヘッドと検索優先順を変更することによる検索の高速化のバランスをとり最適化することが出来る。

上記音声自動翻訳プログラムにおいて、所定の条件を、比較において予め定めた基準回数以上連続して翻訳時間が標準翻訳時間よりも大きいと判定した、という条件としても良い（請求項１１）。
このようにすれば、基準回数を適切に定めて、話題の判定の精度を向上させることが出来る。

上記音声自動翻訳プログラムにおいて、グループには日常話題のグループが含まれ、この日常話題のグループの検索優先順は最上位に固定されているようにしても良い（請求項１２）。
このようにすれば、翻訳手段は、話者によらず会話中の出現頻度が高い日常話題に関する単語等を優先的に検索することができる。
そのため、翻訳の時間を短縮することができる。

本発明によれば、翻訳時間が標準翻訳時間と比較して長いと判断した場合には、会話中の話題を判断し、翻訳ライブラリの検索優先順の変更を行い、変更された優先順に従って翻訳ライブラリを検索して翻訳を行う。
そのため、翻訳の時間を短縮することができるという効果がある。
また、翻訳ライブラリを話題によりグループ分けし、そのグループの検索優先順を変えることにより検索時間の短縮を実現しているから、よく使用されている単語や語句がライブラリの先頭にくるようにメモリ内の配置をリアルタイムに変えながら翻訳する必要はなくなる。
そのため、それに伴うＣＰＵの処理能力とメモリ容量への要求は不要になり、装置サイズやコストへのインパクトを抑制できる効果がある。

以下、図を参照しながら本発明の一実施形態である端末１（音声自動翻訳装置の一例）の構成と動作について説明する。
図１（ａ）は、端末１の構成を示すブロック図である。
端末１は、携帯電話機、スマートフォン等の携行可能な端末装置で、無線通信により公衆電話網２を介して相手端末３と接続し通話する機能を備えている。相手端末は、携帯電話機、固定電話機等任意の電話端末である。
端末１は、後述する音声自動翻訳部２０を備え、端末１と相手端末３の間の音声通話を自動的に翻訳する。この翻訳は、双方向で行うため端末３は、翻訳機能を備えている必要はない。

端末１は、ＣＰＵ１１、メモリ１２、通信部１３、マイクロフォン１４、スピーカ１５を備えている。
ＣＰＵ１１は、制御機能および演算機能を備え、メモリ１２に記憶されたコンピュータプログラムを読み込んで実行することにより端末１全体の動作を制御する。
メモリ１２は、たとえばＲＡＭにより構成され、ＣＰＵ１１の主記憶装置として機能すると共に、翻訳ライブラリ１０４等の情報を格納している。
通信部１３は、ＣＤＭＡ方式等の携帯電話規格に従った通信ユニットで、無線により公衆電話網２に接続し、相手端末３等の他の端末装置の間で情報の送受信を行う。
マイクロフォン１４は、音声入力手段であり、端末１のユーザが発声した音声を電気信号に変換し、後述する音声認識手段２１に出力する。
スピーカ１５は、相手端末３から受信した音声情報や、音声合成手段２３から出力された翻訳された音声情報を音波に変換して出力する。

図１（ｂ）は、端末１の機能ブロック図である。
端末１は、音声情報自動翻訳部２０と記憶部３０により構成される。
音声情報自動翻訳部２０は、次の各手段を含み、端末１のユーザ（以下、単に「ユーザ」という）と相手端末３のユーザ（以下、「通話相手」という）の通話に用いる言語が異なる場合に、リアルタイムで相互に翻訳を行う。

音声認識手段２１は、ユーザが発声し、マイクロフォン１４から入力された音声情報を音声認識してユーザが用いる言語による文字列を生成する。また、通話相手が発声し、通信部１３から入力された音声情報を音声認識して通話相手が用いる言語による文字列を生成する。

翻訳手段２２は、音声認識手段２１が生成したユーザが用いる言語による文字列と通話相手が用いる言語による文字列との間で相互に翻訳を行う。翻訳手段２２は、翻訳を行う際に、翻訳ライブラリ３１を参照し、原文に含まれる単語または語句（以下「単語等」という）に対応する翻訳文の単語等を取得する。

音声合成手段２３は、翻訳手段２２が生成した翻訳済みの文字列を音声情報に変換し、通信部１３またはマイクロフォン１４に出力する。

検索優先順変更手段２４は、翻訳手段２２が翻訳に要した時間を計測し、これが標準翻訳時間よりも大きい場合に、進行している通話の現在の話題を判定し、その判定結果に応じて翻訳ライブラリ３１の検索優先順を変更する。

上記の各手段は、ＣＰＵ１１がメモリ１２に格納された音声自動翻訳プログラムを実行し、端末１の各ハードウェアを制御することにより実現される。

記憶部３０には、翻訳ライブラリ３１と標準翻訳時間３２が記憶されている。
翻訳ライブラリ３１は、翻訳手段２２が原文の単語等に対応する翻訳文の単語等を検索するためのテーブルで、端末１においては、単語が話題毎に分類して格納されている。翻訳手段２３は、検索優先順変更手段２４により決定された順番で、翻訳ライブラリ３１を検索する。

翻訳ライブラリ３１の構成例を図２、図３に示す。
図２は、検索優先順変更前の翻訳ライブラリ３１の一例である。翻訳ライブラリ３１は、日常話題、ビジネス話題、政治話題、医学話題、文化話題、工学話題等のグループから構成されている。各グループには、その話題に関する会話中で出現頻度が高い単語等が登録されている。
検索優先順変更前の翻訳ライブラリ検索優先順は、日常話題がトップで、その次にビジネス話題、政治話題等という順である。通常の通話内容は日常的なものが多いため、検索優先順の初期設定では、日常話題をトップにしてある。そうすることによって、翻訳手段２２は、よく使う会話中の話題の単語を優先的に検索することができ、翻訳の時間を短縮することができる。

図３は、検索優先順変更後の翻訳ライブラリ３１の一例である。翻訳ライブラリ３１は、上記の図２と同様に日常話題、ビジネス話題、政治話題、医学話題、文化話題、工学話題等から構成されている。
検索優先順変更後の翻訳ライブラリ検索優先順は、日常話題がトップで、その次に工学話題、ビジネス話題、政治話題等順である。それは会話内容に使用された単語数が一番多いのは日常話題で、その次は工学話題、ビジネス話題、政治話題等であることを意味する。そうすることによって、通話中によく使用されている日常話題及び工学話題の単語を優先的に検索され、翻訳の時間を短縮することができる。

標準翻訳時間３２は、検索優先順変更手段２４が翻訳時間が長いか否かを判定する際の基準となる情報で、たとえば、標準的なテキストをいくつか選定し端末１により実際に翻訳を行い、各テキストを翻訳するのに要した時間を計測してそれらを平均することにより決定する。

次に、端末１の動作について、詳細に説明する。
図４は、ユーザが端末１を用いて通話相手と通話する場合の端末１の全体の動作を示すフローチャート図である。
図４を参照すると、端末１の音声情報自動翻訳部２０は、通話が開始されているか否かを判定し（ステップＡ１）、開始後であると判断した場合には、通話相手からの音声情報があるかどうかの確認を行う（ステップＡ２）。
通話相手からの音声情報があった場合には、ユーザと通話相手が通話に使用する言語が同一かどうかの判断を行う（ステップＡ３）。
使用言語が異なる（たとえばユーザは日本語、通話相手は英語を使用しているとする）場合には、音声情報自動翻訳部２０は、双方向の音声情報自動翻訳を行う（ステップＡ４）。具体的には、音声認識手段２１がユーザが入力した日本語の音声を音声認識して日本語のテキストを生成し、これを翻訳手段２２が英語のテキストに翻訳し、音声合成手段２３が翻訳したテキストを英語の音声に変換して通信部１３を介して端末３に送信する。端末３から受信した英語の音声情報についても同様の手順で日本語の音声情報に変換してスピーカ１５に出力する。

このとき、検索優先順変更手段２４は、原語のテキストから翻訳テキストを生成するまでの時間である翻訳時間tを、たとえば１文ごとに計測する（ステップＡ５）。翻訳時間の測定は、このほか、予め定めた語数、音声データの情報量（ビット数）を区切りとして行っても良い。
そして、翻訳時間を標準翻訳時間Tと比較して、翻訳の時間が長いかどうかの判断を行う（ステップＡ６）。翻訳の時間が遅くない(翻訳時間t≦標準翻訳時間T)場合には、N(ステップＡ６の判定結果がノーであった回数)を１増加させる処理を実行し（ステップＡ７）、翻訳の時間が長い(翻訳時間t＞標準翻訳時間T)という結果を得た場合には、Y(ステップＡ６の判定結果がイエスであった回数)を１増加させる処理を実行（ステップＡ８）する。

次に、検索優先順変更手段２４は、ライブラリの検索優先順序を変える条件が満たされるか否かを判定する（ステップＡ９）。図４では、一例として、この判定を翻訳時間の測定を１０回行う毎に行うこととし、翻訳時間が長いと判定された回数が長くないと判定された回数以上（Y+N=10、かつ、Y≧N）である場合に検索優先順の変更を行うようにしている。判定条件は、この例には限定されず、たとえば、ステップＡ６の判定が、所定の回数（たとえば３回）以上連続して「イエス」となった場合に検索優先順序を変更するようにしても良い。
ステップＡ９の判定が「イエス」となった場合は、現在の話題を判定し、その判定結果に基づいてライブラリの検索優先順序の変更を実施する（ステップＡ１０）。この処理の詳細については後述する。
端末１は、以上の動作を通話が完了するまで繰り返し実行する（ステップＡ１１）。

ユーザと通話相手が共にエンジニアである場合に想定される具体的な動作例は、たとえば、次のようになる。
会話を始めた直後は、「こんにちは」等の挨拶に始まり日常の話題が主であるのが通例である。そのため、翻訳ライブラリ３１は図２に示す様な話題の検索優先順となっており、会話中の単語等を検索するに適した格好になっている。この為、翻訳時間は短く、上述のステップＡ６の判断結果はNoとなる確率が高い。
一方、会話が進み、用件の本題に入った場合、例えばその話題がプロジェクト開発の技術論であった場合、図２の翻訳ライブラリ３１の検索順では、工学話題が後方にあり検索に時間を要する場合が多くなる。この場合、上述のステップＡ６の判断はYesとなる場合が多くなる。

その結果、「Y+N=10（10は一例）、かつ、Y≧N」という条件が満足され（ステップＡ９）、端末１の検索優先順変更手段２４は、翻訳時間が長いと判断し、会話中の話題により翻訳ライブラリ３１の検索優先順の変更を行う（ステップＡ１０）。
前述のステップＡ９は、会話の中から話題を予測し判断するための処理である。会話の中には様々な言葉や単語が含まれており、その個々の言葉や単語で翻訳ライブラリ３１の検索順序を変更してしまうと、頻繁に検索順序が変わってしまうことになり、結果、次に来る言葉や単語を正確に予測できず、翻訳時間を最適化できない。
話題を予測・判断する処理を入れ、翻訳ライブラリの検索順をリアルタイムではなくゆっくり変えることで、同じ話題を続けている間は翻訳時間を短縮することが可能になる。話題が変わった場合には、その検索順を変更し翻訳時間を短縮する。この処理を会話中、繰り返し行う。

会話中の話題により翻訳ライブラリ３１の検索優先順の変更を行う処理（図４のステップＡ１０）の詳細を図５のフローチャート図に示す。
進行中の会話内容によりM(M=1, 2, …)個の単語等をサンプリングし（ステップＢ１）、そのサンプリングされたM個の言葉や単語を翻訳ライブラリ３１のデータと照合する（ステップＢ２）。
次に、サンプリングされた言葉や単語が、どの話題のライブラリに属しているかをカウントする（ステップＢ３）。
M個のサンプリングが終了した時点でカウント数の多い順に翻訳ライブラリ３１の検索優先順の変更を行う（ステップＢ４）。

図３は図２の検索順が上述の検索優先順の変更処理により変更された一例である。上述の例で、会話はプロジェクト開発の技術論であった為、翻訳した言葉や単語が工業話題に属することが多くなり、工業話題が上位に上がっている。これにより、プロジェクト開発の技術論の会話の翻訳速度は向上する。

以上のように、端末１によれば、検索優先順変更手段２４は、測定した翻訳時間と標準翻訳時間とを比較して、翻訳時間が長いと判断した場合には、会話中の話題を判断し、翻訳ライブラリの検索優先順の変更を行う。翻訳手段２２は、この変更された検索優先順に従って翻訳ライブラリ２１を検索して翻訳を行う。
そのため、翻訳の時間を短縮することができるという効果がある。

また、端末１によれば、検索優先順変更手段２４は、所定の条件（たとえば図４のステップＡ９）が満たされる場合にのみ優先順の変更を行う。
そのため、仮名漢字変換を行う際の漢字辞書の様に、よく使用されている単語等がライブラリの先頭にくるようにメモリ内の配置をリアルタイムに変えながら翻訳する必要はなくなり、それに伴うＣＰＵの処理能力とメモリ容量への要求は不要になる。これにより、装置サイズやコストへのインパクトを抑制できる効果がある。

図１（ａ）は、本発明の一実施形態である端末のハードウェア構成を示すブロック図である。図１（ｂ）は、端末の機能ブロック図である。検索優先順を変更する前の翻訳ライブラリの一例を示す図である。検索優先順を変更した後の翻訳ライブラリの一例を示す図である。音声情報の自動翻訳を行う際の端末の動作を示すフローチャート図である。翻訳ライブラリの検索優先順を変更する際の端末の動作を示すフローチャート図である。

符号の説明

１端末
２公衆電話網
３相手端末
２０音声情報自動翻訳部
２１音声認識手段
２２翻訳手段
２３音声合成手段
２４検索優先順変更手段
３０記憶部
３１翻訳ライブラリ
３２標準翻訳時間

Claims

単語または語句を話題別にグループ分けして登録した翻訳ライブラリと標準翻訳時間を記憶する記憶部と、
第１の言語により入力された音声情報を音声認識して前記第１の言語によるテキストを生成する音声認識手段と、
前記グループに設定された検索優先順に従って前記翻訳ライブラリを検索し、前記第１の言語による単語または語句に対応する第２の言語による単語または語句を取得して前記テキストを前記第２の言語による翻訳テキストに翻訳する翻訳手段と、
前記翻訳テキストを前記第２の言語による翻訳音声情報に変換する音声合成手段と、
前記翻訳手段による前記翻訳に要した翻訳時間を複数回計測し、前記翻訳時間と前記標準翻訳時間とを比較し、その比較結果が所定の条件を満たす場合に前記入力音声の話題を判定し、その判定結果に対応する前記グループの前記検索優先順を上げる方向に変更する検索優先順変更手段とを備えたことを特徴とした音声自動翻訳装置。
前記所定の条件は、予め定めた回数の前記比較において前記翻訳時間が前記標準翻訳時間よりも大きいと判定した回数がそうでないと判定した回数以上である、という条件であることを特徴とした請求項１に記載の音声自動翻訳装置。
前記所定の条件は、前記比較において予め定めた基準回数以上連続して前記翻訳時間が前記標準翻訳時間よりも大きいと判定した、という条件であることを特徴とした請求項１に記載の音声自動翻訳装置。
前記グループには日常話題のグループが含まれ、この日常話題のグループの前記検索優先順は最上位に固定されていることを特徴とした請求項１ないし請求項３のいずれかひとつに記載の音声自動翻訳装置。
第１の言語により入力された音声情報を音声認識して前記第１の言語によるテキストを生成する音声認識工程と、
単語または語句を話題別にグループ分けして登録し記憶装置に予め格納された翻訳ライブラリを前記グループに設定された検索優先順に従って検索し、前記第１の言語による単語または語句に対応する第２の言語による単語または語句を取得して前記テキストを前記第２の言語による翻訳テキストに翻訳する翻訳工程と、
前記翻訳テキストを前記第２の言語による翻訳音声情報に変換する音声合成工程と、
前記翻訳工程における前記翻訳に要した翻訳時間を複数回計測し、前記翻訳時間と記憶装置に予め記憶された標準翻訳時間とを比較し、その比較結果が所定の条件を満たす場合に前記入力音声の話題を判定し、その判定結果に対応する前記グループの前記検索優先順を上げる方向に変更する検索優先順変更工程とを備えたことを特徴とした音声自動翻訳方法。
前記所定の条件は、予め定めた回数の前記比較において前記翻訳時間が前記標準翻訳時間よりも大きいと判定した回数がそうでないと判定した回数以上である、という条件であることを特徴とした請求項５に記載の音声自動翻訳方法。
前記所定の条件は、前記比較において予め定めた基準回数以上連続して前記翻訳時間が前記標準翻訳時間よりも大きいと判定した、という条件であることを特徴とした請求項５に記載の音声自動翻訳方法。
前記グループには日常話題のグループが含まれ、この日常話題のグループの前記検索優先順は最上位に固定されていることを特徴とした請求項５ないし請求項７のいずれかひとつに記載の音声自動翻訳方法。
コンピュータに、
第１の言語により入力された音声情報を音声認識して前記第１の言語によるテキストを生成する音声認識機能と、
単語または語句を話題別にグループ分けして登録し記憶装置に予め格納された翻訳ライブラリを前記グループに設定された検索優先順に従って検索し、前記第１の言語による単語または語句に対応する第２の言語による単語または語句を取得して前記テキストを前記第２の言語による翻訳テキストに翻訳する翻訳機能と、
前記翻訳テキストを前記第２の言語による翻訳音声情報に変換する音声合成機能と、
前記翻訳工程における前記翻訳に要した翻訳時間を複数回計測し、前記翻訳時間と記憶装置に予め記憶された標準翻訳時間とを比較し、その比較結果が所定の条件を満たす場合に前記入力音声の話題を判定し、その判定結果に対応する前記グループの前記検索優先順を上げる方向に変更する検索優先順変更機能とを実行させることを特徴とした音声自動翻訳プログラム。
前記所定の条件は、予め定めた回数の前記比較において前記翻訳時間が前記標準翻訳時間よりも大きいと判定した回数がそうでないと判定した回数以上である、という条件であることを特徴とした請求項９に記載の音声自動翻訳プログラム。
前記所定の条件は、前記比較において予め定めた基準回数以上連続して前記翻訳時間が前記標準翻訳時間よりも大きいと判定した、という条件であることを特徴とした請求項９に記載の音声自動翻訳プログラム。
前記グループには日常話題のグループが含まれ、この日常話題のグループの前記検索優先順は最上位に固定されていることを特徴とした請求項９ないし請求項１１のいずれかひとつに記載の音声自動翻訳プログラム。