JP2008021058A - 翻訳機能付き携帯電話装置、音声データ翻訳方法、音声データ翻訳プログラムおよびプログラム記録媒体 - Google Patents

翻訳機能付き携帯電話装置、音声データ翻訳方法、音声データ翻訳プログラムおよびプログラム記録媒体 Download PDF

Info

Publication number
JP2008021058A
JP2008021058A JP2006191207A JP2006191207A JP2008021058A JP 2008021058 A JP2008021058 A JP 2008021058A JP 2006191207 A JP2006191207 A JP 2006191207A JP 2006191207 A JP2006191207 A JP 2006191207A JP 2008021058 A JP2008021058 A JP 2008021058A
Authority
JP
Japan
Prior art keywords
facial expression
data
user
voice data
translation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006191207A
Other languages
English (en)
Inventor
Yoshiaki Tanaka
義明 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2006191207A priority Critical patent/JP2008021058A/ja
Publication of JP2008021058A publication Critical patent/JP2008021058A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】マイクから入力される音声を文字変換した音声データにおける欠落部分や感情部分を補正して翻訳する翻訳機能付き携帯電話装置を提供する。
【解決手段】翻訳機能付き携帯電話装置を制御する制御部105として、ユーザの顔画像を撮影可能なカメラ部分101にて撮影したユーザの顔画像の目、眉、眉間、額、鼻、口唇のいずれか1ないし複数の各パーツ間の相対位置とその変化量を画像解析部204にて解析して、その解析結果に基づいて、表情データ抽出部205にて、マイク102から入力した音声を音声データ生成部201にて文字変換した音声データの欠落部分を抽出するとともに、当該ユーザの感情を示す表情データを生成して、文字変換した音声データの欠落部分や感情部分を音声データ補正部202にて補正した補正音声データを生成し、該補正音声データを音声データ翻訳部203にて通話相手の言語の翻訳文に翻訳して、通話相手に送信する動作を行う。
【選択図】図2

Description

本発明は、翻訳機能付き携帯電話装置、音声データ翻訳方法、音声データ翻訳プログラムおよびプログラム記録媒体に関する。
従来の翻訳機能付き携帯電話装置では、例えば、特許文献1の特開2002−118659号公報「電話装置及び翻訳電話装置」にも記載されているように、図4のような構成により、通話相手の言語への音声データの翻訳を行っている。ここに、図4は、従来の翻訳機能付き携帯電話装置の音声データの翻訳部分の構成を示すブロック構成図である。図4に示すように、マイクより入力された通話者の音声は、音声データ生成部301にて音声データへと文字変換され、文字変換された音声データを基にして、音声データ翻訳部302にて通話相手の言語に翻訳変換されて、通話相手の携帯電話へと送られるように構成されている。
特開2002−118659号公報(第4−6頁)
しかしながら、従来の翻訳機能付き携帯電話装置では、マイクから入力された音声を文字変換した音声データを通話相手の言語にたとえ正しく翻訳したとしても、文字変換された音声データの欠落部分や、さらには、マイクで入力した際の音声に含まれていた感情部分が表現されないという欠点があった。
本発明は、かかる問題に鑑みてなされたものであり、テレビ電話を用いることにより、通話者の顔画像から通話時における通話者の発声内容や感情を抽出することにより、文字変換された音声データの欠落部分や感情部分を補正し、補正後の文字変換された補正音声データを基にして通話相手の言語に翻訳を行って、通話相手に送信する翻訳機能付き携帯電話装置、音声データ翻訳方法、音声データ翻訳プログラムおよびプログラム記録媒体を提供することにある。
前述の課題を解決するため、本発明による翻訳機能付き携帯電話装置、音声データ翻訳方法、音声データ翻訳プログラムおよびプログラム記録媒体は、次のような特徴的な構成を採用している。
(1)ユーザの顔画像を撮影可能なカメラ部と、該ユーザの音声を文字変換して音声データを生成する音声データ生成部と、文字変換した前記音声データを通話相手の言語の翻訳文に翻訳する音声データ翻訳部と、翻訳した前記翻訳文を通話相手に送信する無線部とを備えた翻訳機能付き携帯電話装置において、前記カメラ部で撮影したユーザの顔画像から当該ユーザの表情データを抽出する表情データ抽出部と、該表情データ抽出部にて抽出したユーザの表情データに基づいて、当該ユーザの音声を文字変換した前記音声データの欠落部分や感情部分を補正して補正音声データとして出力する音声データ補正部と、をさらに備え、前記音声データ補正部にて補正した前記補正音声データを用いて、前記音声データ翻訳部にて通話相手の言語の翻訳文に翻訳する翻訳機能付き携帯電話装置。
(2)前記表情データ抽出部は、前記カメラ部で撮影した当該ユーザの顔画像の目、眉、眉間、額、鼻、口唇のいずれか1ないし複数の各パーツ間の相対位置とその変化量を特徴量として解析する表情解析部と、当該ユーザの表情の前記特徴量を表情パターンとしてあらかじめ登録している表情パターンデータベースとを含み、前記表情解析部において解析された当該ユーザの前記特徴量により前記表情パターンデータデースを参照することにより、当該ユーザの表情データを抽出する上記(1)の翻訳機能付き携帯電話装置。
(3)前記表情パターンデータベースに登録するユーザの前記表情パターンとして、あらかじめ定めた複数の感情それぞれに該当する当該ユーザの表情の特徴量をあらかじめ登録する上記(2)の翻訳機能付き携帯電話装置。
(4)前記表情データ抽出部が、前記表情パターンデータベースを参照してユーザの表情データを抽出する際に、前記表情パターンデータベースに前記表情パターンとして登録したユーザの複数の感情それぞれの前記特徴量との近似度を、当該ユーザのそれぞれの感情の度合いとして表情データに含めて出力する上記(3)の翻訳機能付き携帯電話装置。
(5)前記表情データ抽出部の前記表情パターンデータベースにあらかじめ登録するユーザの複数の感情として、少なくとも、怒り、悲しみ、喜び、平静の感情を含む上記(3)または(4)の翻訳機能付き携帯電話装置。
(6)前記音声データ補正部により、感情部分を補正した前記補正音声データを生成する際に、文字フォント、文字サイズ、文字色、アンダライン、太字、斜体のいずれか1ないし複数を用いて、ユーザの感情ごとに異なる書式で修飾した補正を行う上記(1)ないし(5)のいずれかの翻訳機能付き携帯電話装置。
(7)前記音声データ翻訳部は、前記補正音声データを通話相手の言語の翻訳文に翻訳する際に、ユーザの感情ごとに異なる書式で修飾した前記補正音声データに対応する前記通話相手の言語の書式に変換する上記(6)の翻訳機能付き携帯電話装置。
(8)前記音声データ補正部により、感情部分を補正した前記補正音声データを生成する際に、ユーザの感情に適合した言い回しの翻訳を行うように指示する付加情報を前記補正音声データに追加して出力する上記(1)ないし(7)のいずれかの翻訳機能付き携帯電話装置。
(9)前記音声データ翻訳部は、前記補正音声データを通話相手の言語の翻訳文に翻訳する際に、前記補正音声データに前記付加情報が追加されていた場合、該付加情報に指示されている言い回しに適合する表現を用いて翻訳する上記(8)の翻訳機能付き携帯電話装置。
(10)ユーザの顔画像を撮影可能なカメラ部を備え、該ユーザの音声を文字変換して音声データを生成する音声データ生成ステップと、文字変換した前記音声データを通話相手の言語の翻訳文に翻訳する音声データ翻訳ステップとを有し、翻訳した前記翻訳文を通話相手に送信する翻訳機能付き携帯電話装置における音声データ翻訳方法において、前記カメラ部で撮影したユーザの顔画像から当該ユーザの表情データを抽出する表情データ抽出ステップと、該表情データ抽出ステップにて抽出したユーザの表情データに基づいて、当該ユーザの音声を文字変換した前記音声データの欠落部分や感情部分を補正して補正音声データとして出力する音声データ補正ステップと、をさらに有し、前記音声データ補正部にて補正した前記補正音声データを用いて、前記音声データ翻訳ステップにて通話相手の言語の翻訳文に翻訳する音声データ翻訳方法。
(11)前記表情データ抽出ステップは、前記カメラ部で撮影した当該ユーザの顔画像の目、眉、眉間、額、鼻、口唇のいずれか1ないし複数の各パーツ間の相対位置とその変化量を特徴量として解析する表情解析ステップと、当該ユーザの表情の前記特徴量を表情パターンとしてあらかじめ登録している表情パターンデータベースとを含み、前記表情解析ステップにおいて解析された当該ユーザの前記特徴量により前記表情パターンデータデースを参照することにより、当該ユーザの表情データを抽出する上記(10)の音声データ翻訳方法。
(12)前記表情パターンデータベースに登録するユーザの前記表情パターンとして、あらかじめ定めた複数の感情それぞれに該当する当該ユーザの表情の特徴量をあらかじめ登録する上記(11)の音声データ翻訳方法。
(13)前記表情データ抽出ステップが、前記表情パターンデータベースを参照してユーザの表情データを抽出する際に、前記表情パターンデータベースに前記表情パターンとして登録したユーザの複数の感情それぞれの前記特徴量との近似度を、当該ユーザのそれぞれの感情の度合いとして表情データに含めて出力する上記(12)の音声データ翻訳方法。
(14)上記(10)ないし(13)のいずれかの音声データ翻訳方法をコンピュータにより実行可能なプログラムとして実現している音声データ翻訳プログラム。
(15)上記(14)の音声データ翻訳プログラムを、コンピュータにより読み取り可能な記録媒体に記録しているプログラム記録媒体。
本発明による翻訳機能付き携帯電話装置、音声データ翻訳方法、音声データ翻訳プログラムおよびプログラム記録媒体においては、テレビ電話の通話時に、顔画像を取得することによって、マイクから入力される音声データの欠落部分や感情部分を補正して、翻訳することにより、文字変換された音声データの精度を上げることを可能としているので、テレビ電話の通話者同士の通話をより円滑に行うことができるという効果が得られる。
以下、本発明による翻訳機能付き携帯電話装置、音声データ翻訳方法、音声データ翻訳プログラムおよびプログラム記録媒体の好適実施形態例について添付図を参照して説明する。
(発明の特徴)
本発明は、翻訳機能付き携帯電話装置において、テレビ電話の通話中に、特に、ハンズフリーモードによるテレビ電話の通話中に、カメラ部により撮影されて取り込まれた通話者の顔画像データから通話者の表情データを生成し、通話者の表情データを基にして、マイクにて集音された通話者の音声から得られた文字変換後の音声データの欠落部分や感情部分を補正した後で、文字変換された補正後の音声データ(補正音声データ)の翻訳を実施することによって、音声データの欠落部分を補充するとともに、通話者の感情を含む翻訳を行うことが可能となり、翻訳した音声データの精度を向上させることを可能としている。以下の実施例においては、本発明の翻訳機能付き携帯電話装置の実施例について説明するが、本発明の音声データ翻訳方法、音声データ翻訳プログラム、プログラム記録媒体についても、全く同様の考え方で実現することができるので、これらの実施例の詳細についての説明は省略する。
本発明による翻訳機能付き携帯電話装置の構成例を、図1に示す。図1に示す翻訳機能付き携帯電話装置100としては、通話者(ユーザ)の顔画像を取り込むカメラ部分101、通話者の音声を取り込むマイク102、マイク102にて集音された通話者の音声を音声データに文字変換した際に生じる、文字変換された音声データの欠落部分や感情部分を、カメラ部分101にて撮影された顔画像データを参照して、補正した補正音声データを生成した後、この補正音声データを基にして通話相手の言語に翻訳し、通話先相手へ無線部104、アンテナ103を介して伝える制御部105、通話先相手の音声をアンテナ103、無線部104、制御部105を介して出力するスピーカ106、通話者が操作する操作部107を少なくとも備えている。操作部107は、画像やテキストを画面表示するLCD表示部107A、ユーザが任意の文字、数字を入力するテンキー107B、ユーザが操作する選択スイッチ107Cを少なくとも備えている。
図2は、図1に示す制御部105のうち通話先相手へ伝達する機能部分を中心にその一例を示すブロック構成図である。図2の制御部105に示すように、マイク102より入力された音声データは、音声データ生成部201において文字変換された音声データに変換される。また、カメラ部分101より入力された顔画像データを解析する画像解析部204の解析結果に基づいて、表情データ抽出部205にて表情データを抽出する。
さらに、表情データ抽出部205にて抽出された表情データに基づいて、音声データ生成部201にて文字変換された音声データの欠落部分や感情部分を音声データ補正部202にて補正した補正音声データを生成する。しかる後、音声データ補正部202にて補正されて文字変換された音声データを基にして音声データ翻訳部203にて通話相手の言語に翻訳変換する。なお、制御部105の前述したような各機能ブロックは、ハードウェア論理によって実現するようにしても良いし、プログラム論理によって実現するようにしても良いし、あるいは、両者を併用して実現するようにしても良い。
図2に示した表情データ抽出部205は、図3のような構成からなっている。図3は、図2における表情データ抽出部205の構成の一例を示すブロック構成図である。図3に示すように、表情データ抽出部205は、表情解析部205Aと表情パターンDB(データベース)205Bとにより構成されていて、カメラ部分101が撮影した通話者の顔画像から、当該通話者の発声時の唇の動きを解析した結果を基にして発声音声を推定するとともに、当該通話者の顔画像の各パーツの解析結果を基にして感情を自動判別し、推定した発声音声や判別した感情を表情データとして出力する機能を有している。
この場合に、表情データを抽出する方法としては、カメラ部分101により連続撮影された通話者の顔画像から、「目」、「眉」、「額」、「眉間」、「鼻」、「口唇」などの各パーツのうち、1ないし複数のパーツを用いて、各パーツ間の相対位置やその変化量を特徴量として画像解析部204にて抽出して、表情データ抽出部205に入力されてくる。表情データ抽出部205の表情解析部205Aでは、画像解析部204にて抽出された口唇の動きに基づいて発声音声を推定するとともに、画像解析部204にて抽出された各パーツに関する特徴量を、表情パターンDB205Bにあらかじめ登録されている通話者の表情パターンの特徴量と照合することによって、「怒り」、「悲しみ」、「喜び」、「平静」のうち、最も近似している感情を推定して、表情データとして出力する。ここに、表情パターンDB205Bには、「怒り」、「悲しみ」、「喜び」、「平静」のあらかじめ定めた各場面での通話者の顔画像をあらかじめ撮影して、「目」、「眉」、「額」、「眉間」、「鼻」、「口唇」などの各パーツのうち1ないし複数のパーツについて、各パーツ間の相対位置やその変化量が、当該通話者の感情ごとの各場面における表情パターン(特徴量)としてあらかじめ登録されている。
なお、顔画像から表情データを抽出する方法としては、各パーツ間の相対位置やその変化量を特徴量として抽出する方法に限られるものではなく、各パーツの動き速度や変化方向などを解析したり、目からの涙や、口唇からこぼれる歯などの要素も加味して解析するなど他の方法を用いても良い。また、判別する感情の種類についても、「怒り」、「悲しみ」、「喜び」、「平静」の4つに限られるものではなく、4つより少なくしても良いし、逆に、「驚き」や「不満」などを加えて多くしても良いし、さらには、感情の種類の他に、表情パターンDB205Bにあらかじめ登録した通話者(ユーザ)の複数の感情それぞれの場面における表情パターン(特徴量)との近似度を、その感情の度合いとして加えるようにしても良い。さらに、出力する感情は1つの感情のみに限らず、判別した複数の感情ごとに、その度合いを出力するようにしても良い。
また、表情データを生成する際に、マイク102から入力された音声データを併用することも可能である。例えば、通話者が発声した声の大きさ(音圧)や発話時間間隔、あるいは、韻律的な特徴量である基本周波数などを抽出することにより、通話者の感情(「怒り」、「悲しみ」、「喜び」、「平静」など)を判別して、顔画像から判別した表情データに反映するようにしても良い。
かくのごとき方法を用いて表情データ抽出部205が表情データとして検知した通話者の発声内容や通話者の感情に基づいて、文字変換された音声データの欠落部分や感情部分を補正する機能を有する音声データ補正部202では、表情データ抽出部205から入力されてくる表情データをキーにして、文字変換された音声データに対して関係付けられた修飾データを音声修飾データベース(図示していない)から読み出して補正を加える動作を行う。
ここで、修飾データとしては、文字フォントや文字サイズや文字の色やアンダライン、太字、斜体などの文字用の書式を用いて文字を修飾するようにしても良い。例えば、通話者が「怒り」の表情で発声していると判断した場合は、文字フォントとしてゴシック体(英語におけるArial)を使ったり、文字色を赤で表示したり、文字サイズを大きくするなどの1ないし複数の修飾(強調)を行うことにより、文字変換された音声データにその旨を追加補正して、補正音声データとして生成することができる。これにより、例えば、通話相手に対して、翻訳後の音声データを画面にも同時に表示して通知したい場合においても、そのまま、前記補正音声データに対応した修飾を施した翻訳後の音声データを通話相手の画面に表示することができるので、通話者の感情を含む音声データを画面に表示させることができる。
さらには、修飾データとして、通話者の感情にフィットした言い回しで翻訳するように付加情報を追加することも可能である。このようにして、欠落部分や感情部分を補正した文字変換された音声データは、音声データ翻訳部203へ入力され、通話者の音声の欠落部分や感情部分を反映した形で通話相手の言語に翻訳される。
(発明の実施例の動作説明)
次に、本発明の実施例の動作について、図1、図2を用いてさらに説明する。図1のマイク102より入力された通話者の音声は、図2の音声データ生成部201にて音声データとして文字変換される。この文字変換された音声データは、通話者の感情が除去されてしまっているのみならず、通話者の音声の欠落部分も生じている。そこで、音声データ補正部202において、音声データ生成部201にて文字変換された音声データに補正が加えられ、通話者の感情部分や欠落部分が補正される。
この音声データ補正部202において補正を行う処理は、表情データ抽出部205から入力されてくる通話者の表情データをキーにするものであり、さらに、表情データ抽出部205における通話者の表情データの生成処理は、前述したように、カメラ部分101より入力された通話者の顔画像データを解析する画像解析部204の解析結果を基にして行われる。音声データ補正部202にて補正した文字変換された音声データは、選択スイッチ107Cにて選択されている通話相手の言語に音声データ翻訳部203にて翻訳されて、通話相手の携帯電話へと送られる。
なお、音声データ翻訳部203にて通話相手の言語に翻訳する際に、音声データ補正部202にて補正音声データ用に音声データを補正するために用いた修飾データそれぞれに対応する通話相手の言語の修飾用データを用いて、翻訳後の音声データを補正する。例えば、日本語のMSゴシック体の文字フォントを用いて修飾した補正音声データを英語に翻訳する場合には、Arailの文字フォントを用いて、補正変換される。さらに、通話者の感情を示す付加情報が補正音声データに付加されていた場合には、当該付加情報が示す感情にフィットした言い回しの音声データに翻訳する。
以上のように、図1の翻訳機能付き携帯電話装置100では、カメラ部分101に入力された通話者の顔画像データから抽出された表情データを利用して、マイク102に入力された通話者の音声を文字変換した音声データの欠落部分や感情部分を補正し、翻訳するための文字変換された音声データの精度を向上させるようにした機能を有する制御部105を備えていることを特徴としている。
(効果の説明)
すなわち、本発明による一実施例の翻訳機能付き携帯電話装置100においては、以下に記載するような効果が得られる。
翻訳機能付き携帯電話装置100にてテレビ電話の通話時に、マイク102から入力される通話者の音声を文字変換した音声データの欠落部分や感情部分を補正した後の補正音声データを通話相手の言語に翻訳するようにしているので、通話相手に送信する音声データの精度を向上することができ、テレビ電話の通話者同士の通話をより円滑に行うことができるという効果が得られる。
なお、前述した実施例においては、通話者の音声を通話相手へ送信する場合の翻訳機能付き携帯電話の送信動作について説明したが、通話相手からの音声データを受け取って、スピーカ106から音声を出力する際には、通話相手から送信されてくる翻訳後の音声データ中に含まれている修飾データが意味する通話相手の感情(「怒り」、「悲しみ」、「喜び」、「平静」など)に応じて、音量や発話時間間隔やイントネーションなどで、受信した音声データを修飾した音声を生成して、スピーカ106を鳴動させるようにしている。これにより、通話相手の感情を、言い回しのみならず音量や発話時間間隔やイントネーションとして表現した音声を出力することができる。さらには、通話相手の感情により修飾された翻訳後の音声データを、画面に表示させる動作を行わせることも可能である。
以上、本発明の好適実施例の構成を説明した。しかし、斯かる実施例は、本発明の単なる例示に過ぎず、何ら本発明を限定するものではないことに留意されたい。本発明の要旨を逸脱することなく、特定用途に応じて種々の変形変更が可能であることは、当業者には容易に理解できよう。
本発明による翻訳機能付き携帯電話装置の構成例を示すブロック構成図である。 図1に示す制御部のうち通話先相手へ伝達する機能部分を中心にその一例を示すブロック構成図である。 図2における表情データ抽出部の構成の一例を示すブロック構成図である。 従来の翻訳機能付き携帯電話装置の音声データの翻訳部分の構成を示すブロック構成図である。
符号の説明
100 翻訳機能付き携帯電話装置
101 カメラ部分
102 マイク
103 アンテナ
104 無線部
105 制御部
106 スピーカ
107 操作部
107A LCD表示部
107B テンキー
107C 選択スイッチ
201 音声データ生成部
202 音声データ補正部
203 音声データ翻訳部
204 画像解析部
205 表情データ抽出部
205A 表情解析部
205B 表情パターンDB(データベース)
301 音声データ生成部
302 音声データ翻訳部

Claims (15)

  1. ユーザの顔画像を撮影可能なカメラ部と、該ユーザの音声を文字変換して音声データを生成する音声データ生成部と、文字変換した前記音声データを通話相手の言語の翻訳文に翻訳する音声データ翻訳部と、翻訳した前記翻訳文を通話相手に送信する無線部とを備えた翻訳機能付き携帯電話装置において、前記カメラ部で撮影したユーザの顔画像から当該ユーザの表情データを抽出する表情データ抽出部と、該表情データ抽出部にて抽出したユーザの表情データに基づいて、当該ユーザの音声を文字変換した前記音声データの欠落部分や感情部分を補正して補正音声データとして出力する音声データ補正部と、をさらに備え、前記音声データ補正部にて補正した前記補正音声データを用いて、前記音声データ翻訳部にて通話相手の言語の翻訳文に翻訳することを特徴とする翻訳機能付き携帯電話装置。
  2. 前記表情データ抽出部は、前記カメラ部で撮影した当該ユーザの顔画像の目、眉、眉間、額、鼻、口唇のいずれか1ないし複数の各パーツ間の相対位置とその変化量を特徴量として解析する表情解析部と、当該ユーザの表情の前記特徴量を表情パターンとしてあらかじめ登録している表情パターンデータベースとを含み、前記表情解析部において解析された当該ユーザの前記特徴量により前記表情パターンデータデースを参照することにより、当該ユーザの表情データを抽出することを特徴とする請求項1に記載の翻訳機能付き携帯電話装置。
  3. 前記表情パターンデータベースに登録するユーザの前記表情パターンとして、あらかじめ定めた複数の感情それぞれに該当する当該ユーザの表情の特徴量をあらかじめ登録することを特徴とする請求項2に記載の翻訳機能付き携帯電話装置。
  4. 前記表情データ抽出部が、前記表情パターンデータベースを参照してユーザの表情データを抽出する際に、前記表情パターンデータベースに前記表情パターンとして登録したユーザの複数の感情それぞれの前記特徴量との近似度を、当該ユーザのそれぞれの感情の度合いとして表情データに含めて出力することを特徴とする請求項3に記載の翻訳機能付き携帯電話装置。
  5. 前記表情データ抽出部の前記表情パターンデータベースにあらかじめ登録するユーザの複数の感情として、少なくとも、怒り、悲しみ、喜び、平静の感情を含むことを特徴とする請求項3または4に記載の翻訳機能付き携帯電話装置。
  6. 前記音声データ補正部により、感情部分を補正した前記補正音声データを生成する際に、文字フォント、文字サイズ、文字色、アンダライン、太字、斜体のいずれか1ないし複数を用いて、ユーザの感情ごとに異なる書式で修飾した補正を行うことを特徴とする請求項1ないし5のいずれかに記載の翻訳機能付き携帯電話装置。
  7. 前記音声データ翻訳部は、前記補正音声データを通話相手の言語の翻訳文に翻訳する際に、ユーザの感情ごとに異なる書式で修飾した前記補正音声データに対応する前記通話相手の言語の書式に変換することを特徴とする請求項6に記載の翻訳機能付き携帯電話装置。
  8. 前記音声データ補正部により、感情部分を補正した前記補正音声データを生成する際に、ユーザの感情に適合した言い回しの翻訳を行うように指示する付加情報を前記補正音声データに追加して出力することを特徴とする請求項1ないし7のいずれかに記載の翻訳機能付き携帯電話装置。
  9. 前記音声データ翻訳部は、前記補正音声データを通話相手の言語の翻訳文に翻訳する際に、前記補正音声データに前記付加情報が追加されていた場合、該付加情報に指示されている言い回しに適合する表現を用いて翻訳することを特徴とする請求項8に記載の翻訳機能付き携帯電話装置。
  10. ユーザの顔画像を撮影可能なカメラ部を備え、該ユーザの音声を文字変換して音声データを生成する音声データ生成ステップと、文字変換した前記音声データを通話相手の言語の翻訳文に翻訳する音声データ翻訳ステップとを有し、翻訳した前記翻訳文を通話相手に送信する翻訳機能付き携帯電話装置における音声データ翻訳方法において、前記カメラ部で撮影したユーザの顔画像から当該ユーザの表情データを抽出する表情データ抽出ステップと、該表情データ抽出ステップにて抽出したユーザの表情データに基づいて、当該ユーザの音声を文字変換した前記音声データの欠落部分や感情部分を補正して補正音声データとして出力する音声データ補正ステップと、をさらに有し、前記音声データ補正部にて補正した前記補正音声データを用いて、前記音声データ翻訳ステップにて通話相手の言語の翻訳文に翻訳することを特徴とする音声データ翻訳方法。
  11. 前記表情データ抽出ステップは、前記カメラ部で撮影した当該ユーザの顔画像の目、眉、眉間、額、鼻、口唇のいずれか1ないし複数の各パーツ間の相対位置とその変化量を特徴量として解析する表情解析ステップと、当該ユーザの表情の前記特徴量を表情パターンとしてあらかじめ登録している表情パターンデータベースとを含み、前記表情解析ステップにおいて解析された当該ユーザの前記特徴量により前記表情パターンデータデースを参照することにより、当該ユーザの表情データを抽出することを特徴とする請求項10に記載の音声データ翻訳方法。
  12. 前記表情パターンデータベースに登録するユーザの前記表情パターンとして、あらかじめ定めた複数の感情それぞれに該当する当該ユーザの表情の特徴量をあらかじめ登録することを特徴とする請求項11に記載の音声データ翻訳方法。
  13. 前記表情データ抽出ステップが、前記表情パターンデータベースを参照してユーザの表情データを抽出する際に、前記表情パターンデータベースに前記表情パターンとして登録したユーザの複数の感情それぞれの前記特徴量との近似度を、当該ユーザのそれぞれの感情の度合いとして表情データに含めて出力することを特徴とする請求項12に記載の音声データ翻訳方法。
  14. 請求項10ないし13のいずれかに記載の音声データ翻訳方法をコンピュータにより実行可能なプログラムとして実現していることを特徴とする音声データ翻訳プログラム。
  15. 請求項14に記載の音声データ翻訳プログラムを、コンピュータにより読み取り可能な記録媒体に記録していることを特徴とするプログラム記録媒体。
JP2006191207A 2006-07-12 2006-07-12 翻訳機能付き携帯電話装置、音声データ翻訳方法、音声データ翻訳プログラムおよびプログラム記録媒体 Pending JP2008021058A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006191207A JP2008021058A (ja) 2006-07-12 2006-07-12 翻訳機能付き携帯電話装置、音声データ翻訳方法、音声データ翻訳プログラムおよびプログラム記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006191207A JP2008021058A (ja) 2006-07-12 2006-07-12 翻訳機能付き携帯電話装置、音声データ翻訳方法、音声データ翻訳プログラムおよびプログラム記録媒体

Publications (1)

Publication Number Publication Date
JP2008021058A true JP2008021058A (ja) 2008-01-31

Family

ID=39076949

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006191207A Pending JP2008021058A (ja) 2006-07-12 2006-07-12 翻訳機能付き携帯電話装置、音声データ翻訳方法、音声データ翻訳プログラムおよびプログラム記録媒体

Country Status (1)

Country Link
JP (1) JP2008021058A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010015352A (ja) * 2008-07-03 2010-01-21 Nec Corp 認証装置
JP2011253543A (ja) * 2010-06-03 2011-12-15 Electronics And Telecommunications Research Institute 通訳端末及び通訳端末間の相互通信を用いた通訳方法
WO2017130483A1 (ja) * 2016-01-25 2017-08-03 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02183371A (ja) * 1989-01-10 1990-07-17 Nec Corp 自動通訳装置
JPH04141772A (ja) * 1990-10-03 1992-05-15 Hitachi Ltd 翻訳機及びこれに用いるicカード
JPH0667601A (ja) * 1992-08-24 1994-03-11 Hitachi Ltd 手話通訳装置および手話通訳システム
JPH11112665A (ja) * 1997-09-30 1999-04-23 Meidensha Corp 携帯電話システム
JP2001127846A (ja) * 1999-10-29 2001-05-11 Nec Telecom Syst Ltd 無線電話機
JP2001215993A (ja) * 2000-01-31 2001-08-10 Sony Corp 対話処理装置および対話処理方法、並びに記録媒体
JP2002027125A (ja) * 2000-07-05 2002-01-25 Nec Corp 交換機における自動通話翻訳システム
JP2002237872A (ja) * 2001-02-08 2002-08-23 Naoto Kuramochi 翻訳機能を内蔵した携帯電話
JP2003115942A (ja) * 2001-10-04 2003-04-18 Matsushita Electric Ind Co Ltd 翻訳機能付き携帯電話機
JP2004015478A (ja) 2002-06-07 2004-01-15 Nec Corp 音声通信端末装置
JP2005065252A (ja) * 2003-07-29 2005-03-10 Fuji Photo Film Co Ltd 携帯電話機

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02183371A (ja) * 1989-01-10 1990-07-17 Nec Corp 自動通訳装置
JPH04141772A (ja) * 1990-10-03 1992-05-15 Hitachi Ltd 翻訳機及びこれに用いるicカード
JPH0667601A (ja) * 1992-08-24 1994-03-11 Hitachi Ltd 手話通訳装置および手話通訳システム
JPH11112665A (ja) * 1997-09-30 1999-04-23 Meidensha Corp 携帯電話システム
JP2001127846A (ja) * 1999-10-29 2001-05-11 Nec Telecom Syst Ltd 無線電話機
JP2001215993A (ja) * 2000-01-31 2001-08-10 Sony Corp 対話処理装置および対話処理方法、並びに記録媒体
JP2002027125A (ja) * 2000-07-05 2002-01-25 Nec Corp 交換機における自動通話翻訳システム
JP2002237872A (ja) * 2001-02-08 2002-08-23 Naoto Kuramochi 翻訳機能を内蔵した携帯電話
JP2003115942A (ja) * 2001-10-04 2003-04-18 Matsushita Electric Ind Co Ltd 翻訳機能付き携帯電話機
JP2004015478A (ja) 2002-06-07 2004-01-15 Nec Corp 音声通信端末装置
JP2005065252A (ja) * 2003-07-29 2005-03-10 Fuji Photo Film Co Ltd 携帯電話機

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSNB200100758001; [図解]わかる!次世代携帯電話 初版, 20010128, p.32-33, ダイヤモンド社 *
JPN6012003627; [図解]わかる!次世代携帯電話 初版, 20010128, p.32-33, ダイヤモンド社 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010015352A (ja) * 2008-07-03 2010-01-21 Nec Corp 認証装置
JP2011253543A (ja) * 2010-06-03 2011-12-15 Electronics And Telecommunications Research Institute 通訳端末及び通訳端末間の相互通信を用いた通訳方法
WO2017130483A1 (ja) * 2016-01-25 2017-08-03 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム

Similar Documents

Publication Publication Date Title
US10885318B2 (en) Performing artificial intelligence sign language translation services in a video relay service environment
US20170364484A1 (en) Enhanced text metadata system and methods for using the same
JP2023022150A (ja) 双方向音声翻訳システム、双方向音声翻訳方法及びプログラム
US20220327309A1 (en) METHODS, SYSTEMS, and MACHINE-READABLE MEDIA FOR TRANSLATING SIGN LANGUAGE CONTENT INTO WORD CONTENT and VICE VERSA
CN107871494B (zh) 一种语音合成的方法、装置及电子设备
JP2005202854A (ja) 画像処理装置、画像処理方法及び画像処理プログラム
WO2017195775A1 (ja) 手話会話支援システム
JP2019208138A (ja) 発話認識装置、及びコンピュータプログラム
CN111326138A (zh) 语音生成方法及装置
US20170270701A1 (en) Image processing device, animation display method and computer readable medium
JP2008125815A (ja) 会話ロボットシステム
KR20210085938A (ko) 영상의 음성을 2d 및 3d 아바타, 애니메이션으로 번역해주는 수화번역 시스템 및 그 제어방법
JP2008021058A (ja) 翻訳機能付き携帯電話装置、音声データ翻訳方法、音声データ翻訳プログラムおよびプログラム記録媒体
JP2004015478A (ja) 音声通信端末装置
CN105913841B (zh) 语音识别方法、装置及终端
US11600279B2 (en) Transcription of communications
KR101981091B1 (ko) 감정시각화자막 생성장치
US11848026B2 (en) Performing artificial intelligence sign language translation services in a video relay service environment
CN113115104B (zh) 视频处理方法、装置、电子设备及存储介质
WO2022091426A1 (ja) 顔画像処理システム、顔画像生成用情報提供装置、顔画像生成用情報提供方法および顔画像生成用情報提供プログラム
US10964308B2 (en) Speech processing apparatus, and program
JP6730651B1 (ja) 音声変換装置、音声変換システム及びプログラム
CN108364631B (zh) 一种语音合成方法和装置
KR100849027B1 (ko) 음성 신호에 대한 립싱크 동기화 방법 및 장치
JP2006048352A (ja) キャラクタ映像表示機能付き通信端末およびその制御方法

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20080226

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090612

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20091211

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20091214

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120120

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120131

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120329

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120807

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121023

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20121030

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20121221

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140530

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20140917