JP2004200985A - 通話音声のテキスト変換システム - Google Patents

通話音声のテキスト変換システム Download PDF

Info

Publication number
JP2004200985A
JP2004200985A JP2002366514A JP2002366514A JP2004200985A JP 2004200985 A JP2004200985 A JP 2004200985A JP 2002366514 A JP2002366514 A JP 2002366514A JP 2002366514 A JP2002366514 A JP 2002366514A JP 2004200985 A JP2004200985 A JP 2004200985A
Authority
JP
Japan
Prior art keywords
text
information
text data
voice
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002366514A
Other languages
English (en)
Other versions
JP4232453B2 (ja
Inventor
Masahiro Goto
真広 後藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Corp
Original Assignee
Denso Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso Corp filed Critical Denso Corp
Priority to JP2002366514A priority Critical patent/JP4232453B2/ja
Publication of JP2004200985A publication Critical patent/JP2004200985A/ja
Application granted granted Critical
Publication of JP4232453B2 publication Critical patent/JP4232453B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Mobile Radio Communication Systems (AREA)
  • Telephonic Communication Services (AREA)

Abstract

【課題】携帯電話などで通話するときに、音声が聞き取りにくい場合でも意思の疎通を図りやすくする。
【解決手段】携帯電話機1a,1bによる通話を中継する交換機4にサーバ5を接続し、音声情報を音声認識処理してテキストデータに変換して文字情報としても通話相手や話者に送信する。このとき、テキストデータには、話者付加情報や、通話情報の音量を示す音量付加情報や、感情を推定して付加する感情付加情報が含まれている。携帯電話機1a,abは、受信したテキストデータの内容を文字の大きさで音量の違いを示し、文字の色を変えてそのときの感情を表現して表示する。これにより、意思の疎通が図りやすくなる。
【選択図】 図1

Description

【0001】
【発明の属する技術分野】
本発明は、電話機で通話をする場合の情報伝達の正確性を高めることができるようにした通話音声のテキスト変換システムに関する。
【0002】
【発明が解決しようとする課題】
携帯電話機などを使って通話をする場合に、使用環境や場所によっては相手の音声が聞き取りにくい場合があり、通話内容を把握するのに何度も聞き返したりするなど意思の疎通が図りにくくなることがある。通信技術を改善することによりこのような問題が解決できる方向に向かうことは予想できるが、現状ではすぐに解決を図ることができない場合がある。
【0003】
また、お年寄りや耳の不自由な人などにとっては、単に通信技術だけではなく、音声情報の伝達が正常になされていても意思の疎通がはかりにくくなる場合がある。さらには、話者がうっかりしていて、電話をかけて話し合ったことを忘れてしまったり、どんな印象であったかなどについても正確な記憶がなくなる場合もあり、単純に通信技術だけの問題ではない部分があった。
【0004】
本発明は上記事情に鑑みてなされたものであり、その目的は、電話で通話するときに、相手の言っていることを把握しやすくすることができると共に、意思の疎通を図りやすくすることができる通話音声のテキスト変換システムを提供することにある。
【0005】
【課題を解決するための手段】
請求項1の発明によれば、電話機を使って対話をする場合に、話者が通話音声を入力すると、相手方に通話音声が伝わると共に、テキスト変換手段により、その通話音声が音声認識処理を経てテキストデータに変換され、音量情報付加手段により、通話音声の音量に応じた文字の大きさを指定する情報が付加されるので、その情報を表示することで話者は相手の通話音量に比例した文字の大きさで表現したテキストをみることができる。これにより、聞き取りにくい場合や聞き漏らした場合などにおいても、そのテキスト情報から相手の通話の状況を認識するための情報が増えることになり、意思の疎通が図りやすくなる。
【0006】
請求項2の発明によれば、上記請求項1の発明において、感情推定手段により、通話音声により分析可能な話者の感情を得て、感情情報付加手段によりテキストデータに感情情報を付加するので、その情報を表示することで話者は相手の通話音声に現れる感情を理解して対応することができ、聞き取りにくい場合や聞き漏らした場合などにおいても、そのテキスト情報から相手の通話の状況を認識するための情報が増えることになり、意思の疎通が図りやすくなる。
【0007】
請求項3の発明によれば、上記各発明において、話者情報付加手段により、変換されたテキストデータを話者別に対応して表示させる話者表示情報をテキストデータに付加するので、聞き取りにくい場合や聞き漏らした場合などにおいても、そのテキスト情報から相手の通話の状況を認識するための情報が増えることになり、意思の疎通が図りやすくなる。
【0008】
請求項4の発明によれば、上記各発明において、テキストデータ送信手段により、通話したときのテキストデータを要求に応じて電子メールとして送信することができるので、通話した内容を記録として残すことができ、しかも通話の状況を文字の大きさや感情情報などで補って理解することができるようになる。
【0009】
【発明の実施の形態】
以下、本発明を携帯電話機を用いたシステムに適用した場合の一実施形態について図面を参照して説明する。
図1はシステムの全体構成を概略的に示すもので、携帯電話機1a、1bは、基地局2a,2bなどを経由して電話網3に接続可能で、交換局4を介して携帯電話同士あるいは有線電話との間の通話が行えるように構成されている。
【0010】
交換局4にはテキストデータ変換装置としてのサーバ5が接続されており、これは、本発明でいうところの音量情報付加手段、感情情報付加手段、話者情報付加手段、テキストデータ送信手段としての機能を兼ね備えたものである。なお、これらの手段の機能は、サーバ5において後述するソフトウェアを実行することにより実現される。
【0011】
サーバ5は、インターネット6などのネットワークを介して各種プロバイダなどが運営しているメールサーバ7a,7bなどにアクセス可能である。メールサーバ7a,7bは、インターネット6を介して携帯電話機1a,1bなどの使用者が所持するパソコン8a,8bからアクセス可能となっている。
【0012】
次に、本実施形態の作用について図2ないし図4も参照して説明する。
図2は音声情報をテキストデータに変換して表示させる場合の基本的な動作について示している。いま、携帯電話機1aを使用する話者Aが携帯電話機1bを使用する話者Bに電話をかける場合を例にとって説明する。
【0013】
使用者Aが携帯電話1aを使って使用者Bの携帯電話機1bに電話をかけると、基地局1a、通信網3、交換局4から基地局1bを経由して携帯電話機1bと通話ができるようになる。この状態で、まず、話者Aが音声入力で「こんにちは」と話すと(ステップA1)、その音声情報は携帯電話機1bに伝わって音声として出力される(ステップA2)と共に、交換局4からサーバ5に入力され、サーバ5においてテキストデータに変換されるようになる。
【0014】
サーバ5においては、まず受け付けた音声入力信号を音声認識処理を行い(ステップA3)、これをテキストデータに変換する(ステップA4)。このとき、サーバ5は、受け付けた音声入力信号について後述するような入力音声の解析処理を行って音量や感情などに関するデータの付加を行う(図3参照)。そして、この解析処理を経て得られたテキストデータおよび付加情報を聞き手である話者Bの携帯電話機1bと音声入力した話者Aの携帯電話機1aに共に送信する(ステップA4)。
【0015】
これにより、携帯電話機1a,1bにおいては、それぞれ受信したテキストデータである「こんにちは」の言葉を表示部9a,9bに表示させるようになる(図2ステップA5,A6およびその表示例を参照)。このとき、携帯電話機1a側での表示は、自分が話した言葉のテキストデータであるから、自分を示す「自」の文字がテキストデータの先頭に表示され、携帯電話機1b側での表示は、相手が話した言葉のテキストデータであるから、相手を示す「相」の文字がテキストデータの先頭に表示される。
【0016】
次に、話者Bがこれに答えて、例えば「こちらこそ」と携帯電話機1bに音声入力をした場合(ステップA7)には、その音声情報が上述と同様にして携帯電話機1bから携帯電話機1aに伝わって音声として出力され(ステップA8)、サーバ5においてテキストデータに変換されるようになる。
【0017】
サーバ5においては、音声認識処理、テキストデータ変換処理を行って(ステップA9,10)、得られたテキストデータおよび付加情報を聞き手である話者Aの携帯電話機1aと音声入力した話者Bの携帯電話機1bに共に送信する(ステップA10)。
【0018】
携帯電話機1a,1bにおいては、テキストデータである「こちらこそ」の言葉をそれぞれの表示部に表示させるようになる(図2ステップA11,A12およびその表示例を参照)。また、携帯電話機1a,1bでのそれぞれの表示は、「相」、「自」の文字がテキストデータの先頭に表示される。
【0019】
次に、上述したサーバ5がステップA4,A10で実行したテキスト変換処理において、入力音声の解析処理を行って音量や感情などに関するデータの付加を行う処理について図3を参照して説明する。この解析処理では、サーバ5は、入力された音声データについて、まずその音量解析処理を行う(ステップB1)。
【0020】
ここでは、入力された音声の音量レベルを算出し、予め決められたしきい値で判別することで音量を小、中、大の3つのレベルに判別する。判別した結果に応じて、その対応するテキストの文字サイズを小、中、大となるようにテキストデータへの付加情報として設定する(ステップB2〜B5)。
【0021】
テキストデータにこの付加情報が設定されている場合には、前述した表示部に表示をする場合に、その表示部が文字サイズを設定して表示することができる場合にこれを付加情報に対応した文字サイズで表示させることができる。ここで、文字サイズの「中」は、通常の会話レベルに相当している。
【0022】
次に、サーバ5は、感情解析処理を行う(ステップB6)。これは、入力音声の口調を解析してその話者の感情を推定しようとするものである。具体的には、感情解析処理そのものについては、例えば、喜怒哀楽などの感情を代表する言葉や会話の抑揚のパターン、あるいは音声の波形パターンや平常時に対する声の高低の違いなどを分析することで推定することができる。
【0023】
ここでは、サーバ5は、推定する感情の分類を「喜」,「怒」,「哀」,「楽」および「普通」の5つとしている(ステップB7)。これらに対応して文字の色を「黄色」,「赤色」,「青色」,「緑色」あるいは「黒色」に設定するように情報を付加することになる(ステップB8〜B12)。
【0024】
このような分析を行った結果は、テキストデータに付加情報として付加されるが、この付加情報を表示可能な表示部9aでは、例えば図4に示すように表示動作を行う。また、付加情報の表示ができない表示部では、通常のサイズの文字を使って表示されるようになっている。
【0025】
同図(a)では、相手から困った口調(「哀」に相当)で話しかけられている場合に、こちら(自分)からは怒った口調(「怒」に相当)で答えているところを示している。相手を示す「相:」表示S1の後に、驚いた状態を「普通」を示す黒色の大の文字サイズで「えっ、」表示S2が表示され、このあとに「哀」状態を示す青色で中の文字サイズで「それは困るな」表示S3が表示される。
【0026】
これに応じて、自分を示す「自:」表示S4に続いて、怒った口調を示す赤色文字で「そんなこと言っても」表示S5の表示の後、赤色文字で大の文字サイズで「ダメ」表示S6、赤色文字で中の文字サイズで「だよ」表示S7が表示される。そして、このように、感情に応じて色が変わると共に、声の大きさに応じて文字のサイズが変わるので、視覚的にも相手の話す調子を理解しやすくなる。
【0027】
一方、同図(b)では、喜びの口調で語られる会話の内容を示す場合を示している。「自:」表示S8の後、「喜」状態を示す黄色の大の文字サイズで「合格しました」表示S9が表示され、これに答えて、「相:」表示S10の後、「喜」状態を示す黄色の中の文字サイズで「良かったね」表示S11が表示されている。
【0028】
サーバ5は、上述のリアルタイムの処理に加えて、メール配信サービスを行うように構成されている。これは、予め携帯電話機1a,1bの使用者である話者A,Bからメールサービスの依頼を受けている場合や、あるいは通話毎に設定可能なメール配信サービスを希望する旨の要求を受けている場合などに実施されるようになっている。
【0029】
これは、上述したような通話音声について、音声認識してテキストデータに変換したものに、話者情報を加えて通常のメールにして送信するものである。このとき、テキストデータには音量情報、感情情報を付加してそのまま送信することもできる。メールは、例えば各話者A,Bなどが契約しているプロバイダのメールサーバ7a,7bにインターネット6を経由して配信され、PC8a,8bからダウンロードすることで見ることができる。
【0030】
これにより、実際に通話をしていたときの声の大きさや感情を確認しながら通話内容を読むことができ、その場の雰囲気や状況を把握しやすくなるし、あるいは、通話記録内容をメモなどしていなくても後で受信したメールによって確認することができるようになり、通信情報としても正確なものとすることができるようになる。
【0031】
メールの配信先は、PC8a,8bなどに限らず、例えばモバイル機器であるPDAや、インターネットにアクセス可能なカーナビゲーション装置などに設定することもできる。さらには、携帯電話機1a,1bそのものに、メールで配信するようにしても良い。
【0032】
このような本実施形態によれば、通話相手との会話内容を交換機4に接続されたサーバ5により、音声認識処理およびテキストデータ変換処理を行うことで、文字情報として得ることができるので、音声が聞き取りにくい場合でも文字情報を参照して通話の内容を確実に把握できるようになる。また、通話音声の音量や感情に応じて文字の大きさや色を変化させることができるので、相手の通話時の状況をより把握しやすくなり、意思の疎通が図りやすくなる。
【0033】
また、通話内容を後でメールで文字情報として確認することができるので、通話記録として残す場合も確実性が増し、また、メモなどを取る必要がなくなるので、会話に集中することができるようになる。
【0034】
本発明は上記しかつ図面に示した実施形態に限定されるものではなく、次のように変形することが出来る。
感情情報は、色以外に、文字のパターンや文字の太さあるいは文字の線の種類、さらには文字の網掛けのパターンなどで表現することもできる。
【0035】
感情情報を示す色は、文字そのものの色として示すことに加えて、文字の背景色として表示したり、マーカの色として表示することもできる。
感情情報は、話者側で設定スイッチなどを操作して話しているときの気分を示すボタンを操作してそのときの感情を直接相手側に伝えるようにすることもできる。
【0036】
感情表現や音量表現をする付加情報については、非表示にする機能を設定する機能を持たせても良い。
自分の会話部分については非表示にすることもできる。これはスイッチにより設定するようにすれば良い。
【0037】
テキストデータをメールで受ける媒体は、PCに限らず、PDAや他の携帯電話機など適宜の媒体を指定して受けることができる。
【図面の簡単な説明】
【図1】本発明の一実施形態を示す全体構成の概略図
【図2】携帯電話機間およびサーバとの間のやり取りを示すチャート
【図3】音量解析処理および感情解析処理の概略的なフローチャート
【図4】表示画面の例を示す図
【符号の説明】
1a,1bは携帯電話機(電話機)、2a,2bは基地局、3は電話網、4は交換局、5はサーバ(テキスト変換手段、音量情報付加手段、感情推定手段、感情情報付加手段、話者情報付加手段)、6はインターネット(ネットワーク)、7a,7bはメールサーバ、8a,8bはPC、9a,9bは表示部である。

Claims (4)

  1. 電話機を通じて対話をする話者の通話音声を入力し、これを音声認識処理してテキストデータに変換するテキスト変換手段と、
    前記通話音声の音量を解析して音量に応じた文字の大きさを指定する文字サイズ情報を前記テキストデータに付加する音量情報付加手段と
    を備えたことを特徴とする通話音声のテキスト変換システム。
  2. 請求項1に記載のテキスト変換システムにおいて、
    前記通話音声から分析可能な話者の感情を推定する感情推定手段と、
    この感情推定手段により推定された前記話者の感情に応じた色もしくはパターンを指定する感情情報を前記テキストデータに付加する感情情報付加手段と
    を備えたことを特徴とする通話音声のテキスト変換システム。
  3. 請求項1または2に記載の通話音声のテキスト変換システムにおいて、
    前記変換されたテキストデータを話者別に対応して表示させる話者表示情報を前記テキストデータに付加する話者情報付加手段を備えたことを特徴とする通話音声のテキスト変換システム。
  4. 請求項1ないし3のいずれかに記載の通話音声のテキスト変換システムにおいて、
    前記テキストデータを要求に応じて電子メールとして送信するテキストデータ送信手段を備えたことを特徴とする通話音声のテキスト変換システム。
JP2002366514A 2002-12-18 2002-12-18 通話音声のテキスト変換システム Expired - Fee Related JP4232453B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002366514A JP4232453B2 (ja) 2002-12-18 2002-12-18 通話音声のテキスト変換システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002366514A JP4232453B2 (ja) 2002-12-18 2002-12-18 通話音声のテキスト変換システム

Publications (2)

Publication Number Publication Date
JP2004200985A true JP2004200985A (ja) 2004-07-15
JP4232453B2 JP4232453B2 (ja) 2009-03-04

Family

ID=32763693

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002366514A Expired - Fee Related JP4232453B2 (ja) 2002-12-18 2002-12-18 通話音声のテキスト変換システム

Country Status (1)

Country Link
JP (1) JP4232453B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009171336A (ja) * 2008-01-17 2009-07-30 Nec Corp 携帯通信端末
JP2011065516A (ja) * 2009-09-18 2011-03-31 Nec Corp 文字列変換装置及び文字列変換方法
JP2012113589A (ja) * 2010-11-26 2012-06-14 Nec Corp 行動促進装置、行動促進方法およびプログラム
CN102597914A (zh) * 2009-10-29 2012-07-18 伊梅森公司 用于语音到文本转换的触觉增加的系统和方法
CN113409790A (zh) * 2020-03-17 2021-09-17 Oppo广东移动通信有限公司 语音转换方法、装置、终端及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09206291A (ja) * 1996-02-02 1997-08-12 Japan Small Corp 人の感情・状態を検出する装置
JP2001134290A (ja) * 1999-11-08 2001-05-18 Just Syst Corp 音声認識システム、方法及び記録媒体
JP2001257775A (ja) * 2000-03-10 2001-09-21 Mitsubishi Electric Corp 情報提供システム
JP2002344574A (ja) * 2001-05-15 2002-11-29 Aruze Corp 移動体通信機器
JP2004072310A (ja) * 2002-08-05 2004-03-04 Matsushita Electric Ind Co Ltd テレビ電話装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09206291A (ja) * 1996-02-02 1997-08-12 Japan Small Corp 人の感情・状態を検出する装置
JP2001134290A (ja) * 1999-11-08 2001-05-18 Just Syst Corp 音声認識システム、方法及び記録媒体
JP2001257775A (ja) * 2000-03-10 2001-09-21 Mitsubishi Electric Corp 情報提供システム
JP2002344574A (ja) * 2001-05-15 2002-11-29 Aruze Corp 移動体通信機器
JP2004072310A (ja) * 2002-08-05 2004-03-04 Matsushita Electric Ind Co Ltd テレビ電話装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009171336A (ja) * 2008-01-17 2009-07-30 Nec Corp 携帯通信端末
JP2011065516A (ja) * 2009-09-18 2011-03-31 Nec Corp 文字列変換装置及び文字列変換方法
CN102597914A (zh) * 2009-10-29 2012-07-18 伊梅森公司 用于语音到文本转换的触觉增加的系统和方法
JP2014211900A (ja) * 2009-10-29 2014-11-13 イマージョンコーポレーションImmersion Corporation 音声−テキスト変換の触覚増強のためのシステム及び方法
US9275653B2 (en) 2009-10-29 2016-03-01 Immersion Corporation Systems and methods for haptic augmentation of voice-to-text conversion
JP2012113589A (ja) * 2010-11-26 2012-06-14 Nec Corp 行動促進装置、行動促進方法およびプログラム
CN113409790A (zh) * 2020-03-17 2021-09-17 Oppo广东移动通信有限公司 语音转换方法、装置、终端及存储介质

Also Published As

Publication number Publication date
JP4232453B2 (ja) 2009-03-04

Similar Documents

Publication Publication Date Title
US7706510B2 (en) System and method for personalized text-to-voice synthesis
CA2539649C (en) System and method for personalized text-to-voice synthesis
CN113194203A (zh) 一种用于听障人士的沟通系统、接听拨打方法及通讯系统
JPWO2015083741A1 (ja) 中継装置、表示装置および通信システム
KR20100081022A (ko) 전화번호부 업데이트 방법 및 이를 이용한 휴대 단말기
JP4232453B2 (ja) 通話音声のテキスト変換システム
US20230247131A1 (en) Presentation of communications
JP2009171336A (ja) 携帯通信端末
US8335297B2 (en) System and method for a telephone panic button
JP2003069662A (ja) 電話装置及びコードレス電話装置
JP2002027039A (ja) 通信通訳システム
EP2693429A1 (en) System and method for analyzing voice communications
JP2007259427A (ja) 携帯端末装置
JP2005039501A (ja) 携帯電話録音サービスシステム、方法およびプログラム
JP2002041279A (ja) エージェント伝言システム
KR102221015B1 (ko) 대리통화 서비스 장치 및 방법
JP2002374366A (ja) 通信装置および通信システム
JP6521397B2 (ja) 電話システム、電話機、及び電話転送方法
JP6659066B1 (ja) 音声通話システム、音声通話制御装置、音声通話プログラム、及び音声通話方法
US20060078098A1 (en) Answering phone calls
JP2005073181A (ja) Ip電話機
JP2016144024A (ja) 音声メモ保存機能を有する電話装置
KR100664124B1 (ko) 이동통신 단말기의 통화 종료음 송신 기능 구현방법
KR100587956B1 (ko) 문자 및 음성입력을 통한 이동통신단말기용 맞춤형 벨소리제작방법 및 시스템
JP2005123869A (ja) 通話内容書き起こしシステムおよび通話内容書き起こし方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050207

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080213

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080219

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080417

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081118

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081201

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111219

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121219

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131219

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees