JP2003289387A - ボイスメッセージ処理システムおよび方法 - Google Patents

ボイスメッセージ処理システムおよび方法

Info

Publication number
JP2003289387A
JP2003289387A JP2003068978A JP2003068978A JP2003289387A JP 2003289387 A JP2003289387 A JP 2003289387A JP 2003068978 A JP2003068978 A JP 2003068978A JP 2003068978 A JP2003068978 A JP 2003068978A JP 2003289387 A JP2003289387 A JP 2003289387A
Authority
JP
Japan
Prior art keywords
voice message
data
speaker
voice
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003068978A
Other languages
English (en)
Other versions
JP4619623B2 (ja
Inventor
Eric I-Chao Chang
イ−チャオ チャン エリック
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2003289387A publication Critical patent/JP2003289387A/ja
Application granted granted Critical
Publication of JP4619623B2 publication Critical patent/JP4619623B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/64Automatic arrangements for answering calls; Automatic arrangements for recording messages for absent subscribers; Arrangements for recording conversations
    • H04M1/65Recording arrangements for recording a message from the calling party
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/26Recognition of special voice characteristics, e.g. for use in lie detectors; Recognition of animal voices
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/64Automatic arrangements for answering calls; Automatic arrangements for recording messages for absent subscribers; Arrangements for recording conversations
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/57Arrangements for indicating or recording the number of the calling subscriber at the called subscriber's set
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/60Medium conversion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2242/00Special services or facilities
    • H04M2242/22Automatic class or number identification arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/42025Calling or Called party identification service
    • H04M3/42034Calling party identification service
    • H04M3/42042Notifying the called party of information on the calling party
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/53Centralised arrangements for recording incoming messages, i.e. mailbox systems
    • H04M3/533Voice mail systems
    • H04M3/53333Message receiving aspects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q3/00Selecting arrangements
    • H04Q3/72Finding out and indicating number of calling subscriber

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

(57)【要約】 【課題】 ボイスメッセージに種々の情報を付加する。 【解決手段】 分散データプロセッサは、ボイスメッセ
ージにアクセスして、所定の情報をボイスメッセージか
ら抽出する。データプロセッサはボイスメッセージデー
タ記憶に格納されたデータに抽出された情報を付加す
る。ユーザインタフェースコンポーネントは、付加され
たデータを持つボイスメッセージへのユーザアクセスを
提供する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声処理に関し、
より具体的には、分散システムによって受信されたボイ
スメッセージを処理するためのボイスメッセージ処理に
関する。
【0002】
【従来の技術】現在、多くの人々が広範な種類の情報源
から極めて多くの種々のメッセージを受信する。例え
ば、人々にとって、週に数十通のボイスメールメッセー
ジを受信することは珍しいことではない。現在ユニファ
イドメッセージを使用することが、この問題を悪化させ
ている。ユニファイドメッセージシステムにおいては、
広範な種類の情報源から受信されたメッセージ、例えば
ボイスメッセージ、電子メールメッセージ、ファックス
メッセージおよびインスタントメッセージなどは、シー
ムレスに結び付けられてアクセスすることができる。し
かしながら、電子メールメッセージおよびインスタント
メッセージシステムと比べ、ボイスメッセージに関連す
る情報の種類は非常に限定される。
【0003】
【発明が解決しようとする課題】例えば、電子メールメ
ッセージは、通常、その送信者の識別情報、件名および
優先順位を含む。同様に、このような情報は、元々テキ
ストなので、非常に容易にスキャンたり、コピーやペー
ストをしたりすることができる。反対に、ボイスメール
メッセージは、通常、送信者のいかなる識別情報も持た
ない。発信者表示が組み込まれたシステムでは、入力し
ている番号を識別することができ、その入力している番
号が個人に関連付けられていれば、送信者と思われる人
を識別することもできる。しかしながら、このようなシ
ステムが追跡するのは電話器だけであって、話者ではな
い。通常、ボイスメールメッセージは、件名や優先順位
に関する指示が含まれておらず、元々書かれたものでは
なく音声なので、スキャンしたり、コピーやペーストを
したりするのも困難である。
【0004】ボイスメッセージに関連する情報が不足し
ているため、処理にはより多くの時間が費やされること
となる。例えば、件名や送信者をざっと見て多くの電子
メールメッセージを除去し、必要でなければ直ちにメー
ルボックスから削除したり、所定のホルダを構成したり
することができる。実際、特定のユーザからのメールメ
ッセージ、あるいは特定の件名を持つメールメッセージ
を削除するための規則を指定して、自動的にこれらの処
理をすることさえできる。
【0005】一方、ユーザは単に送信者や件名などの基
本的な情報を抽出するだけでもメッセージを1件1件聞
かなければならないので、ボイスメールメッセージを調
べるには、一般に非常に多くの時間を必要とする。現時
点では、ボイスメールメッセージを(送信者、件名ある
いは緊急度で整理するなど)予め構成しておくための規
則を自動的に生成することも、実質上不可能である。
【0006】
【課題を解決するための手段】分散データ記憶上に複数
のボイスメッセージを示すボイスメッセージデータを格
納することによって、分散システムにおいてはボイスメ
ッセージが処理される。分散データプロセッサは、ボイ
スメッセージにアクセスして、そのボイスメッセージか
ら所定の情報を抽出する。次に、データプロセッサは、
ボイスメッセージデータ記憶に格納されたデータに抽出
された情報を付加する。ユーザは、ユーザインタフェー
スコンポーネントにより、付加されたデータをもってボ
イスメッセージをアクセスすることができる。
【0007】一実施形態において、分散ボイスデータプ
ロセッサは、ソートや警告の生成などユーザ選択の規則
をそのデータに適用する。
【0008】ボイスデータプロセッサは、例えば(話者
識別モデルを用いた)話者の識別、話者の感情や発話速
度のような広範な情報を抽出する。ボイスデータプロセ
ッサは、また、メッセージをユーザによって選択可能な
所定の発話速度に標準化することもできる。一実施形態
において、ボイスデータプロセッサは、メッセージを文
字に転写(transcribing)して要約し、ボ
イスメッセージに関し(意味解析のような)自然言語処
理を実行するための文字転写(transcripti
on)コンポーネントも含む。
【0009】ユーザ入力によって、ユーザはボイスメッ
セージを扱うための広範囲のユーザ起動入力を得ること
ができる。このような入力は、例えばボイスメッセージ
の速度を上げたり、または下げるための速度変更入力、
規則を設定するための入力、ボイスメッセージから抽出
された種々の情報の表示、およびユーザによって選択あ
るいは除外された規則の表示を含む。
【0010】
【発明の実施の形態】本発明は、分散処理システム上で
実現され、所定の情報をボイスメッセージから抽出す
る。本発明は、所定の情報を抽出して、抽出された情報
をもつボイスメッセージを含むボイスデータ記憶に付加
する。ユーザインタフェースによって、ボイスメッセー
ジは、追加された付加情報を付与して容易に取り扱うこ
とができる。本明細書の分散されたとの記載は、サーバ
を含まないシステムを意味し、デスクトップシステム、
パーソナルデジタルアシスタント(PDA)、電話、ラ
ップトップコンピュータなどのような個人ユーザがコン
トロールするシステムを意味する。したがって、例え
ば、本明細書で分散処理プロセッサを議論する際、それ
は例えばサーバ上に存在するというよりも、ネットワー
クの一部とすることができるのであって、ユーザ個人が
コントロールする装置上に存在するプロセッサを意味す
る。
【0011】図1は、本発明を実施することができる適
切なコンピューティングシステム環境100を例示す
る。コンピューティング環境100は適切なコンピュー
ティング環境の一例にすぎず、本発明の使用または機能
の範囲に関しいかなる限定を示唆することも企図してい
ない。コンピューティング環境100は、例示の動作環
境100に示されたいかなる各コンポーネントまたはそ
の組み合わせに依存し、またはこれらを要求するものと
解釈すべきではない。
【0012】本発明は、多くの他の汎用のまたは専用の
コンピューティングシステム環境または構成とともに動
作することができる。本発明で使用するのに適する例と
してよく知られたコンピューティングシステム、環境、
および/または構成、例えばパーソナルコンピュータ、
ハンドヘルドまたはラップトップ装置、マルチプロセッ
サシステム、マイクロプロセッサベースのシステム、セ
ットトップボックス、プログラム可能なコンシューマ電
子機器、ネットワークPC、ミニコンピュータ、マイン
フレームコンピュータ、上記のいずれかのシステムまた
は装置を含む分散コンピューティング環境などが含まれ
るが、これに限定されない。
【0013】本発明は、コンピュータによって実行され
るプログラムモジュールといったコンピュータ実行可能
命令の通常のコンテキストで記述することができる。一
般に、プログラムモジュールは、特定のタスクを実行し
あるいは特定の抽象データタイプを実装するルーチン、
プログラム、オブジェクト、コンポーネント、データ構
造などを含む。本発明はまた、分散コンピューティング
環境で実施することもでき、そこではコミュニケーショ
ンネットワークを通して接続されたリモート処理装置に
よってタスクが実行される。分散コンピューティング環
境において、プログラムモジュールは、メモリ記憶装置
を含むローカルおよびリモートの双方のコンピュータ記
憶媒体に置くことができる。
【0014】図1を参照すると、本発明を実施するため
の例示のシステムは、コンピュータ110の形の汎用コ
ンピューティング装置を含む。コンピュータ110のコ
ンポーネントには、処理ユニット120、システムメモ
リ130および、システムメモリを含む種々のシステム
コンポーネントを処理ユニット120に結合するシステ
ムバス121を含むがこれに限定されない。システムバ
ス121は、いかなる種類のバスアーキテクチャをも使
用するメモリバスまたはコントローラ、ペリフェラルバ
スおよびローカルバスを含む数種のバス構造とすること
ができる。例として、このようなアーキテクチャには工
業標準アーキテクチャ(ISA)バス、マイクロチャネ
ルアーキテクチャ(MCA)バス、拡張ISA(EIS
A)バス、ビデオ電子標準化協会(VESA)ローカル
バスおよびメザニンバスとしても知られる周辺コンポー
ネント相互接続(PCI)バスが含まれるがこれに限ら
れない。
【0015】コンピュータ110は、通常、種々の読み
取り可能媒体を含む。コンピュータ読み取り可能媒体
は、コンピュータ110によりアクセス可能ないかなる
媒体とすることができ、揮発性および不揮発性媒体、並
びに取外し可能および固定媒体の双方を含む。例とし
て、コンピュータ読み取り可能媒体は、コンピュータ記
憶媒体および通信媒体を備えることができるが、これに
限られない。コンピュータ記憶媒体は、情報、例えばコ
ンピュータ読み取り可能命令、データ構造、プログラム
モジュールまたはその他のデータを記憶するためのいず
れかの方法または技術で実施される揮発性および不揮発
性媒体、並びに取外し可能および固定媒体の双方を含
む。コンピュータ記憶媒体は、RAM、ROM、EEP
ROM、フラッシュメモリまたはその他のメモリ技術、
CD−ROM、デジタル多用途ディスク(DVD)また
はその他の光ディスク記憶、磁気カセット、磁気テー
プ、磁気記憶ディスクまたはその他の磁気記憶機器、あ
るいは所定の情報を記憶するための使用およびコンピュ
ータ110からのアクセスが可能な他のいずれかの媒体
も含むがこれに限られない。通信媒体は、一般に、コン
ピュータ読み取り可能命令、プログラムモジュールある
いはその他のデータから変調されたデータ信号、例えば
搬送波やその他の伝送手法に具現化するもであり、いか
なる配信媒体をも含む。用語「変調されたデータ信号」
とは、一定の手法、例えば情報を信号に符号化して設定
または変更された1つまたは複数の特性を有する信号を
意味する。例として、通信媒体は、有線ネットワークや
ディレクトワイヤード接続などの有線媒体および音声、
電波、赤外線その他のような無線媒体を含むが、これに
限られない。コンピュータ読み取り可能媒体の範囲には
上述のいずれの組み合わせも含まれるべきである。
【0016】システムメモリ130は、コンピュータ記
憶媒体を揮発性および/または不揮発性のメモリ、例え
ば読取専用メモリ(ROM)131および逐次アクセス
メモリ(RAM)132の形式で備える。基本入出力シ
ステム133(BIOS)は、スタートアップの最中な
どにコンピュータ110内の要素間における情報の移送
を支援する基本ルーチンをみ、通常ROM131に格納
される。RAM132は一般に、処理ユニット120に
すぐにアクセス可能であり、および/または現在処理ユ
ニット120によってオペレートされているデータおよ
び/またはプログラムモジュールを含む。例として、図
1はオペレーティングシステム134、アプリケーショ
ンプログラム135、その他のプログラムモジュール1
36およびプログラムデータ137を示しているがこれ
に限られない。
【0017】コンピュータ110は、その他の取外し可
能/固定で、揮発性/不揮発性のコンピュータ記憶媒体
も含むことができる。単に例としてであるが、図1は、
固定で不揮発性の磁気媒体の読み書きを行うハードディ
スクドライブ141、取外し可能で不揮発性の磁気ディ
スク152の読み書きを行う磁気ディスクドライブ15
1、およびCD−ROMやその他の光媒体のような取外
し可能で不揮発性の光ディスク156の読み書きを行う
光ディスクドライブ155を示す。例示の動作環境にお
いて使用することができる他の取外し可能/固定で揮発
性/不揮発性のコンピュータ記憶媒体には、磁気テープ
カセット、フラッシュメモリカード、デジタル多用途デ
ィスク、デジタルビデオテープ、ソリッドステートRA
M、ソリッドステートROMなどが含まれるがこれに限
定されない。通常、ハードディスクドライブ141は、
インタフェース140のような固定メモリインタフェー
スを通してシステムバス121に接続されており、磁気
ディスクドライブ151と光ディスクドライブ155と
は、インタフェース150のような取外し可能メモリイ
ンタフェースによってシステムバス121に接続され
る。
【0018】上記で議論し図1に示されたドライブと関
連するコンピュータ記憶媒体によって、コンピュータ読
み取り可能命令、データ構造、プログラムモジュールお
よびコンピュータ110のためのその他のデータが記憶
される。例えば、図1において、ハードディスクドライ
ブ141は、オペレーティングシステム144、アプリ
ケーションプログラム145、その他プログラムモジュ
ール146およびプログラムデータ147を格納するよ
うに示されている。これらのコンポーネントは、オペレ
ーティングシステム134、アプリケーションプログラ
ム135、その他プログラムモジュール136およびプ
ログラムデータ137と同一または異なるもののいずれ
かとすることができ、符号は最低限それらが異なるコピ
ーであることを示すために付与されていることに留意さ
れたい。
【0019】ユーザは、キーボード162、マイクロホ
ン163などの入力機器およびマウス、トラックボール
またはタッチパッドなどのポインティング機器161を
通してコマンドおよび情報をコンピュータ110に入力
することができる。その他の入力機器(図示せず)に
は、ジョイスティック、ゲームパッド、サテライトディ
ッシュ、スキャナ、などを含むことができる。これらお
よび他の入力機器はしばしば、システムバスに結合する
ユーザ入力インタフェース160を通して処理ユニット
120に接続するが、他のインタフェースおよびバス構
造、例えばパラレルポート、ゲームポート、あるいはユ
ニバーサルシリアルバス(USB)などによって接続す
ることもできる。モニタ191または他の種類の表示機
器もまた、ビデオインタフェース190のようなインタ
フェースを介して、システムバス121に接続される。
モニタに加え、コンピュータは、その他の周辺出力機
器、例えばスピーカ197およびプリンタ196を備え
ることもでき、出力周辺インタフェース195を通して
接続することができる。
【0020】コンピュータ110は、1つまたは複数の
リモートコンピュータ180のようなリモートコンピュ
ータへの論理接続を用い、ネットワーク化された環境で
動作することができる。リモートコンピュータ180
は、パーソナルコンピュータ、ハンドヘルド機器、サー
バ、ルータ、ネットワークPC、ピア機器またはその他
従来のネットワークノードとすることができ、一般にコ
ンピュータ110に関する上述した要素の多くまたは全
てを含む。図1に示される論理接続はローカルエリアネ
ットワーク(LAN)171および広域ネットワーク
(WAN)173を含むが、他のネットワークも含むこ
とができる。このようなネットワーク環境は、オフィ
ス、企業内コンピュータネットワーク、イントラネット
およびインターネットにおいては、通常のものである。
【0021】LANネットワーク環境で用いられる際、
コンピュータ110はネットワークインタフェースまた
はアダプタ170を通してLAN171に接続する。W
ANネットワーク環境で使用される際は、コンピュータ
110は一般的に、インターネットのようなWAN17
3を介して通信を確立するためのモデム172または他
の手法を備える。モデム172は、内蔵または外付けと
することができるが、ユーザインタフェース160また
はその他の適切な仕組みを介してシステムバス121に
接続することができる。ネットワーク化された環境にお
いては、コンピュータ110あるいはその部分に関連し
て示されたプログラムモジュールは、リモートメモリ記
憶機器に格納することができる。例として、図1は、リ
モートのアプリケーションプログラム185をリモート
コンピュータ180に存在するように示しているがこれ
に限られない。示されたネットワーク接続が例示であ
り、コンピュータ間における通信接続を確立する他の手
法を用いることができることが理解されるであろう。
【0022】図2は、本発明の一実施形態に合致したボ
イスメッセージ処理システム200のより詳細なブロッ
ク図である。システム200は、例示するようにボイス
データ入力コンポーネント202、ボイスデータ記憶2
04、ユーザインタフェースコンポーネント206およ
びボイスデータプロセッサ208を含む。ボイスデータ
入力コンポーネント202は、例示するようにボイスデ
ータにボイスメールメッセージが含まれる場合には電
話、ボイスデータが録音された講義や会話の場合にはマ
イクロフォンを含むことができ、および他のコンポーネ
ント、例えばラジオ、コンパクトディスクプレーヤなど
とすることができる。
【0023】ボイスデータ記憶204は、例示するよう
にWAVファイルのようなボイスデータを格納するメモ
リの一部である。ユーザインタフェースコンポーネント
206は、例示するようにユーザによって起動され、ユ
ーザインタフェースを生成して、ボイスデータ記憶20
4に格納されたボイスメッセージを操作し、および整理
することができる。ボイスデータプロセッサ208は例
示するように、ボイスメッセージから有用な情報を抽出
する情報抽出コンポーネント210およびボイスメッセ
ージにユーザ選択の規則を適用する規則適用コンポーネ
ント212を含む。
【0024】図3は、システム200の一般的な動作を
示すフロー図である。まず、データ入力コンポーネント
202からボイスメッセージを受信して、ボイスデータ
記憶204に格納する。これは図3のブロック214に
よって示される。情報抽出コンポーネント210は、定
期的あるいは断続的に、データ記憶204にアクセスし
て、それが情報抽出コンポーネント210によって最後
にアクセスされてから新たなボイスメッセージがデータ
記憶204に格納されたか否かを決定する。これは図3
のブロック216および218によって示される。デー
タ記憶204が情報抽出コンポーネント210によって
最後にアクセスされてから、新たなボイスメッセージが
データ記憶204に格納されなかった場合、処理は単に
ブロック216に戻るだけである。
【0025】しかし、情報抽出コンポーネント210
は、ブロック218において処理されなかった新しいボ
イスメッセージに遭遇した場合、それらの新しいメッセ
ージをボイスデータ処理に委ね、新しいメッセージから
所定の情報を抽出する。これはブロック220によって
示される。所定の情報の例は、より詳細に以下で議論す
るが、例示するようにデータ記憶204にあるボイスメ
ッセージの処理と整理を改善するように、およびこれら
のメッセージへの規則の適用を改善するように所定の情
報を適合させることができる。
【0026】いかなる場合においても、所定の情報が新
しいメッセージから抽出されると、ボイスデータ記憶2
04に格納されている(新しいメッセージに対応する)
情報は、情報抽出コンポーネント210によってちょう
ど抽出された追加情報を付加される。これは図3のブロ
ック222によって示される。
【0027】ボイスメールメッセージから抽出される情
報の種類は、上述のように広範囲にわたり変化に富む可
能性があるが、ユーザに効果的にボイスメッセージを処
理させることができるように、抽出される多くの種類の
情報には、話者の識別、話者の発話速度、話者の心理状
態、メッセージの内容などが含まれる。図4は、これら
の種類の情報を抽出するための情報抽出コンポーネント
210の一実施形態を示すブロック図である。当然、そ
の他の異なる情報も同様に抽出することができる。
【0028】図4で例示されるように、情報抽出コンポ
ーネント210は、モデルトレーニングコンポーネント
300、話者識別コンポーネント302、話者識別モデ
ル304、音響特徴抽出コンポーネント306、感情識
別器(emotion identifier)30
8、速度標準化コンポーネント310、音声−テキスト
コンポーネント312および自然言語プロセッサ314
を含む。一実施形態においては、新たなメッセージボイ
スデータ316は、ボイスデータ記憶204から得られ
る。データ316は、例示されるように、情報抽出コン
ポーネント210によってまだ処理されたことがなかっ
た新しいボイスメッセージを表現するWAVファイル、
その他のファイルであり、データ記憶204に格納され
ている。
【0029】一実施形態においては、データ316を話
者識別コンポーネント302に提供する。コンポーネン
ト302は、話者識別モデル304にアクセスして、話
者の識別(情報)を示す話者認識出力(話者ID)32
0を生成する。話者識別コンポーネント302および話
者識別モデル304は、例示するように特定の話者に関
しトレーニングされたいずれかの既知の話者識別コンポ
ーネントおよび話者識別モデルとすることができる。話
者認識出力320は話者のテキストにおける名前、符号
化された識別情報(identifier)またはユー
ザによって割り当てられたいずれかの識別情報とするこ
とができる。
【0030】コンポーネント302が話者を識別できな
い場合(例えば、モデル304が、新しいメッセージの
話者に関連するモデルを含んでいない場合)、コンポー
ネント302は、例示されるように話者の個人情報が不
明であることを示して話者認識出力320を提供する。
この場合、ユーザは新しいメッセージを再検討し、話者
ID320が不知と表示されると、例示する(図5に関
連して以下でより詳細に議論する)ようにユーザインタ
フェース上でユーザ入力を起動する。これによって、モ
デルトレーニングコンポーネント300は、その新しい
メッセージに関連するWAVファイル(あるいは、他の
ボイスデータ)を取得する。次に、モデルトレーニング
コンポーネント300は、この話者に対応する話者識別
モデルをトレーニングして、それとユーザによる話者識
別の入力またはデフォルトの話者識別とを関連付ける。
したがって、次にこの話者からのボイスメッセージを処
理する際は、話者識別コンポーネント302は、その話
者に関連する話者識別モデル304を有するので、正確
な話者ID320を生成する。
【0031】モデルトレーニングコンポーネント300
は、話者識別コンポーネント302が誤りを起こしてい
た場合、モデルを改善させることもできる。システムが
誤りを犯す場合、ユーザは例示するように、ユーザイン
タフェースのウィンドウ内に正確な名前を打ち込みユー
ザ入力コマンドを入力して、モデルトレーニングコンポ
ーネント300がその特定の話者に対する新たな話者モ
デル304を自動的にトレーニングするよう命令する。
また、ユーザは、将来、システムがより多く使用されれ
ばされるほど話者識別が正確になるように、使用中にモ
デルを更新するよう選択することもできる。反対に、ト
レーニングコンポーネント300は、指図されることな
く話者モデル304を徐々に更新することができる。例
えば、ユーザが新しいボイスメッセージにアクセスし、
それが話者の個人情報を表示していて、ユーザがそれを
変更しない場合、モデルトレーニングコンポーネント3
00は、そのメッセージに関連するボイスデータにアク
セスして、その話者に対応するモデルを改善させること
ができる。
【0032】また、話者識別コンポーネント302は話
者ID320に加えて、認識された個人情報がどの程度
機密であるかを示す機密度を提供することもできる。ユ
ーザによって確認されたシステムの判断に基づいて、話
者識別コンポーネント302は、自動的にそのパラメー
タを更新して、時間に関する性能を改善することができ
る。
【0033】本発明の他の形態によると、情報抽出コン
ポーネント310は、所定の音響情報をボイスデータ3
16から抽出して、ボイスメッセージを処理する際にユ
ーザに有用な別のデータを生成するための音響特徴抽出
コンポーネント306を含む。例えば、所定の音響の特
徴を抽出することによって、感情識別器308は、予め
定められた話者の感情を識別して、その感情を表す話者
感情ID322を出力する。
【0034】感情識別器308は、いかなる既知の感情
識別器とすることもでき、2001年の論文「EMOT
ION DETECTION FROM SPEECH
TO ENRICH MULTIMEDIA CON
TENT」(F.Yu等執筆)に記載された感情識別器
とすることもできる。このシステムは、感情を一般的な
カテゴリ、例えば怒り、恐れおよび緊張に分類する。こ
のような情報を用いることによって、このシステムは送
信者とその心理状態に基づき緊急度に合わせて容易にメ
ッセージを分類することができる。
【0035】例示の一実施形態においては、音響特徴抽
出コンポーネント306は、入ってくる音声のピッチを
抽出し、ピッチ信号から引き出される複数の特徴を基本
的なものとして使用する。これらの特徴は、感情識別器
308にあるサポートベクトルマシンに入力され、各々
の文章は嬉しい、悲しいまたは怒っているに分類され
る。サポートベクトルマシンは例示されるように、それ
ぞれ二値のクラシファイヤである。このため、感情識別
器308は、各文章に複数の感情が種々の重みをもって
存在することを決定することができる。これは、単一の
文章中に複数の感情が存在する可能性のあることに対応
するものである。したがって、話者感情識別出力322
は、これらの感情の全てを対応する重みをもって表示す
るか、または単に最も強い感情、またはその他の感情の
任意の組み合わせを表示することができる。
【0036】また、一実施形態においては、音響特徴抽
出コンポーネント306は、例示するようにメッセージ
の発話速度も抽出する。これは、多くの異なる手法を用
いて行うことができる。例えば、音響特徴抽出コンポー
ネント306は、ケプストラム測定を用いて、新たなボ
イスメッセージに関連するケプストラムパターンの変化
する速度を決定することができる。これによって新たな
ボイスメッセージについての発話速度についての目安
(例えば、1分間の単語数)が示される。
【0037】一実施形態においては、速度標準化コンポ
ーネント310が用いられる。この形態のとおりに、ユ
ーザは所定の発話速度を入力することができる(あるい
は、予め設定されたリストから1つを選択することがで
きる)。次に、速度標準化コンポーネント310は、新
しいボイスメッセージに関連する発話速度を音響特徴抽
出コンポーネント306から受信して、そのメッセージ
に対する発話速度をユーザによって選択された速度に標
準化する。速度標準化コンポーネント310は、ブロッ
ク324によって示すように、所定の速度に標準化され
た速度標準化音声データファイル(例えば、WAVファ
イル)を出力する。このファイル324は、例示するよ
うにユーザインタフェースにおいて用いられ、ユーザが
新しいメッセージにアクセスすると、ボイスメッセージ
が標準化された速度で発生される。当然、システムは元
のメッセージも同様に保持することもできる。
【0038】例示の一実施形態においては、発話速度を
標準化するために、速度標準化コンポーネント310
は、新しいボイスメッセージの発話速度を見積もって、
既知のタイムスケール変更(modificatio
n)アルゴリズムによって各文章の発話速度を調整す
る。本システムはまた、より効果的に聴取するため、無
音およびポーズ間隔の長さを減らすこともできる。
【0039】本発明の他の実施形態にしたがい、情報抽
出コンポーネント210はまた、音声−テキストコンポ
ーネント312をも含む。コンポーネント312は、例
示するように、新しいメッセージに対応するボイスデー
タをテキストに転写する音声認識器を含み、それは随意
に自然言語処理プロセッサ314に提供される。当然、
音声−テキストコンポーネント312は、単にメッセー
ジ転写330を出力することもでき、それはデータ31
6によって示された新しいボイスメッセージの転写全体
に相当する。しかし、自然言語処理プロセッサ314が
提供される場合は、その転写にも自然言語処理を同様に
適用することができる。
【0040】一実施形態において、自然言語処理プロセ
ッサ314は要約コンポーネント332および意味解析
器(semantic parser)334を含む。
要約コンポーネント332は、例示するようにテキスト
の入力を要約するための既知の処理サブシステムであ
る。したがって、要約コンポーネント332は、ボイス
メッセージの要旨に対応するメッセージ要約336を出
力する。
【0041】意味解析器334が提供される一実施形態
において、音声−テキストコンポーネント312によっ
て生成されるテキスト転写は、例示されるように意味解
析器334に入力される。意味解析器334はテキスト
の入力の意味解析を生成して、意味ラベルをテキスト入
力の所定の部分に割り当て、および意味解析ツリー33
8をその出力において提供する。意味解析ツリーの一例
では、ボイスメッセージが格納されている計算機システ
ムによって実行される種々のアプリケーションスキーマ
に対応するボイスメッセージの部分に意味ラベルを割り
当てて出力され、ボイスメッセージをそのスキーマによ
り容易に適合させることができる。
【0042】情報抽出コンポーネント210がこれらの
出力全てを生成すると、(図2に示す)規則適用コンポ
ーネント212は、ボイスメッセージの構成を強化する
ためにユーザ指定の規則をボイスデータ316および抽
出された情報(320、322、324、330、33
6および338)に基づいて実行することができる。例
えば、ユーザは規則を選択して、規則適用コンポーネン
ト212に、ボイスメッセージを話者でソートし、それ
らをフィルタにかけて異なるディレクトリに入れ、(メ
ッセージ要約336のような)件名に基づいてメッセー
ジをソートしあるいはフィルタにかけ、または日付でソ
ートさせることができる。規則適用コンポーネント21
2は、その他の規則、例えば話者の感情322、話者の
個人情報320または(メッセージ転写330、メッセ
ージ要約336あるいは意味解析338からの)メッセ
ージ内容のようなメッセージの所定の属性に基づいてユ
ーザに警告するなどのためにも用いることができる。規
則適用コンポーネント212は、所定の人たちからのメ
ッセージまたは受信してから所定の時間が経過したメッ
セージを削除するように構成することもできる。規則適
用コンポーネント212は、予め定められた基準、例え
ば格納されたメッセージの数、話者の個人情報320、
話者の感情322などに基づいて警告を生成することも
できる。当然、規則適用コンポーネント212も同様
に、他の広範な種々の規則を適用することができる。
【0043】図5は、本発明の一例によるユーザインタ
フェースの一実施形態を示す。他の広範な種々のユーザ
インタフェースが用いられるか、またはユーザインタフ
ェースは図5に示されるのと同じ情報を含むが、異なる
構成とすることができることは当然理解されるであろ
う。図5はユーザインタフェース400を示しており、
これは表示部402およびツールバー部404を含む。
表示部402は、WAVファイル403を一般的に表す
表示が生成して示されるか、あるいは現時点で選択され
たボイスメッセージの音響的表現である。表示部402
は、テキストの転写405も表示して示し、テキストの
要約またはそれらもしくは他の情報アイテムとのいずれ
かの組み合わせを示すことができる。表示部402は、
例示するように発信者の電話番号とともに発信者の個人
情報と発信日時を表示する表示部分406を含む。
【0044】ツールバー部404は、例示するように種
々のユーザ起動入力を含み、ユーザはこれを起動してボ
イスメッセージを処理し、または構成することができ
る。図5に示される入力は、例えばメッセージを削除す
るための削除入力408、またはボイスメッセージの再
生の開始および停止を行うための開始ボタン410およ
び停止ボタン412を含む。図5はスロー/早送り再生
ワイパー416を示しており、これによってユーザはボ
イスメッセージの再生速度を遅くしたり早くしたりする
ことが可能となる。図5のインタフェース400は、他
のユーザ起動入力、例えばメッセージを格納および印刷
するために用いられる「ファイル」並びに「印刷」もま
た含むことができ、および古いメッセージまたは新しい
メッセージを検索するために用いられる「メッセージ取
り込み」並びに「新しいメッセージ」を含むこともでき
る。インタフェース400はまた、例示されるように、
メッセージを所定の速度に自動的に標準化させる起動セ
レクタ418をも含むことができる。さらに、インタフ
ェース400は、例示するように、読み取った感情を表
示する感情表示420を含む。当然、ユーザインタフェ
ースは広範な種々の起動入力を含み、ユーザはテキス
ト、音響情報または付加情報を表示し、および異なる規
則を適用する等ができるようにユーザインタフェースを
構成することができる。
【0045】以上により、本発明が所定の情報を抽出
し、所定の情報でボイスメッセージデータ記憶を付加す
るための分散型プロセッサを提供することが理解され
る。所定の情報は、例示されるように本来的に、ユーザ
がボイスメッセージを整理し、ソートしおよび見直しあ
るいは処理するのを支援する。
【0046】本発明は所定の実施形態を参照して記述し
てきたが、本発明の精神と範囲から離れない限り形態や
細部について変更することができることを当業者は理解
するであろう。
【図面の簡単な説明】
【図1】本発明を使用することができる環境を例示する
ブロック図である。
【図2】本発明によるシステムを示す詳細なブロック図
である。
【図3】図2に示すシステムの動作を一般的に示すフロ
ー図である。
【図4】本発明の一実施形態によるボイスデータ処理シ
ステムのより詳細なブロック図である。
【図5】本発明によるユーザインタフェースの一実施形
態を例示する図である。
【符号の説明】
110 コンピュータ 120 プロセッシングユニット 121 システムバス 130 システムメモリ 131 読取専用メモリ 132 ランダムアクセスメモリ 133 基本入出力システム 134 オペレーティングシステム 135 アプリケーションプログラム 136 プログラムモジュール 137 プログラムデータ 140 固定メモリインタフェース 141 磁気ハードディスクドライブ装置 144 オペレーティングシステム 145 アプリケーションプログラム 146 プログラムモジュール 147 プログラムデータ 150 取外し可能メモリインタフェース 151 磁気ディスクドライブ装置 152 取外し可能な磁気ディスク 155 光ディスクドライブ装置 156 取外し可能な光ディスク 160 ユーザ入力インタフェース 161 ポインティング装置 162 キーボード 163 マイクロホン 170 ネットワークインタフェースアダプタ 171 ローカルネットワーク 172 モデム 173 広域ネットワーク 180 リモートコンピュータ 185 リモートアプリケーション 190 ビデオアダプタ 191 モニタ 195 出力周辺インタフェース 196 プリンタ 197 スピーカ 200 ボイスメッセージ処理システム 202 ボイスデータ入力コンポーネント 204 ボイスデータ記憶 206 ユーザインタフェースコンポーネント 208 ボイスデータプロセッサ 210 情報抽出コンポーネント 212 規則適用コンポーネント 300 モデルトレーニングコンポーネント 302 話者識別コンポーネント 304 話者識別モデル 306 音響特徴抽出コンポーネント 308 感情識別器 310 速度標準化コンポーネント 312 音声−テキストコンポーネント 314 自然言語処理プロセッサ 316 データ記憶からの新しいメッセージボイスデー
タ 320 音声ID 322 話者感情 324 速度標準化音声データファイル 330 メッセージ転写 332 要約コンポーネント 334 意味解析器 336 メッセージ要約 338 意味解析 400 ユーザインタフェース 402 表示部 403 WAVファイルを一般的に示す表示 404 ツールバー 405 テキストの転写 406 発信者の電話番号とともに発信者の個人情報と
発信日時を表示する表示部分 408 削除入力 410 開始ボタン 412 停止ボタン 416 スロー/早送り再生ワイパー 418 起動セレクタ 420 感情表示
───────────────────────────────────────────────────── フロントページの続き (72)発明者 エリック イ−チャオ チャン 中華人民共和国 100022 ペキン ジャン ゴ ロード 88 アパートメント 1− 1808 Fターム(参考) 5K015 AA07 AD01 AD02 GA02 5K024 AA72 BB01 BB05 CC02 CC09 DD01 EE09 FF06 GG12 5K030 GA18 HA06 HB01 KA07

Claims (27)

    【特許請求の範囲】
  1. 【請求項1】 複数のボイスメッセージを示すボイスメ
    ッセージデータを格納する分散ボイスメッセージ(V
    M)データ記憶と、 前記VMデータ記憶に結合され、および前記ボイスメッ
    セージにアクセスし、所定の情報を前記ボイスメッセー
    ジから抽出し、並びに所定の情報を前記VMデータ記憶
    に格納されたVMデータに付加するように構成された分
    散ボイスデータプロセッサと、 前記VMデータ記憶に結合され、および前記付加された
    VMデータへのユーザアクセスを提供するように構成さ
    れたユーザインタフェースコンポーネントとを備えたこ
    とを特徴とするボイスメッセージ処理システム。
  2. 【請求項2】 前記分散ボイスデータプロセッサは、 ユーザ選択の規則を示すユーザ規則入力を受信して、前
    記ユーザ選択の規則を前記付加されたVMデータに適用
    するように構成された規則適用コンポーネントを備えた
    ことを特徴とする請求項1に記載のシステム。
  3. 【請求項3】 前記分散ボイスデータプロセッサは、 少なくとも1つの話者識別モデルを格納する話者識別モ
    デルデータ記憶と、 該話者識別モデルデータ記憶にアクセスして、前記VM
    データに対応するボイスメッセージに関連する話者の個
    人情報(indication of anident
    ity)を提供するように構成された話者識別コンポー
    ネントとを備えたことを特徴とする請求項2に記載のシ
    ステム。
  4. 【請求項4】 前記分散ボイスデータプロセッサは、 VMデータを受信して、前記VMデータに基づく話者識
    別モデルと前記VMデータに対応するボイスメッセージ
    の話者を表すユーザ入力とをトレーニングするように構
    成された話者モデルトレーニングコンポーネントを備え
    たことを特徴とする請求項3に記載のシステム。
  5. 【請求項5】 前記分散ボイスデータプロセッサは、 音響特徴を前記VMデータから抽出する音響特徴抽出器
    を備え、前記音響特徴は前記所定の情報を表すことを特
    徴とする請求項2に記載の方法。
  6. 【請求項6】 前記音響特徴抽出器は、話者の感情を表
    す特徴を抽出して該話者の感情を示す感情出力を提供す
    るように構成されたことを特徴とする請求項5に記載の
    システム。
  7. 【請求項7】 前記音響特徴抽出器は、発話速度を示す
    特徴を抽出して該発話速度を示す速度出力を提供するよ
    うに構成されたことを特徴とする請求項5に記載のシス
    テム。
  8. 【請求項8】 前記分散ボイスデータプロセッサは、 前記速度出力を受信して、関連するボイスメッセージを
    予め定められた発話速度に標準化するように構成された
    速度標準化コンポーネントを備えたことを特徴とする請
    求項7に記載のシステム。
  9. 【請求項9】 前記分散ボイスデータプロセッサは、 ボイスメッセージの内容を表すテキストの出力を生成す
    るように構成された音声テキストコンポーネントを備え
    たことを特徴とする請求項2に記載のシステム。
  10. 【請求項10】 前記音声テキストコンポーネントは、
    前記ボイスメッセージの転写を前記テキストの出力とし
    て生成するように構成されたことを特徴とする請求項9
    に記載のシステム。
  11. 【請求項11】 前記分散ボイスデータプロセッサは、 前記ボイスメッセージの要約を生成するように構成され
    た要約コンポーネントを備えたことを特徴とする請求項
    9に記載のシステム。
  12. 【請求項12】 前記分散ボイスデータプロセッサは、 前記ボイスメッセージの少なくとも一部の意味解析を生
    成するように構成された意味解析器を備えたことを特徴
    とする請求項9に記載のシステム。
  13. 【請求項13】 前記規則適用コンポーネントは、ボイ
    スメッセージを前記所定の情報に基づいてソートするこ
    とを特徴とする請求項2に記載のシステム。
  14. 【請求項14】 前記規則適用コンポーネントは、前記
    所定の情報に基づいて警告を生成することを特徴とする
    請求項2に記載のシステム。
  15. 【請求項15】 前記ユーザインタフェースコンポーネ
    ントは、前記ボイスメッセージのユーザによる処理のた
    めにユーザ選択可能な入力を可視出力(exposin
    g)するユーザインタフェースを生成することを特徴と
    する請求項2に記載のシステム。
  16. 【請求項16】 前記ユーザ選択可能な入力は、ユーザ
    によって起動されると、ボイスメッセージに関連する発
    話速度が変更される速度変更入力を備えたことを特徴と
    する請求項15に記載のシステム。
  17. 【請求項17】 前記ユーザインタフェースは、ボイス
    メッセージの内容を示すテキストを表示することを特徴
    とする請求項15に記載のシステム。
  18. 【請求項18】 前記ユーザインタフェースは、ボイス
    メッセージの話者の個人を示す個人情報を表示すること
    を特徴とする請求項15に記載のシステム。
  19. 【請求項19】 前記ユーザインタフェースは、ボイス
    メッセージの話者の感情を表す感情情報(emotio
    n indicator)を表示することを特徴とする
    請求項15に記載のシステム。
  20. 【請求項20】 前記ユーザインタフェースは、適用さ
    れる規則を表す規則情報(a rule indica
    tor)を表示することを特徴とする請求項15に記載
    のシステム。
  21. 【請求項21】 ボイスメッセージを処理する方法であ
    って、 前記ボイスメッセージデータを分散ボイスメッセージ
    (VM)データ記憶に格納するステップと、 前記VMデータ記憶を断続的にアクセスして、新しいボ
    イスメッセージが格納されたか否かを決定するステップ
    と、 新しいボイスメッセージの各々について、分散プロセッ
    サにおいて前記新しいボイスメッセージを処理して、話
    者の個人情報(speaker identity)を
    含む抽出されたデータ、所定の情報を示す音響特徴およ
    び前記新しいボイスメッセージの内容のテキスト表現を
    取得するステップと、 前記抽出されたデータをVMデータ記憶中のデータに付
    加するステップとを備えたことを特徴とする方法。
  22. 【請求項22】 前記新しいボイスメッセージを処理し
    て音響特徴を取得するステップは、 前記ボイスメッセージの話者の感情を示す音響特徴を取
    得して、前記話者の感情を表す話者感情出力を生成する
    ステップを備えたことを特徴とする請求項21に記載の
    方法。
  23. 【請求項23】 前記音響特徴は、前記新しいボイスメ
    ッセージの話者の発話速度を表す発話速度情報(spe
    aking rate indicator)を含み、 前記発話速度をユーザ選択の速度に標準化するステップ
    をさらに備えたことを特徴とする請求項21に記載の方
    法。
  24. 【請求項24】 前記話者の個人情報を取得するステッ
    プは、話者の個人情報が不明であると決定されるとき不
    明出力を提供するステップを含み、 前記新しいボイスメッセージのための話者の個人情報を
    表すユーザ入力を受信するステップと、 話者識別モデルを前記新しいボイスメッセージおよび前
    記ユーザ入力に基づいてトレーニングするステップとを
    さらに備えたことを特徴とする請求項21に記載の方
    法。
  25. 【請求項25】 ユーザ選択の規則を示す規則入力を受
    信して、前記新しいボイスメッセージに適用するステッ
    プと、 前記ユーザ選択規則を前記抽出されたデータに基づいて
    適用するステップとをさらに備えたことを特徴とする請
    求項21に記載の方法。
  26. 【請求項26】 前記新しいボイスメッセージのための
    テキスト表現を意味的に構文解析するステップをさらに
    備えたことを特徴とする請求項21に記載の方法。
  27. 【請求項27】 前記VMデータ記憶へのユーザインタ
    フェースを生成するステップであって、該ユーザインタ
    フェースは前記VMデータ記憶にあるボイスメッセージ
    を処理するためのユーザ起動入力を含むステップをさら
    に備えたことを特徴とする請求項21に記載の方法。
JP2003068978A 2002-03-15 2003-03-13 ボイスメッセージ処理システムおよび方法 Expired - Fee Related JP4619623B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/099,606 US7440900B2 (en) 2002-03-15 2002-03-15 Voice message processing system and method
US10/099,606 2002-03-15

Publications (2)

Publication Number Publication Date
JP2003289387A true JP2003289387A (ja) 2003-10-10
JP4619623B2 JP4619623B2 (ja) 2011-01-26

Family

ID=27765452

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003068978A Expired - Fee Related JP4619623B2 (ja) 2002-03-15 2003-03-13 ボイスメッセージ処理システムおよび方法

Country Status (5)

Country Link
US (1) US7440900B2 (ja)
EP (1) EP1345394B1 (ja)
JP (1) JP4619623B2 (ja)
DK (1) DK1345394T3 (ja)
HK (1) HK1059013A1 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008505406A (ja) * 2004-06-30 2008-02-21 グレネイル エレクトロニクス インコーポレイテッド 地域分散型ボイスメッセージングシステムのためのヘルスモニタ
JP2008113331A (ja) * 2006-10-31 2008-05-15 Aplix Corp 電話システム、電話機、サーバ装置およびプログラム
JP2009273118A (ja) * 2008-04-07 2009-11-19 Ntt Docomo Inc 感情認識メッセージシステム、移動通信端末及びメッセージ蓄積サーバ
JP2011250475A (ja) * 2004-10-20 2011-12-08 Microsoft Corp ユニファイドメッセージングアーキテクチャ
JP2016081424A (ja) * 2014-10-21 2016-05-16 Necソリューションイノベータ株式会社 情報伝達装置、制御方法、及びプログラム

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7665024B1 (en) * 2002-07-22 2010-02-16 Verizon Services Corp. Methods and apparatus for controlling a user interface based on the emotional state of a user
US7231019B2 (en) 2004-02-12 2007-06-12 Microsoft Corporation Automatic identification of telephone callers based on voice characteristics
JP2005346252A (ja) * 2004-06-01 2005-12-15 Nec Corp 情報伝達システムおよび情報伝達方法
US20060229882A1 (en) * 2005-03-29 2006-10-12 Pitney Bowes Incorporated Method and system for modifying printed text to indicate the author's state of mind
US8094803B2 (en) 2005-05-18 2012-01-10 Mattersight Corporation Method and system for analyzing separated voice data of a telephonic communication between a customer and a contact center by applying a psychological behavioral model thereto
US8542803B2 (en) * 2005-08-19 2013-09-24 At&T Intellectual Property Ii, L.P. System and method for integrating and managing E-mail, voicemail, and telephone conversations using speech processing techniques
US8059790B1 (en) * 2006-06-27 2011-11-15 Sprint Spectrum L.P. Natural-language surveillance of packet-based communications
US8553854B1 (en) 2006-06-27 2013-10-08 Sprint Spectrum L.P. Using voiceprint technology in CALEA surveillance
US7617042B2 (en) * 2006-06-30 2009-11-10 Microsoft Corporation Computing and harnessing inferences about the timing, duration, and nature of motion and cessation of motion with applications to mobile computing and communications
US8238528B2 (en) * 2007-06-29 2012-08-07 Verizon Patent And Licensing Inc. Automatic analysis of voice mail content
US7728636B2 (en) * 2007-08-14 2010-06-01 Qimonda Ag Clock signal synchronizing device with inherent duty-cycle correction capability
JP4968147B2 (ja) * 2008-03-31 2012-07-04 富士通株式会社 通信端末、通信端末の音声出力調整方法
US8311188B2 (en) * 2008-04-08 2012-11-13 Cisco Technology, Inc. User interface with voice message summary
US8489992B2 (en) 2008-04-08 2013-07-16 Cisco Technology, Inc. User interface with visual progression
DE102008046431A1 (de) * 2008-09-09 2010-03-11 Deutsche Telekom Ag Sprachdialogsystem mit Reject-Vermeidungsverfahren
US8467402B2 (en) * 2008-09-10 2013-06-18 Miselu, Inc. Digital audio communication system
US8284909B2 (en) * 2008-09-29 2012-10-09 Microsoft Corporation Offline voicemail
US20100135472A1 (en) * 2008-11-18 2010-06-03 Timothy Watanabe Automated voice mail communication system
US9026131B2 (en) 2009-07-21 2015-05-05 Modena Enterprises, Llc Systems and methods for associating contextual information and a contact entry with a communication originating from a geographic location
US8358752B2 (en) 2009-11-19 2013-01-22 At&T Mobility Ii Llc User profile based speech to text conversion for visual voice mail
US9222798B2 (en) 2009-12-22 2015-12-29 Modena Enterprises, Llc Systems and methods for identifying an activity of a user based on a chronological order of detected movements of a computing device
US9215735B2 (en) 2010-03-03 2015-12-15 Modena Enterprises, Llc Systems and methods for initiating communications with contacts based on a communication specification
US9009041B2 (en) 2011-07-26 2015-04-14 Nuance Communications, Inc. Systems and methods for improving the accuracy of a transcription using auxiliary data such as personal data
US9569424B2 (en) * 2013-02-21 2017-02-14 Nuance Communications, Inc. Emotion detection in voicemail
US9628414B1 (en) * 2013-03-15 2017-04-18 Google Inc. User state based engagement
WO2014199596A1 (ja) * 2013-06-10 2014-12-18 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 話者識別方法、話者識別装置及び話者識別システム
KR102146261B1 (ko) * 2014-02-14 2020-08-20 삼성전자 주식회사 전자 장치 및 전자 장치의 대화 메시지에서 의미개체 추출 및 이용방법
US10164921B2 (en) * 2014-03-12 2018-12-25 Stephen Davies System and method for voice networking
US10540979B2 (en) * 2014-04-17 2020-01-21 Qualcomm Incorporated User interface for secure access to a device using speaker verification
US9288327B2 (en) * 2014-05-14 2016-03-15 Mitel Networks Corporation Apparatus and method for routing an incoming call
US10339933B2 (en) 2016-05-11 2019-07-02 International Business Machines Corporation Visualization of audio announcements using augmented reality
CN109417504A (zh) 2017-04-07 2019-03-01 微软技术许可有限责任公司 自动聊天中的语音转发
US20210166715A1 (en) * 2018-02-16 2021-06-03 Hewlett-Packard Development Company, L.P. Encoded features and rate-based augmentation based speech authentication

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5713493A (en) * 1980-06-27 1982-01-23 Hitachi Ltd Speaker recognizing device
JPH07250166A (ja) * 1994-03-08 1995-09-26 Matsushita Electric Ind Co Ltd ボイスメールシステム
JPH09284399A (ja) * 1996-04-18 1997-10-31 Toshiba Corp 音声サービス装置
JPH10285286A (ja) * 1997-04-07 1998-10-23 Casio Comput Co Ltd 情報処理装置及び記憶媒体
JP2000010578A (ja) * 1998-06-19 2000-01-14 Ntt Data Corp 音声メッセージ送受信システム、及び音声メッセージ処理方法
JP2000209364A (ja) * 1998-10-19 2000-07-28 Lucent Technol Inc 能動性応答マシン
JP2000242300A (ja) * 1999-02-22 2000-09-08 Nippon Telegr & Teleph Corp <Ntt> 音声速度変換装置、音声速度変換方法および音声速度変換方法を実行するプログラムを記録した記録媒体
JP2001024781A (ja) * 1999-06-03 2001-01-26 Lucent Technol Inc 発呼者により生成された音声メッセージを分類する方法
WO2001016938A1 (en) * 1999-08-31 2001-03-08 Accenture Llp A system, method, and article of manufacture for detecting emotion in voice signals through analysis of a plurality of voice signal parameters
JP2001101099A (ja) * 1999-09-30 2001-04-13 Oki Electric Ind Co Ltd 電子メール管理装置
JP2001237948A (ja) * 2000-02-22 2001-08-31 Nippon Telegraph & Telephone West Corp 音声メール装置及びプログラムを記憶した記憶媒体
JP2001292240A (ja) * 2000-04-06 2001-10-19 Mitsubishi Electric Corp ボイスメールシステム、ボイスメール装置およびボイスメール転送方法
JP2002032213A (ja) * 2000-05-26 2002-01-31 Internatl Business Mach Corp <Ibm> ボイス・メール・メッセージを転記する方法およびシステム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5568540A (en) 1993-09-13 1996-10-22 Active Voice Corporation Method and apparatus for selecting and playing a voice mail message
US5751793A (en) * 1995-03-14 1998-05-12 U S West Technologies, Inc. Method and instructions for visual voice messaging user interface
US5848130A (en) 1996-12-31 1998-12-08 At&T Corp System and method for enhanced intelligibility of voice messages
US7590538B2 (en) 1999-08-31 2009-09-15 Accenture Llp Voice recognition system for navigating on the internet
GB2364850B (en) 2000-06-02 2004-12-29 Ibm System and method for automatic voice message processing
US6778644B1 (en) * 2001-12-28 2004-08-17 Vocada, Inc. Integration of voice messaging and data systems

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5713493A (en) * 1980-06-27 1982-01-23 Hitachi Ltd Speaker recognizing device
JPH07250166A (ja) * 1994-03-08 1995-09-26 Matsushita Electric Ind Co Ltd ボイスメールシステム
JPH09284399A (ja) * 1996-04-18 1997-10-31 Toshiba Corp 音声サービス装置
JPH10285286A (ja) * 1997-04-07 1998-10-23 Casio Comput Co Ltd 情報処理装置及び記憶媒体
JP2000010578A (ja) * 1998-06-19 2000-01-14 Ntt Data Corp 音声メッセージ送受信システム、及び音声メッセージ処理方法
JP2000209364A (ja) * 1998-10-19 2000-07-28 Lucent Technol Inc 能動性応答マシン
JP2000242300A (ja) * 1999-02-22 2000-09-08 Nippon Telegr & Teleph Corp <Ntt> 音声速度変換装置、音声速度変換方法および音声速度変換方法を実行するプログラムを記録した記録媒体
JP2001024781A (ja) * 1999-06-03 2001-01-26 Lucent Technol Inc 発呼者により生成された音声メッセージを分類する方法
WO2001016938A1 (en) * 1999-08-31 2001-03-08 Accenture Llp A system, method, and article of manufacture for detecting emotion in voice signals through analysis of a plurality of voice signal parameters
JP2001101099A (ja) * 1999-09-30 2001-04-13 Oki Electric Ind Co Ltd 電子メール管理装置
JP2001237948A (ja) * 2000-02-22 2001-08-31 Nippon Telegraph & Telephone West Corp 音声メール装置及びプログラムを記憶した記憶媒体
JP2001292240A (ja) * 2000-04-06 2001-10-19 Mitsubishi Electric Corp ボイスメールシステム、ボイスメール装置およびボイスメール転送方法
JP2002032213A (ja) * 2000-05-26 2002-01-31 Internatl Business Mach Corp <Ibm> ボイス・メール・メッセージを転記する方法およびシステム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008505406A (ja) * 2004-06-30 2008-02-21 グレネイル エレクトロニクス インコーポレイテッド 地域分散型ボイスメッセージングシステムのためのヘルスモニタ
JP2011250475A (ja) * 2004-10-20 2011-12-08 Microsoft Corp ユニファイドメッセージングアーキテクチャ
JP2008113331A (ja) * 2006-10-31 2008-05-15 Aplix Corp 電話システム、電話機、サーバ装置およびプログラム
JP2009273118A (ja) * 2008-04-07 2009-11-19 Ntt Docomo Inc 感情認識メッセージシステム、移動通信端末及びメッセージ蓄積サーバ
JP2016081424A (ja) * 2014-10-21 2016-05-16 Necソリューションイノベータ株式会社 情報伝達装置、制御方法、及びプログラム

Also Published As

Publication number Publication date
US7440900B2 (en) 2008-10-21
US20030177008A1 (en) 2003-09-18
HK1059013A1 (en) 2004-06-11
EP1345394A1 (en) 2003-09-17
EP1345394B1 (en) 2013-03-13
DK1345394T3 (da) 2013-04-08
JP4619623B2 (ja) 2011-01-26

Similar Documents

Publication Publication Date Title
JP4619623B2 (ja) ボイスメッセージ処理システムおよび方法
US10977299B2 (en) Systems and methods for consolidating recorded content
US8447015B2 (en) Method and system for processing messages within the framework of an integrated message system
KR101513888B1 (ko) 멀티미디어 이메일 합성 장치 및 방법
US8150687B2 (en) Recognizing speech, and processing data
CN102782751B (zh) 社会网络中的数字媒体语音标签
US9026445B2 (en) Text-to-speech user&#39;s voice cooperative server for instant messaging clients
TW469422B (en) System and method for automatic audio content analysis for word spotting, indexing, classification and retrieval
US7693267B2 (en) Personalized user specific grammars
US20030046071A1 (en) Voice recognition apparatus and method
US20080281927A1 (en) Summarization tool and method for a dialogue sequence
US20120096007A1 (en) Embedding content-based searchable indexes in multimedia files
JPH1074138A (ja) 音声をセグメント化するための方法と装置
WO2015008162A2 (en) Systems and methods for textual content creation from sources of audio that contain speech
CN111798833A (zh) 一种语音测试方法、装置、设备和存储介质
KR20200087514A (ko) 대화록 서비스를 제공하는 컴퓨팅 장치
US8706484B2 (en) Voice recognition dictionary generation apparatus and voice recognition dictionary generation method
US9077813B2 (en) Masking mobile message content
KR102540177B1 (ko) 화자 간 중첩되는 음성을 분리하여 대화록 서비스를 제공하는 방법
Burke et al. Error correction of voicemail transcripts in scanmail
CN113626634A (zh) 智能朗读亭的作品生成和处理方法及装置
US11632345B1 (en) Message management for communal account
KR102647512B1 (ko) 멀티채널 음성 데이터에 기초하여 회의록을 생성하는 방법
Rodríguez et al. How software features and linguistic analyses add value to orthographic markup in transcription of multilingual recordings for digital archives
Vitasovic et al. Automatic Video Editor for Reportages Assisted by Unsupervised Machine Learning

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060131

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080602

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090203

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090501

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100625

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100927

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101022

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101027

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131105

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4619623

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees