JP2007108541A - メタデータ付き通話音声データ提供システム、方法、プログラム、サーバー及び携帯端末 - Google Patents

メタデータ付き通話音声データ提供システム、方法、プログラム、サーバー及び携帯端末 Download PDF

Info

Publication number
JP2007108541A
JP2007108541A JP2005301058A JP2005301058A JP2007108541A JP 2007108541 A JP2007108541 A JP 2007108541A JP 2005301058 A JP2005301058 A JP 2005301058A JP 2005301058 A JP2005301058 A JP 2005301058A JP 2007108541 A JP2007108541 A JP 2007108541A
Authority
JP
Japan
Prior art keywords
metadata
voice data
call voice
call
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005301058A
Other languages
English (en)
Other versions
JP5007913B2 (ja
Inventor
Yusuke Tomita
祐介 冨田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2005301058A priority Critical patent/JP5007913B2/ja
Publication of JP2007108541A publication Critical patent/JP2007108541A/ja
Application granted granted Critical
Publication of JP5007913B2 publication Critical patent/JP5007913B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

【課題】携帯端末を有する各自に対して、欲する通話音声データだけを聞かせる。
【解決手段】通話を再現するためのメタデータ付き通話音声データ提供システムに、基地局201,202を介して通話を行う携帯端末101,102と、前記携帯端末からの通話音声データを格納する領域と、通話音声データのメタデータを格納する領域を有するデータベース302と、前記通話音声データを音声認識処理しシーンを区分けするキーワードを検出し、検出したキーワードに対してメタデータを作成し、検出されたキーワードに対して前記データベースの領域にインデックスを付け、メタデータを前記データベースの領域に格納させ、前記データベースに格納されたメタデータの情報を携帯端末に配布し、携帯端末を有する各自に対して、欲するに通話音声データだけを提供するためのメタデータ作成部303とを備える。
【選択図】図1

Description

本発明は基地局を介して電話による会話を行う携帯端末に関する。特に、本発明は、各携帯端末からそれぞれ通話音声データを受信し格納し各自が欲する通話音声データを再現し提供するメタデータ付き通話音声データ提供システム、方法、プログラム、サーバー及び携帯端末に関する。
近年、携帯端末の普及が著しく、携帯端末を用いた電話による会話が頻繁に行われているが、人間は電話で話した内容の全てを記憶しているとは限らず、後から関係者へ情報展開をする際に電話で話した内容を上手に伝えることができず、報告漏れがあったりするという問題を有する。
さらに、ボイスレコーダーを用いて会話を録音しただけの場合は、複数の発言者からの声を一度に録音してしまうため、誰の音声かを容易に判断し、発言者を区別することが困難であるという問題がある。
さらに、ボイスレコーダーを用いて会話を録音しただけの場合は、電話での通話音声データを全て聞くことなく、携帯端末を有する各自に対して欲する通話音声データだけを再現して聞かせることが困難であるという問題がある。
従来、後利用しにくい携帯電話の会話内容を有効に活用するため、携帯電話を用いて、音声通信伝送および通信伝送を行う無線通信手段と、音声通信伝送によるやりとりデータをWeb上に設けた通信者用のサーバーに転送する手段を備えたことを特徴とする携帯電話を用いたデータ処理装置としたものであり、さらに、通信者用のサーバー上に自動的に転送する際に、音声通信伝送によるやりとりデータを音声認識手段によりテキストデータ化する手段を備えたものであり、さらに、やりとりデーターをマークアップ言語形式で管理して保存する手段を備えたものもある(例えば、特許文献1参照)。
しかしながら、上記特許文献1では、テキストデータであるため、実際の会話内容を通話音声データとして聞くことができないという問題がある。
また、従来、電話端末装置において、通話者の会話を妨げることなく会話に関連する情報を容易に検索、表示するため、音声入力部からの会話音声に対し、音声認識部が認識処理を行い、言語処理部は音声認識部の認識結果を解析し単語抽出を行い、検索キーワード確定部は抽出された単語から情報検索に適切なキーワードを確定し、表示部に表示し、検索部はユーザーが検索対象指定部によって指定したキーワードに関する情報を情報格納部から検索し、表示部にその内容を表示するものもある(例えば、特許文献2参照)。
しかしながら、上記特許文献2では、キーワードに関する情報を表示部に表示するため、実際の会話内容を通話音声データとして聞くことができないという問題がある。
また、従来、音声データに、その音声データに関連した情報を付加したデータを順次生成/記録し、付加された情報に応じた音声データを抽出可能とする音声処理装置および音声処理方法を提供するため、A/D変換器は、マイクロフォンが集音した信号をディジタル信号(音声データ)に変換し、音声認識処理部は、音声データを認識処理し認識可能な音声データのみを抽出し、声紋照合処理部は、抽出された音声データに基づいて声紋照合処理を行い、予め登録された声紋データに合致する発話者を特定し、データ入力部は、付加データDATAを入力し、メタデータ作成部は、特定された発話者と付加データDATAに基づいてメタデータを作成し、フレームデータ生成部は、音声データと当該音声データに対応するメタデータを合成してフレームデータを生成するものもある(例えば、特許文献3参照)。
しかしながら、上記特許文献3では、特定の発話者の音声を判断し聞くことが可能であるが、携帯端末を有する各自に対して、欲する通話音声データだけを聞かせることが困難であるという問題がある。
また、従来、カラーバー映像部によって区切られたビデオデータA,ビデオデータB,……,ビデオデータEを、データ蓄積装置の個々に異なる記憶領域に、ファイルA,ファイルB,……,ファイルEとして記憶し、ビデオデータの分別整理がきわめて容易となるものがある(例えば、特許文献4参照)。
しかしながら、上記特許文献4では、ビデオデータを通話音声データに置き換えても、携帯端末を有する各自に対して、欲する通話音声データだけを聞かせることができないという問題がある。
特開2004−129168号公報 特開平11−252281号公報 特開2005−181391号公報 特開2000−023069号公報
したがって、本発明は上記問題点に鑑みて、携帯端末を有する各自に対して、欲する通話音声データだけを聞かせるためのメタデータ付き通話音声データ提供システムを提供することを目的とする。
本発明は前記問題点を解決するために、通話を再現するためのメタデータ付き通話音声データ提供システムにおいて、基地局を介して通話を行う携帯端末と、前記携帯端末からの通話音声データを格納する領域と、通話音声データのメタデータを格納する領域を有するデータベースと、前記通話音声データを音声認識処理しシーンを区分けするキーワードを検出し、検出したキーワードに対してメタデータを作成し、検出されたキーワードに対して前記データベースの領域にインデックスを付け、メタデータを前記データベースの領域に格納させ、前記データベースに格納されたメタデータの情報を前記携帯端末に配布し、携帯端末を有する各自に対して欲するに通話音声データだけを提供するためのメタデータ作成部とを備えることを特徴とするメタデータ付き通話音声データ提供システムを提供する。
さらに、前記メタデータ作成部は、前記データベースに格納された通話音声データを音声認識する音声認識部と、キーワードを格納し、前記音声認識部で音声認識された言語がキーワードと一致する場合、一致する言語をメタデータとする処理を行う言語処理部とを備える。
さらに、発言者判別部を備え、前記発言者判別部は携帯端末からの通話音声データの発言者を判別し、通話音声データを発言者毎に前記データベース毎に格納させ、前記メタデータ作成部は、発言者の通話音声データの先頭にインデックスを付け、発言者の通話音声データに対するメタデータを作成し、前記データベースの領域に格納させ、前記通話音声データのメタデータを前記キーワードのメタデータと共に配布する。
さらに、通話音声データを提供するためメタデータの情報を提供する際にパスワードを記載したメールを、通話を行った携帯端末に発行する。
さらに、通話を行った携帯端末以外で予め登録されている複数の関係者の携帯端末に対してパスワードを記載したメールを発行する。
さらに、前記メタデータ作成部は、少なくとも3台の携帯端末間で行う通話に対して、メタデータを作成する。
さらに、携帯端末間で行った通話の通話音声データを携帯端末に格納し通話終了後に携帯端末に格納した通話音声データを前記データベースに格納させ、前記メタデータ作成部にメタデータ作成を行わせる。
さらに、本発明は、携帯端末の通話を再現するためのメタデータ付き通話音声データ提供方法において、携帯端末からの通話音声データを格納する工程と、格納された通話音声データを音声認識処理しシーンを区分けするキーワードを検出する工程と、検出したキーワードに対してメタデータを作成する工程と、検出されたキーワードが格納されている領域にインデックスを付ける工程と、作成されたメタデータを格納する工程と、通話を行った携帯端末に対してパスワードを記載したメールを発行する工程と、メールを受け取った携帯端末から要求に対してメタデータの情報を携帯端末に配布する工程と、携帯端末からのメタデータの選択に対して携帯端末を有する各自に対して欲する通話音声データだけを提供する工程とを備えることを特徴とするメタデータ付き通話音声データ提供方法を提供する。
さらに、本発明は、携帯端末の通話を再現するためのメタデータ付き通話音声データ提供をコンピュータで実行するプログラムにおいて、携帯端末からの通話音声データを格納する手順と、格納された通話音声データを音声認識処理しシーンを区分けするキーワードを検出する手順と、検出したキーワードに対してメタデータを作成する手順と、検出されたキーワードが格納されている領域にインデックスを付ける手順と、作成されたメタデータを格納する手順と、通話を行った携帯端末に対してパスワードを記載したメールを発行する手順と、メールを受け取った携帯端末から要求に対してメタデータの情報を携帯端末に配布する手順と、携帯端末からのメタデータの選択に対して携帯端末を有する各自に対して欲する通話音声データだけを提供する手順とを備えることを特徴とする、メタデータ付き通話音声データ提供をコンピュータで実行するプログラム。
さらに、本発明は、携帯端末間の通話を再現するためのメタデータ付き通話音声データ提供サーバーにおいて、携帯端末からの通話音声データを格納する領域と、通話音声データのメタデータを格納する領域を有するデータベースと、前記通話音声データを音声認識処理しシーンを区分けするキーワードを検出し、検出したキーワードに対してメタデータを作成し、検出されたキーワードに対して前記データベースの領域にインデックスを付け、メタデータを前記データベースの領域に格納させ、前記データベースに格納されたメタデータの情報を前記携帯端末に配布し、携帯端末を有する各自に対して欲するに通話音声データだけを提供するためのメタデータ作成部とを備えることを特徴とするメタデータ付き通話音声データ提供システムサーバーを提供する。
さらに、本発明は、サーバーに通話音声データを格納し通話の再現を行う携帯端末において、携帯端末の発呼時に前記サーバーに対して通話音声データ蓄積の許可を行う通話音声データ蓄積許可部と、前記サーバーで、前記携帯端末からの通話音声データを格納し、前記通話音声データを音声認識処理しシーンを区分けするキーワードを検出し、検出したキーワードに対してメタデータを作成し、検出されたキーワードを格納した領域にインデックスを付け、メタデータを格納させ、メタデータを配布するためのパスワードが記載されたメールが携帯端末に対して発行された場合、前記サーバーに対してメタデータの配布を要求するメタデータ配布要求部と、配布されたメタデータを表示する表示部と、前記表示部に表示されたメタデータから通話音声データのメタデータを選択し、欲する通話音声データだけを前記サーバーから取得する通話音声データ取得部とを備えることを特徴とする携帯端末を提供する。
以上説明したように、本発明によれば、携帯端末からの通話音声データを格納し、格納された通話音声データを音声認識処理しシーンを区分けするキーワードを検出し、検出したキーワードに対してメタデータを作成し、検出されたキーワードが格納されている領域にインデックスを付け、作成されたメタデータを格納し、通話を行った携帯端末に対してパスワードを記載したメールを発行し、メールを受け取った携帯端末から要求に対してメタデータの情報を携帯端末に配布し、携帯端末からのメタデータの選択に対して携帯端末を有する各自に対して欲する通話音声データだけを提供するようにしたので、誰がどのようなシーンで発言をしたのかといった情報を知ることが可能になり、電話での通話音声データを全て聞くことなく、携帯端末を有する各自に対して、欲する通話音声データだけを再現して聞かせることが可能になる。
以下、本発明の実施の形態について図面を参照して説明する。
図1は本発明に係るメタデータ付き通話音声データ提供システムの概略構成を示すブロック図である。本図に示すように、メタデータ付き通話音声データ提供システムでは、代表的に、携帯端末ネットワーク200には基地局201、202が接続され、基地局201、202には携帯端末101、102がそれぞれ接続され、さらに、携帯端末ネットワーク200にはメタデータ付通話音声データ提供サーバー300が接続され、携帯端末101、102を有する各自に対して、欲する通話音声データだけを聞かせる機能をコンピュータのプログラムで実行する。
メタデータ付通話音声データ提供サーバー300は携帯端末101、102の間にて通話が行われた通話音声データを取得し、取得した通話音声データに対してメタデータを作成し、作成したメタデータを携帯端末101、102に配布し、メタデータを配布された携帯端末101、102を有する各自に対して、メタデータで選択された通話音声データを提供する。
詳細には、メタデータ付通話音声データ提供サーバー300には発言者判別部301、データベース302、メタデータ作成部303が設けられ、さらに、データベース302には通話音声データ格納領域302A、メタデータ格納領域302Bが設けられる。
ここに、発言者判別部301は携帯端末ネットワーク200を介して入力する通話音声データを携帯端末101、102の発言者毎に判別する。
なお、通話音声データには送信元、送信先のアドレスが付いているので、送信元情報を用いて発言者毎に判別が行われる。
通話音声データ格納領域302Aは、発言者判別部301で判別された通話音声データを分離し、携帯端末101、102毎に格納する。
メタデータ作成部303は、通話音声データ格納領域302Aに格納された通話音声データに対してインデックスを付け、インデックスを付けた通話音声データに対してメタデータを作成し、作成されたメタデータをデータベース302の通話音声データ格納領域302Bに格納する。
図2は図1におけるメタデータ付通話音声データ提供サーバー300の発言者判別部301による発言者判断を説明する図である。
発言者判別部301にはメタデータ付通話音声データ提供サーバー300により携帯端末101、102から取得された通話音声データが交互に入力する。
すなわち、入力する通話音声データでは、本図(a)に示すように、携帯端末101の通話音声データ101−1に対して、携帯端末102の通話音声データ102−1が応答し、
通話音声データ102−1に対して携帯端末101の通話音声データ101−2が応答し、
通話音声データ101−2に対して携帯端末102の通話音声データ102−3が応答し、
通話音声データ102−3に対して携帯端末101の通話音声データ101−4が応答し、
通話音声データ101−4に対して携帯端末102の通話音声データ102−5が応答し、
通話音声データ102−5に対して携帯端末101の通話音声データ101−6が応答し、
通話音声データ101−6に対して携帯端末102の通話音声データ102−7が応答し、
通話音声データ102−7に対して携帯端末101の通話音声データ101−8が応答し、
通話音声データ101−8に対して…以下同様に通話が終了するまで続くとする。
発言者判別部301は、交互に入力する通話音声データに対して、本図(b)に示すように、携帯端末101の通話音声データ101−1、101−2、…、101−8、…、携帯端末102の通話音声データ102−1、102−2、…、102−8、…、を判別する。
なお、通話音声データは送信元情報で判別されるので、発言者判別部301では携帯端末101、102から同時に通話音声データが入力されても判別は可能である。
図3は図1におけるデータベース302の通話音声データ格納領域302Aに格納される通話音声データを示す図である。本図に示すように、通話音声データ格納領域302Aには、発言者判別部301により判別された携帯端末101の通話音声データ101−1〜101−7、…、携帯端末の通話音声データ102−1〜102−7、…が別々に格納される。
図4は図1におけるメタデータ作成部303の概略構成を示すブロック図である。本図に示すように、メタデータ作成部303には発言者区分部303Aが設けられ、発言者区分部303Aは通話音声データ格納領域302Aに格納されている携帯端末101、102毎の通話音声データに対してインデックスを付け、インデックスに対して、発言者の通話音声データを区分けするメタデータを作成しデータベース302のメタデータ格納領域302Bに格納する。
さらに、メタデータ作成部303にはシーン区分部303Bが設けられ、シーン区分部303Bは通話音声データから特定のキーワードを検出し、検出したキーワードを基に通話音声データに対してシーン分けしデータベース302の通話音声データ格納領域302Aに格納されているキーワードに対してインデックスを付け、検出されたキーワードに対してメタデータを作成しデータベース302のメタデータ格納領域302Bに格納する。
詳細には、シーン区分部303Bには音声認識部304、言語処理部305が設けられる。
ここに、音声認識部304はデータベース302の通話音声データ格納領域302Aに格納されている通話音声データを入力し、音声認識の解析を行う。
言語処理部305は予めキーワードを格納し、音声認識部304で音声認識された言語に対して格納されたキーワードと一致する場合、一致した言語をメタデータとする処理を行う。
キーワードの一例としては、「今週末はどうする?」、「場所は何処にする?」、「値段はどうする?」、「出発は何時にする?」、「誰にする?」、「色は何色にする?」、「厚さはどうする?」、「長さはどうする?」、「温度はどうする?」、「重さはどうする?」、「高さはどうする?」、「大きさはどうする?」、「幅はどうする?」、「材料はどうする?」がある。
さらに、携帯端末を有する各自により所望のキーワードを追加するようにしてもよい。
図5はメタデータ作成部303により通話音声データ格納領域302Aに対して付けるインデックス例を説明する図である。
本図に示すように、メタデータ作成部303の発言者区分部303Aにより、携帯端末101の通話音声データ101−1〜101−8、…の先頭の通話音声データ101−1にはインデックス1が付けられ、携帯端末102の通話音声データ102−1〜102−8、…の先頭の通話音声データ102−1にはインデックス2が付けられる。
このインデックス1、2で携帯端末101、102のいずれか一方の通話音声データの選択が可能になる。
さらに、シーン区分部303Bにより、検出されたキーワードにより通話音声データをシーン分けし、キーワードがある通話音声データの位置にインデックスが付けられる。
例えば、携帯端末101の通話音声データ101−3にキーワード1として「今週はどうする?」が検出された場合には、キーワード1に対してインデックス3が付けられる。
さらに、携帯端末101の通話音声データ101−5にキーワード2として「場所は何処にする?」が検出された場合には、キーワード2に対してインデックス4が付けられる。
さらに、携帯端末102の通話音声データ102−2にキーワード3として「値段はどうする?」が検出された場合には、キーワード3に対してインデックス5が付けられる。
さらに、携帯端末102の通話音声データ102−6にキーワード4として「出発は何時にする?」が検出された場合には、キーワード4に対してインデックス6が付けられる。
図6はメタデータ作成部303で作成されるメタデータの例である。本図に示すように、メタデータ作成部303は、発言者区分について携帯端末101の通話音声データに対するメタデータ、携帯端末101の通話音声データのシーン区分に対してキーワード1、2、…に対するメタデータを作成し、各メタデータに対してインデックス1、3、4、…を付ける。
さらに、メタデータ作成部303は、発言者区分について携帯端末102の通話音声データに対するメタデータ、携帯端末102の通話音声データのシーン区分に対してキーワード3、4、…に対するメタデータを作成し、各メタデータに対してインデックス2、5、6、…を付ける。
インデックス1、2でデータベース302の通話音声データ格納領域302Aに格納されている携帯端末101、102の通話音声データの検索が行われ、インデックス3、4、5、6、…で、携帯端末101、102を有する各自に対して、欲する通話音声データだけを検索することを可能にする。
図7は図1における携帯端末101、102の各々について本発明に係る概略構成を示すブロック図である。本図に示すように、携帯端末101、102の各々には通話音声データ蓄積許可部111が設けられ、通話音声データ蓄積許可部111は、携帯端末101、102の一方から他方に発呼がある場合、メタデータ付通話音声データ提供サーバー300から相手の電話番号と共に「通話音声データを蓄積します。よろしいですか?」との表示、音声案内が携帯端末101、102の各々に対して行われ、この表示、に対して、携帯端末101、102の各々からメタデータ付通話音声データ提供サーバー300に対して通話音声データ蓄積の許可を行う。
さらに、携帯端末101、102の各々にはメタデータ配布要求部112が設けられ、メタデータ配布要求部112は、メタデータ付通話音声データ提供サーバー300から通話音声データの格納、メタデータ作成が終了した場合、メタデータを配布するためのパスワードが記載されたメールが携帯端末101、102に発行され、メタデータ付通話音声データ提供サーバー300に対してメタデータの配布を要求することが可能になる。
携帯端末101、102の各々の表示部113にはメタデータ付通話音声データ提供サーバー300から配布されたメタデータが表示される。
携帯端末101、102の各々には通話音声データ取得部114が設けられ、通話音声データ取得部114は、表示部113の表示を参照して、携帯端末101、102のいずれかの通話音声データの取得を選択し、キーワードの選択を行い、通話音声データを取得する。
図8は図7の表示部113に表示されるメタデータ例を説明する図である。本図(a)に示すように、携帯端末101の通話音声データ取得選択、携帯端末102の通話音声データ取得選択が表示される。
本図(b)に示すように、通話音声データ取得部114により携帯端末101の通話音声データ取得選択が行われた場合には、キーワード1の選択、キーワード2の選択、…が表示される。
本図(c)に示すように、通話音声データ取得部114により携帯端末102の通話音声データ取得選択が行われた場合には、キーワード3の選択、キーワード4の選択、…が表示される。
本図(d)に示すように、通話音声データ取得部114により本図(b)、本図(c)でいずれかのキーワードが選択された場合、再生、中止、巻戻、早送の表示が行われ、通話音声データ取得部114により再生が選択された場合にはキーワードで区分けされた通話音声データの再生が行われる。
さらに、通話音声データ取得部114により中止が選択された場合には再生が中止される。
さらに、通話音声データ取得部114により巻戻、早送が選択された場合には再生の調整が可能になる。
図9はメタデータ付通話音声データ提供サーバー300の一連の動作例を説明するフローチャートである。
本図に示すように、ステップ401において、メタデータ付通話音声データ提供サーバー300の発言者判別部301では、携帯端末101、102の一方から他方に発呼があると、通話音声データを蓄積するという許可があるか否かを判断する。許可がなければ、又は発呼に対して相手側が電話に出ない場合には、本動作を起動せず、処理を終了する。
ステップ402において、相手側が電話に出て、通話音声データの蓄積の許可があった場合には、基地局201、202を介して、メタデータ付通話音声データ提供サーバー300では携帯端末101、102から通話音声データを取得し、発言者判別部301では、取得された通話音声データに対して、携帯端末101、102のいずれの発言者であるかの判別を行う。
ステップ403において、発言者の判別が行われた通話音声データに対して発言者毎に、通話音声データの先頭にインデックスを付けてデータベース302の通話音声データ格納領域302Aに格納する。
ステップ404において、通話音声データ格納領域302Aに格納された発言者毎の通話音声データに対して音声認識の解析を行い、特定されたキーワードを検出し、検出されたキーワードにより通話音声データのシーン区分を行う。
ステップ405において、格納された通話音声データで検出されたキーワードにインデックスを付ける。
ステップ406において、通話音声データ格納領域302Aに格納された発言者毎の通話音声データ、検出されたキーワードに対してメタデータを作成し、メタデータ格納領域302Bに格納する。
ステップ407において、メタデータ付通話音声データ提供サーバー300から携帯端末101、102の各々に対して、メタデータを配布するためのパスワードが記載されたメールを発行し、メタデータの配布が可能である旨を知らせる。
ステップ408において、携帯端末101、102の各々から選択されたメタデータに基づき発言者、通話音声データの区分けについてメタデータ格納領域302Bを検索し、検索結果として、シーン区分けされた発言者の通話音声データを携帯端末101、102に提供し、処理を終了する。
図10は携帯端末101、102の一連の動作を説明するフローチャートである。本図に示すように、ステップ411において、携帯端末101、102の一方から他方に発呼を行う場合に、メタデータ付通話音声データ提供サーバー300に対して、通話音声データ蓄積許可部111により通話音声データの蓄積の許可を行う。
ステップ412において、メタデータ付通話音声データ提供サーバー300で発行され、パスワードが記載されたメールを受信したかを判断する。受信しない場合には処理を終了する。
ステップ413において、メールを受信した場合にはメタデータ付通話音声データ提供サーバー300に対して、メタデータ配布要求部112によりメタデータ配布の要求を行う。
ステップ414において、メタデータ付通話音声データ提供サーバー300から配布されたメタデータを表示部113に表示し、表示されたメタデータから通話音声データ取得部114により発言者の選択が行われる。
ステップ415において、表示されたメタデータから通話音声データ取得部114により通話音声データに対してシーン区分の選択が行われる。
ステップ416において、発言者の選択、シーン区分の選択に応じた通話音声データの取得がOKか否かの判断を行う。別の取得を行う場合にはステップ413に進む。取得がOKならば処理を終了する。
したがって、本発明によれば、メタデータの配布により、誰がどのようなシーンで発言をしたのかといった情報を知ることが可能になり、電話での通話音声データを全て聞くことなく、携帯端末101、102を有する各自に対して、欲する通話音声データだけを再現して聞かせることが可能になる。
好ましくは、通話中、携帯端末101、102内に会話内容の通話情報を格納し、通話終了後に携帯端末101、102からメタデータ付通話音声データ提供サーバー300にアクセスし、メタデータを作成することも可能である。これにより汎用性が増す。
図11は図1の第1の変形例であり、メタデータ付き通話音声データ提供システムの概略構成を示すブロック図である。本図に示すように、図1と比較して、好ましくは、少なくとも3台の携帯端末101、102、103間で通話を行う場合にも本発明の適用が可能である。これにより汎用性が増す。
図12は図1の第2の変形例であり、メタデータ付き通話音声データ提供システムの概略構成を示すブロック図である。本図に示すように、図1と比較して、好ましくは、通話を行った携帯端末101、102以外の関係者が有する複数の携帯端末103、104に対して、メタデータ付通話音声データ提供サーバー300はパスワードを記載したメタデータを配布し、アクセス可能にする。なお、関係者が有する携帯端末の情報がメタデータ付通話音声データ提供サーバー300に登録されているとする。これにより汎用性が増す。
図1のメタデータ付通話音声データ提供サーバー300では、携帯端末101、102の発言者を判別したが、以下のように、発言者を判別せずに、通話音声データに対してシーン区分を行うようにしてもよい。
図13はメタデータ作成部303により通話音声データ格納領域302Aに対して付けるインデックス例を説明する図である。
メタデータ付通話音声データ提供サーバー300はデータベース302の通話音声データ格納領域302Aに対して、携帯端末101、102から交互に取得した通話音声データをそのまま格納し、
携帯端末102の通話音声データ102−2にキーワード1として「値段はどうする?」が検出された場合には、キーワード1に対してインデックス1が付けられる。
さらに、携帯端末101の通話音声データ101−3にキーワード2として「今週はどうする?」が検出された場合には、キーワード2に対してインデックス2が付けられる。
さらに、携帯端末101の通話音声データ101−5にキーワード3として「場所は何処にする?」が検出された場合には、キーワード3に対してインデックス3が付けられる。
さらに、携帯端末102の通話音声データ102−6にキーワード4として「出発は何時にする?」が検出された場合には、キーワード4に対してインデックス4が付けられる。
メタデータ付通話音声データ提供サーバー300によるメタデータの作成、配布、携帯端末101、102によるメタデータの表示、選択の説明は前述と同様であるので省略する。
このようにして、発言者を判別する必要がなく、欲する情報だけを知りたい場合には有利となり、汎用性が増す。
以上、携帯端末について説明を行ったが、これに限らず、携帯電話機、PHS(簡易携帯電話機)、PDA(携帯情報端末)、固定電話機、IP(Internet Protocol)電話機にも利用可能である。
本発明に係るメタデータ付き通話音声データ提供システムの概略構成を示すブロック図である。 図1におけるメタデータ付通話音声データ提供サーバー300の発言者判別部301による発言者判断を説明する図である。 図1におけるデータベース302の通話音声データ格納領域302Aに格納される通話音声データを示す図である。 図1におけるメタデータ作成部303の概略構成を示すブロック図である。 メタデータ作成部303により通話音声データ格納領域302Aに対して付けるインデックス例を説明する図である。 メタデータ作成部303で作成されるメタデータの例である。 図1における携帯端末101、102の各々について本発明に係る概略構成を示すブロック図である。 図7の表示部113に表示されるメタデータ例を説明する図である。 メタデータ付通話音声データ提供サーバー300の一連の動作例を説明するフローチャートである。 携帯端末101、102の一連の動作を説明するフローチャートである。 図1の第1の変形例であり、メタデータ付き通話音声データ提供システムの概略構成を示すブロック図である。 図1の第2の変形例であり、メタデータ付き通話音声データ提供システムの概略構成を示すブロック図である。 メタデータ作成部303により通話音声データ格納領域302Aに対して付けるインデックス例を説明する図である。
符号の説明
101、102、103、104…携帯端末
111…通話音声データ蓄積許可部
112…メタデータ配布要求部
113…表示部
114…通話音声データ取得部
200…携帯端末ネットワーク
201、202、203、204…基地局
300…メタデータ付通話音声データ提供サーバー
301…発言者判別部
302…データベース
302A…通話音声データ格納領域
302B…メタデータ格納領域
303…メタデータ作成部
303A…発言者区分部
303B…シーン区分部
304…音声認識部
305…言語処理部

Claims (11)

  1. 通話を再現するためのメタデータ付き通話音声データ提供システムにおいて、
    基地局を介して通話を行う携帯端末と、
    前記携帯端末からの通話音声データを格納する領域と、通話音声データのメタデータを格納する領域を有するデータベースと、
    前記通話音声データを音声認識処理しシーンを区分けするキーワードを検出し、検出したキーワードに対してメタデータを作成し、検出されたキーワードに対して前記データベースの領域にインデックスを付け、メタデータを前記データベースの領域に格納させ、前記データベースに格納されたメタデータの情報を前記携帯端末に配布し、携帯端末を有する各自に対して欲するに通話音声データだけを提供するためのメタデータ作成部とを備えることを特徴とするメタデータ付き通話音声データ提供システム。
  2. 前記メタデータ作成部は、
    前記データベースに格納された通話音声データを音声認識する音声認識部と、
    キーワードを格納し、前記音声認識部で音声認識された言語がキーワードと一致する場合、一致する言語をメタデータとする処理を行う言語処理部とを備えることを特徴とする、請求項1に記載のメタデータ付き通話音声データ提供システム。
  3. さらに、発言者判別部を備え、前記発言者判別部は携帯端末からの通話音声データの発言者を判別し、通話音声データを発言者毎に前記データベース毎に格納させ、前記メタデータ作成部は、発言者の通話音声データの先頭にインデックスを付け、発言者の通話音声データに対するメタデータを作成し、前記データベースの領域に格納させ、前記通話音声データのメタデータを前記キーワードのメタデータと共に配布することを特徴とする、請求項1に記載のメタデータ付き通話音声データ提供システム。
  4. 通話音声データを提供するためメタデータの情報を提供する際にパスワードを記載したメールを、通話を行った携帯端末に発行することを特徴とする、請求項1に記載のメタデータ付き通話音声データ提供システム。
  5. 通話を行った携帯端末以外で予め登録されている複数の関係者の携帯端末に対してパスワードを記載したメールを発行することを特徴とする、請求項4に記載のメタデータ付き通話音声データ提供システム。
  6. 前記メタデータ作成部は、少なくとも3台の携帯端末間で行う通話に対して、メタデータを作成することを特徴とする、請求項1に記載のメタデータ付き通話音声データ提供システム。
  7. 携帯端末間で行った通話の通話音声データを携帯端末に格納し通話終了後に携帯端末に格納した通話音声データを前記データベースに格納させ、前記メタデータ作成部にメタデータ作成を行わせることを特徴とする、請求項1に記載のメタデータ付き通話音声データ提供システム。
  8. 携帯端末の通話を再現するためのメタデータ付き通話音声データ提供方法において、
    携帯端末からの通話音声データを格納する工程と、
    格納された通話音声データを音声認識処理しシーンを区分けするキーワードを検出する工程と、
    検出したキーワードに対してメタデータを作成する工程と、
    検出されたキーワードが格納されている領域にインデックスを付ける工程と、
    作成されたメタデータを格納する工程と、
    通話を行った携帯端末に対してパスワードを記載したメールを発行する工程と、
    メールを受け取った携帯端末から要求に対してメタデータの情報を携帯端末に配布する工程と、
    携帯端末からのメタデータの選択に対して携帯端末を有する各自に対して欲する通話音声データだけを提供する工程とを備えることを特徴とするメタデータ付き通話音声データ提供方法。
  9. 携帯端末の通話を再現するためのメタデータ付き通話音声データ提供をコンピュータで実行するプログラムにおいて、
    携帯端末からの通話音声データを格納する手順と、
    格納された通話音声データを音声認識処理しシーンを区分けするキーワードを検出する手順と、
    検出したキーワードに対してメタデータを作成する手順と、
    検出されたキーワードが格納されている領域にインデックスを付ける手順と、
    作成されたメタデータを格納する手順と、
    通話を行った携帯端末に対してパスワードを記載したメールを発行する手順と、
    メールを受け取った携帯端末から要求に対してメタデータの情報を携帯端末に配布する手順と、
    携帯端末からのメタデータの選択に対して携帯端末を有する各自に対して欲する通話音声データだけを提供する手順とを備えることを特徴とする、メタデータ付き通話音声データ提供をコンピュータで実行するプログラム。
  10. 携帯端末間の通話を再現するためのメタデータ付き通話音声データ提供サーバーにおいて、
    携帯端末からの通話音声データを格納する領域と、通話音声データのメタデータを格納する領域を有するデータベースと、
    前記通話音声データを音声認識処理しシーンを区分けするキーワードを検出し、検出したキーワードに対してメタデータを作成し、検出されたキーワードに対して前記データベースの領域にインデックスを付け、メタデータを前記データベースの領域に格納させ、前記データベースに格納されたメタデータの情報を前記携帯端末に配布し、携帯端末を有する各自に対して欲するに通話音声データだけを提供するためのメタデータ作成部とを備えることを特徴とするメタデータ付き通話音声データ提供システムサーバー。
  11. サーバーに通話音声データを格納し通話の再現を行う携帯端末において、
    携帯端末の発呼時に前記サーバーに対して通話音声データ蓄積の許可を行う通話音声データ蓄積許可部と、
    前記サーバーで、前記携帯端末からの通話音声データを格納し、前記通話音声データを音声認識処理しシーンを区分けするキーワードを検出し、検出したキーワードに対してメタデータを作成し、検出されたキーワードを格納した領域にインデックスを付け、メタデータを格納させ、メタデータを配布するためのパスワードが記載されたメールが携帯端末に対して発行された場合、前記サーバーに対してメタデータの配布を要求するメタデータ配布要求部と、
    配布されたメタデータを表示する表示部と、
    前記表示部に表示されたメタデータから通話音声データのメタデータを選択し、欲する通話音声データだけを前記サーバーから取得する通話音声データ取得部とを備えることを特徴とする携帯端末。
JP2005301058A 2005-10-14 2005-10-14 メタデータ付き通話音声データ提供システム、方法、プログラム、サーバー及び携帯端末 Expired - Fee Related JP5007913B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005301058A JP5007913B2 (ja) 2005-10-14 2005-10-14 メタデータ付き通話音声データ提供システム、方法、プログラム、サーバー及び携帯端末

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005301058A JP5007913B2 (ja) 2005-10-14 2005-10-14 メタデータ付き通話音声データ提供システム、方法、プログラム、サーバー及び携帯端末

Publications (2)

Publication Number Publication Date
JP2007108541A true JP2007108541A (ja) 2007-04-26
JP5007913B2 JP5007913B2 (ja) 2012-08-22

Family

ID=38034430

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005301058A Expired - Fee Related JP5007913B2 (ja) 2005-10-14 2005-10-14 メタデータ付き通話音声データ提供システム、方法、プログラム、サーバー及び携帯端末

Country Status (1)

Country Link
JP (1) JP5007913B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160042211A (ko) * 2014-10-07 2016-04-19 주식회사 엘지유플러스 통화 내용 기반 주요 키워드 정보 및 배경 이미지 제공을 위한 단말, 서버, 방법, 기록 매체, 및 컴퓨터 프로그램
JP7545688B2 (ja) 2020-10-06 2024-09-05 Toppanホールディングス株式会社 イベント検出装置、イベント検出方法、及びプログラム

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08286693A (ja) * 1995-04-13 1996-11-01 Toshiba Corp 情報処理装置
JP2002024270A (ja) * 2000-06-30 2002-01-25 Sanyo Electric Co Ltd 情報検索蓄積装置
JP2002183169A (ja) * 2000-12-11 2002-06-28 Casio Comput Co Ltd 情報登録装置、及び記録媒体
JP2002271530A (ja) * 2001-03-07 2002-09-20 Sharp Corp 通信装置
JP2003272072A (ja) * 2002-03-13 2003-09-26 Mitsubishi Electric Corp 移動体盗難通報装置
JP2005181391A (ja) * 2003-12-16 2005-07-07 Sony Corp 音声処理装置および音声処理方法
JP2005277589A (ja) * 2004-03-23 2005-10-06 Nec Access Technica Ltd 情報記録機能付き電話機

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08286693A (ja) * 1995-04-13 1996-11-01 Toshiba Corp 情報処理装置
JP2002024270A (ja) * 2000-06-30 2002-01-25 Sanyo Electric Co Ltd 情報検索蓄積装置
JP2002183169A (ja) * 2000-12-11 2002-06-28 Casio Comput Co Ltd 情報登録装置、及び記録媒体
JP2002271530A (ja) * 2001-03-07 2002-09-20 Sharp Corp 通信装置
JP2003272072A (ja) * 2002-03-13 2003-09-26 Mitsubishi Electric Corp 移動体盗難通報装置
JP2005181391A (ja) * 2003-12-16 2005-07-07 Sony Corp 音声処理装置および音声処理方法
JP2005277589A (ja) * 2004-03-23 2005-10-06 Nec Access Technica Ltd 情報記録機能付き電話機

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160042211A (ko) * 2014-10-07 2016-04-19 주식회사 엘지유플러스 통화 내용 기반 주요 키워드 정보 및 배경 이미지 제공을 위한 단말, 서버, 방법, 기록 매체, 및 컴퓨터 프로그램
KR101630069B1 (ko) * 2014-10-07 2016-06-14 주식회사 엘지유플러스 통화 내용 기반 주요 키워드 정보 및 배경 이미지 제공을 위한 단말, 서버, 방법, 기록 매체, 및 컴퓨터 프로그램
JP7545688B2 (ja) 2020-10-06 2024-09-05 Toppanホールディングス株式会社 イベント検出装置、イベント検出方法、及びプログラム

Also Published As

Publication number Publication date
JP5007913B2 (ja) 2012-08-22

Similar Documents

Publication Publication Date Title
KR102223017B1 (ko) 공유된 음성 작동 디바이스상의 호출 핸들링
US7233655B2 (en) Multi-modal callback
KR101149135B1 (ko) 음성 대화형 메시징을 위한 방법 및 장치
JP4662861B2 (ja) モニタリング装置、評価データ選別装置、応対者評価装置、応対者評価システムおよびプログラム
US8320886B2 (en) Integrating mobile device based communication session recordings
US7254384B2 (en) Multi-modal messaging
US20080235018A1 (en) Method and System for Determing the Topic of a Conversation and Locating and Presenting Related Content
US7937268B2 (en) Facilitating navigation of voice data
US9063935B2 (en) System and method for synchronously generating an index to a media stream
US20040064322A1 (en) Automatic consolidation of voice enabled multi-user meeting minutes
CN109842712B (zh) 通话记录生成的方法、装置、计算机设备和存储介质
JP2008061241A (ja) 周囲情報を連続的に記録する方法及び通信システム
US7624016B2 (en) Method and apparatus for robustly locating user barge-ins in voice-activated command systems
JP2008113418A (ja) データを中央でストリングする方法
JP6485935B1 (ja) オンラインコミュニケーションのレビューシステム、方法、及びコンピュータプログラム
JP6606697B1 (ja) 通話システム、及び通話プログラム
JP2006178203A (ja) 音声情報加工システム、音声情報加工方法及び音声情報加工プログラム
TW200824408A (en) Methods and systems for information retrieval during communication, and machine readable medium thereof
KR101399581B1 (ko) 텔러 참여에 의한 자동 응답 시스템, 방법 및 컴퓨터 판독 가능한 기록 매체
JP5007913B2 (ja) メタデータ付き通話音声データ提供システム、方法、プログラム、サーバー及び携帯端末
JP2009290468A (ja) 通話録音装置及び方法
TWI715236B (zh) 語音主題分類之系統與方法
JP2014178621A (ja) 情報提供装置およびプログラム
JP5326539B2 (ja) 留守番電話システム、留守番電話サービスサーバ及び留守番電話サービス方法
JP2005277589A (ja) 情報記録機能付き電話機

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080919

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110414

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110418

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110615

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120216

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120413

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120507

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120520

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150608

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees