JP5305675B2 - 聴覚アーカイブを自動的に発生し聴覚アーカイブを提供するための方法、システム、およびコンピュータ・プログラム - Google Patents

聴覚アーカイブを自動的に発生し聴覚アーカイブを提供するための方法、システム、およびコンピュータ・プログラム Download PDF

Info

Publication number
JP5305675B2
JP5305675B2 JP2008023432A JP2008023432A JP5305675B2 JP 5305675 B2 JP5305675 B2 JP 5305675B2 JP 2008023432 A JP2008023432 A JP 2008023432A JP 2008023432 A JP2008023432 A JP 2008023432A JP 5305675 B2 JP5305675 B2 JP 5305675B2
Authority
JP
Japan
Prior art keywords
information
auditory
archive
slot
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008023432A
Other languages
English (en)
Other versions
JP2008199609A (ja
Inventor
チ・ウェイ・シォアン
チン・シ
ユィォン・チン
ファン・ピン・モン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2008199609A publication Critical patent/JP2008199609A/ja
Application granted granted Critical
Publication of JP5305675B2 publication Critical patent/JP5305675B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • H04M3/4936Speech interaction details
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/51Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing
    • H04M3/5166Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing in combination with interactive voice response systems or voice portals, e.g. as front-ends
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2203/00Aspects of automatic or semi-automatic exchanges
    • H04M2203/20Aspects of automatic or semi-automatic exchanges related to features of supplementary services
    • H04M2203/2011Service processing based on information specified by a party before or during a call, e.g. information, tone or routing selection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/42221Conversation recording systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Human Computer Interaction (AREA)
  • Telephonic Communication Services (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、一般に、聴覚アーカイブ処理に関し、具体的には、聴覚アーカイブを自動的に発生するための方法およびシステムならびに聴覚アーカイブを提供するための方法およびシステムに関する。
問い合わせセンターは、カスタマ・サービス・センターとも呼ばれ、高性能の通信およびコンピュータ技術を総合的に利用し、情報および材料のフローを最適化して管理し、通信、サービス、および製品ガイダンスを集合的にアーカイブするシステムを指す。問い合わせセンターのスタッフ・メンバーは通常、業務担当者と呼ばれる。問い合わせセンターは、数百または何千もの業務担当者によって構成されることがある。また、小規模の会社または大規模の会社の小さい部署の必要性に応じて、わずか数人の業務担当者を含む小さい問い合わせセンターが経済的に設置されることがある。
問い合わせセンターは、以下の特徴を有する。
1.ユーザの能力に対する要求が簡単である。問い合わせセンターが要求するのは、ユーザの聞く能力および話す能力のみである。年配者であっても子供であっても直接に業務担当者と話すことができ、または音声プロンプトによって関心のある情報を得ることができる。
2.コストを節約できる。問い合わせセンターは、音声およびデータを一括して転送し、ユーザは単に音声プロンプトによってデータベース内のデータを取得すれば良いので、これによって各電話呼の長さが短縮されるという効果がある。一方、各業務担当者は限られた時間期間でいっそう多くの電話呼を処理することができ、これによって電話処理の効率および電話システムの利用率が著しく向上する。
3.サービス時間が長い。問い合わせセンターは、毎日24時間、絶え間なくサービスを提供することができるので、ユーザは電話によって迅速に情報を得ることができ、問題の解決が容易かつ素早い。
4.カスタマ・サービスの質が向上する。問い合わせセンターは、丁寧かつ熱意のあるサービスを絶え間なく提供可能な親しみやすいサービス・インタフェースを有する。電話処理速度の向上のため、ユーザがオンラインで待たなければならない時間は著しく短縮される。ユーザ呼が来るとすぐに、問い合わせセンター・システムは関連情報を抽出して、ダイアル番号または被呼番号に従って業務担当者の端末に送信することができる。このため、業務担当者は電話呼を受けながらこのユーザの多くの関連情報を取得するので、電話処理の手順が簡略化される。
問い合わせセンター・サービスは企業にとって極めて重要であるが、これは概して、一種の労働集約的なサービスである。問い合わせセンターは、北米だけで600万を超える人を雇用し、この人数は2010年までに1200万人まで増えることが予想される。問い合わせセンターの業務担当者の平均年収を2万ドルと見積もっても、毎年平均120億ドルが問い合わせセンターの労働力に費やされていることになる。International Business Machine(IBM)社(アメリカ)のような大企業のいくつかでは、4万人以上の業務担当者が問い合わせセンターを介してカスタマに対応していると考えられる。これは、IBM社の全従業員に対する割合としては容認できないほど大きい。また、IBM社の問い合わせセンターおよび事業コンサルタント・サービスからの統計情報によれば、問い合わせセンターに基づくサービスのコストのほぼ80から90%が人件費である。従って、問い合わせセンターのコスト削減および高品質のサービス提供をどのように行うかは、大きな問題であった。
現在の問い合わせセンターの実施において、通常、問い合わせセンターの動作は以下のようなフローである。すなわち、ユーザが電話をかけ、業務担当者がユーザと音声のやり取りを行い、ユーザが示した問題を迅速に記録し、次いで記録した問題に従って、回答を与えるか、または、それを高レベルの部署に送るか専門職の人に転送する等の更に別の処理を行う。通常、情報の記録は業務担当者によって手動で完了するので、記録された情報の完全性、継続性、および一貫性を保証することができない。このため、記録された情報が専門職の人に渡される際に、情報の喪失またはエラーが生じる恐れがあり、結果として問題確認を繰り返したり、または努力が無駄になったりなる。これは、第三者による問題の理解および処理のためには不利であり、更に、情報または問題の統計処理にも都合が悪い。いくつかの問い合わせセンターでは、ユーザの呼の全過程を記録するが、この記録は主に業務担当者のサービスの質を監視するため、および苦情または他の場合の証拠として利用するために用いられる。こういった記録は、分類することも検索することもできず、要約するために統合することもできない。従って、このように実施されている問い合わせセンターは、人件費を有効に削減することも、技術的に効率を向上させることもできない。
問い合わせセンターの別の実施においては、ユーザの呼の全過程を記録し、音声からテキストへと文字化を行う。これは、業務担当者が完全な記録を行っている環境において生じる問題を解決することができる。しかしながら、現在の音声−テキスト文字化技術を用いる場合、予測不可能な音声コンテンツでは、認識エラー率は極めて高く、文字化の精度は極めて低い。このため、文字化されたテキスト・コンテンツの多くは読み取り不可能であり、その後の処理を行うことができない。従って、かかる実施の運用性は低い。すなわち、効果的な実施は、音声−テキスト技術の向上に左右される。
問い合わせセンターの全ての主要サービスにおける2つの重要な機能は、カスタマの苦情を処理し、要求されたものを修理することである。これらの2つの機能のため、カスタマの問題、アドレス、および問い合わせ情報を聴覚的にアーカイブすることは極めて有用である。しかしながら、コンテンツは極めて多様であるので、現在の音声−テキスト文字化技術は、音声文字化において充分に良好な精度を達成することができない。現在、これらの機能は業務担当者によって手動でサポートされている。このため、問い合わせセンターの人件費を削減し、問い合わせセンターの上述の実施における技術的な欠点を解決し、問い合わせセンターのいくつかのサービスのための自動的な解決策を達成し、動作効率を向上させるために、本発明が考案されている。
本発明の一態様によれば、聴覚アーカイブを自動的に発生させるための方法が提案される。この方法は、情報形態に従ってリアルタイム自動音声応答システムによってユーザに質問情報を送信するステップであって、情報形態がカテゴリ選択情報スロットおよび少なくとも1つの記録クリップ情報スロットを含む、ステップと、カテゴリ選択情報スロットによってユーザのカテゴリ選択情報を収集し、少なくとも1つの記録クリップ情報スロットによってユーザの記録クリップを収集するステップと、受信した情報を組み合わせて聴覚アーカイブを発生させるステップと、を含む。
本発明の別の態様によれば、聴覚アーカイブを提供するための方法が提案される。この聴覚アーカイブは、聴覚アーカイブを自動的に発生させるための前述の方法によって発生される。聴覚アーカイブを提供するためのこの方法は、情報要求側のための登録機構および個人情報プロファイルを設定するステップと、情報要求側が聴覚アーカイブを請求しようとする場合に情報要求側を認証するステップと、認証された情報要求側が対応する聴覚アーカイブにアクセスすることを可能とするステップと、を含む。
本発明の別の態様によれば、聴覚アーカイブを提供するための方法が提案される。この聴覚アーカイブは、聴覚アーカイブを自動的に発生させるための前述の方法によって発生される。聴覚アーカイブを提供するためのこの方法は、情報要求側のための登録機構および個人情報プロファイルを設定するステップと、聴覚アーカイブを対応する情報要求側に送出するか、または聴覚アーカイブに対するアクセスを対応する情報要求側に通知するステップと、を含む。
本発明の更に別の態様によれば、聴覚アーカイブを自動的に発生させるためのシステムが提案される。このシステムは、カテゴリ選択情報スロットおよび少なくとも1つの記録クリップ情報スロットを含む情報形態をストアするための情報形態ストレージ手段と、情報形態に従ってリアルタイム自動音声応答システムがユーザに質問情報を送信することを可能とするための質問手段と、カテゴリ選択情報スロットによってユーザのカテゴリ選択情報を受信し、少なくとも1つの記録クリップ情報スロットによってユーザの記録クリップを受信するための情報受信手段と、受信した情報を組み合わせて聴覚アーカイブを発生させるための聴覚アーカイブ発生手段と、を含む。
本発明の更に別の態様によれば、聴覚アーカイブを提供するためのシステムが提案される。この聴覚アーカイブは、聴覚アーカイブを自動的に発生させるための前述のシステムによって発生される。聴覚アーカイブを提供するためのこのシステムは、情報要求側のための登録機構および個人情報プロファイルを設定するための登録手段と、情報要求側が聴覚アーカイブを請求しようとする場合に情報要求側を認証するための認証手段と、認証された情報要求側が対応する聴覚アーカイブにアクセスすることを可能とするためのアクセス手段と、を含む。
本発明の更に別の態様によれば、聴覚アーカイブを提供するためのシステムが提案される。この聴覚アーカイブは、聴覚アーカイブを自動的に発生させるための前述のシステムによって発生される。聴覚アーカイブを提供するためのこのシステムは、情報要求側のための登録機構および個人情報プロファイルを設定するための登録手段と、聴覚アーカイブを対応する情報要求側に送出するか、または聴覚アーカイブに対するアクセスを対応する情報要求側に通知するための送出手段と、を含む。
本発明の更に別の態様によれば、コンピュータにロードすることができるプログラム・コード・ツールを含むコンピュータ・プログラムが提案される。このコンピュータ・プログラムがコンピュータ上で実行された場合、プログラム・コード・ツールが、前述の聴覚アーカイブを自動的に発生させるための方法および聴覚アーカイブを提供するための方法の全てのステップを実行するように適合される。
本発明によって提案される聴覚アーカイブを自動的に発生させるための方法およびシステムならびに聴覚アーカイブを提供するための方法およびシステムは、聴覚アーカイブを自動的に処理し提供する独創的な手法を提供し、問い合わせセンターの動作効率を向上させ、労働力を効果的に削減する。
本発明の新規な特徴と考えられる特性を、特許請求の範囲において述べる。しかしながら、本発明自体およびその好適な形態は、更に別の目的および利点と共に、図面と関連付けて例示的な実施形態の以下の詳細な説明を読むことによって、最も良く理解されよう。
図面を通して、同一の参照番号は同一または同様の構成要素またはユニットを示すことに留意すべきである。
本発明は、聴覚アーカイブを自動的に発生させるための方法およびシステムならびに聴覚アーカイブを設けるための方法およびシステムに関する。本発明によって、カスタマとの音声のやり取りにより、聴覚アーカイブを自動的に発生し提供する。聴覚アーカイブは、問題のカテゴリ、問題の説明、アドレス、問い合わせ情報等、カスタマに関連する重要な情報を含む。カスタマの苦情および修理要求の処理等、問い合わせセンターのいくつかの機能について、本発明の方法およびシステムはこれらを自動的かつ有効な方法で処理することで、問い合わせセンターの業務担当人員に置き換わることができる。このため、本発明の方法およびシステムは、問い合わせセンターのコストを大幅に削減しながら、従来技術の問い合わせセンターの欠点を克服することができる。従って、本発明によって、高品質かつ高効率のサービスを提供するための問い合わせセンターの独創的なモデルが生成される。
本発明によって発生される聴覚アーカイブは、情報形態に基づいて実施される。このため、本発明の方法およびシステムを詳細に説明する前に、情報形態について最初に説明する必要がある。ここで図1を参照すると、図1は本発明の一実施形態に従った情報形態100の例示的な図である。情報形態100は、3つの情報スロット、すなわちカテゴリ選択情報スロット110、記録クリップ情報スロット120、および聴覚アーカイブ情報スロット130を含むものとして示している。ここで、カテゴリ選択情報スロット110および記録クリップ情報スロット120は、情報収集のために不可欠である。また、聴覚アーカイブ情報スロット130は任意であり、カテゴリ選択情報スロット110および記録クリップ情報スロット120における情報を再結合することによって発生する。上述の3つの情報スロットの他に、時間タグ情報スロット、インデクス情報スロット等の1つ以上の補助情報スロット140を情報形態100に含むことができる。各補助情報スロットは、対応する聴覚アーカイブ情報スロットに関連付けられている。このように、聴覚アーカイブ情報スロットにアクセスした場合、補助情報を通して聴覚アーカイブ情報スロットを検索し、より関連した情報を提供する。好ましくは、情報形態100における各情報スロットに、1つの特定の識別情報を追加して、情報検索および編集を容易にすると良い。好ましくは、情報形態100におけるいくつかの情報スロット(カテゴリ選択情報スロット110および記録クリップ情報スロット120等)に、説明情報を追加することができる。好ましくは、説明情報を用いて、ユーザとのやり取りのためのプロンプト情報を発生させると良い。
情報形態は、データベース内に単一の情報ユニットとしてストアすることができ、各情報スロットは情報ユニットのデータ要素としてストアされる。情報形態は、例えば開発者によって自己定義されたファイル・フォーマットでストアすることができる。各情報形態を単一のファイルとしてストアすることができ、または全ての情報形態を1つの大きいファイルとしてストアすることも可能である。
具体的には、情報形態100におけるカテゴリ選択情報スロット110は、ユーザのカテゴリ選択情報を収集するために用いられる。かかる情報の1つの重要な特徴は、全ての可能な選択肢がある集合に属しているということであり、これらの選択肢は1つずつ列挙すると良い。このようなある集合は、前もってサービス・プロバイダによってカスタマイズされている。ユーザは、ある集合から選択することができるだけである。1つの利点は、限定された集合の音声認識では、従来技術によって比較的高い精度を達成可能なことである。かかる集合のサイズは、音声認識の精度にある程度影響を及ぼすので、一般に大きすぎないサイズとする。概して、1つの集合内の選択肢の数が100未満である場合、認識率は95%を超えるか、100%に近付くことができる。これに比べて、規定の範囲なしの音声認識の精度はずっと低い。また、カテゴリ選択情報がある集合内にあることは、後の段階での情報管理およびタスク送出に大きな利点となる。
本発明の一実施形態において、ある居住区域の問い合わせセンターによってサポートされる修理サービス・カテゴリの集合は、例えば、ガス・ヒーター修理、ケーブル・テレビ修理、給水修理、および回路修理である。
かかる情報のストレージ方法は、(1)テキスト「ガス・ヒーター修理」を直接ストアする等のテキスト・ストレージ、(2)01がガス・ヒーター修理を表し、02がケーブル・テレビ修理を表す等の符号化ストレージ等を用いることができる。一般に、符号化ストレージ方法を用いる際には、符号化と特定のサービス・カテゴリとの対応テーブルが必要である。ある実施形態においては、直接テキスト・ストレージ方法に比べて、符号化ストレージ方法の方がストレージ空間を節約することができると共に検索速度も向上する。上述の2つのストレージ方法は当技術分野では周知であり、本発明において詳細には説明しない。
具体的には、情報形態100における記録クリップ情報スロット120は、ユーザの記録クリップをストアするために用いられる。記録クリップ情報スロット120は主に、ユーザの詳細な問題説明、ユーザの名前、ユーザの詳細な住所等、より小さい集合において1つずつ列挙することが難しい何らかの情報を収集するために用いられる。一般に、現在の音声認識技術によってかかる情報を適切に認識することは難しい。
かかる情報のストレージ方法は、一般的な音声情報ストレージ方法を用いることができる。すなわち、(1)PCMまたはWaveのフォーマットによる非圧縮ストレージ方法等の非圧縮ストレージ、(2)G.723.1またはAMRの符号化による圧縮ストレージ方法等の圧縮ストレージ、である。圧縮ストレージ方法はストレージ空間を節約することができるが、音声回復が必要な場合に復号動作を行わなければならず、このため動作効率に悪影響を及ぼす。上述の2つのストレージ方法は当技術分野においては周知であり、本発明において詳細には説明しない。
好ましくは、情報形態100には複数の記録クリップ情報スロット120が存在し、各記録クリップ情報スロット120が特定の情報の一部分を記録すると良い。記録クリップの特定の識別情報および説明情報によって、ユーザの要求に応じて、様々な記録クリップを自由に再結合、ストア等することができると好ましい。
具体的には、情報形態100における聴覚アーカイブ情報スロット130は、収集した情報を再結合することによって発生させた聴覚アーカイブをストアするために用いられる。好ましくは、情報形態100に複数の聴覚アーカイブ情報スロット130があり、カテゴリ選択情報スロット110における各スロットおよび記録クリップ情報スロット120において記録された特定の情報に対応して聴覚アーカイブをストアすることができる。
次に図2を参照すると、図2は、本発明の一実施形態による情報形態100における情報スロット構造の例を示す図である。情報スロットは、情報形態100における情報スロットのいずれか1つとすることができる。前記情報スロットの構造は、識別情報、説明情報、およびストレージ空間を含む。識別情報は、情報スロットのための一意の識別であり、ストレージおよび検索を容易にする。説明情報は、情報スロットの必要な説明であり、ビジター(visitor)の理解を容易にする。ストレージ空間は、例えばテキスト情報、記録クリップ等とすることができる情報スロットに対応する情報をストアするために用いられる。
図1および図2は単に例示のための図であり、当業者が本発明に関連する情報スロットをよりいっそう理解することを意図したものである。これは、前記情報形態の構造および表現を制限することを意図しておらず、情報形態は、本発明の範囲から逸脱することなく、当業者によって様々な方法で設計および変更することができる。
問い合わせセンターの機能および実施の詳細な説明から、情報形態の上述の例示的な説明と関連付けて、本発明によって、聴覚アーカイブを自動的に発生させるための方法が提案される。音声−テキスト文字化を用いた従来の問い合わせセンターとは異なり、本発明の方法は、カスタマ記録に基づいて聴覚アーカイブを発生させる。
ここで図3を参照すると、図3は、本発明の一実施形態による聴覚アーカイブを自動的に発生させるための方法のフローチャートを示す。図3において、この方法は、2つの包括ステップを含む。すなわち、情報形態に従ってユーザに質問して情報を収集するステップ200および聴覚アーカイブを発生させるステップ299である。
具体的には、図3において、まずこの方法はステップ205で開始し、ユーザは問い合わせセンターとの接続を確立し、リアルタイム自動音声応答(IVR:Interactive Voice Response)システムとのやり取りを行う。ユーザが問い合わせセンターとの接続を確立する方法は、例えば、電話呼を行うこと、またはインターネットを介してアクセスすること等とすることができ、それらは全て当技術分野では周知であり、本発明においては詳細には説明しない。
次いで、方法は(図3の上部の点線ボックス200に示すように)包括ステップ200に進み、IVRは情報形態に従ってユーザに質問し、ユーザのカテゴリ選択情報および記録クリップを収集する。例えば図2の情報形態100のように、情報形態は前もって設計されているので、この方法では、情報形態に従ってリアルタイムIVRがユーザとやり取りを行うことによって、情報形態の情報スロットに入力することができる。ステップ200は更にいくつかのステップに分割することができるが、これについて以下で詳細に述べる。
方法はまずステップ210に進み、情報形態に従ってユーザに質問する。各質問は、情報形態におけるカテゴリ選択情報スロット110の1つまたは記録クリップ情報スロット120の1つ以上に対応している。
カテゴリ選択情報スロット110では、音声またはキーボードによって選択を行うようにユーザを促すことによって入力ことができる。理解を容易にするため、図2における情報形態100を参照して、修理サービスをサポートする居住区域の問い合わせセンターの上述の実施形態を再び参照する。例えば、音声により、ユーザにキーを押下して修理カテゴリを入力するよう促すことができる。例えば、「ガス・ヒーター修理の場合は1を押してください。ケーブル・テレビ修理の場合は2を押してください。給水修理の場合は3を押してください。回路修理の場合は4を押してください。」という音声をユーザに聞かせる。あるいは、音声コマンドによって修理カテゴリを入力するようユーザに促すことができる。例えば、「ガス・ヒーター修理、ケーブル・テレビ修理、給水修理、または回路修理と言ってください。」という音声をユーザに聞かせる。ユーザは、プロンプト・プロセスの途中でいつでもプロンプト音声を中断し、入力を直接行うことができる。あるいは、双方の入力方法を同時にサポートすることももちろん可能である。例えば、「キーを押して番号を選ぶか、または直接言ってください。1、ガス・ヒーター修理。2、ケーブル・テレビ修理。3、給水修理。4、回路修理。」という音声をユーザに聞かせる。プロンプトの方法は、音声のやり取りのプロセス中に音声で促すという上述の方法に限定されず、当業者に明らかな他のいずれかの方法とすることができる。例えば、ユーザ・マニュアルによって促したり、視覚的な装置によって即座に提示される文字によって促したりすることができる。
記録クリップ情報スロット120では、一般的なプロンプト方法は、特定の情報を言うようユーザを促すことである。例えば、「カチッという音の後に住所を言ってください」または「カチッという音の後にトラブルの説明をしてください」等の音声をユーザに聞かせる。同様に、プロンプトの方法は上述の方法に限定されず、当業者に明らかな他のいずれかの方法とすることができる。
次いで、方法はステップ215に進み、ユーザの情報を収集する。すなわち、ユーザのカテゴリ選択情報をカテゴリ選択情報スロットによって収集し、ユーザの記録クリップを1つ以上の記録クリップ情報スロットによって収集する。カテゴリ選択情報スロット110にキーを押す入力方法を用いる場合、電話キーパッドによって送信された番号を捕捉して、それをすぐにカテゴリ選択情報スロット110にストアする必要がある。カテゴリ選択情報スロット110に音声入力方法を用いる場合、および記録クリップ情報スロットを入力する場合、ユーザが言った音声を捕捉する必要がある。ユーザが音声を入力している場合、前記方法は認識エンジンを呼び出して音声部および無音部を自動的に検出し、音声部のみをストアすることができる。あるいは、ユーザが発話を開始または終了する際に、発話部の開始点および終了点を明示的に特定するために、あるキー(キー「#」等)を押すようユーザに促す場合がある。その後、収集した音声情報をカテゴリ選択情報スロット110または記録クリップ情報スロット120に即座にストアする。
最終的に発生した情報形態を遠隔サーバにストアするある実施形態においては、あるキャッシュ機構を用いて情報を迅速に収集することができる。例えば、音声インタラクション・システムがユーザとやり取りしている間に、ローカルにストアした一時的な情報形態を設定する。インタラクション・プロセスの間または全インタラクション・プロセスが完了した後、一時的な情報形態および遠隔サーバ上の情報形態を同期させる。更に、圧縮後に音声情報をストアしなければならないある実施形態においては、収集した音声情報をローカルで一時的な情報形態に非圧縮ストレージ方法で一時的にストアして、音声圧縮が引き起こす時間遅延を回避することができる。その後、サーバとの同期プロセスの間に、音声圧縮およびストレージを実行する。
次いで、方法はステップ220に進み、情報形態に従ってユーザに問う質問がまだあるか否かを判定する。まだ質問がある場合、方法はステップ210に戻って、例えば名前、住所、連絡先の番号等をユーザに聞く。ユーザに問う質問がない場合、方法は(図3の下部に点線ボックス299に示すように)包括ステップ299に進み、収集した情報を組み合わせることによって聴覚アーカイブを発生させる。前記の包括ステップ299は、更にいくつかのステップに分割することができるが、これについて以下で詳細に説明する。
方法はまずステップ225に進み、215において非音声フォーマットのカテゴリ選択情報が収集されているか否かを判定する。そうである場合、方法はステップ230に進み、収集した非音声フォーマットのカテゴリ選択情報を音声フォーマットに変換する。例えば、テキスト−音声(TTS:Text to Speech)システムによって、これを音声に変換することができる。符号化ストレージを用いたカテゴリ選択情報では、テキスト−音声技術を用いる前に、符号化情報を対応するテキストに変換しなければならない。更に、カテゴリ選択情報は、事前記録(prerecording)によって、対応する音声情報に置き換えることができる。ステップ230は任意であることに留意すべきである。全ての情報が音声フォーマットで収集されている場合、このステップは省略することができる。
ステップ225において、ステップ215で非音声フォーマットのカテゴリ選択情報が収集されていないと判定されると、方法はステップ235に進む。ステップ235においては、ステップ230を実行したか否かには関係なく、カテゴリ選択情報および記録クリップ情報は音声フォーマットになっている。ステップ235では、音声フォーマットのカテゴリ選択情報および記録クリップ情報を何らかの方法で組み合わせることによって、聴覚アーカイブを発生させる。例えば、カテゴリ選択情報の後に記録クリップ情報を置くことができ、または、ユーザのアドレス、電話番号等の記録クリップ情報の後にカテゴリ選択情報を置き、次いで残りの記録クリップ情報を置くことができる。聴覚アーカイブを組み合わせるためにどの特定の方法を用いるかは、前もって設定されているか、情報要求側によって指定される。これは、本発明の具体的なの実施に影響を与えない。
聴覚アーカイブを発生させるプロセスの間に、他の何らかの情報を追加して、潜在的な情報要求側に対してより良いユーザ経験を与えることができる。例えば、サービス・カテゴリに対応するカテゴリ選択情報では、「ユーザが選択したサービス・カテゴリは」という音声プロンプト情報を追加することができる。更に、ある実施形態においては、適切なバックグラウンド・ミュージックを追加して、ユーザの経験をより良いものとすることができる。更に、ある実施形態では、冗長な音声情報(例えばユーザ音声記録の途中にある長時間の無音)を削除して聴覚アーカイブの長さを短縮し、ストレージおよび検索の効率を向上させることができる。記録中の無音を削除するには無音検出技術が必要であるが、これは音声認識の分野では極めて一般的な技術であり、本発明において詳細には説明しない。
聴覚アーカイブの発生では、異なる様々な形態を使用可能である。例えば、詳細の程度に関して、詳細モード、通常モード、および簡略化モードに分割することができる。詳細モードの聴覚アーカイブはプロンプト情報を全て含み、通常モードの聴覚アーカイブはプロンプト情報の一部のみを含み、簡略化モードの聴覚アーカイブは追加のプロンプト情報を含まない。一方、情報要求側は異なる再生順序を規定することができる。例えば、アドレス先頭モードを規定することができ、この場合はアドレス情報が先頭に置かれる。また、問題先頭モードを規定することができ、この場合は問題の説明が先頭に置かれる。順序を自己定義する目的は、異なる情報要求側の要求を満足させることである。
次いで、方法はステップ240に進み、情報形態100の聴覚アーカイブ情報スロット130に、発生した聴覚アーカイブをストアする。このステップは、前記実施形態において好ましいステップである。また、聴覚アーカイブは、情報検索のたびに再発生することができる。しかし、そうすることは時間がかかるだけでなく、情報検索に不利でもある。聴覚アーカイブの異なる形態を、異なる聴覚アーカイブ情報スロット130にストアすることができる。
次いで、聴覚アーカイブを発生する包括ステップ299の完了後、方法はステップ245に進み、補助情報を発生してストアする。このステップは、前記実施形態において好ましいステップである。かかる情報を発生するか否かは、情報形態100を設計する際に聴覚アーカイブ情報スロットにおいて対応する補助情報スロット140が設計されているか否かに左右される。例えば、情報形態100において時間タグ情報スロットが設計されている場合、聴覚アーカイブを発生させるのと同時に、聴覚アーカイブの各記録クリップに対応する時間タグ情報を発生させる。例えば、「12s:詳細アドレス情報」は、詳細なアドレス情報が12秒後に再生されることを示し、「46s:詳細問題説明」は、詳細な問題説明が46秒後に再生されることを示す。時間タグ情報は、発生した聴覚アーカイブにおいてサウンド・クリップ間のジャンプをサポートするために用いられる。時間タグ情報は、これに対応する記録クリップの前の全ての記録クリップの長さを蓄積することによって計算することができる。例えば、情報形態100においてインデクス情報スロットが設計されている場合、聴覚アーカイブを発生させるのと同時に、聴覚アーカイブの各記録クリップに対応するインデクス情報を発生させる。聴覚アーカイブにおける1つのサウンド・クリップは、ユーザの記録クリップおよび音声形態に変換されたカテゴリ選択情報を含むことに留意すべきである。また、インデクス情報は、発生した聴覚アーカイブにおけるサウンド・クリップ間のジャンプをサポートするために用いられる。前記インデクス情報は、記録の順序に関して発生することができる。例えば、「1:詳細なアドレス情報」は、1番目のサウンド・クリップが詳細なアドレス情報であることを示し、「2:詳細な問題説明」は、2番目のサウンド・クリップが詳細な問題説明であることを示す。上述の時間タグ情報およびインデクス情報の表記は単に例示であることに留意すべきである。当業者には、様々な異なる指示方法が明らかであろう。好ましくは、各情報スロットに特定の識別を更に追加して、情報検索および編集を容易にすることができる。
本発明の方法をより良く理解し実施するのに役立てるために、本発明の方法を実施する簡略化した例を以下に示す。この例は単に例示であり、実際の実施において、収集した情報は以下の例のものとは多かれ少なかれ異なる場合があることに留意すべきである。
ユーザおよび問い合わせセンターが接続を確立した後、互いにやり取りを行っている間の対話を以下に示す。
Q:**建物管理会社のサービス・センターにお電話ありがとうございます。どういったご用件でしょうか。
A:ガス・ヒーター修理です。
Q:ご住所をお願いします。
A:ハピネス・ロードNo.10、ビルディング1、1201号室です。
Q:お名前をどうぞ。
A:トムです。
Q:どういったトラブルですか。
A:ガス・ヒーターのパイプに水漏れがあります。
Q:連絡先の番号を入力してください。
A:12345678(ユーザのキー押下によって入力)
上述の音声のやり取り後に収集したユーザ情報に従って発生した聴覚アーカイブの一例を以下に示す。ここでは、全てのコンテンツは音声フォーマットに変換されている。
・カスタマの選択:ガス・ヒーター修理
・カスタマの詳細:トム;ハピネス・ロードNo.10、ビルティング1、1201号室;ガス・ヒーターのパイプに水漏れ
・カスタマの連絡先番号:12345678
上の例から、ユーザが入力したかまたは発話した情報を音声に変換し、必要な音声説明情報を各カスタマ情報の前に追加して、簡略化した聴覚アーカイブを発生し、これが情報を喪失することなく全てのカスタマ情報を含むことがわかる。一方、カスタマ情報は必要に応じて分類し組み合わせて、将来の検索およびアクセスを容易にする。
本発明の聴覚アーカイブを自動的に発生させる方法の上述の詳細な説明において、上述の実施形態は単に例示であることに留意すべきである。従って、本発明の精神から逸脱することなく、いくつかのステップを追加または削除することができ、またはいくつかのステップを組み合わせたり、または更にいくつかのステップに分割したりすることも可能であるが、その場合、方法ステップは全て本発明の保護範囲内に該当する。
本発明の方法に従って自動的に発生した上述の聴覚アーカイブに基づいて、かかる聴覚アーカイブを情報要求側(例えばエンジニア)に提供し、やがて情報側が彼に関する情報を得られるようにすることが必要である。このため、本発明によって、聴覚アーカイブを提供するための方法も提供される。発生した聴覚アーカイブを提供するためには主に2つの方法がある。すなわち、情報請求および情報送出である。
情報請求の方法は、情報要求側(例えばエンジニア)が、音声チャネル(固定電話、移動電話等)によって自発的に聴覚アーカイブを請求することを示す。ここで図4を参照すると、図4は、本発明の一実施形態による、情報請求の方法において聴覚アーカイブを提供するための方法のフローチャートを示す。
具体的には、図4において、この方法は最初にステップ305で開始し、情報要求側は問い合わせセンターとの接続を確立する。情報要求側が問い合わせセンターとの接続を確立する方法は、例えば、電話呼を行うこと、またはインターネットを介してアクセスすることとすることができ、これらは双方とも当技術分野では周知であり、本発明において詳細には説明しない。
次いで、方法はステップ310に進み、情報要求側のために登録機構および個人情報プロファイルを設定する。最初に、情報要求側のために登録機構を設定する必要がある。登録の後、情報要求側はユーザ名およびパスワードを取得する。一方、登録した各情報要求側のために個人情報プロファイルを設定し、彼のアクセス権および個人用デフォルト設定の一部をストアする。ステップ310は、情報要求側が最初に問い合わせセンターにログオンした際にのみ実行する必要があり、登録の完了後は省略可能であることに留意すべきである。
次いで、方法はステップ315に進み、情報要求側が聴覚アーカイブを請求しようとする場合、例えば、ユーザ名およびパスワードの入力を促して、情報要求側を認証する。認証された情報要求側のみが、そのアクセス権に対応する聴覚アーカイブにアクセスすることができる。認証が行われた後、情報要求側の個人デフォルト設定を知るため、個人情報プロファイルを呼び出す。
次いで、方法はステップ320に進み、認証された情報要求側は情報形態100にアクセスし、これによって対応する聴覚アーカイブにアクセスする。
情報送出の方法は、システムが登録された情報要求側に情報を自動的に送出することを示す。かかる送出には、マルチメディア・メッセージ、電子メール、および電話メッセージ・ボックス等を用いることができる。ここで図5を参照すると、図5は、本発明の一実施形態による、情報送出の方法で聴覚アーカイブを提供するための方法のフローチャートを示す。
具体的には、図5において、この方法はまずステップ410で開始し、情報要求側のために登録機構および個人情報プロファイルを設定する。最初に、情報要求側のために登録機構を設定する必要がある。登録の後、情報要求側はユーザ名およびパスワードを取得する。一方、登録された各情報要求側のために個人情報プロファイルを設定し、彼のアクセス権および個人用デフォルト設定の一部をストアする。ステップ410は、システムが設定された際にのみ実行する必要があり、その後は省略可能であることに留意すべきである。
次いで、方法はステップ415に進み、情報要求側を分類する。例えば、サービス・カテゴリに関して情報要求側を分割することができる。すなわち、ガス・ヒーター修理、ケーブル・テレビ修理、給水修理、回路修理等である。また、例えば、サービス規模に関して、大規模、中規模、小規模のように情報要求側を分割することができる。また、例えば、カスタマ承認度に関して、良好、中程度、不良のように情報要求側を分割することができる。前記カテゴリは自動的に発生させるか、または手動で設定することができる。このステップは、前記実施形態において好ましいステップであることに留意すべきである。情報要求側が一人のみであるか、またはシステムが全ての情報要求側のいずれか一人にランダムに情報を送出する等のある環境においては、このステップを行わない場合もある。
次いで、方法はステップ420に進み、発生した聴覚アーカイブを対応する情報要求側に直接送出するか、または対応する情報要求側に聴覚アーカイブのアクセスを通知する。
情報送出の方法において聴覚アーカイブを提供するための方法を実行する場合、情報送出において、ある特定のポリシーを用いることができる。例えば、情報形態にストアしたカテゴリ選択情報に従って、対応するカテゴリの情報要求側を選択する。また、例えば、より良いカスタマ承認度の情報要求側に情報を送出することが好ましい。これらのポリシーは、管理権を有するユーザによって追加、変更、および削除することができる。
送出された情報は、マルチメディア・メッセージによって送出する等、聴覚アーカイブを直接含むことができる。または、特定の電話番号およびパスワードと共にテキスト情報の一部を送出して、情報を受信した情報要求側がこの電話番号にダイアルし対応するパスワードを入力することによって、対応する情報を取得可能とすることができる。
情報請求または情報送出の方法において聴覚アーカイブを提供するためのいずれの方法においても、情報要求側は、何らかの制約条件を指定することによって、最も望んでいる情報を迅速に検索することができると好ましい。情報形態にストアされたカテゴリ選択情報は、迅速な情報検索のために大きな便宜をもたらすことができる。かかるプロセスは、自動音声応答システムとのインタラクションによって完了することができる。ユーザへのプロンプトと同様に、情報要求側を促すことも可能である。例えば、「キーを押して番号を選択するか、または直接言ってください。1:ガス・ヒーター修理。2:ケーブル・テレビ修理。3:給水修理。4:回路修理。」という音声をユーザに聞かせる。自動音声応答システムは、情報要求側の選択に応じて、対応する情報形態を検索する。例えば、データベース・フォーマットにストアされた情報形態は、SQL言語を用いて、迅速な検索のための条件の制約を行うことができる。
好ましくは、情報要求側は、気に入った聴覚アーカイブ・モードを選択することができる。例えば、情報要求側は、既存の聴覚アーカイブ・モードから、詳細モード、通常モード、または簡略化モードの1つを選択することができる。好ましくは、情報要求側は、聴覚アーカイブ・モードを自己定義することができる。聴覚アーカイブ・モードは、彼の個人情報プロファイルにストアすることができる。好ましくは、情報要求側は、デフォルトの聴覚アーカイブ・モードを更に設定して、電話のたびに選択を繰り返すことを回避することができる。
好ましくは、情報要求側は、聴覚アーカイブにおいて様々なサウンド・クリップの再生順序を調節することができる。例えば、情報要求側が特にユーザのアドレスに関心がある場合、時間を節約するため、詳細なアドレス情報を再生の先頭に置くことができる。
いずれかの聴覚アーカイブが情報形態にストアされていた場合、自動音声応答システムは、対応する聴覚アーカイブを直接再生する。聴覚アーカイブが情報形態にストアされていない場合、自動音声応答システムは、リアルタイムで必要な聴覚アーカイブを発生して再生する。かかる聴覚アーカイブは、規定のポリシーに応じて、情報形態にストアされる場合もあるしストアされない場合もある。
検索された聴覚アーカイブは、音声フォーマットで情報要求側に再生される。好ましくは、マルチ・モード環境において、テキスト情報等の補助情報も同時に情報要求側に提示することができる。
好ましくは、情報要求側は、聴覚アーカイブにおける様々なサウンド・クリップ間のジャンプを制御することができる。一般的なジャンプ・コマンドは、例えば、特定の時間期間だけ早送りすること、または特定の時間期間だけ巻き戻すことである。好ましくは、聴覚アーカイブにおける様々なサウンド・クリップに対応する時間タグ情報を発生した環境のもとで、情報要求側は、音声コマンドまたはキーの押下によって、あるサウンド・クリップにジャンプすることができる。例えば、ユーザは、「詳細なアドレス情報」と言って、詳細なアドレス情報の対応する位置(例えば12秒後)にジャンプし、それを再生することができる。
以上、本発明の聴覚アーカイブを自動的に発生するための方法および聴覚アーカイブを提供するための方法を詳しく紹介した。同じ発明の概念のもとで、本発明は、聴覚アーカイブを自動的に発生するためのシステムおよび聴覚アーカイブを提供するためのシステムを提案する。前記システムについて、図面に関連付けて以下で詳細に説明する。
ここで図6を参照すると、図6は、本発明の一実施形態による聴覚アーカイブを自動的に発生するためのシステム500を示す。前記システム500は、情報形態ストレージ手段505、質問手段510、情報収集手段515、音声変換手段525、聴覚アーカイブ発生手段530、および補助情報発生手段540を含む。
図2に示した情報形態100等の、本発明による情報形態は、情報形態ストレージ手段505にストアされている。
質問手段510は、情報形態ストレージ手段505にストアされた情報形態100に従ってユーザに質問をする。各質問は、カテゴリ選択情報スロット110(図2)の1つまたは1つ以上の記録クリップ情報スロット120(図2)に対応している。カテゴリ選択情報スロット110については、音声またはキーボードによって選択を行うようユーザを促すことによって入力することができる。記録クリップ情報スロット120については、一般的なプロンプト方法は、特定の情報を発話するようユーザを促すことである。上述のプロンプト方法は先に詳細に説明したので、ここでは繰り返さない。
情報収集手段515は、ユーザの情報を収集するために用いられる。すなわち、カテゴリ選択情報スロットによってユーザのカテゴリ選択情報を収集し、1つ以上の記録クリップ情報スロットによってユーザの記録クリップを収集する。ユーザの入力方法の相違に従って(例えばキー押下、音声入力等)、情報をそれぞれ捕捉し、情報形態100における特定の情報スロットにストアする。
音声変換手段525は、収集された非音声フォーマットのカテゴリ選択情報を音声フォーマットに変換する。全ての情報が音声フォーマットで収集された場合は、音声変換手段525は動作を行わない。
聴覚アーカイブ発生手段530は、音声フォーマットのカテゴリ選択情報および記録クリップ情報を何らかの方法で組み合わせる。組み合わせ方法は予め規定するか、または情報要求側によって指定することができる。これは本発明の具体的な実施に影響を及ぼさない。聴覚アーカイブを組み合わせて発生するプロセスの間に、他の何らかの情報を追加して、潜在的な情報要求側に対してより良いユーザ経験を与えることができる。情報の発生では、異なる様々な形態を使用可能である。例えば、詳細の程度に関して、詳細モード、通常モード、および簡略化モードに分割することができる。前記他の情報および前記モードの説明は上述したものと同じである。一方、情報取得者は、異なる情報順序を規定することができる。順序を自己定義する目的は、様々な情報要求側の要求を満足させることである。発生した聴覚アーカイブは、情報形態ストレージ手段505の情報形態100において聴覚アーカイブ情報スロット130にストアする。また、異なる聴覚アーカイブ情報スロット130に、聴覚アーカイブの異なる形態をストアすることも可能である。
補助情報発生手段540は、時間タグ情報およびインデクス情報等、他の補助情報を発生してストアする。かかる補助情報を発生するか否かは、情報形態100を設計する際に対応する補助情報スロット140が設計されているか否かに左右される。好ましくは、特定の識別を各情報スロットに更に追加して、情報の検索および編集を容易にすることができる。発生させた情報は、情報形態100の対応する補助情報スロット140にストアする。
本発明のシステムに従って自動的に発生させた上述の聴覚アーカイブに基づいて、かかる聴覚アーカイブを情報要求側(例えばエンジニア)に提供し、やがて情報要求側が彼に関する情報を得られるようにすることが必要である。このため、本発明によって、聴覚アーカイブを提供するためのシステムも提供される。図面に関連付けて、本発明の聴覚アーカイブを提供するためのシステムを詳細に説明する。発生した聴覚アーカイブを提供するためには主に2つの方法がある。すなわち、情報請求および情報送信である。2つの方法の実行ロジックについては、先に詳細に説明した。
ここで図7を参照すると、図7は、本発明の一実施形態による聴覚アーカイブを提供するためのシステム600を示す。前記システム600は、個人プロファイル・ストレージ手段605、登録手段610、認証手段615、分類手段620、およびアクセス/送出手段625を含む。
個人プロファイル・ストレージ手段605には、情報要求側の個人情報プロファイルがストアされている。登録手段610は、情報要求側のための登録機構および個人情報プロファイルを設定する。認証手段615は、情報要求側が聴覚アーカイブを請求しようとする場合にその認証を行う。分類手段620は、情報要求側を分類する。アクセス/送出手段625は、発生させた聴覚アーカイブに対するアクセスを情報要求側に与えるために用いられ、または聴覚アーカイブを対応する情報要求側に直接送信し、または聴覚アーカイブに対するアクセスについて対応する情報要求側に通知する。これらの手段の具体的な動作フローは、本発明の聴覚アーカイブにアクセスするための上述の方法(図4および図5)と同一または同様であり、従ってその詳細な説明は省略する。前記システムが情報請求の方法または情報送信の方法のいずれかを用いて聴覚アーカイブを提供可能であることは、当業者には明らかである。
本発明の聴覚アーカイブを自動的に発生するためのシステムおよび聴覚アーカイブを提供するためのシステムについて、詳細に説明した。システムおよびその様々な構成要素は、ハードウェア、ソフトウェア、またはその組み合わせによって実施可能であり、必要に応じて他のシステムと組み合わせることも可能である。
ここで図8を参照すると、図8は、本発明の一実施形態による、聴覚アーカイブを発生するための方法およびシステムならびに聴覚アーカイブを提供するための方法およびシステムの全体的な動作の概略図を示す。ユーザ710は、自動音声応答システムシステム720とインタラクトする。具体的には、ユーザ710は、自動音声応答システム720から促されて、音声あるいはキーボードまたはその両方によって、カテゴリ選択情報および記録クリップ情報を自動音声応答システム720に入力する。次いで、自動音声応答システム720は、ユーザが入力したカテゴリ選択情報および記録クリップ情報によって情報形態730に入力する。情報形態730に記録されたカテゴリ選択情報および記録クリップ情報に従って、聴覚アーカイブ740を発生させる。次いで、聴覚アーカイブ740はエンジニア750によって自発的にアクセスすることができ、または聴覚アーカイブ740を対応するエンジニア750に自動的に送信することができ、またはエンジニア750に聴覚アーカイブ740へのアクセスを通知することができる。エンジニア750が聴覚アーカイブ750によって送出された情報を取得した後、エンジニア750はユーザ710へのサポートを提供することができる。
以上、本発明の聴覚アーカイブを自動的に発生するための方法およびシステムならびに聴覚アーカイブを提供するための方法およびシステムの詳細な説明を行った。当業者には認められようが、本発明は、方法、システム、あるいはコンピュータ・プログラムまたはそれら全てとして具現化することができる。従って、本発明は、ハードウェア、ソフトウェア、またはそれらの組み合わせの形態で具現化することができる。更に、本発明は、機械読み取り可能媒体上に含まれるコンピュータ・プログラムとして具現化することができ、この場合、本発明に従ったプロセスを実行するようにコンピュータ・システムをプログラミングするためのコンピュータ実行可能プログラム命令がストアされている。本発明において用いる場合、「機械読み取り可能媒体」という言葉は、コンピュータ・システムに実行のための命令を与えるあらゆる媒体を含む。かかる媒体は、不揮発性媒体、揮発性媒体、および伝送媒体を含むがこれらには限定されない様々な形態を取ることができる。不揮発性媒体は、一般に、例えばフレキシブル・ディスク、フロッピ磁気ディスク、ハード・ディスク、磁気テープ、または他のいずれかの磁気媒体、CD−ROM、または他のいずれかの光媒体、スロッティング・カード、または他のいずれかの孔パターンを有する物理媒体、PROM、EPROM、EEPROM、フラッシュ・メモリ、他のいずれかのメモリ・チップまたはカートリッジ、または、コンピュータ・システムによって読み取ることができて命令をストアするのに適した他のいずれかの媒体を含む。
更に、フローチャートまたはブロック・チャートにおける各ブロックおよびいくつかのブロックの組み合わせは、いくつかのコンピュータ・プログラム命令によって実施可能であることは認められよう。これらのコンピュータ・プログラム命令は、汎用コンピュータ、特定用途コンピュータ、または他のプログラマブル・データ処理デバイスのプロセッサに与えられて機械を生成することができ、これらの命令は、コンピュータまたは他のプログラマブル・データ処理デバイスのプロセッサによって実行されると、ブロック・チャートあるいはフローチャートまたはその両方のブロックによって示される機能を実施するための手段を生成することができる。
本発明について、好適な実施形態を参照することで具体的に提示し説明したが、これは網羅的であることも、本発明を開示した形態に限定することも意図していない。本発明の精神および範囲から逸脱することなく、形態および詳細における多くの変形が当業者には明らかであろう。実施形態は、本発明の原理、実際の用途を最も良く説明するため、および、考えられる具体的な用途に適した様々な変更を用いた様々な実施形態について当業者が本発明を理解することができるように、選択し記載した。
本発明の一実施形態による情報形態の例示的な図である。 本発明の一実施形態による情報スロット構造の例を示す図である。 本発明の一実施形態による、聴覚アーカイブを自動的に発生させるための方法のフローチャートを示す。 本発明の一実施形態による、情報質問の方法において聴覚アーカイブを提供するための方法のフローチャートを示す。 本発明の一実施形態による、情報送出の方法において聴覚アーカイブを提供するための方法のフローチャートを示す。 本発明の一実施形態による、聴覚アーカイブを自動的に発生させるためのシステムを示す。 本発明の一実施形態による聴覚アーカイブを提供するためのシステムを示す。 本発明の一実施形態による、聴覚アーカイブを発生させるための方法およびシステムならびに聴覚アーカイブを設けるための方法およびシステムの全体的な動作の概略図を示す。
符号の説明
100 情報形態
110 カテゴリ選択情報スロット
120 記録クリップ情報スロット
130 聴覚アーカイブ情報スロット
140 補助情報スロット
740 聴覚アーカイブ

Claims (13)

  1. 聴覚アーカイブを自動的に発生させるシステムであって、
    カテゴリ選択情報スロットおよび少なくとも1つの記録クリップ情報スロットを含む情報形態を格納するための情報形態ストレージ手段と、
    前記情報形態に従ってユーザに質問情報を送信する質問手段と、
    前記カテゴリ選択情報スロットに格納される前記ユーザのカテゴリ選択情報を受信し、前記記録クリップ情報スロットに格納される前記ユーザの記録クリップを受信する情報受信手段と、
    前記受信した情報を組み合わせて聴覚アーカイブを発生させる聴覚アーカイブ発生手段と、
    を含み、
    前記情報形態が、聴覚アーカイブ情報スロット、時間タグ情報スロット、およびインデクス情報スロットの少なくとも1つを更に含み、
    前記質問手段によって与えられる質問が、前記情報形態における前記カテゴリ選択情報スロットと前記記録クリップ情報スロットにそれぞれ対応しており、
    前記質問手段が、
    前記カテゴリ選択情報スロットについて、前記ユーザにプロンプト情報を送信して発話またはキーボード入力によって有限の選択肢の中から回答を行うよう前記ユーザを促すための手段と、
    前記記録クリップ情報スロットについて、前記ユーザにプロンプト情報を送信して発話によって任意の回答を行うよう前記ユーザを促すための手段と、
    を更に含み、
    前記聴覚アーカイブ発生手段が、非音声フォーマットのカテゴリ選択情報がある場合、それを音声フォーマットに変換するための音声変換手段を更に含み、
    前記聴覚アーカイブ発生手段が、音声フォーマットの前記カテゴリ選択情報および前記記録クリップ情報を組み合わせて前記聴覚アーカイブを発生させる、システム。
  2. 前記聴覚アーカイブ発生手段が、
    前記受信した情報を組み合わせる際に適切なプロンプト情報あるいは適切なバックグラウンド・ミュージックまたはその双方を追加する手段と、
    冗長な音声情報を削除する手段と、
    の少なくとも1つを更に含む、請求項に記載のシステム。
  3. 前記情報形態が時間タグ情報スロットおよびインデクス情報スロットを含み、
    前記システムが補助情報発生手段を更に含み、該補助情報発生手段が、
    前記聴覚アーカイブ発生手段が聴覚アーカイブを発生させるのに応答して、前記聴覚アーカイブの様々な記録クリップに対応する前記時間タグ情報を発生させ、それを前記情報形態における前記時間タグ情報スロットに格納する動作と、
    前記聴覚アーカイブ発生手段が聴覚アーカイブを発生させるのに応答して、前記聴覚アーカイブの様々な記録クリップに対応する前記インデクス情報を発生させ、それを前記情報形態における前記インデクス情報スロットに格納する動作と、
    の少なくとも1つのために用いられる、請求項1又は2に記載のシステム。
  4. 情報要求側のための登録機構および個人情報プロファイルを設定するための登録手段と、
    前記情報要求側が聴覚アーカイブを要求しようとする場合に前記情報要求側を認証するための認証手段と、
    前記認証された情報要求側が対応する聴覚アーカイブにアクセスすることを可能とするためのアクセス手段と、
    を更に含む、請求項1乃至のいずれかに記載のシステム。
  5. 情報要求側のための登録機構および個人情報プロファイルを設定するための登録手段と、
    前記聴覚アーカイブを対応する情報要求側に送出するか、または前記聴覚アーカイブに対するアクセスを対応する情報要求側に通知するための送出手段と、
    を更に含む、請求項1乃至のいずれかに記載のシステム。
  6. 前記聴覚アーカイブを迅速に検索するために制約条件を指定する動作と、
    聴覚アーカイブ・モードを選択するか、または聴覚アーカイブ・モードを自己定義する動作と、
    前記聴覚アーカイブにおける様々なサウンド・クリップの再生順序を調節する動作と、
    前記聴覚アーカイブにおける様々なサウンド・クリップ間のジャンプを制御する動作と、
    の1つ以上を前記情報要求側が実行することを可能とする、請求項4又は5に記載のシステム。
  7. カテゴリ選択情報スロットおよび少なくとも1つの記録クリップ情報スロットを含む情報形態を格納するための情報形態ストレージを備えるシステムが聴覚アーカイブを自動的に発生させる方法であって、
    情報形態に従ってユーザに質問情報を送信するステップと、
    前記カテゴリ選択情報スロットに格納される前記ユーザのカテゴリ選択情報を受信し、前記記録クリップ情報スロットに格納される前記ユーザの記録クリップを受信するステップと、
    前記受信した情報を組み合わせて聴覚アーカイブを発生させるステップと、
    を含み、
    前記情報形態が、聴覚アーカイブ情報スロット、時間タグ情報スロット、およびインデクス情報スロットの少なくとも1つを更に含み
    前記質問情報をユーザに送信するステップにおいて与えられる質問が、前記情報形態における前記カテゴリ選択情報スロットまたは前記記録クリップ情報スロットにそれぞれ対応しており、前記質問情報をユーザに送信するステップが、
    前記カテゴリ選択情報スロットについて、前記ユーザにプロンプト情報を送信して発話またはキーボード入力によって有限の選択肢の中から回答を行うよう前記ユーザを促すステップと、
    前記記録クリップ情報スロットについて、前記ユーザにプロンプト情報を送信して発話によって任意の回答を行うよう前記ユーザを促すステップと、
    を更に含み、
    前記聴覚アーカイブを発生させるステップが、
    非音声フォーマットのカテゴリ選択情報がある場合、それを音声フォーマットに変換するステップと、
    音声フォーマットの前記カテゴリ選択情報および前記記録クリップ情報を組み合わせて前記聴覚アーカイブを発生させるステップと、
    を更に含む、
    方法。
  8. 前記聴覚アーカイブを発生させるステップが、
    前記受信した情報を組み合わせる際に適切なプロンプト情報あるいは適切なバックグラウンド・ミュージックまたはその双方を追加するステップと、
    冗長な音声情報を削除するステップと、
    の少なくとも1つを更に含む、請求項に記載の方法。
  9. 前記情報形態が時間タグ情報スロットを含み、
    前記方法が、前記聴覚アーカイブを発生させるステップを実行するのに応答して、前記聴覚アーカイブの様々な記録クリップに対応する前記時間タグ情報を発生させ、それを前記情報形態における前記時間タグ情報スロットにストアすることを更に含む、請求項7又は8に記載の方法。
  10. 前記情報形態がインデクス情報スロットを含み、
    前記方法が、前記聴覚アーカイブを発生させるステップを実行するのに応答して、前記聴覚アーカイブの様々な記録クリップに対応する前記インデクス情報を発生させ、それを前記情報形態における前記インデクス情報スロットに格納することを更に含む、請求項7乃至9のいずれかに記載の方法。
  11. 情報要求側のための登録機構および個人情報プロファイルを設定するステップと、
    前記情報要求側が聴覚アーカイブを請求しようとする場合に前記情報要求側を認証するステップと、
    前記認証された情報要求側が対応する聴覚アーカイブにアクセスすることを可能とするステップと、
    を更に含む、請求項7乃至10のいずれかに記載の方法。
  12. 情報要求側のための登録機構および個人情報プロファイルを設定するステップと、
    前記聴覚アーカイブを対応する情報要求側に送出するか、または前記聴覚アーカイブに対するアクセスを対応する情報要求側に通知するステップと、
    を更に含む、請求項7乃至11のいずれかに記載の方法。
  13. 前記聴覚アーカイブを迅速に検索するために制約条件を指定する機能と、
    聴覚アーカイブ・モードを選択するか、または聴覚アーカイブ・モードを自己定義する機能と、
    前記聴覚アーカイブにおける様々なサウンド・クリップの再生順序を調節する機能と、
    前記聴覚アーカイブにおける様々なサウンド・クリップ間のジャンプを制御する機能と、
    の1つ以上を前記情報要求側が実行することを可能とするステップを更に含む、請求項11又は12に記載の方法。
JP2008023432A 2007-02-05 2008-02-04 聴覚アーカイブを自動的に発生し聴覚アーカイブを提供するための方法、システム、およびコンピュータ・プログラム Expired - Fee Related JP5305675B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2007100070108A CN101242452B (zh) 2007-02-05 2007-02-05 用于自动生成声音文档以及提供声音文档的方法和系统
CN200710007010.8 2007-02-05

Publications (2)

Publication Number Publication Date
JP2008199609A JP2008199609A (ja) 2008-08-28
JP5305675B2 true JP5305675B2 (ja) 2013-10-02

Family

ID=39676169

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008023432A Expired - Fee Related JP5305675B2 (ja) 2007-02-05 2008-02-04 聴覚アーカイブを自動的に発生し聴覚アーカイブを提供するための方法、システム、およびコンピュータ・プログラム

Country Status (3)

Country Link
US (2) US9025736B2 (ja)
JP (1) JP5305675B2 (ja)
CN (1) CN101242452B (ja)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101742002A (zh) * 2008-11-05 2010-06-16 北大方正集团有限公司 业务信息的管理方法、装置及系统
US9053182B2 (en) * 2011-01-27 2015-06-09 International Business Machines Corporation System and method for making user generated audio content on the spoken web navigable by community tagging
US8719369B1 (en) * 2011-04-25 2014-05-06 Brian Brown Customized message generation
CN103686607B (zh) * 2012-09-10 2017-03-29 中国移动通信集团公司 一种终端与呼叫中心交互式应答通信的方法和系统
CN102868836B (zh) * 2012-09-17 2015-08-05 北京讯鸟软件有限公司 用于呼叫中心的真人话术系统及其实现方法
CN102932240B (zh) * 2012-11-15 2016-06-29 北京千家悦网络科技有限公司 一种基于语音提示的邮件系统及其发送和接收方法
US9742914B2 (en) * 2014-10-21 2017-08-22 Nexidia Inc. Agent evaluation system
US10230592B2 (en) * 2016-03-02 2019-03-12 Oracle International Corporation Compound service performance metric framework
CN107026949B (zh) * 2017-02-20 2018-02-27 平安科技(深圳)有限公司 回访语音信息的处理方法和装置
US10642889B2 (en) 2017-02-20 2020-05-05 Gong I.O Ltd. Unsupervised automated topic detection, segmentation and labeling of conversations
CN107092364A (zh) * 2017-04-19 2017-08-25 重庆小雨点小额贷款有限公司 一种信息录入方法以及装置
CN109726372B (zh) * 2017-10-31 2023-06-30 上海优扬新媒信息技术有限公司 基于通话记录的工单的生成方法、装置及计算机可读介质
US11276407B2 (en) 2018-04-17 2022-03-15 Gong.Io Ltd. Metadata-based diarization of teleconferences
EP3799687B1 (en) * 2018-06-19 2024-07-10 Pryon Incorporated Recording evidence of communication in human-machine interactions
JP7161361B2 (ja) * 2018-09-28 2022-10-26 大和ハウス工業株式会社 情報管理システム
CN109375963B (zh) * 2018-10-23 2022-06-17 长沙裕邦软件开发有限公司 基于催收系统自动日志的方法、存储介质以及应用服务器
CN109935242A (zh) * 2019-01-10 2019-06-25 上海言通网络科技有限公司 可打断式语音处理系统和方法
CN109902163B (zh) * 2019-02-28 2022-03-01 百度在线网络技术(北京)有限公司 一种智能应答方法、装置、设备及存储介质
CN110867197A (zh) * 2019-10-23 2020-03-06 吴杰 语音交互过程中实时打断语音机器人的方法及设备

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4982420A (en) * 1988-03-01 1991-01-01 Theis Peter F Recording system with response categorization
JPH0218552A (ja) 1988-07-06 1990-01-22 Fuji Photo Film Co Ltd ハロゲン化銀カラー写真感光材料
JPH02150156A (ja) 1988-11-30 1990-06-08 Nec Corp ファクシミリ・システム
JP2838987B2 (ja) 1995-06-30 1998-12-16 日本電気株式会社 電話機
US5897616A (en) * 1997-06-11 1999-04-27 International Business Machines Corporation Apparatus and methods for speaker verification/identification/classification employing non-acoustic and/or acoustic models and databases
JPH1168932A (ja) 1997-08-12 1999-03-09 Nec Corp 留守番電話サービスおよび用件メッセージの検索方法
JP2000115405A (ja) 1998-10-01 2000-04-21 Toshiba Corp 電話の自動発信・自動対応システム及び該システムの制御方法
US6587822B2 (en) * 1998-10-06 2003-07-01 Lucent Technologies Inc. Web-based platform for interactive voice response (IVR)
JP3066028U (ja) * 1999-06-25 2000-02-18 株式会社オフィス・オートメーション・システム ライブテレプロモーションシステム
US6665644B1 (en) 1999-08-10 2003-12-16 International Business Machines Corporation Conversational data mining
US6850603B1 (en) * 1999-09-13 2005-02-01 Microstrategy, Incorporated System and method for the creation and automatic deployment of personalized dynamic and interactive voice services
GB9926134D0 (en) 1999-11-05 2000-01-12 Ibm Interactive voice response system
US7167830B2 (en) * 2000-03-10 2007-01-23 Entrieva, Inc. Multimodal information services
US20030125958A1 (en) * 2001-06-19 2003-07-03 Ahmet Alpdemir Voice-interactive marketplace providing time and money saving benefits and real-time promotion publishing and feedback
JP3923712B2 (ja) 2000-08-08 2007-06-06 株式会社エヌ・ティ・ティ・データ メッセージ交換システムおよび記録媒体
WO2002069325A1 (en) * 2001-02-26 2002-09-06 Startouch International, Ltd. Apparatus and methods for implementing voice enabling applications in a coverged voice and data network environment
JP2002281469A (ja) 2001-03-21 2002-09-27 Canon Inc テレビ電話装置
CN100388284C (zh) * 2001-09-18 2008-05-14 维音数码(上海)有限公司 一种数字化声像记录系统
US8068595B2 (en) * 2002-03-15 2011-11-29 Intellisist, Inc. System and method for providing a multi-modal communications infrastructure for automated call center operation
US7197460B1 (en) * 2002-04-23 2007-03-27 At&T Corp. System for handling frequently asked questions in a natural language dialog service
US7590542B2 (en) * 2002-05-08 2009-09-15 Douglas Carter Williams Method of generating test scripts using a voice-capable markup language
EP1361740A1 (de) * 2002-05-08 2003-11-12 Sap Ag Verfahren und System zur Verarbeitung von Sprachinformationen eines Dialogs
JP2004129168A (ja) 2002-10-07 2004-04-22 Yoshitaka Yamamoto 携帯電話を用いたデータ処理装置
US7076427B2 (en) 2002-10-18 2006-07-11 Ser Solutions, Inc. Methods and apparatus for audio data monitoring and evaluation using speech recognition
JP2004200865A (ja) 2002-12-17 2004-07-15 Hitachi Electronics Service Co Ltd 受付電話内容録音検索再生システム及び検索データ提供用コンピュータとコンピュータ・ソフトウエア
US20040162724A1 (en) 2003-02-11 2004-08-19 Jeffrey Hill Management of conversations
US20050278177A1 (en) 2003-03-11 2005-12-15 Oded Gottesman Techniques for interaction with sound-enabled system or service
US7260537B2 (en) 2003-03-25 2007-08-21 International Business Machines Corporation Disambiguating results within a speech based IVR session
US7398212B2 (en) 2004-04-22 2008-07-08 Hewlett-Packard Development Company, L.P. System and method for quality of service management with a call handling system
JP4672471B2 (ja) 2005-07-19 2011-04-20 富士通エフ・アイ・ピー株式会社 電話サービス提供装置
US8139730B2 (en) * 2005-10-11 2012-03-20 International Business Machines Corporation Integrating an IVR application within a standards based application server
US20070203708A1 (en) * 2006-02-28 2007-08-30 Intervoice Limited Partnership System and method for providing transcription services using a speech server in an interactive voice response system
US20090006083A1 (en) * 2007-06-30 2009-01-01 Bachand William R Systems And Methods For Spoken Information
US8489399B2 (en) * 2008-06-23 2013-07-16 John Nicholas and Kristin Gross Trust System and method for verifying origin of input through spoken language analysis
US8934618B2 (en) * 2008-12-29 2015-01-13 Avaya Inc. Method for analysing an interactive voice response system
US8543406B2 (en) * 2009-01-22 2013-09-24 Yahoo! Inc. Method and system for communicating with an interactive voice response (IVR) system
US20100332287A1 (en) * 2009-06-24 2010-12-30 International Business Machines Corporation System and method for real-time prediction of customer satisfaction
US20140052480A1 (en) * 2012-08-17 2014-02-20 Pilot Catastrophe Services, Inc. Voice activated database management via wireless handset

Also Published As

Publication number Publication date
US20150215458A1 (en) 2015-07-30
US9210263B2 (en) 2015-12-08
US20080187109A1 (en) 2008-08-07
JP2008199609A (ja) 2008-08-28
CN101242452A (zh) 2008-08-13
US9025736B2 (en) 2015-05-05
CN101242452B (zh) 2013-01-23

Similar Documents

Publication Publication Date Title
JP5305675B2 (ja) 聴覚アーカイブを自動的に発生し聴覚アーカイブを提供するための方法、システム、およびコンピュータ・プログラム
JP3873131B2 (ja) 電話メッセージの転記のために使用される編集システム及び方法
US8571528B1 (en) Method and system to automatically create a contact with contact details captured during voice calls
TW401673B (en) System and method for automatic call and data transfer processing
US8050923B2 (en) Automated utterance search
US7522711B1 (en) Delivery of audio driving directions via a telephone interface
US8326643B1 (en) Systems and methods for automated phone conversation analysis
US9183834B2 (en) Speech recognition tuning tool
US20100246784A1 (en) Conversation support
US20150106091A1 (en) Conference transcription system and method
US7937268B2 (en) Facilitating navigation of voice data
US8917838B2 (en) Digital media recording system and method
US20090306981A1 (en) Systems and methods for conversation enhancement
US20050288927A1 (en) Quality of service call routing system using counselor and speech recognition engine and method thereof
US20100158204A1 (en) Indexing recordings of telephony sessions
KR20100016138A (ko) 자동 안내 문법 튜닝
WO2007101030A2 (en) System and method for providing transcription services using a speech server in an interactive voice response system
US20090198701A1 (en) Dynamic webcast content viewer method and system
US20100098227A1 (en) Method and Apparatus for Voice Mail Notes
US8917823B1 (en) Transcribing and navigating a response system
US20020044633A1 (en) Method and system for speech-based publishing employing a telecommunications network
KR101063261B1 (ko) 핵심키워드를 이용하여 통화 내용을 녹취하는 인터넷 프로토콜 컨텍트 센터 녹취 시스템 및 그 방법
JP2009290468A (ja) 通話録音装置及び方法
US7653181B2 (en) Method of creating and managing a customized recording of audio data relayed over a phone network
US6947969B2 (en) System and method for accessing voice messaging system data

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100924

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120726

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120731

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121011

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130604

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130625

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5305675

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees