JPH11282856A - 音声処理装置および記録媒体 - Google Patents

音声処理装置および記録媒体

Info

Publication number
JPH11282856A
JPH11282856A JP10081130A JP8113098A JPH11282856A JP H11282856 A JPH11282856 A JP H11282856A JP 10081130 A JP10081130 A JP 10081130A JP 8113098 A JP8113098 A JP 8113098A JP H11282856 A JPH11282856 A JP H11282856A
Authority
JP
Japan
Prior art keywords
feature amount
similarity
unit
attribute information
audio data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10081130A
Other languages
English (en)
Other versions
JP4769345B2 (ja
Inventor
Ichiro Hattori
一郎 服部
Akira Suzuki
晃 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Animo Ltd
Original Assignee
Animo Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Animo Ltd filed Critical Animo Ltd
Priority to JP08113098A priority Critical patent/JP4769345B2/ja
Publication of JPH11282856A publication Critical patent/JPH11282856A/ja
Application granted granted Critical
Publication of JP4769345B2 publication Critical patent/JP4769345B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 客の自由会話から抽出した音声により顧客管
理を行う。 【解決手段】 音声データ入力受付手段1は、客の自由
会話から抽出され、ディジタル化された音声データを入
力する。特徴量抽出手段2は、音声データから特徴量を
抽出する。属性情報入力手段3は、その客の特徴や行動
を示す属性情報を入力する。記録手段4は、特徴量抽出
手段2によって抽出された特徴量と、属性情報入力受付
手段3から入力された属性情報とを関連付けて記録装置
5に記録する。類似度算出手段6は、客の音声データの
特徴量と、記録装置5に既に記録されている各特徴量
(以前に来店した客の音声の特徴量)の類似度を算出
し、所定以上の類似度を有するものがある場合には、そ
の属性情報を読み出して出力手段8に供給する。出力手
段8は、供給された属性情報を表示装置9に表示させ
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は音声処理装置および
記録媒体に関し、特に、入力された話者の音声データを
もとに、話者を識別する話者識別を行う音声処理装置お
よびそのような処理をコンピュータに実行させるプログ
ラムを記録した記録媒体に関する。
【0002】
【従来の技術】例えば、大手の販売店などでは、客が商
品を購入した際にその客の氏名、住所、電話番号、購入
商品名などを顧客リストに登録しておき、そのリストを
参照して、個々の顧客のニーズにマッチすると思われる
情報(例えば、ダイレクトメールなどによる情報)を提
供する場合がある。
【0003】
【発明が解決しようとする課題】しかし、このような従
来の方法では、顧客リストに登録されるのは、商品を購
入した客のみに限定されるという問題点があった。例え
ば、購入を予定する商品があって、品定めのために何度
も来店している客に関する情報は登録することができな
いという問題点があった。
【0004】また、特に大手の販売店などでは、店員の
人数が多いため、客が来店する度に異なる店員が対応す
る場合が多い。従って、以前に他の店員に説明した内容
を再度繰り返す必要が生じたり、あるいは、他の店員か
ら受けた説明を再度繰り返されたりする場合が生じ、煩
雑であるという問題点もあった。
【0005】本発明はこのような点に鑑みてなされたも
のであり、現在対応している客やユーザの過去の行動な
どに関する情報を参照することを可能とする音声処理装
置を提供することを目的とする。
【0006】
【課題を解決するための手段】本発明では上記課題を解
決するために、話者の音声データの入力を受け付ける音
声データ入力受付手段と、前記音声データ入力受付手段
が受け付けた音声データから特徴量を抽出する特徴量抽
出手段と、前記特徴量抽出手段によって抽出された特徴
量、または、もとの音声データを記録装置に供給して記
録させる記録手段と、前記記録装置に既に記録されてい
る他の音声データを前記特徴量抽出手段が処理すること
によって得られた特徴量、または、前記記録装置に既に
記録されている他の特徴量と、前記特徴量抽出手段によ
って抽出された新たな特徴量の類似度を算出する類似度
算出手段と、前記類似度算出手段によって算出された類
似度に応じて、前記音声データを識別するための識別情
報または前記特徴量を識別するための識別情報を表示装
置に出力して表示させる出力手段と、を有することを特
徴とする音声処理装置が提供される。
【0007】音声データ入力受付手段は、話者の音声デ
ータの入力を受け付ける。特徴量抽出手段は、音声デー
タ入力受付手段が受け付けた音声データから特徴量を抽
出する。記録手段は、特徴量抽出手段によって抽出され
た特徴量、または、もとの音声データを記録装置に供給
して記録させる。類似度算出手段は、記録装置に既に記
録されている他の音声データを特徴量抽出手段が処理す
ることによって得られた特徴量、または、記録装置に既
に記録されている他の特徴量と、特徴量抽出手段によっ
て抽出された新たな特徴量の類似度を算出する。出力手
段は、類似度算出手段によって算出された類似度に応じ
て、音声データを識別するための識別情報または特徴量
を識別するための識別情報を表示装置に出力して表示さ
せる。
【0008】例えば、音声データ入力受付手段は、マイ
クなどにより音声信号に変換された後ディジタル信号に
変換されて得られた話者の音声データの入力を受け付け
る。特徴量抽出手段は、音声データ入力受付手段が受け
付けた音声データからフォルマント分布などに関する特
徴量を抽出する。記録手段は、特徴量抽出手段によって
抽出された特徴量、または、もとの音声データを、例え
ば、ハードディスク装置などの記録装置に供給して記録
させる。類似度算出手段は、記録装置に既に記録されて
いる他の音声データを特徴量抽出手段が処理することに
よって得られた特徴量、または、記録装置に既に記録さ
れている他の特徴量と、特徴量抽出手段によって抽出さ
れた新たな特徴量の類似度を算出する。出力手段は、類
似度算出手段によって算出された類似度に応じて、音声
データを識別するための識別情報または特徴量を識別す
るための識別情報を類似度が高い順に表示装置に出力し
て表示させる。
【0009】
【発明の実施の形態】以下、本発明の実施の形態を図面
を参照して説明する。図1は、本発明の原理を説明する
ための原理図である。
【0010】この図において、音声データ入力受付手段
1は、例えば、マイクなどを介して入力され、A/Dコ
ンバータによってディジタル信号に変換されて得られた
音声データを受け付ける。
【0011】特徴量抽出手段2は、音声データ入力受付
手段1から入力された音声データから特徴量を抽出す
る。属性情報入力受付手段3は、音声データ入力受付手
段1から入力された音声データに対応する話者に関する
属性情報の入力を受け付ける。
【0012】記録手段4は、特徴量抽出手段2によって
抽出された特徴量と、属性情報入力受付手段3から入力
された属性情報とを関連付けて記録装置5に記録する。
記録装置5は、特徴量抽出手段2によって抽出された音
声データの特徴量と、その音声データに対応する話者の
属性情報とを関連付けて記録しており、換言すれば音声
によるデータベースを形成している。
【0013】類似度算出手段6は、新たに入力された音
声データの特徴量と、記録装置5に既に記録されている
音声データの特徴量の類似度を算出する。関連付け手段
7は、新たに入力された音声データと、関連度が高いも
のを関連付ける。
【0014】出力手段8は、類似度算出手段6の処理結
果を参照して、新たに入力された音声データと類似度が
高い音声データの特徴量の属性情報を、例えば、リスト
形式で表示装置9に表示する。
【0015】表示装置9は、出力手段8から供給された
情報を画面に表示する。次に、図1に示す原理図の動作
について説明する。なお、以下では、図1に示す装置に
より、例えば、デパートなどに来店した客の情報の管理
を行うことを想定して説明を行う。
【0016】いま、客が来店し、「○○製のフレームレ
ス眼鏡が欲しいのですが。」という発話を行ったとす
る。すると、この音声に対応する音声データは、音声デ
ータ入力受付手段1によって入力され、特徴量抽出手段
2に供給される。
【0017】特徴量抽出手段2は、供給された音声デー
タから、特徴量を抽出する。なお、この特徴量として
は、音声データの物理的特性に関する情報(例えば、音
声のフォルマント分布に関する情報等)を使用する。
【0018】記録手段4は、抽出された特徴量に対して
所定のファイル名を付与し、記録装置5に供給して記録
させる。類似度算出手段6は、特徴量抽出手段2によっ
て抽出された特徴量と、記録装置に既に記録されている
特徴量の類似度を算出する。そして、類似度が所定の値
を上回る特徴量が存在している場合には、その特徴量を
識別するための識別情報(例えば、ファイル名)と、そ
の特徴量に関連付けて記録されている属性情報と、算出
された類似度とを出力手段8に供給する。
【0019】出力手段8は、類似度算出手段6から供給
された、識別情報、属性情報、および、類似度を表示装
置9に供給する。表示装置9は、出力手段8から供給さ
れた識別情報、属性情報、および、類似度を、リスト形
式で表示する。
【0020】そして、この客に対する応対が終了した場
合には、この客に関する属性情報(年齢、性別、購入商
品などに関する情報)を店員が属性情報入力受付手段3
から入力する。
【0021】記録手段4は、特徴量抽出手段2によって
抽出された特徴量と、属性情報入力受付手段3から入力
された属性情報とを相互に関連付けて記録装置5に記録
する。その結果、記録装置5のデータベースに新たなデ
ータが追加されることになる。
【0022】関連付け手段7は、新たに入力された音声
データとの類似度が所定の値を上回る音声データの特徴
量に関しては、新たに入力された特徴量と関連付け(リ
ンク)を行う。その結果、記録装置5に記録されている
データベースの各項目は、類似度に応じて相互に関連付
けられることになる(類似度が所定の値を上回るデータ
は相互にリンクされる)ので、例えば、類似度が高いデ
ータが複数存在している場合には、リンクされたデータ
のうちの1つが特定されると、他のデータはそのリンク
を辿ることにより取得されることになる。
【0023】以上のような本発明に関する音声処理装置
によれば、来店した客の音声(自由発話による音声)デ
ータが入力された場合には、記録装置5に記録されてい
るデータベースから、類似度が高い音声データの属性デ
ータが取得され、表示装置9に表示されることになる。
従って、過去に1度以上来店し、かつ、店員と会話を行
った経験のある客に関しては、その属性情報が取得され
て表示されることになるので、店員はその属性情報を参
照することにより、商談をより円滑に進めることが可能
となる。
【0024】図2は、本発明の実施の形態を含む音声処
理システムの全体の構成例を示すブロック図である。こ
の図において、マイク10a〜10zは、客の音声を電
気信号に変換して端末装置11a〜11zにそれぞれ供
給する。
【0025】端末装置11a〜11zは、例えば、携帯
型の端末装置であり、マイク10a〜10zから入力さ
れた音声信号をディジタル信号に変換して、音声処理装
置14に送信するとともに、音声処理装置14から送信
された属性情報を表示装置12a〜12zに表示させ
る。また、図示せぬ入力部を操作することにより、客の
属性情報を入力することも可能とされている。
【0026】レジスタ13は、客が商品を購入した場合
には、その商品の商品名などを音声処理装置14に対し
て送信する。音声処理装置14は、図3に示す構成とさ
れており、その詳細は後述する。
【0027】データベース15は、端末装置11a〜1
1zから入力された音声データが音声処理装置14によ
って処理された結果得られた特徴量と、その属性情報と
を関連付けて記録する。
【0028】なお、端末装置11a〜11z、レジスタ
13、音声処理装置14、および、データベース15
は、LAN(Local Area Network)を形成しており、相
互に情報の授受が可能とされている。
【0029】ルータ16は、端末装置11a〜11z、
レジスタ13、音声処理装置14、および、データベー
ス15からなるLANをインターネット17に対して接
続し、例えば、インターネット17に接続されている他
の店舗のLANとの間で情報の授受が可能とされてい
る。
【0030】次に、図3を参照して図2に示す音声処理
装置14の詳細な構成について説明する。CPU14a
は、装置の各部を制御するとともに、種々の演算処理を
実行する。LANユニット14bは、例えば、CSMA
/CD(Carrier Sense MultipleAccess with Collisio
n Detection)方式に基づいて、他の装置との間でデー
タを授受する。
【0031】CD−ROMドライブ14cは、CD−R
OMから必要なデータを読み込む。ハードディスク装置
14dは、CPU14aが実行するプログラムなどを記
録している。
【0032】CRTモニタ14eは、CPU14aの処
理結果等を画面上に表示出力する。メモリ14fは、R
AMおよびROMによって構成されており、CPU14
aが演算処理を行う場合に必要なプログラムを読み出し
たり、一時的に記憶する。
【0033】入力装置14gは、例えば、キーボードや
マウスなどによって構成されており、必要な情報を入力
する際に操作される。なお、図1の原理図と図2および
図3の実施の形態との対応関係を以下に示す。
【0034】即ち、音声データ入力受付手段1は、LA
Nユニット14bに対応している。特徴量抽出手段2
は、CPU14aに対応している。属性情報入力受付手
段3は、LANユニット14bに対応している。
【0035】記録手段4は、CPU14aおよびLAN
ユニット14bに対応している。記録装置5は、ハード
ディスク装置14dまたはデータベース15に対応して
いる。
【0036】類似度算出手段6は、CPU14aに対応
している。関連付け手段7は、CPU14aに対応して
いる。出力手段8は、LANユニット14bに対応して
いる。表示装置9は、表示装置12a〜12zに対応し
ている。
【0037】次に、以上の実施の形態の動作を図4に示
すフローチャートを参照して説明する。このフローチャ
ートが開始されると、以下に示す処理が実行されること
になる。なお、以下の処理では、端末装置11aから音
声データが入力された場合を想定して説明を行う。 [S1]端末装置11aの図示せぬ入力部が操作される
と、音声データの入力がスタートする。
【0038】いま、店舗に客が来訪し、店員との間で会
話が開始され、店員が端末装置11aの入力部の所定の
キーを操作することにより音声の入力処理が開始され
る。その結果、マイク10aから出力された音声信号
は、端末装置11aに供給され、そこでディジタル信号
に変換された後、音声処理装置14に供給される。
【0039】なお、客が発話している場合にのみ所定の
キーを押圧し続け、店員と客の音声の双方が入力される
ことを防止するようにしてもよい。 [S2]音声処理装置14のCPU14aは、LANユ
ニット14bを介して入力した音声データから特徴量を
抽出する。
【0040】なお、この特徴量としては、例えば、話者
の発話に含まれている音声から所定の音素(“あ”、
“い”、“う”など)を切り出し、切り出した音素のフ
ォルマント分布を用いるようにすればよい。 [S3]CPU14aは、LANユニット14bを介し
てデータベース15に登録されている音声データの特徴
量(以前に来店した客の音声の特徴量)を読み込む。
【0041】なお、データベース15に登録されている
データの構造の一例を図5に示す。この図に示すデータ
は、ヘッダーd1、特徴量d2、および、属性情報d3
によって構成されている。ヘッダーd1は、図中に拡大
して示すように、ファイル名d11および記録日時d1
2によって構成されている。また、属性情報d3は、客
の性別d31、(推定)年齢d32、購入商品d33、
購入予定商品d34、および、その他d35によって構
成されている。
【0042】図6は、図5に示すヘッダーd1と属性情
報d3の具体例を示す図である。この図に示すように、
ファイル名d11は、例えば、新たなデータが入力され
る度に1ずつインクリメントされて生成される数値が付
与される。
【0043】記録日時d12は、そのデータが登録され
た日時を示している。性別d31、および年齢d32
は、端末装置の図示せぬ入力部を店員が操作して入力し
たものである。
【0044】購入商品d33は、例えば、購入金額の精
算を行う際にレジスタ13から入力されたものである。
購入予定商品d34は、店員が客との対話の中で推測し
た情報を、端末装置の図示せぬ入力部から入力したもの
である。
【0045】更に、その他d35は、例えば、店員がそ
の客に抱いた印象などを、端末装置の図示せぬ入力部か
ら入力したものである。 [S4]CPU14aは、LANユニット14bを介し
てデータベース15から読み込んだ音声データの特徴量
と、ステップS2において抽出された特徴量の類似度を
算出する。
【0046】なお、この類似度の算出方法としては、例
えば、抽出された各音素のフォルマントの相関関係を計
算するようにすればよい。 [S5]CPU14aは、データベース15に未処理の
特徴量がまだあるか否かを判定し、まだある場合にはス
テップS3に戻り、また、それ以外の場合にはステップ
S6に進む。
【0047】ステップS3〜ステップS5の処理が繰り
返されることにより、データベース15に登録されてい
る全ての特徴量が音声処理装置14に読み込まれ、その
特徴量とステップS2において抽出された特徴量との類
似度が計算されることになる。
【0048】なお、これらの特徴量をハードディスク装
置14dに全て格納しておくようにしてもよい。 [S6]CPU14aは、読み込まれた特徴量のうち、
類似度が所定の値以上の特徴量が存在するか否かを判定
し、1つでも存在する場合にはステップS7に進み、そ
れ以外の場合にはステップS8に進む。
【0049】例えば、類似度が70%以上であるデータ
が存在する場合にはステップS7に進むことになる。 [S7]CPU14aは、類似度が所定の値以上である
特徴量の属性情報を、LANユニット14bを介してデ
ータベースから読み出すとともに、それぞれのデータの
類似度を信頼度として所定の端末装置11aに供給す
る。その結果、端末装置は、供給された属性情報と信頼
度とを表示装置に一覧表示させる。
【0050】図7は、端末装置11aの表示装置12a
に表示される情報の一例を示している。この例では、店
員が応対している客のものと推定される属性情報とその
信頼度とが、信頼度が高い順に一覧表示されている。例
えば、候補No.1としては、ファイル名“0204”のデ
ータが表示されており、この客は、“1998/11/
20−11:24:34”に来店し、年齢は“20代”
の“男性”であり、“パソコン”を購入予定で、“グラ
フィックスに興味”があることが示されている。また、
この属性を有する客が現在来店中の客であるという判定
への信頼度は“98%”であることも同時に示されてい
る。 [S8]CPU14aは、来店した客が新規の顧客であ
るとして、データベース15に登録させる。 [S9]CPU14aは、所定の制御コードをLANユ
ニット14bを介して端末装置に送り、表示装置に来店
中の客が新規の客である旨を示す。
【0051】いまの例では、端末装置11aの表示装置
12aに対して、例えば、メッセージ「新規のお客様で
あると思われます。」などが表示される。 [S10]CPU14aは、レジスタ13や端末装置か
ら出力された属性情報を入力する。 [S11]CPU14aは、ステップS2の処理におい
て取得した特徴量と、ステップS10において取得した
属性情報とをデータベース15に送り、これらを関連付
けて記憶させる。
【0052】その結果、図6に示すようなデータが記録
されることになる。以上の実施の形態によれば、来客が
あった場合には、その音声データが取得されて音声処理
装置14に送られ、そこで特徴量が抽出される。そし
て、抽出された特徴量と、データベース15に記録され
ている特徴量(過去に来店して店員と会話を行った全て
の客に対応する特徴量)との類似度が算出され、所定の
値以上の類似度を有する特徴量が存在した場合には、そ
の属性情報が読み出されて、信頼度とともに端末装置の
表示装置に表示されることになる。
【0053】その結果、来店中の客のものと推定される
特徴量が存在している場合には、その属性情報が信頼度
とともに表示されることになるので、店員は、これらの
情報を参照することにより、その客の過去の行動や嗜好
などを考慮に入れて接客を行うことができるので、商談
を円滑に進めることが可能となる。
【0054】なお、以上の実施の形態では、属性情報を
データベースに記録するようにしたが、例えば、属性情
報を記録せずに、識別情報と信頼度のみを表示するよう
にしてもよい、そのような構成にした場合においても、
その客が過去に何度来店しているかを知ることができる
ので、商談を行う際の参照とすることができる。
【0055】また、インターネット17を介して他の店
舗(または売場)との間でデータを授受するようにして
もよい、そのような構成とすることにより、例えば、あ
る売場や店舗では得意客として認知されている客を、他
の売場でも同等に扱うことができるので、更にきめ細か
いサービスを提供することが可能となる。
【0056】更に、以上の実施の形態では、データベー
ス15には、特徴量とその属性情報のみを記録するよう
にしたが、例えば、図8に示すように、類似度が高いデ
ータを相互に関連付けるリンク情報を付加するようにし
てもよい。このような処理は、新たな特徴量をデータベ
ース15に登録する際に、関連付け手段7に対応するC
PU14aが実行するようにする。
【0057】そのような構成をとることにより、データ
ベース15に記録されているデータのうち、その類似度
が高いものは相互にリンクされることになるので、来店
中の客の音声と類似度が高いデータが複数存在している
場合であって、その内の1つがヒットした場合には、そ
のデータのリンクを参照することにより、その他のデー
タを簡単に得ることができる。
【0058】なお、このようなリンク情報としては、図
9に示すような情報を用いることができる。この例で
は、ファイル名“0001”,“0003”,“000
5”,“0006”の特徴量の類似度(例えば、ファイ
ル名“0001”を基準とした類似度)が、例えば、7
0%以上である。このような場合には、図9に示すよう
に、全ての特徴量を循環するようなリンク情報を付与す
ればよい。その結果、検索によって、これらのうちで1
つがヒットすると、このリンク情報を辿ることにより、
全ての特徴量を取得することができる。例えば、最初に
“0003”が取得されたとすると、そのリンクは“0
001”であるので、ファイル名“0001”の特徴量
が取得される、以下同様にして、“0006”,“00
05”が取得されることになる。
【0059】以上の実施の形態によれば、全ての特徴量
との間で類似度を算出する必要がなくなるので、表示装
置に情報が表示されるまでの時間を短縮することが可能
となり、その結果、接客を円滑に行うことが可能とな
る。
【0060】次に、図10を参照して、本発明の第2の
実施の形態の構成例について説明する。なお、この図に
おいて、図2と対応する部分には同一の符号を付してあ
るので、その説明は省略する。
【0061】この実施の形態においては、図2の場合と
比較して、マイク10a〜10zがヘッドセット22a
〜22zに置換されているとともに、レジスタ13が除
外されている。更に、ヘッドセット22a〜22zがP
BX(Private Branch Exchange )21を介して公衆回
線20に接続されている。その他の構成は、図2の場合
と同様である。
【0062】公衆回線20は、例えば、アナログ回線や
ISDNなどの公衆回線である。PBX21は、呼をヘ
ッドセット22a〜22zに振り分ける機能を有する。
ヘッドセット22a〜22zは、スピーカとマイクによ
り構成されており、PBX21を介して発呼を行ったユ
ーザと通話を行うことができる。スピーカ側の音声信号
(ユーザの音声信号)は、端末装置11a〜11zに供
給される。
【0063】この実施の形態は、商品(この例ではパソ
コン)を購入したユーザから商品に関する電話があった
場合に、そのユーザの音声データの特徴量と類似度が高
い属性情報を検索して表示装置12a〜12zに表示さ
せ、オペレータの対応を支援するものである。
【0064】なお、以上の実施の形態において実行され
る処理は図4に示す場合と同様であり、扱われるデータ
だけが異なるので、その動作については、図11〜図1
3を参照して簡単に説明する。
【0065】図11は、図10に示す実施の形態のデー
タベース15に格納されているデータの構造の一例を示
す図である。この図に示すように、図10に示す実施の
形態では、図2の場合と比較して属性情報d4のみが異
なっている。即ち、属性情報d4は、ユーザの性別d4
1、(推定)年齢d42、所有するパソコンの種類d4
3、パソコンの習熟度d44、相談内容d45、およ
び、その対応d46によって構成されている。
【0066】図12は、図11に示すヘッダーd1と属
性情報d4の詳細を示す図である。この図に示すよう
に、ファイル名は、記録がなされる度に1ずつインクリ
メントされて生成された値が付与される。
【0067】記録日時d12は、そのデータが登録され
た日時を示している。性別d41、および年齢d42
は、会話から推定される性別と年齢を、端末装置の図示
せぬ入力部をオペレータが操作して入力したものであ
る。
【0068】パソコン種類d43は、ユーザが所有して
いるパソコンの種類を示す。習熟度d44は、ユーザの
パソコンへの習熟度を示しており、「初級」、「中
級」、「上級」によって示される。なお、このような情
報は、オペレータが会話の内容から推定して入力する。
【0069】相談内容d45は、相談の内容である。ま
た、対応d46は、相談内容に対する応答である。な
お、これらの情報は、会話の終了後にオペレータが図示
せぬ入力部を操作することにより入力する。
【0070】図13は、図4に示すステップS7の処理
によって、端末装置側の表示装置に表示される属性情報
の一例である。この例では、3つの候補が表示されてい
る。候補No. 1の属性情報としては、1998年1月2
0日の10時20分30秒に登録された、年齢が50代
であり所有するパソコンがKZR−10で、また、習熟
度が初級である男性に関する情報が表示されている。な
お、この男性の前回の相談内容は、「電源が入らない」
ことであり、また、その対応は「電源ケーブルが未接
続」であったこととされている。電話の主がこの男性で
あるとする判定への信頼度は98%である。
【0071】このような情報を参照することにより、オ
ペレータは、相談を行っているユーザの所有しているパ
ソコンの種類、習熟度、および、前回の相談内容を知る
ことができるので、これらを参照して、ユーザのレベル
に合致した適切な情報を提供することが可能となる。
【0072】なお、上記の処理機能は、コンピュータに
よって実現することができる。その場合、音声処理装置
が有すべき機能の処理内容は、コンピュータで読み取り
可能な記録媒体に記録されたプログラムに記述されてお
り、このプログラムをコンピュータで実行することによ
り、上記処理がコンピュータで実現される。コンピュー
タで読み取り可能な記録媒体としては、磁気記録装置や
半導体メモリ等がある。
【0073】市場に流通させる場合には、CD−ROM
(Compact Disk Read Only Memory)やフロッピーディス
ク等の可搬型記録媒体にプログラムを格納して流通させ
たり、ネットワークを介して接続されたコンピュータの
記憶装置に格納しておき、ネットワークを通じて他のコ
ンピュータに転送することもできる。コンピュータで実
行する際には、コンピュータ内のハードディスク装置等
にプログラムを格納しておき、メインメモリにロードし
て実行するようにすればよい。
【0074】
【発明の効果】以上説明したように本発明では、話者の
音声データから特徴量を抽出し、抽出された特徴量と、
記録装置に記録されている特徴量の類似度を算出し、類
似度が高い特徴量に関しては、類似度に関連付けて記録
されている属性情報を表示装置に表示するようにしたの
で、その話者のものと推定される属性情報を参照してそ
の話者に対して適切な対応をとることができる。
【図面の簡単な説明】
【図1】本発明の原理を説明するための原理図である。
【図2】本発明の実施の形態を含む音声処理システムの
全体の構成例を示すブロック図である。
【図3】図2に示す音声処理装置の詳細な構成例を示す
ブロック図である。
【図4】図3に示す音声処理装置において実行される処
理の一例を説明するフローチャートである。
【図5】図3に示すデータベースに格納されているデー
タの構造の一例を示す図である。
【図6】図5に示すヘッダーと属性情報の一例を示す図
である。
【図7】図4に示す処理の結果、端末装置側の表示装置
に表示される情報の一例である。
【図8】図6に示すデータにリンク情報が付加された場
合の一例を示す図である。
【図9】図8に示すリンク情報によるリンクの様子を示
す図である。
【図10】本発明の第2の実施の形態の構成例を示すブ
ロック図である。
【図11】図10に示す実施の形態のデータベースに格
納されているデータの構造の一例を示す図である。
【図12】図11に示すヘッダーと属性情報の一例を示
す図である。
【図13】図4に示す処理の結果、端末装置側の表示装
置に表示される情報の一例である。
【符号の説明】
1 音声データ入力受付手段 2 特徴量抽出手段 3 属性情報入力受付手段 4 記録手段 5 記録装置 6 類似度算出手段 7 関連付け手段 8 出力手段 9 表示装置

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 話者の音声データの入力を受け付ける音
    声データ入力受付手段と、 前記音声データ入力受付手段が受け付けた音声データか
    ら特徴量を抽出する特徴量抽出手段と、 前記特徴量抽出手段によって抽出された特徴量、また
    は、もとの音声データを記録装置に供給して記録させる
    記録手段と、 前記記録装置に既に記録されている他の音声データを前
    記特徴量抽出手段が処理することによって得られた特徴
    量、または、前記記録装置に既に記録されている他の特
    徴量と、前記特徴量抽出手段によって抽出された新たな
    特徴量の類似度を算出する類似度算出手段と、 前記類似度算出手段によって算出された類似度に応じ
    て、前記音声データを識別するための識別情報または前
    記特徴量を識別するための識別情報を表示装置に出力し
    て表示させる出力手段と、 を有することを特徴とする音声処理装置。
  2. 【請求項2】 前記話者に関する属性情報の入力を受け
    付ける属性情報入力受付手段を更に有し、 前記記録手段は、前記属性情報入力受付手段が受け付け
    た属性情報を、前記音声データまたは特徴量と対応付け
    て前記記録装置に供給して記録させ、 前記出力手段は、前記音声データを識別するための識別
    情報または前記特徴量を識別するための識別情報ととも
    に、前記属性情報も同時に表示装置に出力して表示させ
    ることを特徴とする請求項1記載の音声処理装置。
  3. 【請求項3】 前記記録装置は、ネットワークを介して
    接続されていることを特徴とする請求項1記載の音声処
    理装置。
  4. 【請求項4】 前記出力手段は、前記音声データを識別
    するための識別情報または前記特徴量を識別するための
    識別情報とともに、前記類似度算出手段によって算出さ
    れた類似度も同時に表示装置に出力して表示させること
    を特徴とする請求項1記載の音声処理装置。
  5. 【請求項5】 前記類似度算出手段によって算出された
    類似度が所定の値を上回る特徴量に関しては、新たに入
    力された音声データまたはその特徴量と関連付けを行う
    関連づけ手段を更に有することを特徴とする請求項1記
    載の音声処理装置。
  6. 【請求項6】 コンピュータを、 話者の音声データの入力を受け付ける音声データ入力受
    付手段、 前記音声データ入力受付手段が受け付けた音声データか
    ら特徴量を抽出する特徴量抽出手段、 前記特徴量抽出手段によって抽出された特徴量、また
    は、もとの音声データを記録装置に供給して記録させる
    記録手段、 前記記録装置に既に記録されている他の音声データを前
    記特徴量抽出手段が処理することによって得られた特徴
    量、または、前記記録装置に既に記録されている他の特
    徴量と、前記特徴量抽出手段によって抽出された新たな
    特徴量の類似度を算出する類似度算出手段、 前記類似度算出手段によって算出された類似度に応じ
    て、前記音声データを識別するための識別情報または前
    記特徴量を識別するための識別情報を表示装置に出力し
    て表示させる出力手段、 として機能させるプログラムを記録したコンピュータ読
    み取り可能な記録媒体。
JP08113098A 1998-03-27 1998-03-27 音声処理装置および記録媒体 Expired - Lifetime JP4769345B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP08113098A JP4769345B2 (ja) 1998-03-27 1998-03-27 音声処理装置および記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP08113098A JP4769345B2 (ja) 1998-03-27 1998-03-27 音声処理装置および記録媒体

Publications (2)

Publication Number Publication Date
JPH11282856A true JPH11282856A (ja) 1999-10-15
JP4769345B2 JP4769345B2 (ja) 2011-09-07

Family

ID=13737824

Family Applications (1)

Application Number Title Priority Date Filing Date
JP08113098A Expired - Lifetime JP4769345B2 (ja) 1998-03-27 1998-03-27 音声処理装置および記録媒体

Country Status (1)

Country Link
JP (1) JP4769345B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002032213A (ja) * 2000-05-26 2002-01-31 Internatl Business Mach Corp <Ibm> ボイス・メール・メッセージを転記する方法およびシステム
WO2015004909A1 (ja) * 2013-07-10 2015-01-15 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 話者識別方法及び話者識別システム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002032213A (ja) * 2000-05-26 2002-01-31 Internatl Business Mach Corp <Ibm> ボイス・メール・メッセージを転記する方法およびシステム
WO2015004909A1 (ja) * 2013-07-10 2015-01-15 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 話者識別方法及び話者識別システム
US9349372B2 (en) 2013-07-10 2016-05-24 Panasonic Intellectual Property Corporation Of America Speaker identification method, and speaker identification system

Also Published As

Publication number Publication date
JP4769345B2 (ja) 2011-09-07

Similar Documents

Publication Publication Date Title
US7242758B2 (en) System and method for automatically processing a user&#39;s request by an automated assistant
US20020046030A1 (en) Method and apparatus for improved call handling and service based on caller&#39;s demographic information
JP6865653B2 (ja) 対話分析システムおよび対話分析プログラム
JP6570226B2 (ja) 応答生成装置、応答生成方法及び応答生成プログラム
US20010053977A1 (en) System and method for responding to email and self help requests
JP2018207143A (ja) 顧客応対システム、顧客応対方法、顧客応対装置、及びプログラム
JP2002278977A (ja) 質問回答装置、質問回答方法及び質問回答プログラム
US20040148165A1 (en) Pattern processing system specific to a user group
JP6254504B2 (ja) 検索サーバ、及び検索方法
JP5532781B2 (ja) 接客業務用サーバ、並びに、当該サーバを用いる接客システム及び接客業務の予測終了時間算出方法
US20070138267A1 (en) Public terminal-based translator
JP4769345B2 (ja) 音声処理装置および記録媒体
WO2006090881A1 (ja) 応対支援システム、応対支援装置、応対支援方法及び応対支援プログラム
US7831546B2 (en) System and method for intelligent script swapping
JPH11272775A (ja) 電話による取引の情報処理システム
WO2019003395A1 (ja) コールセンター会話内容表示システム、方法及びプログラム
JP2005192024A (ja) コールセンタにおける通話音声データ管理方式およびそれに用いるオペレータ端末
US6640210B1 (en) Customer service operation using wav files
JP2022018724A (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
JP4940891B2 (ja) 商品紹介ロボット、商品紹介方法および商品紹介情報処理プログラム
JP2020077083A (ja) 応対支援システム、及び応対支援方法
WO2019176017A1 (ja) Aiスピーカーシステム、aiスピーカーシステムの制御方法、及びプログラム
JPH1065821A (ja) 電話接続制御システム及びそのシステムでの処理をコンピュータに行なわせるためのプログラムを格納した記録媒体
JP2002007459A (ja) ネットワークナビエージェントシステム、ナビゲーション方法、および仲介サービス提供方法
JP2021033642A (ja) 接客装置、情報処理方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050311

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080520

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080708

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080805

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081003

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20081016

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20081121

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110516

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110620

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140624

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term