JP2010054893A - 来訪者受付装置、来訪者受付方法、および来訪者受付プログラム - Google Patents
来訪者受付装置、来訪者受付方法、および来訪者受付プログラム Download PDFInfo
- Publication number
- JP2010054893A JP2010054893A JP2008220920A JP2008220920A JP2010054893A JP 2010054893 A JP2010054893 A JP 2010054893A JP 2008220920 A JP2008220920 A JP 2008220920A JP 2008220920 A JP2008220920 A JP 2008220920A JP 2010054893 A JP2010054893 A JP 2010054893A
- Authority
- JP
- Japan
- Prior art keywords
- visitor
- information
- dictionary
- time
- date
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Telephonic Communication Services (AREA)
- Interconnected Communication Systems, Intercoms, And Interphones (AREA)
Abstract
【課題】来訪者の発話を高精度に認識することができる来訪者受付装置、来訪者受付方法、および来訪者受付プログラムを提供する。
【解決手段】受付端末から、来訪者が検出された情報が入力されると、来訪予定者の会社名、名前および訪問予定日時を含む情報を記憶する来訪者予約データベースから、訪問予定日時が来訪者が検出された日時と所定の関係にある来訪者の会社名および名前が抽出され、来訪者辞書が作成される(S1)。来訪者の自己の身元に関する発話の音声データが入力されると(S4)、来訪者辞書を用いて発話の音声認識が行われ、来訪者の身元が特定される(S5)。特定された来訪者の身元に関する情報が担当者に通知され(S8)、担当者の指示に応じて、取次ぎ処理(S12〜S13)、または代理応対処理(S14〜S16)が行われる。
【選択図】図12
【解決手段】受付端末から、来訪者が検出された情報が入力されると、来訪予定者の会社名、名前および訪問予定日時を含む情報を記憶する来訪者予約データベースから、訪問予定日時が来訪者が検出された日時と所定の関係にある来訪者の会社名および名前が抽出され、来訪者辞書が作成される(S1)。来訪者の自己の身元に関する発話の音声データが入力されると(S4)、来訪者辞書を用いて発話の音声認識が行われ、来訪者の身元が特定される(S5)。特定された来訪者の身元に関する情報が担当者に通知され(S8)、担当者の指示に応じて、取次ぎ処理(S12〜S13)、または代理応対処理(S14〜S16)が行われる。
【選択図】図12
Description
本発明は、来訪者受付装置、来訪者受付方法、および来訪者受付プログラムに関し、より具体的には、単語辞書を用いて音声認識を行う来訪者受付装置、来訪者受付方法、および来訪者受付プログラムに関する。
従来、単語辞書を用いた音声認識技術を利用して、ビルや会社の受付業務を自動化する自動受付装置が知られている。こういった自動受付装置の主な目的は、来訪者の身元に関する情報を、その応対を担当する担当者に通知し、取次ぎを行うことである。例えば、特許文献1に記載の自動受付装置は、来訪者の発話を認識し、来訪者や担当者等を決定し、対応手続に応じた必要な情報を伝達することができる。
特開平7−234694号公報
特許文献1に記載の自動受付装置等、従来の装置では、担当者を特定する場合、会社の社員全員の名前や所属を単語辞書に登録して利用することができる。この場合、社員数には限りがあることから、発話のバリエーションが絞られ、高精度な音声認識が可能である。一方、来訪者の身元を特定する場合には、単語辞書として、汎用の会社名辞書や名前辞書が利用されるため、辞書に登録される単語数が増大する。さらに、来訪者が自己の身元について発話する際には、会社名と名前の組合せとなるため、発話のバリエーションが膨大となり、音声認識の精度が低下して、来訪者の身元を正確に特定できない場合がある。
本発明は、上記問題点を解決するためになされたものであり、来訪者の発話を高精度に認識することができる来訪者受付装置、来訪者受付方法、および来訪者受付プログラムを提供することを目的とする。
上記目的を達成するために、請求項1に係る発明の来訪者受付装置は、単語辞書を用いて来訪者の発話の音声認識を行う来訪者受付装置であって、現在の来訪者を検出する来訪者検出手段によって前記現在の来訪者が検出された後、音声入力手段から入力された前記現在の来訪者の発する音声の音声情報を取得する音声情報取得手段と、来訪者情報記憶手段に予め記憶されている来訪予定者の身元に関する情報である来訪者記憶情報に基づく単語辞書を来訪者辞書として用いて、前記音声情報取得手段によって取得された前記音声情報を認識することにより、前記現在の来訪者の身元に関する情報である現在来訪者情報を特定する来訪者特定手段と、前記来訪者特定手段によって特定された前記現在来訪者情報を出力する来訪者情報出力手段を備えている。
請求項2に係る発明の来訪者受付装置では、請求項1に記載の発明の構成に加え、前記来訪者情報記憶手段は、来訪日時と対応付けて、前記来訪者記憶情報を記憶しており、前記来訪者情報記憶手段に記憶された前記来訪者記憶情報のうち、前記来訪者検出手段によって前記現在の来訪者が検出された日時である来訪者検出日時と所定の関係にある前記来訪日時に対応する前記来訪者記憶情報を抽出することにより、前記来訪者辞書を作成する来訪者辞書作成手段を備えている。
請求項3に係る発明の来訪者受付装置では、請求項2に記載の発明の構成に加え、前記来訪者辞書作成手段は、前記来訪者情報記憶手段に記憶された前記来訪者記憶情報のうち、対応する前記来訪日時が、前記来訪者検出日時と同日の日時である前記来訪者記憶情報を抽出することにより、前記来訪者辞書を作成する同日辞書作成手段を備えている。
請求項4に係る発明の来訪者受付装置では、請求項2または3に記載の発明の構成に加え、前記来訪者辞書作成手段は、前記来訪者情報記憶手段に記憶された前記来訪者記憶情報のうち、対応する前記来訪日時が、前記来訪者検出日時から前後所定時間以内の日時である前記来訪者記憶情報を抽出することにより、前記来訪者辞書を作成する所定時間辞書作成手段を備えている。
請求項5に係る発明の来訪者受付装置では、請求項2〜4のいずれかに記載の発明の構成に加え、前記来訪者辞書作成手段は、前記来訪者情報記憶手段に記憶された前記来訪者記憶情報のうち、対応する前記来訪日時が、前記来訪者検出日時から所定の日数分の過去に属する日時である前記来訪者記憶情報を抽出することにより、前記来訪者辞書を作成する過去履歴辞書作成手段を備えたことを特徴とする来訪者受付装置。
請求項6に係る発明の来訪者受付装置では、請求項2〜5のいずれかに記載の発明の構成に加え、前記来訪者辞書作成手段は、前記来訪者情報記憶手段に記憶された前記来訪者記憶情報のうち、対応する前記来訪日時が、前記来訪者検出日時と同じ日付、同じ曜日、または同じ時間帯である前記来訪者記憶情報を抽出することにより、前記来訪者辞書を作成するパターン辞書作成手段を備えている。
請求項7に係る発明の来訪者受付装置では、請求項2〜6のいずれかに記載の発明の構成に加え、前記来訪者辞書作成手段は、前記来訪予定者毎に、前記来訪者情報記憶手段に記憶された前記来訪者記憶情報に含まれる前記来訪者の氏名の少なくとも一部と所属の少なくとも一部とを抽出し、結合して1つの単語とすることにより、前記来訪者辞書を作成することを特徴とする。
請求項8に係る発明の来訪者受付装置は、請求項1〜7のいずれかに記載の発明の構成に加え、来訪者の対応者の候補に関する情報に基づく単語辞書である対応者候補辞書を用いて、前記音声情報取得手段によって取得された前記音声情報を認識することにより、前記現在の来訪者の対応者に関する情報である対応者情報を特定する対応者特定手段をさらに備え、前記来訪者情報出力手段は、前記対応者特定手段によって特定された前記対応者情報に対応する前記対応者に対して、前記現在来訪者情報の通知処理を行うことを特徴とする。
請求項9に係る発明の来訪者受付装置は、請求項2〜7のいずれかに記載の発明の構成に加え、来訪者の対応者の候補に関する情報に基づく単語辞書である対応者候補辞書を用いて、前記音声情報取得手段によって取得された前記音声情報を認識することにより、前記現在の来訪者の対応者に関する情報である対応者情報を特定する対応者特定手段をさらに備え、前記来訪者辞書作成手段は、複数の所定の関係に従って、前記来訪者辞書を作成し、前記来訪者特定手段は、前記来訪者辞書作成手段によって作成された前記来訪者辞書を用いて、前記音声情報取得手段によって取得された前記音声情報を認識することにより、前記現在来訪者情報を特定し、前記来訪者情報出力手段は、前記来訪者辞書のうち、前記来訪者特定手段が前記音声情報を認識することに成功した前記来訪者辞書に応じて、前記対応者への前記現在来訪者情報の通知内容を異ならせることを特徴とする。
請求項10に係る発明の来訪者受付方法は、単語辞書を用いて来訪者の発話の音声認識を行う来訪者受付方法であって、現在の来訪者を検出する来訪者検出手段によって前記現在の来訪者が検出された後、音声入力手段から入力された前記現在の来訪者の発する音声の音声情報を取得する音声情報取得ステップと、来訪者情報記憶手段に予め記憶された、予定された来訪者の身元に関する情報である来訪者記憶情報に基づく単語辞書である来訪者辞書を用いて、前記音声情報取得ステップで取得された前記音声情報を認識することにより、前記現在の来訪者の身元に関する情報である現在来訪者情報を特定する来訪者特定ステップと、前記来訪者特定ステップで特定された前記現在来訪者情報を出力する来訪者情報出力ステップを備えている。
請求項11に係る発明の来訪者受付プログラムは、請求項1〜9のいずれかに記載の来訪者受付装置の各種処理手段としてコンピュータを機能させることを特徴とする。
請求項1に係る発明の来訪者受付装置によれば、来訪者情報記憶手段に予め記憶されている来訪者記憶情報に基づいた単語辞書を用いて音声認識が行われる。したがって、人物の身元を表す単語に関する汎用の単語辞書を利用する場合に比べ、高精度な認識結果が得られ、現在の来訪者の身元に関する情報をより正確に特定することができる。
請求項2に係る発明の来訪者受付装置によれば、来訪者情報記憶手段に予め記憶されている来訪者記憶情報のうち、来訪者が検出された来訪者検出日時と所定の関係にある来訪日時に対応する前記来訪者記憶情報が抽出され、来訪者辞書が作成される。したがって、来訪日時が絞り込まれた来訪者辞書に基づいて音声認識が行われるため、請求項1に記載の発明の効果に加え、より高精度な認識結果を得ることができる。
請求項3に係る発明の来訪者受付装置によれば、来訪者情報記憶手段に予め記憶されている来訪者記憶情報のうち、来訪者検出日時と同日の来訪日時に対応する来訪者記憶情報が抽出され、来訪者辞書が作成される。現在の来訪者は、来訪日時が来訪者検出日時と同日に予定された来訪者である可能性が高い。したがって、同日の来訪者記憶情報によって来訪者辞書を作成することにより、請求項2に記載の発明の効果に加え、さらに高精度な認識結果を得ることができる。
請求項4に係る発明の来訪者受付装置によれば、来訪者情報記憶手段に予め記憶されている来訪者記憶情報のうち、来訪者検出日時から前後所定時間以内の来訪日時に対応する来訪者記憶情報が抽出され、来訪者辞書が作成される。現在の来訪者は、来訪日時が来訪者検出日時から前後所定時間以内(例えば、1時間以内)に予定された来訪予定者である可能性が非常に高い。したがって、このような時間帯の来訪者記憶情報によって来訪者辞書を作成することにより、請求項2または3に記載の発明の効果に加え、さらに高精度な認識結果を得ることができる。
請求項5に係る発明の来訪者受付装置によれば、来訪者情報記憶手段に予め記憶されている来訪者記憶情報のうち、来訪者検出から所定日数分の過去に属する来訪日時に対応する来訪者記憶情報が抽出され、来訪者辞書が作成される。過去数日間に来訪した人は、再来訪する可能性がある。したがって、過去の所定日数分の来訪者記憶情報によって来訪者辞書を作成することにより、請求項2〜4のいずれかに記載の発明の効果に加え、高精度な認識結果を得ることができる。
請求項6に係る来訪者受付装置によれば、来訪者情報記憶手段に予め記憶されている来訪者記憶情報のうち、来訪者検出日時と同じ日付、同じ曜日、または同じ時間帯にある来訪日時に対応する来訪者記憶情報が抽出され、来訪者辞書が作成される。来訪者は、所定の日付、所定の曜日、所定の時間帯のように、所定のパターンで定期的に再来訪する可能性がある。したがって、このようなパターンに従って来訪者辞書を作成することにより、請求項2〜5のいずれかに記載の発明の効果に加え、高精度な認識結果を得ることができる。
請求項7に係る発明の来訪者受付装置によれば、来訪予定者毎に、氏名と所属の少なくとも一部が1つの単語に結合され、来訪者辞書が作成される。現在の来訪者は、自己の身元について、氏名と所属の少なくとも一部をつなげて発話する場合が多い。したがって、氏名と所属の少なくとも一部を結合した単語に絞り込んで来訪者辞書を作成することにより、請求項2〜6のいずれかに記載の発明の効果に加え、来訪予定者の認識精度をさらに高めることができる。
請求項8に係る発明の来訪者受付装置によれば、現在の来訪者の発話から対応者が特定され、対応者に対して現在来訪者情報の通知処理が行われる。したがって、請求項1〜7のいずれかに記載の発明の効果に加え、対応者は適切な対応を行うことができる。
請求項9に係る発明の来訪者受付装置によれば、現在の来訪者の音声の認識に成功した単語辞書に応じて、担当者への通知内容が異なる。したがって、請求項2〜7のいずれかに記載の発明の効果に加え、通知を受けた担当者が、通知される現在来訪者情報がどの程度正確かを判断し、適切な対応をすることが容易となる。
請求項10に係る発明の来訪者受付方法によれば、来訪者情報記憶手段に予め記憶されている来訪者記憶情報に基づいた単語辞書を用いて音声認識が行われる。したがって、人物の身元を表す単語に関する汎用の単語辞書を利用する場合に比べ、高精度な認識結果が得られ、現在の来訪者の身元に関する情報をより正確に特定することができる。
請求項11に係る発明の来訪者受付プログラムは、請求項1〜9のいずれかに記載の来訪者受付装置の各種処理手段としてコンピュータを機能させることができる。したがって、請求項1〜9のいずれかに記載の発明の効果を奏することができる。
以下、本発明を具現化した実施の形態について、図面を参照して説明する。なお、参照する図面は、本発明が採用しうる技術的特徴を説明するために用いられるものであり、記載されている装置の構成、各種処理のフローチャートなどは、それのみに限定する趣旨ではなく、単なる説明例である。
まず、図1〜図11を参照して、本実施形態に係る来訪者受付システム1の全体構成、ならびに、来訪者受付システム1の構成要素である受付端末20および受付サーバ10の構成について、順に説明する。
最初に、図1を参照して、来訪者受付システム1の全体構成の概略を説明する。図1は、来訪者受付システム1の概略構成を示すシステム構成図である。図1に示すように、来訪者受付システム1は、受付サーバ10、受付端末20、IP−PBX(Intenet Protocol Private Branch eXchange)50、およびIP電話機60を含み、これらはすべてLAN9に接続されている。来訪者受付システム1は、例えば、ビルや会社に設置され、来訪者に対する受付業務を行うシステムである。本実施形態では、来訪者受付システム1は、会社5に設置されているものとして説明する。図1では、IP電話機60は1つしか図示されていないが、実際には、例えば、会社5の従業員の数に応じて、複数が存在してもよい。
受付サーバ10は、例えば、周知のパーソナルコンピュータであり、汎用型の装置である。受付端末20は、例えば、会社5の入口ドア付近に設置されるインターホン型の端末装置である。IP−PBX50は、LAN9に接続されたIP電話機60の回線交換を行う周知の交換装置である。
ここで、本実施形態の来訪者受付システム1全体で行われる処理の手順について、簡単に説明する。まず、会社5への来訪者が、入口付近に設けられた受付端末20の操作ボタン209(図2参照)を押下げると、受付サーバ10では、来訪者が検出されたと認識して、処理が開始される。受付サーバ10から送信された音声データに基づき、受付端末20から来訪者の身元に関する質問が発せられると、来訪者は受付端末20に対して自己の身元を名乗る。すると、来訪者の音声データがLAN9を介して受付サーバ10に送信され、音声認識処理が行われる。
受付サーバ10は、認識結果に応じて、会社5の来訪者の応対担当者(以下、単に担当者という)が使用するIP電話機60にIP−PBX50を介して接続し、担当者への通知処理を行う。担当者は、通知された来訪者の身元に関する情報に応じて、受付サーバ10に対して応対を指示する。受付サーバ10は、指示に応じて、来訪者と担当者とが会話できるように受付端末20とIP電話機60を接続させたり、担当者の代理で来訪者に応対したりする。このように、受付サーバ10は、会社5における受付業務を自動的に行うことができる。なお、ここまでで簡単に説明した処理については、後で詳述する。
次に、図2を参照して、受付端末20の構成について説明する。図2は、受付端末20の電気的構成を示すブロック図である。図2に示すように、受付端末20は、CPU201と、CPU201に各々接続されたROM202およびRAM203を含む制御回路部200を備えている。CPU201には、入出力(I/O)インタフェイス204が接続されている。I/Oインタフェイス204には、ハードディスク装置(HDD)205、ディスプレイ206、マイク207、スピーカ208、操作ボタン209、およびネットワーク(NW)カード210が接続されている。
CPU201は、受付端末20全体の制御を司る。ROM202は、受付端末20の基本的な動作に必要なプログラムやそのための設定値を記憶している。CPU201は、ROM202や、HDD205に記憶されたプログラムに従って、受付端末20の動作を制御する。RAM203は、各種データを一時的に記憶するための記憶装置である。記憶装置であるHDD205には、例えば、受付端末20の各種動作を制御するための複数のプログラムが記憶されている。記憶されているプログラムとして、例えば、受付端末20の基本的な動作を制御するシステムプログラム、受付サーバ10との通信を制御する通信プログラム、ディスプレイ206に表示する画像を生成する描画プログラム等がある。
ディスプレイ206には、例えば、描画プログラムによって生成された、受付業務を行っている想定の人物やキャラクタの画像と、スピーカ208から発話される音声に対応する文章とが表示される。マイク207は、入力された来訪者の音声を、音声データに変換して出力する機器である。スピーカ208は、受付サーバ10から入力された音声データを、音声に変換して出力する機器である。操作ボタン209は、来訪者が、受付端末20で自己の来訪を告げ、受付処理を開始させる指示を入力するための機器である。NWカード210は、LAN9に接続し、受付サーバ10との間でデータの送受信を可能とするための拡張カードである。本実施形態では、操作ボタン209は、本発明の「来訪者検出手段」に相当し、マイク207は、「音声入力手段」に相当する。
次に、図3〜図11を参照して、受付サーバ10の構成について説明する。図3は、受付サーバ10の電気的構成を示すブロック図である。図4は、来訪者予約データベース1510の説明図である。図5は、言語モデル記憶エリア152に記憶された言語モデル1521の説明図である。図6は、単語辞書1531の説明図である。図7は、訪問日時辞書1541の説明図である。図8は、訪問日辞書1542の説明図である。図9は、訪問パターン辞書1543の説明図である。図10は、訪問履歴辞書1544の説明図である。図11は、社員データベース1551の説明図である。
図3に示すように、受付サーバ10は、CPU101と、CPU101に各々接続されたROM102およびRAM103を備えている。CPU101には、その他、入出力(I/O)インタフェイス104が接続されている。I/Oインタフェイス104には、マウスコントローラ106、キーコントローラ107、ビデオコントローラ108、通信装置109、およびハードディスク装置(HDD)150が接続されている。
CPU101は、受付サーバ10の全体の制御を司る。ROM102は、BIOSを含む、受付サーバ10を動作させるための各種のプログラムを記憶している。CPU101は、ROM102や、後述するHDD150に記憶されたプログラムに従って、受付サーバ10の動作を制御する。RAM103は、各種データを一時的に記憶するための記憶装置である。マウスコントローラ106、キーコントローラ107、およびビデオコントローラ108には、それぞれマウス116、キーボード117およびディスプレイ118が接続されている。通信装置109は、LAN9に接続し、受付端末20等、外部機器との間でデータの送受信を行うことを可能とする装置である。
図3に示すように、HDD150は、来訪者予約データベース(DB)記憶エリア151、言語モデル記憶エリア152、単語辞書記憶エリア153、来訪者辞書記憶エリア154、社員データベース(DB)記憶エリア155、およびプログラム記憶エリア156を含む複数の記憶エリアを備えている。
来訪者予約DB記憶エリア151には、予定された来訪者(以下、単に来訪予定者という)に関する情報である来訪者予約情報を格納する来訪者予約DB1510(図4参照)が記憶されている。来訪者予約情報は、来訪予定者の訪問予定が決まった時点で、来訪予定者1名毎に作成されるものであり、例えば、図4に示すように、来訪者会社名、来訪者会社名ヨミ、来訪者名、来訪者名ヨミ、訪問予定日時、担当者名、担当者名ヨミ、および担当者電話番号(TEL)を含む。これらのうち、来訪者会社名、来訪者会社名ヨミ、来訪者名、および来訪者名ヨミは、それぞれ、来訪予定者の身元に関する情報である。
来訪者会社名は、来訪予定者が所属する会社や団体の名前であり、平仮名、片仮名、漢字、アルファベット等による通常の表記で記憶されている。なお、来訪者会社名としては、図4に示すように、必ずしも会社等の正式な名称ではなく、通常、身元を名乗る際に用いられる名前(通称)が記憶されていてもよい。例えば「株式会社B運送」について、「株式会社」を省略した「B運送」のみを、来訪者会社名として記憶しておくことができる。来訪者会社名ヨミは、来訪者会社名の読み方、すなわち発音であり、片仮名で記憶されている。
来訪者名は、来訪予定者の名前であり、平仮名、片仮名、漢字、アルファベット等による通常の表記で記憶されている。なお、通常、来訪者は、他社の訪問時に身元を名乗る際、フルネームではなく苗字のみを使用することが多い。よって、来訪者名としては、図4に示すように、苗字のみが記憶されていてもよい。来訪者名ヨミは、来訪者名の読み方、すなわち発音であり、片仮名で記憶されている。
訪問予定日時は、来訪予定者の訪問が予定されている日時である。担当者名は、来訪予定者の応対を担当する担当者の名前であり、平仮名、片仮名、漢字、アルファベット等による通常の表記で記憶されている。なお、通常、来訪者は、他社の訪問時に担当者を通知する際、フルネームではなく苗字のみを使用することが多い。よって、図4に示すように、担当者名として、来訪者名と同様、苗字のみが記憶されていてもよい。担当者名ヨミは、担当者名の読み方、すなわち発音であり、片仮名で記憶されている。担当者TELは、担当者が使用するIP電話機60の電話番号である。なお、図4に示す例以外に、会社等の正式名称、来訪者名および担当者のフルネーム等が記憶されていてもよい。来訪者予約DB記憶エリア151は、本発明の「来訪者情報記憶手段」に相当する。
言語モデル記憶エリア152(図3参照)には、来訪者による発話の認識に使用される言語モデルが記憶されている。言語モデルは、単語のつながり、すなわち単語間の結びつきに関する制約を定義するものである。代表的な言語モデルとして、例えば、単語間の結びつきを文法(グラマー)で記述する記述文法モデルと、単語間の結びつきを確率で定義する統計モデル(例えば、単語N−gram)がある。
これらの代表的な言語モデルのうち、記述文法モデルは、想定される文のパターンを、受理可能な文のパターンとして、予め人手で記述して定義するものである。したがって、記述される受理可能な文のパターンの数には限りがあるが、発話が、定義された文のパターンに対応していれば、高精度な音声認識が可能である。本実施形態では、会社5を訪問してきた人物の発話という、比較的限られた状況での発話について音声認識が行われるため、言語モデルとして記述文法モデルを採用している。しかしながら、言語モデルは必ずしも記述文法モデルである必要はなく、統計モデルを使用してもよい。
言語モデル記憶エリア152(図3参照)には、受付端末20と来訪者との対話で想定される様々な場面に応じて予め作成された受理可能な文のパターンが、言語モデルとして記憶されている。例えば、図5に示す言語モデル1521は、来訪者の身元に関する質問に対する応答として受理可能な文のパターンを示すものである。文のパターンは、例えば、文を構成する単語が属するカテゴリを順に並べることによって定義することができる。図5の言語モデル1521では、カテゴリ「会社名と名前」に属する単語およびカテゴリ「名乗り」に属する単語が順に連結された文、ならびに、カテゴリ「会社名と名前」に属する単語だけで構成された文の2種類が、受理可能な文として定義されている。
なお、図5には、来訪者の身元に関する質問に対する応答に対応する言語モデル1521のみが例示されているが、言語モデル記憶エリア152には、他にも、例えば、担当者名に関する質問に対する応答の場面等、様々な場面に対応して予め作成された複数の言語モデルが記憶されている。
単語辞書記憶エリア153(図3参照)には、言語モデルとともに音声認識に使用される単語辞書1531(図6参照)が記憶されている。図6に示すように、単語辞書1531は、予め設定されたカテゴリ毎に、そのカテゴリに属する単語と、各単語の発音に関する情報とを記述するものである。図6は、カテゴリ「名乗り」に対応する単語辞書の例を示している。なお、図6では、表記を簡略化するため、発音に関する情報として片仮名が使用されているが、実際には、単語辞書では音素列として記憶されている。例えば、単語「です」に対応する発音は、図6では片仮名で「デス」と記載されているが、実際には「desu」と記憶されている。
また、図示は省略するが、単語辞書記憶エリア153には、「名乗り」のみでなく、他の様々なカテゴリについても同様に、単語と発音に関する情報の対応が記憶されている。ただし、前述したカテゴリ「会社名と名前」については、別途、後述する来訪者辞書が来訪者受付処理の過程で生成されるため、単語辞書記憶エリア153に記憶しておかなくてよい。
来訪者辞書記憶エリア154(図3参照)には、前述の言語モデルおよび単語辞書とともに、来訪者の身元を特定するための音声認識に使用される来訪者辞書1541〜1544が記憶されている。本実施形態では、図7に示す訪問日時辞書1541、図8に示す訪問日辞書1542、図9に示す訪問パターン辞書1543、および図10に示す訪問履歴辞書1544の4種類の来訪者辞書が記憶されている。これらの来訪者辞書1541〜1544は、いずれも、カテゴリ「会社名と名前」に属する単語と、各単語の発音に関する情報とを記述するものであり、来訪者予約DB1510(図4参照)に記憶された来訪者予約情報に基づいて作成される。なお、単語辞書1531と同様、図7〜図10では、表記を簡略化するため、発音に関する情報として片仮名が使用されているが、実際には、来訪者辞書1541〜1544では音素列として記憶されている。
図7に示す訪問日時辞書1541は、受付端末20の操作ボタン209が来訪者によって操作され、その情報が受付サーバ10に受け付けられた場合に、その時の時刻を基準として作成される来訪者辞書である。例えば、本実施形態の訪問日時辞書1541は、来訪者の訪問が受け付けられた日時の前後1時間以内を訪問予定日時とする来訪者予約情報に基づいて作成されている。
図8に示す訪問日辞書1542は、その日最初に受付端末20の操作ボタン209が来訪者によって操作され、その情報が受付サーバ10に受け付けられた場合に、日付を基準として作成される来訪者辞書である。より具体的には、訪問日辞書1542は、来訪者の訪問が受け付けられた日時と同日の日時を訪問予定日時とする来訪者予約情報に基づいて作成される。
図9に示す訪問パターン辞書1543は、その日最初に受付端末20の操作ボタン209が来訪者によって操作され、その情報が受付サーバ10に受け付けられた場合に、所定の規則(パターン)に基づいて作成される来訪者辞書である。より具体的には、訪問パターン辞書1543は、訪問予定日時が来訪者の訪問が受け付けられた日時と規則的な関係にある来訪者予約情報に基づいて作成される。規則的な関係にある訪問予定日時とは、例えば、同じ曜日、同じ日付、同じ時間帯である。
本実施形態では、訪問パターン辞書1543は、過去1ヶ月以内の同じ曜日の日時を訪問予定日時とする来訪者予約情報に基づいて作成される。訪問パターン辞書1543には、他の来訪者辞書1541、1542、1544とは異なり、カテゴリ「会社名と名前」に属する単語と、各単語の発音に関する情報とともに、訪問パターンに関する情報であるパターン名が記憶されている。本実施形態では、曜日をパターンに用いているため、曜日を特定する情報がパターン名として記憶される。
図10に示す訪問履歴辞書1544は、その日最初に受付端末20の操作ボタン209が来訪者によって操作され、その情報が受付サーバ10に受け付けられた場合に、過去の来訪者に関する情報に基づいて作成される来訪者辞書である。より具体的には、訪問履歴辞書1544は、過去1ヶ月以内の日時を訪問予定日時とする来訪者予約情報に基づいて作成される。なお、来訪者辞書1541〜1544の作成については、後で詳述する。
社員DB記憶エリア155(図3参照)には、会社5の社員全員の個人情報(以下、社員情報という)を格納する社員DB1551(図11参照)が記憶されている。社員情報は、社員1名毎に作成されるものであり、例えば、図11に示すように、氏名、苗字、発音に関する情報、および電話番号を含む。これらの項目のうち、苗字および発音に関する情報のデータについては、後述する担当者名の音声認識処理において、カテゴリ「担当者名」に属する単語の単語辞書として使用される。図11では、表記を簡略化するため、発音に関する情報として片仮名が使用されているが、実際には、音素列が記憶されている。なお、社員情報には、図11に示す以外に、各社員を識別する社員コードや、所属する部署等の情報が含まれていてもよい。社員DB1551の苗字および対応する発音に関する情報は、本発明の「対応者候補辞書」に相当する。
プログラム記憶エリア156(図3参照)には、後述する来訪者受付処理(図12参照)に使用されるプログラム群、システムプログラム、通信プログラム等、各種処理を受付サーバ10に実行させるための各種プログラムが記憶されている。なお、これらのプログラムは、例えばCD−ROMに記憶されたものがCD−ROMドライブ(図示外)を介してインストールされ、プログラム記憶エリア156に記憶される。または、LAN9を介してインターネット(図示外)に接続し、インターネット上からダウンロードされたプログラムが記憶されてもよい。
図示はされていないが、HDD150には、その他、音声認識処理で一般的に使用される周知の音響モデルや、各種処理で使用される設定値等も記憶されている。なお、詳細は説明しないが、音響モデルは、音声の音響的特徴を統計的にモデル化したもので、例えば、母音、子音のそれぞれについて、音響的特徴(例えば、周波数特性)と対応する音素とで表現されている。
以下に、前述のように構成された受付サーバ10において行われる各種処理について、図12〜図15を参照して説明する。図12は、来訪者受付処理のフローチャートである。図13は、来訪者受付処理中に実行される来訪者辞書準備処理のフローチャートである。図14は、来訪者受付処理中に実行される身元特定処理のフローチャートである。図15は、来訪者受付処理中に実行される来訪者通知処理のフローチャートである。図12〜図15の処理は、HDD150のプログラム記憶エリア156に記憶された来訪者受付処理用のプログラム群(例えば、音声認識プログラム、音声合成プログラム、対話制御プログラム)に従って、CPU101が実行する。
来訪者が、会社5の入口付近に設置された受付端末20で操作ボタン209を押下げると、その情報は、LAN9を介して受付サーバ10に送信される。図12に示す来訪者受付処理は、操作ボタン209の押下げを示す情報が受付サーバ10で受信されると開始される。処理が開始されるとまず、来訪者辞書準備処理が行われる(S1、図13)。来訪者辞書準備処理は、来訪者の発話を認識して身元を特定するために使用される、来訪者辞書1541〜1544(図7〜図10参照)を準備する処理である。
図13に示す来訪者辞書準備処理が開始されると、まず、受付サーバ10の内蔵時計で管理されている現在の日時が、来訪者が検出された時間として、RAM103に取得される(S101)。続いて、来訪者辞書1541〜1544(図7〜図10参照)の順に、辞書がまだ作成されていなければ作成する処理が行われる。なお、以下では、来訪者予約DB1510には、図4に具体的な内容が記載されている8件の来訪者予約情報のみが記憶されており、現在の日時として、2008年5月12日11:00が取得された場合を例として説明する。
まず、訪問日時辞書1541(図7参照)を作成するために、来訪者予約DB1510(図4参照)から、訪問予定日時がステップS101で取得された現在日時の前後1時間以内にある来訪者予約情報が抽出され、RAM103の所定の記憶エリアに記憶される(S102)。前述の例では、訪問予定日時が、現在日時の1時間前の2008年5月12日10:00から1時間後の2008年5月12日12:00までの間にある来訪者予定情報が取得される。よって、図4に示す、訪問予定日時が2008年5月12日10:30の永光氏、2008年5月12日11:00の利岡氏、および2008年5月12日11:30の木和田氏の、3件の来訪者予約情報が取得されることになる。
続いて、取得された来訪者予約情報に基づいて、訪問日時辞書1541が作成される(S103)。具体的には、各来訪者予約情報に含まれる、来訪者会社名および来訪者名が結合されることにより、カテゴリ「会社名と名前」に属する1つの単語が作成される。例えば、訪問予定日時が2008年5月12日10:30の永光氏の来訪者予約情報からは、「A工業の永光」という単語が作成される。また、各来訪者予約情報に含まれる、来訪者会社名ヨミおよび来訪者名ヨミがそれぞれ音素列に変換され、結合されることにより、来訪者会社名および来訪者名が結合された単語に対応する発音に関する情報が作成される。
来訪者会社名ヨミおよび来訪者名ヨミから音素列への変換は、例えば、片仮名と音素との対応表を予め作成してHDD150の所定の記憶エリア(図示外)に記憶させておき、この対応表を使用して行えばよい。例えば、訪問予定日時が2008年5月12日10:30の永光氏の来訪者予約情報からは、「エーコーギョウノナガミツ(実際には音素列)」が作成される。
このようにして、来訪者会社名および来訪者名が結合された単語と音素列とが対応づけられることにより訪問日時辞書1541が作成され、来訪者辞書記憶エリア154に記憶される。前述の例では、ステップS103において、訪問予定日時が2008年5月12日10:30の永光氏、2008年5月12日11:00の利岡氏、および2008年5月12日11:30の渡辺氏の3件の来訪者予約情報に基づいて、図7に示す訪問日時辞書1541が作成されることになる。
続いて、訪問日辞書1542(図8参照)がすでに作成されているか否かが判断される(S105)。訪問日辞書は、訪問予定日時がステップS101で取得された現在日時と同日に属する来訪者予約情報に基づいて作成されるものであるため、1日に一度作成されればよいからである。よって、来訪者辞書記憶エリア154に訪問日辞書1542が記憶されていれば、すでに作成済みと判断され(S105:YES)、処理はそのままステップS110に進む。
一方、来訪者辞書記憶エリア154に訪問日辞書1542が記憶されておらず、まだ作成されていないと判断された場合には(S105:NO)、来訪者予約DB1510(図4参照)から、現在日時と同日の訪問予定日時を含む来訪者予約情報が抽出され、RAM103の所定の記憶エリアに記憶される(S106)。前述の例では、訪問予定日時が2008年5月12日10:30の永光氏、2008年5月12日11:00の利岡氏、2008年5月12日11:30の木和田氏、および2008年5月12日13:00の豊倉氏の、4件の来訪者予約情報が取得されることになる。
前述のステップS103と同様にして、取得された来訪者予約情報に基づいて、来訪者会社名および来訪者名が結合され、対応する音素列が作成されて互いに対応づけられることにより訪問日辞書1542が作成され、来訪者辞書記憶エリア154に記憶される(S107)。その後、処理はステップS110へ進む。前述の例では、ステップS107では、ステップS106で取得された4件の来訪者予約情報に基づいて、図8に示す訪問日辞書1542が作成されることになる。
ステップS110では、訪問パターン辞書1543(図9参照)がすでに作成されているか否かが判断される(S110)。訪問パターン辞書は、本実施形態では、訪問予定日時がステップS101で取得された現在日時から過去1ヶ月以内にあり、且つ、同じ曜日である来訪者予約情報に基づいて作成されるものであるため、1日に一度作成されればよいからである。よって、来訪者辞書記憶エリア154に訪問パターン辞書1543が記憶されていれば、すでに作成済みと判断され(S110:YES)、処理はそのままステップS115に進む。
一方、来訪者辞書記憶エリア154に訪問パターン辞書1543が記憶されておらず、まだ作成されていないと判断された場合には(S110:NO)、来訪者予約DB1510(図4参照)から、現在の日付と同じ曜日で過去1ヶ月以内の訪問予定日時を含む来訪者予約情報が抽出され、RAM103の所定の記憶エリアに記憶される(S111)。前述の例では、現在の日付2008年5月12日は月曜日であると特定され、訪問予定日時が過去1ヶ月以内の月曜日である、2008年4月28日11:00の囲氏、2008年4月28日15:00の利岡氏、2008年5月5日11:00の囲氏の、3件の来訪者予約情報が取得されることになる。
前述のステップS103と同様にして、取得された来訪者予約情報に基づいて、来訪者会社名および来訪者名が結合され、対応する音素列が作成されて互いに対応付けられることにより訪問パターン辞書1543が作成され、来訪者辞書記憶エリア154に記憶される(S112)。なお、前述の囲氏の例のように、来訪者会社名および来訪者名が重複する来訪者予約情報がある場合は、重複して登録する必要はない。また、訪問パターン、すなわち、特定された曜日に関する情報も、パターン名として訪問パターン辞書1543に記憶される(S112)。その後、処理はステップS115へ進む。
前述の例では、ステップS112では、ステップS111で取得された3件の来訪者予約情報に基づいて、図9に示す訪問パターン辞書1543が作成されることになる。つまり、来訪者会社名および来訪者名が結合された単語、音素列、ならびに特定された曜日が、単語、発音、およびパターン名を1組とする情報として訪問パターン辞書1543が作成される。
ステップS115では、訪問履歴辞書1544(図10参照)がすでに作成されているか否かが判断される(S115)。訪問履歴辞書は、本実施形態では、訪問予定日時が、現在の日付から過去1ヶ月以内の来訪者予約情報に基づいて作成されるものであるため、1日に一度作成されればよいからである。よって、来訪者辞書記憶エリア154に訪問履歴辞書1544が記憶されていれば、すでに作成済みと判断され(S115:YES)、図13に示す来訪者辞書準備処理は終了し、図12の来訪者受付処理に戻る。
一方、来訪者辞書記憶エリア154に訪問履歴辞書1544が記憶されておらず、まだ作成されていないと判断された場合には(S115:NO)、来訪者予約DB1510(図4参照)から、現在の日付から過去1ヶ月以内の訪問予定日時を含む来訪者予約情報が抽出され、RAM103の所定の記憶エリアに記憶される(S116)。前述の例では、訪問予定日時が、現在の日付2008年5月12日から過去1ヶ月以内にある、図4に示す8件の来訪者予約情報がすべて取得されることになる。
前述のステップS103と同様にして、取得された来訪者予約情報に基づいて、来訪者会社名および来訪者名が結合され、対応する音素列が作成されて互いに対応づけられることにより訪問履歴辞書1544が作成され、来訪者辞書記憶エリア154に記憶される(S117)。前述の例では、ステップS117では、ステップS116で取得された8件の来訪者予約情報に基づいて、図10に示す訪問履歴辞書1544が作成されることになる。なお、前述したように、来訪者会社名および来訪者名が重複する来訪者予約情報がある場合は、重複して登録する必要はない。来訪者辞書1541〜1544すべてについて、処理が完了したため、図13に示す来訪者辞書準備処理は終了し、図12の来訪者受付処理に戻る。
図12の来訪者受付処理において、来訪者辞書準備処理が終了した後(S1)、来訪者に対する最初の挨拶(例えば、「会社5へようこそ。」)の音声データが、受付端末20に出力される(S2)。より具体的には、来訪者との対話を想定したシナリオに沿って予め作成され、HDD150の所定の記憶エリア(図示外)に記憶されている挨拶の文面のテキストデータが読み出され、音声データに変換された後、通信装置109およびLAN9を介して受付端末20に出力される。なお、音声データを受信した受付端末20では、音声データがスピーカ208で音声に変換されて出力される。
続いて、前述したのと同様に、HDD150から読み出された来訪者の身元に関する質問の音声データが、受付端末20に出力される(S3)。本実施形態では、例えば、「御用の方は、会社名とお名前をどうぞ。」というように、来訪者の会社名と名前とを質問する音声の音声データが送信される。そして、受付端末20では、この質問がスピーカ208から音声出力される。
受付端末20に対して、来訪者が身元に関する質問に回答すると、マイク207から入力された音声が音声データに変換され、受付サーバ10に送信される。音声データは、受付端末20からLAN9を介して受付サーバ10に入力され、RAM103の所定の記憶エリアに記憶される(S4)。続いて、身元特定処理が行われる(S5、図14)。身元特定処理は、入力された音声データをテキストに変換する音声認識を行って、来訪者の身元を特定する処理である。
図14に示す身元特定処理が開始されると、まず、この場面で音声認識に使用される音響モデル、言語モデルおよび辞書が、HDD150の所定の記憶エリアからそれぞれ読み出される(S501)。具体的には、音響モデルが、HDD150の所定の記憶エリア(図示外)から読み出される。図5に示す、来訪者の身元に関する質問への応答に対応する言語モデル1521が、言語モデル記憶エリア152から読み出される。言語モデル1521に含まれるカテゴリ「会社名と名前」に対応する辞書である、来訪者辞書準備処理(S1)で作成された来訪者辞書1541〜1544(図7〜図10参照)が、来訪者辞書記憶エリア154から読み出される。また、カテゴリ「名乗り」に対応する辞書である単語辞書1531(図5参照)が、単語辞書記憶エリア153から読み出される。
RAM103の所定の記憶エリアに記憶されている発話回数カウンタのカウンタ値Nが、0にセットされる(S502)。発話回数カウンタは、来訪者による自己の身元に関する回答の音声データを何回受け付けたかをカウントするものである。
続いて、音響モデル、言語モデル1521、来訪者辞書1541〜1544、および単語辞書1531を用いて、音声認識が行われる(S503)。より具体的には、例えば、ステップS4で受付端末20から入力された来訪者の音声データを分析し、特徴量を抽出した後、音響モデルと言語モデル1521とのマッチングが行われる。その結果、言語モデル1521で受理可能な文毎に尤度が求まり、尤度が最も高い文が認識結果として得られる。言語モデル1521は単語辞書として来訪者辞書1541〜1544の各々と単語辞書1531を参照する。来訪者辞書1541〜1544は4種類あるため、言語モデル1521による認識が4通り行われる。認識に成功すれば、それぞれの辞書に対応した認識結果(テキスト)が得られることになる。なお、尤度が既定の閾値以下の値になった場合は、認識失敗として認識結果は得られない。
例えば、来訪者が、受付端末20からの質問に対して「A工業の永光です。」と応じたとする。受付サーバ10に入力された音声データを分析し、特徴量を抽出した後、音響モデルと4種類の来訪者辞書1541〜1544を参照する言語モデル1521とのマッチングを行う。その結果、「エーコウギョウノナガミツ」を含む来訪者辞書1541、1542および1544を参照する言語モデル1521では、「エーコウギョウノナガミツ」の尤度が最も高くなり、認識結果として「A工業の永光」が得られる。「エーコウギョウノナガミツ」を含まない来訪者辞書1543を参照する言語モデル1521では、言語モデル1521で受理可能なすべての文で尤度が閾値以下となり、認識結果は得られない。
続いて、訪問日時辞書1541(図7参照)、訪問日辞書1542(図8参照)、訪問パターン辞書1543(図9参照)、および訪問履歴辞書1544(図10参照)の順に、各辞書を使用した認識結果が存在するか否かが判断される(S504〜S507)。
前述したように、訪問日時辞書1541には、受付端末20で操作ボタン209が押下げられ、来訪者が検出された時刻の前後1時間の来訪予定者の会社名と名前が登録されている。訪問日辞書1542には、同日中の来訪予定者の会社名と名前が登録されている。訪問パターン辞書1543には、過去1ヶ月以内で同じ曜日の来訪予定者の会社名と名前が登録されている。訪問履歴辞書1544には、過去1ヶ月以内の来訪予定者の会社名と名前が登録されている。つまり、訪問日時辞書1541、訪問日辞書1542、訪問パターン辞書1543、訪問履歴辞書1544の順に、訪問予定日時の範囲が広くとられている。
現在の来訪者は、訪問予定日時が現在の前後1時間である来訪予定者である可能性が最も高く、その次に、同日の来訪予定者である可能性が高い。また、いずれにも該当しない場合には、所定のパターンで定期的に来訪する人物、または過去の一定期間内に来訪したことがある人物である可能性がある。したがって、訪問予定日時をより絞り込んで作成された辞書を用いた認識結果ほど、現在の来訪者の身元をより正確に特定する情報として信頼性が高いと考えられる。
そこで、本実施形態では、訪問日時辞書1541、訪問日辞書1542、訪問パターン辞書1543、訪問履歴辞書1544の順番で、来訪者辞書1541〜1544による認識結果を採用する。具体的には、まず、訪問日時辞書1541による認識結果が存在する場合には(S504:YES)、RAM103の所定の記憶エリアに、認識辞書名として「訪問日時辞書」が記憶される(S511)。また、RAM103の所定の記憶エリアに、認識結果として「会社名と名前(例えば、A工業の永光)」が記憶される(S512)。その後、図14に示す身元特定処理は終了し、図12の来訪者受付処理に戻る。
訪問日時辞書1541による認識結果が存在しない場合には(S504:NO)、訪問日辞書1542による認識結果が存在するか否かが判断される(S505)。訪問日辞書1542による認識結果が存在する場合には(S505:YES)、RAM103の所定の記憶エリアに、認識辞書名として「訪問日辞書」が(S511)、認識結果として、ステップS503で得られたテキストに含まれる「会社名と名前」が(S512)、それぞれ記憶される。その後、図14に示す身元特定処理は終了し、図12の来訪者受付処理に戻る。
訪問日辞書1542による認識結果が存在しない場合には(S505:NO)、訪問パターン辞書1543による認識結果が存在するか否かが判断される(S506)。訪問パターン辞書1543による認識結果が存在する場合には(S506:YES)、RAM103の所定の記憶エリアに、パターン名として、訪問パターン辞書1543に記憶されている「パターン名」が記憶される(S508)。また、RAM103の所定の記憶エリアに、認識辞書名として「訪問パターン辞書」が記憶される(S511)。さらに、認識結果として「会社名と名前」が記憶される(S512)。その後、図14に示す身元特定処理は終了し、図12の来訪者受付処理に戻る。
訪問パターン辞書1543による認識結果が存在しない場合には(S506:NO)、訪問履歴辞書1544による認識結果が存在するか否かが判断される(S507)。訪問履歴辞書1544による認識結果が存在する場合には(S507:YES)、RAM103の所定の記憶エリアに、認識辞書名として「訪問履歴辞書」が(S511)、認識結果として「会社名と名前」が(S512)、それぞれ記憶される。その後、図14に示す身元特定処理は終了し、図12の来訪者受付処理に戻る。
訪問履歴辞書1544による認識結果が存在しない場合、すなわち、来訪者辞書1541〜1544のいずれを使用しても認識結果が得られない場合には(S507:NO)、RAM103に記憶されている発話回数カウンタのカウンタ値Nが1インクリメントされた後(S515)、Nが予め定められた閾値である3を超えたか否かが判断される(S516)。初回の処理では、N=2となり、3を超えていないため(S516:NO)、図12のステップS3およびS4と同様にして、再び、来訪者に対する身元に関する質問の音声データが受付端末20に出力され(S518)、質問への回答の音声データが受け付けられる(S519)。これは、来訪者の音声が適切にマイク207から入力されなかったことによって音声認識ができなかった可能性があるため、来訪者が言い直した音声の認識を再度試みるためである。
受け付けられた音声データに基づいて、再度、来訪者辞書1541〜1544を用いた音声認識が行われる(S503)。前述したように、訪問日時辞書1541、訪問日辞書1542、訪問パターン辞書1543、および訪問履歴辞書1544の順に、各辞書を使用した認識結果が存在するか否かが判断される(S504〜S507)。2巡目の処理でも認識できなかった場合には(S507:NO)、さらに発話回数カウンタのカウンタ値Nが1インクリメントされ(S515)、N=3となる。まだNは3を超えていないため(S516:NO)、再度、来訪者に身元に関する情報を求め、音声認識が行われる(S518〜S519、S503)。
3巡目の処理でも認識できなかった場合は(S507:NO)、インクリメントされた発話回数カウンタのカウンタ値Nが3を超えてしまう(S515、S516:YES)。この場合、これ以上の質問は行われない。そこで、RAM103の所定の記憶エリアに、認識辞書名および認識結果として、それぞれ「Null」が記憶された後(S517)、図14に示す身元特定処理は終了し、図12の来訪者受付処理に戻る。なお、本実施形態では、来訪者に繰り返し身元に関する質問を行う回数を3回までとして閾値を定めているが、この値は必ずしも3にする必要はなく、その他の値としてもよい。ただし、あまり大きな数になると、来訪者は同じ回答を何回も続けることになり、ストレスを感じる可能性があるため、2〜3回までとするのが望ましい。
2巡目か3巡目の処理で、来訪者辞書1541〜1544のいずれかによる認識結果が存在すると判断された場合には(S504、S505、S506、またはS507:YES)、該当する認識辞書名、会社名と名前、訪問パターン辞書1543の場合はパターン名が、RAM103の所定の記憶エリアにそれぞれ記憶された後(S511、S512、S508)、図14に示す身元特定処理は終了し、図12の来訪者受付処理に戻る。
図12の来訪者受付処理では、身元特定処理(S5)に続いて、担当者に関する質問の音声データが、受付端末20に出力される(S6)。より具体的には、HDD150の所定の記憶エリア(図示外)に予め記憶されている、質問の文面(例えば、「担当者名をどうぞ。」)が読み出され、音声データに変換された後、通信装置109およびLAN9を介して受付端末20に送信される。音声データを受信した受付端末20では、音声データが音声に変換され、スピーカ208から音声として出力される。
受付端末20に対して、来訪者が担当者に関する質問に回答すると、マイク207から入力された音声が音声データに変換され、受付サーバ10に送信される。受付端末20からの音声データが、LAN9を介して受付サーバ10に入力されると、音声データはRAM103の所定の記憶エリアに記憶される(S7)。続いて、来訪者通知処理が行われる(S5、図15)。来訪者通知処理は、入力された音声データをテキストに変換する音声認識を行って、担当者に来訪者について連絡する処理である。
図15の来訪者通知処理では、まず、担当者の特定が行われる(S801)。より具体的には、前述した身元特定処理と同様、音響モデル、言語モデル、および単語辞書を用いて、受付端末20から入力された音声データの認識処理が行われる。ここでは、言語モデルとして、言語モデル記憶エリア152に記憶された、担当者名に関する質問に対する応答の場面に対応する言語モデル(図示外)が使用される。この言語モデルは、例えば、カテゴリ「担当者名」に属する単語およびカテゴリ「敬称」に属する単語から構成される文(例えば、「佐藤様」)を、受理可能な文のパターンとして含む。
また、単語辞書として、例えば、カテゴリ「担当者名」および「敬称」に対応する辞書がRAM103に読み出され、使用される。このうち、担当者名に関する辞書としては、前述した、社員DB1551(図11参照)に含まれる「苗字」および「発音」を使用することができる。敬称やその他のカテゴリに属する単語の辞書は、単語辞書記憶エリア153に記憶されているものを読み出して、使用すればよい。このように、社員DB1551に記憶された、限られた数の社員の苗字および発音に関する情報を担当者に関する回答の音声認識に使用することにより、担当者名を高精度に認識することができる。来訪者の回答が音声認識によりテキストに変換されると、回答に含まれる担当者名が、RAM103の所定の記憶エリアに一時的に記憶される。
前述のようにして担当者が特定されると(S801)、前述の身元特定処理(図14参照)でRAM103の所定の記憶エリアにそれぞれ記憶された認識辞書名と認識結果(来訪者の会社名と名前)が取得される(S802)。そして、認識結果があるか否か、すなわち、RAM103の所定の記憶エリアから、認識結果が取得できたか否かが判断される(S804)。
認識結果がある場合(S803:YES)、認識結果とともに取得された認識辞書名が特定される。これは、認識に成功した辞書に応じて、担当者に対する来訪者に関する通知内容を異ならせるためである。まず、認識辞書名が訪問日時辞書1541(図7参照)であるか否かが判断される(S804)。訪問日時辞書1541である場合(S804)、来訪者は、訪問が受け付けられた時刻の前後1時間以内の来訪予定者に該当すると認識されている。よって、来訪予定者が訪ねてきたことを伝える内容の通知文が作成され、RAM103の所定の記憶エリアに記憶される(S807)。この場合の通知文は、例えば、「近い時刻にお約束のある、A工業の永光様がいらっしゃっています。」というようになる。なお、来訪者予約DB1510から、この来訪者の訪問予定時間を読み出し、例えば、「10時30分にお約束のある、A工業の永光様がいらっしゃっています。」というように、訪問予定時間の情報もあわせて通知してもよい。
認識辞書名が、訪問日時辞書1541ではなく(S804:NO)、訪問日辞書1542(図8参照)であると判断された場合には(S805:YES)、来訪者は、訪問が受け付けられた時刻の前後1時間以内の来訪予定者ではないが、当日の来訪予定者には該当すると認識されている。よって、予定された時間とは異なるが、来訪予定者が訪ねてきたことを伝える内容の通知文が作成され、RAM103の所定の記憶エリアに記憶される(S808)。この場合の通知文は、例えば、「お客様です。お約束の時間とは違いますが、E化学の豊倉様だと思います。」というようになる。前述のように、訪問予定時間を含めた通知文としてもよい。
認識辞書名が、訪問日辞書1542でもなく(S805:NO)、訪問パターン辞書1543(図9参照)であると判断された場合には(S806:YES)、来訪者は、当日の来訪予定者ではないが、過去1ヶ月以内の同じ曜日に訪ねてきた人物に該当すると認識されている。よって、何曜日に訪ねてきた人物であるかを特定するために、前述の身元特定処理(図14参照)でRAM103に記憶されたパターン名が取得される(S809)。そして、同じ曜日に来訪したことがある人物が訪ねてきたことを伝える内容の通知文が作成され、RAM103の所定の記憶エリアに記憶される(S810)。この場合の通知文は、例えば、「お客様です。よく聞き取れませんでしたが、多分、前にも月曜日にいらっしゃったB運送の囲様だと思います。」というようになる。来訪者予約DB1510から、この来訪者の直近の月曜日の来訪予約情報を読み出し、例えば、「同じ月曜日の5月5日にいらっしゃった、B運送の囲様だと思います。」というように、過去の情報もあわせて通知してもよい。
認識辞書名が、訪問パターン辞書1543でもないと判断された場合は(S806:NO)、訪問履歴辞書1544(図10参照)であることになる。よって、来訪者は、当日の来訪予定者ではないが、過去1ヶ月以内に訪ねてきたことがある人物に該当すると認識されている。そこで、過去1ヶ月以内に来訪したことがある人物が訪ねてきたことを伝える内容の通知文が作成され、RAM103の所定の記憶エリアに記憶される(S811)。この場合の通知文は、例えば、「お客様です。よく聞き取れませんでしたが、多分、前にもいらっしゃったF工業の西坂様だと思います。」というようになる。訪問パターン辞書1543の場合と同様に、来訪者の過去の最新の来訪者予約情報を読み出して、過去の情報をあわせて通知してもよい。
一方、認識結果がないと判断された場合(S803:NO)、前述の身元特定処理(図14参照)で、来訪者辞書1541〜1544のいずれを使用しても、来訪者の身元に関する回答が音声認識できなかった場合に該当する。よって、この場合には、身元不明の来訪者が訪ねてきたことを伝える内容の通知文が作成され、RAM103の所定の記憶エリアに記憶される(S815)。この場合の通知文は、例えば、「お客様です。お名前はよく聞き取れませんでした。」というようになる。
このように、来訪者の音声認識に成功した来訪者辞書1541〜1544に応じて、担当者への通知内容を異ならせることにより、通知を受けた担当者が、通知される来訪者の身元がどの程度正確かを判断し、適切な対応をすることが容易となる。
前述のように、それぞれの場合に応じた通知文が作成された後(S807、S808、S810、S811、またはS815)、通知文のテキストデータが音声データに変換される。そして、ステップS801で特定された担当者の電話番号が社員DB1551(図11参照)から読み出され、IP−PBX50を介して、担当者の使用するIP電話機60に、音声データが発信される(S813)。これにより、電話を受けた担当者は、どのような人物が訪ねてきたのかを的確に知ることができる。担当者に、来訪者の通知が行われた後、図15の来訪者通知処理は終了し、図12の来訪者受付処理に戻る。
図12の来訪者受付処理では、続いて、担当者がIP電話機60に対して発した音声の音声データの入力が受け付けられる(S9)。詳細な説明は省略するが、受け付けられた音声データについて、音響モデル、担当者からの応答指示の場面に対応する言語モデルおよび単語辞書を用いた認識処理が行われる(S10)。この場面では、担当者は、自ら来訪者に応対することを告げる場合と、受付サーバ10で代わりに応対することを指示する場合があると想定される。例えば、自ら来訪者に応対する場合は、「つないでください。」という取次ぎの指示、受付サーバ10に代理応対させる場合は、「代わりに応対してください。」という指示が受け付けられることになる。
認識結果として出力された担当者の指示が、取次ぎの指示であるか否かが判断される(S11)。取次ぎの指示であれば(S11:YES)、HDD150の所定の記憶エリア(図示外)に記憶されている取次ぎの文面のテキストデータが読み出され、音声データに変換された後、通信装置109およびLAN9を介して受付端末20に出力される(S12)。その結果、受付端末20のスピーカ208から、例えば、「おつなぎします。」という取次ぎの音声が出力される。続いて、IP−PBX50を介して、受付端末20と担当者のIP電話機60を接続させる(S13)。そして、来訪者の訪問が受け付けられる都度作成される訪問日時辞書1541が、次の処理に備えて来訪者辞書記憶エリア154から削除された後(S17)、図12の来訪者受付処理は終了する。
一方、担当者の指示が、取次ぎの指示ではなく代理応対の指示であれば(S11:NO)、伝言を受け付ける旨の通知の文面のテキストデータが、HDD150の所定の記憶エリア(図示外)から読み出され、音声データに変換された後、通信装置109およびLAN9を介して受付端末20に出力される(S14)。そして、受付端末20のマイク207から入力された来訪者の伝言が、音声データに変換されて送信され、受付サーバ10に入力されると(S15)、入力された音声データは、HDD150の伝言用の記憶エリア(図示外)に記憶される(S16)。よって、担当者は、後でHDD150に記憶された音声データを再生することにより、来訪者の残した伝言を聞くことができる。続いて、訪問日時辞書1541が、次の処理に備えて来訪者辞書記憶エリア154から削除され(S17)、図12の来訪者受付処理は終了する。
なお、訪問日時辞書1541以外の、1日に一度作成される来訪者辞書1542〜1544については、毎日、例えば0時に、来訪者辞書記憶エリア154から削除される。
以上に説明したように、本実施形態の来訪者受付システム1によれば、来訪者予約DB1510に予め記憶されている来訪者予約情報に基づいて、来訪者辞書1541〜1544が作成される。そして、来訪者辞書1541〜1544を用いて、来訪者の身元に関する発話の音声認識が行われる。したがって、汎用の会社名辞書および名前辞書を利用する場合に比べ、高精度な認識結果が得られ、来訪者の身元に関する情報である会社名と苗字をより正確に特定することができる。
また、来訪者辞書1541〜1544は、それぞれ、受付端末20の操作ボタン209が押下げられることにより来訪者が検出された日時と所定の関係にある訪問予定日時に対応する来訪者予約情報から作成される。したがって、訪問予定日時が絞り込まれた来訪者辞書に基づいて音声認識が行われるため、より高精度な認識結果を得ることができる。
本実施形態では、図12のステップS4で、来訪者の音声データを取得するCPU101が、本発明の「音声情報取得手段」に相当する。図12のステップS5および図14の身元特定処理を行うCPU101が、「来訪者特定手段」に相当する。図15のステップS812で、来訪者に関する通知文の音声データを出力するCPU101が、「来訪者情報出力手段」に相当する。
図13のステップS103、S107、S112、およびS117で来訪者辞書1541〜1544をそれぞれ作成するCPU101が、「来訪者辞書作成手段」に相当する。S107で訪問日辞書1542を作成するCPU101が、「同日辞書作成手段」に相当する。S103で訪問日時辞書1541を作成するCPU101が、「所定時間辞書作成手段」に相当する。S117で訪問履歴辞書1544を作成するCPU101が、「過去履歴辞書作成手段」に相当する。S112で訪問パターン辞書1543を作成するCPU101が、「パターン辞書作成手段」に相当する。また、図15のステップS801で、来訪者の担当者を特定するCPU101が、「対応者特定手段」に相当する。
また、図12のステップS4の来訪者の音声データを取得する処理が、本発明の「音声情報取得ステップ」に相当する。図12のステップS5および図14の身元特定処理が、「来訪者特定ステップ」に相当する。図15のステップS812の来訪者に関する通知文の音声データを出力する処理が、「来訪者情報出力ステップ」に相当する。
なお、前述の実施形態に示される構成や処理は例示であり、各種の変形が可能なことはいうまでもない。例えば、前述の実施形態では、4種類の来訪者辞書1541〜1544が作成され、来訪者の身元に関する発話の音声認識にすべての来訪者辞書1541〜1544が使用されている。しかしながら、来訪者の身元に関する発話の音声認識に使用する辞書は、来訪者辞書1541〜1544のうちの少なくとも1種類を使用すれば行うことが可能である。
また、来訪者辞書1541〜1544は、4種類の別個の辞書とせず、1つの来訪者辞書として作成してもよい。この場合、例えば、来訪者が検出された日時と訪問予定日時との関係が、来訪者が検出された時刻の前後1時間、同日、過去1ヶ月以内で同じ曜日、および過去1ヶ月以内である来訪者予約情報を順番に抽出して、来訪者辞書を作成することができる。なお、先に抽出されているのと同じ来訪者の来訪者予約情報は、重複して抽出しないようにすればよい。また、来訪者予約情報とともに、抽出基準とされた前述の4種類の関係のいずれかを記憶しておけば、前述の実施形態と同様に、記憶されている関係に応じて、担当者への通知内容を変更することができる。
また、来訪者辞書1541〜1544を作成する際の基準となる、来訪者が検出された日時と訪問予定日時との関係は、本実施形態で例示されている以外の所定の関係であってもよい。例えば、訪問日時辞書1541は、訪問予定日時が、来訪者が検出された日時の前後30分以内にある来訪者予約情報に基づいて作成してもよいし、訪問履歴辞書1544は、訪問予定日時が、来訪者が検出された日時から過去2週間以内にある来訪者予約情報に基づいて作成してもよい。
また、来訪者予約DB1510には、訪問予定日時が過去の来訪者予約情報だけでなく、訪問予定日時が将来の来訪者予約情報も記憶されている。よって、訪問パターン辞書1543は、例えば、訪問予定日時が、来訪者が検出された日時の前後2週間以内で、且つ、同じ曜日である来訪者予約情報に基づいて作成してもよい。
前述の実施形態では、来訪者予約DB1510に記憶されている来訪者予約情報のうち、来訪者会社名と来訪者名、および来訪者会社名ヨミと来訪者名ヨミとに基づいて、カテゴリ「会社名と名前」という1つの単語とその発音に関する情報が作成されている。このように、来訪者会社名と来訪者名を結合して1つの単語にした場合、来訪者会社名と来訪者名とを別個の単語として音声認識を行う場合に比べ、発話のバリエーションが絞られるため、認識精度を向上させることができる。しかしながら、来訪者会社名と来訪者名とを別個の2つの単語として来訪者辞書1541〜1544を作成し、音声認識を行ってもよい。
また、例えば、来訪者名のみを1つの単語として来訪者辞書1541〜1544を作成してもよい。さらに、来訪者会社名と来訪者名として、来訪予定者が所属する会社等の正式名称と来訪者のフルネームを使用してもよい。来訪者が所属する会社等の正式名称と来訪者の苗字、または、来訪者が所属する会社等の通称と来訪者のフルネームを使用してもよい。
前述の実施形態では、来訪者予約DB1510には、来訪者会社名ヨミおよび来訪者名ヨミとして、片仮名が記憶されており、来訪者辞書1541〜1544を作成する際に、これらの片仮名が音素列に変換される。しかしながら、来訪者予約DB1510には予め作成した音素列を記憶しておき、そのまま抽出して来訪者辞書1541〜1544を作成してもよい。
前述の実施形態では、1日一度作成される来訪者辞書1542〜1544は、その日の最初の処理で作成されている。しかしながら、毎日、例えば、0時に作成しておいてもよい。
前述の実施形態では、担当者の特定は、社員DB1551に記憶された担当者名と発音を単語辞書として用いた音声認識により行われている。しかしながら、前述の実施形態のように、来訪者予約DB1510に担当者名とその発音に関する情報が記憶されている場合には、来訪者辞書1541〜1544と同様に、来訪者予約情報から担当者名の辞書を作成してもよい。
前述の実施形態では、担当者への来訪者に関する情報の通知は、IP電話機60に音声データを出力することにより行われている。しかしながら、担当者への通知の方法は、IP電話機60による方法に限られるものではない。例えば、担当者が使用する携帯電話に対して音声データを出力してもよいし、通知文のテキストデータを、担当者の使用するパーソナルコンピュータや携帯電話にメールで送信してもよい。
前述の実施形態では、来訪者受付システム1において、来訪者の検出や音声の入力が行われる受付端末20と、図12に示す来訪者受付処理を行う受付サーバ10とは、別個の装置である。しかしながら、マイク、スピーカ、および操作ボタンを備えた受付サーバ10を会社5の入口付近に設置し、受付サーバ10のみで、来訪者の検出、音声の入力、来訪者受付処理のすべてを行うことも可能である。また、来訪者予約DB151や社員DB155等、前述の実施形態でHDD150に記憶されている情報は、例えば、LAN9を介して受付サーバ10に接続可能な別個の記憶装置に記憶させておき、来訪者受付処理中に、必要な情報を読み出す構成としてもよい。
前述の実施形態では、受付端末20の操作ボタン209が押下げの有無によって、来訪者の検出の有無が判断されている。しかしながら、来訪者の検出には、操作ボタン209の代わりに、例えば、周知の人感センサまたはカメラを使用してもよい。
10 受付サーバ
20 受付端末
101 CPU
150 HDD
151 来訪者予約DB記憶エリア
207 マイク
209 操作ボタン
20 受付端末
101 CPU
150 HDD
151 来訪者予約DB記憶エリア
207 マイク
209 操作ボタン
Claims (11)
- 単語辞書を用いて来訪者の発話の音声認識を行う来訪者受付装置であって、
現在の来訪者を検出する来訪者検出手段によって前記現在の来訪者が検出された後、音声入力手段から入力された前記現在の来訪者の発する音声の音声情報を取得する音声情報取得手段と、
来訪者情報記憶手段に予め記憶されている来訪予定者の身元に関する情報である来訪者記憶情報に基づく単語辞書を来訪者辞書として用いて、前記音声情報取得手段によって取得された前記音声情報を認識することにより、前記現在の来訪者の身元に関する情報である現在来訪者情報を特定する来訪者特定手段と、
前記来訪者特定手段によって特定された前記現在来訪者情報を出力する来訪者情報出力手段を備えたことを特徴とする来訪者受付装置。 - 前記来訪者情報記憶手段は、来訪日時と対応付けて、前記来訪者記憶情報を記憶しており、
前記来訪者情報記憶手段に記憶された前記来訪者記憶情報のうち、前記来訪者検出手段によって前記現在の来訪者が検出された日時である来訪者検出日時と所定の関係にある前記来訪日時に対応する前記来訪者記憶情報を抽出することにより、前記来訪者辞書を作成する来訪者辞書作成手段を備えたことを特徴とする請求項1に記載の来訪者受付装置。 - 前記来訪者辞書作成手段は、前記来訪者情報記憶手段に記憶された前記来訪者記憶情報のうち、対応する前記来訪日時が、前記来訪者検出日時と同日の日時である前記来訪者記憶情報を抽出することにより、前記来訪者辞書を作成する同日辞書作成手段を備えたことを特徴とする請求項2に記載の来訪者受付装置。
- 前記来訪者辞書作成手段は、前記来訪者情報記憶手段に記憶された前記来訪者記憶情報のうち、対応する前記来訪日時が、前記来訪者検出日時から前後所定時間以内の日時である前記来訪者記憶情報を抽出することにより、前記来訪者辞書を作成する所定時間辞書作成手段を備えたことを特徴とする請求項2または3に記載の来訪者受付装置。
- 前記来訪者辞書作成手段は、前記来訪者情報記憶手段に記憶された前記来訪者記憶情報のうち、対応する前記来訪日時が、前記来訪者検出日時から所定の日数分の過去に属する日時である前記来訪者記憶情報を抽出することにより、前記来訪者辞書を作成する過去履歴辞書作成手段を備えたことを特徴とする請求項2〜4のいずれかに記載の来訪者受付装置。
- 前記来訪者辞書作成手段は、前記来訪者情報記憶手段に記憶された前記来訪者記憶情報のうち、対応する前記来訪日時が、前記来訪者検出日時と同じ日付、同じ曜日、または同じ時間帯である前記来訪者記憶情報を抽出することにより、前記来訪者辞書を作成するパターン辞書作成手段を備えたことを特徴とする請求項2〜5のいずれかに記載の来訪者受付装置。
- 前記来訪者辞書作成手段は、前記来訪予定者毎に、前記来訪者情報記憶手段に記憶された前記来訪者記憶情報に含まれる前記来訪者の氏名の少なくとも一部と所属の少なくとも一部とを抽出し、結合して1つの単語とすることにより、前記来訪者辞書を作成することを特徴とする請求項2〜6のいずれかに記載の来訪者受付装置。
- 来訪者の対応者の候補に関する情報に基づく単語辞書である対応者候補辞書を用いて、前記音声情報取得手段によって取得された前記音声情報を認識することにより、前記現在の来訪者の対応者に関する情報である対応者情報を特定する対応者特定手段をさらに備え、
前記来訪者情報出力手段は、前記対応者特定手段によって特定された前記対応者情報に対応する前記対応者に対して、前記現在来訪者情報の通知処理を行うことを特徴とする請求項1〜7のいずれかに記載の来訪者受付装置。 - 来訪者の対応者の候補に関する情報に基づく単語辞書である対応者候補辞書を用いて、前記音声情報取得手段によって取得された前記音声情報を認識することにより、前記現在の来訪者の対応者に関する情報である対応者情報を特定する対応者特定手段をさらに備え、
前記来訪者辞書作成手段は、複数の所定の関係に従って、前記来訪者辞書を作成し、
前記来訪者特定手段は、前記来訪者辞書作成手段によって作成された前記来訪者辞書を用いて、前記音声情報取得手段によって取得された前記音声情報を認識することにより、前記現在来訪者情報を特定し、
前記来訪者情報出力手段は、前記来訪者辞書のうち、前記来訪者特定手段が前記音声情報を認識することに成功した前記来訪者辞書に応じて、前記対応者への前記現在来訪者情報の通知内容を異ならせることを特徴とする請求項2〜7のいずれかに記載の来訪者受付装置。 - 単語辞書を用いて来訪者の発話の音声認識を行う来訪者受付方法であって、
現在の来訪者を検出する来訪者検出手段によって前記現在の来訪者が検出された後、音声入力手段から入力された前記現在の来訪者の発する音声の音声情報を取得する音声情報取得ステップと、
来訪者情報記憶手段に予め記憶された、予定された来訪者の身元に関する情報である来訪者記憶情報に基づく単語辞書である来訪者辞書を用いて、前記音声情報取得ステップで取得された前記音声情報を認識することにより、前記現在の来訪者の身元に関する情報である現在来訪者情報を特定する来訪者特定ステップと、
前記来訪者特定ステップで特定された前記現在来訪者情報を出力する来訪者情報出力ステップを備えたことを特徴とする来訪者受付方法。 - 請求項1〜9のいずれかに記載の来訪者受付装置の各種処理手段としてコンピュータを機能させるための来訪者受付プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008220920A JP2010054893A (ja) | 2008-08-29 | 2008-08-29 | 来訪者受付装置、来訪者受付方法、および来訪者受付プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008220920A JP2010054893A (ja) | 2008-08-29 | 2008-08-29 | 来訪者受付装置、来訪者受付方法、および来訪者受付プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010054893A true JP2010054893A (ja) | 2010-03-11 |
Family
ID=42070875
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008220920A Pending JP2010054893A (ja) | 2008-08-29 | 2008-08-29 | 来訪者受付装置、来訪者受付方法、および来訪者受付プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2010054893A (ja) |
-
2008
- 2008-08-29 JP JP2008220920A patent/JP2010054893A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9742912B2 (en) | Method and apparatus for predicting intent in IVR using natural language queries | |
JP4089148B2 (ja) | 通訳サービス方法および通訳サービス装置 | |
JP6084654B2 (ja) | 音声認識装置、音声認識システム、当該音声認識システムで使用される端末、および、話者識別モデルを生成するための方法 | |
JP6540414B2 (ja) | 音声処理装置および音声処理方法 | |
US8521525B2 (en) | Communication control apparatus, communication control method, and non-transitory computer-readable medium storing a communication control program for converting sound data into text data | |
EP2887229A2 (en) | Communication support apparatus, communication support method and computer program product | |
JP2001273283A (ja) | 言語を識別しかつ音声再生装置を制御する方法及び通信デバイス | |
JP2002023783A (ja) | 対話処理システム | |
JP2008225191A (ja) | 議事録作成方法、その装置及びそのプログラム | |
JP6980411B2 (ja) | 情報処理装置、対話処理方法、及び対話処理プログラム | |
US20130253932A1 (en) | Conversation supporting device, conversation supporting method and conversation supporting program | |
CN110266900B (zh) | 客户意图的识别方法、装置及客服系统 | |
CN106713111B (zh) | 一种添加好友的处理方法、终端及服务器 | |
CN111063355A (zh) | 会议记录的生成方法及记录终端 | |
JP2015156062A (ja) | 業務支援システム | |
CN112997207A (zh) | 报告自动生成系统 | |
JPWO2018043138A1 (ja) | 情報処理装置および情報処理方法、並びにプログラム | |
JP6457682B1 (ja) | 認証システム、認証方法、ならびに、プログラム | |
JP2010054897A (ja) | 音声認識装置、音声認識プログラム、受付装置および受付プログラム | |
JP2016184095A (ja) | 言語認識装置、言語認識方法及びプログラム | |
JP2019175052A (ja) | 介護行為推定システム | |
JP2010054893A (ja) | 来訪者受付装置、来訪者受付方法、および来訪者受付プログラム | |
JP7258686B2 (ja) | 情報処理システム、情報処理方法、及びプログラム | |
JP2009086207A (ja) | 議事録情報生成システム、議事録情報生成方法、及び議事録情報生成プログラム | |
CN111785280A (zh) | 身份认证方法和装置、存储介质和电子设备 |