JP2010054893A

JP2010054893A - 来訪者受付装置、来訪者受付方法、および来訪者受付プログラム

Info

Publication number: JP2010054893A
Application number: JP2008220920A
Authority: JP
Inventors: Masashi Takechi; 雅司武市
Original assignee: Brother Industries Ltd
Current assignee: Brother Industries Ltd
Priority date: 2008-08-29
Filing date: 2008-08-29
Publication date: 2010-03-11

Abstract

【課題】来訪者の発話を高精度に認識することができる来訪者受付装置、来訪者受付方法、および来訪者受付プログラムを提供する。
【解決手段】受付端末から、来訪者が検出された情報が入力されると、来訪予定者の会社名、名前および訪問予定日時を含む情報を記憶する来訪者予約データベースから、訪問予定日時が来訪者が検出された日時と所定の関係にある来訪者の会社名および名前が抽出され、来訪者辞書が作成される（Ｓ１）。来訪者の自己の身元に関する発話の音声データが入力されると（Ｓ４）、来訪者辞書を用いて発話の音声認識が行われ、来訪者の身元が特定される（Ｓ５）。特定された来訪者の身元に関する情報が担当者に通知され（Ｓ８）、担当者の指示に応じて、取次ぎ処理（Ｓ１２〜Ｓ１３）、または代理応対処理（Ｓ１４〜Ｓ１６）が行われる。
【選択図】図１２

Description

本発明は、来訪者受付装置、来訪者受付方法、および来訪者受付プログラムに関し、より具体的には、単語辞書を用いて音声認識を行う来訪者受付装置、来訪者受付方法、および来訪者受付プログラムに関する。

従来、単語辞書を用いた音声認識技術を利用して、ビルや会社の受付業務を自動化する自動受付装置が知られている。こういった自動受付装置の主な目的は、来訪者の身元に関する情報を、その応対を担当する担当者に通知し、取次ぎを行うことである。例えば、特許文献１に記載の自動受付装置は、来訪者の発話を認識し、来訪者や担当者等を決定し、対応手続に応じた必要な情報を伝達することができる。
特開平７−２３４６９４号公報

特許文献１に記載の自動受付装置等、従来の装置では、担当者を特定する場合、会社の社員全員の名前や所属を単語辞書に登録して利用することができる。この場合、社員数には限りがあることから、発話のバリエーションが絞られ、高精度な音声認識が可能である。一方、来訪者の身元を特定する場合には、単語辞書として、汎用の会社名辞書や名前辞書が利用されるため、辞書に登録される単語数が増大する。さらに、来訪者が自己の身元について発話する際には、会社名と名前の組合せとなるため、発話のバリエーションが膨大となり、音声認識の精度が低下して、来訪者の身元を正確に特定できない場合がある。

本発明は、上記問題点を解決するためになされたものであり、来訪者の発話を高精度に認識することができる来訪者受付装置、来訪者受付方法、および来訪者受付プログラムを提供することを目的とする。

上記目的を達成するために、請求項１に係る発明の来訪者受付装置は、単語辞書を用いて来訪者の発話の音声認識を行う来訪者受付装置であって、現在の来訪者を検出する来訪者検出手段によって前記現在の来訪者が検出された後、音声入力手段から入力された前記現在の来訪者の発する音声の音声情報を取得する音声情報取得手段と、来訪者情報記憶手段に予め記憶されている来訪予定者の身元に関する情報である来訪者記憶情報に基づく単語辞書を来訪者辞書として用いて、前記音声情報取得手段によって取得された前記音声情報を認識することにより、前記現在の来訪者の身元に関する情報である現在来訪者情報を特定する来訪者特定手段と、前記来訪者特定手段によって特定された前記現在来訪者情報を出力する来訪者情報出力手段を備えている。

請求項２に係る発明の来訪者受付装置では、請求項１に記載の発明の構成に加え、前記来訪者情報記憶手段は、来訪日時と対応付けて、前記来訪者記憶情報を記憶しており、前記来訪者情報記憶手段に記憶された前記来訪者記憶情報のうち、前記来訪者検出手段によって前記現在の来訪者が検出された日時である来訪者検出日時と所定の関係にある前記来訪日時に対応する前記来訪者記憶情報を抽出することにより、前記来訪者辞書を作成する来訪者辞書作成手段を備えている。

請求項３に係る発明の来訪者受付装置では、請求項２に記載の発明の構成に加え、前記来訪者辞書作成手段は、前記来訪者情報記憶手段に記憶された前記来訪者記憶情報のうち、対応する前記来訪日時が、前記来訪者検出日時と同日の日時である前記来訪者記憶情報を抽出することにより、前記来訪者辞書を作成する同日辞書作成手段を備えている。

請求項４に係る発明の来訪者受付装置では、請求項２または３に記載の発明の構成に加え、前記来訪者辞書作成手段は、前記来訪者情報記憶手段に記憶された前記来訪者記憶情報のうち、対応する前記来訪日時が、前記来訪者検出日時から前後所定時間以内の日時である前記来訪者記憶情報を抽出することにより、前記来訪者辞書を作成する所定時間辞書作成手段を備えている。

請求項５に係る発明の来訪者受付装置では、請求項２〜４のいずれかに記載の発明の構成に加え、前記来訪者辞書作成手段は、前記来訪者情報記憶手段に記憶された前記来訪者記憶情報のうち、対応する前記来訪日時が、前記来訪者検出日時から所定の日数分の過去に属する日時である前記来訪者記憶情報を抽出することにより、前記来訪者辞書を作成する過去履歴辞書作成手段を備えたことを特徴とする来訪者受付装置。

請求項６に係る発明の来訪者受付装置では、請求項２〜５のいずれかに記載の発明の構成に加え、前記来訪者辞書作成手段は、前記来訪者情報記憶手段に記憶された前記来訪者記憶情報のうち、対応する前記来訪日時が、前記来訪者検出日時と同じ日付、同じ曜日、または同じ時間帯である前記来訪者記憶情報を抽出することにより、前記来訪者辞書を作成するパターン辞書作成手段を備えている。

請求項７に係る発明の来訪者受付装置では、請求項２〜６のいずれかに記載の発明の構成に加え、前記来訪者辞書作成手段は、前記来訪予定者毎に、前記来訪者情報記憶手段に記憶された前記来訪者記憶情報に含まれる前記来訪者の氏名の少なくとも一部と所属の少なくとも一部とを抽出し、結合して１つの単語とすることにより、前記来訪者辞書を作成することを特徴とする。

請求項８に係る発明の来訪者受付装置は、請求項１〜７のいずれかに記載の発明の構成に加え、来訪者の対応者の候補に関する情報に基づく単語辞書である対応者候補辞書を用いて、前記音声情報取得手段によって取得された前記音声情報を認識することにより、前記現在の来訪者の対応者に関する情報である対応者情報を特定する対応者特定手段をさらに備え、前記来訪者情報出力手段は、前記対応者特定手段によって特定された前記対応者情報に対応する前記対応者に対して、前記現在来訪者情報の通知処理を行うことを特徴とする。

請求項９に係る発明の来訪者受付装置は、請求項２〜７のいずれかに記載の発明の構成に加え、来訪者の対応者の候補に関する情報に基づく単語辞書である対応者候補辞書を用いて、前記音声情報取得手段によって取得された前記音声情報を認識することにより、前記現在の来訪者の対応者に関する情報である対応者情報を特定する対応者特定手段をさらに備え、前記来訪者辞書作成手段は、複数の所定の関係に従って、前記来訪者辞書を作成し、前記来訪者特定手段は、前記来訪者辞書作成手段によって作成された前記来訪者辞書を用いて、前記音声情報取得手段によって取得された前記音声情報を認識することにより、前記現在来訪者情報を特定し、前記来訪者情報出力手段は、前記来訪者辞書のうち、前記来訪者特定手段が前記音声情報を認識することに成功した前記来訪者辞書に応じて、前記対応者への前記現在来訪者情報の通知内容を異ならせることを特徴とする。

請求項１０に係る発明の来訪者受付方法は、単語辞書を用いて来訪者の発話の音声認識を行う来訪者受付方法であって、現在の来訪者を検出する来訪者検出手段によって前記現在の来訪者が検出された後、音声入力手段から入力された前記現在の来訪者の発する音声の音声情報を取得する音声情報取得ステップと、来訪者情報記憶手段に予め記憶された、予定された来訪者の身元に関する情報である来訪者記憶情報に基づく単語辞書である来訪者辞書を用いて、前記音声情報取得ステップで取得された前記音声情報を認識することにより、前記現在の来訪者の身元に関する情報である現在来訪者情報を特定する来訪者特定ステップと、前記来訪者特定ステップで特定された前記現在来訪者情報を出力する来訪者情報出力ステップを備えている。

請求項１１に係る発明の来訪者受付プログラムは、請求項１〜９のいずれかに記載の来訪者受付装置の各種処理手段としてコンピュータを機能させることを特徴とする。

請求項１に係る発明の来訪者受付装置によれば、来訪者情報記憶手段に予め記憶されている来訪者記憶情報に基づいた単語辞書を用いて音声認識が行われる。したがって、人物の身元を表す単語に関する汎用の単語辞書を利用する場合に比べ、高精度な認識結果が得られ、現在の来訪者の身元に関する情報をより正確に特定することができる。

請求項２に係る発明の来訪者受付装置によれば、来訪者情報記憶手段に予め記憶されている来訪者記憶情報のうち、来訪者が検出された来訪者検出日時と所定の関係にある来訪日時に対応する前記来訪者記憶情報が抽出され、来訪者辞書が作成される。したがって、来訪日時が絞り込まれた来訪者辞書に基づいて音声認識が行われるため、請求項１に記載の発明の効果に加え、より高精度な認識結果を得ることができる。

請求項３に係る発明の来訪者受付装置によれば、来訪者情報記憶手段に予め記憶されている来訪者記憶情報のうち、来訪者検出日時と同日の来訪日時に対応する来訪者記憶情報が抽出され、来訪者辞書が作成される。現在の来訪者は、来訪日時が来訪者検出日時と同日に予定された来訪者である可能性が高い。したがって、同日の来訪者記憶情報によって来訪者辞書を作成することにより、請求項２に記載の発明の効果に加え、さらに高精度な認識結果を得ることができる。

請求項４に係る発明の来訪者受付装置によれば、来訪者情報記憶手段に予め記憶されている来訪者記憶情報のうち、来訪者検出日時から前後所定時間以内の来訪日時に対応する来訪者記憶情報が抽出され、来訪者辞書が作成される。現在の来訪者は、来訪日時が来訪者検出日時から前後所定時間以内（例えば、１時間以内）に予定された来訪予定者である可能性が非常に高い。したがって、このような時間帯の来訪者記憶情報によって来訪者辞書を作成することにより、請求項２または３に記載の発明の効果に加え、さらに高精度な認識結果を得ることができる。

請求項５に係る発明の来訪者受付装置によれば、来訪者情報記憶手段に予め記憶されている来訪者記憶情報のうち、来訪者検出から所定日数分の過去に属する来訪日時に対応する来訪者記憶情報が抽出され、来訪者辞書が作成される。過去数日間に来訪した人は、再来訪する可能性がある。したがって、過去の所定日数分の来訪者記憶情報によって来訪者辞書を作成することにより、請求項２〜４のいずれかに記載の発明の効果に加え、高精度な認識結果を得ることができる。

請求項６に係る来訪者受付装置によれば、来訪者情報記憶手段に予め記憶されている来訪者記憶情報のうち、来訪者検出日時と同じ日付、同じ曜日、または同じ時間帯にある来訪日時に対応する来訪者記憶情報が抽出され、来訪者辞書が作成される。来訪者は、所定の日付、所定の曜日、所定の時間帯のように、所定のパターンで定期的に再来訪する可能性がある。したがって、このようなパターンに従って来訪者辞書を作成することにより、請求項２〜５のいずれかに記載の発明の効果に加え、高精度な認識結果を得ることができる。

請求項７に係る発明の来訪者受付装置によれば、来訪予定者毎に、氏名と所属の少なくとも一部が１つの単語に結合され、来訪者辞書が作成される。現在の来訪者は、自己の身元について、氏名と所属の少なくとも一部をつなげて発話する場合が多い。したがって、氏名と所属の少なくとも一部を結合した単語に絞り込んで来訪者辞書を作成することにより、請求項２〜６のいずれかに記載の発明の効果に加え、来訪予定者の認識精度をさらに高めることができる。

請求項８に係る発明の来訪者受付装置によれば、現在の来訪者の発話から対応者が特定され、対応者に対して現在来訪者情報の通知処理が行われる。したがって、請求項１〜７のいずれかに記載の発明の効果に加え、対応者は適切な対応を行うことができる。

請求項９に係る発明の来訪者受付装置によれば、現在の来訪者の音声の認識に成功した単語辞書に応じて、担当者への通知内容が異なる。したがって、請求項２〜７のいずれかに記載の発明の効果に加え、通知を受けた担当者が、通知される現在来訪者情報がどの程度正確かを判断し、適切な対応をすることが容易となる。

請求項１０に係る発明の来訪者受付方法によれば、来訪者情報記憶手段に予め記憶されている来訪者記憶情報に基づいた単語辞書を用いて音声認識が行われる。したがって、人物の身元を表す単語に関する汎用の単語辞書を利用する場合に比べ、高精度な認識結果が得られ、現在の来訪者の身元に関する情報をより正確に特定することができる。

請求項１１に係る発明の来訪者受付プログラムは、請求項１〜９のいずれかに記載の来訪者受付装置の各種処理手段としてコンピュータを機能させることができる。したがって、請求項１〜９のいずれかに記載の発明の効果を奏することができる。

以下、本発明を具現化した実施の形態について、図面を参照して説明する。なお、参照する図面は、本発明が採用しうる技術的特徴を説明するために用いられるものであり、記載されている装置の構成、各種処理のフローチャートなどは、それのみに限定する趣旨ではなく、単なる説明例である。

まず、図１〜図１１を参照して、本実施形態に係る来訪者受付システム１の全体構成、ならびに、来訪者受付システム１の構成要素である受付端末２０および受付サーバ１０の構成について、順に説明する。

最初に、図１を参照して、来訪者受付システム１の全体構成の概略を説明する。図１は、来訪者受付システム１の概略構成を示すシステム構成図である。図１に示すように、来訪者受付システム１は、受付サーバ１０、受付端末２０、ＩＰ−ＰＢＸ（ＩｎｔｅｎｅｔＰｒｏｔｏｃｏｌＰｒｉｖａｔｅＢｒａｎｃｈｅＸｃｈａｎｇｅ）５０、およびＩＰ電話機６０を含み、これらはすべてＬＡＮ９に接続されている。来訪者受付システム１は、例えば、ビルや会社に設置され、来訪者に対する受付業務を行うシステムである。本実施形態では、来訪者受付システム１は、会社５に設置されているものとして説明する。図１では、ＩＰ電話機６０は１つしか図示されていないが、実際には、例えば、会社５の従業員の数に応じて、複数が存在してもよい。

受付サーバ１０は、例えば、周知のパーソナルコンピュータであり、汎用型の装置である。受付端末２０は、例えば、会社５の入口ドア付近に設置されるインターホン型の端末装置である。ＩＰ−ＰＢＸ５０は、ＬＡＮ９に接続されたＩＰ電話機６０の回線交換を行う周知の交換装置である。

ここで、本実施形態の来訪者受付システム１全体で行われる処理の手順について、簡単に説明する。まず、会社５への来訪者が、入口付近に設けられた受付端末２０の操作ボタン２０９（図２参照）を押下げると、受付サーバ１０では、来訪者が検出されたと認識して、処理が開始される。受付サーバ１０から送信された音声データに基づき、受付端末２０から来訪者の身元に関する質問が発せられると、来訪者は受付端末２０に対して自己の身元を名乗る。すると、来訪者の音声データがＬＡＮ９を介して受付サーバ１０に送信され、音声認識処理が行われる。

受付サーバ１０は、認識結果に応じて、会社５の来訪者の応対担当者（以下、単に担当者という）が使用するＩＰ電話機６０にＩＰ−ＰＢＸ５０を介して接続し、担当者への通知処理を行う。担当者は、通知された来訪者の身元に関する情報に応じて、受付サーバ１０に対して応対を指示する。受付サーバ１０は、指示に応じて、来訪者と担当者とが会話できるように受付端末２０とＩＰ電話機６０を接続させたり、担当者の代理で来訪者に応対したりする。このように、受付サーバ１０は、会社５における受付業務を自動的に行うことができる。なお、ここまでで簡単に説明した処理については、後で詳述する。

次に、図２を参照して、受付端末２０の構成について説明する。図２は、受付端末２０の電気的構成を示すブロック図である。図２に示すように、受付端末２０は、ＣＰＵ２０１と、ＣＰＵ２０１に各々接続されたＲＯＭ２０２およびＲＡＭ２０３を含む制御回路部２００を備えている。ＣＰＵ２０１には、入出力（Ｉ／Ｏ）インタフェイス２０４が接続されている。Ｉ／Ｏインタフェイス２０４には、ハードディスク装置（ＨＤＤ）２０５、ディスプレイ２０６、マイク２０７、スピーカ２０８、操作ボタン２０９、およびネットワーク（ＮＷ）カード２１０が接続されている。

ＣＰＵ２０１は、受付端末２０全体の制御を司る。ＲＯＭ２０２は、受付端末２０の基本的な動作に必要なプログラムやそのための設定値を記憶している。ＣＰＵ２０１は、ＲＯＭ２０２や、ＨＤＤ２０５に記憶されたプログラムに従って、受付端末２０の動作を制御する。ＲＡＭ２０３は、各種データを一時的に記憶するための記憶装置である。記憶装置であるＨＤＤ２０５には、例えば、受付端末２０の各種動作を制御するための複数のプログラムが記憶されている。記憶されているプログラムとして、例えば、受付端末２０の基本的な動作を制御するシステムプログラム、受付サーバ１０との通信を制御する通信プログラム、ディスプレイ２０６に表示する画像を生成する描画プログラム等がある。

ディスプレイ２０６には、例えば、描画プログラムによって生成された、受付業務を行っている想定の人物やキャラクタの画像と、スピーカ２０８から発話される音声に対応する文章とが表示される。マイク２０７は、入力された来訪者の音声を、音声データに変換して出力する機器である。スピーカ２０８は、受付サーバ１０から入力された音声データを、音声に変換して出力する機器である。操作ボタン２０９は、来訪者が、受付端末２０で自己の来訪を告げ、受付処理を開始させる指示を入力するための機器である。ＮＷカード２１０は、ＬＡＮ９に接続し、受付サーバ１０との間でデータの送受信を可能とするための拡張カードである。本実施形態では、操作ボタン２０９は、本発明の「来訪者検出手段」に相当し、マイク２０７は、「音声入力手段」に相当する。

次に、図３〜図１１を参照して、受付サーバ１０の構成について説明する。図３は、受付サーバ１０の電気的構成を示すブロック図である。図４は、来訪者予約データベース１５１０の説明図である。図５は、言語モデル記憶エリア１５２に記憶された言語モデル１５２１の説明図である。図６は、単語辞書１５３１の説明図である。図７は、訪問日時辞書１５４１の説明図である。図８は、訪問日辞書１５４２の説明図である。図９は、訪問パターン辞書１５４３の説明図である。図１０は、訪問履歴辞書１５４４の説明図である。図１１は、社員データベース１５５１の説明図である。

図３に示すように、受付サーバ１０は、ＣＰＵ１０１と、ＣＰＵ１０１に各々接続されたＲＯＭ１０２およびＲＡＭ１０３を備えている。ＣＰＵ１０１には、その他、入出力（Ｉ／Ｏ）インタフェイス１０４が接続されている。Ｉ／Ｏインタフェイス１０４には、マウスコントローラ１０６、キーコントローラ１０７、ビデオコントローラ１０８、通信装置１０９、およびハードディスク装置（ＨＤＤ）１５０が接続されている。

ＣＰＵ１０１は、受付サーバ１０の全体の制御を司る。ＲＯＭ１０２は、ＢＩＯＳを含む、受付サーバ１０を動作させるための各種のプログラムを記憶している。ＣＰＵ１０１は、ＲＯＭ１０２や、後述するＨＤＤ１５０に記憶されたプログラムに従って、受付サーバ１０の動作を制御する。ＲＡＭ１０３は、各種データを一時的に記憶するための記憶装置である。マウスコントローラ１０６、キーコントローラ１０７、およびビデオコントローラ１０８には、それぞれマウス１１６、キーボード１１７およびディスプレイ１１８が接続されている。通信装置１０９は、ＬＡＮ９に接続し、受付端末２０等、外部機器との間でデータの送受信を行うことを可能とする装置である。

図３に示すように、ＨＤＤ１５０は、来訪者予約データベース（ＤＢ）記憶エリア１５１、言語モデル記憶エリア１５２、単語辞書記憶エリア１５３、来訪者辞書記憶エリア１５４、社員データベース（ＤＢ）記憶エリア１５５、およびプログラム記憶エリア１５６を含む複数の記憶エリアを備えている。

来訪者予約ＤＢ記憶エリア１５１には、予定された来訪者（以下、単に来訪予定者という）に関する情報である来訪者予約情報を格納する来訪者予約ＤＢ１５１０（図４参照）が記憶されている。来訪者予約情報は、来訪予定者の訪問予定が決まった時点で、来訪予定者１名毎に作成されるものであり、例えば、図４に示すように、来訪者会社名、来訪者会社名ヨミ、来訪者名、来訪者名ヨミ、訪問予定日時、担当者名、担当者名ヨミ、および担当者電話番号（ＴＥＬ）を含む。これらのうち、来訪者会社名、来訪者会社名ヨミ、来訪者名、および来訪者名ヨミは、それぞれ、来訪予定者の身元に関する情報である。

来訪者会社名は、来訪予定者が所属する会社や団体の名前であり、平仮名、片仮名、漢字、アルファベット等による通常の表記で記憶されている。なお、来訪者会社名としては、図４に示すように、必ずしも会社等の正式な名称ではなく、通常、身元を名乗る際に用いられる名前（通称）が記憶されていてもよい。例えば「株式会社Ｂ運送」について、「株式会社」を省略した「Ｂ運送」のみを、来訪者会社名として記憶しておくことができる。来訪者会社名ヨミは、来訪者会社名の読み方、すなわち発音であり、片仮名で記憶されている。

来訪者名は、来訪予定者の名前であり、平仮名、片仮名、漢字、アルファベット等による通常の表記で記憶されている。なお、通常、来訪者は、他社の訪問時に身元を名乗る際、フルネームではなく苗字のみを使用することが多い。よって、来訪者名としては、図４に示すように、苗字のみが記憶されていてもよい。来訪者名ヨミは、来訪者名の読み方、すなわち発音であり、片仮名で記憶されている。

訪問予定日時は、来訪予定者の訪問が予定されている日時である。担当者名は、来訪予定者の応対を担当する担当者の名前であり、平仮名、片仮名、漢字、アルファベット等による通常の表記で記憶されている。なお、通常、来訪者は、他社の訪問時に担当者を通知する際、フルネームではなく苗字のみを使用することが多い。よって、図４に示すように、担当者名として、来訪者名と同様、苗字のみが記憶されていてもよい。担当者名ヨミは、担当者名の読み方、すなわち発音であり、片仮名で記憶されている。担当者ＴＥＬは、担当者が使用するＩＰ電話機６０の電話番号である。なお、図４に示す例以外に、会社等の正式名称、来訪者名および担当者のフルネーム等が記憶されていてもよい。来訪者予約ＤＢ記憶エリア１５１は、本発明の「来訪者情報記憶手段」に相当する。

言語モデル記憶エリア１５２（図３参照）には、来訪者による発話の認識に使用される言語モデルが記憶されている。言語モデルは、単語のつながり、すなわち単語間の結びつきに関する制約を定義するものである。代表的な言語モデルとして、例えば、単語間の結びつきを文法（グラマー）で記述する記述文法モデルと、単語間の結びつきを確率で定義する統計モデル（例えば、単語Ｎ−ｇｒａｍ）がある。

これらの代表的な言語モデルのうち、記述文法モデルは、想定される文のパターンを、受理可能な文のパターンとして、予め人手で記述して定義するものである。したがって、記述される受理可能な文のパターンの数には限りがあるが、発話が、定義された文のパターンに対応していれば、高精度な音声認識が可能である。本実施形態では、会社５を訪問してきた人物の発話という、比較的限られた状況での発話について音声認識が行われるため、言語モデルとして記述文法モデルを採用している。しかしながら、言語モデルは必ずしも記述文法モデルである必要はなく、統計モデルを使用してもよい。

言語モデル記憶エリア１５２（図３参照）には、受付端末２０と来訪者との対話で想定される様々な場面に応じて予め作成された受理可能な文のパターンが、言語モデルとして記憶されている。例えば、図５に示す言語モデル１５２１は、来訪者の身元に関する質問に対する応答として受理可能な文のパターンを示すものである。文のパターンは、例えば、文を構成する単語が属するカテゴリを順に並べることによって定義することができる。図５の言語モデル１５２１では、カテゴリ「会社名と名前」に属する単語およびカテゴリ「名乗り」に属する単語が順に連結された文、ならびに、カテゴリ「会社名と名前」に属する単語だけで構成された文の２種類が、受理可能な文として定義されている。

なお、図５には、来訪者の身元に関する質問に対する応答に対応する言語モデル１５２１のみが例示されているが、言語モデル記憶エリア１５２には、他にも、例えば、担当者名に関する質問に対する応答の場面等、様々な場面に対応して予め作成された複数の言語モデルが記憶されている。

単語辞書記憶エリア１５３（図３参照）には、言語モデルとともに音声認識に使用される単語辞書１５３１（図６参照）が記憶されている。図６に示すように、単語辞書１５３１は、予め設定されたカテゴリ毎に、そのカテゴリに属する単語と、各単語の発音に関する情報とを記述するものである。図６は、カテゴリ「名乗り」に対応する単語辞書の例を示している。なお、図６では、表記を簡略化するため、発音に関する情報として片仮名が使用されているが、実際には、単語辞書では音素列として記憶されている。例えば、単語「です」に対応する発音は、図６では片仮名で「デス」と記載されているが、実際には「ｄｅｓｕ」と記憶されている。

また、図示は省略するが、単語辞書記憶エリア１５３には、「名乗り」のみでなく、他の様々なカテゴリについても同様に、単語と発音に関する情報の対応が記憶されている。ただし、前述したカテゴリ「会社名と名前」については、別途、後述する来訪者辞書が来訪者受付処理の過程で生成されるため、単語辞書記憶エリア１５３に記憶しておかなくてよい。

来訪者辞書記憶エリア１５４（図３参照）には、前述の言語モデルおよび単語辞書とともに、来訪者の身元を特定するための音声認識に使用される来訪者辞書１５４１〜１５４４が記憶されている。本実施形態では、図７に示す訪問日時辞書１５４１、図８に示す訪問日辞書１５４２、図９に示す訪問パターン辞書１５４３、および図１０に示す訪問履歴辞書１５４４の４種類の来訪者辞書が記憶されている。これらの来訪者辞書１５４１〜１５４４は、いずれも、カテゴリ「会社名と名前」に属する単語と、各単語の発音に関する情報とを記述するものであり、来訪者予約ＤＢ１５１０（図４参照）に記憶された来訪者予約情報に基づいて作成される。なお、単語辞書１５３１と同様、図７〜図１０では、表記を簡略化するため、発音に関する情報として片仮名が使用されているが、実際には、来訪者辞書１５４１〜１５４４では音素列として記憶されている。

図７に示す訪問日時辞書１５４１は、受付端末２０の操作ボタン２０９が来訪者によって操作され、その情報が受付サーバ１０に受け付けられた場合に、その時の時刻を基準として作成される来訪者辞書である。例えば、本実施形態の訪問日時辞書１５４１は、来訪者の訪問が受け付けられた日時の前後１時間以内を訪問予定日時とする来訪者予約情報に基づいて作成されている。

図８に示す訪問日辞書１５４２は、その日最初に受付端末２０の操作ボタン２０９が来訪者によって操作され、その情報が受付サーバ１０に受け付けられた場合に、日付を基準として作成される来訪者辞書である。より具体的には、訪問日辞書１５４２は、来訪者の訪問が受け付けられた日時と同日の日時を訪問予定日時とする来訪者予約情報に基づいて作成される。

図９に示す訪問パターン辞書１５４３は、その日最初に受付端末２０の操作ボタン２０９が来訪者によって操作され、その情報が受付サーバ１０に受け付けられた場合に、所定の規則（パターン）に基づいて作成される来訪者辞書である。より具体的には、訪問パターン辞書１５４３は、訪問予定日時が来訪者の訪問が受け付けられた日時と規則的な関係にある来訪者予約情報に基づいて作成される。規則的な関係にある訪問予定日時とは、例えば、同じ曜日、同じ日付、同じ時間帯である。

本実施形態では、訪問パターン辞書１５４３は、過去１ヶ月以内の同じ曜日の日時を訪問予定日時とする来訪者予約情報に基づいて作成される。訪問パターン辞書１５４３には、他の来訪者辞書１５４１、１５４２、１５４４とは異なり、カテゴリ「会社名と名前」に属する単語と、各単語の発音に関する情報とともに、訪問パターンに関する情報であるパターン名が記憶されている。本実施形態では、曜日をパターンに用いているため、曜日を特定する情報がパターン名として記憶される。

図１０に示す訪問履歴辞書１５４４は、その日最初に受付端末２０の操作ボタン２０９が来訪者によって操作され、その情報が受付サーバ１０に受け付けられた場合に、過去の来訪者に関する情報に基づいて作成される来訪者辞書である。より具体的には、訪問履歴辞書１５４４は、過去１ヶ月以内の日時を訪問予定日時とする来訪者予約情報に基づいて作成される。なお、来訪者辞書１５４１〜１５４４の作成については、後で詳述する。

社員ＤＢ記憶エリア１５５（図３参照）には、会社５の社員全員の個人情報（以下、社員情報という）を格納する社員ＤＢ１５５１（図１１参照）が記憶されている。社員情報は、社員１名毎に作成されるものであり、例えば、図１１に示すように、氏名、苗字、発音に関する情報、および電話番号を含む。これらの項目のうち、苗字および発音に関する情報のデータについては、後述する担当者名の音声認識処理において、カテゴリ「担当者名」に属する単語の単語辞書として使用される。図１１では、表記を簡略化するため、発音に関する情報として片仮名が使用されているが、実際には、音素列が記憶されている。なお、社員情報には、図１１に示す以外に、各社員を識別する社員コードや、所属する部署等の情報が含まれていてもよい。社員ＤＢ１５５１の苗字および対応する発音に関する情報は、本発明の「対応者候補辞書」に相当する。

プログラム記憶エリア１５６（図３参照）には、後述する来訪者受付処理（図１２参照）に使用されるプログラム群、システムプログラム、通信プログラム等、各種処理を受付サーバ１０に実行させるための各種プログラムが記憶されている。なお、これらのプログラムは、例えばＣＤ−ＲＯＭに記憶されたものがＣＤ−ＲＯＭドライブ（図示外）を介してインストールされ、プログラム記憶エリア１５６に記憶される。または、ＬＡＮ９を介してインターネット（図示外）に接続し、インターネット上からダウンロードされたプログラムが記憶されてもよい。

図示はされていないが、ＨＤＤ１５０には、その他、音声認識処理で一般的に使用される周知の音響モデルや、各種処理で使用される設定値等も記憶されている。なお、詳細は説明しないが、音響モデルは、音声の音響的特徴を統計的にモデル化したもので、例えば、母音、子音のそれぞれについて、音響的特徴（例えば、周波数特性）と対応する音素とで表現されている。

以下に、前述のように構成された受付サーバ１０において行われる各種処理について、図１２〜図１５を参照して説明する。図１２は、来訪者受付処理のフローチャートである。図１３は、来訪者受付処理中に実行される来訪者辞書準備処理のフローチャートである。図１４は、来訪者受付処理中に実行される身元特定処理のフローチャートである。図１５は、来訪者受付処理中に実行される来訪者通知処理のフローチャートである。図１２〜図１５の処理は、ＨＤＤ１５０のプログラム記憶エリア１５６に記憶された来訪者受付処理用のプログラム群（例えば、音声認識プログラム、音声合成プログラム、対話制御プログラム）に従って、ＣＰＵ１０１が実行する。

来訪者が、会社５の入口付近に設置された受付端末２０で操作ボタン２０９を押下げると、その情報は、ＬＡＮ９を介して受付サーバ１０に送信される。図１２に示す来訪者受付処理は、操作ボタン２０９の押下げを示す情報が受付サーバ１０で受信されると開始される。処理が開始されるとまず、来訪者辞書準備処理が行われる（Ｓ１、図１３）。来訪者辞書準備処理は、来訪者の発話を認識して身元を特定するために使用される、来訪者辞書１５４１〜１５４４（図７〜図１０参照）を準備する処理である。

図１３に示す来訪者辞書準備処理が開始されると、まず、受付サーバ１０の内蔵時計で管理されている現在の日時が、来訪者が検出された時間として、ＲＡＭ１０３に取得される（Ｓ１０１）。続いて、来訪者辞書１５４１〜１５４４（図７〜図１０参照）の順に、辞書がまだ作成されていなければ作成する処理が行われる。なお、以下では、来訪者予約ＤＢ１５１０には、図４に具体的な内容が記載されている８件の来訪者予約情報のみが記憶されており、現在の日時として、２００８年５月１２日１１：００が取得された場合を例として説明する。

まず、訪問日時辞書１５４１（図７参照）を作成するために、来訪者予約ＤＢ１５１０（図４参照）から、訪問予定日時がステップＳ１０１で取得された現在日時の前後１時間以内にある来訪者予約情報が抽出され、ＲＡＭ１０３の所定の記憶エリアに記憶される（Ｓ１０２）。前述の例では、訪問予定日時が、現在日時の１時間前の２００８年５月１２日１０：００から１時間後の２００８年５月１２日１２：００までの間にある来訪者予定情報が取得される。よって、図４に示す、訪問予定日時が２００８年５月１２日１０：３０の永光氏、２００８年５月１２日１１：００の利岡氏、および２００８年５月１２日１１：３０の木和田氏の、３件の来訪者予約情報が取得されることになる。

続いて、取得された来訪者予約情報に基づいて、訪問日時辞書１５４１が作成される（Ｓ１０３）。具体的には、各来訪者予約情報に含まれる、来訪者会社名および来訪者名が結合されることにより、カテゴリ「会社名と名前」に属する１つの単語が作成される。例えば、訪問予定日時が２００８年５月１２日１０：３０の永光氏の来訪者予約情報からは、「Ａ工業の永光」という単語が作成される。また、各来訪者予約情報に含まれる、来訪者会社名ヨミおよび来訪者名ヨミがそれぞれ音素列に変換され、結合されることにより、来訪者会社名および来訪者名が結合された単語に対応する発音に関する情報が作成される。

来訪者会社名ヨミおよび来訪者名ヨミから音素列への変換は、例えば、片仮名と音素との対応表を予め作成してＨＤＤ１５０の所定の記憶エリア（図示外）に記憶させておき、この対応表を使用して行えばよい。例えば、訪問予定日時が２００８年５月１２日１０：３０の永光氏の来訪者予約情報からは、「エーコーギョウノナガミツ（実際には音素列）」が作成される。

このようにして、来訪者会社名および来訪者名が結合された単語と音素列とが対応づけられることにより訪問日時辞書１５４１が作成され、来訪者辞書記憶エリア１５４に記憶される。前述の例では、ステップＳ１０３において、訪問予定日時が２００８年５月１２日１０：３０の永光氏、２００８年５月１２日１１：００の利岡氏、および２００８年５月１２日１１：３０の渡辺氏の３件の来訪者予約情報に基づいて、図７に示す訪問日時辞書１５４１が作成されることになる。

続いて、訪問日辞書１５４２（図８参照）がすでに作成されているか否かが判断される（Ｓ１０５）。訪問日辞書は、訪問予定日時がステップＳ１０１で取得された現在日時と同日に属する来訪者予約情報に基づいて作成されるものであるため、１日に一度作成されればよいからである。よって、来訪者辞書記憶エリア１５４に訪問日辞書１５４２が記憶されていれば、すでに作成済みと判断され（Ｓ１０５：ＹＥＳ）、処理はそのままステップＳ１１０に進む。

一方、来訪者辞書記憶エリア１５４に訪問日辞書１５４２が記憶されておらず、まだ作成されていないと判断された場合には（Ｓ１０５：ＮＯ）、来訪者予約ＤＢ１５１０（図４参照）から、現在日時と同日の訪問予定日時を含む来訪者予約情報が抽出され、ＲＡＭ１０３の所定の記憶エリアに記憶される（Ｓ１０６）。前述の例では、訪問予定日時が２００８年５月１２日１０：３０の永光氏、２００８年５月１２日１１：００の利岡氏、２００８年５月１２日１１：３０の木和田氏、および２００８年５月１２日１３：００の豊倉氏の、４件の来訪者予約情報が取得されることになる。

前述のステップＳ１０３と同様にして、取得された来訪者予約情報に基づいて、来訪者会社名および来訪者名が結合され、対応する音素列が作成されて互いに対応づけられることにより訪問日辞書１５４２が作成され、来訪者辞書記憶エリア１５４に記憶される（Ｓ１０７）。その後、処理はステップＳ１１０へ進む。前述の例では、ステップＳ１０７では、ステップＳ１０６で取得された４件の来訪者予約情報に基づいて、図８に示す訪問日辞書１５４２が作成されることになる。

ステップＳ１１０では、訪問パターン辞書１５４３（図９参照）がすでに作成されているか否かが判断される（Ｓ１１０）。訪問パターン辞書は、本実施形態では、訪問予定日時がステップＳ１０１で取得された現在日時から過去１ヶ月以内にあり、且つ、同じ曜日である来訪者予約情報に基づいて作成されるものであるため、１日に一度作成されればよいからである。よって、来訪者辞書記憶エリア１５４に訪問パターン辞書１５４３が記憶されていれば、すでに作成済みと判断され（Ｓ１１０：ＹＥＳ）、処理はそのままステップＳ１１５に進む。

一方、来訪者辞書記憶エリア１５４に訪問パターン辞書１５４３が記憶されておらず、まだ作成されていないと判断された場合には（Ｓ１１０：ＮＯ）、来訪者予約ＤＢ１５１０（図４参照）から、現在の日付と同じ曜日で過去１ヶ月以内の訪問予定日時を含む来訪者予約情報が抽出され、ＲＡＭ１０３の所定の記憶エリアに記憶される（Ｓ１１１）。前述の例では、現在の日付２００８年５月１２日は月曜日であると特定され、訪問予定日時が過去１ヶ月以内の月曜日である、２００８年４月２８日１１：００の囲氏、２００８年４月２８日１５：００の利岡氏、２００８年５月５日１１：００の囲氏の、３件の来訪者予約情報が取得されることになる。

前述のステップＳ１０３と同様にして、取得された来訪者予約情報に基づいて、来訪者会社名および来訪者名が結合され、対応する音素列が作成されて互いに対応付けられることにより訪問パターン辞書１５４３が作成され、来訪者辞書記憶エリア１５４に記憶される（Ｓ１１２）。なお、前述の囲氏の例のように、来訪者会社名および来訪者名が重複する来訪者予約情報がある場合は、重複して登録する必要はない。また、訪問パターン、すなわち、特定された曜日に関する情報も、パターン名として訪問パターン辞書１５４３に記憶される（Ｓ１１２）。その後、処理はステップＳ１１５へ進む。

前述の例では、ステップＳ１１２では、ステップＳ１１１で取得された３件の来訪者予約情報に基づいて、図９に示す訪問パターン辞書１５４３が作成されることになる。つまり、来訪者会社名および来訪者名が結合された単語、音素列、ならびに特定された曜日が、単語、発音、およびパターン名を１組とする情報として訪問パターン辞書１５４３が作成される。

ステップＳ１１５では、訪問履歴辞書１５４４（図１０参照）がすでに作成されているか否かが判断される（Ｓ１１５）。訪問履歴辞書は、本実施形態では、訪問予定日時が、現在の日付から過去１ヶ月以内の来訪者予約情報に基づいて作成されるものであるため、１日に一度作成されればよいからである。よって、来訪者辞書記憶エリア１５４に訪問履歴辞書１５４４が記憶されていれば、すでに作成済みと判断され（Ｓ１１５：ＹＥＳ）、図１３に示す来訪者辞書準備処理は終了し、図１２の来訪者受付処理に戻る。

一方、来訪者辞書記憶エリア１５４に訪問履歴辞書１５４４が記憶されておらず、まだ作成されていないと判断された場合には（Ｓ１１５：ＮＯ）、来訪者予約ＤＢ１５１０（図４参照）から、現在の日付から過去１ヶ月以内の訪問予定日時を含む来訪者予約情報が抽出され、ＲＡＭ１０３の所定の記憶エリアに記憶される（Ｓ１１６）。前述の例では、訪問予定日時が、現在の日付２００８年５月１２日から過去１ヶ月以内にある、図４に示す８件の来訪者予約情報がすべて取得されることになる。

前述のステップＳ１０３と同様にして、取得された来訪者予約情報に基づいて、来訪者会社名および来訪者名が結合され、対応する音素列が作成されて互いに対応づけられることにより訪問履歴辞書１５４４が作成され、来訪者辞書記憶エリア１５４に記憶される（Ｓ１１７）。前述の例では、ステップＳ１１７では、ステップＳ１１６で取得された８件の来訪者予約情報に基づいて、図１０に示す訪問履歴辞書１５４４が作成されることになる。なお、前述したように、来訪者会社名および来訪者名が重複する来訪者予約情報がある場合は、重複して登録する必要はない。来訪者辞書１５４１〜１５４４すべてについて、処理が完了したため、図１３に示す来訪者辞書準備処理は終了し、図１２の来訪者受付処理に戻る。

図１２の来訪者受付処理において、来訪者辞書準備処理が終了した後（Ｓ１）、来訪者に対する最初の挨拶（例えば、「会社５へようこそ。」）の音声データが、受付端末２０に出力される（Ｓ２）。より具体的には、来訪者との対話を想定したシナリオに沿って予め作成され、ＨＤＤ１５０の所定の記憶エリア（図示外）に記憶されている挨拶の文面のテキストデータが読み出され、音声データに変換された後、通信装置１０９およびＬＡＮ９を介して受付端末２０に出力される。なお、音声データを受信した受付端末２０では、音声データがスピーカ２０８で音声に変換されて出力される。

続いて、前述したのと同様に、ＨＤＤ１５０から読み出された来訪者の身元に関する質問の音声データが、受付端末２０に出力される（Ｓ３）。本実施形態では、例えば、「御用の方は、会社名とお名前をどうぞ。」というように、来訪者の会社名と名前とを質問する音声の音声データが送信される。そして、受付端末２０では、この質問がスピーカ２０８から音声出力される。

受付端末２０に対して、来訪者が身元に関する質問に回答すると、マイク２０７から入力された音声が音声データに変換され、受付サーバ１０に送信される。音声データは、受付端末２０からＬＡＮ９を介して受付サーバ１０に入力され、ＲＡＭ１０３の所定の記憶エリアに記憶される（Ｓ４）。続いて、身元特定処理が行われる（Ｓ５、図１４）。身元特定処理は、入力された音声データをテキストに変換する音声認識を行って、来訪者の身元を特定する処理である。

図１４に示す身元特定処理が開始されると、まず、この場面で音声認識に使用される音響モデル、言語モデルおよび辞書が、ＨＤＤ１５０の所定の記憶エリアからそれぞれ読み出される（Ｓ５０１）。具体的には、音響モデルが、ＨＤＤ１５０の所定の記憶エリア（図示外）から読み出される。図５に示す、来訪者の身元に関する質問への応答に対応する言語モデル１５２１が、言語モデル記憶エリア１５２から読み出される。言語モデル１５２１に含まれるカテゴリ「会社名と名前」に対応する辞書である、来訪者辞書準備処理（Ｓ１）で作成された来訪者辞書１５４１〜１５４４（図７〜図１０参照）が、来訪者辞書記憶エリア１５４から読み出される。また、カテゴリ「名乗り」に対応する辞書である単語辞書１５３１（図５参照）が、単語辞書記憶エリア１５３から読み出される。

ＲＡＭ１０３の所定の記憶エリアに記憶されている発話回数カウンタのカウンタ値Ｎが、０にセットされる（Ｓ５０２）。発話回数カウンタは、来訪者による自己の身元に関する回答の音声データを何回受け付けたかをカウントするものである。

続いて、音響モデル、言語モデル１５２１、来訪者辞書１５４１〜１５４４、および単語辞書１５３１を用いて、音声認識が行われる（Ｓ５０３）。より具体的には、例えば、ステップＳ４で受付端末２０から入力された来訪者の音声データを分析し、特徴量を抽出した後、音響モデルと言語モデル１５２１とのマッチングが行われる。その結果、言語モデル１５２１で受理可能な文毎に尤度が求まり、尤度が最も高い文が認識結果として得られる。言語モデル１５２１は単語辞書として来訪者辞書１５４１〜１５４４の各々と単語辞書１５３１を参照する。来訪者辞書１５４１〜１５４４は４種類あるため、言語モデル１５２１による認識が４通り行われる。認識に成功すれば、それぞれの辞書に対応した認識結果（テキスト）が得られることになる。なお、尤度が既定の閾値以下の値になった場合は、認識失敗として認識結果は得られない。

例えば、来訪者が、受付端末２０からの質問に対して「Ａ工業の永光です。」と応じたとする。受付サーバ１０に入力された音声データを分析し、特徴量を抽出した後、音響モデルと４種類の来訪者辞書１５４１〜１５４４を参照する言語モデル１５２１とのマッチングを行う。その結果、「エーコウギョウノナガミツ」を含む来訪者辞書１５４１、１５４２および１５４４を参照する言語モデル１５２１では、「エーコウギョウノナガミツ」の尤度が最も高くなり、認識結果として「Ａ工業の永光」が得られる。「エーコウギョウノナガミツ」を含まない来訪者辞書１５４３を参照する言語モデル１５２１では、言語モデル１５２１で受理可能なすべての文で尤度が閾値以下となり、認識結果は得られない。

続いて、訪問日時辞書１５４１（図７参照）、訪問日辞書１５４２（図８参照）、訪問パターン辞書１５４３（図９参照）、および訪問履歴辞書１５４４（図１０参照）の順に、各辞書を使用した認識結果が存在するか否かが判断される（Ｓ５０４〜Ｓ５０７）。

前述したように、訪問日時辞書１５４１には、受付端末２０で操作ボタン２０９が押下げられ、来訪者が検出された時刻の前後１時間の来訪予定者の会社名と名前が登録されている。訪問日辞書１５４２には、同日中の来訪予定者の会社名と名前が登録されている。訪問パターン辞書１５４３には、過去１ヶ月以内で同じ曜日の来訪予定者の会社名と名前が登録されている。訪問履歴辞書１５４４には、過去１ヶ月以内の来訪予定者の会社名と名前が登録されている。つまり、訪問日時辞書１５４１、訪問日辞書１５４２、訪問パターン辞書１５４３、訪問履歴辞書１５４４の順に、訪問予定日時の範囲が広くとられている。

現在の来訪者は、訪問予定日時が現在の前後１時間である来訪予定者である可能性が最も高く、その次に、同日の来訪予定者である可能性が高い。また、いずれにも該当しない場合には、所定のパターンで定期的に来訪する人物、または過去の一定期間内に来訪したことがある人物である可能性がある。したがって、訪問予定日時をより絞り込んで作成された辞書を用いた認識結果ほど、現在の来訪者の身元をより正確に特定する情報として信頼性が高いと考えられる。

そこで、本実施形態では、訪問日時辞書１５４１、訪問日辞書１５４２、訪問パターン辞書１５４３、訪問履歴辞書１５４４の順番で、来訪者辞書１５４１〜１５４４による認識結果を採用する。具体的には、まず、訪問日時辞書１５４１による認識結果が存在する場合には（Ｓ５０４：ＹＥＳ）、ＲＡＭ１０３の所定の記憶エリアに、認識辞書名として「訪問日時辞書」が記憶される（Ｓ５１１）。また、ＲＡＭ１０３の所定の記憶エリアに、認識結果として「会社名と名前（例えば、Ａ工業の永光）」が記憶される（Ｓ５１２）。その後、図１４に示す身元特定処理は終了し、図１２の来訪者受付処理に戻る。

訪問日時辞書１５４１による認識結果が存在しない場合には（Ｓ５０４：ＮＯ）、訪問日辞書１５４２による認識結果が存在するか否かが判断される（Ｓ５０５）。訪問日辞書１５４２による認識結果が存在する場合には（Ｓ５０５：ＹＥＳ）、ＲＡＭ１０３の所定の記憶エリアに、認識辞書名として「訪問日辞書」が（Ｓ５１１）、認識結果として、ステップＳ５０３で得られたテキストに含まれる「会社名と名前」が（Ｓ５１２）、それぞれ記憶される。その後、図１４に示す身元特定処理は終了し、図１２の来訪者受付処理に戻る。

訪問日辞書１５４２による認識結果が存在しない場合には（Ｓ５０５：ＮＯ）、訪問パターン辞書１５４３による認識結果が存在するか否かが判断される（Ｓ５０６）。訪問パターン辞書１５４３による認識結果が存在する場合には（Ｓ５０６：ＹＥＳ）、ＲＡＭ１０３の所定の記憶エリアに、パターン名として、訪問パターン辞書１５４３に記憶されている「パターン名」が記憶される（Ｓ５０８）。また、ＲＡＭ１０３の所定の記憶エリアに、認識辞書名として「訪問パターン辞書」が記憶される（Ｓ５１１）。さらに、認識結果として「会社名と名前」が記憶される（Ｓ５１２）。その後、図１４に示す身元特定処理は終了し、図１２の来訪者受付処理に戻る。

訪問パターン辞書１５４３による認識結果が存在しない場合には（Ｓ５０６：ＮＯ）、訪問履歴辞書１５４４による認識結果が存在するか否かが判断される（Ｓ５０７）。訪問履歴辞書１５４４による認識結果が存在する場合には（Ｓ５０７：ＹＥＳ）、ＲＡＭ１０３の所定の記憶エリアに、認識辞書名として「訪問履歴辞書」が（Ｓ５１１）、認識結果として「会社名と名前」が（Ｓ５１２）、それぞれ記憶される。その後、図１４に示す身元特定処理は終了し、図１２の来訪者受付処理に戻る。

訪問履歴辞書１５４４による認識結果が存在しない場合、すなわち、来訪者辞書１５４１〜１５４４のいずれを使用しても認識結果が得られない場合には（Ｓ５０７：ＮＯ）、ＲＡＭ１０３に記憶されている発話回数カウンタのカウンタ値Ｎが１インクリメントされた後（Ｓ５１５）、Ｎが予め定められた閾値である３を超えたか否かが判断される（Ｓ５１６）。初回の処理では、Ｎ＝２となり、３を超えていないため（Ｓ５１６：ＮＯ）、図１２のステップＳ３およびＳ４と同様にして、再び、来訪者に対する身元に関する質問の音声データが受付端末２０に出力され（Ｓ５１８）、質問への回答の音声データが受け付けられる（Ｓ５１９）。これは、来訪者の音声が適切にマイク２０７から入力されなかったことによって音声認識ができなかった可能性があるため、来訪者が言い直した音声の認識を再度試みるためである。

受け付けられた音声データに基づいて、再度、来訪者辞書１５４１〜１５４４を用いた音声認識が行われる（Ｓ５０３）。前述したように、訪問日時辞書１５４１、訪問日辞書１５４２、訪問パターン辞書１５４３、および訪問履歴辞書１５４４の順に、各辞書を使用した認識結果が存在するか否かが判断される（Ｓ５０４〜Ｓ５０７）。２巡目の処理でも認識できなかった場合には（Ｓ５０７：ＮＯ）、さらに発話回数カウンタのカウンタ値Ｎが１インクリメントされ（Ｓ５１５）、Ｎ＝３となる。まだＮは３を超えていないため（Ｓ５１６：ＮＯ）、再度、来訪者に身元に関する情報を求め、音声認識が行われる（Ｓ５１８〜Ｓ５１９、Ｓ５０３）。

３巡目の処理でも認識できなかった場合は（Ｓ５０７：ＮＯ）、インクリメントされた発話回数カウンタのカウンタ値Ｎが３を超えてしまう（Ｓ５１５、Ｓ５１６：ＹＥＳ）。この場合、これ以上の質問は行われない。そこで、ＲＡＭ１０３の所定の記憶エリアに、認識辞書名および認識結果として、それぞれ「Ｎｕｌｌ」が記憶された後（Ｓ５１７）、図１４に示す身元特定処理は終了し、図１２の来訪者受付処理に戻る。なお、本実施形態では、来訪者に繰り返し身元に関する質問を行う回数を３回までとして閾値を定めているが、この値は必ずしも３にする必要はなく、その他の値としてもよい。ただし、あまり大きな数になると、来訪者は同じ回答を何回も続けることになり、ストレスを感じる可能性があるため、２〜３回までとするのが望ましい。

２巡目か３巡目の処理で、来訪者辞書１５４１〜１５４４のいずれかによる認識結果が存在すると判断された場合には（Ｓ５０４、Ｓ５０５、Ｓ５０６、またはＳ５０７：ＹＥＳ）、該当する認識辞書名、会社名と名前、訪問パターン辞書１５４３の場合はパターン名が、ＲＡＭ１０３の所定の記憶エリアにそれぞれ記憶された後（Ｓ５１１、Ｓ５１２、Ｓ５０８）、図１４に示す身元特定処理は終了し、図１２の来訪者受付処理に戻る。

図１２の来訪者受付処理では、身元特定処理（Ｓ５）に続いて、担当者に関する質問の音声データが、受付端末２０に出力される（Ｓ６）。より具体的には、ＨＤＤ１５０の所定の記憶エリア（図示外）に予め記憶されている、質問の文面（例えば、「担当者名をどうぞ。」）が読み出され、音声データに変換された後、通信装置１０９およびＬＡＮ９を介して受付端末２０に送信される。音声データを受信した受付端末２０では、音声データが音声に変換され、スピーカ２０８から音声として出力される。

受付端末２０に対して、来訪者が担当者に関する質問に回答すると、マイク２０７から入力された音声が音声データに変換され、受付サーバ１０に送信される。受付端末２０からの音声データが、ＬＡＮ９を介して受付サーバ１０に入力されると、音声データはＲＡＭ１０３の所定の記憶エリアに記憶される（Ｓ７）。続いて、来訪者通知処理が行われる（Ｓ５、図１５）。来訪者通知処理は、入力された音声データをテキストに変換する音声認識を行って、担当者に来訪者について連絡する処理である。

図１５の来訪者通知処理では、まず、担当者の特定が行われる（Ｓ８０１）。より具体的には、前述した身元特定処理と同様、音響モデル、言語モデル、および単語辞書を用いて、受付端末２０から入力された音声データの認識処理が行われる。ここでは、言語モデルとして、言語モデル記憶エリア１５２に記憶された、担当者名に関する質問に対する応答の場面に対応する言語モデル（図示外）が使用される。この言語モデルは、例えば、カテゴリ「担当者名」に属する単語およびカテゴリ「敬称」に属する単語から構成される文（例えば、「佐藤様」）を、受理可能な文のパターンとして含む。

また、単語辞書として、例えば、カテゴリ「担当者名」および「敬称」に対応する辞書がＲＡＭ１０３に読み出され、使用される。このうち、担当者名に関する辞書としては、前述した、社員ＤＢ１５５１（図１１参照）に含まれる「苗字」および「発音」を使用することができる。敬称やその他のカテゴリに属する単語の辞書は、単語辞書記憶エリア１５３に記憶されているものを読み出して、使用すればよい。このように、社員ＤＢ１５５１に記憶された、限られた数の社員の苗字および発音に関する情報を担当者に関する回答の音声認識に使用することにより、担当者名を高精度に認識することができる。来訪者の回答が音声認識によりテキストに変換されると、回答に含まれる担当者名が、ＲＡＭ１０３の所定の記憶エリアに一時的に記憶される。

前述のようにして担当者が特定されると（Ｓ８０１）、前述の身元特定処理（図１４参照）でＲＡＭ１０３の所定の記憶エリアにそれぞれ記憶された認識辞書名と認識結果（来訪者の会社名と名前）が取得される（Ｓ８０２）。そして、認識結果があるか否か、すなわち、ＲＡＭ１０３の所定の記憶エリアから、認識結果が取得できたか否かが判断される（Ｓ８０４）。

認識結果がある場合（Ｓ８０３：ＹＥＳ）、認識結果とともに取得された認識辞書名が特定される。これは、認識に成功した辞書に応じて、担当者に対する来訪者に関する通知内容を異ならせるためである。まず、認識辞書名が訪問日時辞書１５４１（図７参照）であるか否かが判断される（Ｓ８０４）。訪問日時辞書１５４１である場合（Ｓ８０４）、来訪者は、訪問が受け付けられた時刻の前後１時間以内の来訪予定者に該当すると認識されている。よって、来訪予定者が訪ねてきたことを伝える内容の通知文が作成され、ＲＡＭ１０３の所定の記憶エリアに記憶される（Ｓ８０７）。この場合の通知文は、例えば、「近い時刻にお約束のある、Ａ工業の永光様がいらっしゃっています。」というようになる。なお、来訪者予約ＤＢ１５１０から、この来訪者の訪問予定時間を読み出し、例えば、「１０時３０分にお約束のある、Ａ工業の永光様がいらっしゃっています。」というように、訪問予定時間の情報もあわせて通知してもよい。

認識辞書名が、訪問日時辞書１５４１ではなく（Ｓ８０４：ＮＯ）、訪問日辞書１５４２（図８参照）であると判断された場合には（Ｓ８０５：ＹＥＳ）、来訪者は、訪問が受け付けられた時刻の前後１時間以内の来訪予定者ではないが、当日の来訪予定者には該当すると認識されている。よって、予定された時間とは異なるが、来訪予定者が訪ねてきたことを伝える内容の通知文が作成され、ＲＡＭ１０３の所定の記憶エリアに記憶される（Ｓ８０８）。この場合の通知文は、例えば、「お客様です。お約束の時間とは違いますが、Ｅ化学の豊倉様だと思います。」というようになる。前述のように、訪問予定時間を含めた通知文としてもよい。

認識辞書名が、訪問日辞書１５４２でもなく（Ｓ８０５：ＮＯ）、訪問パターン辞書１５４３（図９参照）であると判断された場合には（Ｓ８０６：ＹＥＳ）、来訪者は、当日の来訪予定者ではないが、過去１ヶ月以内の同じ曜日に訪ねてきた人物に該当すると認識されている。よって、何曜日に訪ねてきた人物であるかを特定するために、前述の身元特定処理（図１４参照）でＲＡＭ１０３に記憶されたパターン名が取得される（Ｓ８０９）。そして、同じ曜日に来訪したことがある人物が訪ねてきたことを伝える内容の通知文が作成され、ＲＡＭ１０３の所定の記憶エリアに記憶される（Ｓ８１０）。この場合の通知文は、例えば、「お客様です。よく聞き取れませんでしたが、多分、前にも月曜日にいらっしゃったＢ運送の囲様だと思います。」というようになる。来訪者予約ＤＢ１５１０から、この来訪者の直近の月曜日の来訪予約情報を読み出し、例えば、「同じ月曜日の５月５日にいらっしゃった、Ｂ運送の囲様だと思います。」というように、過去の情報もあわせて通知してもよい。

認識辞書名が、訪問パターン辞書１５４３でもないと判断された場合は（Ｓ８０６：ＮＯ）、訪問履歴辞書１５４４（図１０参照）であることになる。よって、来訪者は、当日の来訪予定者ではないが、過去１ヶ月以内に訪ねてきたことがある人物に該当すると認識されている。そこで、過去１ヶ月以内に来訪したことがある人物が訪ねてきたことを伝える内容の通知文が作成され、ＲＡＭ１０３の所定の記憶エリアに記憶される（Ｓ８１１）。この場合の通知文は、例えば、「お客様です。よく聞き取れませんでしたが、多分、前にもいらっしゃったＦ工業の西坂様だと思います。」というようになる。訪問パターン辞書１５４３の場合と同様に、来訪者の過去の最新の来訪者予約情報を読み出して、過去の情報をあわせて通知してもよい。

一方、認識結果がないと判断された場合（Ｓ８０３：ＮＯ）、前述の身元特定処理（図１４参照）で、来訪者辞書１５４１〜１５４４のいずれを使用しても、来訪者の身元に関する回答が音声認識できなかった場合に該当する。よって、この場合には、身元不明の来訪者が訪ねてきたことを伝える内容の通知文が作成され、ＲＡＭ１０３の所定の記憶エリアに記憶される（Ｓ８１５）。この場合の通知文は、例えば、「お客様です。お名前はよく聞き取れませんでした。」というようになる。

このように、来訪者の音声認識に成功した来訪者辞書１５４１〜１５４４に応じて、担当者への通知内容を異ならせることにより、通知を受けた担当者が、通知される来訪者の身元がどの程度正確かを判断し、適切な対応をすることが容易となる。

前述のように、それぞれの場合に応じた通知文が作成された後（Ｓ８０７、Ｓ８０８、Ｓ８１０、Ｓ８１１、またはＳ８１５）、通知文のテキストデータが音声データに変換される。そして、ステップＳ８０１で特定された担当者の電話番号が社員ＤＢ１５５１（図１１参照）から読み出され、ＩＰ−ＰＢＸ５０を介して、担当者の使用するＩＰ電話機６０に、音声データが発信される（Ｓ８１３）。これにより、電話を受けた担当者は、どのような人物が訪ねてきたのかを的確に知ることができる。担当者に、来訪者の通知が行われた後、図１５の来訪者通知処理は終了し、図１２の来訪者受付処理に戻る。

図１２の来訪者受付処理では、続いて、担当者がＩＰ電話機６０に対して発した音声の音声データの入力が受け付けられる（Ｓ９）。詳細な説明は省略するが、受け付けられた音声データについて、音響モデル、担当者からの応答指示の場面に対応する言語モデルおよび単語辞書を用いた認識処理が行われる（Ｓ１０）。この場面では、担当者は、自ら来訪者に応対することを告げる場合と、受付サーバ１０で代わりに応対することを指示する場合があると想定される。例えば、自ら来訪者に応対する場合は、「つないでください。」という取次ぎの指示、受付サーバ１０に代理応対させる場合は、「代わりに応対してください。」という指示が受け付けられることになる。

認識結果として出力された担当者の指示が、取次ぎの指示であるか否かが判断される（Ｓ１１）。取次ぎの指示であれば（Ｓ１１：ＹＥＳ）、ＨＤＤ１５０の所定の記憶エリア（図示外）に記憶されている取次ぎの文面のテキストデータが読み出され、音声データに変換された後、通信装置１０９およびＬＡＮ９を介して受付端末２０に出力される（Ｓ１２）。その結果、受付端末２０のスピーカ２０８から、例えば、「おつなぎします。」という取次ぎの音声が出力される。続いて、ＩＰ−ＰＢＸ５０を介して、受付端末２０と担当者のＩＰ電話機６０を接続させる（Ｓ１３）。そして、来訪者の訪問が受け付けられる都度作成される訪問日時辞書１５４１が、次の処理に備えて来訪者辞書記憶エリア１５４から削除された後（Ｓ１７）、図１２の来訪者受付処理は終了する。

一方、担当者の指示が、取次ぎの指示ではなく代理応対の指示であれば（Ｓ１１：ＮＯ）、伝言を受け付ける旨の通知の文面のテキストデータが、ＨＤＤ１５０の所定の記憶エリア（図示外）から読み出され、音声データに変換された後、通信装置１０９およびＬＡＮ９を介して受付端末２０に出力される（Ｓ１４）。そして、受付端末２０のマイク２０７から入力された来訪者の伝言が、音声データに変換されて送信され、受付サーバ１０に入力されると（Ｓ１５）、入力された音声データは、ＨＤＤ１５０の伝言用の記憶エリア（図示外）に記憶される（Ｓ１６）。よって、担当者は、後でＨＤＤ１５０に記憶された音声データを再生することにより、来訪者の残した伝言を聞くことができる。続いて、訪問日時辞書１５４１が、次の処理に備えて来訪者辞書記憶エリア１５４から削除され（Ｓ１７）、図１２の来訪者受付処理は終了する。

なお、訪問日時辞書１５４１以外の、１日に一度作成される来訪者辞書１５４２〜１５４４については、毎日、例えば０時に、来訪者辞書記憶エリア１５４から削除される。

以上に説明したように、本実施形態の来訪者受付システム１によれば、来訪者予約ＤＢ１５１０に予め記憶されている来訪者予約情報に基づいて、来訪者辞書１５４１〜１５４４が作成される。そして、来訪者辞書１５４１〜１５４４を用いて、来訪者の身元に関する発話の音声認識が行われる。したがって、汎用の会社名辞書および名前辞書を利用する場合に比べ、高精度な認識結果が得られ、来訪者の身元に関する情報である会社名と苗字をより正確に特定することができる。

また、来訪者辞書１５４１〜１５４４は、それぞれ、受付端末２０の操作ボタン２０９が押下げられることにより来訪者が検出された日時と所定の関係にある訪問予定日時に対応する来訪者予約情報から作成される。したがって、訪問予定日時が絞り込まれた来訪者辞書に基づいて音声認識が行われるため、より高精度な認識結果を得ることができる。

本実施形態では、図１２のステップＳ４で、来訪者の音声データを取得するＣＰＵ１０１が、本発明の「音声情報取得手段」に相当する。図１２のステップＳ５および図１４の身元特定処理を行うＣＰＵ１０１が、「来訪者特定手段」に相当する。図１５のステップＳ８１２で、来訪者に関する通知文の音声データを出力するＣＰＵ１０１が、「来訪者情報出力手段」に相当する。

図１３のステップＳ１０３、Ｓ１０７、Ｓ１１２、およびＳ１１７で来訪者辞書１５４１〜１５４４をそれぞれ作成するＣＰＵ１０１が、「来訪者辞書作成手段」に相当する。Ｓ１０７で訪問日辞書１５４２を作成するＣＰＵ１０１が、「同日辞書作成手段」に相当する。Ｓ１０３で訪問日時辞書１５４１を作成するＣＰＵ１０１が、「所定時間辞書作成手段」に相当する。Ｓ１１７で訪問履歴辞書１５４４を作成するＣＰＵ１０１が、「過去履歴辞書作成手段」に相当する。Ｓ１１２で訪問パターン辞書１５４３を作成するＣＰＵ１０１が、「パターン辞書作成手段」に相当する。また、図１５のステップＳ８０１で、来訪者の担当者を特定するＣＰＵ１０１が、「対応者特定手段」に相当する。

また、図１２のステップＳ４の来訪者の音声データを取得する処理が、本発明の「音声情報取得ステップ」に相当する。図１２のステップＳ５および図１４の身元特定処理が、「来訪者特定ステップ」に相当する。図１５のステップＳ８１２の来訪者に関する通知文の音声データを出力する処理が、「来訪者情報出力ステップ」に相当する。

なお、前述の実施形態に示される構成や処理は例示であり、各種の変形が可能なことはいうまでもない。例えば、前述の実施形態では、４種類の来訪者辞書１５４１〜１５４４が作成され、来訪者の身元に関する発話の音声認識にすべての来訪者辞書１５４１〜１５４４が使用されている。しかしながら、来訪者の身元に関する発話の音声認識に使用する辞書は、来訪者辞書１５４１〜１５４４のうちの少なくとも１種類を使用すれば行うことが可能である。

また、来訪者辞書１５４１〜１５４４は、４種類の別個の辞書とせず、１つの来訪者辞書として作成してもよい。この場合、例えば、来訪者が検出された日時と訪問予定日時との関係が、来訪者が検出された時刻の前後１時間、同日、過去１ヶ月以内で同じ曜日、および過去１ヶ月以内である来訪者予約情報を順番に抽出して、来訪者辞書を作成することができる。なお、先に抽出されているのと同じ来訪者の来訪者予約情報は、重複して抽出しないようにすればよい。また、来訪者予約情報とともに、抽出基準とされた前述の４種類の関係のいずれかを記憶しておけば、前述の実施形態と同様に、記憶されている関係に応じて、担当者への通知内容を変更することができる。

また、来訪者辞書１５４１〜１５４４を作成する際の基準となる、来訪者が検出された日時と訪問予定日時との関係は、本実施形態で例示されている以外の所定の関係であってもよい。例えば、訪問日時辞書１５４１は、訪問予定日時が、来訪者が検出された日時の前後３０分以内にある来訪者予約情報に基づいて作成してもよいし、訪問履歴辞書１５４４は、訪問予定日時が、来訪者が検出された日時から過去２週間以内にある来訪者予約情報に基づいて作成してもよい。

また、来訪者予約ＤＢ１５１０には、訪問予定日時が過去の来訪者予約情報だけでなく、訪問予定日時が将来の来訪者予約情報も記憶されている。よって、訪問パターン辞書１５４３は、例えば、訪問予定日時が、来訪者が検出された日時の前後２週間以内で、且つ、同じ曜日である来訪者予約情報に基づいて作成してもよい。

前述の実施形態では、来訪者予約ＤＢ１５１０に記憶されている来訪者予約情報のうち、来訪者会社名と来訪者名、および来訪者会社名ヨミと来訪者名ヨミとに基づいて、カテゴリ「会社名と名前」という１つの単語とその発音に関する情報が作成されている。このように、来訪者会社名と来訪者名を結合して１つの単語にした場合、来訪者会社名と来訪者名とを別個の単語として音声認識を行う場合に比べ、発話のバリエーションが絞られるため、認識精度を向上させることができる。しかしながら、来訪者会社名と来訪者名とを別個の２つの単語として来訪者辞書１５４１〜１５４４を作成し、音声認識を行ってもよい。

また、例えば、来訪者名のみを１つの単語として来訪者辞書１５４１〜１５４４を作成してもよい。さらに、来訪者会社名と来訪者名として、来訪予定者が所属する会社等の正式名称と来訪者のフルネームを使用してもよい。来訪者が所属する会社等の正式名称と来訪者の苗字、または、来訪者が所属する会社等の通称と来訪者のフルネームを使用してもよい。

前述の実施形態では、来訪者予約ＤＢ１５１０には、来訪者会社名ヨミおよび来訪者名ヨミとして、片仮名が記憶されており、来訪者辞書１５４１〜１５４４を作成する際に、これらの片仮名が音素列に変換される。しかしながら、来訪者予約ＤＢ１５１０には予め作成した音素列を記憶しておき、そのまま抽出して来訪者辞書１５４１〜１５４４を作成してもよい。

前述の実施形態では、１日一度作成される来訪者辞書１５４２〜１５４４は、その日の最初の処理で作成されている。しかしながら、毎日、例えば、０時に作成しておいてもよい。

前述の実施形態では、担当者の特定は、社員ＤＢ１５５１に記憶された担当者名と発音を単語辞書として用いた音声認識により行われている。しかしながら、前述の実施形態のように、来訪者予約ＤＢ１５１０に担当者名とその発音に関する情報が記憶されている場合には、来訪者辞書１５４１〜１５４４と同様に、来訪者予約情報から担当者名の辞書を作成してもよい。

前述の実施形態では、担当者への来訪者に関する情報の通知は、ＩＰ電話機６０に音声データを出力することにより行われている。しかしながら、担当者への通知の方法は、ＩＰ電話機６０による方法に限られるものではない。例えば、担当者が使用する携帯電話に対して音声データを出力してもよいし、通知文のテキストデータを、担当者の使用するパーソナルコンピュータや携帯電話にメールで送信してもよい。

前述の実施形態では、来訪者受付システム１において、来訪者の検出や音声の入力が行われる受付端末２０と、図１２に示す来訪者受付処理を行う受付サーバ１０とは、別個の装置である。しかしながら、マイク、スピーカ、および操作ボタンを備えた受付サーバ１０を会社５の入口付近に設置し、受付サーバ１０のみで、来訪者の検出、音声の入力、来訪者受付処理のすべてを行うことも可能である。また、来訪者予約ＤＢ１５１や社員ＤＢ１５５等、前述の実施形態でＨＤＤ１５０に記憶されている情報は、例えば、ＬＡＮ９を介して受付サーバ１０に接続可能な別個の記憶装置に記憶させておき、来訪者受付処理中に、必要な情報を読み出す構成としてもよい。

前述の実施形態では、受付端末２０の操作ボタン２０９が押下げの有無によって、来訪者の検出の有無が判断されている。しかしながら、来訪者の検出には、操作ボタン２０９の代わりに、例えば、周知の人感センサまたはカメラを使用してもよい。

来訪者受付システム１の概略構成を示すシステム構成図である。受付端末２０の電気的構成を示すブロック図である。受付サーバ１０の電気的構成を示すブロック図である。来訪者予約データベース１５１０の説明図である。言語モデル記憶エリア１５２に記憶された言語モデル１５２１の説明図である。単語辞書１５３１の説明図である。訪問日時辞書１５４１の説明図である。訪問日辞書１５４２の説明図である。訪問パターン辞書１５４３の説明図である。訪問履歴辞書１５４４の説明図である。社員データベース１５５１の説明図である。来訪者受付処理のフローチャートである。来訪者受付処理中に実行される来訪者辞書準備処理のフローチャートである。来訪者受付処理中に実行される身元特定処理のフローチャートである。来訪者受付処理中に実行される来訪者通知処理のフローチャートである。

符号の説明

１０受付サーバ
２０受付端末
１０１ＣＰＵ
１５０ＨＤＤ
１５１来訪者予約ＤＢ記憶エリア
２０７マイク
２０９操作ボタン

Claims

単語辞書を用いて来訪者の発話の音声認識を行う来訪者受付装置であって、
現在の来訪者を検出する来訪者検出手段によって前記現在の来訪者が検出された後、音声入力手段から入力された前記現在の来訪者の発する音声の音声情報を取得する音声情報取得手段と、
来訪者情報記憶手段に予め記憶されている来訪予定者の身元に関する情報である来訪者記憶情報に基づく単語辞書を来訪者辞書として用いて、前記音声情報取得手段によって取得された前記音声情報を認識することにより、前記現在の来訪者の身元に関する情報である現在来訪者情報を特定する来訪者特定手段と、
前記来訪者特定手段によって特定された前記現在来訪者情報を出力する来訪者情報出力手段を備えたことを特徴とする来訪者受付装置。
前記来訪者情報記憶手段は、来訪日時と対応付けて、前記来訪者記憶情報を記憶しており、
前記来訪者情報記憶手段に記憶された前記来訪者記憶情報のうち、前記来訪者検出手段によって前記現在の来訪者が検出された日時である来訪者検出日時と所定の関係にある前記来訪日時に対応する前記来訪者記憶情報を抽出することにより、前記来訪者辞書を作成する来訪者辞書作成手段を備えたことを特徴とする請求項１に記載の来訪者受付装置。
前記来訪者辞書作成手段は、前記来訪者情報記憶手段に記憶された前記来訪者記憶情報のうち、対応する前記来訪日時が、前記来訪者検出日時と同日の日時である前記来訪者記憶情報を抽出することにより、前記来訪者辞書を作成する同日辞書作成手段を備えたことを特徴とする請求項２に記載の来訪者受付装置。
前記来訪者辞書作成手段は、前記来訪者情報記憶手段に記憶された前記来訪者記憶情報のうち、対応する前記来訪日時が、前記来訪者検出日時から前後所定時間以内の日時である前記来訪者記憶情報を抽出することにより、前記来訪者辞書を作成する所定時間辞書作成手段を備えたことを特徴とする請求項２または３に記載の来訪者受付装置。
前記来訪者辞書作成手段は、前記来訪者情報記憶手段に記憶された前記来訪者記憶情報のうち、対応する前記来訪日時が、前記来訪者検出日時から所定の日数分の過去に属する日時である前記来訪者記憶情報を抽出することにより、前記来訪者辞書を作成する過去履歴辞書作成手段を備えたことを特徴とする請求項２〜４のいずれかに記載の来訪者受付装置。
前記来訪者辞書作成手段は、前記来訪者情報記憶手段に記憶された前記来訪者記憶情報のうち、対応する前記来訪日時が、前記来訪者検出日時と同じ日付、同じ曜日、または同じ時間帯である前記来訪者記憶情報を抽出することにより、前記来訪者辞書を作成するパターン辞書作成手段を備えたことを特徴とする請求項２〜５のいずれかに記載の来訪者受付装置。
前記来訪者辞書作成手段は、前記来訪予定者毎に、前記来訪者情報記憶手段に記憶された前記来訪者記憶情報に含まれる前記来訪者の氏名の少なくとも一部と所属の少なくとも一部とを抽出し、結合して１つの単語とすることにより、前記来訪者辞書を作成することを特徴とする請求項２〜６のいずれかに記載の来訪者受付装置。
来訪者の対応者の候補に関する情報に基づく単語辞書である対応者候補辞書を用いて、前記音声情報取得手段によって取得された前記音声情報を認識することにより、前記現在の来訪者の対応者に関する情報である対応者情報を特定する対応者特定手段をさらに備え、
前記来訪者情報出力手段は、前記対応者特定手段によって特定された前記対応者情報に対応する前記対応者に対して、前記現在来訪者情報の通知処理を行うことを特徴とする請求項１〜７のいずれかに記載の来訪者受付装置。
来訪者の対応者の候補に関する情報に基づく単語辞書である対応者候補辞書を用いて、前記音声情報取得手段によって取得された前記音声情報を認識することにより、前記現在の来訪者の対応者に関する情報である対応者情報を特定する対応者特定手段をさらに備え、
前記来訪者辞書作成手段は、複数の所定の関係に従って、前記来訪者辞書を作成し、
前記来訪者特定手段は、前記来訪者辞書作成手段によって作成された前記来訪者辞書を用いて、前記音声情報取得手段によって取得された前記音声情報を認識することにより、前記現在来訪者情報を特定し、
前記来訪者情報出力手段は、前記来訪者辞書のうち、前記来訪者特定手段が前記音声情報を認識することに成功した前記来訪者辞書に応じて、前記対応者への前記現在来訪者情報の通知内容を異ならせることを特徴とする請求項２〜７のいずれかに記載の来訪者受付装置。
単語辞書を用いて来訪者の発話の音声認識を行う来訪者受付方法であって、
現在の来訪者を検出する来訪者検出手段によって前記現在の来訪者が検出された後、音声入力手段から入力された前記現在の来訪者の発する音声の音声情報を取得する音声情報取得ステップと、
来訪者情報記憶手段に予め記憶された、予定された来訪者の身元に関する情報である来訪者記憶情報に基づく単語辞書である来訪者辞書を用いて、前記音声情報取得ステップで取得された前記音声情報を認識することにより、前記現在の来訪者の身元に関する情報である現在来訪者情報を特定する来訪者特定ステップと、
前記来訪者特定ステップで特定された前記現在来訪者情報を出力する来訪者情報出力ステップを備えたことを特徴とする来訪者受付方法。
請求項１〜９のいずれかに記載の来訪者受付装置の各種処理手段としてコンピュータを機能させるための来訪者受付プログラム。