JP7079419B2

JP7079419B2 - 情報処理方法及び情報処理装置

Info

Publication number: JP7079419B2
Application number: JP2019570177A
Authority: JP
Inventors: 克田▲崎▼
Original assignee: Nissan Motor Co Ltd
Current assignee: Nissan Motor Co Ltd
Priority date: 2018-02-06
Filing date: 2018-02-06
Publication date: 2022-06-02
Anticipated expiration: 2038-02-06
Also published as: JPWO2019155526A1; US11200905B2; US20200365161A1; EP3751562A1; EP3751562A4; WO2019155526A1; CN111868711A

Description

本発明は、情報処理方法及び情報処理装置に関するものである。

従来において、ユーザが発した発話音声のテキストデータに基づき、ユーザの要求を理解し、要求に応じたタスクを実行するという技術が開示されている。

国際公開２０１６／００２４０６号

従来は、例えば、家族や知人の氏名（例えば、日産花子）及び電話番号を含む登録情報を予めデータベースに記憶しておき、音声入力装置に対して「日産花子に電話」のように発話することで、「日産花子」から電話番号を検索し、電話を行うことができる。

しかし、日常の会話では、家族などを氏名以外の呼び名（例えば、お母さん）で呼ぶ場合がある。上記のように、通常は登録情報には氏名（例えば、日産花子）を登録するので、「お母さんに電話」のように発話しても、「日産花子」が「お母さん」であることを認識できず、電話を行えない。そればかりか、登録情報が記憶されているとしても、呼び名からこの登録情報を検索できず、発話者に登録情報を提示できない。

本発明は、上記課題に鑑みて成されたものであり、その目的は、データベースから呼び名に基づいて登録情報を検索して発話者に提示できる情報処理方法及び情報処理装置を提供することである。

本発明の一態様に係わる情報処理方法は、データベースから登録情報を検索する情報処理装置の情報処理方法である。情報処理装置は、発話者の音声をテキストデータに変換し、テキストデータから呼び名を抽出する。そして、情報処理装置は、呼び名を含む登録情報をデータベースから検索し、呼び名を含む登録情報がデータベースに存在しない場合には呼び名に対応する条件を満たす登録情報をデータベースから検索する。情報処理装置は、検索した呼び名に対応する条件を満たす登録情報を発話者に提示する。

本発明によれば、データベースから呼び名に基づいて登録情報を検索して発話者に提示できる。

図１は、実施形態に係わる情報処理装置の概略構成を示すブロック図である。図２は、ユーザデータベース２の構成の一例を示す図である。図３は、対象車両に乗り込んだドライバが電話をかける際の情報処理装置１００の動作を示すフローチャートである。図４は、ドライバが電話番号の入力操作を行って電話の発信が行われた後の通話中での情報処理装置１００の動作を示すフローチャートである。図５は、図４と同様の状況で行われる電話の通話中での情報処理装置１００の別な動作を示すフローチャートである。図６は、対象車両の車内でドライバと同乗者が会話しているときの情報処理装置１００の動作を示すフローチャートである。

図面を参照して、実施形態を説明する。図面の記載において同一部分には同一符号を付して説明を省略する。

図１に示す実施形態の情報処理装置１００は、呼び名データベース１及びユーザデータベース２とともに車両に搭載される。以下、この車両を対象車両という。なお、呼び名データベース１及びユーザデータベース２が車外に設けられていて、車載の通信装置を介して呼び名データベース１及びユーザデータベース２に外部からアクセスすることで車載した場合と同じ機能を果たすことができる。

情報処理装置１００は、音声認識部３、意図推定部４、検索結果出力部５、データベース更新部６、電話処理部７及び声紋識別部８を備える。

情報処理装置１００は、ＣＰＵ（中央処理装置）、メモリ、及び入出力部を備える汎用のマイクロコンピュータ（制御部ともいう）であり、後述の情報処理方法を実行する。このマイクロコンピュータには、情報処理装置として機能させるためのコンピュータプログラム（情報処理プログラム）がインストールされている。コンピュータプログラムを実行することにより、マイクロコンピュータは、情報処理装置が備える複数の情報処理回路（３～８）として機能する。なお、ここでは、ソフトウェアによって情報処理装置が備える複数の情報処理回路（３～８）を実現する例を示すが、もちろん、以下に示す各情報処理を実行するための専用のハードウェアを用意して、情報処理回路（３～８）を構成することも可能である。また、複数の情報処理回路（３～８）を個別のハードウェアにより構成してもよい。更に、情報処理回路（３～８）は、車両にかかわる他の制御に用いる電子制御ユニット（ＥＣＵ）と兼用してもよい。

呼び名データベース１は、日常会話で使用する呼び名、例えば、「お母さん」、「おとうさん」、「おばあちゃん」、「おじいちゃん」などが登録されている。また、企業内などでは「課長」、「部長」などの呼び名も使用されるので、このような呼び名も登録されている。また、「一郎」という名の人を呼ぶ呼び名として、「いっちゃん」なども登録されている。

ユーザデータベース２は、対象車両に乗車する乗員ごとに設けられる。ここでは、乗員が１人のドライバのみであり、このドライバについてのユーザデータベース２のみが設けられていることとする。ユーザデータベース２が複数の乗員ごとに設けられている場合については別途説明する。

図２に示すように、ユーザデータベース２は、ドライバの家族や知人（以下、関係者という）１人ごとに登録情報を備える。各登録情報は、関係者の名字と名前、関係者の呼び名、関係者の性別、関係者の自宅の電話番号（図２の「第１電話番号」）、関係者の携帯電話の電話番号（図２の「第２電話番号」という）、関係者の職場の電話番号（図２の「第３電話番号」）、関係者の自宅の住所、関係者の声の声紋及び履歴情報（例えば、電話の頻度などを示す情報）を備える。なお、情報が不足している登録情報があってもよい。例えば、呼び名や声紋を得ていない関係者の登録情報には呼び名や声紋が含まれない。

音声認識部３は、ドライバの発話の音声を音声認識し、テキストデータに変換する。
意図推定部４は、テキストデータから呼び名とコマンドを抽出する。コマンドは、ドライバすなわち発話者が希望する制御を示す単語などである。具体的には、意図推定部４は、テキストデータから、呼び名データベース１に登録された呼び名と同じ呼び名を抽出する。また、コマンドについても同様に、予めデータベース（図示せず）に登録されたコマンドと同じコマンドを抽出する。

そして、意図推定部４は、呼び名に対応する条件を満たす登録情報をユーザデータベース２から検索する。検索結果出力部５は、意図推定部４による検索結果（登録情報）をドライバに提示する。

データベース更新部６は、意図推定部４が検索した登録情報に呼び名や声紋識別部８が検出した声紋を書き込み、履歴情報を更新する。また、データベース更新部６は、ユーザデータベース２に新たな登録情報を生成する。

電話処理部７は、抽出されたコマンドが電話に関するものの場合、意図推定部４が検索した登録情報を用いて、コマンドに応じた制御を行う。具体的には、電話の発信、着信、音声処理などを行う。また、電話処理部７は、電話相手の電話番号を検出する。声紋識別部８は、電話中の発話から声紋を検出する。

図３は、対象車両に乗り込んだドライバが電話をかける際の情報処理装置１００の動作を示すフローチャートである。なお、情報処理装置１００にとっては、ドライバの名字と名前、性別、第１～第３電話番号、住所、声紋といった情報が既知であることとする。後述の図４、図５の動作の際でもこれらの情報は既知であることとする。

まず、ドライバ（発話者）が、「お母さんに電話して」のように発話すると（Ｓ１）、音声認識部３が、図示しない音声入力装置（マイクロフォン）からドライバの発話の音声を取得する。そして、音声を音声認識し、テキストデータに変換する（Ｓ３）。「電話して」は、ここではドライバ（発話者）が希望する制御を示すコマンドである。

次に、意図推定部４が、テキストデータを単語に分解し、呼び名データベース１に登録された呼び名と同じ単語、すなわち呼び名（例えば「お母さん」）を抽出する（Ｓ５）。また、意図推定部４は、予めコマンドのデータベース（図示せず）に登録されたコマンドと同じ単語、すなわちコマンド（例えば「電話して」）を抽出する（Ｓ５）。

次に、意図推定部４は、ステップＳ５で抽出した呼び名に対応する条件を満たす登録情報をユーザデータベース２から検索する（Ｓ７）。条件を満たす登録情報がない場合は（Ｓ９：ＮＯ）、処理を終える。つまり、音声による電話の発信はできず、例えば、ドライバは相手の電話番号の入力操作を行い、電話処理部７が電話の発信、音声処理などを行う。一方、条件を満たす登録情報がある場合は（Ｓ９：ＹＥＳ）、ステップＳ１１に進む。

ここでステップＳ７、Ｓ９について説明する。
意図推定部４は、ステップＳ５で抽出した呼び名を含む登録情報を検索し（Ｓ７）、そのような登録情報が存在するか否かを判定し（Ｓ９）、存在する場合は（Ｓ９：ＹＥＳ）、その登録情報を読み出す。なお、呼び名を含む登録情報がユーザデータベース２に１つだけ存在する場合は、後述のステップＳ１１、Ｓ１３を省略できる。

また、呼び名「お母さん」には、ここでは予め「名字が同じ、且つ、自宅の住所が同じ、且つ、性別が女性」のような条件が対応づけて記憶されている。

意図推定部４は、呼び名を含む登録情報がない場合、ドライバの名字が「日産」であるならば、例えば名字「日産」を含み、且つ自宅の住所が同じ、且つ、性別が女性の登録情報（条件を満たす登録情報）を検索する（Ｓ７）。そして、そのような登録情報が存在するか否かを判定し（Ｓ９）、存在する場合は（Ｓ９：ＹＥＳ）、その登録情報（例えば、「日産」「花子」を含む登録情報）を読み出す。

また、呼び名「課長」には、ここでは予め「第３電話番号が同じ」のような条件が対応づけて記憶されている。

意図推定部４は、呼び名を含む登録情報がない場合、ドライバの「第３電話番号」と同じ「第３電話番号」を含む登録情報（条件を満たす登録情報）を検索する（Ｓ７）。そして、そのような登録情報が存在するか否かを判定し（Ｓ９）、存在する場合は（Ｓ９：ＹＥＳ）、その登録情報を読み出す。

ステップＳ１１では、検索結果出力部５が、意図推定部４による検索結果（登録情報）をドライバに提示する（Ｓ１１）。ここでは、例えば、登録情報内の名字「日産」、名前「花子」を、「「お母さん」は「日産」「花子」さんですか？」というように音声を出力する（Ｓ１１）。

これに対し、ドライバが、「そうです」と発話すると（Ｓ１３）、音声認識部３が、ドライバの発話の音声を音声認識してテキストデータに変換し、意図推定部４が、「肯定」の回答であることを認識する。すなわち、「日産」「花子」を含む登録情報が特定されたことになる。

ここで、ステップＳ７で複数の登録情報が検索された場合について説明する。
例えば、名字「日産」、名前「花子」を含む登録情報と、名字「日産」、名前「直子」を含む登録情報とが検索された場合、検索結果出力部５は、ステップＳ５で抽出した呼び名「お母さん」を用い、「「お母さん」は「日産」「花子」さんですか、それとも、「日産」「直子」さんですか？」というように音声を出力する（Ｓ１１）。

これに対し、ドライバが「「日産」「花子」です」と発話すると（Ｓ１３）、音声認識部３が、ドライバの発話の音声を音声認識してテキストデータに変換し、意図推定部４が、「「日産」「花子」」の回答であることを認識する。すなわち、「日産」「花子」を含む登録情報が特定されたことになる。この登録情報は、ドライバ（発話者）が発話により選択した登録情報ということができる。

このようにして、１つの登録情報が特定されると、電話処理部７は、特定した登録情報を用いて、コマンドに応じた制御を行う（Ｓ１５）。ステップＳ１５では、例えば、登録情報のいずれかの電話番号に発信し、電話中は音声処理を行う。

また、声紋識別部８は、ステップＳ１５における電話中の発話から電話相手の声紋を検出する（Ｓ１７）。

次に、データベース更新部６が、特定された登録情報に対し、ステップＳ５で抽出した呼び名、及びステップＳ１７で検出した声紋を書き込む（Ｓ１９）。そして、履歴情報を更新し、処理を終える。

以上のように、図３のフローチャートによれば、発話者（ドライバ）の音声をテキストデータに変換し（Ｓ３）、テキストデータから呼び名（お母さん、課長）を抽出する（Ｓ５）。そして、呼び名（お母さん、課長）に対応する条件を満たす登録情報をデータベース（２）から検索し（Ｓ７）、検索した登録情報を発話者に提示する（Ｓ１１）。よって、データベース（２）から呼び名に基づいて登録情報を検索して発話者に提示できる。

また、検索した登録情報に呼び名を書き込む（Ｓ１９）ことで、この登録情報については、次回以降は、呼び名を含む登録情報を検索すればよく、呼び名に対応する条件による登録情報の検索が不要となる。

また、発話者（ドライバ）が希望する制御を示すコマンドをテキストデータから抽出し（Ｓ５）、ステップＳ７で検索した登録情報を用いて、コマンドに応じた制御（電話）を行う（Ｓ１５）。よって、呼び名とコマンドを発話することで、コマンドに応じた制御を行うことができる。

また、検索した複数の登録情報（日産花子、日産直子）を発話者（ドライバ）に提示し（Ｓ１１）、発話者が選択した登録情報に呼び名を書き込む（Ｓ１９）。

よって、この登録情報については、次回以降は、呼び名を含む登録情報を検索すればよく、呼び名に対応する条件による登録情報の検索が不要となる。

図４は、音声による発信ができず、ドライバが電話番号の入力操作を行って電話の発信が行われた後の通話中での情報処理装置１００の動作を示すフローチャートである。

まず、電話処理部７は、電話相手（ドライバが呼び名で呼ぶ対象者）の電話番号を検出する（Ｓ２１）。
また、ドライバが電話中に、「お母さん、次の日曜日に時間ある？」又は「いっちゃん、次の日曜日に時間ある？」のように発話すると（Ｓ２３）、音声認識部３が、ドライバの発話の音声を音声認識し、テキストデータに変換する（Ｓ２５）。

次に、意図推定部４が、テキストデータを単語に分解し、呼び名データベース１に登録された呼び名と同じ単語、すなわち呼び名「お母さん」又は「いっちゃん」を抽出する（Ｓ２７）。

また、電話相手（対象者）が、「あるけど、何か用があるの？」のように発話すると（Ｓ２９）、声紋識別部８は、発話の音声から電話相手の声紋を検出する（Ｓ３１）。

次に、意図推定部４は、ユーザデータベース２を参照し、ステップＳ２１で検出した電話相手の電話番号を含む登録情報がユーザデータベース２に存在するか否かを判定する（Ｓ３３）。つまり、電話相手の電話番号を含む登録情報をユーザデータベース２から検索する。

データベース更新部６は、該当の登録情報が存在する場合は（Ｓ３３：ＹＥＳ）、登録情報に対し、ステップＳ２７で抽出した呼び名、及びステップＳ３１で検出した声紋を書き込み（Ｓ３５）、処理を終える。

ステップＳ３５では、例えば、呼び名「お母さん」で呼ばれる「日産」「花子」さんの登録情報に呼び名「お母さん」と「日産」「花子」さんの声紋を書き込む。

一方、該当の登録情報が存在しない場合は（Ｓ３３：ＮＯ）、データベース更新部６は、ステップＳ２１で検出した電話番号（電話相手の電話番号）、ステップＳ２７で抽出した呼び名（電話相手の呼び名）、及びステップＳ３１で検出した声紋（電話相手の声紋）を含む登録情報を新たにユーザデータベース２に生成し（Ｓ３７）、処理を終える。

ステップＳ３７では、例えば、呼び名「いっちゃん」と電話番号と声紋を含む登録情報がユーザデータベース２に生成される。なお、この登録情報のその他の情報（名字、名前など）は、その後の入力操作などにより追加することができる。

図４の処理により、ドライバが「日産」「花子」さんを呼ぶときの呼び名「お母さん」と「日産」「花子」さんの声紋を、ユーザデータベース２の中の「日産」「花子」さんの登録情報に書き込むことができる。

また、ドライバが呼び名「いっちゃん」と呼ぶ人の電話番号と声紋と呼び名「いっちゃん」を含む登録情報をユーザデータベース２に生成することができる。

以上のように、図４のフローチャートによれば、呼び名で呼ばれる対象者（電話相手）との電話中の発話者（ドライバ）の音声をテキストデータに変換し（Ｓ２５）、テキストデータから呼び名（お母さん、いっちゃん）を抽出し（Ｓ２７）、対象者（電話相手）の電話番号を検出し（Ｓ２１）、電話番号を含む登録情報をデータベース（２）から検索する（Ｓ３３）。

そして、検索した電話番号を含む登録情報がデータベース（２）に存在する場合は（Ｓ３３：ＹＥＳ）、電話番号を含む登録情報に呼び名（お母さん）を書き込む（Ｓ３５）。

また、検索した電話番号を含む登録情報がデータベースに存在しない場合は（Ｓ３３：ＮＯ）、電話番号と呼び名（いっちゃん）とを含む登録情報をデータベース（２）に生成する（Ｓ３７）。

図５は、図４と同様の状況で行われる電話の通話中での情報処理装置１００の別な動作を示すフローチャートである。ここでは、図４のステップＳ２１（電話番号の検出）を不要とする動作について説明する。

まず、ドライバ（発話者）が、「お母さん、次の日曜日に時間ある？」のように発話すると（Ｓ４１）、音声認識部３が、ドライバの発話の音声を音声認識し、テキストデータに変換する（Ｓ４３）。

次に、意図推定部４が、テキストデータを単語に分解し、呼び名データベース１に登録された呼び名と同じ単語、すなわち呼び名「お母さん」を抽出する（Ｓ４５）。

また、電話相手（発話者との対話中の対象者）が、「あるけど、何か用があるの？」のように発話すると（Ｓ４７）、声紋識別部８は、発話の音声から電話相手の声紋を検出する（Ｓ４９）。

次に、意図推定部４は、ステップＳ４９で検出した声紋を含む登録情報をユーザデータベース２から検索する（Ｓ５１）。

ステップＳ４９で検出した声紋を含む複数の登録情報がある場合（Ｓ５３：ＹＥＳ）、検索結果出力部５が、意図推定部４による検索結果をドライバに提示する（Ｓ５５）。

例えば、「日産」、「花子」さんの声紋と、「日産」、「直子」さんの声紋が類似している場合、声紋検出の精度によっては、名字「日産」、名前「花子」を含む登録情報と、名字「日産」、名前「直子」を含む登録情報とが検索される場合がある。つまり、複数の登録情報が検索される場合がある。

この場合、検索結果出力部５は、ステップＳ４５で抽出した呼び名「お母さん」を用い、「「お母さん」は「日産」「花子」さんですか、それとも、「日産」「直子」さんですか？」というように音声を出力する（Ｓ５５）。つまり、複数の登録情報を発話者（ドライバ）に提示する。

これに対し、ドライバが「「日産」「花子」です」と発話すると（Ｓ５７）、音声認識部３が、ドライバの発話の音声を音声認識してテキストデータに変換し、意図推定部４が、「「日産」「花子」」の回答であることを認識する。

すなわち、「日産」「花子」を含む登録情報が特定されたことになる。また、ステップＳ４９で検出した声紋を含む登録情報が１つの場合（Ｓ５３：ＮＯ）、この１つの登録情報が特定されたことになる。

このようにして、１つの登録情報が特定されると、データベース更新部６が、特定された登録情報に対し、ステップＳ４５で抽出した呼び名を書き込む（Ｓ５９）。そして、履歴情報を更新し、処理を終える。

図５の処理により、ドライバが「日産」「花子」さんを呼ぶときの呼び名「お母さん」を、ユーザデータベース２の中の「日産」「花子」さんの登録情報に書き込むことができる。

また、ドライバが呼び名「課長」で呼ぶ「青山」「一郎」さんが電話相手の場合、呼び名「課長」を、ユーザデータベース２の中の「青山」「一郎」さんの登録情報に書き込むことができる。

また、電話相手である「青山」「一郎」さんが乗る車両にも情報処理装置１００が搭載されていれば、「青山」「一郎」さんがドライバ「日産」「太郎」さんを呼ぶときの呼び名、例えば「日産くん」を、「青山」「一郎」さんが乗る車両の「日産」「太郎」さんの登録情報に書き込むことができる。

以上のように、図５のフローチャートによれば、呼び名で呼ばれる対象者（電話相手）との対話中の発話者（ドライバ）の音声をテキストデータに変換し（Ｓ４３）、テキストデータから呼び名（お母さん）を抽出し（Ｓ４５）、発話者との対話中の対象者（電話相手）の音声から声紋を検出する（Ｓ４９）。そして、声紋を含む登録情報をデータベース（２）から検索し（Ｓ５１）、検索した登録情報に呼び名を書き込む（Ｓ５９）。

また、検索した複数の登録情報（日産花子、日産直子）を発話者（ドライバ）に提示し（Ｓ５５）、発話者が選択した登録情報に呼び名を書き込む（Ｓ５９）。

図６は、対象車両の車内でドライバと同乗者が会話しているときの情報処理装置１００の動作を示すフローチャートである。このドライバをドライバＡ、この同乗者を同乗者Ｂという。

ここでは、ユーザデータベース２が、ドライバＡと同乗者Ｂ、つまり複数の乗員ごとに設けられる。

また、情報処理装置１００にとっては、ドライバＡと同乗者Ｂの名字と名前、性別、第１～第３電話番号、住所、声紋といった情報が既知であることとする。

まず、ドライバＡと同乗者Ｂの一方（発話者）が、「お母さん、次の日曜日に時間ある？」のように発話すると（Ｓ７１）、声紋識別部８は、発話の音声から発話者の声紋を検出する（Ｓ７３）。

次に、意図推定部４は、ステップＳ７３で検出した声紋に基づき、発話者がドライバＡか同乗者Ｂかを特定し、特定した発話者のユーザデータベース２を処理対象として選択する（Ｓ７５）。

例えば、予めドライバＡのユーザデータベース２にドライバＡの声紋を記憶させ、同乗者Ｂのユーザデータベース２に同乗者Ｂの声紋を記憶させ、検出した声紋と照合することにより、発話者を特定できる。

また、音声認識部３は、ステップＳ７１の発話の音声を音声認識し、テキストデータに変換する（Ｓ７７）。

次に、意図推定部４が、テキストデータを単語に分解し、呼び名データベース１に登録された呼び名と同じ単語、すなわち呼び名「お母さん」を抽出する（Ｓ７９）。

そして、相手が、「あるけど、何か用があるの？」のように発話すると（Ｓ８１）、声紋識別部８は、発話の音声から相手の声紋を検出する（Ｓ８３）。

次に、意図推定部４は、ステップＳ８３で検出した声紋を含む登録情報を、ステップＳ７５で選択したユーザデータベース２から検索する（Ｓ８５）。なお、検出した声紋を含む複数の登録情報がある場合は、図５のように検索結果を提示し、発話に基づき、１つの登録情報を特定すればよい。

そして、データベース更新部６が、特定した登録情報に対し、ステップＳ７９で抽出した呼び名を書き込む（Ｓ８７）。そして、履歴情報を更新し、処理を終える。

図６の処理により、ドライバＡが同乗者Ｂを呼ぶときの呼び名「お母さん」を、ドライバＡのユーザデータベース２の中の同乗者Ｂの登録情報に書き込むことができる。また、図６の処理を繰り返し行うことで、別のタイミングでは、同乗者ＢがドライバＡを呼ぶときの呼び名「お父さん」を、同乗者Ｂのユーザデータベース２の中のドライバＡの登録情報に書き込むことができる。

日本では、ドライバＡと同乗者Ｂが夫婦の場合、このようにお互いを「お母さん」「お父さん」と呼ぶことがある。

また、同乗者Ｂともう１人の同乗者（同乗者Ｃという）の会話について同様の処理を行ってもよい。同乗者Ｃが同乗者Ｂの孫である場合、同乗者Ｃが同乗者Ｂを呼び名「おばば」と呼ぶことが考えられる。この場合、呼び名「おばば」が、同乗者Ｃ（孫）のユーザデータベース２の中の同乗者Ｂの登録情報に書き込まれる。

すなわち、ドライバＡ（夫）のユーザデータベース２の中の同乗者Ｂの登録情報に書き込まれる呼び名「お母さん」と、同乗者Ｃ（孫）のユーザデータベース２の中の同乗者Ｂの登録情報に書き込まれる呼び名「おばば」は、同じ同乗者Ｂを呼ぶときの呼び名であっても相違することとなる。

よって、ドライバＡ（夫）は、「お母さんに電話して」と発話することで、同乗者Ｂに電話でき、同乗者Ｃ（孫）は、「おばばに電話して」と発話することで、同乗者Ｂに電話できる。すなわち、それぞれの呼び方で同乗者Ｂに電話することができる。

以上のように、図６のフローチャートによれば、呼び名で呼ばれる対象者との対話中の発話者の音声をテキストデータに変換し（Ｓ７７）、テキストデータから呼び名（お母さん）を抽出し（Ｓ７９）、発話者との対話中の対象者（会話の相手）の音声から声紋を検出する（Ｓ８３）。そして、声紋が登録された登録情報をデータベース（２）から検索し（Ｓ８５）、検索した登録情報に呼び名を書き込む（Ｓ８７）。

以上、実施の形態について説明したが、同様の処理を行うことで、種々の変形例を実施することができる。

例えば、情報処理装置１００は、車両（四輪車）でなく、オートバイ、自転車などの乗り物に搭載してもよい。また、情報処理装置１００を電話機（固定電話又は携帯電話）に内蔵してもよい。その際は、電話処理部７は、電話機のものを流用すればよい。

また、情報処理装置１００を会議室などに設置し、図６の処理を行ってもよい。

また、情報処理装置１００を、インターネットなどに接続された通信可能なコンピュータに搭載し、テキストデータは電子メールや対話用のアプリケーションソフトウェアなどから取得してもよい。その際、電話番号に代えて、電子メールアドレスやユーザＩＤを使用すればよい。そして、電話の会話に代えて、電子メールの送受信や対話用のアプリケーションソフトウェアにおける対話を行ってもよい。

上記のように、本発明の実施形態を記載したが、この開示の一部をなす論述及び図面はこの発明を限定するものであると理解すべきではない。この開示から当業者には様々な代替実施の形態、実施例及び運用技術が明らかとなろう。

上述の各実施形態で示した各機能は、１又は複数の処理回路により実装され得る。処理回路は、電気回路を含む処理装置等のプログラムされた処理装置を含む。処理装置は、また、実施形態に記載された機能を実行するようにアレンジされた特定用途向け集積回路（ＡＳＩＣ）や従来型の回路部品のような装置を含む。

１呼び名データベース
２ユーザデータベース（データベース）
３音声認識部
４意図推定部
５検索結果出力部
６データベース更新部
７電話処理部
８声紋識別部
１００情報処理装置

Claims

データベースから登録情報を検索する情報処理装置の情報処理方法であって、
前記情報処理装置は、
発話者の音声をテキストデータに変換し、
前記テキストデータから呼び名を抽出し、
前記呼び名を含む登録情報を前記データベースから検索し、
前記呼び名を含む登録情報が前記データベースに存在しない場合には前記呼び名に対応する条件を満たす登録情報を前記データベースから検索し、
検索した前記呼び名に対応する条件を満たす登録情報を前記発話者に提示する
ことを特徴とする情報処理方法。
前記呼び名は人名を示す呼び名であり、
前記呼び名に対応する条件は、名字、性別、住所、及び電話番号のうちの少なくともいずれかを含む
ことを特徴とする請求項１記載の情報処理方法。
前記情報処理装置は、
前記呼び名と、検索した前記呼び名に対応する条件を満たす登録情報に含まれている人物の名前とを対応付けて前記発話者に提示する
ことを特徴とする請求項１記載の情報処理方法。
前記情報処理装置は、
前記呼び名と、検索した前記呼び名に対応する条件を満たす登録情報に含まれている人物の名前とを対応付けて前記発話者に提示し、
前記発話者から肯定的な回答があった場合には、前記登録情報に対応付けて前記呼び名を記録する
ことを特徴とする請求項１記載の情報処理方法。
前記情報処理装置は、
検索した前記登録情報に前記呼び名を書き込む
ことを特徴とする請求項１記載の情報処理方法。
前記情報処理装置は、
前記発話者が希望する制御を示すコマンドを前記テキストデータから抽出し、
検索した前記登録情報を用いて、前記コマンドに応じた制御を行う
ことを特徴とする請求項１乃至５のいずれかに記載の情報処理方法。
前記情報処理装置は、
前記呼び名で呼ばれる対象者との電話中の前記発話者の音声を前記テキストデータに変換し、
前記テキストデータから呼び名を抽出し、
前記対象者の電話番号を検出し、
前記電話番号を含む登録情報を前記データベースから検索し、
検索した前記電話番号を含む前記登録情報が前記データベースに存在する場合は、前記電話番号を含む前記登録情報に前記呼び名を書き込む
ことを特徴とする請求項１乃至６のいずれかに記載の情報処理方法。
前記情報処理装置は、
検索した前記電話番号を含む前記登録情報が前記データベースに存在しない場合は、前記電話番号と前記呼び名とを含む登録情報を前記データベースに生成する
ことを特徴とする請求項７記載の情報処理方法。
前記情報処理装置は、
前記呼び名で呼ばれる対象者との対話中の前記発話者の音声を前記テキストデータに変換し、
前記テキストデータから呼び名を抽出し、
前記発話者との対話中の前記対象者の音声から声紋を検出し、
前記声紋を含む前記登録情報を前記データベースから検索し、
検索した前記登録情報に前記呼び名を書き込む
ことを特徴とする請求項１乃至８のいずれかに記載の情報処理方法。
前記情報処理装置は、
検索した複数の前記登録情報を前記発話者に提示し、
前記発話者が選択した前記登録情報に前記呼び名を書き込む
ことを特徴とする請求項１又は９記載の情報処理方法。
登録情報を記憶するデータベースと、
発話者の音声をテキストデータに変換する音声認識部と、
前記テキストデータから呼び名を抽出し、前記呼び名を含む登録情報を前記データベースから検索し、前記呼び名を含む登録情報が前記データベースに存在しない場合には前記呼び名に対応する条件を満たす登録情報を前記データベースから検索する意図推定部と、
検索した前記呼び名に対応する条件を満たす登録情報を前記発話者に提示する検索結果出力部と
を備えることを特徴とする情報処理装置。