JP2007280104A - 情報処理装置、情報処理方法、情報処理プログラムおよびコンピュータに読み取り可能な記録媒体 - Google Patents

情報処理装置、情報処理方法、情報処理プログラムおよびコンピュータに読み取り可能な記録媒体 Download PDF

Info

Publication number
JP2007280104A
JP2007280104A JP2006106373A JP2006106373A JP2007280104A JP 2007280104 A JP2007280104 A JP 2007280104A JP 2006106373 A JP2006106373 A JP 2006106373A JP 2006106373 A JP2006106373 A JP 2006106373A JP 2007280104 A JP2007280104 A JP 2007280104A
Authority
JP
Japan
Prior art keywords
word
standby
information processing
utterance content
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006106373A
Other languages
English (en)
Inventor
Sakae Onodera
栄 小野寺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pioneer Corp
Original Assignee
Pioneer Electronic Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pioneer Electronic Corp filed Critical Pioneer Electronic Corp
Priority to JP2006106373A priority Critical patent/JP2007280104A/ja
Publication of JP2007280104A publication Critical patent/JP2007280104A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】待ち受け語の一部を忘れた場合など、全てを正確に発話出来なくても、目的の語句を検索して所望の処理を実現すること。
【解決手段】まず、認識部101は、入力された音声から発話内容を認識する。識別部102は、認識部101によって認識された発話内容から、あらかじめ定められた置き換え語を識別する。次に、選択部103は、識別部102によって置き換え語が識別された場合、発話内容から置き換え語を除いた部分を待ち受け語と照合し、この部分を含む待ち受け語を選択する。そして、処理部104は、選択部103によって選択された待ち受け語に基づく処理を実行する。
【選択図】図1

Description

この発明は、音声による指示を認識して処理を実行する情報処理装置、情報処理方法、情報処理プログラムおよびコンピュータに読み取り可能な記録媒体に関する。ただし、この発明の利用は、上述の音声による指示を認識して処理を実行する情報処理装置、情報処理方法、情報処理プログラムおよびコンピュータに読み取り可能な記録媒体に限らない。
従来、音声によって指示を出して、音声による指示を認識して処理を実行するナビゲーション装置があった。たとえば、音声によって目的地を指示したり、付属のオーディオ装置による音楽の再生を指示したりすることができるナビゲーション装置があった。このようなナビゲーション装置で音声認識を用いて語句を認識する場合、認識する語句を用意しておいて、発話された内容に対して一番近いものを結果として出力していた(たとえば、特許文献1参照。)。
一方で、このような音声認識では、予め待ち受けている語句以外のものに対しての対策はなされていないので、ユーザが発話開始時や語尾に「えぇっと」や「それで」などという意味をなさない語句を発話した場合には、この意味をなさない語句を含めて待ち受け語に対してマッチングしてしまうため、誤認識する可能性が高くなってしまう。そこで、このような発話に対応するために、語句の前後にあらゆる音素にマッチング出来るようなモデルを付加したり、「えぇっと」などの予め予想できる単語モデルを付加したりすることによって対応していた。
特開平11−224265号公報
しかしながら、発話者が発話により語句を認識させようという場合、発話内容と待ち受け語が完全に一致しなければ発話者が要望する語句を認識させるのが難しいため、予め待ち受けている単語の内容を把握して発話をしなければならなかった。したがって、発話する内容の一部を忘れてしまった場合、その一部を除いて待ち受け語を把握しているにも関わらず、発話内容を待ち受け語と一致させることができない。その結果、忘れた場合には待ち受け語にたどり着くのが非常に困難となってしまっていたという問題が一例として挙げられる。
また、発話内容と待ち受け語は完全に一致しなければならないわけではなく、単語の前後に付く無意味な語句に対する対応はなされていて、発話内容がこの無意味な語句を含む場合でも待ち受け語と一致するものとして処理することができた。しかしこの処理は、余分な語句が加わった場合に発話内容と待ち受け語を一致させる処理であり、待ち受け語に含まれる語句の一部が、発話内容に含まれていない場合に対応するものではなかった。したがって、発話内容の一部を忘れてしまったものに関しては対応されていなかったという問題が一例として挙げられる。
請求項1の発明にかかる情報処理装置は、入力された音声から発話内容を認識する認識手段と、前記認識手段によって認識された発話内容から、あらかじめ定められた置き換え語を識別する識別手段と、前記識別手段によって前記置き換え語が識別された場合、前記発話内容から前記置き換え語を除いた部分を待ち受け語と照合し、前記部分を含む待ち受け語を選択する選択手段と、前記選択手段によって選択された待ち受け語に基づく処理を実行する処理手段と、を備えることを特徴とする。
また、請求項5の発明にかかる情報処理方法は、入力された音声から発話内容を認識する認識工程と、前記認識工程によって認識された発話内容から、あらかじめ定められた置き換え語を識別する識別工程と、前記識別工程によって前記置き換え語が識別された場合、前記発話内容から前記置き換え語を除いた部分を待ち受け語と照合し、前記部分を含む待ち受け語を選択する選択工程と、前記選択工程によって選択された待ち受け語に基づく処理を実行する処理工程と、を含むことを特徴とする。
また、請求項6の発明にかかる情報処理プログラムは、請求項5に記載の情報処理方法をコンピュータに実行させることを特徴とする。
また、請求項7の発明にかかるコンピュータに読み取り可能な記録媒体は、請求項6に記載の情報処理プログラムを記録したことを特徴とする。
以下に添付図面を参照して、この発明にかかる情報処理装置、情報処理方法、情報処理プログラムおよびコンピュータに読み取り可能な記録媒体の好適な実施の形態を詳細に説明する。
図1は、この発明の実施の形態にかかる情報処理装置の機能的構成を示すブロック図である。この実施の形態の情報処理装置は、認識部101、識別部102、選択部103、処理部104により構成されている。
認識部101は、入力された音声から発話内容を認識する。具体的には、マイクなどにより入力された音声を解析して、音声を構成する文字(たとえば、“か”)や文字構成要素(たとえば、“か(ka)”を構成する“k”や“a”)の一つ一つを特定する。そして、その文字や文字構成要素の連続について繰り返すことにより発話内容を認識する。
識別部102は、認識部101によって認識された発話内容から、あらかじめ定められた置き換え語を識別する。つまり、発話内容を構成する文字や文字構成要素の連続から、置き換え語に一致する単語を識別する。一致する場合には、その単語を置き換え語が含まれているとして識別する。
選択部103は、識別部102によって置き換え語が識別された場合、発話内容から置き換え語を除いた部分を待ち受け語と照合し、この部分を含む待ち受け語を選択する。たとえば、「かわごえ_なんとか_ほてる」と発話した場合、置き換え語である「なんとか」を除いた部分を照合し、「かわごえ」と「ほてる」を含む待ち受け語を選択する。このとき、施設名称「かわごえあいうえおほてる」の待ち受け語「かわごえ_あいうえお_ほてる」が「なんとか」を「あいうえお」に置き換えた形になっているので、この待ち受け語を選択する。なお、置き換え語の位置に何らかの文字がない待ち受け語が照合された場合でも、この待ち受け語を選択することができる。たとえば、「かわごえ_ほてる」という待ち受け語も選択することができる。
すなわち、選択部103は、発話内容を単語ごとに分割して各単語について待ち受け語と照合し、発話内容のうち置き換え語を除いた各単語が含まれるとともに置き換え語の位置に他の単語が含まれている待ち受け語を選択する。なお、選択部103は、認識部102によって置き換え語が識別されなかった場合には、発話内容全体を待ち受け語と照合して発話内容に一致する待ち受け語を選択する。
ここで、発話内容に置き換え語が含まれている場合の待ち受け語の選択方法は、上述した方法以外でもよい。たとえば、待ち受け語に各々に対して置き換え語を含んだ待ち受け語を展開し、これら展開された待ち受け語と発話内容の全体とをマッチングさせて、一番良くマッチングするものに対応する待ち受け語を選択するようにしてもよい。具体的には、たとえば、施設名称「かわごえあいうえおほてる」の待ち受け語「かわごえ_あいうえお_ほてる」に対して「かわごえ_あいうえお_ほてる」、「かわごえ_あいうえお_なんとか」、「かわごえ_なんとか_ほてる」、「なんとか_あいうえお_ほてる」・・・というように展開し、発話内容が「かわごえなんとかほてる」である場合には、この発話内容と一番マッチングする「かわごえ_なんとか_ほてる」に対応する待ち受け語「かわごえ_あいうえお_ほてる」を選択する。
処理部104は、選択部103によって選択された待ち受け語に基づく処理を実行する。たとえば、待ち受け語によって特定される地点を目的地として設定し、この目的地への経路を探索することができる。また、たとえば、待ち受け語によってオーディオなど他の機能の実行を判別し、ここで判別されたオーディオなどの機能を実行することもできる。また、処理部104は、選択部103によって複数の待ち受け語が選択された場合に、複数の待ち受け語のうち一つの指示を受けつけ、指示された待ち受け語に基づいて処理を実行することもできる。
図2は、この発明の実施の形態にかかる情報処理の手順を示すフローチャートである。まず、認識部101は、入力された音声から発話内容を認識する(ステップS201)。次に、識別部102は、認識部101によって認識された発話内容から、あらかじめ定められた置き換え語を識別する(ステップS202)。次に、選択部103は、識別部101によって置き換え語が識別されたか否かを判定する(ステップS203)。
識別部101によって置き換え語が識別されなかった場合(ステップS203:No)には、選択部103は、発話内容全体と待ち受け語を照合し、一致する待ち受け語を選択する(ステップS204)。そして、ステップS206に進む。
一方、識別部101によって置き換え語が識別された場合(ステップS203:Yes)には、選択部103は、発話内容から置き換え語を除いた部分を待ち受け語と照合し、この部分を含む待ち受け語を選択する(ステップS205)。
そして、処理部104は、ステップS204またはステップS205において選択部103によって選択された待ち受け語に基づく処理を実行する(ステップS206)。そして、一連の処理を終了する。
以上説明した実施の形態により、待ち受け語を構成する単語のすべてを入力できない場合でも、待ち受け語の一部と置き換え語を組み合わせて入力することにより、待ち受け語が入力されたものとして認識することができる。それにより、待ち受け語と完全に一致させずに入力した場合でも、その待ち受け語に対応する所望の処理を実行することができる。たとえば、待ち受け語を忘れた場合でも、忘れた部分を置き換え語で置き換えて入力して所望の処理を実行することができる。
(情報処理装置のハードウェア構成)
図3は、情報処理装置のハードウェア構成を示すブロック図である。この実施例は、上述した実施の形態にかかる情報処理装置を、移動体としての車両に搭載された情報処理装置に適用した例である。はじめに、実施例の情報処理装置のハードウェア構成について図3を参照して説明する。
図3に示すように、実施例の情報処理装置は、CPU301と、ROM302と、RAM(メモリ)303と、磁気ディスクドライブ304と、磁気ディスク305と、光ディスクドライブ306と、光ディスク307と、音声I/F(インターフェース)308と、マイク309と、スピーカ310と、入力デバイス311と、映像I/F312と、カメラ313と、ディスプレイ314と、通信I/F315と、GPSユニット316と、各種センサ317と、を備えている。また、各構成部301〜317は、バス320によってそれぞれ接続されている。
まず、CPU301は、情報処理装置の全体の制御を司る。ROM302は、ブートプログラム、ナビゲーションプログラムなどのプログラムを記録している。RAM303は、CPU301のワークエリアとして使用される。
ここで、ナビゲーションプログラムには、CPU301によって実行されることにより、入力された音声から発話内容を認識させ、認識された発話内容から、あらかじめ定められた置き換え語を識別させ、置き換え語が識別された場合、発話内容から置き換え語を除いた部分を待ち受け語と照合し、この部分を含む待ち受け語を選択させ、選択された待ち受け語に基づく処理を実行させるプログラムが含まれる。
磁気ディスクドライブ304は、CPU301の制御に従って磁気ディスク305に対するデータの読み取り/書き込みを制御する。磁気ディスク305は、磁気ディスクドライブ304の制御で書き込まれたデータを記録する。磁気ディスク305としては、たとえば、HD(ハードディスク)やFD(フレキシブルディスク)を用いることができる。
光ディスクドライブ306は、CPU301の制御に従って光ディスク307に対するデータの読み取り/書き込みを制御する。光ディスク307は、光ディスクドライブ306の制御に従ってデータが読み出される着脱自在な記録媒体である。光ディスク307は、書き込み可能な記録媒体を利用することもできる。また、この着脱可能な記録媒体として、光ディスク307のほか、MO、メモリカードなどであってもよい。
磁気ディスク305や光ディスク307に記録される情報の他の一例として、経路探索・経路誘導などに用いる地図データが挙げられる。地図データは、建物、河川、地表面などの地物(フィーチャ)をあらわす背景データと、道路の形状をあらわす道路形状データとを有しており、ディスプレイ314の表示画面において2次元または3次元に描画される。情報処理装置が経路誘導中の場合は、地図データとCPU301によって取得された車両の現在地点とが重ねて表示されることとなる。
音声I/F308は、音声入力用のマイク309および音声出力用のスピーカ310に接続される。マイク309に受音された音声は、音声I/F308内でA/D変換される。また、スピーカ310からは音声が出力される。なお、マイク309から入力された音声は、音声データとして磁気ディスク305または光ディスク307に記録可能である。
入力デバイス311は、文字、数値、各種指示などの入力のための複数のキーを備えたリモコン、キーボード、マウス、タッチパネルなどが挙げられる。さらに、入力デバイス311は、デジタルカメラや携帯電話端末などの他の情報処理端末を接続し、データの入出力をおこなうことができる。
映像I/F312は、映像入力用のカメラ313および映像出力用のディスプレイ314と接続される。映像I/F312は、具体的には、たとえば、ディスプレイ314全体の制御をおこなうグラフィックコントローラと、即時表示可能な画像情報を一時的に記録するVRAM(Video RAM)などのバッファメモリと、グラフィックコントローラから出力される画像データに基づいて、ディスプレイ314を表示制御する制御ICなどによって構成される。
カメラ313は、車両内外の映像を撮像し、画像データとして出力する。カメラ313で撮像された画像は、画像データとして磁気ディスク305あるいは光ディスク307に記録可能である。ディスプレイ314には、アイコン、カーソル、メニュー、ウインドウ、あるいは文字や画像などの各種データが表示される。このディスプレイ314は、たとえば、CRT、TFT液晶ディスプレイ、プラズマディスプレイなどを採用することができる。
通信I/F315は、無線を介してネットワークに接続され、情報処理装置とCPU301とのインターフェースとして機能する。通信I/F315は、さらに、無線を介してインターネットなどの通信網に接続され、この通信網とCPU301とのインターフェースとしても機能する。
通信網には、LAN、WAN、公衆回線網や携帯電話網などがある。具体的には、通信I/F315は、たとえば、FMチューナー、VICS/ビーコンレシーバ、無線情報処理装置、およびその他の情報処理装置によって構成され、VICSセンターから配信される渋滞や交通規制などの道路交通情報を取得する。なお、VICSは登録商標である。
GPSユニット316は、GPS衛星からの電波を受信し、情報処理装置を搭載した車両の位置に関する情報を出力する。GPSユニット316の出力情報は、後述する各種センサ317の出力値とともに、CPU301による車両の現在地点の算出に際して利用される。現在地点を示す情報は、たとえば緯度・経度、高度などの、地図データ上の1点を特定する情報である。
各種センサ317は、車速センサや角速度センサなどの、車両の位置や挙動を判断するための情報を出力する。各種センサ317の出力値は、CPU301による車両の現在地点の算出や、速度や方位の変化量の測定に用いられる。
なお、図示および説明を省略するが、情報処理装置は、上述した構成301〜317に加えて、DVDやCDなどの再生、テレビ放送の受信・録画などの各種機能を実現する構成を備えていてもよい。
図4は、待ち受け語の一覧を示す図である。認識辞書400は、待ち受け語401〜404を備えている。待ち受け語401〜404は、いずれも「かわごえ」で始まる待ち受け語である。待ち受け語401は、「かわごえ_あいうえお_ほてる」によって構成される。待ち受け語402は、「かわごえ_かきくけこ_ほてる」によって構成される。待ち受け語403は、「かわごえ_さしすせそ_ほてる」によって構成される。待ち受け語404は、「かわごえ_さしすせそ_でぱーと」によって構成される。以上の待ち受け語401〜404のいずれかが認識されたとき、対応する処理が実行される。
図5は、待ち受け語を単語ごとに分けた場合の認識辞書を示す図である。図4に示した待ち受け語401〜404は、いずれも一連の単語が続いたものであり、この一連の単語がすべて一致しなければ認識されない。そこでこの実施例では、待ち受け語を構成する単語の一部が、本来使用されるべき語を置き換える語であるワイルドカードで差し替えられた場合でも、待ち受け語を認識できるように待ち受け語401〜404をそれぞれ単語ごとに分割して登録する。
具体的には、待ち受け語401は、「かわごえ」「あいうえお」「ほてる」、と各単語を区切った形で登録されている。同様に、待ち受け語402は、「かわごえ」「かきくけこ」「ほてる」、と登録されている。また、待ち受け語403は、「かわごえ」「さしすせそ」「ほてる」、と登録されている。待ち受け語401は、「かわごえ」「さしすせそ」「でぱーと」、と登録されている。
このように、1つの認識語からワイルドカードとして置き換えることが出来るような区切りごとに目印をつけておく。それにより、マッチング時にそれらの部分に対してワイルドカード(この実施例では「なんとか」)で置き換えられる、全パスに対してマッチングを実行する。
図6は、ワイルドカードを含む発話内容を認識した状態を説明する説明図である。発話内容600は、「かわごえ_なんとか_ほてる」である。このうち「なんとか」が、ワイルドカード610に該当する。そして、発話内容600のうち、ワイルドカード610の部分が一致しなくても、他の単語が一致した場合は、その待ち受け語と一致するものとして認識する。
図7は、照合の対象となる待ち受け語リストを説明する図である。待ち受け語リスト700には、待ち受け語710〜730が含まれ、それぞれ単語ごとに区切られて登録されている。
具体的には、待ち受け語710は、「かわごえ」「あいうえお」「ほてる」、と各単語を区切った形で登録されている。同様に、待ち受け語720は、「かわごえ」「さしすせそ」「でぱーと」、と登録されている。待ち受け語730は、「さいたま」「あいうえお」「でぱーと」、と登録されている。
図8は、ワイルドカードを含む発話内容の認識処理を説明する説明図である。ここでは発話内容600を、待ち受け語リスト700に登録された待ち受け語710〜730と照合する。そして、照合にあたって、置き換え処理800でワイルドカード610が考慮される。待ち受け語710と照合する場合、初期状態810から開始する。まず、「かわごえ」が一致する。次の「あいうえお」は一致しないが、発話内容600ではワイルドカード610に該当するので不一致でもよい。そして、「ほてる」が一致し、発話内容600と待ち受け語710が一致することになり、待ち受け語710が認識される。そして、最終状態820に進み、待ち受け語710の照合処理を終わる。
次に、待ち受け語720と照合する場合、初期状態810から開始する。まず、「かわごえ」が一致する。次の「さしすせそ」は一致しないが、発話内容600ではワイルドカード610に該当するので不一致でもよい。しかし、その次の「でぱーと」が一致しないので、発話内容600と待ち受け語720は一致しないと認識される。そして、最終状態820に進み、待ち受け語720の照合処理を終わる。
次に、待ち受け語730と照合する場合、初期状態810から開始する。まず、「さいたま」が一致しない。したがって、後続の単語を照合するまでもなく、発話内容600と待ち受け語730は一致しないと認識される。そして、最終状態820に進み、待ち受け語730の照合処理を終わる。以上のように、発話内容600とは、待ち受け語710のみが一致するので、待ち受け語710が選択される。
図9は、認識された待ち受け語が複数ある場合のリストを説明する説明図である。図7に示した待ち受け語リスト700から検索する場合、待ち受け語710の一つだけが選択されることになるが、ワイルドカード610が含まれる発話内容600と一致するものを検索する場合、該当するものが複数でてくる場合がある。この場合、複数の待ち受け語を選択しておいて、所望のものを選択するようにすることができる。
待ち受け語リスト900には、待ち受け語910〜950が含まれ、それぞれ単語ごとに区切られて登録されている。具体的には、待ち受け語910は、「かわごえ」「あいうえお」「ほてる」、と各単語を区切った形で登録されている。同様に、待ち受け語920は、「かわごえ」「えっくす」「ほてる」、と登録されている。待ち受け語930は、「かわごえ」「さしすせそ」「でぱーと」、と登録されている。待ち受け語940は、「さいたま」「さしすせそ」「でぱーと」、と登録されている。待ち受け語950は、「かわごえ」「ほてる」、と登録されている。
このうち、ワイルドカード610を含めて一致する待ち受け語は、待ち受け語910、待ち受け語920、待ち受け語950ということになる。待ち受け語950は、ワイルドカード610の箇所に単語が含まれていないが、この場合でも、一致するとして認識される。このように3つの待ち受け語が選択される。
図10は、複数の待ち受け語から指示を受け付ける画面の説明図である。表示画面1000には、待ち受け語910、待ち受け語920、待ち受け語950が表示される。すなわち、認識結果にワイルドカード610が含まれていた場合には、待ち受けている辞書や検索履歴など、予めワイルドカード610用に決めていた場所からワイルドカードを考慮してマッチングさせた結果を発話者に提示し、その中から選んでもらうようにする。そして、このうち一つを選択することにより、ユーザは想定していた待ち受け語を選択し、所望の処理を実行することができる。
図11は、待ち受け語を受け付けてから実行するまでの処理を説明するフローチャートである。まず、入力された音声から発話内容600を認識する(ステップS1101)。次に、発話内容600に対応する待ち受け語を選択する(ステップS1102)。ステップS1102の待ち受け語の選択処理については、図12において後述する。
そして、待ち受け語が複数あるか否かを判定する(ステップS1103)。待ち受け語が複数ではなかった場合(ステップS1103:No)、すなわち一つであった場合、ステップS1105に進む。待ち受け語が複数の場合(ステップS1103:Yes)、待ち受け語のうちひとつの指示を受け付け、待ち受け語を特定する(ステップS1104)。そして、待ち受け語の示す処理を実行し(ステップS1105)、一連の処理を終了する。
図12は、待ち受け語の選択処理を説明するフローチャートである。図11のステップS1102に示した待ち受け語の選択処理において、図12に示す処理を実行する。まず、最初の待ち受け語を指定する(ステップS1201)。次に、待ち受け語の単語の発話内容の単語を比較し(ステップS1202)、一致したか否かを判定する(ステップS1203)。一致した場合(ステップS1203:Yes)、ステップS1205に進む。一致しなかった場合(ステップS1203:No)、発話内容の単語が置き換え語、すなわちワイルドカードであるか否かを判定する(ステップS1204)。置き換え語でない場合(ステップS1204:No)、ステップS1207に進む。
置き換え語の場合(ステップS1204:Yes)、すべての単語について比較終了したか否かを判定する(ステップS1205)。終了した場合(ステップS1205:Yes)、ステップS1207に進み、終了していない場合(ステップS1205:No)、次の単語に進んで(ステップS1206)、ステップS1202に戻る。
ステップS1207では、すべての待ち受け語について照合終了したか否かを判定する。すべての待ち受け語について照合終了していない場合(ステップS1207:No)、次の待ち受け語に進み(ステップS1208)、ステップS1202に戻る。すべての待ち受け語について照合終了した場合(ステップS1207:Yes)、発話内容に対応する待ち受け語を選択して(ステップS1209)、一連の処理を終了する。一連の処理を終了した後は、図11に示したステップS1103に進む。
以上説明した実施例によれば、待ち受け語を構成する単語のすべてを入力できない場合でも、待ち受け語の一部と置き換え語を組み合わせて入力することにより、待ち受け語が入力されたものとして認識することができる。たとえば、「かわごえ_あいうえお_ほてる」を検索したいが、「あいうえお」の部分を忘れてしまった場合に、「かわごえ_なんとか_ほてる」と発話することにより検索することができる。
これにより、全てを正確に発話出来なくても目的の語句に辿りつくことが出来る。そして、待ち受け語と完全に一致させずに入力した場合でも、その待ち受け語に対応する所望の処理を実行することができる。たとえば、待ち受け語を忘れた場合でも、忘れた部分を置き換え語で置き換えて入力して所望の処理を実行することができる。
なお、本実施の形態で説明した情報処理方法は、予め用意されたプログラムをパーソナルコンピュータやワークステーションなどのコンピュータで実行することにより実現することができる。このプログラムは、ハードディスク、フレキシブルディスク、CD−ROM、MO、DVDなどのコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。またこのプログラムは、インターネットなどのネットワークを介して配布することが可能な伝送媒体であってもよい。
この発明の実施の形態にかかる情報処理装置の機能的構成を示すブロック図である。 この発明の実施の形態にかかる情報処理の手順を示すフローチャートである。 情報処理装置のハードウェア構成を示すブロック図である。 待ち受け語の一覧を示す図である。 待ち受け語を単語ごとに分けた場合の認識辞書を示す図である。 ワイルドカードを含む発話内容を認識した状態を説明する説明図である。 照合の対象となる待ち受け語リストを説明する図である。 ワイルドカードを含む発話内容の認識処理を説明する説明図である。 認識された待ち受け語が複数ある場合のリストを説明する説明図である。 複数の待ち受け語から指示を受け付ける画面の説明図である。 待ち受け語を受け付けてから実行するまでの処理を説明するフローチャートである。 待ち受け語の選択処理を説明するフローチャートである。
符号の説明
101 認識部
102 識別部
103 選択部
104 処理部

Claims (7)

  1. 入力された音声から発話内容を認識する認識手段と、
    前記認識手段によって認識された発話内容から、あらかじめ定められた置き換え語を識別する識別手段と、
    前記識別手段によって前記置き換え語が識別された場合、前記発話内容から前記置き換え語を除いた部分を待ち受け語と照合し、前記部分を含む待ち受け語を選択する選択手段と、
    前記選択手段によって選択された待ち受け語に基づく処理を実行する処理手段と、
    を備えることを特徴とする情報処理装置。
  2. 前記選択手段は、前記発話内容を単語ごとに分割して各単語について前記待ち受け語と照合し、前記発話内容のうち前記置き換え語を除いた各単語が含まれるとともに前記置き換え語の位置に他の単語が含まれている待ち受け語を選択することを特徴とする請求項1に記載の情報処理装置。
  3. 前記選択手段によって照合される待ち受け語は、過去に認識された発話内容の履歴として用意されることを特徴とする請求項1または2に記載の情報処理装置。
  4. 前記処理手段は、前記選択手段によって複数の待ち受け語が選択された場合に、前記複数の待ち受け語のうち一つの指示を受けつけ、指示された待ち受け語に基づいて処理を実行することを特徴とする請求項1〜3のいずれか一つに記載の情報処理装置。
  5. 入力された音声から発話内容を認識する認識工程と、
    前記認識工程によって認識された発話内容から、あらかじめ定められた置き換え語を識別する識別工程と、
    前記識別工程によって前記置き換え語が識別された場合、前記発話内容から前記置き換え語を除いた部分を待ち受け語と照合し、前記部分を含む待ち受け語を選択する選択工程と、
    前記選択工程によって選択された待ち受け語に基づく処理を実行する処理工程と、
    を含むことを特徴とする情報処理方法。
  6. 請求項5に記載の情報処理方法をコンピュータに実行させることを特徴とする情報処理プログラム。
  7. 請求項6に記載の情報処理プログラムを記録したことを特徴とするコンピュータに読み取り可能な記録媒体。


JP2006106373A 2006-04-07 2006-04-07 情報処理装置、情報処理方法、情報処理プログラムおよびコンピュータに読み取り可能な記録媒体 Pending JP2007280104A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006106373A JP2007280104A (ja) 2006-04-07 2006-04-07 情報処理装置、情報処理方法、情報処理プログラムおよびコンピュータに読み取り可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006106373A JP2007280104A (ja) 2006-04-07 2006-04-07 情報処理装置、情報処理方法、情報処理プログラムおよびコンピュータに読み取り可能な記録媒体

Publications (1)

Publication Number Publication Date
JP2007280104A true JP2007280104A (ja) 2007-10-25

Family

ID=38681483

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006106373A Pending JP2007280104A (ja) 2006-04-07 2006-04-07 情報処理装置、情報処理方法、情報処理プログラムおよびコンピュータに読み取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JP2007280104A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009169418A (ja) * 2008-01-16 2009-07-30 Harman Becker Automotive Systems Gmbh フラグメントを使用した大規模なリストにおける音声認識
CN111862943A (zh) * 2019-04-30 2020-10-30 北京地平线机器人技术研发有限公司 语音识别方法和装置、电子设备和存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56121100A (en) * 1980-02-29 1981-09-22 Nissan Motor Voice identification driving device
JPH05189492A (ja) * 1992-01-14 1993-07-30 Nec Corp 検索式自動生成装置
JPH06266779A (ja) * 1993-03-15 1994-09-22 Hitachi Ltd 制御装置
JPH1195793A (ja) * 1997-09-17 1999-04-09 Toshiba Corp 音声入力解釈装置及び音声入力解釈方法
JP2002297182A (ja) * 2001-03-29 2002-10-11 Sanyo Electric Co Ltd 音声認識装置および音声認識方法
JP2004213091A (ja) * 2002-12-26 2004-07-29 Canon Inc 文書画像検索装置及びその方法、文書画像検索システム、プログラム
JP2004295102A (ja) * 2003-03-13 2004-10-21 Matsushita Electric Ind Co Ltd 音声認識辞書作成装置及び情報検索装置
JP2005257954A (ja) * 2004-03-10 2005-09-22 Nec Corp 音声検索装置、音声検索方法および音声検索プログラム
JP2005326497A (ja) * 2004-05-12 2005-11-24 Nippon Telegr & Teleph Corp <Ntt> 音声認識方法、音声認識装置、音声認識プログラム、記録媒体

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56121100A (en) * 1980-02-29 1981-09-22 Nissan Motor Voice identification driving device
JPH05189492A (ja) * 1992-01-14 1993-07-30 Nec Corp 検索式自動生成装置
JPH06266779A (ja) * 1993-03-15 1994-09-22 Hitachi Ltd 制御装置
JPH1195793A (ja) * 1997-09-17 1999-04-09 Toshiba Corp 音声入力解釈装置及び音声入力解釈方法
JP2002297182A (ja) * 2001-03-29 2002-10-11 Sanyo Electric Co Ltd 音声認識装置および音声認識方法
JP2004213091A (ja) * 2002-12-26 2004-07-29 Canon Inc 文書画像検索装置及びその方法、文書画像検索システム、プログラム
JP2004295102A (ja) * 2003-03-13 2004-10-21 Matsushita Electric Ind Co Ltd 音声認識辞書作成装置及び情報検索装置
JP2005257954A (ja) * 2004-03-10 2005-09-22 Nec Corp 音声検索装置、音声検索方法および音声検索プログラム
JP2005326497A (ja) * 2004-05-12 2005-11-24 Nippon Telegr & Teleph Corp <Ntt> 音声認識方法、音声認識装置、音声認識プログラム、記録媒体

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009169418A (ja) * 2008-01-16 2009-07-30 Harman Becker Automotive Systems Gmbh フラグメントを使用した大規模なリストにおける音声認識
CN111862943A (zh) * 2019-04-30 2020-10-30 北京地平线机器人技术研发有限公司 语音识别方法和装置、电子设备和存储介质
CN111862943B (zh) * 2019-04-30 2023-07-25 北京地平线机器人技术研发有限公司 语音识别方法和装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
JP5334178B2 (ja) 音声認識装置およびデータ更新方法
US7310602B2 (en) Navigation apparatus
JP2013068532A (ja) 情報端末、サーバー装置、検索システムおよびその検索方法
JP2008014818A (ja) 作動制御装置、プログラム
JP2011179917A (ja) 情報記録装置、情報記録方法、情報記録プログラムおよび記録媒体
JP5217838B2 (ja) 車載機器の操作装置及び車載機器の操作方法
JP4914632B2 (ja) ナビゲーション装置
WO2014199428A1 (ja) 候補告知装置、候補告知方法及び候補告知用プログラム
JP5455355B2 (ja) 音声認識装置及びプログラム
JP2005275228A (ja) ナビゲーション装置
JP2007280104A (ja) 情報処理装置、情報処理方法、情報処理プログラムおよびコンピュータに読み取り可能な記録媒体
JP5160653B2 (ja) 情報提供装置、通信端末、情報提供システム、情報提供方法、情報出力方法、情報提供プログラム、情報出力プログラムおよび記録媒体
JP2000122685A (ja) ナビゲーションシステム
KR100677711B1 (ko) 음성 인식 장치, 기억 매체 및 네비게이션 장치
US20150192425A1 (en) Facility search apparatus and facility search method
JP2003005783A (ja) ナビゲーションシステムおよびその目的地入力方法
WO2006028171A1 (ja) データ提示装置、データ提示方法、データ提示プログラムおよびそのプログラムを記録した記録媒体
JP2010038751A (ja) ナビゲーション装置
JP2005114964A (ja) 音声認識方法および音声認識処理装置
JP2001083983A (ja) 音声認識装置、音声認識のためのデータを記録した記録媒体、および、音声認識ナビゲーション装置
JPH0916191A (ja) ナビゲータ用音声認識装置および方法
JP2006349427A (ja) 車載音声認識装置
JP4645708B2 (ja) コード認識装置および経路探索装置
JP2009086132A (ja) 音声認識装置、音声認識装置を備えたナビゲーション装置、音声認識装置を備えた電子機器、音声認識方法、音声認識プログラム、および記録媒体
JP2005031260A (ja) 情報処理方法及び装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090304

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110208

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110411

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120124

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120522