JP4466171B2 - Information retrieval device - Google Patents
Information retrieval device Download PDFInfo
- Publication number
- JP4466171B2 JP4466171B2 JP2004114385A JP2004114385A JP4466171B2 JP 4466171 B2 JP4466171 B2 JP 4466171B2 JP 2004114385 A JP2004114385 A JP 2004114385A JP 2004114385 A JP2004114385 A JP 2004114385A JP 4466171 B2 JP4466171 B2 JP 4466171B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- voice
- order
- list
- driver
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000013500 data storage Methods 0.000 description 34
- 238000000034 method Methods 0.000 description 34
- 238000006243 chemical reaction Methods 0.000 description 9
- 230000004044 response Effects 0.000 description 5
- 230000004913 activation Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 239000000470 constituent Substances 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 210000000707 wrist Anatomy 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、音声により情報を検索する情報検索装置、および方法に関する。 The present invention relates to an information search apparatus and method for searching for information by voice.
電話番号と、電話番号と関連付けた音声タグとをメモリに格納しておき、使用者に対してメモリに格納した音声タグを登録順に順次音声で提示し、使用者が発信先に相当する音声タグが提示された時点で当該音声タグを選択することで、選択した音声タグに関連付けられた電話番号を参照するようにした無線電話が特許文献1によって知られている。 The phone number and the voice tag associated with the phone number are stored in the memory, and the voice tag stored in the memory is sequentially presented to the user in the order of registration, so that the user corresponds to the destination. Patent Document 1 discloses a radiotelephone in which a telephone number associated with a selected voice tag is referred to by selecting the voice tag at the time when the voice tag is presented.
しかしながら、使用者に対してメモリに記憶した音声タグを格納順に順次音声で提示する従来の装置においては、メモリに格納したデータ量が多い場合、また発信先に該当する音声タグがメモリ内の後方に格納されている場合には、発信先の音声タグが提示されるまでに時間がかかるという問題が生じていた。 However, in the conventional apparatus that presents the voice tags stored in the memory to the user sequentially in the order of storage, when the amount of data stored in the memory is large, the voice tag corresponding to the destination is located in the rear of the memory. In the case where it is stored in the network, there has been a problem that it takes time until the destination voice tag is presented.
本発明は、複数の情報を記憶するとともに、各情報ごとに付された情報の略称の音声データ(以下、音声タグという)を前記各情報に対応付けて記憶しておき、音声入力した情報の略称を各情報の音声タグと照合し、記憶されている情報の中から一致結果が得られた音声タグに対応する情報を検索する情報検索装置および方法において、各情報の検索履歴を記憶しておき、複数の情報の略称のリストを各情報の検索履歴に応じた順序で音声により提示することを特徴とする。 The present invention stores a plurality of pieces of information and also stores abbreviated audio data (hereinafter referred to as audio tags) of information attached to each information in association with the information. In an information search device and method for searching for information corresponding to a voice tag for which a matching result is obtained from stored information by comparing an abbreviation with a voice tag of each information, a search history of each information is stored. In addition, a list of abbreviations of a plurality of information is presented by voice in an order corresponding to a search history of each information.
本発明によれば、必要な情報にたどり着くまでの検索時間を短縮できる可能性が高くなり、利便性を向上させることができる。 According to the present invention, it is highly possible to shorten the search time until the required information is reached, and convenience can be improved.
図1は、本発明による情報検索装置の一実施の形態を示し、情報検索装置を車両用のハンズフリー電話システムへと適用した場合のブロック図である。ハンズフリー電話システム100は、運転者(使用者)の発話を入力するマイクロフォン101と、音声を出力するスピーカー102と、運転者がシステムの起動するための起動スイッチ103と、日時を計時する時計104と、携帯電話105と、情報検索コントローラー106とを有している。この車両用ハンズフリー電話システムでは、運転者が発信相手と通話するときはマイクロフォン101を介して発話し、スピーカー102から出力される発信相手の声を聞き取る。
FIG. 1 shows an embodiment of an information search apparatus according to the present invention, and is a block diagram when the information search apparatus is applied to a hands-free telephone system for a vehicle. A hands-
情報検索コントローラー106は、電話帳データ記憶メモリ106aと、電話帳データ更新部106bと、音声タグ出力制御部106cと、音声認識用辞書メモリ106dと、音声認識部106eと、音声タグ−電話番号変換部106fと、通話制御部106gとを有している。なお、電話帳データ更新部106b、音声タグ出力制御部106c、音声認識部106e、音声タグ−電話番号変換部106f、および通話制御部106gは、マイクロコンピューターのソフトウェア形態により構成される。また、電話帳データ記憶メモリ106aと音声認識用辞書メモリ106dにはEEPROMなどの不揮発性メモリやバックアップRAMなどを用いる。
The
電話帳データ記憶メモリ106aには、図2に示す形式でデータが格納される。各レコードには一意に識別可能な識別番号2aがレコードの登録順に付与され、電話帳データとしての電話番号2bが記憶される。音声タグ2cは、電話帳から電話番号を簡単、容易に読み出すために電話番号ごとに付けられた略称の音声データであり、使用者が電話番号の登録の際に自由に設定することができる。例えば、図2に示す例では、識別番号2aが1の電話番号に対して「自宅」という音声タグ2cが設定されている。なお、図2においては、音声タグ2cに格納されるデータ(「自宅」、「会社」)は説明の便宜上、文字で表記してあるが、実際には波形で表される音声データとして格納される。
The telephone book
最終アクセス日時2dは、運転者が電話番号を呼び出すためにレコードを参照した際に更新され、常に当該レコードの最終(最新)の参照日時が格納される。アクセス回数カウンタ2eは、運転者がレコードを参照した際に1ずつカウントアップされ、運転者によるレコード参照回数が格納される。すなわち、運転者が音声タグ2cが「自宅」である電話番号2bを発信先として呼び出したときに、時計104から取得したそのときの日時が最終アクセス日時2dに格納され、アクセス回数カウンタ2eに1が加算される。
The last access date and time 2d is updated when the driver refers to the record to call the telephone number, and the last (latest) reference date and time of the record is always stored. The
電話帳データ更新部106bは、上述した電話帳データ記憶メモリ106aへのデータの登録、および更新を制御する。すなわち、運転者によって電話帳データの登録が指示された場合には、運転者からの入力内容に基づいて、図2に示す形式で電話帳データを登録する。なお、登録時においては、最終アクセス日時2dには登録日時が、アクセス回数カウンタ2eには0が初期値として格納される。そして、運転者によって電話帳データ記憶メモリ106a内のデータが参照された際には、上述したとおり最終アクセス日時2d、およびアクセス回数カウンタ2eを更新する。電話帳データ更新部106bはまた、電話帳データ記憶メモリ106aへ登録された音声タグ2cを後述する音声認識用辞書メモリ106dへ登録し、その音声データを運転者が発話したときに照合できるようにする。
The phone book
音声タグ出力制御部106cは、運転者からの指示に基づいて電話帳データ記憶メモリ106aに格納された音声タグ2cのリストをスピーカー102を介して運転者に提示する。運転者は目的の発信先を呼び出す際に、電話番号2bに関連付けられた音声タグ2cを発話するが、発信先の音声タグ2cをどのような略称で登録したか忘れてしまうことが考えられる。このような場合に、電話帳データ記憶メモリ106aに格納された音声タグ2cの内容を確認するため、運転者は音声タグ2cのリストを出力するよう指示を出す。
The voice tag
このとき、運転者はリストの出力順を指定することができ、本実施の形態においては、運転者は「登録順」、「アクセス頻度順」、「アクセス日時順」のいずれかを指定する。音声タグ出力制御部106cは、運転者によって出力順が指定されると、識別番号2a、アクセス回数カウンタ2e、および最終アクセス日時2dをソート情報として用い、指定された出力順で音声タグ2cを音声出力する。
At this time, the driver can specify the output order of the list, and in the present embodiment, the driver specifies any one of “registration order”, “access frequency order”, and “access date / time order”. When the output order is designated by the driver, the voice tag
音声タグ出力制御部106cは、出力順として「登録順」が指定された場合は、電話帳データ記憶メモリ106aに登録された順、すなわち電話帳データ記憶メモリ106aに格納された識別番号2aが小さいレコードから順に音声タグ2cのリストを音声出力する。これにより、かなり以前に登録し、今では忘れてしまっている可能性が高い音声タグ2cを優先的に出力することができる。
When “registration order” is designated as the output order, the voice tag
「アクセス頻度順」が指定された場合は、アクセス頻度の少ない順、すなわち電話帳データ記憶メモリ106aに格納されたアクセス回数カウンタ2eが小さいレコードから順に音声タグ2cのリストを音声出力する。これにより、運転者が過去にあまり使用しておらず、忘れてしまっている可能性の高い音声タグ2cを優先的に出力することができる。
When “access frequency order” is designated, the list of the
「アクセス日時順」が指定された場合は、アクセス時間の古い順、すなわち最終アクセス日時2dが古いレコードから順に音声タグ2cのリストを音声出力する。これにより、運転者が最近は使用しておらず、忘れてしまっている可能性の高い音声タグ2cを優先的に出力することができる。
When “in order of access date / time” is designated, the list of
音声認識用辞書メモリ106dは、情報検索コントローラー106が運転者の発話を待ち受ける音声データを格納する。上述したように、本実施の形態における情報検索コントローラー106は、音声タグ2cの運転者による発話を待ち受け、それらを認識する必要があるため、電話帳データ記憶メモリ106aに格納されているすべての音声タグ2cを音声認識用辞書メモリ106dに格納する。音声認識部106eは、運転者によって発話されマイクロフォン101を介して入力された各種コマンドや音声タグ2cと、音声認識用辞書メモリ106dに格納された各種コマンドや音声タグ2cとをマッチング処理して運転者の発話内容を認識する。
The voice
音声タグ−電話番号変換部106fは、電話帳データ記憶メモリ106aを参照して音声認識部106eで音声認識された音声タグ2cに対応する電話番号2bを取得し、音声タグ2cから電話番号2bへの変換を行う。すなわち、音声認識された音声タグ2cに対応する電話番号2bを検索する。これによって、運転者が音声タグ2cを発話して発信先を指定すれば、発信先の電話番号2bを参照することができる。
The voice tag-phone number conversion unit 106f refers to the phone book
通話制御部106gは携帯電話105による通話を制御する。すなわち、発信時には、音声タグ−電話番号変換部106fによって変換された発信先電話番号に発信するように携帯電話105を制御する。また着信時には、運転者からの通話開始指示にしたがって、相手との通話を開始するように携帯電話105を制御する。
The
図3は、電話帳データ記憶メモリ106aに電話帳データを新しく登録する処理を示すフローチャートである。ステップS10で起動スイッチ103がオン状態にあって、ステップS20で情報検索コントローラ106が音声入力待機状態にあるときに、ステップS30で運転者から電話帳登録コマンド「電話帳登録」が発話され、マイクロフォン101を介して音声データが入力されたと判断するとステップS40へ進む。
FIG. 3 is a flowchart showing a process of newly registering phone book data in the phone book
ステップS40において、音声認識部106eは、運転者により発話された「電話帳登録」の音声データと音声認識用辞書メモリ106dに格納されたコマンドとをマッチング処理し、最も一致度の高いコマンドを音声認識結果として決定する。運転者によって発話された電話帳登録コマンド「電話帳登録」が音声認識部106eによって正常に認識されると、情報検索コントローラー106は電話帳登録のための処理を開始する。
In step S40, the voice recognition unit 106e performs a matching process on the voice data of “phone book registration” uttered by the driver and the command stored in the voice
ステップS50において、運転者に対して電話帳への登録を促すガイダンス音声をスピーカー102を介して出力する。本実施の形態においては、まず運転者に対して音声タグ2cの発話を促すため、「音声タグを入力してください」のようにガイダンス音声を出力する。その後、ステップS60において、情報検索コントローラー106は音声入力待機状態となる。
In step S <b> 50, a guidance voice that prompts the driver to register in the telephone directory is output via the
ステップS70において、運転者によって音声タグ2c、例えば「自宅」が発話されると、ステップS80へ進む。ステップS80において、電話帳データ更新部106bは、識別番号2aを採番して電話帳データ記憶メモリ106a内に新規登録レコードを追加する。ステップS90において、電話帳データ更新部106bは、ステップS70で運転者によって発話された音声タグ2cを新規登録レコードの音声タグ2cに格納する。
In step S70, when the driver speaks the
ステップS100において、電話帳データ更新部106bは、上記新規登録レコードの音声タグ2cを音声認識用辞書メモリ106dに格納する。ステップS110において、電話帳データ更新部106bは、時計104から取得した現在の日時を上記新規登録レコードの最終アクセス日時2dに格納する。ステップS120において、電話帳データ更新部106bは、上記新規登録レコードのアクセス回数カウンタ2eに初期値として0を格納する。
In step S100, the telephone directory
ステップS130において、運転者に対して電話番号の入力を促すガイダンス音声、例えば「電話番号を入力してください」をスピーカー102を介して出力する。その後、ステップS140において、情報検索コントローラー106は音声入力待機状態となる。ステップS150において、運転者によって電話番号が発話されるとステップS160へ進む。
In step S <b> 130, a guidance voice that prompts the driver to input a telephone number, for example, “Please input a telephone number”, is output via the
ステップS160において、音声認識部106eは、運転者により発話された電話番号の数字と、音声認識用辞書メモリ106dに格納された数字とをマッチング処理し、最も一致度の高い数字を音声認識結果として決定する。運転者によって発話された電話番号が音声認識部106eによって正常に認識されると、ステップS170へ進む。
In step S160, the speech recognition unit 106e performs a matching process on the number of the telephone number uttered by the driver and the number stored in the speech
ステップS170において、認識した電話番号を新規登録レコードの電話番号2bに格納する。その後、処理を終了する。以上の処理により、図2に示したデータ形式で電話帳データ記憶メモリ106aに新規レコードが登録される。
In step S170, the recognized telephone number is stored in
次に、電話帳データ記憶メモリ106aに格納された電話帳データを参照して任意の発信先を呼び出す処理について説明する。図4は、運転者が任意の発信先の音声タグ2cを発話して電話帳データ記憶メモリ106aから発信先の電話番号を参照する処理を示すフローチャートである。
Next, a process for calling an arbitrary destination with reference to the phone book data stored in the phone book
ステップS210で起動スイッチ103がオン状態にあって、ステップS220で情報検索コントローラー106が音声入力待機状態にあるときに、ステップS230で運転者から電話帳参照コマンド「電話帳参照」が発話され、マイクロフォン101を介して音声データが入力されたと判断するとステップS240へ進む。
When the
ステップS240において、音声認識部106eは、運転者により発話された「電話帳参照」の音声データと音声認識用辞書メモリ106dに格納されたコマンドとをマッチング処理し、最も一致度の高いコマンドを音声認識結果として決定する。運転者によって発話された電話帳登録コマンド「電話帳参照」が音声認識部106eによって正常に認識されると、情報検索コントローラー106は電話帳参照のための処理を開始する。
In step S240, the voice recognition unit 106e performs a matching process on the voice data of “refer to the phone book” uttered by the driver and the command stored in the voice
ステップS250において、運転者に対して参照する音声タグ2cの発話を促すため、「音声タグを入力してください」のようにガイダンス音声を出力した後、ステップS260で情報検索コントローラー106は音声入力待機状態となる。ステップS270において、運転者によって音声タグ2c、ここでは例えば「自宅」が発話されたとするとステップS280へ進み、音声認識部106eは、運転者により発話された音声タグと音声認識用辞書メモリ106dに格納された音声タグ2cとをマッチング処理し、最も一致度の高い音声タグ2cを音声認識結果として決定する。
In step S250, in order to prompt the driver to speak the
ステップS290において、音声タグ−電話番号変換部106fは、電話帳データ記憶メモリ106aを参照して運転者により発話された音声タグ2cに対応する電話番号2bを読み出し、音声タグ2cから電話番号2bへの変換を行う。すなわち、音声タグ2cが「自宅」のレコードを参照して電話番号2bを取得する。
In step S290, the voice tag-phone number conversion unit 106f reads the
ステップS300において、電話帳データ更新部106bは、電話帳データ記憶メモリ106aの音声タグ2cが「自宅」のレコードの最終アクセス日時2dを時計104から取得した現在の日時で更新する。ステップS310において、電話帳データ更新部106bは、音声タグ2cが「自宅」のレコードのアクセス回数カウンタ2eのカウント値に1を加算する。
In step S300, the phone book
ステップS320において、電話帳データ更新部106bは、アクセス回数カウンタ2eのカウント値に1を加算した結果、当該レコードのカウント値に桁あふれが発生したか否かを判断する。カウント値に桁あふれが発生したと判断した場合、電話帳データ更新部106bは、音声タグ2cが「自宅」のレコードのアクセス回数カウンタ2eのカウント値を1を加算する前の値に戻し、すべてのレコードのアクセス回数カウンタ2eのカウント値を1/2にする。その後、改めて音声タグ2cが「自宅」のレコードのアクセス回数カウンタeのカウント値に1を加算する。これによって、各レコード間のカウント値の大小関係を保持したまま、桁あふれを回避することができる。なお、カウント値が2で割り切れない場合には、小数点以下は切り捨てるものとする。
In step S320, the telephone directory
なお、カウント値が桁あふれを起こしていないと判断した場合は、ステップS330をスキップする。ステップS340において、発話者により発話された音声タグ2c、ここでは「自宅」の電話番号2bを発信先として発信するか否かを運転者に確認するために、例えば「自宅へ発信しますか?」という音声ガイダンスをスピーカー102を介して出力する。その後、ステップS350において、情報検索コントローラー106は音声入力待機状態となる。
If it is determined that the count value has not overflowed, step S330 is skipped. In step S340, in order to confirm to the driver whether or not the
ステップS360において、発信を確認するための音声ガイダンスに対する応答を確認する。運転者からの応答があった場合はステップS370に進み、音声認識部106eは、運転者の応答内容と音声認識用辞書メモリ106dに格納された「はい」、「いいえ」とをマッチング処理し、最も一致度の高い待受け単語を音声認識結果として決定する。
In step S360, a response to the voice guidance for confirming the outgoing call is confirmed. If there is a response from the driver, the process proceeds to step S370, where the speech recognition unit 106e performs a matching process between the response content of the driver and “yes”, “no” stored in the speech
ステップS380において運転者の応答内容を確認し、発信先への発信に同意する「はい」であった場合はステップS390へ進む。ステップS390において、通信制御部106gは携帯電話105を制御して発信先へ発信する。すなわち電話をかける。なお、発話者の応答内容が発信先への発信に同意しない「いいえ」であった場合は発信せずに処理を終了する。
In step S380, the driver's response content is confirmed. If the answer is “Yes” to agree to the transmission to the destination, the process proceeds to step S390. In step S390, the
次に、電話帳データ記憶メモリ106aに格納された電話帳データから、すべてのレコードの音声タグ2cのリストを出力する処理について説明する。図5は、電話帳データ記憶メモリ106aに格納された電話帳データから音声タグ2cのリストを出力する処理を示すフローチャートである。
Next, processing for outputting a list of voice tags 2c of all records from the phone book data stored in the phone book
ステップS410で起動スイッチ103がオン状態にあって、ステップS420で情報検索コントローラー106が音声入力待機状態にあるときに、ステップS430で運転者から音声タグ2cのリストを出力するコマンド「リスト出力」が発話され、マイクロフォン101を介して音声データが入力されたと判断するとステップS440へ進む。
When the
ステップS440において、音声認識部106eは、運転者により発話された「リスト出力」の音声データと音声認識用辞書メモリ106dに格納されたコマンドとをマッチング処理し、最も一致度の高いコマンドを音声認識結果として決定する。運転者によって発話された電話帳登録コマンド「リスト出力」が音声認識部106eによって正常に認識されると、情報検索コントローラー106は電話帳参照のための処理を開始する。
In step S440, the voice recognition unit 106e performs a matching process on the voice data of “list output” uttered by the driver and the command stored in the voice
ステップS450において、運転者に対して音声タグ2cのリストの出力順序の発話を促すために、「リスト出力順を入力してください」という音声ガイダンスを出力する。その後、ステップS460において情報検索コントローラー106は音声入力待機状態となる。
In step S450, in order to prompt the driver to speak the output order of the list of the
ステップS470において、運転者によってリスト出力順として「登録順」、「アクセス頻度順」、「アクセス日時順」のいずれかが発話されると、ステップS480へ進む。ステップS480において、音声認識部106eは、運転者により発話されたリスト出力順の音声データと音声認識用辞書メモリ106dに格納されたリスト出力順の音声データとをマッチング処理し、最も一致度の高いリスト出力順を音声認識結果として決定する。
In step S470, if any one of “registration order”, “access frequency order”, and “access date / time order” is uttered as the list output order by the driver, the process proceeds to step S480. In step S480, the voice recognition unit 106e performs a matching process on the voice data in the list output order uttered by the driver and the voice data in the list output order stored in the voice
ステップS490において、リスト出力順に応じて処理を分岐する。リスト出力順が「登録順」であった場合にはステップS500へ進み、音声タグ出力制御部106cは、電話帳データ記憶メモリ106aに格納された識別番号2aが小さいレコードから順に音声タグ2cのリストを音声出力する。これにより、かなり以前に登録し、今では忘れてしまっている可能性が高い音声タグ2cを優先的に出力することができる。
In step S490, the process branches according to the list output order. If the list output order is "registration order", the process proceeds to step S500, where the voice tag
また、リスト出力順が「アクセス頻度順」であった場合にはステップS510へ進み、音声タグ出力制御部106cは、アクセス頻度の少ない順、すなわち電話帳データ記憶メモリ106aに格納されたアクセス回数カウンタ2eが小さいレコードから順に音声タグ2cのリストを音声出力する。これにより、運転者が過去にあまり使用しておらず、忘れてしまっている可能性の高い音声タグ2cを優先的に出力することができる。
If the list output order is “access frequency order”, the process advances to step S510, and the voice tag
リスト出力順が「アクセス日時順」であった場合にはステップS520へ進み、音声タグ出力制御部106cは、アクセス日時の古い順、すなわち最終アクセス日時2dが古いレコードから順に音声タグ2cのリストを音声出力する。これにより、運転者が最近は使用しておらず、忘れてしまっている可能性の高い音声タグ2cを優先的に出力することができる。
When the list output order is “access date order”, the process proceeds to step S520, and the audio tag
以上、本実施の形態によれば、以下のような作用効果を得ることができる。
(1)運転者は、音声タグのリスト出力順として「登録順」、「アクセス頻度順」、「アクセス日時順」のいずれかを指定し、指定された出力順に基づいて音声タグのリストを音声出力することとした。これにより、音声タグのリストの出力順を指定することができ、運転者が捜し求めている音声タグを早く提示させる可能性が高くなる。
(2)音声タグの出力順として「アクセス頻度順」が指定された場合には、アクセス頻度の少ないレコードから順に音声タグのリストを音声出力することにした。これにより、過去にあまり使用しておらず、忘れてしまっている可能性の高い音声タグから優先的に提示することができる。
As described above, according to the present embodiment, the following operational effects can be obtained.
(1) The driver designates “registration order”, “access frequency order”, or “access date order” as the voice tag list output order, and the voice tag list is voiced based on the designated output order. I decided to output it. As a result, the output order of the list of voice tags can be specified, and the possibility of promptly presenting the voice tag that the driver is looking for increases.
(2) When “access frequency order” is designated as the output order of the audio tags, the audio tag list is output in order from the record with the lowest access frequency. As a result, it is possible to present with priority from voice tags that have not been used much in the past and are likely to be forgotten.
(3)音声タグの出力順として「アクセス日時順」が指定された場合には、最終アクセス日時の古いレコードから順に音声タグのリストを音声出力することにした。これにより、運転者が最近は使用しておらず、忘れてしまっている可能性の高い音声タグから優先的に提示することができる。
(4)アクセス回数カウンタ2eのカウント値に1を加算した結果、当該レコードのカウント値に桁あふれが発生する場合は、電話帳データ記憶メモリ106aに格納されている全レコードのアクセス回数カウンタ2eのカウント値を1/2にしてから改めて1を加算することにした。これによって、各レコード間のカウント値の大小関係を保持したまま、桁あふれを回避することができ、処理を続行することができる。
(3) When “order of access date / time” is designated as the output order of audio tags, the audio tag list is output in audio from the records with the oldest access date / time. Thereby, it can present preferentially from the voice tag which has not been used recently by the driver and is likely to be forgotten.
(4) As a result of adding 1 to the count value of the
なお、カウント値が2で割り切れない場合は小数点以下は切り捨てることにしたが、小数点以下は切り上げても四捨五入してもよい。また、全レコードのアクセス回数カウンタ2eのカウント値を1/2にして桁あふれを回避する例を示したが、例えば1/3、1/4等にして桁あふれを回避してもよい。
When the count value is not divisible by 2, the decimal part is rounded down. However, the decimal part may be rounded up or rounded off. Moreover, although the example in which the count value of the
なお、上述した一実施の形態では、運転者は、音声タグ2cのリスト出力順として「登録順」、「アクセス頻度順」、「アクセス日時順」の3つからいずれかの出力順を指定することとしたが、これらのうち少なくともいずれか2つの出力順を指定可能としてもよい。
In the above-described embodiment, the driver designates one of the output orders from “registration order”, “access frequency order”, and “access date order” as the list output order of the
さらに、上述した一実施の形態では、電話帳データ記憶メモリ106aに新しいレコードを登録する際には、電話番号2b、および音声他タグ2cを音声入力することにした。しかし、例えば操作スイッチなど不図示の手動入力装置によって入力を行ってもよい。また、音声入力と手動入力の切替スイッチを設け、運転者が必要に応じていずれかの方法に切り替えて入力を行うようにしてもよい。なお、音声入力以外の方法で音声タグを入力する場合には、電話帳データ記憶メモリ106aに格納するときに、音声タグを音声データに変換する処理を行って音声データで記憶する。
Further, in the above-described embodiment, when a new record is registered in the telephone directory
さらに、上述した一実施の形態では、音声タグ2cのリストはスピーカー102を介して音声で出力することにした。しかし、これに限定されず、以下のように変形してもよい。例えば、文字や画像を表示するモニタを設け、音声タグのリストをモニタ画面上に文字で出力してもよい。この場合は、電話帳データ記憶メモリ106aに音声タグ2cを文字データとして格納しておくか、あるいは音声タグ2cを文字データに変換して出力すればよい。
Furthermore, in the above-described embodiment, the list of the
さらにまた、上述した一実施の形態では、本発明による音声認識装置を車両用ハンズフリー電話システムに適用した一例を示した。しかし、本発明はハンズフリー電話システム以外の例えばオーディオシステムやナビゲーションシステムに適用してもよいし、その他の情報機器、あるいは車両用以外のそれらの装置に適用してもよい。この場合には、音声タグと関連付ける情報は、電話番号に代えて、各システム、および機器で使用者が頻繁に呼び出す情報、例えばナビゲーションシステムにおいては目的地情報等とすればよい。 Furthermore, in the above-described embodiment, an example in which the voice recognition device according to the present invention is applied to a hands-free telephone system for a vehicle is shown. However, the present invention may be applied to, for example, an audio system or a navigation system other than the hands-free telephone system, or may be applied to other information devices or devices other than those for vehicles. In this case, the information associated with the voice tag may be information frequently called by the user in each system and device, for example, destination information in the navigation system, instead of the telephone number.
特許請求の範囲の構成要素と一実施の形態の構成要素との対応関係は次の通りである。すなわち、電話帳データ記憶メモリ106aおよび音声認識用辞書メモリ106dが情報記憶手段を、マイクロフォン101が音声入力手段を、音声タグ−電話番号変換部106fが情報検索手段を、音声タグ出力制御部106cが略称提示手段を、音声認識部106eがリスト順選択手段をそれぞれ構成する。なお、本発明の特徴的な機能を損なわない限り、各構成要素は上記構成に限定されるものではない。
The correspondence between the constituent elements of the claims and the constituent elements of the embodiment is as follows. That is, the telephone directory
100 ハンズフリー電話システム
101 マイクロフォン
102 スピーカー
103 起動スイッチ
104 時計
105 携帯電話
106 情報検索コントローラー
106a 電話帳データ記憶メモリ
106b 電話帳データ更新部
106c 音声タグ出力制御部
106d 音声認識用辞書メモリ
106e 音声認識部
106f 音声タグ−電話番号変換部
106g 通話制御部
DESCRIPTION OF
Claims (4)
音声を入力する音声入力手段と、
前記音声入力手段により入力した前記情報の略称を前記各情報の前記音声タグと照合し、前記記憶手段に記憶されている情報の中から一致結果が得られた音声タグに対応する情報を検索する情報検索手段とを備えた情報検索装置において、
前記情報記憶手段はさらに前記各情報の検索履歴を記憶しており、
前記複数の情報の略称のリストを前記各情報の検索履歴に応じた順序で音声により提示する略称提示手段を備えることを特徴とする情報検索装置。 Information storage means for storing a plurality of pieces of information and storing voice data (hereinafter referred to as voice tags) of information abbreviated to each piece of information in association with each piece of information;
Voice input means for inputting voice;
The abbreviation of the information input by the voice input unit is collated with the voice tag of each information, and information corresponding to the voice tag for which a matching result is obtained is searched from the information stored in the storage unit. In an information search device comprising information search means,
The information storage means further stores a search history of each information,
An information search apparatus comprising: abbreviation presentation means for presenting a list of abbreviations of the plurality of information by voice in an order corresponding to a search history of each information.
前記検索履歴には前記各情報の検索回数が含まれ、前記略称提示手段は、検索回数が少ない前記情報の順に前記情報の略称のリストを提示することを特徴とする情報検索装置。 The information search device according to claim 1,
The search history includes the number of searches of each piece of information, and the abbreviation presentation unit presents a list of abbreviations of the information in order of the information with the smallest number of searches.
前記検索履歴には前記各情報の最新の検索日時が含まれ、前記略称提示手段は、最新の検索日時が古い前記情報の順に前記情報の略称のリストを提示することを特徴とする情報検索装置。 The information search device according to claim 1,
The search history includes the latest search date and time of each piece of information, and the abbreviation presentation means presents a list of abbreviations of the information in order of the information with the latest search date and time being old. .
前記検索履歴には前記各情報の検索回数と最新の検索日時とが含まれており、
記憶された日時が古い前記情報の順、検索回数が少ない前記情報の順、および最新の検索日時が古い前記情報の順の中からいずれかを選択するリスト順選択手段を備え、
前記略称提示手段は、前記リスト順選択手段により選択された順に前記情報の略称のリストを提示することを特徴とする情報検索装置。
The information search device according to claim 1,
The search history includes the number of searches for each piece of information and the latest search date and time,
A list order selection means for selecting one of the order of the information stored in the oldest date, the order of the information with a small number of searches, and the order of the information in the latest search date and time;
The abbreviation presentation means presents a list of abbreviations of the information in the order selected by the list order selection means.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004114385A JP4466171B2 (en) | 2004-04-08 | 2004-04-08 | Information retrieval device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004114385A JP4466171B2 (en) | 2004-04-08 | 2004-04-08 | Information retrieval device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005301511A JP2005301511A (en) | 2005-10-27 |
JP4466171B2 true JP4466171B2 (en) | 2010-05-26 |
Family
ID=35332990
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004114385A Expired - Lifetime JP4466171B2 (en) | 2004-04-08 | 2004-04-08 | Information retrieval device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4466171B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2023112113A1 (en) * | 2021-12-14 | 2023-06-22 |
-
2004
- 2004-04-08 JP JP2004114385A patent/JP4466171B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP2005301511A (en) | 2005-10-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6570651B2 (en) | Voice dialogue apparatus and voice dialogue method | |
US20200312329A1 (en) | Performing speech recognition using a local language context including a set of words with descriptions in terms of components smaller than the words | |
KR100383352B1 (en) | Voice-operated service | |
US8577681B2 (en) | Pronunciation discovery for spoken words | |
US8099290B2 (en) | Voice recognition device | |
WO2006101673A1 (en) | Voice nametag audio feedback for dialing a telephone call | |
KR20040073937A (en) | User programmable voice dialing for mobile handset | |
CN102111483B (en) | Method and device for querying information in call process and mobile terminal | |
JP2008527859A (en) | Hands-free system and method for reading and processing telephone directory information from a radio telephone in a car | |
WO2006090222A1 (en) | Selecting an order of elements for a speech synthesis | |
KR20050040628A (en) | Guidance method and apparatus for telephone number | |
US7460999B2 (en) | Method and apparatus for executing tasks in voice-activated command systems | |
JP4466171B2 (en) | Information retrieval device | |
JP2002281145A (en) | Telephone number input device | |
JP2009104047A (en) | Information processing method and information processing apparatus | |
JP2003223187A (en) | Method of operating speech dialogue system | |
KR20040008990A (en) | Voice recognition key input wireless terminal, method for using voice in place of key input in wireless terminal, and recording medium therefore | |
US20150142436A1 (en) | Speech recognition in automated information services systems | |
JP7079419B2 (en) | Information processing method and information processing equipment | |
KR20080043035A (en) | Mobile communication terminal having voice recognizing function and searching method using the same | |
EP1895748B1 (en) | Method, software and device for uniquely identifying a desired contact in a contacts database based on a single utterance | |
JP5500647B2 (en) | Method and apparatus for generating dynamic speech recognition dictionary | |
JP2005283797A (en) | Device and method for speech recognition | |
WO2019163011A1 (en) | Display control device and display control method | |
KR100347790B1 (en) | Speech Recognition Method and System Which Have Command Updating Function |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070226 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091020 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091214 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100202 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100215 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4466171 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130305 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130305 Year of fee payment: 3 |
|
EXPY | Cancellation because of completion of term |