JP4198040B2 - データ利用装置及びデータ利用方法 - Google Patents
データ利用装置及びデータ利用方法 Download PDFInfo
- Publication number
- JP4198040B2 JP4198040B2 JP2003406779A JP2003406779A JP4198040B2 JP 4198040 B2 JP4198040 B2 JP 4198040B2 JP 2003406779 A JP2003406779 A JP 2003406779A JP 2003406779 A JP2003406779 A JP 2003406779A JP 4198040 B2 JP4198040 B2 JP 4198040B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- wire
- word
- voice
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
このため、マニュアルなどのテキストを容易に読めるようにするため、音声を用いてテキスト検索を行う技術が考えられている(例えば、特許文献1参照)。
所定の語句の入力処理と次の処理との遷移を定義するワイヤと前記遷移の確率を示す重み係数とを対応付けたワイヤデータを記憶するワイヤ記憶手段と、
音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句の候補と各候補の尤度とを特定する音声認識手段と、
前記音声認識手段が特定した候補のうち、前記ワイヤ記憶手段に格納されている各語句について、前記各語句の入力処理を起点とするワイヤに付された重み係数と前記音声認識手段によって特定された語句のうち前記ワイヤ記憶手段に格納されている語句の尤度との積を求め、前記積に基づいて前記ワイヤ記憶手段に記憶されているワイヤのうちいずれかのワイヤを特定し、前記ワイヤ記憶手段を参照して、特定したワイヤが定義する遷移の遷移先の処理を判別し、判別した処理を示す情報を出力するデータ抽出手段と、を備える、
ことを特徴とする。
前記データ抽出手段は、前記音声認識手段によって所定の語句が入力され、前記音声認識手段が特定した候補のうち、前記ワイヤ記憶手段に格納されている各語句について、前記各語句の入力処理を起点とするワイヤに付された重み係数と前記音声認識手段によって特定された語句のうち前記ワイヤ記憶手段に格納されている語句の尤度との積を求め、前記積に基づいて前記音声データ出力処理を結ぶワイヤが特定されたときに、次の処理として登録されている音声データ出力処理の質問事項を表す音声データを生成して出力する手段を備えるものであってもよい。
前記ワイヤ記憶手段は、前記処理手段が前記判別した処理を実行したときに、前記処理手段が実行した処理への遷移を定義するワイヤに付された前記重み係数をインクリメントするものであってもよい。
音声認識手段が、音声データを取得し、前記音声データに音声認識を施すことにより、前記音声が表す語句の候補と各候補の尤度とを特定する音声認識ステップと、
データ抽出手段が、前記音声認識ステップで特定された候補のうち、予め格納されている各語句について、所定の語句の入力処理と次の処理との遷移を定義する予め格納されたワイヤのうち前記各語句の入力処理を起点とするワイヤに付された前記遷移の確率を示す重み係数と前記音声認識ステップで特定された語句のうち前記予め格納されている語句の尤度との積を求め、前記積に基づいて、予め格納されているワイヤのうちいずれかのワイヤを特定し、特定したワイヤで示された遷移先の処理を判別し、判別した処理を示す情報を出力するデータ抽出ステップと、を備える
ことを特徴とする。
図1は、このマニュアル利用システムの構成を示すブロック図である。図示するように、このマニュアル利用システムは、音声入力部1と、言語解析部2と、音声合成処理部3と、音声出力部4と、マニュアル記憶部5と、表示入力部7と、エージェント処理部6とより構成されている。音声入力部1と言語解析部2とは互いに接続されており、音声合成処理部3と音声出力部4とは互いに接続されており、言語解析部2、音声合成処理部3、マニュアル記憶部5及び表示入力部7は、専用のケーブルあるいはLAN(Local Area Network)を介してエージェント処理部6に接続されている。
なお、言語解析部2、音声合成処理部3及びエージェント処理部6の一部又は全部の機能を単一のプロセッサや単一の不揮発性メモリや単一の揮発性メモリが行うようにしてもよい。
(1) 車両の車種、車名、型式、寸法、重量、乗車定員、燃料消費率、及びその他車両についての基本的な情報や、
(2) 備え付けのエアコンやオーディオ機器及びその他の附属機器の操作法を紹介する情報や、
(3) 車内各インテリア部品、リモコンキー、トランク、走行装置などの名称、操作法点検法を紹介する情報や、
(4) 様々な道路状況(降雨時、積雪時、濃霧時など)における運転についてのアドバイスや整備点検の仕方について指示する情報や、
(5) ライトが点灯しなくなった場合の対処法など、トラブル時の対処法を指示する情報、
などの情報を含んでいる。
この場合、このフラグ群は、概念「温度」の下には単語「上がる」、「暑い」及び「開ける」がグルーピングされており、概念「エアコンの操作」の下には単語「上がる」及び「暑い」がグルーピングされており、概念「窓の開閉」の下には単語「暑い」及び「開ける」がグルーピングされており、概念「故障」の下には単語「上がる」、「暑い」又は「開ける」のいずれもグルーピングされていないことを示す。
具体的には、例えば、エージェント処理部6は、「メーターパネルについて知りたい」という語句を表す単語データの集合が言語解析部2より供給されると、これらの単語データに応答してマニュアル記憶部5にアクセスし、マニュアルの記載のうちから、メーターパネル全般を概説するための画像を表す画像データを索出して、この画像を表示入力部7に表示させる。該当する画像としては、例えば、メータパネルのパネル面全体を写した写真等が考えられる。
その後、「肯定」という概念の下にグルーピングされた単語を表す単語データが言語解析部2より供給されると、エージェント処理部6はこの単語データに応答してマニュアル記憶部5を検索し、スノーチェーン装着時の走行上の注意点を解説した部分のテキストデータを索出して、音声合成処理部3を介し、音声出力部4にこの部分を読み上げさせる。一方、「否定」という概念の下にグルーピングされた単語を表す単語データが言語解析部2より供給されると、エージェント処理部6はこの単語データに応答してマニュアル記憶部5を検索し、スノーチェーンの装着法を解説した部分のテキストデータを索出して、音声合成処理部3を介し、音声出力部4にこの部分を読み上げさせる。
尚、上述のマニュアルは、交換可能なように構成してもよいし、追加可能又は削除可能なように構成してもよい。
また、新たな機能又は新たな機器が付加されたことを検出したとき、これに対応してマニュアルの新たな部分が利用可能になされるようにしてもよい。
更に、新たなマニュアルの部分は、予め他のマニュアルデータと共にハードディスク等に記録されているものとし、新たな機能又は新たな機器が付加されたことを検出されるまでは利用不可能な状態になされているようにしてもよい。
また、新たなマニュアルの部分は、新たな機能又は新たな機器が付加されたことを検出されたとき、ネットワークを介して所定のデータをダウンロードしてなるものであってもよい。
処理P2のワイヤW03の重み係数は、処理P1のワイヤW1に係る確率係数0.5に処理P2のワイヤW03に係る確率係数0.5を乗じた結果すなわち0.25となる。
ワイヤW05の重み係数は、処理P1のワイヤW1に係る確率係数0.5に処理P2のワイヤW03に係る確率係数0.5を乗じた結果に更に処理P3のワイヤW5に係る確率係数0.5を乗じた結果、すなわち0.125となる。
例えば、図4に示すフローを実行している場合において、単語「暑い」に対するスコアが80%で、単語「窓」に対するスコアが50%であることを示す単語データが入力されたとし、また、単語「暑い」を示す単語データを入力する処理を先行の処理とするワイヤW01の重み係数が0.5、単語「窓」を示す単語データを入力する処理を先行の処理とするワイヤW05の重み係数が0.125であったとする。この場合、ワイヤW01及びW05について求められる積は、数式1及び2に示すとおりとなる。
また、エージェント処理部6は、求めた積の値が所定の条件に合致しないような処理(たとえば、積の値が所定値に達しないような処理)は、遷移を実行する対象から除外するよう取り扱ってもよい。
このワイヤの自動追加は、ある処理項目からある処理項目へのジャンプの回数を計数し、これが所定回数に達したときに自動で行うようにすればよい。
以上説明したこのマニュアル利用システムは、処理の内容を示すデータやワイヤが適切に記述されれば、得たい情報の内容をユーザが完全に特定することを必ずしも必要とせずに、ユーザが発した言語やその他ユーザが加えた操作に応答し、この言語からユーザの欲求を推測し、この欲求を満たすためにどのような情報を抽出すればよいかを適切に判断して、判断結果に従った情報を抽出して提供することができるようになる。
例えば、単語データベースは、必ずしも単語を示すデータのみならず、複数の単語からなる語句を示すデータを単語データベースの要素として記憶するようにしてもよいし、単語の一部あるいは音素を示すデータを単語データベースの要素として記憶するようにしてもよい。また、単語等は必ずしも特定の概念の下にグルーピングされている必要はなく、グルーピングを行う場合も、グルーピングを行うために用いられるデータは、必ずしもフラグの集合の形をとっていなくてもよい。
具体的には、例えば、ワイヤデータベースに、それぞれのワイヤについて、当該ワイヤが表す遷移が実行された回数を記憶しておく。そしてエージェント処理部6は、当該遷移が新たに行われる毎に、この回数の値を書き換えることにより、この回数の値を1ずつインクリメントし、それぞれのワイヤに記述された重み係数を、例えば、当該ワイヤについて記憶された回数に比例した値と書き換える。
また、音声入力部1は、たとえば、音声を表すデータが記録された記録媒体(たとえば、フロッピー(登録商標)ディスクや、CD(Compact Disc)や、MO(Magneto-Optical Disk)など)から波形信号を読み出して言語解析部2に供給する記録媒体ドライブ装置(たとえば、フロッピー(登録商標)ディスクドライブや、CD−ROMドライブや、MOドライブなど)を備えていてもよい。
例えば、表示入力部7に接続されていて、マニュアルを構成するテキストデータや画像データを記憶したパーソナルコンピュータに上述の音声入力部1、言語解析部2、音声合成処理部3、音声出力部4、マニュアル記憶部5及びエージェント処理部6の動作を実行させるためのプログラムを格納した記録媒体から該プログラムをインストールすることにより、上述の処理を実行するマニュアル利用システムを構成することができる。そして、このプログラムを実行するパーソナルコンピュータが、図1のマニュアル利用システムの動作に相当する処理として、例えば、図4に示すフローを実行するものとする。
2 言語解析部
3 音声合成処理部
4 音声出力部
5 マニュアル記憶部
6 エージェント処理部
7 表示入力部
Claims (8)
- 所定の語句の入力処理と次の処理との遷移を定義するワイヤと前記遷移の確率を示す重み係数とを対応付けたワイヤデータを記憶するワイヤ記憶手段と、
音声データを取得し、当該音声データに音声認識を施すことにより、当該音声が表す語句の候補と各候補の尤度とを特定する音声認識手段と、
前記音声認識手段が特定した候補のうち、前記ワイヤ記憶手段に格納されている各語句について、前記各語句の入力処理を起点とするワイヤに付された重み係数と前記音声認識手段によって特定された語句のうち前記ワイヤ記憶手段に格納されている語句の尤度との積を求め、前記積に基づいて前記ワイヤ記憶手段に記憶されているワイヤのうちいずれかのワイヤを特定し、前記ワイヤ記憶手段を参照して、特定したワイヤが定義する遷移の遷移先の処理を判別し、判別した処理を示す情報を出力するデータ抽出手段と、を備える、
ことを特徴とするデータ利用装置。 - 前記ワイヤ記憶手段は、所定の語句が入力されたときに、前記音声の発話者が解決を欲する問題を明らかにするための質問事項を表す音声データを生成して出力する音声データ出力処理と該音声データ出力処理を結ぶワイヤとを含み、
前記データ抽出手段は、前記音声認識手段によって所定の語句が入力され、前記音声認識手段が特定した候補のうち、前記ワイヤ記憶手段に格納されている各語句について、前記各語句の入力処理を起点とするワイヤに付された重み係数と前記音声認識手段によって特定された語句のうち前記ワイヤ記憶手段に格納されている語句の尤度との積を求め、前記積に基づいて前記音声データ出力処理を結ぶワイヤが特定されたときに、次の処理として登録されている音声データ出力処理の質問事項を表す音声データを生成して出力する手段を備える、
ことを特徴とする請求項1に記載のデータ利用装置。 - 前記データ抽出手段によって出力された前記情報を取得し、該情報に基づいて、前記判別した処理を実行する処理手段をさらに備え、
前記ワイヤ記憶手段は、前記処理手段が前記判別した処理を実行したときに、前記処理手段が実行した処理への遷移を定義するワイヤに付された前記重み係数をインクリメントする、
ことを特徴とする請求項1又は2に記載のデータ利用装置。 - 新たな機能又は新たな機器が前記データ利用装置に付加されたことを検出する検出手段と、
前記検出手段が前記新たな機能又は新たな機器が付加されたことを検出したときに、前記ワイヤ記憶手段に記憶されている前記ワイヤデータの交換、追加及び削除のうち少なくともいずれか1つを実行する手段と、をさらに備える、
ことを特徴とする請求項1乃至3のいずれか一項に記載のデータ利用装置。 - 新たな機能又は新たな機器が前記データ利用装置に付加されたことを検出する検出手段と、
前記検出手段が前記新たな機能又は新たな機器が付加されたことを検出したときに、前記新たな機能又は新たな機器に対応する新たなワイヤデータを利用可能とする手段と、をさらに備える、
ことを特徴とする請求項1乃至4のいずれか一項に記載のデータ利用装置。 - 前記ワイヤ記憶手段は、前記新たなワイヤデータを予め記憶し、
前記検出手段が新たな機能又は新たな機器が付加されたことを検出するまでは前記ワイヤ記憶手段に記憶されている前記新たなワイヤデータを利用不可能な状態にする手段、をさらに備える、
ことを特徴とする請求項5に記載のデータ利用装置。 - 前記検出手段が前記新たな機能又は新たな機器が付加されたことを検出したとき、ネットワークを介して前記新たなワイヤデータをダウンロードする手段、をさらに備える、
ことを特徴とする請求項5又は6に記載のデータ利用装置。 - 音声認識手段が、音声データを取得し、前記音声データに音声認識を施すことにより、前記音声が表す語句の候補と各候補の尤度とを特定する音声認識ステップと、
データ抽出手段が、前記音声認識ステップで特定された候補のうち、予め格納されている各語句について、所定の語句の入力処理と次の処理との遷移を定義する予め格納されたワイヤのうち前記各語句の入力処理を起点とするワイヤに付された前記遷移の確率を示す重み係数と前記音声認識ステップで特定された語句のうち前記予め格納されている語句の尤度との積を求め、前記積に基づいて、予め格納されているワイヤのうちいずれかのワイヤを特定し、特定したワイヤで示された遷移先の処理を判別し、判別した処理を示す情報を出力するデータ抽出ステップと、
を備えることを特徴とするデータ利用方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003406779A JP4198040B2 (ja) | 2003-12-05 | 2003-12-05 | データ利用装置及びデータ利用方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003406779A JP4198040B2 (ja) | 2003-12-05 | 2003-12-05 | データ利用装置及びデータ利用方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005165901A JP2005165901A (ja) | 2005-06-23 |
JP4198040B2 true JP4198040B2 (ja) | 2008-12-17 |
Family
ID=34729023
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003406779A Expired - Fee Related JP4198040B2 (ja) | 2003-12-05 | 2003-12-05 | データ利用装置及びデータ利用方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4198040B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6954950B2 (ja) * | 2019-04-26 | 2021-10-27 | Tis株式会社 | 情報処理システム、情報処理方法、及びプログラム |
JP7347244B2 (ja) * | 2020-01-29 | 2023-09-20 | トヨタ自動車株式会社 | エージェント装置、エージェントシステム及びプログラム |
-
2003
- 2003-12-05 JP JP2003406779A patent/JP4198040B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2005165901A (ja) | 2005-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4533845B2 (ja) | オーディオ機器制御装置、オーディオ機器制御方法及びプログラム | |
US8103510B2 (en) | Device control device, speech recognition device, agent device, on-vehicle device control device, navigation device, audio device, device control method, speech recognition method, agent processing method, on-vehicle device control method, navigation method, and audio device control method, and program | |
JP3250559B2 (ja) | 歌詞作成装置及び歌詞作成方法並びに歌詞作成プログラムを記録した記録媒体 | |
US7054817B2 (en) | User interface for speech model generation and testing | |
JP3892410B2 (ja) | 音楽データ選曲装置、音楽データ選曲方法、並びに、音楽データの選曲プログラムおよびそれを記録した情報記録媒体 | |
JP2007206317A (ja) | オーサリング方法、オーサリング装置およびプログラム | |
JP6746923B2 (ja) | 情報処理システム、情報処理装置、情報処理方法および情報処理プログラム | |
US20070256435A1 (en) | Air Conditioner Control Device and Air Conditioner Control Method | |
JP6815184B2 (ja) | 情報処理装置、情報処理方法、および情報処理プログラム | |
JP2009288815A (ja) | 機器制御装置、音声認識装置、エージェント装置、機器制御方法及びプログラム | |
JP4198040B2 (ja) | データ利用装置及びデータ利用方法 | |
JP2897701B2 (ja) | 効果音検索装置 | |
JP2006267881A (ja) | 電子学習装置 | |
US7822614B2 (en) | Device control, speech recognition device, agent device, control method | |
JP6987447B2 (ja) | 音声認識装置 | |
JP6418179B2 (ja) | 音読練習装置、表示制御方法、及びプログラム | |
JP4279274B2 (ja) | 携帯端末装置および楽曲情報表示方法 | |
JP2004294577A (ja) | 文字情報音声変換方法 | |
JP2009204872A (ja) | 音声認識用辞書生成システム | |
JP4389516B2 (ja) | 音声データ出力装置 | |
JP2007219219A (ja) | 語学学習用電子機器および学習用文章リスト作成方法 | |
JP2006323438A (ja) | 楽曲検索システム | |
JP2017122880A (ja) | 音読評価装置、表示制御方法、及びプログラム | |
JPH07311591A (ja) | 音声認識装置およびナビゲーションシステム | |
JP2020183985A (ja) | 音声認識システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060131 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080415 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080616 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080701 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080825 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080909 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080930 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111010 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121010 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121010 Year of fee payment: 4 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121010 Year of fee payment: 4 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131010 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |