JPH06332493A - 音声対話型情報検索装置及び方法 - Google Patents

音声対話型情報検索装置及び方法

Info

Publication number
JPH06332493A
JPH06332493A JP5117169A JP11716993A JPH06332493A JP H06332493 A JPH06332493 A JP H06332493A JP 5117169 A JP5117169 A JP 5117169A JP 11716993 A JP11716993 A JP 11716993A JP H06332493 A JPH06332493 A JP H06332493A
Authority
JP
Japan
Prior art keywords
recognition
vocabulary
voice
information
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5117169A
Other languages
English (en)
Inventor
Keiichi Sakai
桂一 酒井
Yuji Ikeda
裕治 池田
Minoru Fujita
稔 藤田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP5117169A priority Critical patent/JPH06332493A/ja
Publication of JPH06332493A publication Critical patent/JPH06332493A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 対話の進行に応じて、音声認識のための語彙
を動的に変更することで、自然で使い易い音声対話型情
報検索装置を提供する。 【構成】 音声対話型情報検索装置に、音声情報を入力
し、生成された応答を出力する音声入出力部101と、
音声認識の対象となる語彙を記憶し、その記憶内容を参
照して入出力部101より入力された音声情報を認識す
る音声認識部105と、その認識結果を解釈する対話管
理部107と、その解釈結果に基づいて情報を検索する
情報検索部103と、その検索結果に基づいて応答を生
成する対話応答生成部104と、対話管理部107によ
る解釈結果及び情報検索部103による検索結果に基づ
いて、音声認識部105に記憶された音声認識の対象と
なる語彙を更新する認識対象生成部106とを具える。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声対話を通して、デ
ータベース上の情報を検索し、その結果を出力する装置
に関するものである。
【0002】
【従来の技術】人間と人間の間で行われる情報交換の媒
体の中で、最も自然に使われるのが音声である。一方、
計算機の飛躍的な進歩により、計算機は数値計算のみな
らず様々な情報を扱えるようになって来ている。そこ
で、人間と計算機の間でも、情報交換の媒体として音声
を利用したいという要求がある。
【0003】このような要求に応えるべく、音声によっ
て入力された情報に基づいて情報検索を行う音声情報検
索装置が登場してきている。
【0004】
【発明が解決しようとしている課題】しかしながら、上
記従来の音声情報検索装置には、予め登録したごく一部
の単語や文を用いてしか、音声による検索ができないと
いう問題点があった。
【0005】更に、ある対話の状態においては、その状
態に対して予め登録された対話内容しか認識できないた
め、自然な対話を行うことができないという問題点も生
じていた。このため、データベース上のあらゆる検索項
目を自然に検索できないという問題が生じていた。
【0006】また、一般に、対話を自然に行う時には、
対話のどの時点でも入力されうるユーザ入力文が存在す
る。例えば、旅に関する情報検索における対話では、
「どんな項目が聞けますか?」等のメタ質問や、「東京
にあるゴルフ場を知りたい。」等の非常にグローバルな
質問がある。一方、対話が進むに連れて、詳細な内容に
関わる質問、例えば、「箱根の湯本温泉の電話番号を知
りたい。」とか「群馬県吉井町の温泉の住所は?」とい
った質問が入力されるようになる。このように対話のど
の時点でも入力されうるユーザ入力文を受け付けて音声
認識するための静的な音声認識情報と、対話が進むに連
れて動的に変わっていく入力を受け付けて音声認識する
ための音声認識情報を同時に扱うためには、認識装置の
巨大化や認識性能の低下、制御の複雑化が問題となって
いる。
【0007】
【課題を解決するための手段】上記課題を解決するため
に、本発明の音声対話型情報検索装置は、音声情報を入
力する入力手段と、音声認識の対象となる語彙を記憶す
る記憶手段と、該記憶手段を参照して前記入力手段より
入力された音声情報の認識を実行する認識手段と、該認
識手段による認識結果を解釈する解釈手段と、該解釈手
段の解釈結果に基づいて、情報を検索する検索手段と、
該検索手段による検索結果に基づいて応答を生成する生
成手段と、該生成手段により生成された応答を出力する
出力手段と、前記解釈手段による解釈結果及び前記検索
手段による検索結果に基づいて、前記記憶手段に記憶さ
れた音声認識の対象となる語彙を更新する更新手段とを
具える。
【0008】また、本発明の他の態様によれば、音声対
話型情報検索方法に、音声情報を入力する入力工程と、
音声認識の対象となる語彙を記憶する記憶部を参照し
て、前記入力工程において入力された音声情報の認識を
実行する認識工程と、該認識工程による認識結果を解釈
する解釈工程と、該解釈工程の解釈結果に基づいて、情
報を検索する検索工程と、該検索工程による検索結果に
基づいて応答を生成する生成工程と、該生成工程により
生成された応答を出力する出力工程と、前記解釈工程に
よる解釈結果及び前記検索工程による検索結果に基づい
て、前記記憶部に記憶された音声認識の対象となる語彙
を更新する更新工程とを具える。
【0009】
【作用】上記音声対話型情報検索装置は、音声認識の対
象となる語彙を記憶する記憶手段を参照して、入力手段
より入力された音声情報の認識を認識手段により実行
し、その認識結果を解釈手段により解釈し、その解釈結
果に基づいて、検索手段が情報を検索し、その検索結果
に基づいて生成手段が生成した応答を出力手段が出力す
る。そして前記解釈手段による解釈結果及び前記検索手
段による検索結果に基づいて、前記記憶手段に記憶され
た音声認識の対象となる語彙を、更新手段により更新す
る。
【0010】また、上記音声対話型情報検索方法は、音
声認識の対象となる語彙を記憶する記憶部を参照して、
入力工程において入力された音声情報の認識を認識工程
により実行し、その認識結果を解釈工程により解釈し、
その解釈結果に基づいて検索工程により情報を検索し、
その検索結果に基づいて生成工程により生成された応答
を出力工程において出力する。そして、前記解釈工程に
よる解釈結果及び前記検索工程による検索結果に基づい
て、前記記憶部に記憶された音声認識の対象となる語彙
を更新工程において更新する。
【0011】
【実施例】以下、図面を参照して本発明を詳細に説明す
る。
【0012】図1は、本発明の実施例の音声対話型情報
検索装置のブロック構成を示す図である。同図におい
て、101は、マイクより入力された音声をA/D変換
して装置内部に取り込む一方、生成された応答をD/A
変換してスピーカより出力する音声入出力部である。ま
た、102は、検索結果、対話の流れ、次発話情報など
を文字出力する表示部である。103は、データベース
を含み、そのデータベースに格納されている情報を検索
するための情報検索部である。104は、対話管理部1
07で管理される情報や情報検索部103で検索された
検索情報より、出力形式の対話応答文を生成する対話応
答生成部である。
【0013】また、105は、認識対象の情報である認
識語彙(読みと表記の対)及び文法を参照して、音声入
出力部101より入力された音声の認識を行う音声認識
部である。106は、階層辞書であるシソーラス108
を含み、それを参照して次発話で用いられると予想され
る認識対象の情報を生成する認識対象生成部である。ま
た、107は、音声認識部で認識された情報を解釈し、
情報検索部103に検索指示を与え、次発話予測、対話
応答を行う対話管理部である。
【0014】次に、以上のように構成される音声対話型
情報検索装置の動作を図2のフローチャートを参照して
説明する。
【0015】まず、ステップS201では、音声入出力
部101よりの音声入力を待ち、音声入力が行われる
と、この入力情報を音声認識部105に送る。ステップ
S202では、音声認識部105が、認識対象生成部1
06にて生成された情報を参照して入力情報の音声認識
を行う。そして、ステップS203で、この認識結果を
対話管理部107に送り、ステップS204にて、対話
管理部107が認識結果を解釈して検索条件が整ってい
るかを判定し、整っていれば検索の指示が出され、ステ
ップS205に進む。そうでなければ、不足情報を得る
ために対話を続ける指示が出されて、ステップS208
へ進む。
【0016】ステップS205では、検索条件が整って
いるので、情報検索部103において、データベースよ
り情報を検索する。続いて、ステップS206で、対話
管理部107や情報検索部103より出力される情報を
もとに、対話応答生成部104が対話の応答を生成す
る。ステップS207において、生成された応答を音声
入出力部101のスピーカより音声出力する、あるいは
表示部102に文字出力する。一方、情報検索部103
により検索された情報や対話管理部107にて管理され
る対話の状況をもとに、ステップS208では、次発話
に発声されると予測される認識対象の情報(語彙及び文
法)を、認識対象生成部106にて生成する。生成され
た認識対象の情報は、音声認識部105による次の発話
の認識の際に参照できるように音声認識部105内に保
存される。認識対象の情報が生成されたら、ステップS
201に戻り、再び、次発話の音声入力を待つ。
【0017】なお、このステップS208は、ステップ
S206〜207の対話応答の生成及び出力と並行して
実行するようにしてもよく、そのようにすれば、待ち時
間を短くすることができる。
【0018】また、図1の装置各部は、上述の如く動作
する1つまたは複数の専用ハードウエアで構成してもよ
いし、その一部を、CPUが、メモリに記憶された図2
に対応するプログラムを、メモリ上のワークエリアを利
用しながら実行することで、実現するようにしてもよ
い。
【0019】図3は、認識対象生成部106の詳細構成
を示す図である。図1と同じ部分には、同じ番号を付し
ている。ただし、図1が共通バス形式による装置構成を
示しているのに対し、図3は、装置各部間のデータの流
れを明らかとするように構成されている。
【0020】前述したように、一般に、対話を自然に行
う時には、対話のどこでも発声できる入力が存在する。
例えば、旅に関する情報検索の対話においては、「どん
な項目が聞けますか?」等のメタ質問や、「東京にある
ゴルフ場を知りたい。」等の非常にグローバルな質問で
ある。図3において、304は、このように対話のどこ
でも発声できる入力を受け付け、音声認識するための単
語が保持されている静的単語辞書部である。また、30
5はそのための文法が保持されている静的文法部であ
る。
【0021】一方、対話が進むに連れて、詳細な内容に
関わる質問が入力されるようになる。例えば、「箱根の
湯本温泉の電話番号を知りたい。」とか「群馬県吉井町
の温泉の住所は?」が挙げられる。
【0022】このように対話が進むに連れて動的に変更
する入力を受け付け、音声認識するための動的な単語辞
書として、対話管理部107で管理される対話の履歴に
基づいて、次発話予測単語辞書生成部306により次回
の発話で使用が予測される単語辞書を生成し、更に、検
索内容単語辞書生成部307が、情報検索部103で検
索された結果に基づいて、シソーラス108を参照して
単語辞書を生成する。なお、検索結果より生成される単
語に読みが付いていない場合は、単語読み付け部308
で読みを付加する。また、動的な文法は、生成される単
語辞書の内容に応じて、動的文法部309に保持されて
いる文法から、動的文法選択部310が選択/生成す
る。以上の動的な単語辞書及び文法に、静的単語辞書部
304と静的文法部305の情報を加えて、認識対象情
報生成部311で認識対象とする全ての情報を生成し、
音声認識部105に送る。
【0023】以下、本実施例においては、シソーラス1
08に格納される階層化した単語情報を「地名」とした
例について説明する。
【0024】「地名」は日本国内においても、関東地
方、近畿地方などの「地方名」、東京都、大阪府などの
「都道府県名」、堺市、千代田区、豊能町などの「市区
町村名」といった階層関係を持っている。シソーラス1
08には、各「地方」に存在する「都道府県名」および
各「都道府県」に存在する「市区町村名」の階層化した
情報が格納されている。
【0025】図4に地名の認識語彙を動的に変更する処
理の流れを示す。
【0026】ステップS401で、静的な認識用の情報
に地名の最上位である「地方名」を保持し、ステップS
402で、起動時の動的な認識用の情報に次位の「都道
府県名」をすべて保持する。すなわち、起動時の時点で
音声認識可能な「地名」は「地方名」と「都道府県名」
である。この時点でも、「宮城県」と「宮崎県」、「福
島県」と「徳島県」などといった誤認識しやすい地名が
存在する。
【0027】ステップS403では、音声認識結果に基
づいて対話管理部107で作成された検索条件により情
報検索部103で情報検索が行なわれ、ステップS40
4に移る。ステップS404では、検索条件中の地名が
「地方名」であればステップS405に移り、「地方
名」でなければステップS406に移る。ステップS4
05では、シソーラス108を参照して、検索結果が存
在する「都道府県名」を動的な認識用の情報の地名語彙
としてステップS408に移る。
【0028】ステップS406では、検索条件中の地名
が「都道府県名」であればステップS407に移り、
「都道府県名」でなければ、地名語彙は変更せず、ステ
ップS408に移る。ステップS407では、現在動的
な認識用の情報として保持している「都道府県名」に加
えて、シソーラス108を参照して、検索結果が存在す
る「市区町村名」を動的な認識用の情報の地名語彙とし
てステップS408に移る。ステップS408では、検
索結果の件数がある閾値(ここでは、例えば10件とす
る)以下であれば、ステップS409に移り、この閾値
より多ければステップS403に戻る。ステップS40
9では、検索の結果得られた具体的な名称を、動的な認
識用の情報に付け加えてステップS403に移る。
【0029】本発明による実施例に基づく対話例を図5
に示し、対話例によって変化する音声認識語彙を図6に
示す。
【0030】図5中、usr1は、起動時の認識用情報とし
て全都道府県名を地名語彙としているために、「宮城
県」を「宮崎県」と誤認識された例である。このため宮
崎県の温泉が検索される。また、地名が「宮崎県」とい
う都道府県であったため、図6のsys1の動的語彙とし
て、起動時より保持されていた全都道府県名と検索によ
って温泉が存在した市区町村名が保持される。一方、具
体的な温泉名は、件数(15件)が閾値(10件)を越
えるので保持しない。
【0031】そこで、usr2で「東北地方」で検索を行な
うと、地名が「東北地方」という地方名であるので、動
的語彙として「東北地方」の都道府県名が保持される。
またこの場合も検索された件数が多いので温泉名は動的
語彙として保持されない。従って、図6のsys2のよう
に、動的語彙は、東北地方の都道府県名だけに限定され
る。これにより、次の認識では、「宮崎県」が認識語彙
に入らないので、usr3では、「宮城県」を「宮崎県」と
誤認識されることがなくなる。
【0032】その後、図6のsys3の動的語彙として、sy
s1の動的語彙と同様、全都道府県名及び温泉の存在した
市区町村名が保持される。また、sys4では、地名が「仙
台市」という市区町村名であったので、地名語彙はsys3
のままであり、検索結果が閾値以下であるので、検索さ
れた温泉名が動的語彙に加えられている。
【0033】以上のごとく、地名のように階層化した構
造を持つ情報群を認識語彙とする場合、対話を通して着
目する階層を変え、認識語彙を変更することによって、
互いに誤認識しやすいような情報群の一方を認識語彙か
ら排除することにより、誤認識を減らすことができる。
【0034】また、対話が進むに連れて、上位の階層の
情報を認識語彙から除き、下位の階層にある詳細な情報
を認識語彙に取り入れて行くようにすることにより、対
話の各時点における認識語彙数が抑えられ、認識のため
の処理量・処理時間を増大させずに、対話の全体を通じ
て多数の語句を認識することが可能となる。
【0035】また、このように対話の進行に従い順次切
り替えられる動的な語彙とともに、対話のどの時点にも
現れうる入力文を認識するための語彙が、静的な語彙と
して用意されているので、いかなる時点でも、メタ質問
や非常にグローバルな質問を認識することができる。
【0036】以上のように本実施例によれば、自然でし
かも使い易い形で、音声入力による情報検索が実現でき
る。
【0037】〔他の実施例〕上記実施例では、地名の階
層として、「地方名」、「都道府県名」、「市区町村
名」の3階層として説明したが、これに加えて、日本、
アメリカ合衆国などの「国名」、更にはアジア、ヨーロ
ッパなどの「地域名」など、階層を増やしても構わな
い。その場合、図4のステップS404〜S7の分岐を
増やすことによって対処できる。
【0038】また、上記実施例では階層化した単語情報
として「地名」を用いたが、例えば、「会社組織の部署
名」における「本部名」、「部名」、「課名」など、他
の階層化した単語情報を利用しても同様の処理が可能で
ある。
【0039】
【発明の効果】以上説明したように、本発明によれば、
音声認識のための認識情報を対話に応じて動的に変更す
ることにより、自然で使い易い音声対話型情報検索装置
を実現できるという効果がある。
【図面の簡単な説明】
【図1】本発明による音声対話型情報検索装置の実施例
のブロック構成図である。
【図2】実施例の音声対話型情報検索処理のフローチャ
ートである。
【図3】実施例の認識対象生成部の図である。
【図4】実施例の地名認識語彙の変更処理の流れ図であ
る。
【図5】実施例のユーザとシステムの対話例を示す図で
ある。
【図6】対話例によって変化する音声認識語彙の図であ
る。
【符号の説明】
101 音声入出力部 102 表示部 103 情報検索部 104 対話応答生成部 105 音声認識部 106 認識対象生成部 107 対話管理部

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 音声情報を入力する入力手段と、 音声認識の対象となる語彙を記憶する記憶手段と、 該記憶手段を参照して前記入力手段より入力された音声
    情報の認識を実行する認識手段と、 該認識手段による認識結果を解釈する解釈手段と、 該解釈手段の解釈結果に基づいて、情報を検索する検索
    手段と、 該検索手段による検索結果に基づいて応答を生成する生
    成手段と、 該生成手段により生成された応答を出力する出力手段
    と、 前記解釈手段による解釈結果及び前記検索手段による検
    索結果に基づいて、前記記憶手段に記憶された音声認識
    の対象となる語彙を更新する更新手段とを具えたことを
    特徴とする音声対話型情報検索装置。
  2. 【請求項2】 前記記憶手段は、前記更新手段の更新対
    象となる動的な語彙と、前記更新手段の更新対象外とな
    る静的な語彙とを記憶することを特徴とする請求項1記
    載の音声対話情報検索装置。
  3. 【請求項3】 前記更新手段は、語彙を当該語彙間の階
    層関係とともに記憶する辞書を有し、当該語彙及び階層
    関係を参照して、前記記憶手段に記憶された語彙を更新
    することを特徴とする請求項1記載の音声対話情報検索
    装置。
  4. 【請求項4】 音声情報を入力する入力工程と、 音声認識の対象となる語彙を記憶する記憶部を参照し
    て、前記入力工程において入力された音声情報の認識を
    実行する認識工程と、 該認識工程による認識結果を解釈する解釈工程と、 該解釈工程の解釈結果に基づいて、情報を検索する検索
    工程と、 該検索工程による検索結果に基づいて応答を生成する生
    成工程と、 該生成工程により生成された応答を出力する出力工程
    と、 前記解釈工程による解釈結果及び前記検索工程による検
    索結果に基づいて、前記記憶部に記憶された音声認識の
    対象となる語彙を更新する更新工程とを具えたことを特
    徴とする音声対話型情報検索方法。
  5. 【請求項5】 前記記憶部に、前記更新工程の更新対象
    となる動的な語彙と、前記更新工程の更新対象外となる
    静的な語彙とを記憶させることを特徴とする請求項4記
    載の音声対話情報検索方法。
  6. 【請求項6】 前記更新工程では、語彙を当該語彙間の
    階層関係とともに記憶する辞書に記述された当該語彙及
    び階層関係を参照して、前記記憶部に記憶された語彙を
    更新することを特徴とする請求項4記載の音声対話情報
    検索方法。
JP5117169A 1993-05-19 1993-05-19 音声対話型情報検索装置及び方法 Pending JPH06332493A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5117169A JPH06332493A (ja) 1993-05-19 1993-05-19 音声対話型情報検索装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5117169A JPH06332493A (ja) 1993-05-19 1993-05-19 音声対話型情報検索装置及び方法

Publications (1)

Publication Number Publication Date
JPH06332493A true JPH06332493A (ja) 1994-12-02

Family

ID=14705156

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5117169A Pending JPH06332493A (ja) 1993-05-19 1993-05-19 音声対話型情報検索装置及び方法

Country Status (1)

Country Link
JP (1) JPH06332493A (ja)

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08266747A (ja) * 1995-03-31 1996-10-15 Matsushita Electric Ind Co Ltd 音声認識装置、反応装置、反応選択装置及びこれらを用いた反応玩具
JP2001034292A (ja) * 1999-07-26 2001-02-09 Denso Corp 単語列認識装置
JP2006053470A (ja) * 2004-08-16 2006-02-23 Nippon Telegr & Teleph Corp <Ntt> 音声対話シーケンス状態表記方法、プログラム、および音声対話装置
JP2007212919A (ja) * 2006-02-13 2007-08-23 Fujitsu Ten Ltd 音声対話システム
JP2007310137A (ja) * 2006-05-18 2007-11-29 Fujitsu Ltd 音声認識装置および音声認識プログラム
JP2010072507A (ja) * 2008-09-22 2010-04-02 Toshiba Corp 音声認識検索装置及び音声認識検索方法
WO2011121649A1 (ja) * 2010-03-30 2011-10-06 三菱電機株式会社 音声認識装置
US9865248B2 (en) 2008-04-05 2018-01-09 Apple Inc. Intelligent text-to-speech conversion
US9966060B2 (en) 2013-06-07 2018-05-08 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9971774B2 (en) 2012-09-19 2018-05-15 Apple Inc. Voice-based media searching
US9986419B2 (en) 2014-09-30 2018-05-29 Apple Inc. Social reminders
US10049675B2 (en) 2010-02-25 2018-08-14 Apple Inc. User profiling for voice input processing
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10079014B2 (en) 2012-06-08 2018-09-18 Apple Inc. Name recognition system
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US10706841B2 (en) 2010-01-18 2020-07-07 Apple Inc. Task flow identification based on user intent
US10791176B2 (en) 2017-05-12 2020-09-29 Apple Inc. Synchronization and task delegation of a digital assistant
US10810274B2 (en) 2017-05-15 2020-10-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
US10904611B2 (en) 2014-06-30 2021-01-26 Apple Inc. Intelligent automated assistant for TV user interactions
US11080012B2 (en) 2009-06-05 2021-08-03 Apple Inc. Interface for a virtual digital assistant

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08266747A (ja) * 1995-03-31 1996-10-15 Matsushita Electric Ind Co Ltd 音声認識装置、反応装置、反応選択装置及びこれらを用いた反応玩具
JP2001034292A (ja) * 1999-07-26 2001-02-09 Denso Corp 単語列認識装置
JP2006053470A (ja) * 2004-08-16 2006-02-23 Nippon Telegr & Teleph Corp <Ntt> 音声対話シーケンス状態表記方法、プログラム、および音声対話装置
JP2007212919A (ja) * 2006-02-13 2007-08-23 Fujitsu Ten Ltd 音声対話システム
JP2007310137A (ja) * 2006-05-18 2007-11-29 Fujitsu Ltd 音声認識装置および音声認識プログラム
US8560317B2 (en) 2006-05-18 2013-10-15 Fujitsu Limited Voice recognition apparatus and recording medium storing voice recognition program
US9865248B2 (en) 2008-04-05 2018-01-09 Apple Inc. Intelligent text-to-speech conversion
JP2010072507A (ja) * 2008-09-22 2010-04-02 Toshiba Corp 音声認識検索装置及び音声認識検索方法
US11080012B2 (en) 2009-06-05 2021-08-03 Apple Inc. Interface for a virtual digital assistant
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US11423886B2 (en) 2010-01-18 2022-08-23 Apple Inc. Task flow identification based on user intent
US10741185B2 (en) 2010-01-18 2020-08-11 Apple Inc. Intelligent automated assistant
US10706841B2 (en) 2010-01-18 2020-07-07 Apple Inc. Task flow identification based on user intent
US10049675B2 (en) 2010-02-25 2018-08-14 Apple Inc. User profiling for voice input processing
WO2011121649A1 (ja) * 2010-03-30 2011-10-06 三菱電機株式会社 音声認識装置
CN102770910A (zh) * 2010-03-30 2012-11-07 三菱电机株式会社 声音识别装置
US10079014B2 (en) 2012-06-08 2018-09-18 Apple Inc. Name recognition system
US9971774B2 (en) 2012-09-19 2018-05-15 Apple Inc. Voice-based media searching
US9966060B2 (en) 2013-06-07 2018-05-08 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US10904611B2 (en) 2014-06-30 2021-01-26 Apple Inc. Intelligent automated assistant for TV user interactions
US9986419B2 (en) 2014-09-30 2018-05-29 Apple Inc. Social reminders
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US10791176B2 (en) 2017-05-12 2020-09-29 Apple Inc. Synchronization and task delegation of a digital assistant
US11405466B2 (en) 2017-05-12 2022-08-02 Apple Inc. Synchronization and task delegation of a digital assistant
US10810274B2 (en) 2017-05-15 2020-10-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback

Similar Documents

Publication Publication Date Title
JPH06332493A (ja) 音声対話型情報検索装置及び方法
JP5526396B2 (ja) 情報検索装置、情報検索システム及び情報検索方法
CN102549652B (zh) 信息检索装置
Issar Estimation of language models for new spoken language applications
US20190370398A1 (en) Method and apparatus for searching historical data
CN102725790B (zh) 识别词典制作装置及声音识别装置
US7949524B2 (en) Speech recognition correction with standby-word dictionary
JP3454897B2 (ja) 音声対話システム
JP7200405B2 (ja) 音声認識のためのコンテキストバイアス
JP3278222B2 (ja) 情報処理方法及び装置
US6961706B2 (en) Speech recognition method and apparatus
US20060129396A1 (en) Method and apparatus for automatic grammar generation from data entries
US20020013706A1 (en) Key-subword spotting for speech recognition and understanding
US7742924B2 (en) System and method for updating information for various dialog modalities in a dialog scenario according to a semantic context
US20110320464A1 (en) Retrieval device
US20120239399A1 (en) Voice recognition device
JP5753769B2 (ja) 音声データ検索システムおよびそのためのプログラム
KR20060070605A (ko) 영역별 언어모델과 대화모델을 이용한 지능형 로봇 음성인식 서비스 장치 및 방법
JP2002123290A (ja) 音声認識装置ならびに音声認識方法
JPH07219590A (ja) 音声情報検索装置及び方法
CN111508497B (zh) 语音识别方法、装置、电子设备及存储介质
JP3634863B2 (ja) 音声認識システム
JP7279099B2 (ja) 対話管理
CN103918027A (zh) 用于语音应用中的最优有限状态转换机(fst)的有效渐进修改
JP5378907B2 (ja) 音声対話装置及び音声対話プログラム

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20011009