JPWO2007066433A1 - 音声認識装置 - Google Patents

音声認識装置 Download PDF

Info

Publication number
JPWO2007066433A1
JPWO2007066433A1 JP2007549020A JP2007549020A JPWO2007066433A1 JP WO2007066433 A1 JPWO2007066433 A1 JP WO2007066433A1 JP 2007549020 A JP2007549020 A JP 2007549020A JP 2007549020 A JP2007549020 A JP 2007549020A JP WO2007066433 A1 JPWO2007066433 A1 JP WO2007066433A1
Authority
JP
Japan
Prior art keywords
vocabulary
dictionary
speech recognition
type
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007549020A
Other languages
English (en)
Other versions
JP4846734B2 (ja
Inventor
政信 大沢
政信 大沢
玲子 岡田
玲子 岡田
充 海老原
充 海老原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=38122585&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JPWO2007066433(A1) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2007549020A priority Critical patent/JP4846734B2/ja
Publication of JPWO2007066433A1 publication Critical patent/JPWO2007066433A1/ja
Application granted granted Critical
Publication of JP4846734B2 publication Critical patent/JP4846734B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/228Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)
  • Navigation (AREA)

Abstract

音声認識装置10は、音声認識辞書を参照して入力音声を音声認識して音声認識結果を出力しており、外部接続機器20−1〜20−Nが接続され外部接続機器からその種別を取得するとともに外部接続機器に登録されたデータを取得する外部情報取得手段14と、データから語彙を抽出語彙として抽出し抽出語彙を解析して当該抽出語彙にヨミを付与して解析データとする語彙抽出解析手段15及び16と、種別に対応する音声認識辞書に解析データを格納する辞書生成手段17とを有し、外部接続機器の種別毎に音声認識辞書13−1〜13−Nを備える。

Description

この発明は、複数の音声認識辞書を備えて、音声認識を行う音声認識装置に関し、特に、携帯電話機等の外部接続機器に対応した音声認識辞書を備える音声認識装置に関するものである。
一般に、音声認識装置においては、音声認識辞書に登録された単語(語彙)を参照して音声認識を行っており、音声認識率を向上させるためには音声認識辞書に多数の単語を登録する必要がある。このため、音声認識装置には、既存の音声認識辞書にユーザが単語を追加登録して音声認識辞書を更新する機能及び/又はユーザ個人用の音声認識辞書を作成する機能を有するものがある。
例えば、音声認識装置において、音声入力による電子メールの作成において使用される音声認識辞書の作成の際、メール作成処理が開始されたことを検出すると、アプリケーションにおいて取得された文書データを読み込んで文書データを解析し、既存の音声認識辞書に存在しない未知語を抽出して、抽出した未知語を含む音声認識辞書を作成するようにしたものがある(例えば、特許文献1参照)。
さらに、音声認識辞書を作成・更新する際、第1の解析辞書記憶部に日常使用される語彙の表記及び読み等が登録された第1の解析辞書を記憶し、第2の解析辞書記憶部に特殊な語彙の表記及び読み等が登録された第2の解析辞書を記憶して、テキスト解析部で両解析辞書を用いて形態素解析を行う一方、読み付与部2で入力形態素に読みを付与する際に、第2の解析辞書の登録語彙に関して第2の解析辞書の語彙/読みの対と他の候補/読み候補の対とを対応テーブルに記録して、音声認識辞書作成部によって対応テーブルの内容に基づいて音声認識辞書を作成して、音声認識辞書を、認識語彙と第2の解析辞書の音素表記及び他の音素表記候補との対応付けに基づいて作成するようにしたものがある(例えば、特許文献2参照)。
特開2004−233577公報(第3頁〜第9頁、第1図〜第9図) 特開2003−271183公報(第6頁〜第12頁、第1図〜第7図)
従来の音声認識装置は以上のように構成されているので、音声認識辞書を作成・更新する際の対象が文書データの送受信が可能なアプリケーションに限られており、音声認識装置に接続される外部接続機器によって認識の際の単語の使用頻度が大きく異なることがあり、さらには、外部接続機器によって認識に使用する単語・語彙が異なることもあることを考慮すると、単一のアプリケーション(つまり、単一の外部接続機器)のための音声認識辞書を作成・更新するようにしたのでは、外部接続機器が異なると効率的に音声認識を行うことができないという課題があった。
また、従来の音声認識装置では、単一の音声認識辞書に解析した単語を登録しているので、登録単語数が増加すると、音声認識辞書の検索に時間が掛かり、効率的に音声認識を行えないばかりか、類似語が多くなって認識率が低下することがある。
この発明は上記のような課題を解決するためになされたもので、外部接続機器に応じて効率的に音声認識を行うことのできる音声認識装置を得ることを目的とする。
この発明に係る音声応答装置は、音声認識辞書を参照して入力音声を音声認識して音声認識結果を出力しており、外部接続機器が接続され外部接続機器からその種別を取得するとともに外部接続機器に登録されたデータを取得する外部情報取得手段と、データから語彙を抽出語彙として抽出し抽出語彙を解析して当該抽出語彙にヨミを付与して解析データとする語彙抽出解析手段と、種別に対応する音声認識辞書に解析データを格納する辞書生成手段とを有し、外部接続機器の種別毎に音声認識辞書を備えることを特徴とするものである。
以上のように、この発明によれば、音声認識結果について誤認識であるか否かを判定して、誤認識であると判定すると、音声認識辞書を切り替えて音声認識処理を継続するように構成したので、ユーザが特別の操作を行うことなく、音声認識辞書を切り替えて音声認識を行うことができ、その結果、音声認識処理時間を短縮して認識率を向上させることができるという効果がある。
この発明の実施の形態1による音声認識装置の一例を外部接続機器とともに示すブロック図である。 図1に示す音声認識装置において音声認識辞書への語彙登録を説明するためのフローチャートである。 図1に示す音声認識装置において音声認識辞書の更新及び新規作成を説明するためのフローチャートである。 この発明の実施の形態2による音声認識装置の一例を外部接続機器とともに示すブロック図である。 図4に示す音声認識装置において音声認識辞書をアクティブとする動作を説明するためのフローチャートである。 この発明の実施の形態3による音声認識装置の一例を外部接続機器とともに示すブロック図である。 図6に示す音声認識装置において外部情報語彙解析手段の動作を説明するためのフローチャートである。 図6に示す音声認識装置において語彙候補提示手段の動作を説明するための図であり、(a)及び(b)はそれぞれ語彙候補提示手段によって提示される語彙候補の例を示す図である。
以下、この発明をより詳細に説明するために、この発明を実施するための最良の形態について、添付の図面に従って説明する。
実施の形態1.
図1はこの発明の実施の形態1による音声認識装置の一例を示すブロック図であり、図示の音声認識装置10は、例えば、カーナビゲーション装置で用いられる。音声認識装置10はマイク等の音声入力手段11、音声認識手段12、及び複数の音声認識辞書(以下単に辞書と呼ぶ)13−1乃至13−N(Nは2以上の整数)を備えるとともに、外部情報取得手段14、外部情報語彙抽出手段15、外部情報語彙解析手段16、外部情報辞書生成手段(辞書生成手段)17、語彙解析用辞書18、及びCDDB(コンパクトディスクデータベース:音楽CDに収録された楽曲に関する情報をユーザのCD再生ソフト又は周辺機器に提供するためのデータベース)19を備えている。そして、外部情報取得手段14には複数の外部接続機器20−1乃至20−Nが接続される。
なお、外部情報語彙抽出手段15、外部情報語彙解析手段16、語彙解析用辞書18、及びCDDB19によって語彙抽出解析手段が構成され、語彙解析用辞書18及びCDDB19によって解析辞書が構成される。
外部接続機器20−1乃至20−Nは、例えば、携帯電話機、小型ミュージックプレーヤ(例えば、iPod(商品名))、キーボード、又はPDA(Personal Digital Assistant)であり、互いに異なる装置であり、辞書13−1乃至13−Nはそれぞれ外部接続機器20−1乃至20−Nに対応している。
音声認識を行う際には、音声入力手段11から入力された音声が音声認識手段12に与えられ、音声認識手段12は、後述するようにして生成された辞書13−1乃至13−Nのいずれか1つを参照して入力音声を認識して、音声認識結果を出力する。つまり、外部接続機器20−n(nは1からNまでのいずれかの数)に関して音声認識を行う際には、辞書13−nを用いて音声認識が行われる。
なお、上述の音声認識結果に応じて、例えば、カーナビゲーション装置では、画面遷移又は外部接続機器20−nの操作を行い、遷移後の画面又は外部接続機器の操作結果がモニター等に表示される。
次に動作について説明する。
図1及び図2を参照して、辞書13−1乃至13−Nの生成について説明すると、いま、外部接続機器20−nが外部情報取得手段14に接続されると、外部接続機器20−nから機器を特定するためのID信号が外部情報取得手段14に与えられる。これによって、外部情報取得手段14は外部接続機器20−nの種類を判別する。
続いて、外部情報取得手段14は外部接続機器20−n内に記憶されたデータ(例えば、携帯電話機であれば受信メール、iPodであれば曲名、アーティスト名、アルバム名等)を取得した(ステップST1)後、外部情報辞書生成手段17に外部接続機器20−nの種別(種類)を通知する(ステップST2)。なお、外部情報取得手段14に接続される外部接続機器20−nが変更されると、同様にして、ステップST1及びST2が実行される。
外部情報取得手段14で取得されたデータは、外部情報語彙抽出手段15に渡されて、ここで解析対象となる部分(例えば、受信メールの本文、曲名、アーティスト名、又はアルバム名等)を抽出して抽出データとして外部情報語彙解析手段16に渡す(ステップST3)。
外部情報語彙解析手段16では、抽出されたデータがメール文章のような文章である際には、形態素解析を行い、語彙解析用辞書18を参照して、文章を単語に切り分け、解析の際に得られるヨミを各単語に付与して解析データを得る(ステップST4)。一方、抽出されたデータが曲名又はアーティスト名等の単語である場合には、外部情報語彙解析手段16はその表記をキーとしてCDDB19を検索して、ヨミを取得し当該語彙に付与して解析データとする。
これら解析データは外部情報語彙解析手段16から外部情報辞書生成手段17に渡されて、外部情報辞書生成手段17は、外部情報取得手段14から送られた外部接続機器種別に基づいて、外部接続機器20−nに対応する辞書13−nに解析データを格納する(ステップST5)。このようにして、外部接続機器20−1乃至20−Nに対応して辞書13−1乃至13−Nを生成することになる。
ところで、前述の辞書13−1乃至13−Nは、メモリ中の辞書保存領域に保存され、所定のユーザ以外によって削除されることはない。そして、音声認識装置10を起動する都度、又は外部接続機器20−nを切り替える際に外部接続機器20−nに対応する辞書13−nが用いられる。
続いて、図3を参照して、前述のステップST5について詳しく説明すると、外部情報辞書生成手段17では解析データを辞書13−nに格納する際、まず、外部接続機器20−nの種別に基づいて該当する辞書13−nが存在するか否かを判定し(種別判定手段:ステップST6)、該当する辞書13−nが存在しないと、辞書保存領域中に新たに辞書13−nを作成して(辞書作成手段:ステップST7)、この新規辞書13−nに解析データを格納する。
一方、ステップST6において、外部接続機器20−nに対応する辞書13−nが存在すると判定した場合には、外部情報辞書生成手段17は、辞書13−n中の語彙を調べて、解析データに一致する語彙があるか否かを調べる。つまり、解析データから辞書13−nに存在しないデータを抽出して(ステップST8)、辞書13−nに存在しない解析データのみを辞書13−nに格納して、辞書13−nを更新する(辞書更新手段:ステップST9)。そして、外部情報辞書生成手段17は、辞書13−nに既に存在する解析データを破棄する。
なお、辞書更新の際、辞書に存在する語彙のうち解析データに含まれていない語彙を削除するようにしてもよい。このようにすれば、辞書に格納されるデータ量の増加を防止でき、その結果効率的に音声認識を行うことができる。
以上のように、この実施の形態1によれば、外部接続機器の種別に応じて辞書を生成するように構成したので、外部接続機器毎の辞書を用いて音声認識を行うようにすれば、認識効率が向上するばかりでなく、認識率が向上し、外部接続機器を容易に音声入力によって操作することができるという効果がある。
この実施の形態1によれば、外部接続機器を外部情報取得手段に接続すると、自動的に対応する辞書が更新される結果、ユーザが意識することなく辞書の更新が行えるという効果がある。
実施の形態2.
図4はこの発明の実施の形態2による音声認識装置の一例を示すブロック図であり、図示の音声認識装置30において、図1に示す音声認識装置10と同一の構成要素については同一の参照番号を付す。音声認識装置30はさらに音声認識辞書制御手段31を有しており、外部情報取得手段14は外部接続機器20−nの種別を音声認識辞書制御手段31にも通知する。
図5も参照して、いま、外部接続機器20−nが変更されると、前述したように、外部情報取得手段14は外部接続機器20−nからデータを取得した(ステップST10)後、外部情報辞書取得手段17に外部情報機器20−nの種別を通知するとともに、音声認識辞書制御手段31に外部情報機器20−nの種別を通知する(ステップST11)。
図1で関連して説明したように、外部情報取得手段14で取得されたデータから、外部情報語彙抽出手段15によって解析対象となる部分が抽出されて抽出データとして外部情報語彙解析手段16に渡される(ステップST12)。そして、外部情報語彙解析手段16では、語彙解析用辞書18又はCDDB19を参照して、解析データ(ヨミを付与した語彙)を得る(ステップST13)。外部情報辞書生成手段17は、外部情報取得手段14から送られた外部接続機器種別に基づいて、外部接続機器20−nに対応する辞書13−nに解析データを格納する(ステップST14)。
一方、音声認識辞書制御手段31は、外部接続機器種別に応じてこの外部接続機器20−nに対応する辞書13−nをアクティブにする(ステップST15)。なお、複数の外部接続機器が外部情報取得手段14に接続されている際には、これら複数の外部接続機器に各々に対応する辞書がアクティブとされる。
以上のように、この実施の形態2によれば、外部接続機器の種別に応じて対応する辞書をアクティブとするように構成したので、音声認識を行う際、外部情報取得手段に外部接続機器を接続すれば、辞書が切り替えられることになって、ユーザは辞書の切り替えを意識することなく、音声入力を行うことができるという効果がある。
この実施の形態2によれば、外部情報取得手段に接続された外部接続機器に対応する辞書のみがアクティブとなる結果、音声認識の際に参照すべき辞書を削減することができ、音声認識を効率的に行うことができるばかりでなく、認識率を向上させることができるという効果がある。
実施の形態3.
図6はこの発明の実施の形態3による音声認識装置の一例を示すブロック図であり、図示の音声認識装置40において、図1に示す音声認識装置10と同一の構成要素については同一の参照番号を付す。音声認識装置40はさらに語彙候補選択手段41及び語彙候補提示手段42を有しており、後述するように、外部情報語彙抽出手段15で抽出された抽出データ(語彙)を外部情報語彙解析手段16で解析した結果得られた解析データ(ヨミが付与された語彙)にゆらぎが存在する場合(例えば、複数の語彙候補が存在する場合)、外部情報語彙解析手段16はその旨語彙候補提示手段42に連絡する。
語彙候補提示手段42では複数の語彙候補を、例えば、モニター(図示せず)に表示して、ユーザに選択を促す。ユーザが語彙候補選択手段41によって複数の語彙候補から1つの語彙候補を選択語彙として選択すると、この選択語彙が外部情報語彙解析手段16に与えられ、外部情報語彙解析手段16は選択語彙を解析データとして外部情報辞書生成手段17に渡す。そして、外部情報辞書生成手段17は、外部情報取得手段14から送られた外部接続機器種別に基づいて、外部接続機器20−nに対応する辞書13−nに解析データを格納する。
図7及び図8も参照して、いま、iPodのような音楽データ再生機器が外部接続機器20−nとして外部情報取得手段14に接続されているとすると、前述したように、外部情報取得手段14は外部接続機器20−nの種別を外部情報辞書生成手段17に渡すとともに、外部接続機器20−nからデータを取得して(ステップST16)、このデータを外部情報語彙抽出手段15に送る。
外部情報語彙抽出手段15は、外部情報取得手段14で取得されたデータから解析対象となる部分を抽出して(ここでは、例えば、曲名、アーティスト名、及びアルバム名等のデータが抽出される:ステップST17)、抽出データとして外部情報語彙解析手段16に送る。外部情報語彙解析手段16では、まず、抽出データがメール文章のような文章であるか否かを判定して(ステップST18)、抽出データが文章であると、外部情報語彙解析手段16は形態素解析を行い、語彙解析用辞書18を参照して、文章を単語(語彙)に切り分け、解析の際に得られるヨミを各単語に付与して解析データを得る(ステップST19)。
この解析データは外部情報語彙解析手段16から外部情報辞書生成手段17に送られ、外部情報辞書生成手段17は、外部情報取得手段14から送られた外部接続機器20−nの種別に対応する辞書20−nに解析データを格納する(ステップST20)。
一方、ステップST18において、抽出データが文章でないと判定されると、外部情報語彙解析手段16ではその表記をキーとしてCDDB19を検索して(ステップST21)、検索結果である語彙が存在するか否かを判定する(つまり、一致する語彙があるかを判断する:ステップST22)。一致する語彙があると、外部情報語彙解析手段16は当該語彙にヨミを付与して解析データとする(ステップST23)。その後、外部情報辞書生成手段17によってステップST20が行われる。
ところで、曲名、アーティスト名、又はアルバム名にゆらぎがあると、抽出データと一致する語彙がCDDB19に存在せず、ステップST22において、外部情報語彙解析手段16は検索結果が存在しないと判断する。例えば、図8(a)に示すように、外部接続機器20−nに登録されているデータの表記が「○○○×□」であり、CDDB19に登録されている語彙の表記が「○○○△×」及び「○○○×△」等であると、抽出データと一致する登録語彙がCDDB19に存在しない。この場合、外部情報語彙解析手段16では、抽出データに類似する語彙を語彙候補として選択して(ステップST24)、語彙候補提示手段42によってモニター(提示部)43に語彙候補を提示する。
図8(a)に示す例では、提示部43に語彙候補として、「○○○△×」及び「○○○×」が提示され、ユーザが語彙候補選択手段41によって語彙候補から1つの語彙候補を選択語彙として選択すると、ステップST23において外部情報語彙解析手段16は選択語彙にヨミを付与して解析データとする。その後、外部情報辞書生成手段17によってステップST20が行われる。
外部情報語彙解析手段16において抽出データと登録語彙との類似度を判定する際には、抽出データの表記と登録語彙の表記の文字列長又は文字の一致数、かなに変換した際の文字列長又は文字の一致数等を用いて類似度(字数に対する誤字数の比率)が求められる。例えば、類似度は0(まったく一致していない)〜100(完全に一致している)までの度合いを有し、類似度が予め規定された閾値(例えば、80)以上であると、外部情報語彙解析手段16はその語彙を語彙候補として語彙候補提示手段42によって提示部43に提示する。図示の例では、ステップST22及びST24が類似語彙判定手段に相当する。
図8(b)に示す例では、外部接続機器20−nに登録されているデータの表記が「ウィッシュカムズトゥルー」であり、CDDB19に登録されている語彙の表記が「ウィッシュカムトゥルー」等であると、抽出データと一致する登録語彙がCDDB19に存在しないものの、類似判定によって、外部情報語彙解析手段16は、語彙候補提示手段42によって提示部43に語彙候補として「ウィッシュカムトゥルー」を提示する。
以上のように、この実施の形態3によれば、外部接続機器に登録されているデータの表記に一致する語彙が存在しない場合においても、類似する語彙候補を提示してユーザが語彙候補から1つの語彙候補を選択すると、選択語彙として辞書に登録するように構成したので、辞書の語彙を精度よくすることができ、誤認識率を低減することができるという効果がある。
以上のように、この発明に係る音声認識装置は、外部接続機器に応じて効率的に音声認識を行うことのできるので、例えば携帯電話機等で用いられる音声認識装置に用いるのに適している。

Claims (5)

  1. 音声認識辞書を参照して入力音声を音声認識して音声認識結果を出力する音声認識装置において、
    外部接続機器が接続され該外部接続機器からその種別を取得するとともに前記外部接続機器に登録されたデータを取得する外部情報取得手段と、
    前記データから語彙を抽出語彙として抽出し該抽出語彙を解析して当該抽出語彙にヨミを付与して解析データとする語彙抽出解析手段と、
    前記種別に対応する前記音声認識辞書に前記解析データを格納する辞書生成手段とを有し、
    前記外部接続機器の種別毎に前記音声認識辞書を備えることを特徴とする音声認識装置。
  2. 辞書生成手段は解析データを受けた際外部接続機器の種別に対応する音声認識辞書が存在するか否かを判定する種別判定手段と、
    前記外部接続機器の種別に対応する音声認識辞書が存在しないと当該種別に対応する音声認識辞書を新規に作成する辞書作成手段と、
    前記外部接続機器の種別に対応する音声認識辞書が存在すると当該種別に対応する音声認識辞書を更新する辞書更新手段とを有することを特徴とする請求項1記載の音声認識装置。
  3. 外部情報取得手段に接続された外部接続機器の種別を受け、該種別に対応する音声認識辞書のみをアクティブとする音声認識辞書制御手段を有することを特徴とする請求項1記載の音声認識装置。
  4. 語彙抽出解析手段は、抽出語彙を解析する際に用いる解析辞書と、
    前記抽出語彙に一致する語彙が前記解析辞書に存在しないと当該抽出語彙に類似する語彙が前記解析辞書に存在するか否かを判定する類似語彙判定手段とを有し、
    前記抽出語彙に類似する語彙が前記解析辞書に存在すると当該類似する語彙を語彙候補として提示する語彙候補提示手段を備えることを特徴とする請求項1記載の音声認識装置。
  5. 語彙候補提示手段によって提示された語彙候補から1つの語彙候補を選択語彙として選択する語彙候補選択手段を有し、
    語彙解析手段は前記選択語彙にヨミを付与して解析データとすることを特徴とする請求項4記載の音声認識装置。
JP2007549020A 2005-12-07 2006-08-18 音声認識装置 Expired - Fee Related JP4846734B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007549020A JP4846734B2 (ja) 2005-12-07 2006-08-18 音声認識装置

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2005353695 2005-12-07
JP2005353695 2005-12-07
JP2007549020A JP4846734B2 (ja) 2005-12-07 2006-08-18 音声認識装置
PCT/JP2006/316257 WO2007066433A1 (ja) 2005-12-07 2006-08-18 音声認識装置

Publications (2)

Publication Number Publication Date
JPWO2007066433A1 true JPWO2007066433A1 (ja) 2009-05-14
JP4846734B2 JP4846734B2 (ja) 2011-12-28

Family

ID=38122585

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007549020A Expired - Fee Related JP4846734B2 (ja) 2005-12-07 2006-08-18 音声認識装置

Country Status (5)

Country Link
US (1) US8060368B2 (ja)
JP (1) JP4846734B2 (ja)
CN (1) CN101326571B (ja)
DE (1) DE112006002979T5 (ja)
WO (1) WO2007066433A1 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009204872A (ja) * 2008-02-28 2009-09-10 Alpine Electronics Inc 音声認識用辞書生成システム
JP5465926B2 (ja) * 2009-05-22 2014-04-09 アルパイン株式会社 音声認識辞書作成装置及び音声認識辞書作成方法
US9230538B2 (en) * 2011-04-08 2016-01-05 Mitsubishi Electric Corporation Voice recognition device and navigation device
US9235565B2 (en) * 2012-02-14 2016-01-12 Facebook, Inc. Blending customized user dictionaries
TWI508057B (zh) * 2013-07-15 2015-11-11 Chunghwa Picture Tubes Ltd 語音辨識系統以及方法
DE102014209358A1 (de) * 2014-05-16 2015-11-19 Ford Global Technologies, Llc Vorrichtung und Verfahren zur Spracherkennung, insbesondere in einem Fahrzeug
EP3444808A4 (en) * 2016-04-11 2019-05-01 Sony Corporation INFORMATION PROCESSING DEVICE, INFORMATION PROCESSING PROCESS AND PROGRAM
KR20200035476A (ko) * 2016-10-03 2020-04-03 구글 엘엘씨 디바이스 토폴로지에 기초한 음성 명령 프로세싱
US10572586B2 (en) * 2018-02-27 2020-02-25 International Business Machines Corporation Technique for automatically splitting words

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05342260A (ja) * 1992-06-08 1993-12-24 Sharp Corp 単語綴りチェック装置
JPH09171395A (ja) * 1995-12-20 1997-06-30 Oki Electric Ind Co Ltd 音声認識装置
JPH11237896A (ja) * 1998-02-24 1999-08-31 Clarion Co Ltd 音声認識による制御装置及び方法、制御対象ユニット、音声認識による制御を用いるシステム並びに音声認識による制御用プログラムを記録した記録媒体
JPH11311996A (ja) * 1997-10-23 1999-11-09 Sony Internatl Europ Gmbh 音声装置及び遠隔制御可能なネットワーク機器
WO2002001550A1 (fr) * 2000-06-26 2002-01-03 Mitsubishi Denki Kabushiki Kaisha Procede et systeme de commande d'un dispositif

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08248980A (ja) 1995-03-06 1996-09-27 Fuji Xerox Co Ltd 音声認識装置
US5825306A (en) 1995-08-25 1998-10-20 Aisin Aw Co., Ltd. Navigation system for vehicles
US5809471A (en) 1996-03-07 1998-09-15 Ibm Corporation Retrieval of additional information not found in interactive TV or telephony signal by application using dynamically extracted vocabulary
EP1021804A4 (en) * 1997-05-06 2002-03-20 Speechworks Int Inc SYSTEM AND METHOD FOR DEVELOPING INTERACTIVE LANGUAGE APPLICATIONS
JPH11231886A (ja) 1998-02-18 1999-08-27 Denso Corp 登録名称認識装置
US6233559B1 (en) * 1998-04-01 2001-05-15 Motorola, Inc. Speech control of multiple applications using applets
JP4036528B2 (ja) 1998-04-27 2008-01-23 富士通株式会社 意味認識システム
DE19910236A1 (de) * 1999-03-09 2000-09-21 Philips Corp Intellectual Pty Verfahren zur Spracherkennung
WO2000058942A2 (en) * 1999-03-26 2000-10-05 Koninklijke Philips Electronics N.V. Client-server speech recognition
US6360201B1 (en) * 1999-06-08 2002-03-19 International Business Machines Corp. Method and apparatus for activating and deactivating auxiliary topic libraries in a speech dictation system
JP2001022374A (ja) * 1999-07-05 2001-01-26 Victor Co Of Japan Ltd 電子番組ガイドの操作装置および電子番組ガイドの送信装置
JP4314680B2 (ja) 1999-07-27 2009-08-19 ソニー株式会社 音声認識制御システム及び音声認識制御方法
JP3476008B2 (ja) 1999-09-10 2003-12-10 インターナショナル・ビジネス・マシーンズ・コーポレーション 音声情報の登録方法、認識文字列の特定方法、音声認識装置、音声情報の登録のためのソフトウエア・プロダクトを格納した記憶媒体、及び認識文字列の特定のためのソフトウエア・プロダクトを格納した記憶媒体
JP2001296881A (ja) 2000-04-14 2001-10-26 Sony Corp 情報処理装置および方法、並びに記録媒体
US6654720B1 (en) * 2000-05-09 2003-11-25 International Business Machines Corporation Method and system for voice control enabling device in a service discovery network
JP2002351652A (ja) 2001-05-23 2002-12-06 Nec System Technologies Ltd 音声認識操作支援システム、音声認識操作支援方法、および、音声認識操作支援プログラム
JP4017887B2 (ja) 2002-02-28 2007-12-05 富士通株式会社 音声認識システムおよび音声ファイル記録システム
JP3911178B2 (ja) 2002-03-19 2007-05-09 シャープ株式会社 音声認識辞書作成装置および音声認識辞書作成方法、音声認識装置、携帯端末器、音声認識システム、音声認識辞書作成プログラム、並びに、プログラム記録媒体
EP1372139A1 (en) * 2002-05-15 2003-12-17 Pioneer Corporation Speech recognition apparatus and program with error correction
US7003457B2 (en) * 2002-10-29 2006-02-21 Nokia Corporation Method and system for text editing in hand-held electronic device
JP4217495B2 (ja) 2003-01-29 2009-02-04 キヤノン株式会社 音声認識辞書作成方法、音声認識辞書作成装置及びプログラム、記録媒体
JP2005148151A (ja) * 2003-11-11 2005-06-09 Mitsubishi Electric Corp 音声操作装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05342260A (ja) * 1992-06-08 1993-12-24 Sharp Corp 単語綴りチェック装置
JPH09171395A (ja) * 1995-12-20 1997-06-30 Oki Electric Ind Co Ltd 音声認識装置
JPH11311996A (ja) * 1997-10-23 1999-11-09 Sony Internatl Europ Gmbh 音声装置及び遠隔制御可能なネットワーク機器
JPH11237896A (ja) * 1998-02-24 1999-08-31 Clarion Co Ltd 音声認識による制御装置及び方法、制御対象ユニット、音声認識による制御を用いるシステム並びに音声認識による制御用プログラムを記録した記録媒体
WO2002001550A1 (fr) * 2000-06-26 2002-01-03 Mitsubishi Denki Kabushiki Kaisha Procede et systeme de commande d'un dispositif

Also Published As

Publication number Publication date
DE112006002979T5 (de) 2008-10-09
CN101326571B (zh) 2012-05-23
US20090228276A1 (en) 2009-09-10
US8060368B2 (en) 2011-11-15
WO2007066433A1 (ja) 2007-06-14
CN101326571A (zh) 2008-12-17
JP4846734B2 (ja) 2011-12-28

Similar Documents

Publication Publication Date Title
JP4846734B2 (ja) 音声認識装置
JP4058071B2 (ja) 用例翻訳装置、用例翻訳方法および用例翻訳プログラム
US11049493B2 (en) Spoken dialog device, spoken dialog method, and recording medium
EP2477186B1 (en) Information retrieving apparatus, information retrieving method and navigation system
JP3962763B2 (ja) 対話支援装置
US8155956B2 (en) Voice query extension method and system
US20070124131A1 (en) Input apparatus, input method and input program
US20060136227A1 (en) Dialog supporting apparatus
JP2011018330A (ja) 統計的な方法を用いて漢字を自国語の発音列に変換するシステムおよび方法
JP4570509B2 (ja) 読み生成装置、読み生成方法及びコンピュータプログラム
JP5753769B2 (ja) 音声データ検索システムおよびそのためのプログラム
JP6599219B2 (ja) 読み付与装置、読み付与方法、およびプログラム
US20070016420A1 (en) Dictionary lookup for mobile devices using spelling recognition
JPWO2007069762A1 (ja) 類似文検索方法、類似文検索システム及び類似文検索用プログラム
JP4738847B2 (ja) データ検索装置および方法
JP5396530B2 (ja) 音声認識装置および音声認識方法
JP5160594B2 (ja) 音声認識装置および音声認識方法
Yang et al. Vocabulary expansion through automatic abbreviation generation for Chinese voice search
JP2009205357A (ja) 中国語の品詞を判定する装置、方法およびプログラム
JP3795409B2 (ja) 音声認識装置及び方法
JP2011007862A (ja) 音声認識装置、音声認識プログラム、および音声認識方法
JP2000285112A (ja) 予測入力装置及び予測入力方法並びに記録媒体
JP7257010B2 (ja) 検索支援サーバ、検索支援方法及びコンピュータプログラム
JP2014137636A (ja) 情報検索装置及び情報検索方法
JP2008107641A (ja) 音声データ検索装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101214

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110209

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110524

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110630

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111004

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111012

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141021

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4846734

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees