JP6073540B2 - 情報提供システム - Google Patents
情報提供システム Download PDFInfo
- Publication number
- JP6073540B2 JP6073540B2 JP2016561111A JP2016561111A JP6073540B2 JP 6073540 B2 JP6073540 B2 JP 6073540B2 JP 2016561111 A JP2016561111 A JP 2016561111A JP 2016561111 A JP2016561111 A JP 2016561111A JP 6073540 B2 JP6073540 B2 JP 6073540B2
- Authority
- JP
- Japan
- Prior art keywords
- unit
- speech recognition
- recognition target
- word
- display
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000015572 biosynthetic process Effects 0.000 claims description 104
- 238000003786 synthesis reaction Methods 0.000 claims description 104
- 238000000034 method Methods 0.000 claims description 40
- 238000000605 extraction Methods 0.000 claims description 36
- 239000000284 extract Substances 0.000 claims description 12
- 230000002194 synthesizing effect Effects 0.000 claims description 8
- 230000000694 effects Effects 0.000 claims description 3
- 230000004397 blinking Effects 0.000 claims description 2
- 230000010365 information processing Effects 0.000 description 13
- 239000000203 mixture Substances 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 230000002093 peripheral effect Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 238000005401 electroluminescence Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- User Interface Of Digital Computer (AREA)
- Machine Translation (AREA)
- Navigation (AREA)
Description
このような音声認識を利用した情報提供装置では、テキスト中のどの語が音声認識対象であるかをユーザに明示する必要がある。
また、画面が小さいと表示可能な文字数にも限りがあるので、テキストを画面に表示するとしても、テキストすべてを表示できない場合がある。その場合、上記特許文献1,2のような方法では、文字数制限により音声認識対象語が画面に表示されず、音声認識対象語をユーザに明示できない可能性がある。
なお、以下の実施の形態では、この発明に係る情報提供システムを車両等の移動体用のナビゲーション装置に適用した場合を例に挙げて説明するが、ナビゲーション装置の他、PC(パーソナルコンピュータ)、タブレットPC、およびスマートフォン等の携帯情報端末に適用してもよい。
図1は、この発明の実施の形態1に係る情報提供システム1とその周辺機器の概略を説明する図である。
情報提供システム1は、ネットワーク2を介してWebサーバ3などの外部情報源から読み上げテキストを取得し、取得した読み上げテキストを音声出力するよう、スピーカ5に対して指示する。加えて、情報提供システム1は、読み上げテキストを表示するよう、ディスプレイ(表示部)4に対して指示してもよい。
ディスプレイ4の表示領域Aには、自車位置および地図などを示すナビゲーション画面が表示されているため、読み上げテキストを表示するための表示領域Bが狭い。そのため、読み上げテキスト全文を表示領域Bに一度に表示できない。そこで、情報提供システム1は、読み上げテキストの一部のみを表示させ、全文は音声出力させる。
あるいは、表示領域Bを確保できない場合、情報提供システム1は、読み上げテキストを表示せず、音声出力するだけでもよい。
RAM103は、プログラム実行時に使用するメモリである。
入力装置104は、ユーザ入力を受け付けるものであり、マイク、リモートコントローラ等の操作デバイス、またはタッチセンサ等である。図1では、入力装置104の例として、マイク6を図示している。
通信装置105は、ネットワーク2を介して通信するものである。
HDD106は、外部記憶装置の一例である。外部記憶装置としては、HDDの他に、CDもしくはDVD、またはUSBメモリおよびSDカード等のフラッシュメモリを採用したストレージ等が含まれる。
出力装置107は、情報をユーザに提示するものであり、スピーカ、液晶ディスプレイ、または有機EL(Electroluminescence)等である。図1では、出力装置107の例として、ディスプレイ4およびスピーカ5を図示している。
この情報提供システム1は、取得部10、抽出部12、合成制御部13、音声合成部14、表示指示部15、辞書生成部16、認識辞書17および音声認識部18を備えている。これらの機能は、CPU101がプログラムを実行することにより実現される。
抽出部12、合成制御部13、音声合成部14および表示指示部15は、情報処理制御部11を構成している。
なお、ネットワーク2としては、例えば、インターネットおよび携帯電話等の公衆回線を使用することができる。
なお、付加情報の情報源は、ネットワーク2上のWebサーバ3のような外部情報源であってもよいし、情報提供システム1が備えるデータベース(図示せず)等であってもよい。抽出部12は、取得部10を介してネットワーク2上の外部情報源に接続してもよいし、取得部10を介さず直接接続してもよい。
上記の「首相、消費税増税判断、有識者議論を開始方針『デフレ脱却が困難なら考慮』」という読み上げテキストの場合、読み上げテキストの先頭からのモーラ数は、「首相」が「1」、「消費税」が「4」、「デフレ」が「33」となる。
なお、アクセント情報の決定方法については公知の技術を用いればよいため説明を省略する。
なお、音声合成部14へ出力開始した時点から計時としたが、後述するように、音声合成部14が合成音声を出力するようスピーカ5に対して指示した時点から計時するとしてもよい。
なお、音声合成の方法については公知の技術を用いればよいため説明を省略する。
なお、音声認識の方法については公知の技術を用いればよいため説明を省略する。
ここでは、読み上げテキストを「首相、消費税増税判断、有識者議論を開始方針『デフレ脱却が困難なら考慮』」とし、音声認識対象語を「首相」「消費税」「デフレ」として説明する。
続いて、抽出部12は、分割した単語列等から音声認識対象語「首相」「消費税」「デフレ」を抽出する(ステップST002)。
また、合成制御部13は、読み上げテキストの音声合成に必要なアクセント情報を生成する(ステップST005)。
合成制御部13が、読み上げテキストのアクセント情報を音声合成部14へ出力し、音声合成部14が、読み上げテキストの合成音声を生成してスピーカ5に出力し、読み上げを開始する(ステップST006)。
ユーザは、表示領域C1〜C3に表示された音声認識対象語を発話することで、その語に関連する付加情報の提供を受けることができる。付加情報の提供については図6で詳述する。
音声認識部18は、ユーザが発話した音声をマイク6を介して取得し、認識辞書17を参照して認識し、認識結果文字列を出力する(ステップST101)。続いて、取得部10は、音声認識部18が出力した認識結果文字列に関連する付加情報を、ネットワーク2を介してWebサーバ3等から取得する(ステップST102)。そして、合成制御部13は、取得部10により取得された情報の音声合成に必要なアクセント情報を決定し、音声合成部14に出力する(ステップST103)。最後に、音声合成部14は、合成制御部13が出力したアクセント情報に基づいて合成音声を生成し、スピーカ5に対して出力するよう指示する(ステップST104)。
また、ユーザの発話後に取得部10が付加情報を取得する構成にしたが、これに限定されるものではなく、例えば、抽出部12が読み上げテキストから音声認識対象語を抽出する際に付加情報の有無を判断するだけでなく付加情報を取得して蓄積しておく構成にしてもよい。
図7は、この発明の実施の形態2に係る情報提供システム1の構成例を示すブロック図である。図7において、図4と同一または相当の部分については同一の符号を付し説明を省略する。
実施の形態2の情報提供システム1は、音声認識対象語を記憶する記憶部20を備えている。また、実施の形態2の情報処理制御部21は、上記実施の形態1の情報処理制御部11とは一部動作が異なるため、以下で説明する。
実施の形態2の抽出部22は、分割した単語列等の中から音声認識対象語を抽出し、抽出した音声認識対象語を記憶部20に記憶させる。
実施の形態2の合成制御部23は、アクセント情報を音声合成部24に出力すると同時に、当該アクセント情報に対応する単語列等を表示指示部25に対して出力する。
ここでは、読み上げテキストを「首相、消費税増税判断、有識者議論を開始方針『デフレ脱却が困難なら考慮』」とし、音声認識対象語を「首相」「消費税」「デフレ」として説明する。
ここで、辞書生成部16は、抽出部22により抽出された上述の3つの音声認識対象語に基づいて、認識辞書17を生成する(ステップST203)。
また、抽出部22は、抽出した3つの音声認識対象語を記憶部20に記憶させる(ステップST204)。
ユーザは、表示領域C1〜C3に表示された音声認識対象語を発話することで、その語に関連する付加情報の提供を受けることができる。
図9は、この発明の実施の形態3に係る情報提供システム1の構成例を示すブロック図である。図9において、図4および図7と同一または相当の部分については同一の符号を付し説明を省略する。
実施の形態3の情報提供システム1は、音声認識対象語を記憶する記憶部30を備えている。また、実施の形態3の情報処理制御部31は、読み上げテキストを読み上げる際に音声認識対象語とそれ以外の単語列等とを区別するために、読み上げ方法変更部36を備えている。
実施の形態3の情報処理制御部31は、読み上げ方法変更部36を備えたことにより、上記実施の形態2の情報処理制御部21とは一部動作が異なるため、以下で説明する。
実施の形態3の合成制御部33は、単語列等が記憶部30に存在するか否かを判定する。つまり、当該単語列等が音声認識対象語であるか否かを判定する。そして、合成制御部33は、決定したアクセント情報を、読み上げテキストの先頭から単語列等の単位で、音声合成部34に対して出力する。その際、合成制御部33は、出力するアクセント情報に対応する単語列等が音声認識対象語であれば、当該単語列等の読み上げ方法を変更するよう読み上げ方法変更部36に指示する。さらに、合成制御部33は、出力するアクセント情報に対応する単語列等が音声認識対象語であれば、当該単語列等を表示指示部35に対して出力する。
ユーザが音声認識対象語とそれ以外の単語列等とを聞き分けやすいように、音声認識対象語を読み上げるピッチを高くしたり、音声認識対象語の前後にポーズを入れたり、音声認識対象語を読み上げる音量を大きくしたり、音声認識対象語の読み上げ中に効果音を付加したりすることが好ましい。
ここでは、読み上げテキストを「首相、消費税増税判断、有識者議論を開始方針『デフレ脱却が困難なら考慮』」とし、音声認識対象語を「首相」「消費税」「デフレ」として説明する。
ここで、辞書生成部16は、抽出部32により抽出された上述の3つの音声認識対象語に基づいて、認識辞書17を生成する(ステップST303)。
また、抽出部32は、抽出した3つの音声認識対象語を記憶部30に記憶させる(ステップST304)。
読み上げ方法変更部36は、合成制御部33から出力された読み上げ変更指示に従って、音声認識対象語のアクセント情報を再決定し、音声合成部34に対して出力する(ステップST308)。
音声合成部34は、読み上げ方法変更部36により再決定されたアクセント情報に基づいて、音声認識対象語の合成音声を生成してスピーカ5に出力し、読み上げる(ステップST309)。
読み上げ方法変更部36は、合成制御部33から出力された単語列等のアクセント情報をそのまま音声合成部34へ出力し、音声合成部34が、そのアクセント情報に基づいて単語列等の合成音声を生成してスピーカ5に出力し、読み上げる(ステップST312)。
ユーザは、読み上げ方法が変更された、あるいは表示領域C1〜C3に表示された音声認識対象語を発話することで、その語に関連する付加情報の提供を受けることができる。
なお、読み上げ方法変更部36は、上記実施の形態1,2の情報提供システム1に追加することが可能である。
Claims (6)
- テキストに含まれる単語または単語列のうち、当該単語または単語列に関する情報を情報源から取得できるものを音声認識対象語として抽出する抽出部と、
前記テキストを読み上げる音声の合成に用いる情報および前記抽出部が抽出した前記音声認識対象語を出力する合成制御部と、
前記合成制御部から受け取った前記情報を用いて前記テキストを読み上げる音声合成部と、
前記音声合成部が前記音声認識対象語を読み上げるタイミングに合わせて、前記合成制御部から受け取った前記音声認識対象語を表示するよう表示部に指示する表示指示部とを備える情報提供システム。 - 前記表示指示部は、前記音声認識対象語を強調表示するよう前記表示部に指示することを特徴とする請求項1記載の情報提供システム。
- 前記強調表示は、字体、文字の大きさ、文字色、背景色、輝度、点滅、および記号の付加のうちの少なくとも1つにより行われることを特徴とする請求項2記載の情報提供システム。
- 前記音声合成部の読み上げ方法を前記テキストのうちの前記音声認識対象語とそれ以外とで変更する読み上げ方法変更部を備えることを特徴とする請求項1記載の情報提供システム。
- 前記読み上げ方法の変更は、読み上げるピッチの変更、読み上げる速度の変更、読み上げ前後のポーズの有無の変更、読み上げる音量の変更、および読み上げ中の効果音の有無の変更のうちの少なくとも1つであることを特徴とする請求項4記載の情報提供システム。
- 前記表示指示部は、前記表示部が前記音声認識対象語を表示する領域を、当該音声認識対象語を選択するソフトウエアキーとするよう指示することを特徴とする請求項1記載の情報提供システム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2014/081087 WO2016084129A1 (ja) | 2014-11-25 | 2014-11-25 | 情報提供システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6073540B2 true JP6073540B2 (ja) | 2017-02-01 |
JPWO2016084129A1 JPWO2016084129A1 (ja) | 2017-04-27 |
Family
ID=56073754
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016561111A Expired - Fee Related JP6073540B2 (ja) | 2014-11-25 | 2014-11-25 | 情報提供システム |
Country Status (5)
Country | Link |
---|---|
US (1) | US20170309269A1 (ja) |
JP (1) | JP6073540B2 (ja) |
CN (1) | CN107004404B (ja) |
DE (1) | DE112014007207B4 (ja) |
WO (1) | WO2016084129A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109817208A (zh) * | 2019-01-15 | 2019-05-28 | 上海交通大学 | 一种适合各地方言的驾驶员语音智能交互设备及方法 |
US10896686B2 (en) | 2019-05-29 | 2021-01-19 | Capital One Services, Llc | Methods and systems for providing images for facilitating communication |
US10878800B2 (en) * | 2019-05-29 | 2020-12-29 | Capital One Services, Llc | Methods and systems for providing changes to a voice interacting with a user |
US11367429B2 (en) * | 2019-06-10 | 2022-06-21 | Microsoft Technology Licensing, Llc | Road map for audio presentation of communications |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004163265A (ja) * | 2002-11-13 | 2004-06-10 | Nissan Motor Co Ltd | ナビゲーション装置 |
JP2006243521A (ja) * | 2005-03-04 | 2006-09-14 | Sony Corp | 文章出力装置、その方法及びプログラム |
JP2010139826A (ja) * | 2008-12-12 | 2010-06-24 | Toyota Motor Corp | 音声認識システム |
JP2012058745A (ja) * | 2011-10-26 | 2012-03-22 | Kyocera Corp | 音声合成機能付き文字情報表示装置およびその制御方法 |
Family Cites Families (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5924068A (en) * | 1997-02-04 | 1999-07-13 | Matsushita Electric Industrial Co. Ltd. | Electronic news reception apparatus that selectively retains sections and searches by keyword or index for text to speech conversion |
JPH1125098A (ja) | 1997-06-24 | 1999-01-29 | Internatl Business Mach Corp <Ibm> | 情報処理装置、リンク先ファイルの取得方法および記憶媒体 |
US6457031B1 (en) * | 1998-09-02 | 2002-09-24 | International Business Machines Corp. | Method of marking previously dictated text for deferred correction in a speech recognition proofreader |
US6064965A (en) * | 1998-09-02 | 2000-05-16 | International Business Machines Corporation | Combined audio playback in speech recognition proofreader |
JP3822990B2 (ja) * | 1999-01-07 | 2006-09-20 | 株式会社日立製作所 | 翻訳装置、記録媒体 |
US6876969B2 (en) * | 2000-08-25 | 2005-04-05 | Fujitsu Limited | Document read-out apparatus and method and storage medium |
US7120583B2 (en) * | 2000-10-02 | 2006-10-10 | Canon Kabushiki Kaisha | Information presentation system, information presentation apparatus, control method thereof and computer readable memory |
US6728681B2 (en) * | 2001-01-05 | 2004-04-27 | Charles L. Whitham | Interactive multimedia book |
CN1369834B (zh) * | 2001-01-24 | 2010-04-28 | 松下电器产业株式会社 | 语音转换设备 |
JP2003108171A (ja) * | 2001-09-27 | 2003-04-11 | Clarion Co Ltd | 文書読み上げ装置 |
JP2003271182A (ja) * | 2002-03-18 | 2003-09-25 | Toshiba Corp | 音響モデル作成装置及び音響モデル作成方法 |
JP2005190349A (ja) * | 2003-12-26 | 2005-07-14 | Mitsubishi Electric Corp | メール読み上げ装置 |
JP3962763B2 (ja) * | 2004-04-12 | 2007-08-22 | 松下電器産業株式会社 | 対話支援装置 |
JP4277746B2 (ja) * | 2004-06-25 | 2009-06-10 | 株式会社デンソー | カーナビゲーション装置 |
US8799401B1 (en) * | 2004-07-08 | 2014-08-05 | Amazon Technologies, Inc. | System and method for providing supplemental information relevant to selected content in media |
CN1300762C (zh) * | 2004-09-06 | 2007-02-14 | 华南理工大学 | 文本和自然语音自动同步方法 |
FR2884023B1 (fr) * | 2005-03-31 | 2011-04-22 | Erocca | Dispositif pour la communication par des personnes handicapees de la parole et/ou de l'ouie |
JP4675691B2 (ja) | 2005-06-21 | 2011-04-27 | 三菱電機株式会社 | コンテンツ情報提供装置 |
US20070211071A1 (en) * | 2005-12-20 | 2007-09-13 | Benjamin Slotznick | Method and apparatus for interacting with a visually displayed document on a screen reader |
US7689417B2 (en) * | 2006-09-04 | 2010-03-30 | Fortemedia, Inc. | Method, system and apparatus for improved voice recognition |
US20080208589A1 (en) * | 2007-02-27 | 2008-08-28 | Cross Charles W | Presenting Supplemental Content For Digital Media Using A Multimodal Application |
JP2008225254A (ja) * | 2007-03-14 | 2008-09-25 | Canon Inc | 音声合成装置及び方法並びにプログラム |
JP4213755B2 (ja) * | 2007-03-28 | 2009-01-21 | 株式会社東芝 | 音声翻訳装置、方法およびプログラム |
JP2009205579A (ja) * | 2008-02-29 | 2009-09-10 | Toshiba Corp | 音声翻訳装置およびプログラム |
JP5083155B2 (ja) * | 2008-09-30 | 2012-11-28 | カシオ計算機株式会社 | 辞書機能を備えた電子装置およびプログラム |
JP4935869B2 (ja) * | 2009-08-07 | 2012-05-23 | カシオ計算機株式会社 | 電子機器及びプログラム |
CN102314778A (zh) * | 2010-06-29 | 2012-01-11 | 鸿富锦精密工业(深圳)有限公司 | 电子阅读器 |
CN102314874A (zh) * | 2010-06-29 | 2012-01-11 | 鸿富锦精密工业(深圳)有限公司 | 文本到语音转换系统与方法 |
US9162574B2 (en) * | 2011-12-20 | 2015-10-20 | Cellco Partnership | In-vehicle tablet |
US8731905B1 (en) * | 2012-02-22 | 2014-05-20 | Quillsoft Ltd. | System and method for enhancing comprehension and readability of text |
KR101193362B1 (ko) * | 2012-04-13 | 2012-10-19 | 최병기 | 문자열을 발음 단위로 분할하는 방법, 이를 이용하는 문자열의 어조 표현 방법 및 문자열의 어조를 표현하는 동영상 데이터가 저장된 저장매체 |
US9317486B1 (en) * | 2013-06-07 | 2016-04-19 | Audible, Inc. | Synchronizing playback of digital content with captured physical content |
CN103530415A (zh) * | 2013-10-29 | 2014-01-22 | 谭永 | 一种兼容关键词搜索的自然语言搜索方法及系统 |
-
2014
- 2014-11-25 JP JP2016561111A patent/JP6073540B2/ja not_active Expired - Fee Related
- 2014-11-25 WO PCT/JP2014/081087 patent/WO2016084129A1/ja active Application Filing
- 2014-11-25 DE DE112014007207.9T patent/DE112014007207B4/de not_active Expired - Fee Related
- 2014-11-25 US US15/516,844 patent/US20170309269A1/en not_active Abandoned
- 2014-11-25 CN CN201480083606.4A patent/CN107004404B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004163265A (ja) * | 2002-11-13 | 2004-06-10 | Nissan Motor Co Ltd | ナビゲーション装置 |
JP2006243521A (ja) * | 2005-03-04 | 2006-09-14 | Sony Corp | 文章出力装置、その方法及びプログラム |
JP2010139826A (ja) * | 2008-12-12 | 2010-06-24 | Toyota Motor Corp | 音声認識システム |
JP2012058745A (ja) * | 2011-10-26 | 2012-03-22 | Kyocera Corp | 音声合成機能付き文字情報表示装置およびその制御方法 |
Also Published As
Publication number | Publication date |
---|---|
DE112014007207T5 (de) | 2017-08-03 |
US20170309269A1 (en) | 2017-10-26 |
CN107004404B (zh) | 2021-01-29 |
DE112014007207B4 (de) | 2019-12-24 |
JPWO2016084129A1 (ja) | 2017-04-27 |
CN107004404A (zh) | 2017-08-01 |
WO2016084129A1 (ja) | 2016-06-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7106680B2 (ja) | ニューラルネットワークを使用したターゲット話者の声でのテキストからの音声合成 | |
TWI281146B (en) | Apparatus and method for synthesized audible response to an utterance in speaker-independent voice recognition | |
US11450313B2 (en) | Determining phonetic relationships | |
KR102196400B1 (ko) | 핫워드 적합성을 결정하는 방법 및 장치 | |
JP6251958B2 (ja) | 発話解析装置、音声対話制御装置、方法、及びプログラム | |
JP5419136B2 (ja) | 音声出力装置 | |
JP6073540B2 (ja) | 情報提供システム | |
EP3021318A1 (en) | Speech synthesis apparatus and control method thereof | |
CN108431883B (zh) | 语言学习系统以及语言学习程序 | |
US20150039318A1 (en) | Apparatus and method for selecting control object through voice recognition | |
US8315873B2 (en) | Sentence reading aloud apparatus, control method for controlling the same, and control program for controlling the same | |
US20170372695A1 (en) | Information providing system | |
CN110570876A (zh) | 歌声合成方法、装置、计算机设备和存储介质 | |
JP2015014665A (ja) | 音声認識装置及び方法、並びに、半導体集積回路装置 | |
JP5606951B2 (ja) | 音声認識システムおよびこれを用いた検索システム | |
CN112750445A (zh) | 语音转换方法、装置和系统及存储介质 | |
JP5335165B2 (ja) | 発音情報生成装置、車載情報装置およびデータベース生成方法 | |
JP2012088370A (ja) | 音声認識システム、音声認識端末、およびセンター | |
US20210065678A1 (en) | Speech synthesis method and apparatus | |
JP5949634B2 (ja) | 音声合成システム、及び音声合成方法 | |
JP2005283646A (ja) | 音声認識率推定装置 | |
JP2004171174A (ja) | 文章読み上げ装置、読み上げのためのプログラム及び記録媒体 | |
Engell | TaleTUC: Text-to-Speech and Other Enhancements to Existing Bus Route Information Systems | |
KR20230013826A (ko) | 인공 지능 모델을 이용하여 음성 인식 서비스를 제공하는 장치 및 방법 | |
JP5954221B2 (ja) | 音源特定システム、及び音源特定方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20161011 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20161011 |
|
TRDD | Decision of grant or rejection written | ||
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20161130 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161206 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170104 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6073540 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |