JP2020086003A - 情報処理装置、情報処理方法およびプログラム - Google Patents
情報処理装置、情報処理方法およびプログラム Download PDFInfo
- Publication number
- JP2020086003A JP2020086003A JP2018216668A JP2018216668A JP2020086003A JP 2020086003 A JP2020086003 A JP 2020086003A JP 2018216668 A JP2018216668 A JP 2018216668A JP 2018216668 A JP2018216668 A JP 2018216668A JP 2020086003 A JP2020086003 A JP 2020086003A
- Authority
- JP
- Japan
- Prior art keywords
- reproduction
- unit
- data
- text data
- audio data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/04—Details of speech synthesis systems, e.g. synthesiser structure or memory management
- G10L13/047—Architecture of speech synthesisers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/30—Services specially adapted for particular environments, situations or purposes
- H04W4/40—Services specially adapted for particular environments, situations or purposes for vehicles, e.g. vehicle-to-pedestrians [V2P]
- H04W4/44—Services specially adapted for particular environments, situations or purposes for vehicles, e.g. vehicle-to-pedestrians [V2P] for communication between vehicles and infrastructures, e.g. vehicle-to-cloud [V2C] or vehicle-to-home [V2H]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/165—Management of the audio stream, e.g. setting of volume, audio stream path
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/80—Responding to QoS
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Theoretical Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Transfer Between Computers (AREA)
Abstract
Description
前記音声データの再生を行う音声データ再生部と、
前記テキストデータの音声合成による再生を行うテキストデータ再生部と、
前記音声データまたは前記テキストデータの再生を制御する制御部と、を備え、
前記制御部は、前記音声データ再生部が前記音声データの再生を行うことができない場合、前記テキストデータ再生部に前記テキストデータの再生を行わせる。
前記音声データおよび前記テキストデータを受信するステップと、
前記音声データまたは前記テキストデータの再生を制御するステップと、を含み、
前記音声データ再生部が前記音声データの再生を行うことができない場合、前記テキストデータ再生部に前記テキストデータの再生を行わせる。
前記音声データおよび前記テキストデータを受信するステップと、
前記音声データまたは前記テキストデータの再生を制御するステップと、を実行させ、
前記音声データ再生部が前記音声データの再生を行うことができない場合、前記テキストデータ再生部に前記テキストデータの再生を行わせる。
2 配信サーバ
3 車両
4 ネットワーク
10 情報処理装置
11 入力部
12 通信部
13 記憶部
14 音声データ再生部
15 テキストデータ再生部
16 制御部
20 通信装置
Claims (11)
- コンテンツの音声データおよび前記音声データに対応するテキストデータを受信する通信部と、
前記音声データの再生を行う音声データ再生部と、
前記テキストデータの音声合成による再生を行うテキストデータ再生部と、
前記音声データまたは前記テキストデータの再生を制御する制御部と、を備え、
前記制御部は、前記音声データ再生部が前記音声データの再生を行うことができない場合、前記テキストデータ再生部に前記テキストデータの再生を行わせる、情報処理装置。 - 請求項1に記載の情報処理装置において、
前記音声データ再生部は、前記通信部による音声データの受信と並行して、該受信された音声データの再生を行うストリーミング再生が可能であり、
前記制御部は、前記音声データ再生部によるストリーミング再生が途絶すると、前記音声データ再生部による前記コンテンツの再生位置から、前記テキストデータ再生部に前記テキストデータの再生を行わせる、情報処理装置。 - 請求項2に記載の情報処理装置において、
前記通信部が受信した音声データをバッファする記憶部をさらに備え、
前記制御部は、前記音声データ再生部によるストリーミング再生が途絶すると、前記音声データ再生部に前記記憶部にバッファされた未再生の音声データの再生を行わせた後、前記音声データ再生部による前記コンテンツの再生位置から、前記テキストデータ再生部に前記テキストデータの再生を行わせる、情報処理装置。 - 請求項2または3に記載の情報処理装置において、
前記制御部は、前記音声データ再生部によるストリーミング再生の再生時間および再生速度から前記音声データ再生部による前記コンテンツの再生位置を推定する、情報処理装置。 - 請求項4に記載の情報処理装置において、
前記制御部は、前記推定した再生位置よりも所定時間分だけ前の位置から、前記テキストデータ再生部に前記テキストデータの再生を行わせる、情報処理装置。 - 請求項1から5のいずれか一項に記載の情報処理装置において、
前記制御部は、前記テキストデータ再生部による前記テキストデータの再生中に、前記音声データ再生部によるストリーミング再生が可能になると、前記テキストデータ再生部による前記テキストデータの再生から前記音声データ再生部によるストリーミング再生に切り替える、情報処理装置。 - 請求項1に記載の情報処理装置において、
前記音声データ再生部は、前記通信部による音声データの受信と並行して、該受信された音声データの再生を行うストリーミング再生、または、前記コンテンツの音声データの受信が完了した後に、該受信された音声データの再生を行うダウンロード再生が可能であり、
前記制御部は、
前記通信部に前記テキストデータを受信させた後に、前記音声データを受信させ、前記テキストデータの受信が完了すると、前記テキストデータ再生部に前記テキストデータの再生を開始させ、
前記音声データ再生部による前記ストリーミング再生または前記ダウンロード再生が可能になると、前記テキストデータ再生部による前記テキストデータの再生から前記音声データ再生部による前記音声データの再生に切り替える、情報処理装置。 - 請求項6または7に記載の情報処理装置において、
前記制御部は、前記テキストデータ再生部による前記テキストデータの再生文字数および再生速度から前記テキストデータの再生時間を推定し、該推定した再生時間に基づき、前記テキストデータ再生部による前記コンテンツの再生位置を推定し、該推定した再生位置から前記音声データ再生部に前記音声データの再生を行わせる、情報処理装置。 - 請求項8に記載の情報処理装置において、
前記制御部は、前記推定した再生位置よりも所定時間分だけ前の位置から、前記音声データ再生部に前記音声データの再生を行わせる、情報処理装置。 - コンテンツの音声データの再生を行う音声データ再生部および前記音声データに対応するテキストデータの音声合成による再生を行うテキストデータ再生部を備える情報処理装置における情報処理方法であって、
前記音声データおよび前記テキストデータを受信するステップと、
前記音声データまたは前記テキストデータの再生を制御するステップと、を含み、
前記音声データ再生部が前記音声データの再生を行うことができない場合、前記テキストデータ再生部に前記テキストデータの再生を行わせる、情報処理方法。 - コンテンツの音声データの再生を行う音声データ再生部および前記音声データに対応するテキストデータの音声合成による再生を行うテキストデータ再生部を備える情報処理装置に、
前記音声データおよび前記テキストデータを受信するステップと、
前記音声データまたは前記テキストデータの再生を制御するステップと、を実行させ、
前記音声データ再生部が前記音声データの再生を行うことができない場合、前記テキストデータ再生部に前記テキストデータの再生を行わせる、プログラム。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018216668A JP7119939B2 (ja) | 2018-11-19 | 2018-11-19 | 情報処理装置、情報処理方法およびプログラム |
CN201910858944.5A CN111277976B (zh) | 2018-11-19 | 2019-09-11 | 信息处理设备、信息处理方法和程序 |
US16/567,628 US11195508B2 (en) | 2018-11-19 | 2019-09-11 | Information processing device, information processing method, and program for generating synthesized audio content from text when audio content is not reproducible |
US17/383,991 US11837218B2 (en) | 2018-11-19 | 2021-07-23 | Information processing device, information processing method, and program for generating synthesized audio content from text when audio content is not reproducible |
US18/382,162 US20240046917A1 (en) | 2018-11-19 | 2023-10-20 | Information processing device, information processing method, and program for generating synthesized audio content from text when audio content is not reproducible |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018216668A JP7119939B2 (ja) | 2018-11-19 | 2018-11-19 | 情報処理装置、情報処理方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020086003A true JP2020086003A (ja) | 2020-06-04 |
JP7119939B2 JP7119939B2 (ja) | 2022-08-17 |
Family
ID=70728074
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018216668A Active JP7119939B2 (ja) | 2018-11-19 | 2018-11-19 | 情報処理装置、情報処理方法およびプログラム |
Country Status (3)
Country | Link |
---|---|
US (3) | US11195508B2 (ja) |
JP (1) | JP7119939B2 (ja) |
CN (1) | CN111277976B (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005229414A (ja) * | 2004-02-13 | 2005-08-25 | Daikin Ind Ltd | 情報処理装置および情報処理方法、プログラム、並びに、情報処理システム |
JP2009544247A (ja) * | 2006-07-14 | 2009-12-10 | クゥアルコム・インコーポレイテッド | オーデイオ情報を配信するための改良された方法及び装置 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6023678A (en) * | 1998-03-27 | 2000-02-08 | International Business Machines Corporation | Using TTS to fill in for missing dictation audio |
US6151576A (en) * | 1998-08-11 | 2000-11-21 | Adobe Systems Incorporated | Mixing digitized speech and text using reliability indices |
JP2002221980A (ja) * | 2001-01-25 | 2002-08-09 | Oki Electric Ind Co Ltd | テキスト音声変換装置 |
DE10321097A1 (de) * | 2003-05-09 | 2004-11-25 | Dictanet Software Ag | Verfahren und Computervorrichtung zum automatischen Wiedergeben von digitalen Audiodaten |
JP4059214B2 (ja) * | 2004-03-04 | 2008-03-12 | ソニー株式会社 | 情報再生システムの制御方法、情報再生システム、情報提供装置、および情報提供プログラム |
JP2006041721A (ja) | 2004-07-23 | 2006-02-09 | Ntt Docomo Inc | コンテンツ配信システム、コンテンツ受信クライアント、コンテンツ配信サーバ、及び、コンテンツ再生方法 |
JP5032408B2 (ja) * | 2008-07-25 | 2012-09-26 | パナソニック株式会社 | 簡易レジューム再生装置及び簡易レジューム再生方法 |
JP2012243337A (ja) * | 2011-05-17 | 2012-12-10 | Sony Corp | 再生装置、ストリームファイルの再生方法、及びプログラム |
KR101977072B1 (ko) * | 2012-05-07 | 2019-05-10 | 엘지전자 주식회사 | 음성 파일과 관련된 텍스트의 표시 방법 및 이를 구현한 전자기기 |
US8996377B2 (en) * | 2012-07-12 | 2015-03-31 | Microsoft Technology Licensing, Llc | Blending recorded speech with text-to-speech output for specific domains |
JP6852478B2 (ja) * | 2017-03-14 | 2021-03-31 | 株式会社リコー | 通信端末、通信プログラム及び通信方法 |
US10347238B2 (en) * | 2017-10-27 | 2019-07-09 | Adobe Inc. | Text-based insertion and replacement in audio narration |
US11114085B2 (en) * | 2018-12-28 | 2021-09-07 | Spotify Ab | Text-to-speech from media content item snippets |
-
2018
- 2018-11-19 JP JP2018216668A patent/JP7119939B2/ja active Active
-
2019
- 2019-09-11 CN CN201910858944.5A patent/CN111277976B/zh active Active
- 2019-09-11 US US16/567,628 patent/US11195508B2/en active Active
-
2021
- 2021-07-23 US US17/383,991 patent/US11837218B2/en active Active
-
2023
- 2023-10-20 US US18/382,162 patent/US20240046917A1/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005229414A (ja) * | 2004-02-13 | 2005-08-25 | Daikin Ind Ltd | 情報処理装置および情報処理方法、プログラム、並びに、情報処理システム |
JP2009544247A (ja) * | 2006-07-14 | 2009-12-10 | クゥアルコム・インコーポレイテッド | オーデイオ情報を配信するための改良された方法及び装置 |
Also Published As
Publication number | Publication date |
---|---|
JP7119939B2 (ja) | 2022-08-17 |
US11837218B2 (en) | 2023-12-05 |
US20200160834A1 (en) | 2020-05-21 |
US20210350787A1 (en) | 2021-11-11 |
CN111277976A (zh) | 2020-06-12 |
US11195508B2 (en) | 2021-12-07 |
US20240046917A1 (en) | 2024-02-08 |
CN111277976B (zh) | 2023-10-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6052610B2 (ja) | 情報通信端末、およびその対話方法 | |
US8670984B2 (en) | Automatically generating audible representations of data content based on user preferences | |
CN113613068A (zh) | 视频的处理方法、装置、电子设备和存储介质 | |
WO2014141676A1 (ja) | 情報通信端末、対話提供方法 | |
EP4346218A1 (en) | Audio processing method and apparatus, and electronic device and storage medium | |
JP5300276B2 (ja) | データ処理装置及び論理ドライブのマウント方法 | |
JP3693326B2 (ja) | 地図表示システム、音声案内支援装置、地図表示装置 | |
JP2014219617A (ja) | 音声案内システム及び音声案内方法 | |
JP7119939B2 (ja) | 情報処理装置、情報処理方法およびプログラム | |
CN113965581A (zh) | 用于设备交互的方法、装置和介质 | |
US10884700B2 (en) | Sound outputting device, sound outputting method, and sound outputting program storage medium | |
WO2017166358A1 (zh) | 一种定位通话的方法和装置 | |
CN115269920A (zh) | 交互方法、装置、电子设备和存储介质 | |
KR101366325B1 (ko) | 단말기의 미디어 재생 방법 및 미디어 재생 기능을 갖는단말기 | |
JP2013250132A (ja) | 車載装置、車載情報システム | |
CN113160824A (zh) | 信息处理系统、信息处理装置及程序 | |
CN107112021A (zh) | 声音信息校正系统、声音信息校正方法及声音信息校正程序 | |
JP5209370B2 (ja) | 再生装置、再生方法およびプログラム | |
JP2017111339A (ja) | 音声再生装置、音声再生方法及びプログラム | |
JP2008182319A (ja) | ストリームデータ再生システム、携帯端末機およびストリームデータ再生方法 | |
JP2019021277A (ja) | 車載システム | |
KR100787388B1 (ko) | Msn 프로토콜을 이용한 무선 스피커 시스템 및 그의재생 방법 | |
WO2015111256A1 (ja) | 音声調整システム、サーバ及び車載装置 | |
JP2021089231A (ja) | 走行経路提案装置 | |
JP2014165567A (ja) | 情報記憶管理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210420 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220128 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220201 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220329 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220705 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220718 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7119939 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |