JP2020034895A - 応答方法及び装置 - Google Patents
応答方法及び装置 Download PDFInfo
- Publication number
- JP2020034895A JP2020034895A JP2019129594A JP2019129594A JP2020034895A JP 2020034895 A JP2020034895 A JP 2020034895A JP 2019129594 A JP2019129594 A JP 2019129594A JP 2019129594 A JP2019129594 A JP 2019129594A JP 2020034895 A JP2020034895 A JP 2020034895A
- Authority
- JP
- Japan
- Prior art keywords
- user
- information
- voice
- category
- user category
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 230000004044 response Effects 0.000 claims description 85
- 238000004590 computer program Methods 0.000 claims description 11
- 238000010586 diagram Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 210000000867 larynx Anatomy 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 210000000214 mouth Anatomy 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 210000001331 nose Anatomy 0.000 description 1
- 210000003800 pharynx Anatomy 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 210000003437 trachea Anatomy 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/04—Details of speech synthesis systems, e.g. synthesiser structure or memory management
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/06—Decision making techniques; Pattern matching strategies
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/26—Recognition of special voice characteristics, e.g. for use in lie detectors; Recognition of animal voices
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- User Interface Of Digital Computer (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Telephonic Communication Services (AREA)
Abstract
Description
本願の実施例はコンピュータ技術分野に関し、具体的にはインターネット技術分野に関し、特に応答方法及び装置に関する。
[背景技術]
ユーザは、音声によって上記スクリーン付きスマートスピーカボックスとスマートスピーカボックスに情報を送信して命令を取得させることができる。スクリーン付きスマートスピーカボックス又はスマートスピーカボックスは、ユーザからの情報に基づいて命令を取得して、ユーザに対してオーディオ又はビデオ情報などを再生する。
本願の他の特徴、目的及び利点は、以下の図面を参照して説明される非限定的な実施例を読むことによって、より明らかになる。
Claims (16)
- ユーザがクライアントを介して送信した音声情報を受信することと、
前記音声情報に基づいて前記ユーザが属するユーザカテゴリを決定することと、
前記ユーザカテゴリにマッチングする音声を使用して、前記音声情報に応答することとを含む応答方法。 - 前記音声情報に基づいて前記ユーザが属するユーザカテゴリを決定することは、
前記音声情報に対して声紋認識を行い、認識結果に基づいて前記ユーザが属するユーザカテゴリを決定することを含む、請求項1に記載の方法。 - 前記音声情報に基づいて前記ユーザが属するユーザカテゴリを決定することは、
前記音声情報を予め訓練されたユーザカテゴリ認識モデルに入力して、前記ユーザカテゴリ認識モデルの出力に基づいて前記ユーザが属するユーザカテゴリを決定することを含む、請求項1に記載の方法。 - 前記ユーザカテゴリにマッチングする音声を使用して、前記音声情報に応答することは、
前記音声情報の意味を解析することと、
前記意味にマッチングする応答情報を決定することと、
前記音声を使用して前記応答情報を再生することとを含む、請求項1に記載の方法。 - 前記ユーザカテゴリにマッチングする音声を使用して、前記音声情報に応答することは、
音声情報にマナー用語が含まれるか否かを判定することと、
前記音声情報にマナー用語が含まれると判定したことに応答して、前記音声を使用して予め設定されたマナー用語を再生することとを含む、請求項1に記載の方法。 - 前記音声は、前記ユーザカテゴリにマッチングする音声パラメータに基づいて合成された合成音声であるか、又は予め録音された音声である、請求項1〜5のいずれか1項に記載の方法。
- 前記ユーザカテゴリは子供のユーザであり、前記方法は、
前記ユーザに対して子供のユーザにマッチングするマルチメディア情報をプッシュすることをさらに含む、請求項1に記載の方法。 - ユーザがクライアントを介して送信した音声情報を受信するように構成される受信手段と、
前記音声情報に基づいて前記ユーザが属するユーザカテゴリを決定するように構成される決定手段と、
前記ユーザカテゴリにマッチングする音声を使用して、前記音声情報に応答するよう構成される応答手段とを備える、応答装置。 - 前記決定手段は、さらに、
前記音声情報に対して声紋認識を行い、認識結果に基づいて前記ユーザが所属するユーザカテゴリを決定するように構成される、請求項8に記載の装置。 - 前記決定手段は、さらに、
前記音声情報を予め訓練されたユーザカテゴリ認識モデルに入力して、前記ユーザカテゴリ認識モデルの出力に基づいて前記ユーザが属するユーザカテゴリを決定するように構成される、請求項8に記載の装置。 - 前記応答手段は、さらに、
前記音声情報の意味を解析して、
前記意味にマッチングする応答情報を決定して、
前記音声を使用して前記応答情報を再生するように構成される、請求項8に記載の装置。 - 前記応答手段は、さらに、
音声情報にマナー用語が含まれるか否かを判定して、
前記音声情報にマナー用語が含まれると判定したことに応答して、前記音声を使用して予め設定されたマナー用語を再生するように構成される、請求項8に記載の装置。 - 前記音声は、前記ユーザカテゴリにマッチングする音声パラメータに基づいて合成された合成音声であるか、又は予め録音された音声である、請求項8〜12のいずれか1項に記載の装置。
- 前記ユーザカテゴリは子供のユーザであり、前記装置は、前記ユーザに対して子供のユーザにマッチングするマルチメディア情報をプッシュするように構成されるプッシュ手段をさらに備える、請求項8に記載の装置。
- 1つ又は複数のプロセッサと、
1つ又は複数のプログラムが記憶されている記憶装置と、
前記1つ又は複数のプログラムを前記1つ又は複数のプロセッサに実行させることにより、請求項1〜7のいずれか1項に記載の方法を1つ又は複数のプロセッサに実現させる、電子デバイス。 - コンピュータプログラムが記憶されているコンピュータ可読媒体であって、前記コンピュータプログラムが実行される場合、請求項1〜7のいずれか1項に記載の方法を実現させる、コンピュータ可読媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811000038.3 | 2018-08-30 | ||
CN201811000038.3A CN109147800A (zh) | 2018-08-30 | 2018-08-30 | 应答方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020034895A true JP2020034895A (ja) | 2020-03-05 |
JP6876752B2 JP6876752B2 (ja) | 2021-05-26 |
Family
ID=64829189
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019129594A Active JP6876752B2 (ja) | 2018-08-30 | 2019-07-11 | 応答方法及び装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US11475897B2 (ja) |
JP (1) | JP6876752B2 (ja) |
CN (1) | CN109147800A (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020049687A1 (ja) * | 2018-09-06 | 2020-03-12 | 日本電気株式会社 | 音声処理装置、音声処理方法、およびプログラム記録媒体 |
CN109885277A (zh) * | 2019-02-26 | 2019-06-14 | 百度在线网络技术(北京)有限公司 | 人机交互设备、方法、系统和装置 |
CN111724789B (zh) * | 2019-03-19 | 2023-03-28 | 华为终端有限公司 | 语音交互的方法和终端设备 |
CN111276144A (zh) * | 2020-02-21 | 2020-06-12 | 北京声智科技有限公司 | 一种平台匹配方法、装置、设备和介质 |
US11393455B2 (en) * | 2020-02-28 | 2022-07-19 | Rovi Guides, Inc. | Methods for natural language model training in natural language understanding (NLU) systems |
US11626103B2 (en) * | 2020-02-28 | 2023-04-11 | Rovi Guides, Inc. | Methods for natural language model training in natural language understanding (NLU) systems |
US11392771B2 (en) * | 2020-02-28 | 2022-07-19 | Rovi Guides, Inc. | Methods for natural language model training in natural language understanding (NLU) systems |
US11574127B2 (en) * | 2020-02-28 | 2023-02-07 | Rovi Guides, Inc. | Methods for natural language model training in natural language understanding (NLU) systems |
CN112309403A (zh) * | 2020-03-05 | 2021-02-02 | 北京字节跳动网络技术有限公司 | 用于生成信息的方法和装置 |
CN111638787B (zh) * | 2020-05-29 | 2023-09-01 | 百度在线网络技术(北京)有限公司 | 用于展示信息的方法和装置 |
CN111805558B (zh) * | 2020-08-03 | 2021-10-08 | 深圳作为科技有限公司 | 一种具有记忆识别功能的自学式老年护理机器人系统 |
CN111916065A (zh) * | 2020-08-05 | 2020-11-10 | 北京百度网讯科技有限公司 | 用于处理语音的方法和装置 |
CN114155865A (zh) * | 2021-12-16 | 2022-03-08 | 广州城市理工学院 | 一种全息互动系统 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002041084A (ja) * | 2000-07-26 | 2002-02-08 | Victor Co Of Japan Ltd | 対話処理システム |
US6665644B1 (en) * | 1999-08-10 | 2003-12-16 | International Business Machines Corporation | Conversational data mining |
JP2004109323A (ja) * | 2002-09-17 | 2004-04-08 | Denso Corp | 音声対話装置及びプログラム |
JP2007272773A (ja) * | 2006-03-31 | 2007-10-18 | Xing Inc | 対話型インターフェイス制御システム |
JP2010078763A (ja) * | 2008-09-25 | 2010-04-08 | Brother Ind Ltd | 音声処理装置、音声処理プログラム、およびインターホンシステム |
JP2014002383A (ja) * | 2012-06-15 | 2014-01-09 | Samsung Electronics Co Ltd | 端末装置及び端末装置の制御方法 |
JP2015119298A (ja) * | 2013-12-18 | 2015-06-25 | 船井電機株式会社 | 情報処理装置および通信装置 |
JP2017062602A (ja) * | 2015-09-24 | 2017-03-30 | シャープ株式会社 | 対話システム、対話を制御する方法、およびコンピュータを対話システムとして機能させるためのプログラム |
WO2017147081A1 (en) * | 2016-02-22 | 2017-08-31 | Sonos, Inc. | Voice control of a media playback system |
CN107170456A (zh) * | 2017-06-28 | 2017-09-15 | 北京云知声信息技术有限公司 | 语音处理方法及装置 |
JP2017176728A (ja) * | 2016-03-31 | 2017-10-05 | 株式会社バンダイナムコエンターテインメント | シミュレーションシステム及びプログラム |
JP2018081169A (ja) * | 2016-11-15 | 2018-05-24 | 日本電信電話株式会社 | 話者属性推定システム、学習装置、推定装置、話者属性推定方法、およびプログラム |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6374225B1 (en) * | 1998-10-09 | 2002-04-16 | Enounce, Incorporated | Method and apparatus to prepare listener-interest-filtered works |
JP3994368B2 (ja) * | 2000-01-25 | 2007-10-17 | ソニー株式会社 | 情報処理装置および情報処理方法、並びに記録媒体 |
US6466654B1 (en) * | 2000-03-06 | 2002-10-15 | Avaya Technology Corp. | Personal virtual assistant with semantic tagging |
US8374874B2 (en) * | 2006-09-11 | 2013-02-12 | Nuance Communications, Inc. | Establishing a multimodal personality for a multimodal application in dependence upon attributes of user interaction |
US8249225B2 (en) * | 2008-03-14 | 2012-08-21 | International Business Machines Corporation | Identifying caller preferences based on voice print analysis |
WO2009158581A2 (en) * | 2008-06-27 | 2009-12-30 | Adpassage, Inc. | System and method for spoken topic or criterion recognition in digital media and contextual advertising |
US8682667B2 (en) * | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
AU2011274318A1 (en) * | 2010-06-29 | 2012-12-20 | Royal Wins Pty Ltd | System and method of providing a computer-generated response |
CN103493045B (zh) * | 2011-01-18 | 2019-07-30 | 谷歌有限责任公司 | 对在线问题的自动回答 |
CN103187051A (zh) * | 2011-12-28 | 2013-07-03 | 上海博泰悦臻电子设备制造有限公司 | 车载互动装置 |
US20150314454A1 (en) * | 2013-03-15 | 2015-11-05 | JIBO, Inc. | Apparatus and methods for providing a persistent companion device |
CN103236259B (zh) * | 2013-03-22 | 2016-06-29 | 乐金电子研发中心(上海)有限公司 | 语音识别处理及反馈系统、语音回复方法 |
US9626961B2 (en) * | 2014-01-31 | 2017-04-18 | Vivint, Inc. | Systems and methods for personifying communications |
US9401143B2 (en) * | 2014-03-24 | 2016-07-26 | Google Inc. | Cluster specific speech model |
US9564123B1 (en) * | 2014-05-12 | 2017-02-07 | Soundhound, Inc. | Method and system for building an integrated user profile |
US20150339321A1 (en) * | 2014-05-22 | 2015-11-26 | Konnect Labs, Inc. | Adaptable Multimedia Display System and Method |
CN106027485A (zh) * | 2016-04-28 | 2016-10-12 | 乐视控股(北京)有限公司 | 基于语音交互的富媒体展示方法及系统 |
US10074359B2 (en) * | 2016-11-01 | 2018-09-11 | Google Llc | Dynamic text-to-speech provisioning |
US10347244B2 (en) * | 2017-04-21 | 2019-07-09 | Go-Vivace Inc. | Dialogue system incorporating unique speech to text conversion method for meaningful dialogue response |
CN107358949A (zh) * | 2017-05-27 | 2017-11-17 | 芜湖星途机器人科技有限公司 | 机器人发声自动调整系统 |
CN107832720B (zh) * | 2017-11-16 | 2022-07-08 | 北京百度网讯科技有限公司 | 基于人工智能的信息处理方法和装置 |
CN108037905B (zh) * | 2017-11-21 | 2021-12-21 | 北京光年无限科技有限公司 | 一种用于智能机器人的交互输出方法及智能机器人 |
CN108366302B (zh) * | 2018-02-06 | 2020-06-30 | 南京创维信息技术研究院有限公司 | Tts播报指令优化方法、智能电视、系统及存储装置 |
CN108388638B (zh) * | 2018-02-26 | 2020-09-18 | 出门问问信息科技有限公司 | 语义解析方法、装置、设备及存储介质 |
CN110069608B (zh) * | 2018-07-24 | 2022-05-27 | 百度在线网络技术(北京)有限公司 | 一种语音交互的方法、装置、设备和计算机存储介质 |
-
2018
- 2018-08-30 CN CN201811000038.3A patent/CN109147800A/zh active Pending
-
2019
- 2019-07-08 US US16/505,648 patent/US11475897B2/en active Active
- 2019-07-11 JP JP2019129594A patent/JP6876752B2/ja active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6665644B1 (en) * | 1999-08-10 | 2003-12-16 | International Business Machines Corporation | Conversational data mining |
JP2002041084A (ja) * | 2000-07-26 | 2002-02-08 | Victor Co Of Japan Ltd | 対話処理システム |
JP2004109323A (ja) * | 2002-09-17 | 2004-04-08 | Denso Corp | 音声対話装置及びプログラム |
JP2007272773A (ja) * | 2006-03-31 | 2007-10-18 | Xing Inc | 対話型インターフェイス制御システム |
JP2010078763A (ja) * | 2008-09-25 | 2010-04-08 | Brother Ind Ltd | 音声処理装置、音声処理プログラム、およびインターホンシステム |
JP2014002383A (ja) * | 2012-06-15 | 2014-01-09 | Samsung Electronics Co Ltd | 端末装置及び端末装置の制御方法 |
JP2015119298A (ja) * | 2013-12-18 | 2015-06-25 | 船井電機株式会社 | 情報処理装置および通信装置 |
JP2017062602A (ja) * | 2015-09-24 | 2017-03-30 | シャープ株式会社 | 対話システム、対話を制御する方法、およびコンピュータを対話システムとして機能させるためのプログラム |
WO2017147081A1 (en) * | 2016-02-22 | 2017-08-31 | Sonos, Inc. | Voice control of a media playback system |
JP2017176728A (ja) * | 2016-03-31 | 2017-10-05 | 株式会社バンダイナムコエンターテインメント | シミュレーションシステム及びプログラム |
JP2018081169A (ja) * | 2016-11-15 | 2018-05-24 | 日本電信電話株式会社 | 話者属性推定システム、学習装置、推定装置、話者属性推定方法、およびプログラム |
CN107170456A (zh) * | 2017-06-28 | 2017-09-15 | 北京云知声信息技术有限公司 | 语音处理方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN109147800A (zh) | 2019-01-04 |
US11475897B2 (en) | 2022-10-18 |
JP6876752B2 (ja) | 2021-05-26 |
US20200075024A1 (en) | 2020-03-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6876752B2 (ja) | 応答方法及び装置 | |
JP6613347B2 (ja) | 情報をプッシュする方法及び装置 | |
US11302337B2 (en) | Voiceprint recognition method and apparatus | |
CN109119063B (zh) | 视频配音生成方法、装置、设备及存储介质 | |
US20200126566A1 (en) | Method and apparatus for voice interaction | |
WO2020253509A1 (zh) | 面向情景及情感的中文语音合成方法、装置及存储介质 | |
CN109346076A (zh) | 语音交互、语音处理方法、装置和系统 | |
WO2022178969A1 (zh) | 语音对话数据处理方法、装置、计算机设备及存储介质 | |
US20220076674A1 (en) | Cross-device voiceprint recognition | |
WO2007043679A1 (ja) | 情報処理装置およびプログラム | |
CN109754783A (zh) | 用于确定音频语句的边界的方法和装置 | |
JP2023552854A (ja) | ヒューマンコンピュータインタラクション方法、装置、システム、電子機器、コンピュータ可読媒体及びプログラム | |
CN113392273A (zh) | 视频播放方法、装置、计算机设备及存储介质 | |
CN114121006A (zh) | 虚拟角色的形象输出方法、装置、设备以及存储介质 | |
CN111696520A (zh) | 智能配音方法、装置、介质及电子设备 | |
CN113761268A (zh) | 音频节目内容的播放控制方法、装置、设备和存储介质 | |
US20240004606A1 (en) | Audio playback method and apparatus, computer readable storage medium, and electronic device | |
CN111415662A (zh) | 用于生成视频的方法、装置、设备和介质 | |
KR20220154655A (ko) | 가족 관계에 기초하여 음성 데이터를 생성하는 장치, 방법 및 컴퓨터 프로그램 | |
CN112423000B (zh) | 数据处理方法、装置、设备以及介质 | |
CN114999441A (zh) | 虚拟形象生成方法、装置、设备、存储介质以及程序产品 | |
CN112863476A (zh) | 个性化语音合成模型构建、语音合成和测试方法及装置 | |
Tong | Speech to text with emoji | |
WO2021102647A1 (zh) | 数据处理方法、装置和存储介质 | |
Paaß et al. | Understanding Spoken Language |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191212 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191212 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201118 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201208 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210304 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210406 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210426 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6876752 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE Ref document number: 6876752 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313114 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |