JP6567727B2 - 受信した音声入力の入力音量に基づいて出力される音の出力音量を調節するユーザ命令処理方法およびシステム - Google Patents
受信した音声入力の入力音量に基づいて出力される音の出力音量を調節するユーザ命令処理方法およびシステム Download PDFInfo
- Publication number
- JP6567727B2 JP6567727B2 JP2018091853A JP2018091853A JP6567727B2 JP 6567727 B2 JP6567727 B2 JP 6567727B2 JP 2018091853 A JP2018091853 A JP 2018091853A JP 2018091853 A JP2018091853 A JP 2018091853A JP 6567727 B2 JP6567727 B2 JP 6567727B2
- Authority
- JP
- Japan
- Prior art keywords
- volume
- sound
- output
- input
- user command
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims description 36
- 238000012545 processing Methods 0.000 claims description 27
- 238000000034 method Methods 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 17
- 230000004044 response Effects 0.000 claims description 13
- 230000000007 visual effect Effects 0.000 claims description 11
- 238000013473 artificial intelligence Methods 0.000 description 20
- 230000006870 function Effects 0.000 description 18
- 230000015654 memory Effects 0.000 description 14
- 238000004891 communication Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000011161 development Methods 0.000 description 3
- 230000009118 appropriate response Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000005611 electricity Effects 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 238000004378 air conditioning Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000011038 discontinuous diafiltration by volume reduction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/165—Management of the audio stream, e.g. setting of volume, audio stream path
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification
- G10L17/26—Recognition of special voice characteristics, e.g. for use in lie detectors; Recognition of animal voices
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L2025/783—Detection of presence or absence of voice signals based on threshold decision
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/87—Detection of discrete points within a voice signal
Description
入力音量にしたがって出力音量を調節するための機能を、予め設定された時間に活性化させることができる。
110:ユーザ
210:外部サーバ
Claims (15)
- ユーザ命令処理方法であって、
ユーザから音声入力を受信する段階、
前記受信した音声入力の入力音量を測定する段階、
前記受信した音声入力に対応して出力するための音の出力音量を、前記測定された入力音量にしたがって調節する第1調整段階、および
前記音声入力が前記音の出力音量を調節するためのキーワードを含む場合、前記キーワードの発話時間に基づいて前記音の出力音量を調節する第2調整段階
を含むことを特徴とする、ユーザ命令処理方法。 - 前記第1調整段階は、
前記測定された入力音量に比例するように前記音の出力音量を調節することを特徴とする、請求項1に記載のユーザ命令処理方法。 - 前記測定された入力音量が予め設定された第1閾値以下である場合、または前記測定された入力音量が前記第1閾値以下でありながら前記音に対して要求される出力正確度が予め設定された第2閾値以上である場合、前記音に対応する視覚情報を、前記出力音量を調節する電子機器と連係する他の機器のディスプレイから出力するための制御情報を生成する段階、および
前記生成された制御情報を送信する段階
をさらに含むことを特徴とする、請求項1に記載のユーザ命令処理方法。 - 前記出力する段階は、
前記発話時間に比例するように前記音の出力音量を増加または減少させることを特徴とする、請求項1乃至3のいずれか一項に記載のユーザ命令処理方法。 - 前記音は、前記音声入力の応答として出力するための返答音声およびオーディオコンテンツのうちの少なくとも1つを含むことを特徴とする、請求項1に記載のユーザ命令処理方法。
- 前記受信された音声入力の入力音量を測定する段階は、
前記音声入力が含むキーワードのうち、前記出力音量を調節する電子機器をウェイクアップさせるために予め設定されたキーワードの入力音量を測定することを特徴とする、請求項1に記載のユーザ命令処理方法。 - 前記音声入力が含む周辺騒音の騒音音量または前記音を出力しようとする時点の周辺騒音の騒音音量を測定する段階
をさらに含み、
前記第1調整段階は、
前記測定された騒音音量をさらに利用して前記音の出力音量を調節することを特徴とする、請求項1に記載のユーザ命令処理方法。 - 時間情報を設定する段階
をさらに含み、
前記第1調整段階は、
現在時刻が前記設定された時間情報に対応する場合、前記音の出力音量を前記測定された入力音量にしたがって調節することを特徴とする、請求項1に記載のユーザ命令処理方法。 - 請求項1〜8のうちのいずれか一項に記載の方法をコンピュータに実行させるコンピュータプログラム。
- 請求項1〜8のうちのいずれか一項に記載の方法をコンピュータに実行させるコンピュータプログラムが記録されていることを特徴とする、コンピュータで読み取り可能な記録媒体。
- ユーザ命令処理システムであって、
コンピュータで読み取り可能な命令を実行するように実現される少なくとも1つのプロセッサ
を含み、
前記少なくとも1つのプロセッサは、
ユーザから音声入力を受信し、
前記受信した音声入力の入力音量を測定し、
前記受信した音声入力に対応して出力するための音の出力音量を、前記測定された入力音量にしたがって調節し、
前記音声入力が前記音の出力音量を調節するためのキーワードを含む場合、前記キーワードの発話時間に基づいて前記音の出力音量を調節すること
を特徴とする、ユーザ命令処理システム。 - 前記少なくとも1つのプロセッサは、
前記測定された入力音量が予め設定された第1閾値以下である場合、または前記測定された入力音量が前記第1閾値以下でありながら前記音に対して要求される出力正確度が予め設定された第2閾値以上である場合、前記音に対応する視覚情報を、前記ユーザ命令処理システムを実現する電子機器と連係する他の機器のディスプレイから出力するための制御情報を生成し、
前記生成された制御情報を送信すること
を特徴とする、請求項11に記載のユーザ命令処理システム。 - 前記少なくとも1つのプロセッサは、前記受信した音声入力の入力音量を測定するために、
前記音声入力が含むキーワードのうち、前記ユーザ命令処理システムを実現する電子機器をウェイクアップさせるために予め設定されたキーワードの入力音量を測定すること
を特徴とする、請求項11に記載のユーザ命令処理システム。 - 前記少なくとも1つのプロセッサは、
前記音声入力が含む周辺騒音の騒音音量または前記音を出力しようとする時点の周辺騒音の騒音音量を測定し、
前記測定された騒音音量をさらに利用して前記音の出力音量を調節すること
を特徴とする、請求項11に記載のユーザ命令処理システム。 - 前記少なくとも1つのプロセッサは、
時間情報を設定し、
現在時刻が前記設定された時間情報に対応する場合、前記音の出力音量を前記測定された入力音量にしたがって調節すること
を特徴とする、請求項11に記載のユーザ命令処理システム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020170059316A KR20180124564A (ko) | 2017-05-12 | 2017-05-12 | 수신된 음성 입력의 입력 음량에 기반하여 출력될 소리의 출력 음량을 조절하는 사용자 명령 처리 방법 및 시스템 |
KR10-2017-0059316 | 2017-05-12 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018194832A JP2018194832A (ja) | 2018-12-06 |
JP6567727B2 true JP6567727B2 (ja) | 2019-08-28 |
Family
ID=64104741
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018091853A Active JP6567727B2 (ja) | 2017-05-12 | 2018-05-11 | 受信した音声入力の入力音量に基づいて出力される音の出力音量を調節するユーザ命令処理方法およびシステム |
Country Status (4)
Country | Link |
---|---|
US (1) | US10872617B2 (ja) |
JP (1) | JP6567727B2 (ja) |
KR (1) | KR20180124564A (ja) |
WO (1) | WO2018208026A1 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020121375A (ja) * | 2019-01-30 | 2020-08-13 | 株式会社Preferred Networks | 制御装置、制御対象装置、制御方法及びプログラム |
CN110085225B (zh) * | 2019-04-24 | 2024-01-02 | 北京百度网讯科技有限公司 | 语音交互方法、装置、智能机器人及计算机可读存储介质 |
CN111104090B (zh) * | 2019-12-31 | 2023-05-05 | 云知声智能科技股份有限公司 | 一种音量调整方法及装置 |
US11269667B2 (en) * | 2020-07-16 | 2022-03-08 | Lenovo (Singapore) Pte. Ltd. | Techniques to switch between different types of virtual assistance based on threshold being met |
CN112201232A (zh) * | 2020-08-28 | 2021-01-08 | 星络智能科技有限公司 | 语音输出控制方法、电子装置及计算机可读存储介质 |
JP2022105372A (ja) * | 2021-01-04 | 2022-07-14 | 東芝テック株式会社 | 音声応答装置、音声応答方法および音声応答プログラム |
US11749287B2 (en) * | 2021-04-09 | 2023-09-05 | Qualcomm Incorporated | Device finder using voice authentication |
CN113223519A (zh) * | 2021-04-23 | 2021-08-06 | 深圳创维-Rgb电子有限公司 | 远场音量控制方法、设备、存储介质及计算机程序产品 |
CN114089945A (zh) * | 2021-10-29 | 2022-02-25 | 歌尔科技有限公司 | 音量实时调整方法、电子设备及可读存储介质 |
CN115695642A (zh) * | 2022-09-26 | 2023-02-03 | 展讯通信(天津)有限公司 | 通话音量调节方法和设备 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0247700U (ja) * | 1988-09-27 | 1990-03-30 | ||
KR19980041437A (ko) * | 1996-11-30 | 1998-08-17 | 유기범 | 소음레벨에 따른 수신음량 자동조정기능을 갖춘 이동단말기 |
JP3744161B2 (ja) * | 1997-03-28 | 2006-02-08 | セイコーエプソン株式会社 | 音声指示装置および音声指示情報記憶媒体 |
JP2002350167A (ja) * | 2001-05-29 | 2002-12-04 | Denso Corp | カーナビゲーション装置 |
KR20040096330A (ko) * | 2003-05-09 | 2004-11-16 | 엘지전자 주식회사 | 자동으로 방송수신기의 음량을 조절하는 방법 |
JP2006054613A (ja) * | 2004-08-10 | 2006-02-23 | Nec Access Technica Ltd | Tv機能を有する携帯電話機および携帯電話機におけるtv駆動方法 |
JP4953767B2 (ja) * | 2006-11-02 | 2012-06-13 | アルパイン株式会社 | 音声生成装置 |
JP5222543B2 (ja) * | 2007-12-10 | 2013-06-26 | 株式会社日立製作所 | テレビジョン装置 |
KR101387928B1 (ko) | 2010-06-24 | 2014-04-22 | 에스케이플래닛 주식회사 | 홈 미디어 디바이스 및 이를 이용한 홈 네트워크 시스템, 방법 |
US8594281B2 (en) * | 2012-01-10 | 2013-11-26 | Bank Of America Corporation | Dynamic menu framework |
JP5983077B2 (ja) * | 2012-06-15 | 2016-08-31 | ソニー株式会社 | 光情報記録媒体および再生装置 |
JP5404860B2 (ja) * | 2012-07-10 | 2014-02-05 | 株式会社東芝 | 情報処理端末及び情報処理方法 |
KR20140072927A (ko) * | 2012-11-15 | 2014-06-16 | 엘지전자 주식회사 | 이동 단말기 및 이의 제어방법 |
JP5996603B2 (ja) * | 2013-10-31 | 2016-09-21 | シャープ株式会社 | サーバ、発話制御方法、発話装置、発話システムおよびプログラム |
US9830924B1 (en) * | 2013-12-04 | 2017-11-28 | Amazon Technologies, Inc. | Matching output volume to a command volume |
KR20180071029A (ko) * | 2016-12-19 | 2018-06-27 | 삼성전자주식회사 | 음성 인식 방법 및 장치 |
-
2017
- 2017-05-12 KR KR1020170059316A patent/KR20180124564A/ko active Search and Examination
-
2018
- 2018-04-18 WO PCT/KR2018/004498 patent/WO2018208026A1/ko active Application Filing
- 2018-05-11 JP JP2018091853A patent/JP6567727B2/ja active Active
-
2019
- 2019-11-08 US US16/678,419 patent/US10872617B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US10872617B2 (en) | 2020-12-22 |
KR20180124564A (ko) | 2018-11-21 |
JP2018194832A (ja) | 2018-12-06 |
US20200075036A1 (en) | 2020-03-05 |
WO2018208026A1 (ko) | 2018-11-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6567727B2 (ja) | 受信した音声入力の入力音量に基づいて出力される音の出力音量を調節するユーザ命令処理方法およびシステム | |
JP6731894B2 (ja) | デバイス制御方法及び電子機器 | |
US10657963B2 (en) | Method and system for processing user command to provide and adjust operation of electronic device by analyzing presentation of user speech | |
JP6752870B2 (ja) | 複数のウェイクワードを利用して人工知能機器を制御する方法およびシステム | |
KR102209092B1 (ko) | 복수의 호출 용어를 이용하여 인공지능 기기를 제어하는 방법 및 시스템 | |
JP6573696B2 (ja) | ネットワークに連結した音響機器とのマルチモーダルインタラクション方法およびシステム | |
JP6920398B2 (ja) | 人工知能機器における連続会話機能 | |
US11749271B2 (en) | Method for controlling external device based on voice and electronic device thereof | |
JP6681940B2 (ja) | ユーザの位置及び空間に適した情報を能動的に提供する方法及び装置 | |
JP2018198058A (ja) | 情報提供方法、電子機器、コンピュータプログラム及び記録媒体 | |
KR102419374B1 (ko) | 사용자 발화를 처리하는 전자 장치 및 그 전자 장치의 제어 방법 | |
JP6775563B2 (ja) | 人工知能機器の自動不良検出のための方法およびシステム | |
JP2019012506A (ja) | 機械の自動活性のための方法及びシステム | |
US11557285B2 (en) | Electronic device for providing intelligent assistance service and operating method thereof | |
US11620996B2 (en) | Electronic apparatus, and method of controlling to execute function according to voice command thereof | |
EP4310835A1 (en) | Electronic device and personalized text-to-speech model generation method by electronic device | |
KR102255844B1 (ko) | 사용자의 위치 및 공간에 알맞은 정보를 능동적으로 제공하는 방법 및 장치 | |
KR102241792B1 (ko) | 인공지능 기기에서의 연속 대화 기능 | |
KR102239223B1 (ko) | 기계의 자동 활성을 위한 방법 및 시스템 | |
US20230260512A1 (en) | Electronic device and method of activating speech recognition service | |
US20230154462A1 (en) | Electronic device and method of restoring device state | |
KR20240020137A (ko) | 전자 장치 및 음성 인식 방법 | |
JP2020022158A (ja) | 音源フィルタリングのための方法およびシステム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180511 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190307 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190319 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190527 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190709 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190731 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6567727 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313115 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313115 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313115 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |