JP6567727B2 - 受信した音声入力の入力音量に基づいて出力される音の出力音量を調節するユーザ命令処理方法およびシステム - Google Patents

受信した音声入力の入力音量に基づいて出力される音の出力音量を調節するユーザ命令処理方法およびシステム Download PDF

Info

Publication number
JP6567727B2
JP6567727B2 JP2018091853A JP2018091853A JP6567727B2 JP 6567727 B2 JP6567727 B2 JP 6567727B2 JP 2018091853 A JP2018091853 A JP 2018091853A JP 2018091853 A JP2018091853 A JP 2018091853A JP 6567727 B2 JP6567727 B2 JP 6567727B2
Authority
JP
Japan
Prior art keywords
volume
sound
output
input
user command
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018091853A
Other languages
English (en)
Other versions
JP2018194832A (ja
Inventor
ミョンス シン
ミョンス シン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Naver Corp
Original Assignee
Naver Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Naver Corp filed Critical Naver Corp
Publication of JP2018194832A publication Critical patent/JP2018194832A/ja
Application granted granted Critical
Publication of JP6567727B2 publication Critical patent/JP6567727B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/26Recognition of special voice characteristics, e.g. for use in lie detectors; Recognition of animal voices
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L2025/783Detection of presence or absence of voice signals based on threshold decision
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L25/87Detection of discrete points within a voice signal

Description

以下の説明は、受信した音声入力の入力音量に基づいて出力される音の出力音量を調節するユーザ命令処理方法およびシステム、ユーザ命令処理方法をコンピュータに実行させるコンピュータプログラムとその記録媒体に関する。
ホームネットワークサービスの人工知能スピーカのように音声を基盤として動作するインタフェースは、ユーザの音声入力を受信した後、音声入力にしたがって返答音声を合成して提供したり、音声入力に対応するコンテンツのオーディオを出力したりする。例えば、特許文献1は、ホームメディアデバイスおよびこれを利用したホームネットワークシステムと方法に関する技術であって、ホームネットワークサービスにおいて移動通信網の他にWi-Fiのような第2通信網を利用してホームネットワークサービスを提供することが可能であり、ホーム内の複数のマルチメディア機器を、ユーザのボタン操作なく音声命令に基づいてマルチコントロールすることができる技術について開示している。
しかし、このような従来技術では、予め設定されている音量で音が出力されることにより、予め設定されている音量が大きすぎる場合は、ユーザまたはユーザの周辺にいる人が大きな音に驚いてしまうという状況が発生しかねない。逆に、予め設定されている音量が小さすぎる場合には、ユーザが返答音声やコンテンツのオーディオを正確に聞き取ることができないとう状況も発生し得る。さらに、従来技術では、ユーザが現在設定されている音量で出力される音を聞いた後、出力された音の音量を基準としてしか音量を調節することができないという問題もある。
韓国公開特許第10−2011−0139797号
ユーザから受信した音声入力の入力音量にしたがって出力される音の出力音量を調節することにより、ユーザは、ユーザ命令と同時に出力される音の出力音量を調節することができる、ユーザ命令処理方法およびシステム、ユーザ命令処理方法をコンピュータに実行させるコンピュータプログラムとその記録媒体を提供する。
ユーザ命令処理方法において、ユーザから音声入力を受信する段階、前記受信した音声入力の入力音量を測定する段階、および前記受信した音声入力に対応して出力するための音の出力音量を、前記測定された入力音量にしたがって調節する段階を含むことを特徴とする、ユーザ命令処理方法を提供する。
前記ユーザ命令処理方法をコンピュータに実行させるコンピュータプログラムが記録されていることを特徴とする、コンピュータで読み取り可能な記録媒体を提供する。
前記ユーザ命令処理方法をコンピュータに実行させるコンピュータプログラムを提供する。
ユーザ命令処理システムであって、コンピュータで読み取り可能な命令を実行するように実現される少なくとも1つのプロセッサを含み、前記少なくとも1つのプロセッサは、ユーザから音声入力を受信し、前記受信した音声入力の入力音量を測定し、前記受信した音声入力に対応して出力するための音の出力音量を、前記測定された入力音量にしたがって調節することを特徴とする、ユーザ命令処理システムを提供する。
ユーザから受信した音声入力の入力音量にしたがって出力される音の出力音量を調節することにより、ユーザは、ユーザ命令と同時に出力される音の出力音量を調節することができる。
本発明の一実施形態における、音声基盤のインタフェースを活用したサービス環境の例を示した図である。 本発明の一実施形態における、音声基盤のインタフェースを活用したサービス環境の他の例を示した図である。 本発明の一実施形態における、クラウド人工知能プラットフォームの例を示した図である。 本発明の一実施形態における、電子機器およびサーバの内部構成を説明するためのブロック図である。 本発明の一実施形態における、入力音量にしたがって出力音量を調節する例を示した図である。 本発明の一実施形態における、入力音量にしたがって出力音量を調節する例を示した図である。 本発明の一実施形態における、電子機器が実行することのできるユーザ命令処理方法の例を示したフローチャートである。 本発明の一実施形態における、予め設定されたキーワードの入力音量にしたがって音の出力音量を調節する例を示した図である。 本発明の一実施形態における、予め設定されたキーワードの入力音量にしたがって音の出力音量を調節する例を示した図である。 本発明の一実施形態における、出力される音に対応する視覚情報を追加で提供するユーザ命令処理方法の例を示したフローチャートである。 本発明の一実施形態における、キーワードの発話時間に基づいて出力される音の出力音量を調節する例を示した図である。 本発明の一実施形態における、周辺騒音の騒音音量に基づいて出力される音の出力音量を調節するユーザ命令処理方法の例を示したフローチャートである。
以下、実施形態について、添付の図面を参照しながら詳しく説明する。
本発明の実施形態に係るユーザ命令処理システムは、音声を基盤として動作するインタフェースを提供する電子機器によって実現されてよい。ユーザ命令は、ユーザから受信される音声入力を少なくとも含んでよく、電子機器は、このような音声入力を直接に、または別のインタフェースコネクトを介して連結する外部プラットフォームで認識および分析してユーザ命令を処理してよい。このとき、電子機器は、出力するための音、一例として、入力音声に対する返答音声および/または入力音声の応答として提供されるコンテンツのオーディオ(以下、「オーディオコンテンツ」)の出力音量を、入力音声の入力音量にしたがって調節してよい。本発明の実施形態に係るユーザ命令処理方法は、上述した電子機器で実行されてよい。このとき、電子機器には、本発明の一実施形態に係るコンピュータプログラムがインストールおよび駆動されてよく、電子機器は、駆動するコンピュータプログラムの制御にしたがって本発明の一実施形態に係るユーザ命令処理方法を実行してよい。上述したコンピュータプログラムは、コンピュータによって実現される電子機器と結合してユーザ命令処理方法をコンピュータに実行させるためにコンピュータで読み取り可能な記録媒体に格納されてよい。
図1は、本発明の一実施形態における、音声基盤のインタフェースを活用したサービス環境の例を示した図である。図1の実施形態では、スマートホーム(smart home)やホームネットワークサービスのように宅内の機器を連結して制御する技術において、音声を基盤として動作するインタフェースを提供する電子機器100がユーザ110の発話によって受信した音声入力「電気を消して」を認識および分析し、宅内で電子機器100と内部ネットワークを介して連係する宅内照明機器120のライト電源を制御する例を示している。
例えば、宅内の機器は、上述した宅内照明機器120の他にも、TV、PC(Personal Computer)、周辺機器、エアコン、冷蔵庫、ロボット掃除機などのような家電製品はもちろん、水道、電気、冷暖房機器などのようなエネルギー消費装置、ドアロックや監視カメラなどのような保安機器などのように、オンライン上で連結して制御可能な多様な機器を含んでよい。また、内部ネットワークは、イーサネット(Ethernet)(登録商標)、HomePNA、IEEE 1394のような有線ネットワーク技術、ブルートゥース(Bluetooth)(登録商標)、UWB(ultra Wide Band)、ジグビー(ZigBee)(登録商標)、Wireless 1394、Home RFのような無線ネットワーク技術などが活用されてよい。
電子機器100は、宅内の機器のうちの1つであってよい。例えば、電子機器100は、宅内に備えられた人工知能スピーカやロボット清掃機などのような機器のうちの1つであってよい。また、電子機器100は、スマートフォン(smart phone)、携帯電話、ノート型パンコン、デジタル放送用端末、PDA(Personal Digital Assistants)、PMP(Portable Multimedia Player)、タブレットPCなどのようなユーザ110のモバイル機器であってもよい。このように、電子機器100は、ユーザ110の音声入力を受信し、宅内の機器を制御するために宅内の機器と連結可能な機能を備えた機器であれば、特に制限されることはない。
図2は、本発明の一実施形態における、音声基盤のインタフェースを活用したサービス環境の例を示した図である。図2は、音声を基盤として動作するインタフェースを提供する電子機器100が、ユーザ110の発話によって受信した音声入力「今日の天気」を認識および分析し、外部ネットワークを介して外部サーバ210から今日の天気に関する情報を取得し、取得した情報を音声で出力する例を示している。
例えば、外部ネットワークは、PAN(personal area network)、LAN(local area network)、CAN(campus area network)、MAN(metropolitan area network)、WAN(wide area network)、BBN(broadband network)、インターネットなどのネットワークのうちの1つ以上の任意のネットワークを含んでよい。
図2の実施形態でも、電子機器100は、宅内の機器のうちの1つであっても、ユーザ110のモバイル機器のうちの1つであってもよく、ユーザ110の音声入力を受信して処理するための機能と、外部ネットワークを介して外部サーバ210に接続して外部サーバ210が提供するサービスやコンテンツをユーザ110に提供するための機能を備えた機器であれば、特別に制限されることはない。
このように、本発明の実施形態に係る電子機器100は、音声基盤のインタフェースにより、ユーザ110の発話によって受信される音声入力を少なくとも含むユーザ命令を処理することのできる機器であれば、特に制限されることはない。例えば、電子機器100は、ユーザの音声入力を直接に認識および分析し、音声入力に適した動作を実行することによってユーザ命令を処理してもよいが、実施形態によっては、ユーザの音声入力に対する認識や認識された音声入力の分析、ユーザに提供される音声の合成などの処理を、電子機器100と連係する外部のプラットフォームで実行してもよい。
図3は、本発明の一実施形態における、クラウド人工知能プラットフォームの例を示した図である。図3は、電子機器310、クラウド人工知能プラットフォーム320、およびコンテンツ・サービス330を示している。
一例として、電子機器310は、宅内に備えられた機器を意味してよく、少なくとも上述したような電子機器100を含んでよい。このような電子機器310や電子機器310にインストールおよび駆動されるアプリケーション(以下、アプリ)は、インタフェースコネクト340を介してクラウド人工知能プラットフォーム320と連係してよい。ここで、インタフェースコネクト340は、電子機器310や電子機器310にインストールおよび駆動されるアプリの開発のためのSDK(Software Development Kit)および/または開発文書を開発者に提供してよい。また、インタフェースコネクト340は、電子機器310や電子機器310にインストールおよび駆動されるアプリが、クラウド人工知能プラットフォーム320が提供する機能を活用することのできるAPI(Application Program Interface)を提供してよい。具体的な例として、開発者が、インタフェースコネクト340が提供するSDK(Software Development Kit)および/または開発文書を利用して開発した機器やアプリは、インタフェースコネクト340が提供するAPIを利用してクラウド人工知能プラットフォーム320が提供する機能を活用することが可能になる。
ここで、クラウド人工知能プラットフォーム320は、音声基盤のサービスを提供するための機能を提供してよい。例えば、クラウド人工知能プラットフォーム320は、受信した音声を認識し、出力する音声を合成するための音声処理モジュール321、受信した映像や動画を分析して処理するためのビジョン処理モジュール322、受信した音声にしたがって適した音声を出力するために適切な対話を決定するための対話処理モジュール323、受信した音声に適した機能を推薦するための推薦モジュール324、人工知能がデータ学習に基づいて文章単位で言語を翻訳するように支援するニューラル機械翻訳(Neural Machine Translation:NMT)325などのように、音声基盤サービスを提供するための多様なモジュールを含んでよい。
例えば、図1および図2の実施形態において、電子機器100が、ユーザ110の音声入力を、インタフェースコネクト340から提供されるAPIを利用してクラウド人工知能プラットフォーム320に送信したとする。この場合、クラウド人工知能プラットフォーム320は、受信した音声入力を、上述したモジュール321〜325を活用して認識および分析してよく、受信した音声入力にしたがって適切な返答音声を合成して提供したり、適切な動作を推薦したりしてよい。
また、拡張キット350は、第3者コンテンツ開発者または会社が、クラウド人工知能プラットフォーム320を基盤として新たな音声基盤機能を実現することのできる開発キットを提供してよい。例えば、図2の実施形態において、電子機器100は、受信したユーザ110の音声入力を外部サーバ210に送信し、外部サーバ210は、拡張キット350から提供されるAPIに基づいてクラウド人工知能プラットフォーム320に音声入力を送信したとする。この場合、上述と同じように、クラウド人工知能プラットフォーム320は、受信した音声入力を認識および分析した後、適切な返答音声を合成して提供したり、音声入力によって処理されなければならない機能に関する推薦情報を外部サーバ210に提供したりしてよい。一例として、図2において、外部サーバ210は、音声入力「今日の天気」をクラウド人工知能プラットフォーム320に送信し、クラウド人工知能プラットフォーム320から、音声入力「今日の天気」の認識によって抽出されたキーワード「今日の」および「天気」を受信したとする。この場合、外部サーバ210は、キーワード「今日の」および「天気」に基づいて「今日の天気は・・・」のようなテキスト情報を生成し、クラウド人工知能プラットフォーム320に生成されたテキスト情報を再び送信してよい。このとき、クラウド人工知能プラットフォーム320は、テキスト情報を音声で合成して外部サーバ210に提供してよい。外部サーバ210は、合成された音声を電子機器100に送信してよく、電子機器100は、合成された音声「今日の天気は・・・」をスピーカから出力することにより、ユーザ110から受信された音声入力「今日の天気」が処理されてよい。
図4は、本発明の一実施形態における、電子機器およびサーバの内部構成を説明するためのブロック図である。図4の電子機器410は、上述した電子機器100に対応してよく、サーバ420は、上述した外部サーバ210やクラウド人工知能プラットフォーム320を実現する1つのコンピュータ装置に対応してよい。
電子機器410とサーバ420は、メモリ411、421、プロセッサ412、422、通信モジュール413、423、および入力/出力インタフェース414、424を含んでよい。メモリ411、421は、コンピュータで読み取り可能な記録媒体であって、RAM(random access memory)、ROM(read only memory)、およびディスクドライブのような永久大容量記憶装置(permanent mass storage device)を含んでよい。ここで、ROMとディスクドライブのような永久大容量記憶装置は、メモリ411、421とは区分される別の永久記憶装置として電子機器410やサーバ420に含まれてもよい。また、メモリ411、421には、オペレーティングシステムと、少なくとも1つのプログラムコード(一例として、電気機器410にインストールされ、特定サービスの提供のために電子機器410で駆動するアプリケーションなどのためのコード)が格納されてよい。このようなソフトウェア構成要素は、メモリ411、421とは別のコンピュータで読み取り可能な記録媒体からロードされてよい。このような別のコンピュータで読み取り可能な記録媒体は、フロッピー(登録商標)ドライブ、ディスク、テープ、DVD/CD−ROMドライブ、メモリカードなどのコンピュータで読み取り可能な記録媒体を含んでよい。他の実施形態において、ソフトウェア構成要素は、コンピュータで読み取り可能な記録媒体ではない通信モジュール413、423を通じてメモリ411、421にロードされてもよい。例えば、少なくとも1つのプログラムは、開発者またはアプリケーションのインストールファイルを配信するファイル配信システムがネットワーク430を介して提供するファイルによってインストールされるコンピュータプログラム(一例として、上述したアプリケーション)に基づいて電子機器410のメモリ411にロードされてよい。
プロセッサ412、422は、基本的な算術、ロジック、および入出力演算を実行することにより、コンピュータプログラムの命令を処理するように構成されてよい。命令は、メモリ411、421または通信モジュール413、423によって、プロセッサ412、422に提供されてよい。例えば、プロセッサ412、422は、メモリ411、421のような記録装置に格納されたプログラムコードにしたがって受信される命令を実行するように構成されてよい。
通信モジュール413、423は、ネットワーク430を介して電子機器410とサーバ420とが互いに通信するための機能を提供してもよいし、電子機器410および/またはサーバ420が他の電子機器または他のサーバと通信するための機能を提供してもよい。一例として、電子機器410のプロセッサ412がメモリ411のような記録装置に格納されたプログラムコードにしたがって生成した要求が、通信モジュール413の制御にしたがってネットワーク430を介してサーバ420に伝達されてよい。これとは逆に、サーバ420のプロセッサ422の制御にしたがって提供される制御信号や命令、コンテンツ、ファイルなどが、通信モジュール423とネットワーク430を経て電子機器410の通信モジュール413を通じて電子機器410に受信されてもよい。例えば、通信モジュール413を通じて受信したサーバ420の制御信号や命令、コンテンツ、ファイルなどは、プロセッサ412やメモリ411に伝達されてよく、コンテンツやファイルなどは、電子機器410がさらに含むことのできる格納媒体(上述した永久記憶装置)に格納されてよい。
入力/出力インタフェース414は、入力/出力装置415とのインタフェースのための手段であってよい。例えば、入力装置は、マイク、キーボードまたはマウスなどの装置を、出力装置は、ディスプレイ、スピーカのような装置を含んでよい。他の例として、入力/出力インタフェース414は、タッチスクリーンのように入力と出力のための機能が1つに統合された装置とのインタフェースのための手段であってもよい。入力/出力装置415は、電子機器410と1つの装置で構成されてもよい。また、サーバ420の入力/出力インタフェース424は、サーバ420と連結するか、サーバ420が含むことのできる入力または出力のための装置(図示せず)とのインタフェースのための手段であってもよい。
また、他の実施形態において、電子機器410およびサーバ420は、図4の構成要素よりも少ないか多い構成要素を含んでもよい。しかし、大部分の従来技術的構成要素を明確に図に示す必要はない。例えば、電子機器410は、上述した入力/出力装置415のうちの少なくとも一部を含むように実現されてもよいし、トランシーバ、GPS(Global Positioning System)モジュール、カメラ、各種センサ、データベースなどのような他の構成要素をさらに含んでもよい。より具体的な例として、電子機器410がスマートフォンである場合、一般的にスマートフォンが含んでいる加速度センサやジャイロセンサ、カメラモジュール、物理的な各種ボタン、タッチパネルを利用したボタン、入力/出力ポート、振動のための振動器などのような多様な構成要素が電子機器410にさらに含まれるように実現されてよい。
本実施形態において、電子機器410は、ユーザの音声入力を受信するためのマイクを入力/出力装置415として基本的に含んでよく、ユーザの音声入力に対応する返答音声やオーディオコンテンツのような音を出力するためのスピーカを入力/出力装置415としてさらに含んでよい。
このとき、電子機器410は、ユーザの音声入力の入力音量にしたがい、音声入力に対応して出力される音の出力音量を調節してよい。このとき、出力音量は、入力音量に比例してよい。例えば、ユーザが電子機器410をコールする声が大きいほど、ユーザ命令に対応して出力される音の出力音量が相対的に大きくなるように調節されてよい。これとは逆に、ユーザが電子機器410をコールする声が小さいほど、ユーザ命令に対応して出力される音の出力音量が相対的に小さくなるように調節されてよい。具体的な例として、出力される音の出力音量は、音声入力の入力音量と同等に調節されてよい。ユーザが小声やささやくような声で電子機器410をコールすると、電子機器410も小声やささやくような音声で応答するようになる。
図5および図6は、本発明の一実施形態における、入力音量にしたがって出力音量を調節する例を示した図である。図5および図6では、音量を文字の大きさで表現した例であって、ユーザ110の音声入力の入力音量にしたがい、電子機器410で出力される音の出力音量が自動的に調節される例を示している。図5では、図6に比べて相対的に大きい音量(大きな文字によって大きな音量を表現)にしたがい、電子機器410から相対的に大きな音量の音が出力される例を、図6では、図5に比べて相対的に小さな音量(小さな文字によって小さな音量を表現)の音声にしたがい、電子機器410から相対的に小さな音量の音が出力される例を、比較して示している。
図7は、本発明の一実施形態における、電子機器が実行することのできるユーザ命令処理方法の例を示したフローチャートである。本発明の実施形態に係るユーザ命令処理システムは、上述した電子機器410のようなコンピュータ装置の形態で実現されてよい。このような電子機器410は、図7のユーザ命令処理方法が含む段階710〜730を実行してよい。このとき、プロセッサ412は、メモリ411が含むオペレーティングシステムのコードや、少なくとも1つのプログラムのコードによる制御命令を実行するように実現されてよい。ここで、プロセッサ412は、電子機器410に格納されたコードが提供する制御命令にしたがって電子機器410が図7の段階710〜730を実行するように電子機器410を制御してよい。
段階710で、電子機器410は、ユーザから音声入力を受信してよい。例えば、電子機器410は、電子機器410が含むマイクのような音声入力装置でユーザの発話による音声入力を受信してよい。
段階720で、電子機器410は、受信した音声入力の入力音量を測定してよい。音量の測定は、音の大きさを数値化することが可能な方法であれば、制限されることなく活用されてよい。例えば、電子機器420は、受信した音声入力から音に関連する音声電流を測定し、これによって得られるVU単位の値として入力音量を測定してよい。
段階730で、電子機器410は、受信した音声入力に対応して出力するための音の出力音量を、測定された入力音量にしたがって調節してよい。例えば、電子機器410は、測定された入力音量に比例するように、出力される音の出力音量を調節してよい。音声入力に対応して出力するための音は、音声入力に対応する返答音声および/またはオーディオコンテンツを含んでよい。
したがって、ユーザは、予め設定されていた出力音量が分からなくても、ユーザ自身がユーザ命令のために発話する音声の大きさを調節することにより、出力音量を直観的に調節することが可能となる。
他の実施形態として、電子機器410は、段階720で、ユーザの音声入力が含むすべての音声に対する入力音量を測定するのではなく、音声入力が含むキーワードのうち、電子機器410をウェイクアップ(wake−up)させるために予め設定されたキーワードの入力音量を測定してよい。
図8および図9は、本発明の一実施形態における、予め設定されたキーワードの入力音量にしたがって音の出力音量を調節する例を示した図である。図8および図9でも、入力音量と出力音量を、吹き出しに含まれた文字の大きさで表示した例を示している。電子機器410は、通常はスリープ状態で動作してよく、ユーザから電子機器410をウェイクアップさせるために予め設定されたキーワードが入力された場合には、ウェイクアップ状態にモードが変更されながら、該当のキーワードと共に入力されるユーザの音声入力をユーザ命令として認識してよい。図8および図9では、予め設定されたキーワードとして「スピーカ」を活用する例について示しており、キーワード「スピーカ」に対して測定された入力音量にしたがい、出力される音の出力音量を調節する例を示している。
図8では、予め設定されたキーワード「スピーカ」が、実際のユーザ命令「今日の天気」よりも相対的に大きな音量である例を示している。このとき、電子機器410から出力される音「今日の天気は・・・」の出力音量は、「スピーカ」に該当する入力音量にしたがって調節され、実際のユーザ命令「今日の天気」に対する入力音量よりも相対的に大きい音量で出力される例を示している。
これとは逆に、図9では、予め設定されたキーワード「スピーカ」が、実際のユーザ命令「今日の天気」よりも相対的に小さな音量である例を示している。このとき、電子機器410から出力される音「今日の天気は・・・」の出力音量は、実際のユーザ命令「今日の天気」に対する入力音量よりも相対的に小さい音量で出力される例を示している。
このように、本実施形態によると、ユーザが入力した音声全体ではなく、特定のキーワードのような一部分に対する入力音量にしたがい、ユーザが直観的に出力される音の出力音量を調節することが可能となる。
図10は、本発明の一実施形態における、出力される音に対応する視覚情報を追加で提供するユーザ命令処理方法の例を示したフローチャートである。図10の段階1010および1020は、図7の段階730以後に実行されてよい。
段階1010で、電子機器410は、測定された入力音量が予め設定された第1閾値以下である場合、または測定された入力音量が第1閾値以下でありながら音に対して要求される出力正確度が予め設定された第2閾値以上である場合、音に対応する視覚情報を、電子機器410と連係する他の機器のディスプレイから出力するための制御情報を生成してよい。
例えば、測定された入力音量が小さ過ぎる場合には、ユーザは、測定された入力音量にしたがって調節された出力音量の音を正確に聞き取ることができない可能性が発生する。また、出力される音が一定以上の長さを有するか、相対的に重要な情報である場合のように、高い出力正確度が要求される状況も存在し得る。したがって、電子機器410は、測定された入力音量が予め設定された第1閾値以下である場合や、測定された入力音量が第1閾値以下でありながら出力される音に対して要求される出力正確度が予め設定された第2閾値以上である場合、出力される音に対応する視覚情報を、ディスプレイを備えた他の機器のサポートにしたがって出力してよい。このために、電子機器410は、上述した特定条件に基づき、音に対応する視覚情報を、電子機器410ではなく、電子機器410と連係する他の機器から出力するための制御情報を生成してよい。
段階1020で、電子機器410は、生成された制御情報を送信してよい。このとき、生成された制御情報は、電子機器410から他の機器に直接伝達されても、図2を参照しながら説明した外部サーバ210を経て他の機器に伝達されてもよい。一例として、制御情報は、ユーザのスマートフォンに伝達されてよく、制御情報に基づいてスマートフォンが備えるディスプレイに視覚情報が表示されてよい。このような制御情報の送信は、2つの機器間に信号を直接送信するための方法またはサーバの中継を経て2つの機器間に信号を送信するための方法のように周知の方法によって実行可能であることは、当業者であれば容易に理解することができるであろう。
また他の実施形態として、電子機器410は、特定キーワードの発話時間に基づき、出力される音の出力音量を調節してよい。例えば、音声入力が音の出力音量を調節するためのキーワードを含む場合、このようなキーワードの発話時間に比例するように音の出力音量を増加または減少させてよい。
図11は、本発明の一実施形態における、キーワードの発話時間に基づいて出力される音の出力音量を調節する例を示した図である。図11では、音声入力「ボリュームを上げて」から、音の出力音量を調節するためのキーワード「上げて」の発話時間に基づいて出力音量を増加させる例を示している。例えば、ユーザが、キーワード「上げて」を1秒間で発話したり、キーワード「上げて」を3秒間で発話したりするように、特定キーワードの発話時間を調節することがある。このとき、出力音量は、発話時間が長くなるほどその変化幅を大きくしてよい。言い換えれば、ユーザがキーワード「上げて」を1秒間で発話する場合よりも、3秒間で発話する場合の方が、出力音量の増加幅を大きくしてよい。これとは逆に、出力の音量の減少幅においても、「音を下げて」や「ボリュームを低くして」などのような音声入力のキーワードに対する発話時間に基づいて調節してよい。
また他の実施形態として、電子機器410は、周辺騒音の騒音音量を追加のパラメータとして活用することで、出力される音の出力音量を調節してもよい。
図12は、本発明の一実施形態における、周辺騒音の騒音音量に基づいて出力される音の出力音量を調節する、ユーザ命令処理方法の例を示したフローチャートである。図12の段階1210および1220は、図7の段階720以後に、そして段階730の代わりに実行されてよい。
段階1210で、電子機器410は、音声入力が含む周辺騒音の騒音音量または音を出力しようとする時点の周辺騒音の騒音音量を測定してよい。
段階1220で、電子機器410は、受信した音声入力に対応して出力するための音の出力音量を、測定された入力音量および測定された騒音音量にしたがって調節してよい。
例えば、電子機器410は、測定された入力音量にしたがって出力される音の出力音量を調節するが、周辺騒音の騒音音量にもしたがって出力される音の出力音量を追加でさらに調節してよい。より具体的な例として、電子機器410は、ユーザの発話時の騒音音量や音を出力する時点の騒音音量が大きいほど、調節された出力音量が大きくなるように調節してよい。
また他の実施形態として、電子機器410は、測定された入力音量にしたがって音の出力音量を調節する機能が、特定の時間帯に活性化されるように制御してもよい。図7の段階は、現在時刻が電子機器410に設定された時間情報に対応する場合にだけ実行されてよい。例えば、真夜中や朝方のように音の出力音量に敏感になる時間帯に、出力音量の調節のための機能が活性化されるように設定されてよい。
以上のように、本発明の実施形態によると、ユーザから受信した音声入力の入力音量にしたがって出力される音の出力音量を調節することにより、ユーザは、ユーザ命令と同時に出力される音の出力音量を調節することができる。また、ユーザから受信した音声入力の入力音量および/または出力される音に対して要求される出力正確度に基づいてユーザが音を正確に聞き取ることができない状況が発生する可能性を考慮し、音に対応する視覚情報を、他の機器のディスプレイから出力することができる。また、出力される音の出力音量を調節するためのキーワードの発話時間にしたがって音の出力音量を調節することができ、音声基盤のインタフェースを提供する電子機器をウェイクアップさせるために予め設定されたキーワードの入力音量にしがたい、出力される音の出力音量を調節することができる。さらに、周辺騒音をさらに活用することで出力される音の出力音量を調節することができ、入力音量にしたがって出力音量を調節するための機能を予め設定された時間に活性化させることができる。
上述したシステムまたは装置は、ハードウェア構成要素、ソフトウェア構成要素、またはハードウェア構成要素とソフトウェア構成要素との組み合わせによって実現されてよい。例えば、実施形態で説明された装置および構成要素は、例えば、プロセッサ、コントローラ、ALU(arithmetic logic unit)、デジタル信号プロセッサ、マイクロコンピュータ、FPGA(field programmable gate array)、PLU(programmable logic unit)、マイクロプロセッサ、または命令を実行して応答することができる様々な装置のように、1つ以上の汎用コンピュータまたは特殊目的コンピュータを利用して実現されてよい。処理装置は、オペレーティングシステム(OS)および前記OS上で実行される1つ以上のソフトウェアアプリケーションを実行してよい。また、処理装置は、ソフトウェアの実行に応答し、データにアクセスし、データを格納、操作、処理、および生成してもよい。理解の便宜のために、1つの処理装置が使用されるとして説明される場合もあるが、当業者は、処理装置が複数個の処理要素および/または複数種類の処理要素を含んでもよいことが理解できるであろう。例えば、処理装置は、複数個のプロセッサまたは1つのプロセッサおよび1つのコントローラを含んでよい。また、並列プロセッサのような、他の処理構成も可能である。
ソフトウェアは、コンピュータプログラム、コード、命令、またはこれらのうちの1つ以上の組み合わせを含んでもよく、思うままに動作するように処理装置を構成したり、独立的または集合的に処理装置に命令したりしてよい。ソフトウェアおよび/またはデータは、処理装置に基づいて解釈されたり、処理装置に命令またはデータを提供したりするために、いかなる種類の機械、コンポーネント、物理装置、仮想装置、コンピュータ格納媒体または装置に具現化されてよい。ソフトウェアは、ネットワークによって接続されたコンピュータシステム上に分散され、分散された状態で格納されても実行されてもよい。ソフトウェアおよびデータは、1つ以上のコンピュータで読み取り可能な記録媒体に格納されてよい。
実施形態に係る方法は、多様なコンピュータ手段によって実行可能なプログラム命令の形態で実現されてコンピュータで読み取り可能な媒体に記録されてよい。前記コンピュータで読み取り可能な媒体は、プログラム命令、データファイル、データ構造などを単独でまたは組み合わせて含んでよい。媒体は、コンピュータによって実行可能なプログラムを継続して格納するものであっても、実行またはダウンロードのために臨時で格納するものであってもよい。また、媒体は、単一または複数個のハードウェアが結合した形態の多様な記録手段または格納手段であってよいが、あるコンピュータシステムに直接接続する媒体に限定されてはならず、ネットワーク上に分散存在するものであってもよい。媒体の例としては、ハードディスク、フロッピー(登録商標)ディスク、および磁気テープのような磁気媒体、CD−ROM、DVDのような光媒体、フロプティカルディスク(floptical disk)のような光磁気媒体、およびROM、RAM、フラッシュメモリなどを含んでプログラム命令語が格納されるように構成されたものであってよい。また、他の媒体の例として、アプリケーションを流通するアプリストアやその他の多様なソフトウェアを供給ないし流通するサイト、サーバなどで管理する記録媒体ないし格納媒体が挙げられてもよい。プログラム命令の例には、コンパイラによって生成されるもののような機械語コードだけではなく、インタプリタなどを使用してコンピュータによって実行される高級言語コードを含む。
以上のように、実施形態を、限定された実施形態と図面に基づいて説明したが、当業者であれば、上述した記載から多様な修正および変形が可能であろう。例えば、説明された技術が、説明された方法とは異なる順序で実行されたり、かつ/あるいは、説明されたシステム、構造、装置、回路などの構成要素が、説明された方法とは異なる形態で結合されたりまたは組み合わされたり、他の構成要素または均等物によって対置されたり置換されたとしても、適切な結果を達成することができる。
したがって、異なる実施形態であっても、特許請求の範囲と均等なものであれば、添付される特許請求の範囲に属する。
本発明の実施形態は、更に以下の課題を解決する。
ユーザから受信した音声入力の入力音量および/または出力される音に対して要求される出力正確度に基づいてユーザが音を正確に聞き取ることができない状況が発生する可能性を考慮し、音に対応する視覚情報を他の機器のディスプレイから出力することができる、ユーザ命令処理方法およびシステム、ユーザ命令処理方法をコンピュータに実行させるコンピュータプログラムとその記録媒体を提供する。
出力される音の出力音量を調節するためのキーワードの発話時間にしたがって音の出力音量を調節することができる、ユーザ命令処理方法およびシステム、ユーザ命令処理方法をコンピュータに実行させるコンピュータプログラムとその記録媒体を提供する。
音声基盤のインタフェースを提供する電子機器をウェイクアップさせるために予め設定されたキーワードの入力音量にしたがって出力される音の出力音量を調節することができる、ユーザ命令処理方法およびシステム、ユーザ命令処理方法をコンピュータに実行させるコンピュータプログラムとその記録媒体を提供する。
周辺騒音をさらに活用することで出力される音の出力音量を調節することができる、ユーザ命令処理方法およびシステム、ユーザ命令処理方法をコンピュータに実行させるコンピュータプログラムとその記録媒体を提供する。
入力音量にしたがって出力音量を調節するための機能を予め設定された時間に活性化させることができる、ユーザ命令処理方法およびシステム、ユーザ命令処理方法をコンピュータに実行させるコンピュータプログラムとその記録媒体を提供する。
本発明の実施形態は、更に以下の効果を達成する。
ユーザから受信した音声入力の入力音量および/または出力される音に対して要求される出力正確度に基づいてユーザが音を正確に聞き取ることができない状況が発生する可能性を考慮し、音に対応する視覚情報を他の機器のディスプレイから出力することができる。
出力される音の出力音量を調節するためのキーワードの発話時間にしたがって音の出力音量を調節することができる。
音声基盤のインタフェースを提供する電子機器をウェイクアップさせるために予め設定されたキーワードの入力音量にしたがって出力される音の出力音量を調節することができる。
周辺騒音をさらに活用することで出力される音の出力音量を調節することができる。
入力音量にしたがって出力音量を調節するための機能を、予め設定された時間に活性化させることができる。
100:電子機器
110:ユーザ
210:外部サーバ

Claims (15)

  1. ユーザ命令処理方法であって、
    ユーザから音声入力を受信する段階、
    前記受信した音声入力の入力音量を測定する段階
    前記受信した音声入力に対応して出力するための音の出力音量を、前記測定された入力音量にしたがって調節する第1調整段階、および
    前記音声入力が前記音の出力音量を調節するためのキーワードを含む場合、前記キーワードの発話時間に基づいて前記音の出力音量を調節する第2調整段階
    を含むことを特徴とする、ユーザ命令処理方法。
  2. 前記第1調整段階は、
    前記測定された入力音量に比例するように前記音の出力音量を調節することを特徴とする、請求項1に記載のユーザ命令処理方法。
  3. 前記測定された入力音量が予め設定された第1閾値以下である場合、または前記測定された入力音量が前記第1閾値以下でありながら前記音に対して要求される出力正確度が予め設定された第2閾値以上である場合、前記音に対応する視覚情報を、前記出力音量を調節する電子機器と連係する他の機器のディスプレイから出力するための制御情報を生成する段階、および
    前記生成された制御情報を送信する段階
    をさらに含むことを特徴とする、請求項1に記載のユーザ命令処理方法。
  4. 前記出力する段階は、
    前記発話時間に比例するように前記音の出力音量を増加または減少させることを特徴とする、請求項1乃至3のいずれか一項に記載のユーザ命令処理方法。
  5. 前記音は、前記音声入力の応答として出力するための返答音声およびオーディオコンテンツのうちの少なくとも1つを含むことを特徴とする、請求項1に記載のユーザ命令処理方法。
  6. 前記受信された音声入力の入力音量を測定する段階は、
    前記音声入力が含むキーワードのうち、前記出力音量を調節する電子機器をウェイクアップさせるために予め設定されたキーワードの入力音量を測定することを特徴とする、請求項1に記載のユーザ命令処理方法。
  7. 前記音声入力が含む周辺騒音の騒音音量または前記音を出力しようとする時点の周辺騒音の騒音音量を測定する段階
    をさらに含み、
    前記第1調整段階は、
    前記測定された騒音音量をさらに利用して前記音の出力音量を調節することを特徴とする、請求項1に記載のユーザ命令処理方法。
  8. 時間情報を設定する段階
    をさらに含み、
    前記第1調整段階は、
    現在時刻が前記設定された時間情報に対応する場合、前記音の出力音量を前記測定された入力音量にしたがって調節することを特徴とする、請求項1に記載のユーザ命令処理方法。
  9. 請求項1〜のうちのいずれか一項に記載の方法をコンピュータに実行させるコンピュータプログラム。
  10. 請求項1〜のうちのいずれか一項に記載の方法をコンピュータに実行させるコンピュータプログラムが記録されていることを特徴とする、コンピュータで読み取り可能な記録媒体。
  11. ユーザ命令処理システムであって、
    コンピュータで読み取り可能な命令を実行するように実現される少なくとも1つのプロセッサ
    を含み、
    前記少なくとも1つのプロセッサは、
    ユーザから音声入力を受信し、
    前記受信した音声入力の入力音量を測定し、
    前記受信した音声入力に対応して出力するための音の出力音量を、前記測定された入力音量にしたがって調節し、
    前記音声入力が前記音の出力音量を調節するためのキーワードを含む場合、前記キーワードの発話時間に基づいて前記音の出力音量を調節すること
    を特徴とする、ユーザ命令処理システム。
  12. 前記少なくとも1つのプロセッサは、
    前記測定された入力音量が予め設定された第1閾値以下である場合、または前記測定された入力音量が前記第1閾値以下でありながら前記音に対して要求される出力正確度が予め設定された第2閾値以上である場合、前記音に対応する視覚情報を、前記ユーザ命令処理システムを実現する電子機器と連係する他の機器のディスプレイから出力するための制御情報を生成し、
    前記生成された制御情報を送信すること
    を特徴とする、請求項11に記載のユーザ命令処理システム。
  13. 前記少なくとも1つのプロセッサは、前記受信した音声入力の入力音量を測定するために、
    前記音声入力が含むキーワードのうち、前記ユーザ命令処理システムを実現する電子機器をウェイクアップさせるために予め設定されたキーワードの入力音量を測定すること
    を特徴とする、請求項11に記載のユーザ命令処理システム。
  14. 前記少なくとも1つのプロセッサは、
    前記音声入力が含む周辺騒音の騒音音量または前記音を出力しようとする時点の周辺騒音の騒音音量を測定し、
    前記測定された騒音音量をさらに利用して前記音の出力音量を調節すること
    を特徴とする、請求項11に記載のユーザ命令処理システム。
  15. 前記少なくとも1つのプロセッサは、
    時間情報を設定し、
    現在時刻が前記設定された時間情報に対応する場合、前記音の出力音量を前記測定された入力音量にしたがって調節すること
    を特徴とする、請求項11に記載のユーザ命令処理システム。
JP2018091853A 2017-05-12 2018-05-11 受信した音声入力の入力音量に基づいて出力される音の出力音量を調節するユーザ命令処理方法およびシステム Active JP6567727B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020170059316A KR20180124564A (ko) 2017-05-12 2017-05-12 수신된 음성 입력의 입력 음량에 기반하여 출력될 소리의 출력 음량을 조절하는 사용자 명령 처리 방법 및 시스템
KR10-2017-0059316 2017-05-12

Publications (2)

Publication Number Publication Date
JP2018194832A JP2018194832A (ja) 2018-12-06
JP6567727B2 true JP6567727B2 (ja) 2019-08-28

Family

ID=64104741

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018091853A Active JP6567727B2 (ja) 2017-05-12 2018-05-11 受信した音声入力の入力音量に基づいて出力される音の出力音量を調節するユーザ命令処理方法およびシステム

Country Status (4)

Country Link
US (1) US10872617B2 (ja)
JP (1) JP6567727B2 (ja)
KR (1) KR20180124564A (ja)
WO (1) WO2018208026A1 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020121375A (ja) * 2019-01-30 2020-08-13 株式会社Preferred Networks 制御装置、制御対象装置、制御方法及びプログラム
CN110085225B (zh) * 2019-04-24 2024-01-02 北京百度网讯科技有限公司 语音交互方法、装置、智能机器人及计算机可读存储介质
CN111104090B (zh) * 2019-12-31 2023-05-05 云知声智能科技股份有限公司 一种音量调整方法及装置
US11269667B2 (en) * 2020-07-16 2022-03-08 Lenovo (Singapore) Pte. Ltd. Techniques to switch between different types of virtual assistance based on threshold being met
CN112201232A (zh) * 2020-08-28 2021-01-08 星络智能科技有限公司 语音输出控制方法、电子装置及计算机可读存储介质
JP2022105372A (ja) * 2021-01-04 2022-07-14 東芝テック株式会社 音声応答装置、音声応答方法および音声応答プログラム
US11749287B2 (en) * 2021-04-09 2023-09-05 Qualcomm Incorporated Device finder using voice authentication
CN113223519A (zh) * 2021-04-23 2021-08-06 深圳创维-Rgb电子有限公司 远场音量控制方法、设备、存储介质及计算机程序产品
CN114089945A (zh) * 2021-10-29 2022-02-25 歌尔科技有限公司 音量实时调整方法、电子设备及可读存储介质
CN115695642A (zh) * 2022-09-26 2023-02-03 展讯通信(天津)有限公司 通话音量调节方法和设备

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0247700U (ja) * 1988-09-27 1990-03-30
KR19980041437A (ko) * 1996-11-30 1998-08-17 유기범 소음레벨에 따른 수신음량 자동조정기능을 갖춘 이동단말기
JP3744161B2 (ja) * 1997-03-28 2006-02-08 セイコーエプソン株式会社 音声指示装置および音声指示情報記憶媒体
JP2002350167A (ja) * 2001-05-29 2002-12-04 Denso Corp カーナビゲーション装置
KR20040096330A (ko) * 2003-05-09 2004-11-16 엘지전자 주식회사 자동으로 방송수신기의 음량을 조절하는 방법
JP2006054613A (ja) * 2004-08-10 2006-02-23 Nec Access Technica Ltd Tv機能を有する携帯電話機および携帯電話機におけるtv駆動方法
JP4953767B2 (ja) * 2006-11-02 2012-06-13 アルパイン株式会社 音声生成装置
JP5222543B2 (ja) * 2007-12-10 2013-06-26 株式会社日立製作所 テレビジョン装置
KR101387928B1 (ko) 2010-06-24 2014-04-22 에스케이플래닛 주식회사 홈 미디어 디바이스 및 이를 이용한 홈 네트워크 시스템, 방법
US8594281B2 (en) * 2012-01-10 2013-11-26 Bank Of America Corporation Dynamic menu framework
JP5983077B2 (ja) * 2012-06-15 2016-08-31 ソニー株式会社 光情報記録媒体および再生装置
JP5404860B2 (ja) * 2012-07-10 2014-02-05 株式会社東芝 情報処理端末及び情報処理方法
KR20140072927A (ko) * 2012-11-15 2014-06-16 엘지전자 주식회사 이동 단말기 및 이의 제어방법
JP5996603B2 (ja) * 2013-10-31 2016-09-21 シャープ株式会社 サーバ、発話制御方法、発話装置、発話システムおよびプログラム
US9830924B1 (en) * 2013-12-04 2017-11-28 Amazon Technologies, Inc. Matching output volume to a command volume
KR20180071029A (ko) * 2016-12-19 2018-06-27 삼성전자주식회사 음성 인식 방법 및 장치

Also Published As

Publication number Publication date
US10872617B2 (en) 2020-12-22
KR20180124564A (ko) 2018-11-21
JP2018194832A (ja) 2018-12-06
US20200075036A1 (en) 2020-03-05
WO2018208026A1 (ko) 2018-11-15

Similar Documents

Publication Publication Date Title
JP6567727B2 (ja) 受信した音声入力の入力音量に基づいて出力される音の出力音量を調節するユーザ命令処理方法およびシステム
JP6731894B2 (ja) デバイス制御方法及び電子機器
US10657963B2 (en) Method and system for processing user command to provide and adjust operation of electronic device by analyzing presentation of user speech
JP6752870B2 (ja) 複数のウェイクワードを利用して人工知能機器を制御する方法およびシステム
KR102209092B1 (ko) 복수의 호출 용어를 이용하여 인공지능 기기를 제어하는 방법 및 시스템
JP6573696B2 (ja) ネットワークに連結した音響機器とのマルチモーダルインタラクション方法およびシステム
JP6920398B2 (ja) 人工知能機器における連続会話機能
US11749271B2 (en) Method for controlling external device based on voice and electronic device thereof
JP6681940B2 (ja) ユーザの位置及び空間に適した情報を能動的に提供する方法及び装置
JP2018198058A (ja) 情報提供方法、電子機器、コンピュータプログラム及び記録媒体
KR102419374B1 (ko) 사용자 발화를 처리하는 전자 장치 및 그 전자 장치의 제어 방법
JP6775563B2 (ja) 人工知能機器の自動不良検出のための方法およびシステム
JP2019012506A (ja) 機械の自動活性のための方法及びシステム
US11557285B2 (en) Electronic device for providing intelligent assistance service and operating method thereof
US11620996B2 (en) Electronic apparatus, and method of controlling to execute function according to voice command thereof
EP4310835A1 (en) Electronic device and personalized text-to-speech model generation method by electronic device
KR102255844B1 (ko) 사용자의 위치 및 공간에 알맞은 정보를 능동적으로 제공하는 방법 및 장치
KR102241792B1 (ko) 인공지능 기기에서의 연속 대화 기능
KR102239223B1 (ko) 기계의 자동 활성을 위한 방법 및 시스템
US20230260512A1 (en) Electronic device and method of activating speech recognition service
US20230154462A1 (en) Electronic device and method of restoring device state
KR20240020137A (ko) 전자 장치 및 음성 인식 방법
JP2020022158A (ja) 音源フィルタリングのための方法およびシステム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180511

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190307

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190319

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190527

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190709

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190731

R150 Certificate of patent or registration of utility model

Ref document number: 6567727

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313115

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313115

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313115

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350