JP2023501536A - 人工知能型マルチメディア装置の制御方法及びシステム - Google Patents

人工知能型マルチメディア装置の制御方法及びシステム Download PDF

Info

Publication number
JP2023501536A
JP2023501536A JP2022527149A JP2022527149A JP2023501536A JP 2023501536 A JP2023501536 A JP 2023501536A JP 2022527149 A JP2022527149 A JP 2022527149A JP 2022527149 A JP2022527149 A JP 2022527149A JP 2023501536 A JP2023501536 A JP 2023501536A
Authority
JP
Japan
Prior art keywords
signal
multimedia device
user
control signal
artificial intelligence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022527149A
Other languages
English (en)
Inventor
ヨプ ク、スン
ウク イ、ドン
グ ホ、ジュン
ジュ ジャン、ヨン
ジュン ペク、スン
ジョン キム、ヨン
ウン キム、ヨン
ウ ソ、ジ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
1Thefull Platform Ltd
Original Assignee
1Thefull Platform Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 1Thefull Platform Ltd filed Critical 1Thefull Platform Ltd
Publication of JP2023501536A publication Critical patent/JP2023501536A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/16Speech classification or search using artificial neural networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Telephonic Communication Services (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

人工知能型マルチメディア装置の制御方法及びシステムに関する。マルチメディア装置の音信号とユーザーの音声信号とが同時に人工知能型ケア装置に印加されることによって、人工知能型ケア装置がユーザーの音声信号を正確に把握できないとき、人工知能型ケア装置が自らマルチメディア装置のボリュームを調節したり、又はユーザーにボリューム調節に対する案内音声を送り出し、ユーザーがマルチメディア装置のボリュームを調節できるようになり、その結果、ユーザーの音声命令把握及び解釈の正確性を確保できるという効果がある。【選択図】図3

Description

本発明は、人工知能型マルチメディア装置の制御方法及びシステムに関する。
本出願は、2020年1月20日に出願された韓国特許出願第10-2020-0007180号に基づいた優先権を主張し、該当出願の明細書及び図面に記載した全ての内容は本出願に援用される。
全世界的な高齢化速度の加速化に伴い、高齢者のためのIT技術分野に対する関心が高まっている。
そして、近年、ユーザーの音声命令を把握し、ユーザーが要請する各情報(天気、音楽、ニュースなど)を音声で知らせるスマートスピーカーなどの人工知能型電子装置の開発が加速化されている。
特に、老人などの高齢者、独居老人の場合、このようなスマートスピーカーなどの人工知能型電子装置の効用性が次第に大きくなっている。
ただ、近年開発されているスマートスピーカーなどの人工知能型電子装置の場合にも、ユーザー(老人などの高齢者、独居老人など)の音声命令と外部騒音(TV音など)とが同時に印加される場合、ユーザーの音声命令を正確に認識できないので、ユーザーが所望の動作を行えないという問題がある。
一方、このようなスマートスピーカーと関連して、特許文献1:韓国登録特許第10-2053534号には、人工知能スピーカーを通じて鬱病などの疾病を診断及び防止し、位置基盤で施設情報を知らせ、収集された情報を基にして一定時間に合わせてユーザが質問する前にユーザに情報を提供する「人工知能スピーカーを用いた老人ケア提供方法」が開示されている。
韓国登録特許第10-2053534号
本発明が達成しようとする技術的課題は、マルチメディア装置の音信号とユーザーの音声信号とが同時に人工知能型ケア装置に印加されることによって、人工知能型ケア装置がユーザーの音声信号を正確に把握できないとき、人工知能型ケア装置が自らマルチメディア装置のボリュームを調節したり、ユーザーにボリューム調節に対する案内音声を送り出し、ユーザーがマルチメディア装置のボリュームを調節できるようになり、その結果、ユーザーの音声命令把握及び解釈の正確性を確保できる人工知能型マルチメディア装置の制御方法及びシステムを提供することを目的とする。
前記のような技術的課題を達成するための本発明の一実施例は、(a)人工知能型ケア装置101の入力部103(マイク)が、ユーザー105の音声信号S1と、マルチメディアコンテンツを出力するマルチメディア装置107の音信号S3とを同時に受け取る段階;(b)前記ケア装置101の判断部109が、同時に印加された前記音声信号S1と前記音信号S3から前記音声信号S1のみの抽出可不可を判断する段階;及び(c)前記音声信号S1のみの抽出が不可能である場合、前記ケア装置101の制御部111が、前記マルチメディア装置107又は前記ユーザー105に伝送される制御信号S5を生成する段階;を含むことを特徴とする人工知能型マルチメディア装置の制御方法を提供する。
また、マルチメディアコンテンツを出力しながら音信号S3を生成するマルチメディア装置107;及びユーザー105の音声信号S1と前記音信号S3とを同時に受け取る入力部103と、同時に印加された前記音声信号S1と音信号S3から前記音声信号S1のみの抽出可不可を判断する判断部109と、前記音声信号S1のみの抽出が不可能である場合、前記マルチメディア装置107又は前記ユーザー105に伝送される制御信号S5を生成する制御部111とを含む人工知能型ケア装置101;を含むことを特徴とする人工知能型マルチメディア装置の制御システムを提供する。
本発明の実施例によると、マルチメディア装置の音信号とユーザーの音声信号とが同時に人工知能型ケア装置に印加されることによって、人工知能型ケア装置がユーザーの音声信号を正確に把握できないとき、人工知能型ケア装置が自らマルチメディア装置のボリュームを調節したり、又はユーザーにボリューム調節に対する案内音声を送り出し、ユーザーがマルチメディア装置のボリュームを調節できるようになり、その結果、ユーザーの音声命令把握及び解釈の正確性を確保できるという効果がある。
本発明の一実施例に係る人工知能型マルチメディア装置の制御システムを示すブロック図である。 本発明の他の実施例に係る人工知能型マルチメディア装置の制御システムを示すブロック図である。 本発明の更に他の実施例に係る人工知能型マルチメディア装置の制御システムを示すブロック図である。 本発明の更に他の実施例に係る人工知能型マルチメディア装置の制御方法を示すフローチャートである。 本発明の更に他の実施例に係る人工知能型マルチメディア装置の制御方法を示すフローチャートである。 本発明の更に他の実施例に係る人工知能型マルチメディア装置の制御方法を示すフローチャートである。
以下、本発明の一部の実施例を例示的な図面を通じて詳細に説明する。各図面の各構成要素に参照符号を付するにおいて、同一の構成要素に対しては、たとえ他の図面上に表示されたとしても、可能な限り、同一の符号を付している。また、本発明を説明するにおいて、関連する公知の構成又は機能に対する具体的な説明が本発明の要旨を不明瞭にし得ると判断される場合は、それについての詳細な説明は省略する。
また、本発明の構成要素を説明するにおいて、第1、第2、A、B、(a)、(b)などの用語を使用することができる。このような用語は、その構成要素を他の構成要素と区別するためのものに過ぎなく、その用語によって該当の構成要素の本質や順序などが限定されることはない。一つの構成要素が他の構成要素に「連結」、「結合」又は「接続」されると記載された場合、その構成要素は、その他の構成要素に直接連結又は接続され得るが、各構成要素の間に更に他の構成要素が「連結」、「結合」又は「接続」される場合もある。
図1は、本発明の一実施例に係る人工知能型マルチメディア装置の制御システムを示すブロック図である。図2は、本発明の他の実施例に係る人工知能型マルチメディア装置の制御システムを示すブロック図である。図3は、本発明の更に他の実施例に係る人工知能型マルチメディア装置の制御システムを示すブロック図である。図4は、本発明の更に他の実施例に係る人工知能型マルチメディア装置の制御方法を示すフローチャートである。図5は、本発明の更に他の実施例に係る人工知能型マルチメディア装置の制御方法を示すフローチャートである。図6は、本発明の更に他の実施例に係る人工知能型マルチメディア装置の制御方法を示すフローチャートである。
これらの各図面に示したように、本発明の一実施例に係る人工知能型マルチメディア装置の制御方法は、(a)人工知能型ケア装置101の入力部103が、ユーザー105の音声信号S1と、マルチメディアコンテンツを出力するマルチメディア装置107の音信号S3とを同時に受け取る段階;(b)ケア装置101の判断部109が、同時に印加された前記音声信号S1と前記音信号S3から前記音声信号S1のみの抽出可不可を判断する段階;及び(c)音声信号S1のみの抽出が不可能である場合、ケア装置101の制御部111が、マルチメディア装置107又はユーザー105に伝送される制御信号S5を生成する段階;を含むことを特徴とする。
以下、各段階別に詳細に説明する。
まず、(a)段階において、人工知能型ケア装置101の入力部103は、ユーザー105の音声信号S1と、マルチメディアコンテンツを出力するマルチメディア装置107の音信号S3とを同時に受け取る。
人工知能型ケア装置101は、一例として、ロボット、スマートフォン又はスマートスピーカーであってもよく、人工知能型ケア装置101には、老人などの高齢者のためのケアアプリが設置されてもよい。
人工知能型ケア装置101の入力部103は、マイクとして提供され、ユーザー105の音声信号S1を受け取る。
ここで、ユーザー105は、一例として、老人などの高齢者であってもよい。
また、人工知能型ケア装置101の入力部103は、上述したユーザー105の音声信号S1と共に、マルチメディアコンテンツを出力するマルチメディア装置107からの音信号S3を受け取る。
ここで、マルチメディア装置107は、テレビ(TV)、移動通信端末機、ノートパソコン、デスクトップPCなどのディスプレイ装置及びオーディオ装置を備える多様な電子装置として提供され得る。
もちろん、このようなマルチメディア装置107は、多様なマルチメディアコンテンツの映像信号を表示するディスプレイと、音信号S3を出力するスピーカーとを備えることができる。
続いて、(b)段階において、人工知能型ケア装置101の判断部109は、同時に印加された音声信号S1と音信号S3から音声信号S1のみの抽出可不可を判断する。
すなわち、(b)段階において、判断部109は、同時に印加された音声信号S1と音信号S3から音声信号S1のみを分離することによって、ユーザー105の音声(命令)を把握できるかどうかを判断する。
もちろん、判断部109は、ユーザー105から持続的に印加されて累積/格納された過去の各音声信号(音声命令、音声呼び出しなど)を基盤にして、同時に印加された音声信号S1と音信号S3から音声信号S1のみの抽出可不可を判断することができる。
さらに具体的に、判断部109は、ユーザー105から持続的に印加されて累積/格納された過去の各音声信号(音声命令、音声呼び出しなど)において、音の強さ(音の振幅)、音の高低(音の振動数)、及び音色(音波の模様)のうち少なくとも一つ以上を用いて、同時に印加された音声信号S1と音信号S3から音声信号S1のみの抽出可不可を判断することができる。
すなわち、音声信号S1と音信号S3とを比較した結果、音の強さ(音の振幅)、音の高低(音の振動数)、及び音色(音波の模様)のうち少なくとも一つ以上又は全てが既に設定された誤差範囲内である場合は、同時に印加された音声信号S1と音信号S3から音声信号S1のみを抽出できない場合と判断することができる。
続いて、(c)段階において、人工知能型ケア装置101の制御部111は、音声信号S1のみの抽出が不可能である場合、マルチメディア装置107又はユーザー105に伝送される制御信号S5を生成する。
言い換えると、制御部111は、同時に印加された音声信号S1と音信号S3において、ユーザーの音声信号S1である音声命令、音声呼び出しなどを把握できない場合、マルチメディア装置107又はユーザー105に伝送される制御信号S5を生成するようになる。
一方、制御信号S5がマルチメディア装置107に伝送される信号である場合、本発明の一実施例に係る人工知能型マルチメディア装置の制御方法は、(c)段階後、ケア装置101の通信部113が、制御信号S5をマルチメディア装置107に印加する段階;をさらに含む。
ここで、通信部113は、近距離通信(short range communication)技術として、ブルートゥース(登録商標)(Bluetooth)、RFID(Radio Frequency Identification)、赤外線通信(IrDA、infrared Data Association)、UWB(Ultra Wideband)、ZigBeeなどを用いることができる。
一方、通信部113がマルチメディア装置107に印加する制御信号S5は、マルチメディア装置107のボリュームを下げたり消す制御信号であってもよい。
すなわち、ケア装置101の判断部109が、同時に印加された音声信号S1と音信号S3から音声信号S1のみの抽出が不可能であると判断した場合、制御部111は、マルチメディア装置107のボリュームを下げたり消す制御信号S5をマルチメディア装置107に印加し、マルチメディア装置107から出力される音信号S3の大きさ(ボリューム)を下げたり無音にすることによって、判断部109がユーザー105の音声信号S1に対して正確に把握及び判断できるようにする。
また、制御信号S5がユーザー105に伝送される信号である場合、本発明の一実施例に係る人工知能型マルチメディア装置の制御方法は、(c)段階後、ケア装置101のスピーカー部115が、制御信号S5を音響で送り出す段階;をさらに含む。
ここで、制御信号S5は、ユーザー105にマルチメディア装置107のボリュームを下げたり消すように案内する音声信号であってもよい。
すなわち、ケア装置101の判断部109が、同時に印加された音声信号S1と音信号S3から音声信号S1のみの抽出が不可能であると判断した場合、制御部111は、ユーザー105がマルチメディア装置107のボリュームを下げたり消すことができるように案内する音声信号(例として、「TVのボリュームを下げてください。」、「TVのボリュームを消してください。」などの案内音声)を生成するようになり、スピーカー部115が音響で制御信号S5を送り出すことによって、ユーザー105がマルチメディア装置107のボリュームを下げたり無音にすることができる。
これを通じて、判断部109は、ユーザー105の音声信号S1に対して正確に把握及び判断できるようになる。
もちろん、上述した通信部113及びスピーカー部115は、人工知能型ケア装置101に共に搭載されてもよく、それぞれ別個に搭載されてもよい。
一方、本発明の他の実施例に係る人工知能型マルチメディア装置の制御システムは、マルチメディアコンテンツを出力しながら音信号S3を生成するマルチメディア装置107;及びユーザー105の音声信号S1と音信号S3とを同時に受け取る入力部103と、同時に印加された音声信号S1と音信号S3から音声信号S1のみの抽出可不可を判断する判断部109と、音声信号S1のみの抽出が不可能である場合、マルチメディア装置107又はユーザー105に伝送される制御信号S5を生成する制御部111とを含む人工知能型ケア装置101;を含むことを特徴とする。
また、人工知能型ケア装置101は、制御信号S5がマルチメディア装置107に伝送される信号である場合、制御信号S5をマルチメディア装置107に印加する通信部113;をさらに含む。
このとき、制御信号S5は、マルチメディア装置107のボリュームを下げたり消す制御信号であってもよい。
そして、人工知能型ケア装置101は、制御信号S5がユーザー105に伝送される信号である場合、制御信号S5を音響で送り出すスピーカー部115;をさらに含む。
ここで、制御信号S5は、マルチメディア装置107のボリュームを下げたり消すように案内する音声信号であってもよい。
一方、上述した本発明の他の実施例に係る人工知能型マルチメディア装置の制御システムの各構成が有する機能及び特徴は、上述した人工知能型マルチメディア装置の制御方法と同一であるので、それについての具体的な説明は省略する。
以上で説明したように、本発明の実施例によると、マルチメディア装置の音信号とユーザーの音声信号とが同時に人工知能型ケア装置に印加されることによって、人工知能型ケア装置がユーザーの音声信号を正確に把握できないとき、人工知能型ケア装置が自らマルチメディア装置のボリュームを調節したり、ユーザーにボリューム調節に対する案内音声を送り出し、ユーザーがマルチメディア装置のボリュームを調節できるようになり、その結果、ユーザーの音声命令把握及び解釈の正確性を確保できるという効果がある。
以上では、本発明の実施例を構成する全ての構成要素が一つに結合されたり、結合されて動作することを説明したが、本発明が必ずしもこのような実施例に限定されるわけではない。すなわち、本発明の目的範囲内であれば、全ての構成要素が一つ以上に選択的に結合されて動作することもできる。
以上の説明は、本発明の技術思想を例示的に説明したものに過ぎなく、本発明の属する技術分野で通常の知識を有する者であれば、本発明の本質的な特性から逸脱しない範囲で多様な修正及び変形が可能である。よって、本発明に開示された各実施例は、本発明の技術思想を限定するためのものではなく、説明するためのものであり、このような実施例によって本発明の技術思想の範囲が限定されるわけではない。本発明の保護範囲は、下記の特許請求の範囲によって解釈しなければならなく、それと同等な範囲内にある全ての技術思想は、本発明の権利範囲に含まれる。
101 人工知能型ケア装置
103 入力部
105 ユーザー
107 マルチメディア装置
109 判断部
111 制御部
113 通信部
115 スピーカー部
S1 ユーザーの音声信号
S3 マルチメディア装置の音信号
S5 制御信号

Claims (10)

  1. (a)人工知能型ケア装置(101)の入力部(103)が、ユーザー(105)の音声信号(S1)と、マルチメディアコンテンツを出力するマルチメディア装置(107)の音信号(S3)と、を同時に受け取る段階;
    (b)前記ケア装置(101)の判断部(109)が、同時に印加された前記音声信号(S1)と前記音信号(S3)から前記音声信号(S1)のみの抽出可不可を判断する段階;及び、
    (c)前記音声信号(S1)のみの抽出が不可能である場合、前記ケア装置(101)の制御部(111)が、前記マルチメディア装置(107)又は前記ユーザー(105)に伝送される制御信号(S5)を生成する段階;を含む
    ことを特徴とする人工知能型マルチメディア装置の制御方法。
  2. 前記(c)段階において、前記制御信号(S5)が前記マルチメディア装置(107)に伝送される信号である場合、
    (d)前記ケア装置(101)の通信部(113)が、前記制御信号(S5)を前記マルチメディア装置(107)に印加する段階;をさらに含む
    請求項1に記載の人工知能型マルチメディア装置の制御方法。
  3. 前記(c)段階において、前記制御信号(S5)が前記ユーザー(105)に伝送される信号である場合、
    (d)前記ケア装置(101)のスピーカー部(115)が、前記制御信号(S5)を音響で送り出す段階;をさらに含む
    請求項1に記載の人工知能型マルチメディア装置の制御方法。
  4. 前記制御信号(S5)は、前記マルチメディア装置(107)のボリュームを下げたり消す制御信号である
    請求項2に記載の人工知能型マルチメディア装置の制御方法。
  5. 前記制御信号(S5)は、前記マルチメディア装置(107)のボリュームを下げたり消すように案内する音声信号である
    請求項3に記載の人工知能型マルチメディア装置の制御方法。
  6. マルチメディアコンテンツを出力しながら音信号(S3)を生成するマルチメディア装置(107);及び、
    ユーザー(105)の音声信号(S1)と前記音信号(S3)を同時に受け取る入力部(103)と、同時に印加された前記音声信号(S1)と音信号(S3)から前記音声信号(S1)のみの抽出可不可を判断する判断部(109)と、前記音声信号(S1)のみの抽出が不可能である場合、前記マルチメディア装置(107)又は前記ユーザー(105)に伝送される制御信号(S5)を生成する制御部(111)と、を含む人工知能型ケア装置(101);を含む
    ことを特徴とする人工知能型マルチメディア装置の制御システム。
  7. 前記人工知能型ケア装置(101)は、
    前記制御信号(S5)が前記マルチメディア装置(107)に伝送される信号である場合、前記制御信号(S5)を前記マルチメディア装置(107)に印加する通信部(113);をさらに含む
    請求項6に記載の人工知能型マルチメディア装置の制御システム。
  8. 前記人工知能型ケア装置(101)は、
    前記制御信号(S5)が前記ユーザー(105)に伝送される信号である場合、前記制御信号(S5)を音響で送り出すスピーカー部(115);をさらに含む
    請求項6に記載の人工知能型マルチメディア装置の制御システム。
  9. 前記制御信号(S5)は、前記マルチメディア装置(107)のボリュームを下げたり消す制御信号である
    請求項7に記載の人工知能型マルチメディア装置の制御システム。
  10. 前記制御信号(S5)は、前記マルチメディア装置(107)のボリュームを下げたり消すように案内する音声信号である
    請求項8に記載の人工知能型マルチメディア装置の制御システム。

JP2022527149A 2020-01-20 2020-11-03 人工知能型マルチメディア装置の制御方法及びシステム Pending JP2023501536A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR1020200007180A KR102355713B1 (ko) 2020-01-20 2020-01-20 인공지능형 멀티미디어장치 제어 방법 및 시스템
KR10-2020-0007180 2020-01-20
PCT/KR2020/015229 WO2021149898A1 (ko) 2020-01-20 2020-11-03 인공지능형 멀티미디어장치 제어 방법 및 시스템

Publications (1)

Publication Number Publication Date
JP2023501536A true JP2023501536A (ja) 2023-01-18

Family

ID=76993028

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022527149A Pending JP2023501536A (ja) 2020-01-20 2020-11-03 人工知能型マルチメディア装置の制御方法及びシステム

Country Status (4)

Country Link
US (1) US20230016799A1 (ja)
JP (1) JP2023501536A (ja)
KR (1) KR102355713B1 (ja)
WO (1) WO2021149898A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230077780A1 (en) * 2021-09-16 2023-03-16 International Business Machines Corporation Audio command corroboration and approval
KR102644559B1 (ko) * 2023-06-26 2024-03-08 주식회사 한길에이치씨 Uwb 기반의 음성안내장치 및 이를 이용한 지도 제공 서비스를 포함하는 음성안내시스템

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11126092A (ja) * 1997-10-22 1999-05-11 Toyota Motor Corp 音声認識装置および車両用音声認識装置
JP2014071124A (ja) * 2012-09-27 2014-04-21 Sharp Corp テレビ受信機、及びテレビ受信機の音声認識方法
JP2019036174A (ja) * 2017-08-17 2019-03-07 ヤフー株式会社 制御装置、入出力装置、制御方法、および制御プログラム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104951077A (zh) * 2015-06-24 2015-09-30 百度在线网络技术(北京)有限公司 基于人工智能的人机交互方法、装置和终端设备
KR102544250B1 (ko) * 2018-07-03 2023-06-16 삼성전자주식회사 소리를 출력하는 디바이스 및 그 방법
WO2020251074A1 (ko) * 2019-06-12 2020-12-17 엘지전자 주식회사 음성 인식 기능을 제공하는 인공 지능 로봇 및 그의 동작 방법
KR20190096307A (ko) * 2019-07-29 2019-08-19 엘지전자 주식회사 음성 인식 서비스를 제공하는 인공 지능 장치 및 그의 동작 방법
KR20190100117A (ko) * 2019-08-09 2019-08-28 엘지전자 주식회사 인공지능 기반의 홈 시어터 음성 제어 장치 및 방법
KR20190109341A (ko) * 2019-09-06 2019-09-25 엘지전자 주식회사 노이즈 관리가 가능한 전자기기 및 이의 제어 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11126092A (ja) * 1997-10-22 1999-05-11 Toyota Motor Corp 音声認識装置および車両用音声認識装置
JP2014071124A (ja) * 2012-09-27 2014-04-21 Sharp Corp テレビ受信機、及びテレビ受信機の音声認識方法
JP2019036174A (ja) * 2017-08-17 2019-03-07 ヤフー株式会社 制御装置、入出力装置、制御方法、および制御プログラム

Also Published As

Publication number Publication date
US20230016799A1 (en) 2023-01-19
KR20210094177A (ko) 2021-07-29
KR102355713B1 (ko) 2022-01-28
WO2021149898A1 (ko) 2021-07-29

Similar Documents

Publication Publication Date Title
US11527243B1 (en) Signal processing based on audio context
US10079017B1 (en) Speech-responsive portable speaker
KR102210433B1 (ko) 전자 장치 및 이의 음성 인식 방법
US10091545B1 (en) Methods and systems for detecting audio output of associated device
US20190311718A1 (en) Context-aware control for smart devices
KR102304052B1 (ko) 디스플레이 장치 및 그의 동작 방법
JP4837917B2 (ja) 音声に基づく装置制御
CN110870201A (zh) 音频信号调节方法、装置、存储介质及终端
JP2023501536A (ja) 人工知能型マルチメディア装置の制御方法及びシステム
EP3484183B1 (en) Location classification for intelligent personal assistant
CN109743618B (zh) 音乐播放方法、终端和计算机可读存储介质
US10062386B1 (en) Signaling voice-controlled devices
KR20210031141A (ko) 음성 인식을 통하여 인공지능 제어기술을 수행하는 전자 칠판
KR20090027817A (ko) 배경음 출력 방법 및 이를 이용하는 이동통신 단말기
Panek et al. Challenges in adopting speech control for assistive robots
KR102494051B1 (ko) 전자 장치 및 이의 음성 인식 방법
JP6559051B2 (ja) 発声機能を備えたロボット装置、発声制御方法およびプログラム
KR101934349B1 (ko) 휴대 단말기를 이용한 무선 마이크 구현 방법 및 그 휴대 단말기
KR102359163B1 (ko) 전자 장치 및 이의 음성 인식 방법
US11610596B2 (en) Adjustment method of sound output and electronic device performing the same
JP6759370B2 (ja) 呼出音認識装置および呼出音認識方法
KR102114102B1 (ko) 뉴럴 네트워크를 통한 음성 증폭 시스템
TWI662546B (zh) 聲音調整方法和系統
CN117133296A (zh) 显示设备及多路语音信号的混音处理方法
KR20210031249A (ko) 사물인터넷 기반의 원격 제어가 가능한 전자 칠판

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220511

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230420

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230425

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20231121