TWI603626B - 揚聲裝置、其控制方法及播放控制系統 - Google Patents

揚聲裝置、其控制方法及播放控制系統 Download PDF

Info

Publication number
TWI603626B
TWI603626B TW105112921A TW105112921A TWI603626B TW I603626 B TWI603626 B TW I603626B TW 105112921 A TW105112921 A TW 105112921A TW 105112921 A TW105112921 A TW 105112921A TW I603626 B TWI603626 B TW I603626B
Authority
TW
Taiwan
Prior art keywords
facial
speaker
module
data
processing unit
Prior art date
Application number
TW105112921A
Other languages
English (en)
Other versions
TW201739267A (zh
Inventor
黃俊堯
乎曼 薩馬尼
周玉庭
Original Assignee
音律電子股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 音律電子股份有限公司 filed Critical 音律電子股份有限公司
Priority to TW105112921A priority Critical patent/TWI603626B/zh
Priority to CN201610603020.7A priority patent/CN107318071A/zh
Application granted granted Critical
Publication of TWI603626B publication Critical patent/TWI603626B/zh
Publication of TW201739267A publication Critical patent/TW201739267A/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R9/00Transducers of moving-coil, moving-strip, or moving-wire type
    • H04R9/06Loudspeakers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/017Gesture based interaction, e.g. based on a set of recognized hand gestures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • User Interface Of Digital Computer (AREA)

Description

揚聲裝置、其控制方法及播放控制系統
本發明是有關於一種揚聲裝置,且特別是有關於一種控制其底座進行運動行為的揚聲裝置、其控制方法及播放控制系統。
由於喜愛音樂是人類的自然天性,因此揚聲裝置(俗稱喇叭)亦成為多數人在日常生活中不可缺少的物品之一。而隨著資訊科技的快速演進,現今的揚聲裝置不僅能播放音樂,更能與使用者互動,從而增添生活體驗。
各式各樣具有智慧功能的揚聲裝置陸續在市場上推出,部份商品甚至具有娛樂功能。例如,具有特定造型(例如,動物、植物等)的揚聲裝置可透過發光二極體(light-emitting diode;LED)隨著音樂的節拍及節奏而變化。部份揚聲裝置亦可隨著音樂節拍滾動及開闔、搖晃其他部件。由此可知,聽音樂不再是單純的被動行為,使用者可透過與揚聲裝置來與日常生活結合,從而提昇生活品質及體驗。
本發明提供一種揚聲裝置、其控制方法及播放控制系統,其可追蹤使用者以改變揚聲模組的朝向,並提供更多且方便的控制操作。
本發明提供一種揚聲裝置,其包括影像擷取單元、儲存單元、揚聲模組、馬達模組及處理單元。影像擷取單元用於擷取影像。儲存單元用以儲存臉部資料。馬達模組耦接揚聲模組,且驅動揚聲模組的底座進行運動行為。處理單元耦接影像擷取單元、儲存單元、揚聲模組及馬達模組。處理單元依據臉部資料比對影像中的臉部物件,依據比對結果及臉部物件與揚聲模組的相對距離選擇臉部物件中的追蹤物件,且控制馬達模組以驅動揚聲模組的底座隨著追蹤物件進行運動行為。
在本發明的一實施例中,上述的臉部資料包括對應於人員的臉部資訊。而處理單元判斷臉部物件是否符合這些人員的臉部資訊,且自符合這些人員的臉部資訊之臉部物件中選擇與揚聲模組的相對距離為最接近的一者作為追蹤物件。
在本發明的一實施例中,上述的運動行為包括揚聲模組動態朝向追蹤物件對應之人員。馬達模組驅動揚聲模組的底座進行旋轉行為及移動行為中的至少一者。
在本發明的一實施例中,上述的儲存單元更儲存手勢資料。而處理單元依據手勢資料比對影像中的手部物件,且依據比對結果控制對多媒體檔案的播放操作。
在本發明的一實施例中,上述的揚聲裝置更包括通訊模組。通訊模組耦接處理單元。處理單元透過通訊模組接收控制訊號,且依據控制訊號控制對多媒體檔案的播放操作。
在本發明的一實施例中,上述的控制訊號反應於行動裝置的動態操作。
在本發明的一實施例中,上述的處理單元透過通訊模組接收人員影像,且將人員影像作為臉部資料之依據。
在本發明的一實施例中,上述的揚聲裝置更包括顯示模組。顯示模組耦接處理單元。處理單元依據揚聲裝置的操作狀態,透過顯示模組呈現對應的提示訊息。
另一觀點而言,本發明提供一種揚聲裝置的控制方法。此揚聲裝置包括揚聲模組。其控制方法包括下列步驟。擷取影像。依據臉部資料比對影像中的臉部物件。依據比對結果及臉部物件與揚聲模組的相對距離選擇臉部物件中的追蹤物件。驅動揚聲模組的底座隨著追蹤物件進行運動行為。
在本發明的一實施例中,上述的臉部資料包括對應於人員的臉部資訊。而依據比對結果及臉部物件與揚聲模組的相對距離選擇臉部物件中的追蹤物件包括下列步驟。判斷臉部物件是否符合那些人員的臉部資訊。自符合人員的臉部資訊之臉部物件中選擇與揚聲模組的相對距離為最接近的一者作為追蹤物件。
在本發明的一實施例中,上述的運動行為包括揚聲模組動態朝向追蹤物件對應之人員。驅動揚聲模組的底座隨著追蹤物件進行運動行為包括下列步驟。驅動揚聲模組的底座進行旋轉行為及移動行為中的至少一者。
在本發明的一實施例中,更包括下列步驟。依據手勢資料比對影像中的手部物件,且依據比對結果控制對多媒體檔案的播放操作。
在本發明的一實施例中,更包括下列步驟。接收控制訊號。依據此控制訊號控制對多媒體檔案的播放操作。
在本發明的一實施例中,上述接收該控制訊號之前,更包括下列步驟。反應於行動裝置的動態操作而產生控制訊號。
在本發明的一實施例中,更包括下列步驟。接收人員影像。將人員影像作為臉部資料之依據。
在本發明的一實施例中,更包括下列步驟。依據揚聲裝置的操作狀態,呈現對應的提示訊息。
此外,本發明亦提供一種播放控制系統,其包括行動裝置及揚聲裝置。行動裝置感測其動態操作,且產生對應於動態操作的控制訊號。揚聲裝置包括揚聲模組。此揚聲模組擷取影像,依據臉部資料比對影像中的臉部物件,依據比對結果及臉部物件與揚聲模組的相對距離選擇臉部物件中的追蹤物件,驅動揚聲模組的底座隨著追蹤物件進行運動行為。此外,揚聲裝置接收控制訊號,並依據控制訊號控制對多媒體檔案的播放操作。
在本發明的一實施例中,上述的行動裝置擷取人員影像,且傳送人員影像至揚聲裝置。而揚聲裝置將人員影像作為臉部資料之依據。
基於上述,本發明實施例所提出的揚聲裝置、其控制方法及播放控制系統,其能透過影像辨識來追蹤使用者以改變揚聲模組的播放方向,從而為使用者提供更佳的音質體驗。此外,本發明實施例亦可依據使用者的手勢操作或對應於行動裝置的動態操作,來對多媒體檔案的播放操作進行控制。藉此,使用者可更方便地操控多媒體檔案的播放行為。
為讓本發明的上述特徵和優點能更明顯易懂,下文特舉實施例,並配合所附圖式作詳細說明如下。
圖1是依據本發明一實施例說明播放控制系統的方塊圖。請參照圖1,播放控制系統10包括揚聲裝置100及行動裝置150。
揚聲裝置100包括(但不僅限於)影像擷取單元101、儲存單元103、揚聲模組104、馬達模組105、通訊模組107、顯示模組108及處理單元109。
影像擷取單元101可以是電荷耦合元件(Charge coupled device;CCD)鏡頭、互補式金氧半電晶體(Complementary metal oxide semiconductor transistors;CMOS)鏡頭、或紅外線鏡頭的攝影機、照相機。影像擷取單元101用以擷取影像。
儲存單元103可以是任何型態的固定或可移動隨機存取記憶體(random access memory,RAM)、唯讀記憶體(read-only memory,ROM)、快閃記憶體(flash memory)或類似元件或上述元件的組合。在本實施例中,儲存單元103係用以儲存影像、人員影像、臉部資料、手勢資料、程式碼、裝置組態、緩衝的或永久的資料。
揚聲模組104至少包括(但不僅限於)軀殼、底座、至少一個揚聲單體、訊號接頭等元件。馬達模組105可以是伺服馬達(servomotor),且包括至少一個伺服馬達。馬達模組105中的各伺服馬達分別具有與揚聲模組104之底座耦接的支架。其伺服馬達可用於分別控制諸如上下及/或左右方向的旋轉及移動,從而帶動支架對揚聲模組104之底座進行旋轉行為及移動行為中的至少一者。馬達模組105可透過諸如一般用途輸入輸出(General Purpose Input/ Output;GPIO)、通用非同步收發傳輸器(Universal Asynchronous Receiver/Transmitter;UART)、通用序列匯流排(Universal Serial Bus;USB)等傳輸介面與處理單元109連結。馬達模組105受控於處理單元109,且可朝向特定方向進行轉動。
通訊模組107可以是至少支援藍牙、WiFi、紅外線等技術中的一者無線通訊元件。而本發明較佳的實施例是,通訊模組107採用藍牙模組,然不以此為限。舉例而言,在藍牙技術的實現上,通訊模組107可利用射頻通訊(radio frequency communication;RFCOMM)協定,並建立邏輯鏈路控制和適配協定(Logical Link Control and Adaptation Protocol;L2CAP)通道,以傳送藍牙封包。
顯示模組108可以是液晶顯示器(Liquid Crystal Display;LCD)、至少一個發光二極體(Light-Emitting Diode;LED)顯示燈、場發射顯示器(Field Emission Display;FED)。而本發明較佳的實施例是,顯示模組108採用發光二極體,且可以不同頻率、顏色、亮度呈現提示訊息。
處理單元109的功能可藉由使用諸如中央處理單元(central processing unit;CPU)、微處理器、微控制器、數位信號處理(digital signal processing;DSP)晶片、場可程式化邏輯閘陣列(Field Programmable Gate Array;FPGA)等可程式化單元來實施。處理單元109的功能亦可用獨立電子裝置或積體電路(integrated circuit;IC)實施,且處理單元109亦可用硬體或軟體實施。處理單元109耦接影像擷取單元101、儲存單元103、揚聲模組104、馬達模組105、通訊模組107及顯示模組108。在本發明實施例中,處理單元109用以控制揚聲裝置100的所有操作,且可執行嵌入式作業系統(例如,Linux、Ubuntu、Android、Windows等)。
舉例而言,圖2是一範例說明揚聲裝置的實施示意圖,然本發明不以此為限。請參照圖2中的正視圖及側視圖,揚聲裝置200以圓球體設計作為揚聲模組204的軀殼。此軀殼上亦裝設相機201及發光二極體顯示燈208。揚聲模組204的底座具有支架與下方機體結合。揚聲裝置200可透過其馬達模組(未繪示)控制這些支架,以使揚聲模組204的振膜(發聲處)朝向(發聲方向)不同方向。
另一方面,行動裝置150可以是智慧型手機或平板電腦等電子裝置。行動裝置150包括(但不僅限於)感測模組153、影像擷取單元151、通訊模組157及處理單元159。
感測模組153至少包括重力感測器、加速度計(accelerometer)、陀螺儀(gyroscope )、電子羅盤(electronic Compass)、地磁感測器(geomagnetic sensor)等感測器的其中之一或其組合。感測模組153用以感測行動裝置150的動態操作。此動態操作可以是向上、向下、向右、向左翻轉、旋轉、搖晃等其中之一或其組合。
影像擷取單元151、通訊模組157及處理單元159的實施範例可參考前述針對揚聲裝置100中影像擷取單元101、通訊模組107及處理單元109的詳細說明,於此不再贅述。值得說明的是,通訊模組107及157使用相同或相符的無線通訊技術,以便揚聲裝置100及行動裝置150彼此進行資料傳輸。而處理單元159耦接影像擷取單元151、感測模組153及通訊模組157,且用以控制行動裝置150的所有操作。
為了方便理解本發明實施例的操作流程,以下將舉諸多實施例詳細說明本發明實施例中揚聲裝置100與行動裝置150之間運作的流程。下文中,將搭配揚聲裝置100及行動裝置150中的各項元件及模組進行說明。
圖3是依據本發明一實施例說明一種揚聲裝置100之控制方法的流程圖。請參照圖3,在步驟S310中,處理單元109透過影像擷取單元101擷取一或多張影像。影像擷取單元101可依據特定拍攝頻率(例如,每秒3、5、20張等)或不定時進行拍攝作業,並將擷取的影像儲存於儲存單元103中。
在其他實施例中,處理單元109亦可事先設定啟動條件。當符合此啟動條件時,處理單元109可致能影像擷取單元101來擷取人員的影像。例如,揚聲裝置100設置感測器,利用感測器來偵測是否有人員位於影像擷取單元101可擷取影像的範圍內,並據以致能影像擷取單元101開始擷取影像。另外,揚聲裝置100上亦可設置啟動開關,且當開啟此啟動開關時,處理單元109才啟動影像擷取單元101。需說明的是,上述僅為舉例說明,本發明並不以此為限。
接著,由處理單元109開始透過對上述影像的各張影像進行影像辨識程序。在步驟S330中,處理單元109依據臉部資料比對影像中的臉部物件。具體而言,處理單元109可自儲存單元103中取得臉部資料。此臉部資料包括對應於一或多位人員的臉部資訊(例如,眼睛、鼻子、膚色等臉部特徵)。需說明的是,依據儲存單元103的容量限制,可紀錄之人員的數量(例如,5、10、100個)可能不同。
本發明實施例可利用諸如適應性增強(Adaptive Boosting;AdaBoost)學習演算法、Haar串聯(cascade)分類器、局部二值模式(Local Binary Pattern;LBP)、特徵匹配(feature matching)、加速強健特徵(speeded-up robust features;SURF)、尺度不變特徵轉換(Scale Invariant feature transformation;SIFT)、有向梯度直方圖(Histogram of orientation;HoG)、主成份分析(Principal Component Analysis;PCA)、獨立成份分析(Independent Component Analysis;ICA)等影像辨識演算法來獲得各影像中的臉部物件,並對偵測到的臉部物件與人員的臉部資訊進行比對,以判斷臉部物件是否符合紀錄的人員。
需說明的是,處理單元109亦可透過通訊模組105接收來自行動裝置150的人員影像,且將人員影像作為臉部資料之依據。換句而言,行動裝置150之處理單元159透過影像擷取單元151對人員擷取人員影像後,可透過通訊模組157(例如,藍牙封包、WiFi封包等)傳送此人員影像至揚聲裝置100。處理單元109便可依據接收的人員影像產生對應的臉部資訊(例如,臉部特徵),以儲存作為臉部資料。
在步驟S350中,處理單元109依據比對結果及臉部物件與揚聲模組104的相對距離選擇臉部物件中的追蹤物件。在本實施中,處理單元109判斷臉部物件是否符合那些人員的臉部資訊,且自符合人員的臉部資訊之臉部物件中選擇與揚聲模組104的相對距離為最接近的一者作為追蹤物件。
具體而言,本發明實施例的揚聲裝置100是設計為反應於紀錄的人員,因此處理單元109需要先判斷影像中是否出現已紀錄之人員。若臉部物件符合這些人員之中的臉部資訊,則繼續進行後續步驟。反之,處理單元109會持續偵測臉部物件。
由於影像中可能偵測出不只一個臉部物件(即,不只一位使用者),因此處理單元109會自符合的臉部資料的臉部物件中挑選一者作為追蹤物件。處理單元109可計算符合的臉部資料的臉部物件與揚聲模組104的相對距離(例如,使用者與揚聲模組104或揚聲裝置100的相對距離)。例如,處理單元109依據臉部資訊所紀錄原人臉面積、臉寬、臉長、眼寬等距離或面積資訊與影像中對應臉部物件的距離或面積資訊來推算相對距離。而在本實施例中,處理單元109會挑選相對距離為最近的一者(即,最接近揚聲模組104或揚聲裝置100的使用者)作為追蹤物件。
在另一實施例中,處理單元109亦可對人員的臉部資訊設定優先權,且將判斷出符合的臉部物件中具有特定優先權(例如,最高、最低、平均優先權)的一者作為追蹤物件。在其他實施例中,處理單元109亦可選擇具有膚色最白、眼睛最大等特定臉部特徵的臉部物件作為追蹤物件,且不以此為限。另一方面,若處理單元109僅偵測出一個臉部物件,則將此臉部物件直接作為追蹤物件。
在步驟S370中,處理單元109控制馬達模組105以驅動揚聲模組104的底座隨著追蹤物件進行運動行為。在本實施例中,運動行為包括揚聲模組104動態朝向追蹤物件對應之人員。而馬達模組105可驅動揚聲模組104的底座進行旋轉行為及移動行為中的至少一者。
具體而言,處理單元109可使用馬達控制相關函式庫進行設定及控制,且載入馬達控制程式碼來控制馬達模組105的轉動方向、角度、移動距離等。處理單元109可計算影像的中心點與追蹤物件之間的影像距離,並依據此影像距離與前述相對距離,來推算影像擷取單元101的拍攝方向與其朝向追蹤物件對應之人員的方向之間的夾角。處理單元109便可依據此夾角來控制馬達模組105的轉動方向、角度,從而帶動揚聲模組104之底座。依據不同設計需求,處理單元109亦可上下左右移動揚聲模組104之底座,以使揚聲模組104更接近使用者。
需說明的是,在實際應用上,影像擷取單元101的拍攝方向可設定成與揚聲模組104之發聲方向(例如,揚聲單體之振膜的法線方向)相同,以方便控制揚聲模組104之發聲方向。或者,拍攝方向與發聲方向之間的夾角度可紀錄於儲存單元103中,以控制馬達模組105之依據。此外,處理單元109可依據調整週期(例如,每秒1、3、5次)來調整馬達模組105的轉動方向、角度、移動方向及距離等,以達到動態調整之目的。據此,本發明實施例並能讓使用者隨時享有最佳音質的體驗。
除了轉動或移動揚聲模組104,本發明亦可針對多媒體檔案(例如,音樂、有聲書等)之播放操作進行控制。圖4是依據本發明另一實施例說明一種揚聲裝置100之控制方法的流程圖。請參照圖4,在步驟S410中,處理單元109透過影像擷取單元101擷取一或多張影像。步驟S410可參考圖3中步驟S310的說明,於此不再贅述。
接著,由處理單元109開始透過對上述影像序列的各張影像進行影像辨識程序。在步驟S430中,處理單元109依據手勢資料比對影像中的手部物件。具體而言,本發明實施例可利用諸如顏色辨識法、平方擬合(square-fitting)法、背景濾除(Background subtraction)法、樣本匹配(template matching)法等演算法來偵測手部物件。
處理單元109可自儲存單元103中取得手勢資料。此手勢資料可包括諸如輪廓、顏色、背景、位置等手掌甚至手臂等手部特徵,更包括特定手勢、位置、方向等對應的播放操作(例如,音量提昇及下降、切換上一首及下一首歌、快轉、停止、播放、暫停等)。處理單元109可依據手勢資料判斷影像中當前手部物件的動作、位置或手勢是否符合。
舉例而言,假設處理單元109採用樣本匹配法結合象限法。處理單元109可在影像中找出手掌(即,手部物件),並以手掌位置為中心,找出以手掌為中心的四個象限。例如,圖5是一範例說明四個象限的界定。請參照圖5,以首次偵測到之手掌位置501為中心,在影像中區分為四個象限。第1象限為音量提昇手勢,第2象限為下一首樂曲,第3象限為音量下降,第4象限為上一首樂曲。
需說明的是,依據不同設計需求,手勢資料可能是手掌搖晃、翻轉、伸出一或多根手指、手指形成形狀等,本發明不加以限制。
在步驟S450中,處理單元109依據比對結果控制對多媒體檔案的播放操作。以圖5為例,每隔一秒,處理單元109會判斷當前手掌位置落於四個象限中的何者,並據以對多媒體檔案進行控制(即,執行對應的播放操作)。例如,第2秒時,處理單元109判斷當前手掌位置落於第3象限,則將音量下降一階層(level)。
需說明的是,依據不同設計需求,各種手勢對應的播放操作可能不同(例如,手掌向右翻轉為快轉、手掌開闔為停止等),且本發明不加以限制。據此,本發明可為多媒體檔案帶來新穎的控制機制。
此外,本發明實施例的揚聲裝置100更可與行動裝置150進行互動。圖6是依據本發明另一實施例說明一種揚聲裝置100與行動裝置150之互動方法的流程圖。請參照圖6,在步驟S610中,行動裝置150的處理單元159透過感測模組153感測行動裝置150的動態操作(例如,揮動、旋轉、位移、拍動、搖晃等)。
感測模組153可偵測諸如加速度、速度、磁場、方向等感測資料。處理單元159可依據分析週期(例如,每秒1次、每3、5秒1次等),來分析此分析週期內容所有感測資料,並據以判斷對應的動態操作。例如,動態操作可以是行動裝置150向上下左右揮動(分別對應於感測資料中加速度規之Y值大於7、小於-5、X值小於-3、大於3)。
在步驟S630中,反應於行動裝置150的動態操作,處理單元159產生對應於動態操作的控制訊號。具體而言,處理單元159可定義不同動態操作對應的播放操作。例如,行動裝置150向上揮動為提高音量,向下揮動為降低音量,向左揮動為前一首歌曲,向右揮動為下一首歌曲。處理單元159可將偵測的動態操作所對應之播放操作作為控制資訊,且將控制資訊加入至控制訊號(例如,藍牙封包、WiFi封包等)中。接著,處理單元159透過通訊模組157發送至控制訊號。
需說明的是,依據不同設計需求,各種動態操作對應的播放操作可能不同(例如,行動裝置150旋轉一圈為快轉、行動裝置150上下揮動兩次為暫停等),且本發明不加以限制。
在步驟S650中,揚聲模組100的處理單元109透過通訊模組107接收來自行動裝置150的控制訊號。在步驟S670中,處單元109可依據此控制訊號控制對多媒體檔案的播放操作。具體而言,處理單元109可自控制訊號中取得控制資訊,且可依據此控制資訊得知對應的播放操作,從而對當前播放之多媒體檔案進行控制。據此,本發明可為揚聲裝置100帶來新穎的互動控制機制。
此外,行動裝置150亦可裝載應用程式,且透過處理單元159執行此應用程式,並透過顯示模組(未繪示)呈現使用者介面以供使用者操作。此應用程式可提供對於揚聲裝置100之控制及設定操作(例如,多媒體檔案之播放操作、人員影像之輸入、影像辨識參數設定等)。處理單元159可接收使用者介面上的操作,判斷對應的控制及設定操作,且將此控制及設定操作作為控制資訊加入至控制訊號中。揚聲裝置100透過通訊模組107接收此控制訊號後,便可依據控制資訊來進行控制或設定。
另一方面,為了讓使用者能得知揚聲裝置100當前的操作狀態,在另一實施例中,處理單元109可依據揚聲裝置100的操作狀態(例如,電量、影像辨識狀態、通訊傳輸狀態、多媒體檔案之播放狀態等),透過顯示模組108呈現對應的提示訊息(例如,不同頻率、顏色、亮度、影像畫面等)。舉例而言,揚聲裝置100配置諸如圖2之發光二極體顯示燈208,且此發光二極體顯示燈208可呈現不同閃爍及顏色(即,提示訊息)。
表(1)是一範例表示發光二極體顯示燈208之顯示燈號與對應揚聲裝置100的操作狀態。 表(1) <TABLE border="1" borderColor="#000000" width="85%"><TBODY><tr><td> 顯示燈號 </td><td> 操作狀態 </td></tr><tr><td> 藍色 </td><td> 辨識手勢 </td></tr><tr><td> 綠色(漸亮) </td><td> 聲音變大 </td></tr><tr><td> 綠色(漸暗) </td><td> 聲音變小 </td></tr><tr><td> 綠色(閃爍) </td><td> 臉部偵測成功 </td></tr><tr><td> 紅色 </td><td> 等待藍牙連結 </td></tr></TBODY></TABLE>
需說明的是,依據不同設計需求,不同顯示模組108之規格可決定呈現訊息的種類、數量及樣式,且本發明不加以限制。
綜上所述,本發明實施例所述之揚聲裝置、其控制方法及播放控制系統,其透過影像辨識來尋找出影像中已紀錄且最接近揚聲裝置之臉部物件,從而控制揚聲裝置之底座,以讓揚聲裝置之發聲方向動態朝向某一使用者。藉此,便能有效提昇音質體驗。此外,本發明實施例亦提供手勢辨識及行動裝置動態操作之控制,以對多媒體檔案的播放操作進行控制。行動裝置亦可反應於使用者之操作而遠端控制揚聲裝置。藉此,可為揚聲裝置100帶來新穎的互動控制機制。
雖然本發明已以實施例揭露如上,然其並非用以限定本發明,任何所屬技術領域中具有通常知識者,在不脫離本發明的精神和範圍內,當可作些許的更動與潤飾,故本發明的保護範圍當視後附的申請專利範圍所界定者為準。
10‧‧‧播放控制系統
100、200‧‧‧揚聲裝置
101、151‧‧‧影像擷取單元
103‧‧‧儲存單元
104、204‧‧‧揚聲模組
105‧‧‧馬達模組
107、157‧‧‧通訊模組
108‧‧‧顯示模組
109、159‧‧‧處理單元
150‧‧‧行動裝置
153‧‧‧感測模組
201‧‧‧相機
208‧‧‧發光二極體顯示燈
S310~S370、S410~S450、S610~S670‧‧‧步驟
501‧‧‧手掌位置
圖1是依據本發明一實施例說明播放控制系統的方塊圖。 圖2是一範例說明揚聲裝置的實施示意圖。 圖3是依據本發明一實施例說明一種揚聲裝置之控制方法的流程圖。 圖4是依據本發明另一實施例說明一種揚聲裝置之控制方法的流程圖。 圖5是一範例說明四個象限的界定。 圖6是依據本發明另一實施例說明一種揚聲裝置與行動裝置之互動方法的流程圖。
S310~S370‧‧‧步驟

Claims (18)

  1. 一種揚聲裝置,包括:一影像擷取單元,擷取至少一影像;一儲存單元,儲存一臉部資料一揚聲模組;一馬達模組,耦接該揚聲模組,且驅動該揚聲模組的底座進行一運動行為;以及一處理單元,耦接該影像擷取單元、該儲存單元、該揚聲模組及該馬達模組,其中該處理單元依據該臉部資料比對該至少一影像中的至少一臉部物件,以判斷該至少一臉部物件是否符合該臉部資料,並選擇該至少一臉部物件中的一追蹤物件,且控制該馬達模組以驅動該揚聲模組的該底座隨著該追蹤物件進行該運動行為,其中當符合該臉部資料的臉部物件的數量為一個,該處理單元依據比對結果選擇符合該臉部資料的該臉部物件為該追蹤物件,其中當符合該臉部資料的臉部物件的數量為多個,該處理單元依據該比對結果以及符合該臉部資料的該些臉部物件與該揚聲模組的相對距離選擇該些臉部物件的其中之一為該追蹤物件。
  2. 如申請專利範圍第1項所述的揚聲裝置,其中該臉部資料包括對應於多個人員的臉部資訊,而該處理單元判斷該至少一臉部物件是否符合該些人員的該臉部資訊,且自符合該些人員的 該臉部資訊之臉部物件中選擇與該揚聲模組的該相對距離為最接近的一者作為該追蹤物件。
  3. 如申請專利範圍第1項所述的揚聲裝置,其中該運動行為包括該揚聲模組動態朝向該追蹤物件對應之人員,且該馬達模組驅動該揚聲模組的該底座進行旋轉行為及移動行為中的至少一者。
  4. 如申請專利範圍第1項所述的揚聲裝置,其中該儲存單元更儲存一手勢資料,而該處理單元依據該手勢資料比對該至少一影像中的一手部物件,且依據比對結果控制對一多媒體檔案的播放操作。
  5. 如申請專利範圍第1項所述的揚聲裝置,更包括:一通訊模組,耦接該處理單元,其中該處理單元透過該通訊模組接收一控制訊號,且依據該控制訊號控制對一多媒體檔案的播放操作。
  6. 如申請專利範圍第5項所述的揚聲裝置,其中該控制訊號反應於一行動裝置的一動態操作。
  7. 如申請專利範圍第5項所述的揚聲裝置,其中該處理單元透過該通訊模組接收至少一人員影像,且將該至少一人員影像作為該臉部資料之依據。
  8. 如申請專利範圍第1項所述的揚聲裝置,更包括:一顯示模組,耦接該處理單元,其中該處理單元依據該揚聲裝置的操作狀態,透過該顯示模組呈現對應的提示訊息。
  9. 一種揚聲裝置的控制方法,其中該揚聲裝置包括一揚聲模組,該控制方法包括:擷取至少一影像;依據一臉部資料比對該至少一影像中的至少一臉部物件,以判斷該至少一臉部物件是否符合該臉部資料;選擇該至少一臉部物件中的一追蹤物件;以及驅動該揚聲模組的底座隨著該追蹤物件進行一運動行為,其中當符合該臉部資料的臉部物件的數量為一個,依據比對結果選擇符合該臉部資料的該臉部物件為該追蹤物件,其中當符合該臉部資料的臉部物件的數量為多個,依據該比對結果以及符合該臉部資料的該些臉部物件與該揚聲模組的相對距離選擇該些臉部物件的其中之一為該追蹤物件。
  10. 如申請專利範圍第9項所述的控制方法,其中該臉部資料包括對應於多個人員的臉部資訊,而選擇該至少一臉部物件中的該追蹤物件的步驟包括:判斷該至少一臉部物件是否符合該些人員的該臉部資訊;以及自符合該些人員的該臉部資訊之臉部物件中選擇與該揚聲模組的該相對距離為最接近的一者作為該追蹤物件。
  11. 如申請專利範圍第9項所述的控制方法,其中該運動行為包括該揚聲模組動態朝向該追蹤物件對應之人員,且驅動該揚聲模組的底座隨著該追蹤物件進行該運動行為的步驟包括: 驅動該揚聲模組的該底座進行旋轉行為及移動行為中的至少一者。
  12. 如申請專利範圍第9項所述的控制方法,更包括:依據一手勢資料比對該至少一影像中的一手部物件,且依據比對結果控制對一多媒體檔案的播放操作。
  13. 如申請專利範圍第9項所述的控制方法,更包括:接收一控制訊號;以及依據該控制訊號控制對一多媒體檔案的播放操作。
  14. 如申請專利範圍第13項所述的控制方法,其中在接收該控制訊號之前,更包括:反應於一行動裝置的一動態操作而產生該控制訊號。
  15. 如申請專利範圍第13項所述的控制方法,更包括:接收至少一人員影像;以及將該至少一人員影像作為該臉部資料之依據。
  16. 如申請專利範圍第9項所述的控制方法,更包括:依據該揚聲裝置的操作狀態,呈現對應的提示訊息。
  17. 一種播放控制系統,包括:一行動裝置,感測該行動裝置的一動態操作,且產生對應於該動態操作的一控制訊號;以及一揚聲裝置,包括一揚聲模組,其中該揚聲模組擷取至少一影像,依據一臉部資料比對該至少一影像中的至少一臉部物件,以判斷該至少一臉部物件是否符合該臉部資料,並選擇該至少一 臉部物件中的一追蹤物件,驅動該揚聲模組的底座隨著該追蹤物件進行一運動行為,且接收該控制訊號,並依據該控制訊號控制對一多媒體檔案的播放操作,其中當符合該臉部資料的臉部物件的數量為一個,該揚聲模組依據比對結果選擇符合該臉部資料的該臉部物件為該追蹤物件,其中當符合該臉部資料的臉部物件的數量為多個,該揚聲模組依據該比對結果以及符合該臉部資料的該些臉部物件與該揚聲模組的相對距離選擇該些臉部物件的其中之一為該追蹤物件。
  18. 如申請專利範圍第17項所述的播放控制系統,其中該行動裝置擷取至少一人員影像,且傳送該至少一人員影像至該揚聲裝置,而該揚聲裝置將該至少一人員影像作為該臉部資料之依據。
TW105112921A 2016-04-26 2016-04-26 揚聲裝置、其控制方法及播放控制系統 TWI603626B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
TW105112921A TWI603626B (zh) 2016-04-26 2016-04-26 揚聲裝置、其控制方法及播放控制系統
CN201610603020.7A CN107318071A (zh) 2016-04-26 2016-07-28 扬声装置、其控制方法及播放控制系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW105112921A TWI603626B (zh) 2016-04-26 2016-04-26 揚聲裝置、其控制方法及播放控制系統

Publications (2)

Publication Number Publication Date
TWI603626B true TWI603626B (zh) 2017-10-21
TW201739267A TW201739267A (zh) 2017-11-01

Family

ID=60185399

Family Applications (1)

Application Number Title Priority Date Filing Date
TW105112921A TWI603626B (zh) 2016-04-26 2016-04-26 揚聲裝置、其控制方法及播放控制系統

Country Status (2)

Country Link
CN (1) CN107318071A (zh)
TW (1) TWI603626B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI672042B (zh) * 2018-06-20 2019-09-11 崑山科技大學 智慧型商品介紹系統及其方法
CN109640221B (zh) * 2019-01-18 2021-01-12 云谷(固安)科技有限公司 一种智能音箱及其控制方法
KR20230004191A (ko) * 2021-06-30 2023-01-06 엘지디스플레이 주식회사 음향 장치와 이를 포함하는 음향 시스템

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1393591A2 (en) * 2000-11-16 2004-03-03 Koninklijke Philips Electronics N.V. Automatically adjusting audio system
US20050159955A1 (en) * 2002-05-14 2005-07-21 Martin Oerder Dialog control for an electric apparatus
JP5396769B2 (ja) * 2008-08-04 2014-01-22 セイコーエプソン株式会社 音声出力制御装置、音声出力装置、音声出力制御方法、及び、プログラム
CN102025945A (zh) * 2009-09-16 2011-04-20 宏碁股份有限公司 电子装置及其控制方法
CN102455799B (zh) * 2010-12-06 2014-12-31 深圳市同洲电子股份有限公司 移动终端控制数字电视接收终端的方法、装置和系统
CN103167375A (zh) * 2011-12-13 2013-06-19 新昌有限公司 人脸辨识喇叭装置及其声音指向调整方法
TWI454966B (zh) * 2012-04-24 2014-10-01 Wistron Corp 手勢控制方法及手勢控制裝置
CN103914126A (zh) * 2012-12-31 2014-07-09 腾讯科技(深圳)有限公司 一种多媒体播放器控制方法和装置
CN104375627B (zh) * 2013-08-15 2018-02-27 联想(北京)有限公司 一种调节音量的方法及装置

Also Published As

Publication number Publication date
TW201739267A (zh) 2017-11-01
CN107318071A (zh) 2017-11-03

Similar Documents

Publication Publication Date Title
US20160162039A1 (en) Method and system for touchless activation of a device
CN112532865B (zh) 慢动作视频拍摄方法及电子设备
CN108958610A (zh) 基于人脸的特效生成方法、装置和电子设备
JP4384240B2 (ja) 画像処理装置、画像処理方法、画像処理プログラム
US9226330B2 (en) Wireless motion activated user device with bi-modality communication
CN108052079A (zh) 设备控制方法、装置、设备控制装置及存储介质
WO2019024717A1 (zh) 防伪处理方法及相关产品
US11748968B2 (en) Target tracking method and system, readable storage medium, and mobile platform
JP2021516836A (ja) アプリケーションシーンにおけるインタラクティブ方法並びにその方法を実行するモバイル端末及びコンピュータプログラム
US9412190B2 (en) Image display system, image display apparatus, image display method, and non-transitory storage medium encoded with computer readable program
TWI603626B (zh) 揚聲裝置、其控制方法及播放控制系統
KR102708717B1 (ko) 특정 순간에 관한 사진 또는 동영상을 자동으로 촬영하는 디바이스 및 그 동작 방법
KR20150083445A (ko) 이벤트에 근거하여 형상을 자동으로 변경하기 위한 방법 및 전자 장치
TWI691864B (zh) 智慧型機器人
US11151398B2 (en) Anti-counterfeiting processing method, electronic device, and non-transitory computer-readable storage medium
US20240126375A1 (en) Gesture recognition device and method for sensing multi-factor assertion
US10979632B2 (en) Imaging apparatus, method for controlling same, and storage medium
CN109955264B (zh) 机器人、机器人控制系统、机器人的控制方法以及记录介质
US8371897B1 (en) Vision technology for interactive toys
US11029753B2 (en) Human computer interaction system and human computer interaction method
CN111915744A (zh) 增强现实图像的交互方法、终端和存储介质
US10389947B2 (en) Omnidirectional camera display image changing system, omnidirectional camera display image changing method, and program
JP4945617B2 (ja) 画像処理装置、画像処理方法、画像処理プログラム
CN108398845A (zh) 投影设备控制方法和投影设备控制装置
KR102381542B1 (ko) 실시간 거북목 자세의 판별을 위한 알고리즘을 포함하는 시스템, 상기 시스템과 연동하는 반응형 거치대 및 이들의 제어방법