TWI458362B - 自動調整音量的聲音播放方法及電子設備 - Google Patents
自動調整音量的聲音播放方法及電子設備 Download PDFInfo
- Publication number
- TWI458362B TWI458362B TW101122428A TW101122428A TWI458362B TW I458362 B TWI458362 B TW I458362B TW 101122428 A TW101122428 A TW 101122428A TW 101122428 A TW101122428 A TW 101122428A TW I458362 B TWI458362 B TW I458362B
- Authority
- TW
- Taiwan
- Prior art keywords
- volume
- image
- sound
- processing unit
- face
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 24
- 238000012545 processing Methods 0.000 claims description 49
- 238000010586 diagram Methods 0.000 description 5
- 230000000295 complement effect Effects 0.000 description 3
- 229910044991 metal oxide Inorganic materials 0.000 description 3
- 150000004706 metal oxides Chemical class 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/002—Special television systems not provided for by H04N7/007 - H04N7/18
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/14—Digital output to display device ; Cooperation and interconnection of the display device with other functional units
- G06F3/147—Digital output to display device ; Cooperation and interconnection of the display device with other functional units using display panels
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/165—Management of the audio stream, e.g. setting of volume, audio stream path
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/142—Image acquisition using hand-held instruments; Constructional details of the instruments
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/20—Automatic control
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/20—Automatic control
- H03G3/30—Automatic control in amplifiers having semiconductor devices
- H03G3/3005—Automatic control in amplifiers having semiconductor devices in amplifiers suitable for low-frequencies, e.g. audio amplifiers
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/20—Automatic control
- H03G3/30—Automatic control in amplifiers having semiconductor devices
- H03G3/3089—Control of digital or coded signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/4223—Cameras
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/442—Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
- H04N21/44213—Monitoring of end-user related data
- H04N21/44218—Detecting physical presence or behaviour of the user, e.g. using sensors to detect if the user is leaving the room or changes his face expression during a TV program
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/44—Receiver circuitry for the reception of television signals according to analogue transmission standards
- H04N5/60—Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09G—ARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
- G09G2354/00—Aspects of interface with display user
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/44—Receiver circuitry for the reception of television signals according to analogue transmission standards
- H04N5/60—Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals
- H04N5/607—Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals for more than one sound signal, e.g. stereo, multilanguages
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
- H04N7/141—Systems for two-way working between two video terminals, e.g. videophone
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- General Physics & Mathematics (AREA)
- Social Psychology (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Oral & Maxillofacial Surgery (AREA)
- General Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Databases & Information Systems (AREA)
- Computer Networks & Wireless Communication (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Stereophonic System (AREA)
- Television Receiver Circuits (AREA)
- Circuit For Audible Band Transducer (AREA)
Description
本發明是有關於一種聲音播放方法及應用其之電子設備,且特別是有關於一種自動調整音量之聲音播放方法及應用其之電子設備。
隨著科技日新月異的進步,各種電子產品均朝著輕、薄、短、小的趨勢發展,尤其是薄型化設計已成為現今各種消費式電子產品的主流趨勢。
現今的消費性電子產品,如筆記型電腦、平板電腦、智慧型手機、個人數位助理等等,多具備影音視聽功能,以符合消費者的需求。為了播放音樂檔案、語音檔案、或是進行視訊,喇叭是實現這些功能所不可或缺的裝置。
一般而言,大部分電子產品的喇叭係設置於面對使用者之表面(例如:螢幕旁邊),以便播放音訊給使用者。然而,在長時間觀看影片或是視訊時,這些電子產品往往是放置於定點,若是使用者改變觀看位置,則會影響使用者收聽到的聲音品質。
本發明的目的就是在提供一種自動調整音量的聲音播放方法,用以根據使用者的觀看位置自動調整輸出音量大小及/或平衡左右聲道。
本發明之一態樣,提供了一種自動調整音量的聲音播放方法,包含拍攝一影像,擷取影像中之一人臉範圍,比較人臉範圍之高度與影像之高度,以得到一比例,以及根據比例調整輸出音量。
本發明之另一實施方式中,自動調整音量的聲音播放方法,包含拍攝影像,擷取影像中之一人臉範圍,比對人臉範圍之邊線與影像之邊線,以得到相對偏移量,以及根據相對偏移量調整左聲道或右聲道之輸出音量。
於一實施例中,比對人臉範圍之邊線與影像之邊線之步驟包含比對人臉範圍之左邊線與影像之左邊線,以得到用以調整左聲道之輸出音量的相對偏移量。或者,比對人臉範圍之邊線與影像之邊線之步驟包含比對人臉範圍之右邊線與影像之右邊線,以得到用以調整右聲道之輸出音量的相對偏移量。
於一實施例中,左聲道或右聲道之音量補償值的公式為:(O/W)*M,其中O為相對偏移量,W為影像之寬度,M為音量最大補償值。
於一實施例中,自動調整音量的聲音播放方法更包含比較人臉範圍之高度與影像之高度,以得到比例,以及根據比例調整左聲道與右聲道之輸出音量。
本發明之另一態樣為一種自動調整音量之電子設備,包含一影像感測元件、影像處理單元、音頻處理單元,以及擴音器。影像感測元件用以拍攝一影像。影像處理單元用以擷取影像中之人臉範圍,以及比較人臉範圍之高度與影像之高度,以得到音量調整值。音頻處理單元用以接收
音量調整值與音源資料,並將音源資料轉換為聲音資料,聲音資料之音量根據音量調整值調整。擴音器輸出音頻處理單元所傳送之聲音資料。
在另一實施方式中,自動調整音量之電子設備,包含影像感測元件、影像處理單元、音頻處理單元與擴音器。影像感測元件用以拍攝影像。影像處理單元用以擷取影像中之人臉範圍,以及比對人臉範圍之邊線與影像之邊線,以得到相對偏移量,並換算出音量補償值。音頻處理單元用以接收音量補償值與音源資料,並將音源資料轉換為聲音資料,其中音頻處理單元包含左聲道暫存器與右聲道暫存器,音量補償值傳送至左聲道暫存器或右聲道暫存器。擴音器輸出音頻處理單元所傳送之聲音資料,其中擴音器包含左聲道與右聲道,左聲道與右聲道之音量分別由左聲道暫存器與右聲道暫存器控制。
藉由辨識使用者與播放螢幕之間的距離及/或角度,可以自動調整輸出音量的大小及/或平衡左右聲道,提供使用者更佳的收聽品質。
以下將以圖式及詳細說明清楚說明本發明之精神,任何所屬技術領域中具有通常知識者在瞭解本發明之較佳實施例後,當可由本發明所教示之技術,加以改變及修飾,其並不脫離本發明之精神與範圍。
本發明提供了一種自動調整音量的聲音播放方法,藉由偵測使用者與播放螢幕之間的相對位置,如使用者與播
放螢幕之間的前後距離及/或使用者與播放螢幕之間的角度等,以調整輸出音量的大小及/或補償左右聲道的音量平衡,進而提升使用者在觀看影音或是進行視訊之品質。
自動調整音量的聲音播放方法可應用在具有影音播放功能的電子設備中,如智慧型手機、平板電腦、筆記型電腦等手持式電子設備,或是如家庭劇院等電子設備中。
參照第1圖,其繪示本發明之自動調整音量的聲音播放方法一實施例的流程圖。此實施例主要是用以判斷使用者與電子設備之遠近,以自動調整輸出音量。步驟S10為拍攝一影像,如利用電子設備中之電荷耦合元件(charge couple device;CCD)影像感測元件或互補金氧半導體(complementary metal oxide semiconductor;CMOS)影像感測元件拍攝影像。
接著,步驟S12為擷取影像中之人臉範圍,具體而言,電子設備中具有影像處理單元,影像感測元件所拍攝之影像可以傳送至影像處理單元,而後透過人臉追蹤技術辨識出影像中的人臉範圍。
接著,步驟S14為比較人臉範圍之高度與播放螢幕之高度,以得到一比例。具體而言,當影像處理單元辨識出影像中的人臉範圍之後,可以比對人臉範圍的高度所占的畫素與播放螢幕(即影像的全畫面)之高度的總畫素,以得到該比例。
最後,步驟S16為根據該比例調整輸出音量。具體而言,影像處理單元進一步比對該比例與預建之數值表,藉以得到一音量調整值,接著,此音量調整值被傳送至電子
設備之音頻處理單元中,音頻處理單元所接收之音源資料再轉換為聲音資料,而後輸出至擴音器中進行輸出。其中擴音器所輸出的音量會根據音頻處理單元所接收之音量調整值而改變。
換言之,當使用者接近播放螢幕時,影像感測元件所擷取到的畫面中,使用者的人臉範圍所占的比例會較大,故對應的音量調整值會較小甚至是負值,對應使用者移動此時擴音器輸出的音量會變小;相對地,當使用者遠離播放螢幕時,影像感測元件所擷取到的畫面中,使用者的人臉範圍所占的比例會較小,故對應的音量調整值會較大,對應使用者移動此時擴音器輸出的音量會變大。
音量調整值的計算公式可以如下所示:(1-比例)*最大音量調整值=音量調整值,其中比例為前述之人臉範圍所占影像全畫面之比例。
舉例來說,若是最大音量調整值為3分貝(dB),當人臉範圍所占影像全畫面之高度的比例為0.25時,此時的音量調整值為2.25分貝,即擴音器的左右聲道各加2.25分貝的音量;當人臉範圍所占影像全畫面之高度的比例為0.5時,此時的音量調整值為1.5分貝,即擴音器的左右聲道各加1.5分貝的音量;當人臉範圍所占影像全畫面之高度的比例為1時,此時的音量調整值為0分貝,即擴音器的左右聲道音量不變;而若是人臉極為靠近螢幕,影像處理單元如經由雙眼間距推算出人臉範圍大於影像全畫面時,此時的音量調整值為負值,即擴音器的左右聲道各自減少音量。
參照第2圖,其繪示本發明之自動調整音量的聲音播放方法另一實施例的流程圖。本實施例與前一實施例之差異在於,若是步驟S12中無法從影像中辨識出人臉範圍,例如使用者離開播放螢幕前,以致於影像處理單元辨識不出人臉範圍,則步驟S17為使音量初始化,令擴音器的輸出音量回到初始值。
此方法中更包含步驟S13之判斷人臉範圍的數量是否大於1。若是影像感測元件所拍攝的影像中,經辨識後有多個人臉範圍,則步驟S15中,影像處理單元可以取最大的人臉範圍所佔之比例與最小的人臉範圍所佔之比例的平均值套入前述的公式中,以平均後之比例對應的音量調整值進行輸出音量的音量調整。
參照第3圖,其繪示本發明之自動調整音量的聲音播放方法再一實施例的流程圖。此實施例主要是用以判斷使用者與電子設備之角度,以自動調整左右聲道之平衡。步驟S20為拍攝一影像,如利用電子設備中之電荷耦合元件(charge couple device;CCD)影像感測元件或互補金氧半導體(complementary metal oxide semiconductor;CMOS)影像感測元件拍攝影像。
步驟S22為擷取影像中之人臉範圍,具體而言,可以透過電子設備之影像處理單元,利用人臉追蹤技術辨識出影像中的人臉範圍。
步驟S24為比對人臉範圍之邊線與影像全畫面之邊線,以得到一相對偏移量。舉例而言,當進行左聲道之音量補償時,影像處理單元比對人臉範圍的左邊線與影像全
畫面的左邊線,以得到用以調整左聲道之輸出音量的相對偏移量;當進行右聲道之音量補償時,影像處理單元比對人臉範圍的右邊線與影像全畫面的右邊線,以得到用以調整右聲道之輸出音量的相對偏移量。
步驟S26為根據相對偏移量調整左聲道或是右聲道之輸出音量。左聲道或是右聲道的音量補償值的公式可以如下所示:(O/W)*M=音量補償值,其中O為該相對偏移量,W為影像全畫面之寬度,M為音量最大補償值。
舉例而言,若音量最大補償值為3分貝,當人臉範圍的左邊線對齊影像全畫面的左邊線時,此時相對偏移量為0,得出的音量補償值為0分貝,左聲道音量不變;而當人臉範圍的左邊線對齊影像全畫面之中線時,此時的相對偏移量為螢幕寬度的一半,得出的音量補償值為1.5分貝,左聲道音量增加1.5分貝;而當人臉範圍的左邊線對齊影像全畫面之右邊線時,此時的相對偏移量為整個螢幕寬度,得出的音量補償值為3分貝,左聲道音量增加3分貝。
相對地,若音量最大補償值為3分貝,當人臉範圍的右邊線對齊影像全畫面的右邊線時,此時相對偏移量為0,得出的音量補償值為0分貝,右聲道音量不變;而當人臉範圍的右邊線對齊影像全畫面之中線時,此時的相對偏移量為螢幕寬度的一半,得出的音量補償值為1.5分貝,右聲道音量增加1.5分貝;而當人臉範圍的右邊線對齊影像全畫面之左邊線時,此時的相對偏移量為整個螢幕寬度,
得出的音量補償值為3分貝,右聲道音量增加3分貝。
左聲道與右聲道之補償可以僅進行其中一種,或是兩種各進行一次,使得使用者相對於播放螢幕左右移動時,左右聲道可以根據相對偏移量換算出的音量補償值平衡左右聲道的輸出音量。
同樣地,當步驟S22中辨識出多個人臉範圍時,可以計算出多個相對偏移量的平均值,藉以得到音量補償值,在此便不再贅述。
參照第4圖,其繪示本發明之自動調整音量的聲音播放方法再一實施例的流程圖。此實施例可用以判斷使用者與電子設備之距離與角度,以自動調整輸出音量大小與左右聲道之平衡。步驟S30為拍攝一影像。
步驟S32為擷取影像中之人臉範圍。
步驟S34為比對人臉範圍之邊線與影像全畫面之邊線,以得到一相對偏移量。
步驟S36為根據相對偏移量提供用以調整左聲道或是右聲道之輸出音量的音量補償值。
步驟S38為比較人臉範圍之高度與影像全畫面之高度,以得到一比例。
步驟S40為根據該比例提供音量調整值。
步驟S42為根據音量調整值改變輸出音量之音量大小,以及根據音量補償值平衡左右聲道的輸出音量。
步驟S30至步驟S42的具體內容可以參照前述之實施例。
參照第5圖,其繪示本發明之自動調整音量之電子設
備一實施例的外觀示意圖。電子設備100包含有播放螢幕110、影像感測元件120以及擴音器130。影像感測元件120設置於鄰近播放螢幕110,用以拍攝面對播放螢幕110之影像。擴音器130則包含有左聲道132與右聲道134,左聲道132與右聲道134分別包含有至少一喇叭。左聲道132與右聲道134可以內建或是外接於播放螢幕110。
參照第6圖,其繪示第5圖中之電子設備100的方塊圖。電子設備100包含有影像感測元件120、擴音器130、影像處理單元140、音頻處理單元150以及音訊源160。
影像感測元件120用以拍攝影像,其可以為電荷耦合元件(charge couple device;CCD)影像感測元件或互補金氧半導體(complementary metal oxide semiconductor;CMOS)影像感測元件。
影像感測元件120所拍攝之影像為傳送至影像處理單元140中進行處理。影像處理單元140可以透過人臉辨識技術辨識出人臉範圍。接著,影像處理單元140可以比對出人臉範圍所占影像全畫面之比例,以得到用以調整整體音量大小的音量調整值。或者,影像處理單元140可以比對出人臉範圍之邊線與影像全畫面之邊線之間的相對偏移量,以得到用以調整左聲道及/或右聲道之音量補償值。
音頻處理單元150可以從音訊源160接收音源資料,以及從影像處理單元140接收音量調整值及/或音量補償值。音頻處理單元150中包含左聲道暫存器152以及右聲道暫存器154,音量調整值及/或音量補償值傳送至左聲道暫存器152與右聲道暫存器154,以修改其中儲存之數值。
音頻處理單元150可將數位訊號之音頻訊號轉換為類比訊號的聲音資料。換言之,聲音資料之音量根據音量調整值及/或音量補償值調整。
音頻處理單元150連接至擴音器130,擴音器130包含左聲道132、右聲道134以及音源放大器136。音頻處理單元150所提供之聲音資料經由音源放大器136傳送至左聲道132與右聲道134播出。左聲道132之音量由左聲道暫存器152控制,右聲道134之音量由右聲道暫存器154控制。
由上述本發明較佳實施例可知,本發明藉由辨識使用者與播放螢幕之間的距離及/或角度,可以自動調整輸出音量的大小及/或平衡左右聲道,提供使用者更佳的收聽品質。
雖然本發明已以一較佳實施例揭露如上,然其並非用以限定本發明,任何熟習此技藝者,在不脫離本發明之精神和範圍內,當可作各種之更動與潤飾,因此本發明之保護範圍當視後附之申請專利範圍所界定者為準。
100‧‧‧電子設備
110‧‧‧播放螢幕
120‧‧‧影像感測元件
130‧‧‧擴音器
132‧‧‧左聲道
134‧‧‧右聲道
136‧‧‧音源放大器
140‧‧‧影像處理單元
150‧‧‧音頻處理單元
152‧‧‧左聲道暫存器
154‧‧‧右聲道暫存器
160‧‧‧音訊源
S10~S42‧‧‧步驟
為讓本發明之上述和其他目的、特徵、優點與實施例能更明顯易懂,所附圖式之詳細說明如下:
第1圖繪示本發明之自動調整音量的聲音播放方法一實施例的流程圖。
第2圖繪示本發明之自動調整音量的聲音播放方法另
一實施例的流程圖。
第3圖繪示本發明之自動調整音量的聲音播放方法再一實施例的流程圖。
第4圖繪示本發明之自動調整音量的聲音播放方法再一實施例的流程圖。
第5圖繪示本發明之自動調整音量之電子設備一實施例的外觀示意圖。
第6圖繪示第5圖中之電子設備的方塊圖。
100‧‧‧電子設備
120‧‧‧影像感測元件
130‧‧‧擴音器
132‧‧‧左聲道
134‧‧‧右聲道
136‧‧‧音源放大器
140‧‧‧影像處理單元
150‧‧‧音頻處理單元
152‧‧‧左聲道暫存器
154‧‧‧右聲道暫存器
160‧‧‧音訊源
Claims (8)
- 一種自動調整音量的聲音播放方法,包含:拍攝一影像;擷取該影像中之一人臉範圍;比較該人臉範圍之高度與該影像之高度,以得到一比例;以及根據該比例調整一輸出音量。
- 一種自動調整音量的聲音播放方法,包含:拍攝一影像;擷取該影像中之一人臉範圍;比對該人臉範圍之邊線與該影像之邊線,以得到一相對偏移量;以及根據該相對偏移量調整一左聲道或一右聲道之輸出音量。
- 如申請專利範圍第2項所述之自動調整音量的聲音播放方法,其中比對該人臉範圍之邊線與該影像之邊線之步驟包含比對該人臉範圍之一左邊線與該影像之一左邊線,以得到用以調整該左聲道之輸出音量的該相對偏移量。
- 如申請專利範圍第2項所述之自動調整音量的聲音播放方法,其中比對該人臉範圍之邊線與該影像之邊線之 步驟包含比對該人臉範圍之一右邊線與該影像之一右邊線,以得到用以調整該右聲道之輸出音量的該相對偏移量。
- 如申請專利範圍第2項所述之自動調整音量的聲音播放方法,其中該左聲道或該右聲道之一音量補償值的公式為:(O/W)*M,其中O為該相對偏移量,W為該影像之寬度,M為一音量最大補償值。
- 如申請專利範圍第2項所述之自動調整音量的聲音播放方法,更包含:比較該人臉範圍之高度與該影像之高度,以得到一比例;以及根據該比例調整該左聲道與該右聲道之輸出音量。
- 一種自動調整音量之電子設備,包含:一影像感測元件,用以拍攝一影像;一影像處理單元,用以擷取該影像中之一人臉範圍,以及比較該人臉範圍之高度與該影像之高度,以得到一音量調整值;一音頻處理單元,用以接收該音量調整值與一音源資料,並將該音源資料轉換為一聲音資料,該聲音資料之音量根據該音量調整值調整;以及一擴音器,以輸出該音頻處理單元所傳送之該聲音資料。
- 一種自動調整音量之電子設備,包含:一影像感測元件,用以拍攝一影像;一影像處理單元,用以擷取該影像中之一人臉範圍,以及比對該人臉範圍之邊線與該影像之邊線,以得到一相對偏移量,並換算出一音量補償值;一音頻處理單元,用以接收該音量補償值與一音源資料,並將該音源資料轉換為一聲音資料,其中該音頻處理單元包含一左聲道暫存器與一右聲道暫存器,該音量補償值傳送至該左聲道暫存器或該右聲道暫存器;以及一擴音器,以輸出該音頻處理單元所傳送之該聲音資料,其中該擴音器包含一左聲道與一右聲道,該左聲道與該右聲道之音量分別由該左聲道暫存器與該右聲道暫存器控制。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW101122428A TWI458362B (zh) | 2012-06-22 | 2012-06-22 | 自動調整音量的聲音播放方法及電子設備 |
CN201210238789.5A CN103517201A (zh) | 2012-06-22 | 2012-07-10 | 自动调整音量的声音播放方法及电子设备 |
US13/681,423 US20130342669A1 (en) | 2012-06-22 | 2012-11-20 | Method for auto-adjusting audio output volume and electronic apparatus using the same |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW101122428A TWI458362B (zh) | 2012-06-22 | 2012-06-22 | 自動調整音量的聲音播放方法及電子設備 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201401896A TW201401896A (zh) | 2014-01-01 |
TWI458362B true TWI458362B (zh) | 2014-10-21 |
Family
ID=49774120
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW101122428A TWI458362B (zh) | 2012-06-22 | 2012-06-22 | 自動調整音量的聲音播放方法及電子設備 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20130342669A1 (zh) |
CN (1) | CN103517201A (zh) |
TW (1) | TWI458362B (zh) |
Families Citing this family (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10417900B2 (en) * | 2013-12-26 | 2019-09-17 | Intel Corporation | Techniques for detecting sensor inputs on a wearable wireless device |
CN104768064A (zh) * | 2014-01-02 | 2015-07-08 | 冠捷投资有限公司 | 基于用户位置动态优化图像或声音的方法 |
KR102278816B1 (ko) * | 2014-02-04 | 2021-07-20 | 삼성디스플레이 주식회사 | 표시장치 및 이의 구동방법 |
US20160048202A1 (en) * | 2014-08-13 | 2016-02-18 | Qualcomm Incorporated | Device parameter adjustment using distance-based object recognition |
US20160117962A1 (en) * | 2014-10-22 | 2016-04-28 | Samsung Electronics Co., Ltd. | Display apparatus and display method thereof |
US9712940B2 (en) * | 2014-12-15 | 2017-07-18 | Intel Corporation | Automatic audio adjustment balance |
US9536176B2 (en) * | 2015-03-23 | 2017-01-03 | International Business Machines Corporation | Environmental-based location monitoring |
EP3073747A1 (en) * | 2015-03-26 | 2016-09-28 | Thomson Licensing | Method and device for adapting an audio level of a video |
CN104935718B (zh) * | 2015-06-11 | 2017-10-31 | 广东欧珀移动通信有限公司 | 一种控制方法及移动终端 |
TW201707471A (zh) * | 2015-08-14 | 2017-02-16 | Unity Opto Technology Co Ltd | 自動控制指向性喇叭及其燈具 |
CN106502375A (zh) * | 2015-09-06 | 2017-03-15 | 中兴通讯股份有限公司 | 一种实现音频参数自适应调整的方法和设备 |
CN105723326A (zh) * | 2016-01-23 | 2016-06-29 | 张阳 | 剧院中音量控制方法及系统 |
CN105739707B (zh) * | 2016-03-04 | 2018-10-02 | 京东方科技集团股份有限公司 | 电子设备、脸部识别跟踪方法和三维显示方法 |
KR102531886B1 (ko) | 2016-08-17 | 2023-05-16 | 삼성전자주식회사 | 전자장치 및 그 제어방법 |
CN106303688A (zh) * | 2016-08-29 | 2017-01-04 | 青岛海信电器股份有限公司 | 一种终端中的声音平衡参数调节方法和系统 |
CN107870758B (zh) * | 2016-09-26 | 2020-07-10 | 北京小米移动软件有限公司 | 音频播放方法及装置、电子设备 |
US10785367B2 (en) * | 2016-10-31 | 2020-09-22 | Huawei Technologies Co., Ltd. | Audio processing method and terminal device |
CN106817667A (zh) * | 2016-11-30 | 2017-06-09 | 努比亚技术有限公司 | 一种实现立体声的方法、装置及移动终端 |
CN106990935B (zh) * | 2017-03-30 | 2018-09-04 | 维沃移动通信有限公司 | 一种音频播放方法及移动终端 |
US10171054B1 (en) | 2017-08-24 | 2019-01-01 | International Business Machines Corporation | Audio adjustment based on dynamic and static rules |
CN107566888B (zh) * | 2017-09-12 | 2019-12-13 | 中广热点云科技有限公司 | 多个多媒体播放设备的音频设置方法、多媒体播放系统 |
CN110392298B (zh) * | 2018-04-23 | 2021-09-28 | 腾讯科技(深圳)有限公司 | 一种音量调节方法、装置、设备及介质 |
TWI672012B (zh) * | 2018-06-08 | 2019-09-11 | 友達光電股份有限公司 | 互動式指向性聲音顯示系統及互動式指向性聲音顯示方法 |
TWI739041B (zh) * | 2018-10-31 | 2021-09-11 | 華碩電腦股份有限公司 | 電子裝置以及其控制方法 |
CN109445744B (zh) * | 2018-11-09 | 2022-04-15 | 上德(深圳)数据科技有限公司 | 一种基于播放距离的播放调节系统 |
CN109977799B (zh) * | 2019-03-07 | 2022-12-20 | 腾讯科技(深圳)有限公司 | 一种人眼与屏幕距离监控方法、装置及终端 |
GB2589720A (en) * | 2019-10-30 | 2021-06-09 | Fujitsu Client Computing Ltd | Information processing apparatus, program, and information processing system |
CN111190568A (zh) * | 2019-12-30 | 2020-05-22 | 上海摩软通讯技术有限公司 | 一种音量调节方法及装置 |
CN111787460B (zh) | 2020-06-23 | 2021-11-09 | 北京小米移动软件有限公司 | 设备控制方法及装置 |
CN113965641B (zh) * | 2021-09-16 | 2023-03-28 | Oppo广东移动通信有限公司 | 音量调节方法及装置、终端及计算机可读存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040151347A1 (en) * | 2002-07-19 | 2004-08-05 | Helena Wisniewski | Face recognition system and method therefor |
TW200603626A (en) * | 2004-07-15 | 2006-01-16 | Ali Corp | Methods and related circuit for automatic audio volume level control |
TW200742478A (en) * | 2006-04-21 | 2007-11-01 | Hon Hai Prec Ind Co Ltd | Method and sound output device for protecting hearing |
KR100830039B1 (ko) * | 2007-01-05 | 2008-05-15 | 주식회사 대우일렉트로닉스 | 홈씨어터 시스템의 음량 자동 조절 방법 |
US20080253587A1 (en) * | 2007-04-11 | 2008-10-16 | Kabushiki Kaisha Toshiba | Method for automatically adjusting audio volume and audio player |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5698805A (en) * | 1995-06-30 | 1997-12-16 | Crystal Semiconductor Corporation | Tone signal generator for producing multioperator tone signals |
US6243476B1 (en) * | 1997-06-18 | 2001-06-05 | Massachusetts Institute Of Technology | Method and apparatus for producing binaural audio for a moving listener |
US6219639B1 (en) * | 1998-04-28 | 2001-04-17 | International Business Machines Corporation | Method and apparatus for recognizing identity of individuals employing synchronized biometrics |
TWI230023B (en) * | 2003-11-20 | 2005-03-21 | Acer Inc | Sound-receiving method of microphone array associating positioning technology and system thereof |
GB2426169B (en) * | 2005-05-09 | 2007-09-26 | Sony Comp Entertainment Europe | Audio processing |
KR100739798B1 (ko) * | 2005-12-22 | 2007-07-13 | 삼성전자주식회사 | 청취 위치를 고려한 2채널 입체음향 재생 방법 및 장치 |
US20080085014A1 (en) * | 2006-02-13 | 2008-04-10 | Hung-Yi Chen | Active gain adjusting method and related system based on distance from users |
JP2011055076A (ja) * | 2009-08-31 | 2011-03-17 | Fujitsu Ltd | 音声通話装置及び音声通話方法 |
US8441515B2 (en) * | 2009-09-17 | 2013-05-14 | Sony Corporation | Method and apparatus for minimizing acoustic echo in video conferencing |
CN102033549B (zh) * | 2009-09-30 | 2014-02-05 | 三星电子(中国)研发中心 | 显示设备的视角调整装置 |
US8532343B1 (en) * | 2010-04-16 | 2013-09-10 | Steven Jay Freedman | System for non-repudiable registration of an online identity |
JP5525923B2 (ja) * | 2010-06-09 | 2014-06-18 | 任天堂株式会社 | 画像処理プログラム、画像処理装置、画像処理システム、および画像処理方法 |
JP5602618B2 (ja) * | 2010-06-10 | 2014-10-08 | 任天堂株式会社 | 画像処理プログラム、画像処理装置、画像処理システム、および画像処理方法 |
JP2012104871A (ja) * | 2010-11-05 | 2012-05-31 | Sony Corp | 音響制御装置及び音響制御方法 |
CN103270773A (zh) * | 2010-12-20 | 2013-08-28 | 株式会社尼康 | 声音控制装置及摄像装置 |
WO2012083989A1 (en) * | 2010-12-22 | 2012-06-28 | Sony Ericsson Mobile Communications Ab | Method of controlling audio recording and electronic device |
JP2012191524A (ja) * | 2011-03-11 | 2012-10-04 | Sony Corp | 音響装置および音響システム |
WO2013058728A1 (en) * | 2011-10-17 | 2013-04-25 | Nuance Communications, Inc. | Speech signal enhancement using visual information |
KR101997449B1 (ko) * | 2013-01-29 | 2019-07-09 | 엘지전자 주식회사 | 이동 단말기 및 이의 제어 방법 |
-
2012
- 2012-06-22 TW TW101122428A patent/TWI458362B/zh not_active IP Right Cessation
- 2012-07-10 CN CN201210238789.5A patent/CN103517201A/zh active Pending
- 2012-11-20 US US13/681,423 patent/US20130342669A1/en not_active Abandoned
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040151347A1 (en) * | 2002-07-19 | 2004-08-05 | Helena Wisniewski | Face recognition system and method therefor |
TW200603626A (en) * | 2004-07-15 | 2006-01-16 | Ali Corp | Methods and related circuit for automatic audio volume level control |
TW200742478A (en) * | 2006-04-21 | 2007-11-01 | Hon Hai Prec Ind Co Ltd | Method and sound output device for protecting hearing |
KR100830039B1 (ko) * | 2007-01-05 | 2008-05-15 | 주식회사 대우일렉트로닉스 | 홈씨어터 시스템의 음량 자동 조절 방법 |
US20080253587A1 (en) * | 2007-04-11 | 2008-10-16 | Kabushiki Kaisha Toshiba | Method for automatically adjusting audio volume and audio player |
Also Published As
Publication number | Publication date |
---|---|
TW201401896A (zh) | 2014-01-01 |
CN103517201A (zh) | 2014-01-15 |
US20130342669A1 (en) | 2013-12-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI458362B (zh) | 自動調整音量的聲音播放方法及電子設備 | |
US11375329B2 (en) | Systems and methods for equalizing audio for playback on an electronic device | |
US20070172083A1 (en) | Method and apparatus for controlling a gain of a voice signal | |
US20100302401A1 (en) | Image Audio Processing Apparatus And Image Sensing Apparatus | |
US20140009639A1 (en) | Camera control system, mobile device having the system, and camera control method | |
US20170084287A1 (en) | Electronic device and method of audio processing thereof | |
US11284151B2 (en) | Loudness adjustment method and apparatus, and electronic device and storage medium | |
US20170345437A1 (en) | Voice receiving method and device | |
KR20140093513A (ko) | 휴대 단말기의 디스플레이 제어 장치 및 방법 | |
CN108845787A (zh) | 音频调节的方法、装置、终端及存储介质 | |
US20200296534A1 (en) | Sound playback device and output sound adjusting method thereof | |
US20240135946A1 (en) | Method and apparatus for improving sound quality of speaker | |
US9161125B2 (en) | High dynamic microphone system | |
US9621985B2 (en) | Apparatus and method for adjusting volume in terminal | |
US11388281B2 (en) | Adaptive method and apparatus for intelligent terminal, and terminal | |
US11487496B2 (en) | Controlling audio processing | |
CN104601126B (zh) | 调节音量的方法和装置 | |
CN101340516B (zh) | 感光度调整装置及调整方法 | |
CN109587603B (zh) | 音量控制方法、装置及存储介质 | |
JP2014175670A (ja) | 情報端末装置及び音響制御方法並びにプログラム | |
KR20070074251A (ko) | 휴대 단말기에서 동영상 촬영 시 오디오 신호 입력 방법 및장치 | |
CN109712629A (zh) | 音频文件的合成方法及装置 | |
KR20090109779A (ko) | 자동 영상 조절 장치 및 그 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
GD4A | Issue of patent certificate for granted invention patent | ||
MM4A | Annulment or lapse of patent due to non-payment of fees |