TWI508559B - 影音播放裝置與方法 - Google Patents

影音播放裝置與方法 Download PDF

Info

Publication number
TWI508559B
TWI508559B TW101119335A TW101119335A TWI508559B TW I508559 B TWI508559 B TW I508559B TW 101119335 A TW101119335 A TW 101119335A TW 101119335 A TW101119335 A TW 101119335A TW I508559 B TWI508559 B TW I508559B
Authority
TW
Taiwan
Prior art keywords
audio
telephone
operation behavior
video playback
video
Prior art date
Application number
TW101119335A
Other languages
English (en)
Other versions
TW201349862A (zh
Inventor
Hung Chi Huang
Original Assignee
Mstar Semiconductor Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mstar Semiconductor Inc filed Critical Mstar Semiconductor Inc
Priority to TW101119335A priority Critical patent/TWI508559B/zh
Publication of TW201349862A publication Critical patent/TW201349862A/zh
Application granted granted Critical
Publication of TWI508559B publication Critical patent/TWI508559B/zh

Links

Landscapes

  • Telephonic Communication Services (AREA)
  • Selective Calling Equipment (AREA)

Description

影音播放裝置與方法
本發明是有關於一種影音播放裝置與方法,且特別是有關於一種根據音訊控制指令而進行操作之影音播放裝置與方法。
習用技術為了改善使用遙控器的不便,提供了以麥克風輔助之具有聲控功能的電視機。簡單來說,此種習用技術讓使用者透過麥克風而下達電視機的操作指令,例如:靜音、轉換頻道、調整音量等功能。使用者下達的指令經由麥克風收音後,將經過電視機內部之聲音辨識,之後電視機再根據使用者的指令而執行相關的影音播放動作。
然而,習用技術的作法仍有其缺失。例如:使用者A正在看電視而使用麥克風下達指令的同時,使用者B正好在一旁與使用者C進行交談。則麥克風收音時,將同時接收到三個使用者的聲音,因而產生誤判。因為透過麥克風所傳遞的聲音可能來自四周,但是麥克風卻無法清楚辨識。
因此,採用習用技術的聲控作法時,麥克風必須搭配聲音強度偵測器使用。使聲音強度偵測器的目的是為了偵測輸入聲音訊號的強度,判斷出在麥克風四周所發出的聲音中,何者係由真正在觀看電視節目的使用者所發出的聲音。
換言之,對習用技術而言,麥克風的靈敏度(增益) 調整將會影響整體指令的辨認率。當背景雜音過大時,使用者還未說話,系統已經偵測到有語音(背景雜音)輸入了,此種情形將導致辨認錯誤。此時,習用技術便需要調低麥克風的增益,或是將背景雜音降低。由此可知,習用技術以麥克風收音的方式進行電視機的控制播放,需要根據周圍環境的改變而調整麥克風靈敏度,否則其辨認率可能受到影響。
再者,此種聲控方式無異於要使用者近距離說出命令,否則,一旦使用者位於較遠的距離下達指令時,其指令很容易被視為背景雜訊而無法發揮效用。
承上所述,習用技術所提供之聲控方式需要使用高階、精準的數位信號處理作法,方能將使用者的聲音與環境周遭的雜音予以區隔,並準確的判斷使用者所下達的指令。此外,使用麥克風的方式,也限定了使用者能夠操作電視機的距離。因此,習用技術成本高、且對使用者的操作位置形成限制,而仍有待改進。
本發明之一方面係為一種影音播放裝置,與一電話裝置相連,該影音播放裝置包含:一電話接孔,藉由一電話線而與該電話裝置相連;以及一影音播放模組,電連接於該電話接孔,其中,該影音播放模組接收該電話裝置所傳送之一音訊控制指令,並據此而進行一操作行為。
本發明之另一方面係為一種影音播放方法,應用於與一電話裝置相連之一影音播放裝置,該播放方法包含以下 步驟:藉由一電話線而接收由該電話裝置所傳送之一音訊控制指令;以及根據該音訊控制指令而進行一操作行為。
為了對本發明之上述及其他方面有更佳的瞭解,下文特舉較佳實施例,並配合所附圖式,作詳細說明如下:
鑒於以上的問題,本發明舉出的較佳實施例,利用電話裝置來控制電視機等影音播放裝置的操作。電話裝置在現代的家庭中,已經是相當普及的產品。因此,根據本發明的構想,在影音播放裝置提供了電話接孔,使得影音播放裝置可以透過電話線而與電話裝置導通。
請參見第1圖,其係根據本發明構想之較佳實施例的影音播放裝置示意圖。影音播放裝置23具有一電話接孔234,電話接孔234用來連接電話線22,進而與電話裝置21相連。在影音播放裝置23提供電話接孔234,利用電話線22將電話裝置21與影音播放裝置23相連接的作法,其作法相對簡易,而可用相當低廉的成本來達成。
影音播放裝置23還包含了影音播放模組231。影音播放模組231電連接於電話接孔234,因而透過電話線22而與電話裝置21進行指令、資料交換的動作。影音播放模組231接收電話裝置21所傳送之音訊控制指令,並據此而進行操作行為。
根據本發明的構想,使用者27若與影音播放裝置23、電話裝置21位於相同房間內,則使用者27便直接操作電話裝置21,透過電話線22、電話接孔234而將音訊 控制指令傳送至影音播放裝置23。另一方面,若使用者位於他處,則使用者可以利用與電話裝置21信號連結的通訊裝置26來傳送音訊控制指令。亦即,音訊控制指令透過通訊裝置26、電話網路25而傳送至電話裝置21後,再由電話裝置21傳送至影音播放裝置23。
當電話裝置21與通訊裝置26處於通話狀態時,由通訊裝置26產生音訊控制指令,並透過電話裝置21傳送至影音播放裝置23。需注意的是,無論是由使用者27的口語所發出的語音控制信號,或是因為使用者按壓通訊裝置26上的按鍵,導致電話裝置21相對產生電話按鍵音序列等,都可以是此處的音訊控制指令。
儲存模組233電連接於影音播放模組231,其係提供複數個預存指令與其對應之複數個控制流程。當影音播放模組231透過電話接孔234接收音訊控制指令後,根據該等預存指令與該等控制流程之對應關係,選擇其中與音訊控制指令相對應之控制流程作為該操作行為。
辨識模組232電連接於影音播放模組231,其係對音訊控制指令進行辨識而得出辨識結果,並使影音播放模組231因應辨識結果而進行操作行為。操作行為的類型可以相當多元,例如:啟動影音操作行為、關閉影音操作行為、播放影音操作行為、音量調整操作行為、頻道轉換操作行為等。
根據發明的構想,使用者可以利用各種類型的電話裝置來下達對電視、機上盒等影音播放裝置的語音控制指令。
請參見第2圖,其係本發明所提出利用電話裝置對影音播放裝置下達音訊控制指令之流程圖。此處係以使用者發出聲控的語音控制信號為例,簡要說明語音控制信號的接收方式。
首先取得語音控制信號(S201);接著判斷語音控制信號的品質是否良好並足以進行後續的語音辨識(步驟S202)。若是,便接著進行後續的步驟;若否,則要求使用者重新輸入語音控制信號(步驟S206)。
一旦語音控制信號的品質可被接受後,接著進行語音辨識(步驟S203)。根據語音辨識的成功與否(步驟S204),影音播放裝置將開始進行影音播放(步驟S205),或是要求使用者再度輸入語音控制信號(步驟S206)。
需注意的是,除了單獨由使用者以聲控的方式對影音播放裝置進行控制外,本發明還可以進一步讓使用者搭配電話的按鍵來做為指令的組合。亦即,由於電話按鍵被按下時,電話裝置將對應產生按鍵音,因此影音播放裝置也可以利用電話按鍵音序列作為語音控制指令的判斷依據。
例如:當使用者下達錄影的語音控制指令時,使用者可以進一步搭配電話按鍵選擇第65頻道、時間為19:00~21:00。此時,便可以利用電話按鍵輸入代表頻道的65、代表時間的19002100。當使用者透過電話裝置輸入數字按鍵6519002100後,由這些數字按鍵所對應產生的電話按鍵音序列,將由影音播放裝置用來設定頻道與進行錄影的期間。
當然,使用者發出的語音控制信號、電話按鍵音序列 的組合可以相當多元。延續前述例子,若使用者不知道頻道編號,只知道想看的頻道名稱為探索頻道(Discovery),便可以口述「Discovery」而產生對影音播放裝置的語音控制信號,搭配電話按鍵所對應的時段選擇。此處的組合可視系統應用或使用者的需要而彈性調整,此處不再贅述。
由此可知,當電話裝置被接通時,影音播放裝置可以明確得知使用者希望開始聲控,因此可以避免誤判聲控產生時點的情形。因此,便可以克服習用技術使用麥克風收音而無法準確判斷指令的缺失。
此處的電話裝置並不僅以使用公用電話交換網路(Public Switched Telephone Network,簡稱為PSTN)的市話話機為限。舉例來說,許多家庭都會加裝市話話機的無線分機,這些無線分機同樣可以提供操作功能的控制。
當然,其他像是具有數位長距離功能的數位增強無線電話系統(Digital Enhanced Cordless Telecommunications,簡稱為DECT)的電話話機、提供VoIP的網路電話等,也都可以用來作為控制影音播放裝置的媒介。
採用撥打電話的方式對影音播放裝置進行控制可以利用遠端方式確認家中動態,或是以遠端開啟的方式來營造有人在家裡的感覺,進而提升居家的安全性。
請參見第3圖,其係於儲存模組提供複數個預存指令與其對應之複數個控制流程之示意圖。需注意的是,此圖 式的對應關係係為舉例說明,實際於儲存模組中的資料儲存格式並不以此為限。
預存指令A、預存指令B、預存指令C分別對應於控制流程a、控制流程b、控制流程c,因此,在接收到音訊控制指令後,若辨識結果與預存指令C相符合時,便提供控制流程c作為影音播放裝置的操作行為。
更進一步來說,根據本發明的構想,語音控制指令也可以用來控制其他的家電產品。亦即,影音播放裝置所進行的操作行為也可以是針對外部裝置進行的控制行為。
請參見第4圖,其係電話裝置透過電話線傳送音訊控制指令至影音播放裝置後,透過網路而控制其他外部裝置之示意圖。
在此圖式中,冰箱31、音響32、空調33均透過網路30與影音播放裝置23信號連接,因此影音播放裝置23可以透過網路30而傳送對這些外部裝置的控制指令。
舉例來說,若影音播放裝置與冰箱31、燈具、音響32、空調33等外部裝置彼此透過網路而信號連結時,便可以透過影音播放裝置而控制這些外部裝置。例如:透過影音播放裝置而開啟家中的空調33,因此當使用者回到家時,家裡的室溫不會過高或過低;或是控制洗衣機開始洗滌原本浸泡中的衣物等。
針對影音播放裝置的聲控控制,本發明所提出的影音播放方法可被歸納為以下步驟:藉由電話線而接收由電話裝置所傳送之音訊控制指令;以及根據音訊控制指令而進行與音訊控制指令相對應的操作行為。
這裡的音訊控制指令可以根據使用者的身份而進行,當使用者的身份與預存之合法使用者的身份不符合時,便停止影音播放裝置進行後續操作行為,或是僅提供有限功能的操作行為。
亦即,在接收到音訊控制指令後,利用辨識模組對音訊控制指令發出者的身份進行身份辨識;以及當身份辨識結果符合預設的身份比對結果時,因應身份比對結果所對應的操作權限而進行操作行為。
舉例來說,影音播放裝置可以提供三種等級的使用者身份,分別為未授權的使用者等級、部份授權的使用者等級、完整授權的使用者等級。
當未經授權的使用者嘗試對影音播放裝置進行控制時,其發出的音訊控制指令將無法被驗證通過。此時,由於使用者的身份辨識結果無法通過驗證,因此不符合預設的身份比對結果,此時影音播放裝置便無法開機。
對於部份授權的使用者等級來說,可能被應用於成人對家中孩童收看頻道的管理。例如:預設家中的孩童只能觀賞卡通頻道、教育頻道,或是只有在某些特定的時間才可以觀看電視節目。
以前者來說,孩童所發出的音訊控制指令之權限受到限制。因此,由孩童發出的音訊控制指令係選擇性的由影音播放裝置所接受,只有其音訊控制指令為這些預設可選之頻道間的切換、音量控制、關機等符合操作權限的情形下,影音播放裝置才會進行對應的操作。以後者來說,當孩童在晚上九點以後若想要觀看電視節目,則影音播放裝 置將被設定為無法接受夜間時段由孩童所發出的音訊控制指令。
根據前述說明,透過儲存模組的使用,影音播放裝置可以提供複數個預存指令與其對應之複數個控制流程;以及根據預存指令與控制流程之對應關係,選擇其中與音訊控制指令相對應之控制流程作為操作行為。
舉例來說,預存指令所對應的控制流程可能包含:開機、關機、音量調整、頻道轉換、控制其他電子裝置等操作行為。當使用者發出音量調整的指令時,影音播放裝置根據使用者的指示為音量增加、音量減少、靜音的何者,而開始進行與其對應的控制流程。
承上,根據本發明的構想,影音播放裝置可以透過電話裝置而接收指令動作。當影音播放裝置接收到音訊控制指令後,便對音訊控制指令發出者的身份、音訊控制指令的指令內容進行辨識而得出辨識結果。當辨識結果為發出音訊控制指令的使用者身份獲得確認時,便判斷其指示為何種操作行為。此種作法可以搭配既存的有線電話網路使用,並利用相當低廉的成本完成電視的遠端控制。
此外,使用者的位置並不需要被限制在影音播放裝置的週邊。除了與影音播放裝置在相同房間外,還可以藉由外部的通訊裝置來控制。亦即,當電話裝置與通訊裝置處於通話狀態時,只要由通訊裝置產生音訊控制指令,並透過電話裝置傳送至影音播放裝置。如此一來,影音裝置的控制與操作將更具有彈性。
綜上所述,雖然本發明已以較佳實施例揭露如上,然 其並非用以限定本發明。本發明所屬技術領域中具有通常知識者,在不脫離本發明之精神和範圍內,當可作各種之更動與潤飾。因此,本發明之保護範圍當視後附之申請專利範圍所界定者為準。
27‧‧‧使用者
26‧‧‧通訊裝置
25‧‧‧電話網路
21‧‧‧電話裝置
22‧‧‧電話線
234‧‧‧電話接孔
23‧‧‧影音播放裝置
233‧‧‧儲存模組
231‧‧‧影音播放模組
232‧‧‧辨識模組
30‧‧‧網路
31‧‧‧冰箱
32‧‧‧音響
33‧‧‧空調
第1圖,其係根據本發明構想之較佳實施例的影音播放裝置示意圖。
第2圖,其係本發明所提出利用電話裝置對影音播放裝置下達音訊控制指令之流程圖。
第3圖,其係於儲存模組提供複數個預存指令與其對應之複數個控制流程之示意圖。
第4圖,其係電話裝置透過電話線傳送音訊控制指令至影音播放裝置後,透過網路而控制其他外部裝置之示意圖。
27‧‧‧使用者
26‧‧‧通訊裝置
25‧‧‧電話網路
21‧‧‧電話裝置
22‧‧‧電話線
234‧‧‧電話接孔
23‧‧‧影音播放裝置
233‧‧‧儲存模組
231‧‧‧影音播放模組
232‧‧‧辨識模組

Claims (14)

  1. 一種影音播放裝置,與一電話裝置相連,該影音播放裝置包含:一電話接孔,藉由一電話線而與該電話裝置相連;一影音播放模組,電連接於該電話接孔,接收該電話裝置所傳送之一音訊控制指令:以及一辨識模組,電連接於該影音播放模組,其係對該音訊控制指令進行身分辨識而產生一身份比對結果,並對該音訊控制指令進行操作行為辨識而產生一操作行為辨識結果,其中該影音播放模組係因應該身份比對結果與該操作行為辨識結果而進行一操作行為。
  2. 如申請專利範圍第1項所述之影音播放裝置,其中當該電話裝置與一通訊裝置處於一通話狀態時,由該通訊裝置產生該音訊控制指令,並透過該電話裝置傳送至該影音播放裝置。
  3. 如申請專利範圍第1項所述之影音播放裝置,其中該音訊控制指令係為:一語音控制信號、或一電話按鍵音序列。
  4. 如申請專利範圍第1項所述之影音播放裝置,其中該操作行為係為下列行為之一:一啟動影音操作行為、一關閉影音操作行為、一播放影音操作行為、一音量調整操作行為、一頻道轉換操作行為、以及一外部裝置操作行為。
  5. 如申請專利範圍第4項所述之影音播放裝置,其 中該外部裝置操作行為係指透過該影音播放裝置而控制與其信號連接之一電子裝置的操作。
  6. 如申請專利範圍第1項所述之影音播放裝置,更包含:一儲存模組,電連接於該影音播放模組,其係提供複數個預存指令與其對應之複數個控制流程,其中,當該影音播放模組接收該音訊控制指令後,根據該等預存指令與該等控制流程之對應關係,選擇其中與該音訊控制指令相對應之控制流程作為該操作行為。
  7. 如申請專利範圍第1項所述之影音播放裝置,其中該電話裝置係為一市話話機。
  8. 一種影音播放方法,應用於與一電話裝置相連並包含一辨識模組之一影音播放裝置,該播放方法包含以下步驟:藉由一電話線而接收由該電話裝置所傳送之一音訊控制指令;以及該辨識模組對該音訊控制指令進行身份辨識而產生一身份比對結果;該辨識模組對該音訊控制指令進行操作行為辨識而產生一操作行為辨識結果;以及因應該身分比對結果與該操作行為辨識結果而進行一操作行為。
  9. 如申請專利範圍第8項所述之影音播放方法,其中當該電話裝置與一通訊裝置處於一通話狀態時,由該通 訊裝置產生該音訊控制指令,並透過該電話裝置傳送至該影音播放裝置。
  10. 如申請專利範圍第8項所述之影音播放方法,其中該音訊控制指令係為:一語音控制信號、或一電話按鍵音序列。
  11. 如申請專利範圍第8項所述之影音播放方法,其中該操作行為係為下列行為之一:一啟動影音操作行為、一關閉影音操作行為、一播放影音操作行為、一音量調整操作行為、一頻道轉換操作行為、以及一外部裝置操作行為。
  12. 如申請專利範圍第11項所述之影音播放方法,其中該外部裝置操作行為係指透過該影音播放裝置而控制與其信號連接之一電子裝置的操作。
  13. 如申請專利範圍第8項所述之影音播放方法,更包含以下步驟:提供複數個預存指令與其對應之複數個控制流程;以及根據該等預存指令與該等控制流程之對應關係,選擇其中與該音訊控制指令相對應之控制流程作為該操作行為。
  14. 如申請專利範圍第8項所述之影音播放方法,其中該電話裝置係為一市話話機。
TW101119335A 2012-05-30 2012-05-30 影音播放裝置與方法 TWI508559B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW101119335A TWI508559B (zh) 2012-05-30 2012-05-30 影音播放裝置與方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW101119335A TWI508559B (zh) 2012-05-30 2012-05-30 影音播放裝置與方法

Publications (2)

Publication Number Publication Date
TW201349862A TW201349862A (zh) 2013-12-01
TWI508559B true TWI508559B (zh) 2015-11-11

Family

ID=50157651

Family Applications (1)

Application Number Title Priority Date Filing Date
TW101119335A TWI508559B (zh) 2012-05-30 2012-05-30 影音播放裝置與方法

Country Status (1)

Country Link
TW (1) TWI508559B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW446934B (en) * 1998-10-13 2001-07-21 Ericsson Telefon Ab L M Speech recognition and control system and telephone
TWI297870B (en) * 2006-04-24 2008-06-11 Asustek Comp Inc Telephone system integrated with an electric device

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW446934B (en) * 1998-10-13 2001-07-21 Ericsson Telefon Ab L M Speech recognition and control system and telephone
TWI297870B (en) * 2006-04-24 2008-06-11 Asustek Comp Inc Telephone system integrated with an electric device

Also Published As

Publication number Publication date
TW201349862A (zh) 2013-12-01

Similar Documents

Publication Publication Date Title
US11631403B2 (en) Apparatus, system and method for directing voice input in a controlling device
US11763812B2 (en) Image display apparatus and method of controlling the same
JP5695447B2 (ja) テレビジョン装置及び遠隔操作装置
US10359991B2 (en) Apparatus, systems and methods for audio content diagnostics
US8041025B2 (en) Systems and arrangements for controlling modes of audio devices based on user selectable parameters
US20150243163A1 (en) Audio Based Remote Control Functionality
US20040006477A1 (en) Voice-controllable communication gateway for controlling multiple electronic and information appliances
US20030018479A1 (en) Electronic appliance capable of preventing malfunction in speech recognition and improving the speech recognition rate
US20100060715A1 (en) Communication system and method
US9596507B2 (en) Electronic device audio volume reduction in response to audio communication request
US20060235698A1 (en) Apparatus for controlling a home theater system by speech commands
KR20140087717A (ko) 디스플레이 장치 및 제어 방법
JP7467513B2 (ja) 端末、音声連携再生システム及びコンテンツ表示装置
JP2014021493A (ja) 外部入力制御方法及びそれを適用した放送受信装置
CN107566888A (zh) 多个多媒体播放设备的音频设置方法、多媒体播放系统
JP7374099B2 (ja) 制御デバイスにおいて音声入力を指示する装置、システム及び方法
TWI508559B (zh) 影音播放裝置與方法
US20160182935A1 (en) Method to control the rendering of a media content upon detection of a phone call
WO2023051083A1 (zh) 音频控制方法、电子设备和音频播放系统
CN103489462B (zh) 影音播放装置与方法
JP7159773B2 (ja) 音声操作装置、音声操作方法、および音声操作システム
JP2020200968A (ja) 電気機器
KR101517232B1 (ko) 이동 통신 단말기를 이용한 음성 송신 시스템
JP7216621B2 (ja) 電子機器、プログラムおよび音声認識方法
TW201721365A (zh) 語音控制型洗浴系統及其操作方法

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees