TWI741406B - 一種智慧設備控制方法、裝置、電腦可讀介質及計算裝置 - Google Patents

一種智慧設備控制方法、裝置、電腦可讀介質及計算裝置 Download PDF

Info

Publication number
TWI741406B
TWI741406B TW108141147A TW108141147A TWI741406B TW I741406 B TWI741406 B TW I741406B TW 108141147 A TW108141147 A TW 108141147A TW 108141147 A TW108141147 A TW 108141147A TW I741406 B TWI741406 B TW I741406B
Authority
TW
Taiwan
Prior art keywords
smart device
distance
broadcast
broadcast content
control method
Prior art date
Application number
TW108141147A
Other languages
English (en)
Other versions
TW202018587A (zh
Inventor
張勝美
李金鑫
宋奔
Original Assignee
大陸商北京獵戶星空科技有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 大陸商北京獵戶星空科技有限公司 filed Critical 大陸商北京獵戶星空科技有限公司
Publication of TW202018587A publication Critical patent/TW202018587A/zh
Application granted granted Critical
Publication of TWI741406B publication Critical patent/TWI741406B/zh

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J11/00Manipulators not otherwise provided for
    • B25J11/0005Manipulators having means for high-level communication with users, e.g. speech generator, face recognition means
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1694Programme controls characterised by use of sensors other than normal servo-feedback from position, speed or acceleration sensors, perception control, multi-sensor controlled systems, sensor fusion
    • B25J9/1697Vision controlled systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/008Artificial life, i.e. computing arrangements simulating life based on physical entities controlled by simulated intelligence so as to replicate intelligent life forms, e.g. based on robots replicating pets or humans in their appearance or behaviour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/50Depth or shape recovery
    • G06T7/55Depth or shape recovery from multiple images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/103Static body considered as a whole, e.g. static pedestrian or occupant recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Engineering & Computer Science (AREA)
  • Robotics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Mechanical Engineering (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Data Mining & Analysis (AREA)
  • User Interface Of Digital Computer (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Manipulator (AREA)
  • Image Analysis (AREA)

Abstract

本發明為智慧設備領域中的智慧設備控制方法、裝置、電腦可讀介質及計算裝置。本發明在智慧設備處於休眠狀態時,採集智慧設備周圍的圖像;若在採集的圖像中檢測到人物特徵,且具有人物特徵的目標與智慧設備之間的距離在第一指定距離內,則觸發智慧設備進行語音播報;語音播報後,若檢測到目標與智慧設備之間的距離在第二指定距離內,則喚醒智慧設備。由此,本發明能夠根據圖像檢測,確定周圍的使用者是否有互動意圖,並通過主動進行語音播報的形式,將有潛在互動意圖的使用者引導到智慧設備進行操作,以提高智慧設備的曝光率和使用率。

Description

一種智慧設備控制方法、裝置、電腦可讀介質及計算裝置
本發明屬於智慧設備技術領域,特別是關於慧設備控制方法、裝置、電腦可讀介質及計算裝置。
隨著人工智慧技術的不斷發展,越來越多的智慧設備(如機器人)進入人們的生活和工作領域。
如今各類的機器人能夠提供不同的功能,例如育兒機器人能夠從伺服器獲得童話故事、兒歌、詩歌等播放給小朋友。接待機器人能夠幫助使用者自助辦理一些服務(如銀行開卡服務)。
然而,智慧設備提供的功能雖然較為全面了,但是人們面對陌生的智慧設備仍無所適從,導致智慧設備的曝光率和使用率較低。
為解決前揭之問題,本發明實施例提供一種智慧設備控制方法、裝置、電腦可讀介質及計算裝置,用於解決現有技術中智慧設備的曝光率和使用率較低等的問題。
第一方面,本發明實施例提供一種智慧設備控制方法,該方法包括:在智慧設備處於休眠狀態時,採集該智慧設備周圍環境的圖像;若在採集的圖像中檢測到人物特徵且具有該人物特徵的目標與該智慧設備 之間的距離在第一指定距離內,則觸發該智慧設備進行語音播報;語音播報之後,若檢測到該目標與該智慧設備之間的距離在第二指定距離內,則喚醒該智慧設備,該第二指定距離小於該第一指定距離。
進一步的,該人物特徵包括以下特徵的至少一種:人臉特徵和人體特徵。
進一步的,該採集該智慧設備周圍環境的圖像,包括:即時採集該智慧設備前方物體的彩色圖像和深度圖像;若在採集的圖像中檢測到人物特徵且具有該人物特徵的目標與該智慧設備之間的距離在第一指定距離內,則觸發該智慧設備進行語音播報,包括:即時基於該彩色圖像進行人物特徵檢測;針對檢測到的每個人物特徵執行:確定具有該人物特徵的目標在深度圖像中的對應資料;根據具有該人物特徵的目標在深度圖像中的對應資料,確定具有該人物特徵的目標與該智慧設備的距離;若該距離在第一指定距離內,則觸發該智慧設備進行語音播報。
進一步的,該方法還包括:在語音播報過程中,若檢測到至少一個具有人物特徵的其他目標與該智慧設備之間的距離在該第一指定距離內,在語音播報完畢後,不重複進行語音播報。
進一步的,該方法還包括:在語音播報完畢且間隔設定時長後,若檢測到至少一個具有人物特徵的其他目標與該智慧設備之間的距離在該第一指定距離內,再次進行語音播報。
進一步的,觸發該智慧設備進行語音播報,包括:觸發該智慧設備採用大於預設音量的音量進行語音播報,該預設音量為該智慧設備喚醒後與目標互動時的音量。
進一步的,觸發該智慧設備進行語音播報,包括:觸發該智慧設備從預設播報內容集合中隨機選擇播報內容進行語音播報;或者觸發該智慧設備從預設播報內容集合中順序選擇播報內容進行語音播報;或者觸發該智慧設備對預設播報內容集合中的播報內容進行語音迴圈播報。
進一步的,該方法還包括:接收播報內容增加指令,將該播報內容增加指令中包含的播報內容添加至該播報內容集合中;或者接收播報內容修改指令,根據該播報內容修改指令對該播報內容集合中相應的播報內容進行修改;或者接收播報內容替換指令,根據該播報內容替換指令替換該播報內容集合中相應的播報內容。
進一步的,該方法還包括:進行語音播報的同時,在該智慧設備的螢幕上顯示預設表情。
第二方面,本發明還提供一種智慧設備控制裝置,該裝置包括:圖像採集模組,用於在智慧設備處於休眠狀態時,採集該智慧設備周圍環境的圖像; 預喚醒模組,用於若在採集的圖像中檢測到人物特徵且具有該人物特徵的目標與該智慧設備之間的距離在第一指定距離內,則觸發該智慧設備進行語音播報;喚醒模組,用於語音播報之後,若檢測到該目標與該智慧設備之間的距離在第二指定距離內,則喚醒該智慧設備,該第二指定距離小於該第一指定距離。
進一步的,該人物特徵包括以下特徵的至少一種:人臉特徵和人體特徵。
進一步的,圖像採集模組,用於即時採集該智慧設備前方物體的彩色圖像和深度圖像;預喚醒模組具體用於:即時基於該彩色圖像進行人物特徵檢測;針對檢測到的每個人物特徵執行:確定具有該人物特徵的目標在深度圖像中的對應資料;根據具有該人物特徵的目標在深度圖像中的對應資料,確定具有該人物特徵的目標與該智慧設備的距離;若該距離在第一指定距離內,則觸發該智慧設備進行語音播報。
進一步的,該預喚醒模組還用於:在語音播報過程中,若檢測到至少一個具有人物特徵的其他目標與該智慧設備之間的距離在該第一指定距離內,在語音播報完畢後,不重複進行語音播報。
進一步的,該預喚醒模組還用於:在語音播報完畢且間隔設定時長後,若檢測到至少一個具有人物特徵的其他目標與該智慧設備之間 的距離在該第一指定距離內,再次進行語音播報。
進一步的預喚醒模組具體用於觸發該智慧設備採用大於預設音量的音量進行語音播報,該預設音量為該智慧設備喚醒後與目標互動時的音量。
進一步的,預喚醒模組具體用於:觸發該智慧設備從預設播報內容集合中隨機選擇播報內容進行語音播報;或者觸發該智慧設備從預設播報內容集合中順序選擇播報內容進行語音播報;或者觸發該智慧設備對預設播報內容集合中的播報內容進行語音迴圈播報。
進一步的,該裝置還包括:播報內容維護模組,用於接收播報內容增加指令,將該播報內容增加指令中包含的播報內容添加至該播報內容集合中;或者接收播報內容修改指令,根據該播報內容修改指令對該播報內容集合中相應的播報內容進行修改;或者接收播報內容替換指令,根據該播報內容替換指令替換該播報內容集合中相應的播報內容。
進一步的,該裝置還包括:播報表情控制模組,用於進行語音播報的同時,在該智慧設備的螢幕上顯示預設表情。
第三方面,本發明還提供一種計算裝置,包括至少一個處理器;以及與該至少一個處理器通信連接的記憶體;其中,該記憶體存儲有 可被該至少一個處理器執行的指令,該指令被該至少一個處理器執行,以使該至少一個處理器能夠執行本發明實施例提供的任一智慧設備控制方法。
第四方面,本發明還提供了一種電腦存儲介質,其中,該電腦存儲介質存儲有電腦可執行指令,該電腦可執行指令用於使電腦執行本發明實施例中的任一智慧設備控制方法。
本發明提供的智慧設備控制方法、裝置和存儲介質。能夠根據圖像檢測,確定周圍較遠距離的使用者是否有互動意圖,並通過主動進行語音播報的形式,將有潛在互動意圖的使用者引導到智慧設備進行操作,從而提高智慧設備的曝光率和使用率。
本發明的其它特徵和優點將在隨後的說明書中闡述,並且,部分地從說明書中變得顯而易見,或者通過本發明實施例進行瞭解。本發明的目的和其他優點可通過所寫的說明書、申請專利範圍、以及附圖中所特別指出的結構來實現和獲得。
10‧‧‧使用者
11‧‧‧智慧設備
130‧‧‧計算裝置
131‧‧‧處理器
132‧‧‧記憶體
1321‧‧‧隨機存取記憶體
1322‧‧‧快取記憶體
1323‧‧‧唯讀記憶體
1324‧‧‧程式模組
1325‧‧‧程式/實用工具
133‧‧‧匯流排
134‧‧‧外部設備
135‧‧‧輸入/輸出介面
136‧‧‧網路介面卡
501‧‧‧圖像採集模組
502‧‧‧預喚醒模組
503‧‧‧喚醒模組
201-203‧‧‧步驟
401-410‧‧‧步驟
圖1為本發明實施例中的智慧設備控制的應用場景示意圖;
圖2為本發明實施例中的智慧設備控制方法的流程示意圖之一;
圖3為本發明實施例中的智慧設備控制方法的示意圖;
圖4為本發明實施例中的智慧設備控制方法的流程示意圖之二;
圖5為本發明實施例中的智慧設備控制裝置示意圖;
圖6為根據本發明實施方式的計算裝置的結構示意圖。
為了提高智慧設備的曝光率和使用率,讓人們能夠更加自然的和智慧設備互動,更加方便的使用智慧設備提供的服務,本發明實施例中提供一種智慧設備控制方法、裝置、電腦可讀介質及計算裝置。為了更好的理解本發明實施例提供的技術方案,這裡對該方案採用的一些名詞和基本原理做一下簡單說明。
名詞說明:在睡眠狀態之外,智慧設備可以包括兩個模式,如包括預喚醒模式和喚醒模式。
預喚醒模式:是使用者距離智慧設備較遠時的功能設計。在預喚醒模式下,智慧設備即時採集周圍環境圖像,並在檢測到人臉或人體特徵時,確定周圍有使用者存在,開啟語音播報功能,例如語音打招呼,播報自身能夠提供的服務等,以便於使用者瞭解智慧設備的功能,吸引使用者走近智慧設備,並使用智慧設備的具體功能。
喚醒模式:是使用者距離智慧設備較近時的功能設計,在喚醒模式下,智慧設備可以和使用者進行互動,依照使用者指令以完成相應的服務,也可以主動引導使用者以完成相應的服務等。
深度圖像:在3D(Dimensions,維度)電腦圖形中,Depth Map(深度圖像)是包含與視點的場景物件的表面的距離資訊的圖像。
人物特徵:用於描述人的特徵,如人臉特徵,人體特徵。
原理說明:為了能夠提高智慧設備的使用效率,本發明實施例中實現了智慧設備11採 用較為自然的互動方案,來引導使用者使用智慧設備完成相應服務。具體的,當使用者靠近智慧設備時,就像自然人靠近自然人一樣,雙方通過打招呼來發起談話。本發明中,當確定智慧設備前方有人時,智慧設備可以主動打招呼播報自身的功能。例如,銀行接待機器人能夠採用自然的對話模式播報「嗨,我是銀行助理,請問您需要辦理什麼服務」。這樣,智慧設備能夠通過自然互動的方式向使用者打招呼,吸引使用者和智慧設備互動,並引導使用者在智慧設備上完成操作。
進一步的,本發明實施例中為了盡可能的少打擾使用者,當判斷使用者離智慧設備較近時,才主動打招呼播報語音,而距離較遠時並不打招呼,這樣可以採用更為自然的方式引導使用者使用智慧設備。
為了便於進一步理解本發明實施例提供的技術方案,以下將描述具體之實施例以說明本發明之實施態樣,惟其並非用以限制本發明所欲保護之範疇。
如圖1所示,為本發明實施例提供的智慧設備控制方法的應用場景示意圖,該應用場景中包括使用者10、智慧設備11,智慧設備11可以即時採集前方圖像,然後根據圖像分析前方是否有人,若有人,且距離較近時,則進入預喚醒狀態,進行語音播報,以此引導使用者使用智慧設備。
需要說明的是,本發明實施例中的智慧設備可以是能夠移動的機器人也可以是放置在固定位置的機器人,智慧設備提供的功能可以是各行各業各種功能,如前所述的伴隨小朋友成長的智慧設備,銀行接待機器人等。
下面對本發明實施例提供的智慧設備控制方法做進一步介紹,如圖2所示,該方法包括以下步驟:
步驟201:在智慧設備處於休眠狀態時,採集該智慧設備周圍環境的圖像;
步驟202:若在採集的圖像中檢測到人物特徵且具有該人物特徵的目標與該智慧設備之間的距離在第一指定距離內,則觸發該智慧設備進行語音播報;其中,具體實施時,人物特徵檢測,可以進行人臉檢測和/或人體檢測,只要能夠確定圖像中包含人像均適用於本發明實施例;播報的語音可以為該智慧設備內置功能的服務提供者自行按需設置的。例如銀行可以設置其接待智慧設備播報:「嗨,我是銀行小秘,可以為個人使用者辦理**服務」;
步驟203:語音播報之後,若檢測到該目標與該智慧設備之間的距離在第二指定距離內,則喚醒該智慧設備,該第二指定距離小於該第一指定距離。
例如,第一指定距離為3公尺,第二指定距離為1.5公尺,即距離使用者在1.5-3公尺內則進行語音播報,之後,確定使用者靠近且距離在1.5公尺內,則可以進入喚醒模式,與使用者10進行互動。
這樣,本發明實施例中若目標與智慧設備的距離在第一指定距離內,則確定近距離內有人可能有互動意圖,然後通過語音播報實現和目標的打招呼,以便於引導目標靠近智慧設備。然後,在確定距離目標很近(即第二指定距離內)時,確定目標有互動意圖,開始進入喚醒模式進行互動。這樣,通過簡單的自然的方式將使用者導流到智慧設備上進行操作,從而提高智慧設備的使用率。
進一步的,確定智慧設備與目標的距離的方案可具體實施為 以下幾種。
方案1、採用距離感測器探測周圍環境的目標與智慧設備的距離。
這樣,是否進行語音播報的方案可理解為當檢測到人物特徵且探測周圍環境的目標與智慧設備的距離在第一指定距離內時,則可觸發該智慧設備進行語音播報。否則,即使檢測到人物特徵、但距離感測器沒有探測到物體時,也不觸發該智慧設備進行語音播報。也即,目標距離太遠則確定不存在具有互動意圖的使用者,無需語音播報進行導流。
相應的,若沒有檢測到人物特徵,無論距離感測器是否探測到物體(該物體可能是桌子,遮擋物等),都不存在具有互動意圖的使用者10,同樣不會觸發語音播報。
方案2:可以採用RGB-D攝影機來採集圖像,然後進行判斷。
即即時採集該智慧設備前方物體的彩色圖像和深度圖像;然後,即時基於該彩色圖像進行人物特徵檢測;在檢測到人物特徵後,針對檢測到的每個人物特徵執行:確定該人物特徵的目標在深度圖像中的對應資料;根據具有該人物特徵的目標在深度圖像中的對應資料,確定具有該人物特徵的目標與該智慧設備的距離;若該距離在第一指定距離內,則觸發該智慧設備進行語音播報。
具體實施時,可以採用紅外線感測器和紅外線相機獲取深度圖像(Depth圖像),即通過紅外線感測器發射紅外線,紅外線遇到遮擋物後會反射給紅外線相機,紅外線相機根據捕捉的紅外線成像,得到紅外線圖像中各像素的深度資料。RGB-D攝影機彩色圖像(即RGB(red、green、 blue,紅綠藍)圖像)和Depth圖像是校準的,因而兩圖像的像素點之間具有一一對應關係。故此,根據檢測到的人物特徵的各像素點,可以確定具有該人物特徵的目標和智慧設備的距離。由於人物特徵像素點有多個,具體實施時,可以採用距離最近的像素點的距離作為距離智慧設備的距離,也可以採用最遠距離,當然也可以採用人物特徵各像素點的距離平均值,本發明對此不作限定。
本發明實施例中,還可以當目標足夠近時,直接判斷該目標具有互動意圖,而進入喚醒模式。如圖3所示,第一指定距離為(1.5公尺-3公尺),第二指定距離為0-1.5公尺。連續獲取圖片後,分析具有人物特徵的目標和智慧設備的距離,當距離在1.5-3公尺內時,則預喚醒,當距離在1.5公尺以內時則直接喚醒。當然,具體實施時,具體的第一指定距離和第二指定距離可以根據實驗或實際需要確定,本發明對此並不作限定。
關於語音播報,具體實施時,智慧設備管理人員可以通過語音播報頁面自行輸入播報的檔(該檔的形式可以是文字檔或音訊檔)並保存。然後需要語音播報時,由智慧設備根據預存的檔進行語音播報。若是文字檔,則可以採用TTS(文本語音合成)技術進行播報。
當然具體實施時可以設置多條播報內容構成預設播報內容集合。語音播報時觸發智慧設備從預設播報內容集合中隨機選擇播報內容進行語音播報,或者,觸發該智慧設備從預設播報內容集合中順序選擇播報內容進行語音播報,亦或者,觸發該智慧設備對預設播報內容集合中的播報內容進行語音迴圈播報。
當然,隨機選擇時,可以隨機選擇一條,也可以隨機選擇多 條進行播報。具體實施時,每條語音的字數具有字數上限,語音的條數也可以具有上限(如10條)。
相應的,使用者也可以對自己配置的播報內容進行更新,具體可包括:接收播報內容增加指令,將該播報內容增加指令中包含的播報內容添加至該播報內容集合中;或者,接收播報內容修改指令,根據該播報內容修改指令對該播報內容集合中相應的播報內容進行修改;亦或者,接收播報內容替換指令,根據該播報內容替換指令替換該播報內容集合中相應的播報內容。
由此,使用者通過上述增刪改的操作可以實現對播報內容的維護。
關於語音播報除了上述內容,下面將補充幾種場景的對語音內容的播報進行補充說明,包括如下。
1)、在語音播報過程中,若檢測到至少一個具有人物特徵的其他目標與該智慧設備之間的距離在該第一指定距離內,在語音播報完畢後,不重複進行語音播報。
也即,連續監測到具有人物特徵的目標距離智慧設備11在第一指定距離內時,不會連續重複播報語音。這樣,能夠避免連續打擾使用者,讓使用者產生聽覺疲勞。同時,也能節約由於語音播報耗費的資源。
2)、本發明實施例中,在語音播報完畢且間隔設定時長後,若檢測到至少一個具有人物特徵的其他目標與該智慧設備之間的距離在該第一指定距離內,再次進行語音播報。
例如,本次語音播報完畢後,間隔5秒鐘,5秒鐘之後若滿足 語音播報條件時,則再次進行語音播報。這樣,會週期性檢測並確定是否進行語音播報。週期內可以通過避免持續播報語音導致電能和處理資源的損耗。這樣,可以實現在資源的使用和及時導流使用者之間實現平衡。
3)、語音播報時,可以觸發該智慧設備採用大於預設音量的音量進行語音播報,該預設音量為該智慧設備喚醒後與目標互動時的音量。這樣,智慧設備播報的語音內容可以引起使用者注意,以便於能夠更加有效的將具有潛在互動意圖的使用者導流到智慧設備上操作。
4)、為了便於能夠讓使用者以更加自然的方式理解和收聽播報的內容,本發明中進行語音播報的同時,還可以在該智慧設備的螢幕上顯示預設表情。如,露出一個笑臉,以便於使用者除了在聽覺上能夠對智慧設備產生興趣,在視覺上也能進一步的對智慧設備產生興趣,以便於將使用者導流到智慧設備上。
本發明實施例中,具體實施時,人物特徵檢測和語音播報可以為獨立的兩個程式,即圖像的採集和人物特徵檢測可以即時進行,並在檢測到人物特徵時確定具有該人物特徵的目標與智慧設備之間的距離,若該距離在第一指定距離範圍內,則發送消息給語音播報程式,語音播報程式根據收到的消息確定是否進行語音播報。
按照【0058】段中的間隔設定時長進行語音播報,對這兩個程式的配合使用進行說明。具體可實施為假設指定時長為5秒,一開始,語音播報程式在收到人物特徵檢測程式發送的消息後,開始播報:「嗨,我是接待智慧設備小秘請問有什麼需求?」,在該語音還沒有播報完,又收到人物特徵檢測程式的消息時,則忽略該消息。播報完開始計時,若在5秒之內, 收到人物特徵檢測程式的消息,則丟棄該消息。若在5秒之後,收到消息,則進行語音播報。
具體實施時,還可以根據採集的圖像確定是否有人進入智慧設備的視野或離開智慧設備的視野。若在語音播報過程中,視野中所有人離開智慧設備視野時,則可以終止播報,達到節約資源的目的。
為了便於系統的理解本發明實施例提供的智慧設備的控制方法,結合圖4對此進行說明,包括以下步驟:
步驟401:在智慧設備處於休眠狀態時,採集該智慧設備周圍環境的圖像。
步驟402:即時基於該彩色圖像進行人物特徵檢測。
步驟403:若檢測到人臉,則針對檢測到的人臉,在深度圖像中查找該人臉的對應資料;並根據該對應資料,確定該人臉對應的目標與智慧設備的距離。
步驟404:確定是否存在至少一個目標距離智慧設備的距離在1.5公尺內,若是,執行步驟405,否則,執行步驟406。
步驟405:喚醒該智慧設備。
步驟406:確定是否存在至少一個目標距離智慧設備的距離在1.5-3公尺內,若是,執行步驟407,否則,執行步驟401。
步驟407:確定當前是否正在進行語音播報,若是,則返回執行步驟401,若否,則執行步驟408。
步驟408:距離上次語音播報的時長是否達到設定時長,若否,則返回執行步驟401,是則,執行步驟409。
步驟409:隨機選擇一條播報內容,並採用大於指定分貝的音量播報選擇的 播報內容。
步驟410:語音播報完畢後,確定目標與智慧設備的距離,之後執行步驟404。
基於相同的發明構思,本發明實施例還提供一種智慧設備控制裝置。如圖5所示,該裝置包括:
圖像採集模組501,用於在智慧設備處於休眠狀態時,採集該智慧設備周圍環境的圖像;
預喚醒模組502,用於若在採集的圖像中檢測到人物特徵且具有該人物特徵的目標與該智慧設備之間的距離在第一指定距離內,則觸發該智慧設備進行語音播報;
喚醒模組503,用於語音播報之後,若檢測到該目標與該智慧設備之間的距離在第二指定距離內,則喚醒該智慧設備,該第二指定距離小於該第一指定距離。
進一步的,該人物特徵包括以下特徵的至少一種:人臉特徵和人體特徵。
進一步的,圖像採集模組,用於即時採集該智慧設備前方物體的彩色圖像和深度圖像;預喚醒模組具體用於:即時基於該彩色圖像進行人物特徵檢測;針對檢測到的每個人物特徵執行:確定具有該人物特徵的目標在深度圖像中的對應資料;根據具有該人物特徵的目標在深度圖像中的對應資料,確定具有該人物特徵的目標與該智慧設備的距離; 若該距離在第一指定距離內,則觸發該智慧設備進行語音播報。
進一步的,該裝置還包括:預喚醒模組還用於在語音播報過程中,若檢測到至少一個具有人物特徵的其他目標與該智慧設備之間的距離在該第一指定距離內,在語音播報完畢後,不重複進行語音播報。
進一步的,該預喚醒模組還用於在語音播報完畢且間隔設定時長後,若檢測到至少一個具有人物特徵的其他目標與該智慧設備之間的距離在該第一指定距離內,再次進行語音播報。
進一步的,預喚醒模組具體用於觸發該智慧設備11採用大於預設音量的音量進行語音播報,該預設音量為該智慧設備11喚醒後與目標互動時的音量。
進一步的,預喚醒模組具體用於:觸發該智慧設備從預設播報內容集合中隨機選擇播報內容進行語音播報;或者觸發該智慧設備從預設播報內容集合中順序選擇播報內容進行語音播報;或者觸發該智慧設備對預設播報內容集合中的播報內容進行語音迴圈播報。
進一步的,該裝置還包括:播報內容維護模組,用於接收播報內容增加指令,將該播報內容增加指令中包含的播報內容添加至該播報內容集合中;或者接收播報內容修改指令,根據該播報內容修改指令對該播報內容集合中相應的播報內容進行修改;或者 接收播報內容替換指令,根據該播報內容替換指令替換該播報內容集合中相應的播報內容。
進一步的,該裝置還包括:播報表情控制模組,用於進行語音播報的同時,在該智慧設備的螢幕上顯示預設表情。
在介紹了本發明示例性實施方式的智慧設備控制方法、裝置之後,接下來,介紹根據本發明的另一示例性實施方式的計算裝置130。
所屬技術領域的通常知識者能夠理解,本發明的各個方面可以實現為系統、方法或程式產品。因此,本發明的各個方面可以具體實現為以下形式,即:完全的硬體實施方式、完全的軟體實施方式(包括韌體、微代碼等),或硬體和軟體方面結合的實施方式,這裡可以統稱為「電路」、「模組」或「系統」。
在一些可能的實施方式中,根據本發明的計算裝置可以至少包括至少一個處理器、以及至少一個記憶體。其中,記憶體存儲有程式碼,當程式碼被處理器執行時,使得處理器執行本說明書上述描述的根據本發明各種示例性實施方式的智慧設備控制方法中的步驟。例如,處理器可以執行如圖2中所示的步驟201-203。
下面參照圖6來描述根據本發明的這種實施方式的計算裝置130。圖6顯示的計算裝置130僅僅是一個示例,不應對本發明實施例的功能和使用範圍帶來任何限制。
如圖6所示,計算裝置130以通用計算裝置的形式表現。計算裝置130的元件可以包括但不限於:上述至少一個處理器131、上述至少一 個記憶體132、連接不同系統元件(包括記憶體132和處理器131)的匯流排133。
匯流排133表示幾類匯流排結構中的一種或多種,包括記憶體匯流排或者記憶體控制器、週邊匯流排、處理器或者使用多種匯流排結構中的任意匯流排結構的局域匯流排。
記憶體132可以包括易失性記憶體形式的可讀介質,例如隨機存取記憶體(RAM)1321和/或快取記憶體1322,還可以進一步包括唯讀記憶體(ROM)1323。
記憶體132還可以包括具有一組(至少一個)程式模組1324的程式/實用工具1325,這樣的程式模組1324包括但不限於:作業系統、一個或者多個應用程式、其它程式模組以及程式資料,這些示例中的每一個或某種組合中可能包括網路環境的實現。
計算裝置130也可以與一個或多個外部設備134(例如鍵盤、指向設備等)通信,還可與一個或者多個使得使用者能與計算裝置130互動的設備通信,和/或與使得該計算裝置130能與一個或多個其它計算裝置進行通信的任何設備(例如路由器、數據機等等)通信。這種通信可以通過輸入/輸出(I/O)介面135進行。並且,計算裝置130還可以通過網路介面卡136與一個或者多個網路(例如局域網(LAN),廣域網路(WAN)和/或公共網路,例如網際網路)通信。如圖所示,網路介面卡136通過匯流排133與用於計算裝置130的其它模組通信。應當理解,儘管圖中未示出,可以結合計算裝置130使用其它硬體和/或軟體模組,包括但不限於:微代碼、裝置驅動程式、冗餘處理器、外部磁片驅動陣列、RAID系統、磁帶驅動器以及資 料備份存儲系統等。
在一些可能的實施方式中,本發明提供的智慧設備控制方法的各個方面還可以實現為一種程式產品的形式,其包括程式碼,當程式產品在電腦設備上運行時,程式碼用於使電腦設備執行本說明書上述描述的根據本發明各種示例性實施方式的智慧設備控制方法中的步驟,例如,電腦設備可以執行如圖2中所示的步驟201-203。
程式產品可以採用一個或多個可讀介質的任意組合。可讀介質可以是可讀信號介質或者可讀存儲介質。可讀存儲介質例如可以是──但不限於──電、磁、光、電磁、紅外線、或半導體的系統、裝置或器件,或者任意以上的組合。可讀存儲介質的更具體的例子(非窮舉的列表)包括:具有一個或多個導線的電連接、隨身硬碟、硬碟、隨機存取記憶體(RAM)、唯讀記憶體(ROM)、可抹拭可程式唯讀記憶體(EPROM或快閃記憶體)、光纖、唯讀記憶光碟(CD-ROM)、光記憶體、磁記憶體、或者上述的任意合適的組合。
本發明的實施方式的用於智慧設備控制的程式產品可以採用唯讀記憶光碟(CD-ROM)並包括程式碼,並可以在計算裝置上運行。然而,本發明的程式產品不限於此,在本發明中,可讀存儲介質可以是任何包含或存儲程式的有形介質,該程式可以被指令執行系統、裝置或者器件使用或者與其結合使用。
可讀信號介質可以包括在基帶中或者作為載波一部分傳播的資料信號,其中承載了可讀程式碼。這種傳播的資料信號可以採用多種形式,包括──但不限於──電磁信號、光信號或上述的任意合適的組合。 可讀信號介質還可以是可讀存儲介質以外的任何可讀介質,該可讀介質可以發送、傳播或者傳輸用於由指令執行系統、裝置或者器件使用或者與其結合使用的程式。
可讀介質上包含的程式碼可以用任何適當的介質傳輸,包括──但不限於──無線、有線、光纜、RF等等,或者上述的任意合適的組合。
可以以一種或多種程式設計語言的任意組合來編寫用於執行本發明操作的程式碼,程式設計語言包括物件導向的程式設計語言-諸如Java、C++等,還包括常規的過程式程式設計語言-諸如「C」語言或類似的程式設計語言。程式碼可以完全地在使用者計算裝置上執行、部分地在使用者設備上執行、作為一個獨立的套裝軟體執行、部分在使用者計算裝置上部分在遠端計算裝置上執行、或者完全在遠端計算裝置或伺服器上執行。在涉及遠端計算裝置的情形中,遠端計算裝置可以通過任意種類的網路──包括局域網(LAN)或廣域網路(WAN)-連接到使用者計算裝置,或者,可以連接到外部計算裝置(例如利用網際網路服務提供者來通過網際網路連接)。
應當注意,儘管在本發明詳細描述中提及了裝置的若干單元或子單元,但是這種劃分僅僅是示例性的並非強制性的。實際上,根據本發明的實施方式,本發明描述的兩個或更多單元的特徵和功能可以在一個單元中具體化。反之,本發明描述的一個單元的特徵和功能可以進一步劃分為由多個單元來具體化。
此外,儘管在附圖中以特定順序描述了本發明方法的操作, 但是,這並非要求或者暗示必須按照該特定順序來執行這些操作,或是必須執行全部所示的操作才能實現期望的結果。附加地或備選地,可以省略某些步驟,將多個步驟合併為一個步驟執行,和/或將一個步驟分解為多個步驟執行。
本領域具有通常知識者應明白,本發明的實施例可提供為方法、系統、或電腦程式產品。因此,本發明可採用完全硬體實施例、完全軟體實施例、或結合軟體和硬體方面的實施例的形式。而且,本發明可採用在一個或多個其中包含有電腦可用程式碼的電腦可用存儲介質(包括但不限於磁碟記憶體、CD-ROM、光學記憶體等)上實施的電腦程式產品的形式。
本發明是參照根據本發明實施例的方法、設備(系統)、和電腦程式產品的流程圖和/或方框圖來描述的。應理解可由電腦程式指令實現流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結合。可提供這些電腦程式指令到通用電腦、專用電腦、嵌入式處理機或其他可程式設計資料處理設備的處理器以產生一個機器,使得通過電腦或其他可程式設計資料處理設備的處理器執行的指令產生用於實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。
這些電腦程式指令也可存儲在能引導電腦或其他可程式設計資料處理設備以特定方式工作的電腦可讀記憶體中,使得存儲在該電腦可讀記憶體中的指令產生包括指令裝置的製造品,該指令裝置實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。
這些電腦程式指令也可裝載到電腦或其他可程式設計資料處理設備上,使得在電腦或其他可程式設計設備上執行一系列操作步驟以產生電腦實現的處理,從而在電腦或其他可程式設計設備上執行的指令提供用於實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。
在上列詳細說明係針對本發明之一可行實施例之具體說明,惟該實施例並非用以限制本發明之專利範圍,凡未脫離本發明技藝精神所為之等效實施或變更,均應包含於本案之專利範圍中。
201-203‧‧‧步驟

Claims (12)

  1. 一種智慧設備控制方法,該智慧設備控制方法包括:
    在智慧設備處於休眠狀態時,採集該智慧設備周圍環境的圖像;
    若在採集的圖像中檢測到人物特徵且具有該人物特徵的目標與該智慧設備之間的距離在第一指定距離內,則觸發該智慧設備進行語音播報;
    語音播報之後,若檢測到該目標與該智慧設備之間的距離在第二指定距離內,則喚醒該智慧設備,該第二指定距離小於該第一指定距離。
  2. 如申請專利範圍第1項所述的智慧設備控制方法,該人物特徵包括以下特徵的至少一種:人臉特徵和人體特徵。
  3. 如申請專利範圍第1項所述的智慧設備控制方法,該採集該智慧設備周圍環境的圖像,包括:
    即時採集該智慧設備前方物體的彩色圖像和深度圖像;
    若在採集的圖像中檢測到人物特徵且具有該人物特徵的目標與該智慧設備之間的距離在第一指定距離內,則觸發該智慧設備進行語音播報,包括:
    即時基於該彩色圖像進行人物特徵檢測;
    針對檢測到的每個人物特徵執行:
    確定具有該人物特徵的目標在深度圖像中的對應資料;
    根據具有該人物特徵的目標在深度圖像中的對應資料,確定具有該人物特徵的目標與該智慧設備的距離;
    若該距離在第一指定距離內,則觸發該智慧設備進行語音播報。
  4. 如申請專利範圍第1項所述的智慧設備控制方法,該智慧設備控制方法 還包括:
    在語音播報過程中,若檢測到至少一個具有人物特徵的其他目標與該智慧設備之間的距離在該第一指定距離內,在語音播報完畢後,不重複進行語音播報。
  5. 如申請專利範圍第1項所述的智慧設備控制方法,該智慧設備控制方法還包括:
    在語音播報完畢且間隔設定時長後,若檢測到至少一個具有人物特徵的其他目標與該智慧設備之間的距離在該第一指定距離內,再次進行語音播報。
  6. 如申請專利範圍第1項所述的智慧設備控制方法,觸發該智慧設備進行語音播報,包括:
    觸發該智慧設備採用大於預設音量的音量進行語音播報,該預設音量為該智慧設備喚醒後與目標互動時的音量。
  7. 如申請專利範圍第1至6項中任一項所述的智慧設備控制方法,觸發該智慧設備進行語音播報,包括:
    觸發該智慧設備從預設播報內容集合中隨機選擇播報內容進行語音播報;或者
    觸發該智慧設備從預設播報內容集合中順序選擇播報內容進行語音播報;或者
    觸發該智慧設備對預設播報內容集合中的播報內容進行語音迴圈播報。
  8. 如申請專利範圍第7項所述的智慧設備控制方法,該智慧設備控制方法還包括:
    接收播報內容增加指令,將該播報內容增加指令中包含的播報內容添加至該播報內容集合中;或者
    接收播報內容修改指令,根據該播報內容修改指令對該播報內容集合中相應的播報內容進行修改;或者
    接收播報內容替換指令,根據該播報內容替換指令替換該播報內容集合中相應的播報內容。
  9. 如申請專利範圍第1至6項中任一項所述的智慧設備控制方法,該智慧設備控制方法還包括:
    進行語音播報的同時,在該智慧設備的螢幕上顯示預設表情。
  10. 一種智慧設備控制裝置,該裝置包括:
    圖像採集模組,用於在智慧設備處於休眠狀態時,採集該智慧設備周圍環境的圖像;
    預喚醒模組,用於若在採集的圖像中檢測到人物特徵且具有該人物特徵的目標與該智慧設備之間的距離在第一指定距離內,則觸發該智慧設備進行語音播報;
    喚醒模組,用於語音播報之後,若檢測到該目標與該智慧設備之間的距離在第二指定距離內,則喚醒該智慧設備,該第二指定距離小於該第一指定距離。
  11. 一種電腦可讀介質,存儲有電腦可執行指令,該電腦可執行指令用於執行如申請專利範圍第1至9項中任一項所述的智慧設備控制方法。
  12. 一種計算裝置,包括:至少一個處理器;以及與該至少一個處理器通信連接的記憶體;其中,該記憶體存儲有可被該至少一個處理器執行的指 令,該指令被該至少一個處理器執行,以使該至少一個處理器能夠執行如申請專利範圍第1至9項中任一項所述的智慧設備控制方法。
TW108141147A 2018-11-13 2019-11-13 一種智慧設備控制方法、裝置、電腦可讀介質及計算裝置 TWI741406B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201811346631.3A CN109543578B (zh) 2018-11-13 2018-11-13 智能设备控制方法、装置和存储介质
CN201811346631.3 2018-11-13

Publications (2)

Publication Number Publication Date
TW202018587A TW202018587A (zh) 2020-05-16
TWI741406B true TWI741406B (zh) 2021-10-01

Family

ID=65847106

Family Applications (1)

Application Number Title Priority Date Filing Date
TW108141147A TWI741406B (zh) 2018-11-13 2019-11-13 一種智慧設備控制方法、裝置、電腦可讀介質及計算裝置

Country Status (6)

Country Link
US (1) US11247342B2 (zh)
EP (1) EP3866054B1 (zh)
JP (1) JP7204912B2 (zh)
CN (1) CN109543578B (zh)
TW (1) TWI741406B (zh)
WO (1) WO2020098421A1 (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109543578B (zh) * 2018-11-13 2020-12-22 北京猎户星空科技有限公司 智能设备控制方法、装置和存储介质
CN109940638B (zh) * 2019-04-26 2021-04-16 北京猎户星空科技有限公司 机器人、机器人控制方法、装置、存储介质和控制器
CN110253595B (zh) * 2019-06-21 2022-01-21 北京猎户星空科技有限公司 一种智能设备控制方法和装置
CN112207812B (zh) * 2019-07-12 2024-07-16 阿里巴巴集团控股有限公司 设备控制方法、设备、系统及存储介质
CN110427887B (zh) * 2019-08-02 2023-03-10 腾讯科技(深圳)有限公司 一种基于智能的会员身份识别方法及装置
CN113556649B (zh) * 2020-04-23 2023-08-04 百度在线网络技术(北京)有限公司 智能音箱的播报控制方法和装置
CN112130918B (zh) * 2020-09-25 2024-07-23 深圳市欧瑞博科技股份有限公司 智能设备唤醒方法、装置、系统及智能设备
CN116156270A (zh) * 2021-11-23 2023-05-23 成都极米科技股份有限公司 一种信息播报控制方法、装置、设备及存储介质
CN114047901B (zh) * 2021-11-25 2024-03-15 阿里巴巴(中国)有限公司 人机交互方法及智能设备
CN114310909A (zh) * 2022-01-26 2022-04-12 美的集团(上海)有限公司 一种机器人及其控制方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI576825B (zh) * 2015-01-12 2017-04-01 芋頭科技(杭州)有限公司 一種機器人系統的聲音識別系統及方法
TWI621071B (zh) * 2017-08-31 2018-04-11 國立勤益科技大學 使用深度學習於車牌與人臉辨識之門禁管理系統

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04335399A (ja) * 1991-05-11 1992-11-24 Colleen Denshi Kk 音量自動調節機能を備えた音声出力装置
JP2003122382A (ja) * 2001-10-11 2003-04-25 Seiko Epson Corp 携帯型の複合型再生装置
JP5732632B2 (ja) * 2011-02-03 2015-06-10 株式会社国際電気通信基礎技術研究所 ロボットシステムおよびそれに用いる空間陣形認識装置
JP2013003221A (ja) * 2011-06-14 2013-01-07 Tomy Co Ltd 楽音出力装置
JP5803470B2 (ja) * 2011-09-15 2015-11-04 富士ゼロックス株式会社 電力供給制御装置、画像処理装置、電力供給制御プログラム
US20140313303A1 (en) * 2013-04-18 2014-10-23 Digimarc Corporation Longitudinal dermoscopic study employing smartphone-based image registration
KR102158208B1 (ko) 2013-07-26 2020-10-23 엘지전자 주식회사 전자기기 및 그것의 제어 방법
CN104305648B (zh) 2014-10-28 2016-03-16 广东小天才科技有限公司 一种节能手环及应用于该节能手环的控制方法
JP2017069876A (ja) * 2015-10-01 2017-04-06 富士ゼロックス株式会社 処理装置
JP6610349B2 (ja) * 2016-03-10 2019-11-27 大日本印刷株式会社 案内ロボット制御システム、プログラム及び案内ロボット
WO2017100641A1 (en) 2015-12-11 2017-06-15 SomniQ, Inc. Apparatus, system, and methods for interfacing with a user and/or external apparatus by stationary state detection
JP6599803B2 (ja) * 2016-03-08 2019-10-30 シャープ株式会社 発話装置
US20180053504A1 (en) 2016-08-19 2018-02-22 Otis Elevator Company Intention recognition for triggering voice recognition system
JP2018067785A (ja) * 2016-10-19 2018-04-26 前川 博文 コミュニケーションロボットシステム
JP2018152704A (ja) * 2017-03-13 2018-09-27 富士ゼロックス株式会社 情報処理装置
JP6673276B2 (ja) * 2017-03-28 2020-03-25 カシオ計算機株式会社 音声検出装置、音声検出方法、及びプログラム
CN106956274A (zh) * 2017-03-28 2017-07-18 旗瀚科技有限公司 一种机器人唤醒方法
CN108153169A (zh) * 2017-12-07 2018-06-12 北京康力优蓝机器人科技有限公司 导览模式切换方法、系统和导览机器人
CN107972048A (zh) * 2017-12-28 2018-05-01 沈阳建筑大学 一种智能多功能导游机器人及其控制方法
US10709335B2 (en) * 2017-12-31 2020-07-14 Google Llc Infant monitoring system with observation-based system control and feedback loops
CN108733420B (zh) * 2018-03-21 2022-04-29 北京猎户星空科技有限公司 智能设备的唤醒方法、装置、智能设备和存储介质
CN108733417A (zh) * 2018-03-21 2018-11-02 北京猎户星空科技有限公司 智能设备的工作模式选择方法和装置
CN108519819A (zh) * 2018-03-30 2018-09-11 北京金山安全软件有限公司 智能设备的处理方法、装置、智能设备及介质
CN109543578B (zh) 2018-11-13 2020-12-22 北京猎户星空科技有限公司 智能设备控制方法、装置和存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI576825B (zh) * 2015-01-12 2017-04-01 芋頭科技(杭州)有限公司 一種機器人系統的聲音識別系統及方法
TWI621071B (zh) * 2017-08-31 2018-04-11 國立勤益科技大學 使用深度學習於車牌與人臉辨識之門禁管理系統

Also Published As

Publication number Publication date
CN109543578A (zh) 2019-03-29
TW202018587A (zh) 2020-05-16
JP7204912B2 (ja) 2023-01-16
CN109543578B (zh) 2020-12-22
EP3866054B1 (en) 2023-12-06
EP3866054C0 (en) 2023-12-06
EP3866054A1 (en) 2021-08-18
WO2020098421A1 (zh) 2020-05-22
EP3866054A4 (en) 2021-12-01
JP2022507447A (ja) 2022-01-18
US11247342B2 (en) 2022-02-15
US20210354306A1 (en) 2021-11-18

Similar Documents

Publication Publication Date Title
TWI741406B (zh) 一種智慧設備控制方法、裝置、電腦可讀介質及計算裝置
CN109940638B (zh) 机器人、机器人控制方法、装置、存储介质和控制器
CN105930073A (zh) 用于支持电子设备中的通信的方法和装置
CN110253595B (zh) 一种智能设备控制方法和装置
CN107704169B (zh) 虚拟人的状态管理方法和系统
CN107087101A (zh) 用于提供动态全景功能的装置和方法
WO2020228326A1 (zh) 一种可视化三维扫描建模方法、系统、设备及存储介质
CN107995101A (zh) 一种用于将语音消息转为文本信息的方法与设备
AU2014200039A1 (en) User interface method and system for use in mobile terminal
US20210335004A1 (en) Texture-based pose validation
CN105122353A (zh) 用于虚拟个人助理系统的自然人-计算机交互
CN106572131B (zh) 物联网中媒体数据分享的方法及系统
CN109885164A (zh) 智能设备控制方法、装置和存储介质
CN104780459A (zh) 一种即时视频中的特效加载方法和电子设备
CN106653020A (zh) 一种基于深度学习的智慧视听设备多业务控制方法及系统
US20230388832A1 (en) Method for detecting video surveillance device and electronic device
US20240070976A1 (en) Object relighting using neural networks
KR20230161516A (ko) 햅틱 피드백 응답을 갖는 가상 현실 인터페이스
CN108762512A (zh) 人机交互装置、方法及系统
KR20230160905A (ko) 햅틱 및 오디오 피드백 응답을 갖는 인터페이스
KR20240100386A (ko) 포인트 및 클린
CN111312243A (zh) 设备交互方法和装置
WO2018107318A1 (zh) 一种可视化装修设计方法及其装置、机器人
CN110162350A (zh) 通知栏信息的显示方法、装置、服务器及存储介质
WO2018023513A1 (zh) 一种基于运动识别的家居控制方法