TWI646444B

TWI646444B - 一種喚醒智慧機器人的方法及智慧機器人

Info

Publication number: TWI646444B
Application number: TW106105868A
Authority: TW
Inventors: 陳明修
Original assignee: 芋頭科技(杭州)有限公司
Priority date: 2016-02-23
Filing date: 2017-02-22
Publication date: 2019-01-01
Also published as: JP2019512826A; US20190057247A1; TW201823927A; EP3422246A4; KR20180111859A; WO2017143948A1; EP3422246A1; CN107102540A

Abstract

本發明公開一種喚醒智慧機器人的方法及智慧機器人。方法包括：步驟S1，採用智慧機器人上的圖像採集裝置獲取圖像資訊；步驟S2，判斷圖像資訊內是否存在人臉資訊：若不存在，則返回步驟S1；步驟S3，提取人臉資訊上的多個特徵點資訊，並根據特徵點資訊判斷人臉資訊是否表示正對圖像採集裝置的正面人臉，並在判斷人臉資訊表示正面人臉時轉向步驟S4；步驟S4，喚醒智慧機器人，隨後退出。上述技術方案能夠提供使用者一種不需要任何動作就能喚醒智慧機器人的操作方法，降低使用者喚醒智慧機器人的操作複雜度，提升使用者的使用體驗。

Description

一種喚醒智慧機器人的方法及智慧機器人

本發明涉及智慧設備技術領域，尤其涉及一種喚醒智慧機器人的方法及智慧機器人。

現有技術中，對於智慧機器人的操作通常包括以下幾種：1）對於存在輸入設備的智慧機器人，可以通過相應的輸入設備輸入指令，例如通過外接鍵盤，本身具備的觸摸屏或者其他遙控輸入設備等輸入控制指令，以控制智慧機器人執行相應操作；2）對於一些智慧機器人而言，可以通過語音輸入的方式進行控制，智慧機器人根據內置的語音識別模型識別輸入語音，並進而執行相應操作；3）同樣地，對於一些智慧機器人而言，可以通過做手勢的方式進行控制，智慧機器人根據內置的手勢識別模型識別該手勢，並進而執行相應操作。

基於上述設定，在一般的智慧機器人中，執行喚醒操作通常也通過上述幾種方式進行，較爲常見的爲通過輸入特定的語音語句（例如使用者對智慧機器人說「Hi，你好」等指定的語句）或者通過做特定的手勢（例如使用者對智慧機器人做揮手等指定的手勢）來喚醒智慧機器人。但是無論基於手勢的喚醒操作還是基於語音的喚醒操作，都需要使用者進行一定的行爲輸出，當使用者沒有任何肢體動作或者語音輸出時，均無法觸發智慧機器人的喚醒操作。因此導致喚醒智慧機器人的操作較爲複雜，降低使用者的使用體驗。

根據現有技術中存在的問題，現提供一種喚醒智慧機器人的方法及智慧機器人的技術方案，旨在提供使用者一種不需要任何動作就能喚醒智慧機器人的操作方法，降低使用者喚醒智慧機器人的操作複雜度，提升使用者的使用體驗。

上述技術方案具體包括：

一種喚醒智慧機器人的方法，其中，包括：

步驟S1，採用智慧機器人上的圖像採集裝置獲取圖像資訊；

步驟S2，判斷圖像資訊內是否存在人臉資訊：

若不存在，則返回步驟S1；

步驟S3，提取人臉資訊上的多個特徵點資訊，並根據特徵點資訊判斷人臉資訊是否表示正對圖像採集裝置的正面人臉，並在判斷人臉資訊表示正面人臉時轉向步驟S4；

步驟S4，喚醒智慧機器人，隨後退出。

優選的，該喚醒智慧機器人的方法，其中，步驟S2中，採用人臉檢測器判斷圖像資訊內是否存在人臉資訊。

優選的，該喚醒智慧機器人的方法，其中，步驟S2中，若判斷圖像資訊中存在人臉資訊，則獲取關聯於人臉資訊的位置資訊和大小資訊；

步驟S3具體包括：

步驟S31，利用預先訓練形成的特徵點預測模型，根據位置資訊和大小資訊提取人臉資訊中的多個特徵點；

步驟S32，根據多個特徵點資訊確定人臉資訊中各部位輪廓的資訊；

步驟S33，獲取人臉資訊中鼻子中心點到左眼中心點的第一距離，以及鼻子中心點到右眼中心點的第二距離；

步驟S34，判斷第一距離和第二距離之間的差值是否包括在一預設的差值範圍內：

若是，則判斷人臉資訊表示正面人臉，隨後轉向步驟S4；

若否，則判斷人臉資訊不表示正面人臉，隨後返回步驟S1。

優選的，該喚醒智慧機器人的方法，其中，執行步驟S3後，若判斷人臉資訊中包括正面人臉，則首先執行一停留時間判斷步驟，隨後再執行步驟S4；

停留時間判斷步驟具體包括：

步驟A1，持續跟蹤採集人臉資訊，並記錄正面人臉持續停留的時間；

步驟A2，判斷正面人臉持續停留的時間是否超過一預設的第一閾值：

若是，則轉向步驟S4；

若否，則返回步驟S1。

優選的，該喚醒智慧機器人的方法，其中，步驟S2中，若判斷圖像資訊中存在人臉資訊後，記錄下關聯於人臉資訊的位置資訊和大小資訊；

執行步驟A2後，若判斷正面人臉持續的時間超過第一閾值，則首先執行一距離判斷步驟，隨後再執行步驟S4；

距離判斷步驟具體包括：

步驟B1，判斷大小資訊是否不小於一預設的第二閾值：

若是，則轉向步驟S4；

若否，則返回步驟S1。

執行步驟S3後，若判斷人臉資訊中包括正面人臉，則首先執行一距離判斷步驟，隨後再執行步驟S4；

距離判斷步驟具體包括：

步驟B1，判斷大小資訊是否不小於一預設的第二閾值：

若是，則轉向步驟S4；

若否，則返回步驟S1。

優選的，該喚醒智慧機器人的方法，其中，執行步驟B1後，若判斷大小資訊不小於第二閾值，則首先執行一停留時間判斷步驟，隨後再執行步驟S4：

停留時間判斷步驟具體包括：

若是，則轉向步驟S4；

若否，則返回步驟S1。

優選的，該喚醒智慧機器人的方法，其中，第一閾值爲2秒。

優選的，該喚醒智慧機器人的方法，其中，第二閾值爲400圖元。

一種智慧機器人，其中，採用上述的喚醒智慧機器人的方法。

上述技術方案的有益效果是：提供一種喚醒智慧機器人的方法，能夠提供使用者一種不需要任何動作就能喚醒智慧機器人的操作方法，降低使用者喚醒智慧機器人的操作複雜度，提升使用者的使用體驗。

下面將結合本發明實施例中的附圖，對本發明實施例中的技術方案進行清楚、完整地描述，顯然，所描述的實施例僅僅是本發明一部分實施例，而不是全部的實施例。基於本發明中的實施例，本領域普通技術人員在沒有作出創造性勞動的前提下所獲得的所有其他實施例，都屬於本發明保護的範圍。

需要說明的是，在不衝突的情況下，本發明中的實施例及實施例中的特徵可以相互組合。

下面結合附圖和具體實施例對本發明作進一步說明，但不作爲本發明的限定。

本發明的較佳的實施例中，基於現有技術中存在的上述問題，現提供一種喚醒智慧機器人的方法，具體包括如圖1中的下述步驟：

步驟S1，採用智慧機器人上的圖像採集裝置獲取圖像資訊；

步驟S2，判斷圖像資訊內是否存在人臉資訊：

若不存在，則返回步驟S1；

步驟S4，喚醒智慧機器人，隨後退出。

在一個具體實施例中，上述步驟S1中，所謂的圖像採集裝置可以爲智慧機器人上設置的攝像頭，即利用智慧機器人上設置的攝像頭嘗試採集位於其捕捉區域內的圖像資訊。

隨後，根據一定的判斷規則，判斷上述採集到的圖像資訊中是否存在人臉資訊。具體地，可以採用預先訓練形成的人臉檢測器在上述圖像資訊中判斷是否存在人臉資訊。所謂人臉檢測器，實際可以爲一個預先訓練形成的人臉檢測模型，通過預先輸入的多個人臉訓練樣本可以反覆學習並形成該檢測模型，並將該檢測模型運用於實際的圖像資訊檢測中，以檢測在圖像資訊中是否包括用於表示人臉的人臉資訊。在該步驟中，人臉資訊可以包括表示正面人臉的人臉資訊，也可以包括表示側面人臉或者部分人臉的人臉資訊，這些檢測標準可以通過上述預先輸入的訓練樣本控制人臉檢測器的生成內容來實現。通過訓練樣本反覆學習形成人臉檢測器的過程在現有技術中已經存在較多的實現方法，在此不再贅述。

在該實施例中，若判斷上述圖像資訊中不存在任何人臉資訊，則返回上述步驟S1，以繼續採用圖像採集裝置採集圖像資訊；若判斷上述圖像資訊中存在人臉資訊，則轉向步驟S3。在上述步驟S3中，通過提取人臉資訊中的多個特徵點資訊來判斷該人臉資訊是否表示一個正對圖像採集裝置的正面人臉：若是，則轉向步驟S4，以根據檢測到的正面人臉喚醒該智慧機器人（即判斷此時使用者有意對智慧機器人進行操作）；若否，則返回上述步驟S1，以繼續採用圖像採集裝置採集圖像資訊並繼續進行人臉資訊的判斷。

綜上，本發明技術方案中，提供使用者能夠通過正對智慧機器人的圖像採集裝置（例如攝像頭）的方式就能夠喚醒智慧機器人並進行操作，而避免傳統的必須採用語音或者手勢等輸入方式才能進行智慧機器人的喚醒操作的問題。

本發明的較佳的實施例中，上述步驟S2中，若判斷圖像資訊中存在人臉資訊，則獲取關聯於人臉資訊的位置資訊和大小資訊；

則上述步驟S3具體如圖2所示，包括：

若是，則判斷人臉資訊表示正面人臉，隨後轉向步驟S4；

若否，則判斷人臉資訊不表示正面人臉，隨後返回步驟S1。

具體地，本發明的較佳的實施例中，在上述步驟S2中，在判斷得到圖像資訊中存在人臉資訊，則在獲得該人臉資訊的同時獲得該人臉資訊的位置資訊和大小資訊。

所謂位置資訊，是指該人臉資訊表示的人臉在圖像資訊中所處的位置，例如位於圖像的正中央，或者位於圖像的左上方，或者位於圖像的右下方等。

所謂大小資訊，是指該人臉資訊表示的人臉的大小，通常以圖元表示。

則上述步驟S31〜S32中，首先利用預先訓練形成的特徵點預測模型，根據關聯於上述人臉資訊的位置資訊和大小資訊，提取人臉資訊中的多個特徵點，並進而根據提取到的特徵點確定人臉資訊中各部位輪廓的資訊。所謂特徵點預測模型，同樣可以爲預先經過多個訓練樣本輸入和學習形成的預測模型，通過對人臉上的68個特徵點進行提取和預測，從而得到包含人臉上眉毛、眼睛、鼻子、嘴巴以及臉整體的輪廓等資訊，以勾勒出人臉的大致輪廓。

隨後，本發明的較佳的實施例中，上述步驟S33中，根據上述輪廓資訊，分別獲得鼻子中心點的位置、左眼中心點的位置以及右眼中心點的位置，進而計算得到鼻子中心點的位置到左眼中心點的位置之間的距離，計爲第一距離，以及計算得到鼻子中心點的位置到右眼中心點的位置之間的距離，計爲第二距離。隨後計算上述第一距離與第二距離之間的差值，並判斷該差值是否在一預設的差值範圍內：若是，則表示此時該人臉資訊表示的是正對智慧機器人的圖像捕捉裝置的正面人臉；若否，則表示該人臉資訊表示的並不是正面人臉。

具體地，本發明的較佳的實施例中，對於正面人臉而言，由於人臉的對稱性，其鼻子中心點到左右眼睛的中心點之間的距離應該相等或者接近。而若人臉稍微有點側轉，則上述兩個距離之間必然會發生變化，例如人臉向左轉，則鼻子中心點到右眼中心點的距離必然會縮小，因此上述兩個距離之間的差值會增大。同理，若人臉向右轉，則鼻子中心點到左眼中心點的距離必然會縮小，上述兩個距離之間的差值同樣會增大。

因此如上文中，在最理想的情況下，若人臉資訊表示的爲正面人臉，則上述兩個距離應該相等，即上述兩個距離之間的差值應該爲0。但是在實際情況下，人臉不可能爲絕對對稱，因此在人臉資訊表示正面人臉的情況下，上述兩個距離之間仍然會有一定的差值，但是這個差值應當較小。因此在本發明的較佳的實施例中，上述差值範圍應當被設定爲一個適宜的較小的取值範圍，以保證能夠通過該差值範圍判斷出當前的人臉資訊是否表示正面人臉。

本發明的較佳的實施例中，執行上述步驟S3後，若判斷人臉資訊中包括正面人臉，則首先執行一停留時間判斷步驟，隨後再執行步驟S4；

該停留時間判斷步驟具體包括：

若是，則轉向步驟S4；

若否，則返回步驟S1。

則在本發明的一個較佳的實施例中，包括上述停留時間判斷步驟的整個喚醒方法的過程如圖3所示，包括：

步驟S1，採用智慧機器人上的圖像採集裝置獲取圖像資訊；

步驟S2，判斷圖像資訊內是否存在人臉資訊：

若不存在，則返回步驟S1；

步驟S3，提取人臉資訊上的多個特徵點資訊，並根據特徵點資訊判斷人臉資訊是否表示正對圖像採集裝置的正面人臉：

若否，則返回步驟S1；

若是，則轉向步驟S4；

若否，則返回步驟S1。

步驟S4，喚醒智慧機器人，隨後退出。

具體地，該實施例中，上述過程中，首先執行如上文中的對正面人臉做判斷的步驟。在判斷得到當前識別的人臉資訊表示正面人臉時，再執行上述停留時間判斷步驟，即持續跟蹤採集該人臉資訊，並持續將當前的人臉資訊資訊與前一刻的人臉資訊進行對比，判斷該表示正面人臉的人臉資訊是否發生變化，最終記錄該人臉訊息資訊沒有改變的持續時間，即該人臉資訊持續停留的時間。

該實施例中，對於上述人臉資訊的對比，可以設置一個對比差值範圍，以允許人臉資訊出現微小範圍內的變化。

則該實施例中，將該停留時間判斷步驟應用到整個喚醒方法中，就稱爲如上文中的步驟（如圖3所示）：首先執行正面人臉的判斷步驟，在判斷出當前的人臉資訊表示正面人臉時，再執行停留時間判斷步驟。只有在同時符合正面人臉判斷標準和停留時間判斷標準，才能被認爲可以喚醒智慧機器人。

本發明的較佳的實施例中，上文中的預設的第一閾值，可以設置爲類似一個人被盯著時的正常反應時間，例如可以被設置爲1秒，或者2秒。

本發明的較佳的實施例中，如上文中，上述步驟S2中，若判斷圖像資訊中存在人臉資訊後，則記錄下關聯於人臉資訊的位置資訊和大小資訊。

則在上述喚醒方法中還包括一個距離判斷步驟。該步驟依賴於上述被記錄的位置資訊和大小資訊。具體可以爲：

步驟B1，判斷大小資訊是否不小於一預設的第二閾值：

若是，則轉向步驟S4；

若否，則返回步驟S1。

具體地，本發明的較佳的實施例中，上述距離判斷步驟的作用在於判斷人臉是否距離圖像採集裝置（攝像頭）夠近：若是，則判斷使用者有意識喚醒智慧機器人；若否，則判斷使用者並不想喚醒智慧機器人。

本發明的較佳的實施例中，上述第二閾值可以爲適合於圖像採集裝置的取景框大小的一個數值。例如，取景框大小通常爲640個圖元，而上述第二閾值可以被設置爲400個圖元，因此，若關聯於人臉資訊的大小資訊不小於上述第二閾值（即人臉大小不小於400圖元），則認爲此時使用者距離圖像採集裝置較近，反之，認爲使用者距離圖像採集裝置較遠。

本發明的一個較佳的實施例中，在上述喚醒方法中同時應用上述停留時間判斷步驟以及距離判斷步驟，最終形成的過程如圖4所示，包括：

步驟S1，採用智慧機器人上的圖像採集裝置獲取圖像資訊；

步驟S2，判斷圖像資訊內是否存在人臉資訊：

若不存在，則返回步驟S1；

若否，則返回步驟S1；

步驟B1，判斷大小資訊是否不小於一預設的第二閾值：

若是，則轉向步驟S4；

若否，則返回步驟S1。

步驟S4，喚醒智慧機器人，隨後退出。

在該實施例中，判斷順序依次爲：判斷圖像中是否存在人臉資訊→判斷人臉資訊是否表示正面人臉→判斷該人臉資訊的停留時間是否符合標準→判斷關聯於該人臉資訊的大小資訊是否符合標準。

因此，該實施例中，只有同時符合下述三個條件，才認爲此時使用者希望喚醒智慧機器人，並根據判斷結果實際執行喚醒智慧機器人的操作：

（1）人臉資訊表示正面人臉；

（2）該人臉的持續停留時間超過第一閾值；

（3）該人臉在取景框中的大小不小於第二閾值。

本發明的另一個較佳的實施例中，同樣地，同時應用停留時間判斷步驟和距離判斷步驟形成的完整的喚醒方法的過程如圖5所示，包括：

步驟S1，採用智慧機器人上的圖像採集裝置獲取圖像資訊；

步驟S2，判斷圖像資訊內是否存在人臉資訊：

若不存在，則返回步驟S1；

若否，則返回步驟S1；

步驟B1，判斷大小資訊是否不小於一預設的第二閾值：

若否，則返回步驟S1；

若是，轉向步驟S4；

若否，則返回步驟S1；

步驟S4，喚醒智慧機器人，隨後退出。

該實施例中，具體的判斷過程爲：判斷圖像中是否存在人臉資訊→判斷人臉資訊是否表示正面人臉→判斷關聯於該人臉資訊的大小資訊是否符合標準→判斷該人臉資訊的停留時間是否符合標準。同樣地，該實施例中，需要同時符合三個條件才能被認爲可以進行智慧機器人喚醒操作。

本發明的另一個較佳的實施例中，可以在上述喚醒方法中僅加入距離判斷步驟，具體如圖6所示，包括：

步驟S1，採用智慧機器人上的圖像採集裝置獲取圖像資訊；

步驟S2，判斷圖像資訊內是否存在人臉資訊：

若不存在，則返回步驟S1；

若否，則返回步驟S1；

步驟B1，判斷大小資訊是否不小於一預設的第二閾值：

若是，則轉向步驟S4；

若否，則返回步驟S1；

步驟S4，喚醒智慧機器人，隨後退出。

該實施例中，只需要同時滿足兩個條件，即（1）人臉資訊表示正面人臉；（3）該人臉在取景框中的大小不小於第二閾值；就可以認爲此時使用者有意識喚醒智慧機器人，並根據判斷結果對智慧機器人執行喚醒操作。

綜上，本發明技術方案中，提供了三個對於是否執行智慧機器人的喚醒操作的判斷條件：（1）人臉資訊表示正面人臉；（2）該人臉的持續停留時間超過第一閾值；（3）該人臉在取景框中的大小不小於第二閾值。每個判斷條件均具有其對應的判斷過程。其中，第（1）個判斷條件對於本發明喚醒方法來說是必須的，而後面第（2）個和第（3）個判斷條件對於本發明喚醒方法來說僅爲可選的判斷條件，因此可以衍生出多種不同的喚醒方法。這些衍生的喚醒方法及根據這些喚醒方法做出的修改和更新都應被納入本發明的保護範圍。

本發明的較佳的實施例中，還提供一種智慧機器人，其中採用上文中的喚醒智慧機器人的方法。

以上僅爲本發明較佳的實施例，並非因此限制本發明的實施方式及保護範圍，對於本領域技術人員而言，應當能夠意識到凡運用本發明說明書及圖式內容所作出的等同替換和顯而易見的變化所得到的方案，均應當包含在本發明的保護範圍內。

S1〜S4‧‧‧步驟

S31〜S34‧‧‧步驟

A1〜A2‧‧‧步驟

B1‧‧‧步驟

圖1是本發明的較佳的實施例中，一種喚醒智慧機器人的方法的總體流程示意圖；圖2是本發明的較佳的實施例中，判斷人臉資訊是否表示正面人臉的步驟示意圖；圖3是本發明的較佳的實施例中，包括停留時間判斷步驟的喚醒智慧機器人的方法的流程示意圖；圖4〜5是本發明的較佳的實施例中，包括停留時間判斷步驟和距離判斷步驟的喚醒智慧機器人的方法的流程示意圖；圖6是本發明的較佳的實施例中，包括距離判斷步驟的喚醒智慧機器人的方法的流程示意圖。

Claims

一種喚醒智慧機器人的方法，包括：步驟S1，採用該智慧機器人上的圖像採集裝置獲取圖像資訊；步驟S2，判斷該圖像資訊內是否存在人臉資訊：若不存在，則返回該步驟S1；步驟S3，提取該人臉資訊上的多個特徵點資訊，並根據該特徵點資訊判斷該人臉資訊是否表示正對該圖像採集裝置的正面人臉，並在判斷該人臉資訊表示該正面人臉時轉向步驟S4；步驟S4，喚醒該智慧機器人，隨後退出；該步驟S2中，若判斷該圖像資訊中存在該人臉資訊，則獲取關聯於該人臉資訊的位置資訊和大小資訊；該步驟S3具體包括：步驟S31，利用預先訓練形成的特徵點預測模型，根據該位置資訊和該大小資訊提取該人臉資訊中的多個特徵點；步驟S32，根據多個該特徵點資訊確定該人臉資訊中各部位輪廓的資訊；步驟S33，獲取該人臉資訊中鼻子中心點到左眼中心點的第一距離，以及鼻子中心點到右眼中心點的第二距離；步驟S34，判斷該第一距離和該第二距離之間的差值是否包括在一預設的差值範圍內：若是，則判斷該人臉資訊表示該正面人臉，隨後轉向該步驟S4；若否，則判斷該人臉資訊不表示該正面人臉，隨後返回該步驟S1；執行該步驟S3後，若判斷該人臉資訊中包括該正面人臉，則首先執行一停留時間判斷步驟，隨後再執行該步驟S4；該停留時間判斷步驟具體包括：步驟A1，持續跟蹤採集該人臉資訊，並記錄該正面人臉持續停留的時間；步驟A2，判斷該正面人臉持續停留的時間是否超過一預設的第一閾值：若是，則轉向該步驟S4；若否，則返回該步驟S1；或執行該步驟S3後，若判斷該人臉資訊中包括該正面人臉，則首先執行一距離判斷步驟，隨後再執行該步驟S4；該距離判斷步驟具體包括：步驟B1，判斷該大小資訊是否不小於一預設的第二閾值：若是，則轉向該步驟S4；若否，則返回該步驟S1。
如請求項第1項所述之喚醒智慧機器人的方法，其中，該步驟S2中，採用人臉檢測器判斷該圖像資訊內是否存在該人臉資訊。
如請求項第1項所述之喚醒智慧機器人的方法，其中，該步驟S2中，若判斷該圖像資訊中存在該人臉資訊後，記錄下關聯於該人臉資訊的位置資訊和大小資訊；執行該步驟A2後，若判斷該正面人臉持續的時間超過該第一閾值，則首先執行一距離判斷步驟，隨後再執行該步驟S4；該距離判斷步驟具體包括：步驟B1，判斷該大小資訊是否不小於一預設的第二閾值：若是，則轉向該步驟S4；若否，則返回該步驟S1。
如請求項第1項所述之喚醒智慧機器人的方法，其中，執行該步驟B1後，若判斷該大小資訊不小於該第二閾值，則首先執行一停留時間判斷步驟，隨後再執行該步驟S4；該停留時間判斷步驟具體包括：步驟A1，持續跟蹤採集該人臉資訊，並記錄該正面人臉持續停留的時間；步驟A2，判斷該正面人臉持續停留的時間是否超過一預設的第一閾值：若是，則轉向該步驟S4；若否，則返回該步驟S1。
如請求項第1項或第4項所述之喚醒智慧機器人的方法，其中，該第一閾值為2秒。
如請求項第1項或第3項所述之喚醒智慧機器人的方法，其中，該第二閾值為400像素。
一種智慧機器人，採用如請求項第1~6項中任一所述之喚醒智慧機器人的方法。