JP2019133634A - スマート設備の機能案内方法及システム - Google Patents

スマート設備の機能案内方法及システム Download PDF

Info

Publication number
JP2019133634A
JP2019133634A JP2018212637A JP2018212637A JP2019133634A JP 2019133634 A JP2019133634 A JP 2019133634A JP 2018212637 A JP2018212637 A JP 2018212637A JP 2018212637 A JP2018212637 A JP 2018212637A JP 2019133634 A JP2019133634 A JP 2019133634A
Authority
JP
Japan
Prior art keywords
operation command
function
guidance
user
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018212637A
Other languages
English (en)
Other versions
JP6683794B2 (ja
Inventor
ヤン,ペン
Peng Yang
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Original Assignee
Baidu Online Network Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baidu Online Network Technology Beijing Co Ltd filed Critical Baidu Online Network Technology Beijing Co Ltd
Publication of JP2019133634A publication Critical patent/JP2019133634A/ja
Application granted granted Critical
Publication of JP6683794B2 publication Critical patent/JP6683794B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1815Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/228Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

【課題】音声インタラクティブによって機能案内を行う効率を向上することができるスマート設備の機能案内方法、システム、設備及記憶媒体を提供する。【解決手段】方法は、ユーザの音声データを取得し、音声データに対応する操作指令を取得するステップS11と、操作指令が予め設けられた案内条件を満足するかを判断し、操作指令が予め設けられた案内条件を満足すれば、スマート設備へ案内音声を送信するステップS12と、を含む。【選択図】図1

Description

本発明は、コンピュータ応用技術に関するものであり、特にスマート設備の機能案内方法及システムに関するものである。
音声識別技術の成熟化に伴い、市場でスマートサウンドボックスのようなスマート設備がますます増えつつあり、これらのスマート設備は、音声識別技術に基づいて利用者により便利なインタラクティブ形態を提供する。
モバイルインターネットにおいて、APPの案内機能が非常に完備であり、ユーザが初めて使用する時にキー機能に関する案内ページがあり、更にジェスチャー操作クリック案内があり、更に基本使用タスクチュートリアル及び完備なヘルプページ、カスタマーサービスへの連絡ページがある。
例えば、現在のスマートサウンドボックスのようなスマート設備において、依然として、この案内方式に従い、主にmateApp(スマートサウンドボックスに対して、ネットワークマッチング及設備管理を行うAPP)を元にして使用案内を行い、補助手段として、スマートサウンドボックスで一定の音声案内を行い、且つ案内が主にキー操作や状態提示であり、機能使用に関する案内が少ない。
ユーザが初めてスマートサウンドボックスを使用する時、mateAppをダウンロードしてネットワークマッチング及びペアリング等の操作を行う必要がある。mateAppによってネットワークマッチングした後に、Appは、初めて使用に対する案内インターフェースに進み、どのようにサウンドボックスと会話インタラクティブを行うかに関する案内や個人の音楽、クロストーク等に対する興味や重点機能などに関するqueryの例を含む。そして、ユーザは、これらの案内を閲覧してサウンドボックスを簡単に了解することができる。なお、Appに機能ヘルプページがあり、そのうちに対応機能のqueryの例があり、ユーザが閲覧するができる。Appにおいて質問ヘルプページもあり、ユーザは、ロボット応答或いはカスタマーサービスによって機能の使用を了解することができる。また、Appのメッセージインターフェースにおいて、新たな機能に関する推薦或いはユーザが使用したことがない機能に関する推薦もある。簡単に言えば、機能案内は、伝統的なモバイルインターネットAPP案内方式と一致し、質問があれば、ユーザは頻繁にAppからヘルプを尋ねる必要がある。
ところが、ユーザがネットワークマッチングmateAPPを使用する頻度が低く、初めてネットワークマッチングが成功した後に、スマートサウンドボックスは単独で使用することができ、mateAppと頻繁にインタラクティブを行う必要がないので、ユーザがスマートサウンドボックスを使用する時に、多い機能を了解しておらず、どのように操作することも分からず、且つ不便でコストも高いので、ユーザは簡単にmateAppから使用ヘルプを尋ねない。
更に、スクリーンなしスマートサウンドボックスは、スクリーンがないので、音声インタラクティブだけでユーザとのインタラクティブを行う。スマートサウンドボックスの音声案内は、主に、状態提示(例えば「ネットワークへの接続が失敗し、ネットワークをチェックしてください」)、操作提示(「サウンドボックスのトップ中央ボタンを6秒間押し続けて、ネットワークマッチングモードに進んでサウンドボックスに対してネットワークマッチングする」)、初めて使用する案内の自分紹介を含むが、これらはサウンドボックスの詳細の機能案内、機能ヘルプに係わらない。例えばユーザーは、「音量を大きくする」というqueryを使用して音量を上げることができることを知っているが、ボリュームの範囲が1〜100であることが分からなく、「音量を50にする」というqueryを使用できることが分からないので、ユーザは音量を50に調整するために何度も「音量を大きくする」と言う必要があるかもしれない。明らかに、これは効率よくなく、面倒な操作である。ユーザーはこのような機能を了解したい場合は、必ずAppを利用してシステム使用ヘルプを閲覧する必要があり、明らかに、これはスマートではなく、不便な方式である。
本発明は、音声インタラクティブによって機能案内を行う効率を向上することができるスマート設備の機能案内方法、システム、設備及記憶媒体を提供する。
本出願の1つの形態に係るスマート設備の機能案内方法は、
ユーザの音声データを取得し、上記音声データに対応する操作指令を取得すること、
上記操作指令が予め設けられた案内条件を満足するかを判断し、上記操作指令が予め設けられた案内条件を満足すれば、スマート設備へ案内音声を送信すること、を含む。
上記のような形態及びいずれか実現できる形態において、ユーザの音声データを取得し、上記音声データに対応する操作指令を取得することは、
スマート設備がモニタしたユーザの音声データを受信すること、
上記音声データに対して音声識別を行い、上記音声データに対応する識別テキストを取得すること、
上記識別テキストに対して意味分析を行い、上記識別テキストに対応する操作指令を取得すること、を含む。
上記のような形態及びいずれか実現できる形態において、上記操作指令が予め設けられた案内条件を満足すれば、スマート設備へ案内音声を送信することは、
上記操作指令が自発的な質問タイプであれば、機能案内ライブラリにおいて上記操作指令に対応する予め設けられた案内音声を問い合わせ、スマート設備へ上記予め設けられた案内音声を送信し、ユーザに対して受動的な機能案内を行うこと、を含む。
上記のような形態及びいずれか実現できる形態において、上記操作指令に対応する機能の複雑度に基づいて、ユーザに対して一回の受動的な機能案内或いは複数回の受動的な機能案内を行う。
上記のような形態及びいずれか実現できる形態において、上記操作指令が予め設けられた案内条件を満足すれば、スマート設備へ案内音声を送信することは、
上記操作指令が機能操作タイプであれば、且つ上記機能操作タイプの指令に関する予め設けられた起動条件を満足すれば、機能案内ライブラリにおいて上記操作指令に対応する予め設けられた案内音声を問い合わせ、スマート設備へ上記予め設けられた案内音声を送信し、ユーザに対して自発的な機能案内を行うこと、を含む。
上記のような形態及びいずれか実現できる形態において、上記予め設けられた起動条件は、
ユーザが初めてある機能に対して上記操作指令を発すること、
上記操作指令が非効率的な操作指令であり、ユーザの所定期間内に発した回数が予め設けられた回数閾値に到達したこと、
ユーザが頻繁に上記操作指令を発し且つ同一の機能を実現する他の操作指令が存在すること、
上記操作指令に新たに出現した類似操作指令或いは機能が存在すること、
の中の少なくとも1つを含む。
上記のような形態及びいずれか実現できる形態において、上記予め設けられた起動条件が、ユーザが初めてある機能に対して上記操作指令を発することであれば、対応する予め設けられた案内音声は、上記機能の重要指令であり、
上記予め設けられた起動条件が、上記操作指令が非効率的な操作指令であり、ユーザの所定期間内に発した回数が予め設けられた回数閾値に到達したことであれば、対応する予め設けられた案内音声は、上記操作指令に対応する効率的な操作指令であり、
上記予め設けられた条件が、ユーザが頻繁に上記操作指令を発し且つ同一の機能を実現する他の操作指令が存在することであれば、対応する予め設けられた案内音声は、上記機能の他の操作指令であり、
上記予め設けられた条件が、上記操作指令に新たに出現した類似操作指令或いは機能が存在することであれば、対応する予め設けられた案内音声は、新たに出現した類似操作指令或いは機能である。
上記のような形態及びいずれか実現できる形態において、上記スマート設備の機能案内方法は、
上記操作指令を実行することを更に含む。
本発明の他の形態に係るスマート設備の機能案内システムは、
ユーザの音声データを取得し、上記音声データに対応する操作指令を取得する解析モジュールと、
上記操作指令が予め設けられた案内条件を満足するかを判断し、上記操作指令が予め設けられた案内条件を満足すれば、スマート設備へ案内音声を送信する案内モジュールと、を含む。
上記のような形態及びいずれか実現できる形態において、上記解析モジュールは、
スマート設備がモニタしたユーザの音声データを受信する受信サブモジュールと、
上記音声データに対して音声識別を行い、上記音声データに対応する識別テキストを取得する音声識別サブモジュールと、
上記識別テキストに対して意味分析を行い、上記識別テキストに対応する操作指令を取得する意味分析サブモジュールと、を含む。
上記のような形態及びいずれか実現できる形態において、上記案内モジュールは、具体的に
上記操作指令が自発的な質問タイプであれば、機能案内ライブラリにおいて上記操作指令に対応する予め設けられた案内音声を問い合わせ、スマート設備へ上記予め設けられた案内音声を送信し、ユーザに対して受動的な機能案内を行うことに用いられる。
上記のような形態及びいずれか実現できる形態において、上記案内モジュールは、具体的に
上記操作指令に対応する機能の複雑度に基づいて、ユーザに対して一回の受動的な機能案内或いは複数回の受動的な機能案内を行うことに用いられる。
上記のような形態及びいずれか実現できる形態において、上記案内モジュールは、具体的に
上記操作指令が機能操作タイプであれば、且つ上記機能操作タイプの指令に関する予め設けられた起動条件を満足すれば、機能案内ライブラリにおいて上記操作指令に対応する予め設けられた案内音声を問い合わせ、スマート設備へ上記予め設けられた案内音声を送信し、ユーザに対して自発的な機能案内を行うことに用いられる。
上記のような形態及びいずれか実現できる形態において、上記予め設けられた起動条件は、
ユーザが初めてある機能に対して上記操作指令を発すること、
上記操作指令が非効率的な操作指令であり、ユーザの所定期間内に発した回数が予め設けられた回数閾値に到達したこと、
ユーザが頻繁に上記操作指令を発し且つ同一の機能を実現する他の操作指令が存在すること、
上記操作指令に新たに出現した類似操作指令或いは機能が存在すること、
の中の少なくとも1つを含む。
上記のような形態及びいずれか実現できる形態において、上記予め設けられた起動条件が、ユーザが初めてある機能に対して上記操作指令を発することであれば、対応する予め設けられた案内音声は、上記機能の重要指令であり、
上記予め設けられた起動条件が、上記操作指令が非効率的な操作指令であり、ユーザの所定期間内に発した回数が予め設けられた回数閾値に到達したことであれば、対応する予め設けられた案内音声は、上記操作指令に対応する効率的な操作指令であり、
上記予め設けられた条件が、ユーザが頻繁に上記操作指令を発し且つ同一の機能を実現する他の操作指令が存在することであれば、対応する予め設けられた案内音声は、上記機能の他の操作指令であり、
上記予め設けられた条件が、上記操作指令に新たに出現した類似操作指令或いは機能が存在することであれば、対応する予め設けられた案内音声は、新たに出現した類似操作指令或いは機能である。
上記のような形態及びいずれか実現できる形態において、上記案内モジュールは、さらに、
上記操作指令を実行することに用いられる。
本発明の他の形態に係る、メモリ、プロセッサ及び上記メモリに記憶され上記プロセッサに実行されるコンピュータプログラムを含むコンピュータ設備は、上記プロセッサが上記プログラムを実行する時、以上のような方法を実現する。
本発明の他の形態に係るコンピュータプログラムが記憶されているコンピュータ読取り可能な記憶媒体であって、上記プログラムがプロセッサによって実行される時、以上のような方法を実現する。
上記説明から分かるように、本発明の上記技術案によれば、従来技術においてAPPによって機能案内を行う形態や簡単な音声機能案内を提供する形態に比べて、音声インタラクティブによって機能案内を行う効率を向上することができる。
本発明に係るスマート設備の機能案内方法のフローチャートである。 本発明に係るスマート設備の機能案内システムの構成図である。 本発明の実施形態を実現することに適する、例示的なコンピュータシステム/サーバ12を示すブロック図である。
本出願の実施例の目的、技術案及び利点をより明確で簡潔させるために、以下、実施例の図面を参照して、本出願の実施例における技術案を詳細に説明する。明らかに、記載された実施例は、全ての実施例ではなく、実施例の一部だけである。創造的な労働をしないことを前提として、当業者が本出願の実施例に基づいて取得できる他の実施例は、いずれも本発明の保護範囲に属する。
図1は、本発明に係るスマート設備の機能案内方法の実施例のフローチャートであり、図1に示すように、ユーザの音声データを取得し、上記音声データに対応する操作指令を取得するステップS11と、上記操作指令が予め設けられた案内条件を満足するかを判断し、上記操作指令が予め設けられた案内条件を満足すれば、スマート設備へ案内音声を送信するステップS12と、を含む。
本実施例に係る方法は、クラウドサーバによって実行してもよく、他のサーバによって実行してもよい。
ステップS11の好ましい実現形態において、好ましくは、ユーザの音声データを取得し、上記音声データに対応する操作指令を取得することは、以下のようなサブステップを含む。
サブステップS111:クラウドサーバが、スマート設備がモニタしたユーザの音声データを受信する。
ユーザは、音声によってスマート設備とインタラクティブを行うことができ、スマート設備は、ユーザが発した音声情報をモニタして取得することができる。
好ましくは、上記スマート設備、例えばスマートサウンドボックスのMICアレイは、ユーザが発した音声情報をモニタして取得する。スマート設備は、モニタしたユーザの音声データをクラウドサーバに送信する。
サブステップS112:クラウドサーバが、上記音声データに対して音声識別を行い、上記音声データに対応する識別テキストを得る。
好ましくは、クラウドサーバは、自動音声識別(Automatic Speech Recognition,ASR)サービスを呼び出し、ユーザの音声データに対して解析を行い、上記音声に対応する音声識別結果を取得し、上記音声識別結果は音声に対応する識別テキストである。
上記音声識別の過程は、従来の音声識別技術を採用することができ、主に、音声データに対して特征抽出を行い、抽出された特征データ及び予め訓練した声学モデル及び言語モデルを利用して復号し、復号する時に音声データに対応する文法セルを確定し、文法セルは、例えば音素或音節であり、復号結果に基づいて当前音声に対応する識別テキストを得る。
サブステップS113:クラウドサーバが上記識別テキストに対して意味分析を行い、上記識別テキストに対応する操作指令を得る。
クラウドサーバは、予め所定された操作指令において上記識別テキストに対して精密にマッチングを行い、対応する操作指令を問い合わせ、上記識別テキストに精密にマッチングする操作指令を問い合わせていなければ、上記識別テキストに対して単語分割処理を行って、キーワードを生成し、上記キーワードに基づいて、予め所定された操作指令において上記キーワードにマッチングした操作指令を問い合わせる。
好ましくは、意味識別技術に基づいて、上記識別テキストと予め所定された操作指令とをマッチングすることができる。例えば、意味識別技術に基づいて上記識別テキスト及び予め所定された操作指令を処理し、両者間の類似度を計算し、両者間の類似度が類似度の閾値より大きければ、マッチングが成功したと確定し、そうでなければ、マッチングが成功しなかったと確定する。本実施例において、類似度の閾値を具体的に限定しなく、例えば類似度の閾値を0.8とすることができる。
ステップS12の好ましい実現形態において、上記操作指令が予め設けられた案内条件を満足するかを判断し、対応する予め設けられた案内条件に基づいて、スマート設備へ予め設けられた案内音声を送信する。
上記予め設けられた案内条件は、以下のような幾つかの場合と分けることができる。
上記操作指令が自発質問タイプである。
上記操作指令が機能操作タイプである。
上記操作指令が自発質問タイプである場合に、ユーザがスマートサウンドボックスに対して、自発的に、ある機能をどのように操作するか或いは機能の使用を質問し、例えばユーザが「どのように便利に音量を調整するか?」、「どの新しい機能があるか?」、「どの機能を使用したことがないか」、「歌手に基づき音楽を注文することができるか?」等というqueryを話す。クラウドサーバは、機能案内ライブラリにおいて上記操作指令に対応する予め設けられた案内音声を問い合わせ、スマート設備へ上記予め設けられた案内音声を送信し、ユーザに対して受動的な機能案内を行う。
好ましくは、機能案内ライブラリにおいて、操作指令に対応する機能の複雑度に基づいて、一回の案内及び複数回の案内と設定する。
一回の案内は内容が少ない機能に適し、複数回の案内は内容が多い機能に適する。
ただし、一回の受動的な機能案内の例において、クラウドサーバが、機能案内ライブラリにおいて上記操作指令に対応する予め設けられた案内音声を問い合わせ、スマートサウンドボックスへ上記予め設けられた案内音声を送信する。例えば、ユーザが「どのように便利に音量を調整するか?」というqueryを質問し、クラウドサーバが、機能案内ライブラリにおいて上記操作指令に対応する予め設けられた案内音声を問い合わせ、「直接に‘バイドゥバイドゥ、音を少し低下する’を話してください。或いは、直接に0から100までの音量値、例えば‘バイドゥバイドゥ、音量を50に調整する’を話してください」のように、スマートサウンドボックスへ上記予め設けられた案内音声を送信する。
複数回の受動的な機能案内の例において、内容が多いので、複数回の受動的な機能案内は、使用頻度が高いquery指令を優先に推薦し、ユーザがより多いものを了解したいと、複数回に進むことができる。
好ましくは、上記操作指令に対応する予め設けられた案内音声は、複数の案内音声を含み、それらの使用頻度に基づいて並べ替えし、まずユーザへ1つあるいは複数の使用頻度が高い予め設けられた案内音声を伝送し、そして、ユーザの選択に基づいて続けて他の予め設けられた案内音声を伝送する。
例えば、ユーザが「どのように歌を再生するか?」と質問したら、サウンドボックスは、「例えば‘バイドゥバイドゥ、ジェイ・チョウの歌を聴きたい’のように、直接に歌手を注文することができる。また、例えば‘バイドゥバイドゥ、ジェイ・チョウの青花瓷’のように、歌手の名前+曲名によって注文してもよい。さらに、例えば‘バイドゥバイドゥ、ロック音楽を再生する’のように、直接に歌の分類を話してもよい」と回答する。そして、サウンドボックスは、続けて「更に他の注文方式がほしいか?」を複数回に送信し、ユーザが「はい」を選択したら、続けて機能案内の内容を伝送し、ユーザが「いいえ」を選択したら、機能案内を終了する。
上記実施形態によって、ユーザは、人類言語によって自分の問題を描出することができ、使用機能が混乱であるが、クラウドサーバが対応する機能案内音声を正確にマッチングし解析することで、ユーザーは快速に回答を得ることができ、携帯電話のAppを開いて機能案内ページを問い合わせて回答を得る必要がない。
上記操作指令が機能操作タイプである場合に、ユーザがスマートサウンドボックスと音声インタラクティブ操作を行い、スマートサウンドボックスに対して予め設けられた機能を実行するように指示する。
好ましくは、上記操作指令の予め設けられた起動条件を満足したら、クラウドサーバが、機能案内ライブラリにおいて上記操作指令に対応する予め設けられた案内音声を問い合わせ、スマートサウンドボックスへ上記予め設けられた案内音声を送信する。
上記予め設けられた起動条件は、ユーザが初めてある機能に対して上記操作指令を発すること、上記操作指令が非効率的な操作指令であり、ユーザの所定期間内に発した回数が予め設けられた回数閾値に到達したこと、ユーザが頻繁に上記操作指令を発し且つ同一の機能を実現する他の操作指令が存在すること、及び、上記操作指令に新たに出現した類似操作指令或いは機能が存在すること、を含む。
好ましくは、ユーザが初めてある機能に対して上記操作指令を発するという予め設けられた起動条件については、クラウドサーバが、ユーザ操作履歴記録において問い合わせを行い、操作指令がユーザの初めて発したものであり、即ちユーザが初めて上記操作指令に対応する機能を使用すると判断し、自発的な機能案内を起動する。クラウドサーバは、機能案内ライブラリにおいて該起動条件における上記操作指令に対応する予め設けられた案内音声を問い合わせて取得し、ユーザ操作指令を実行する同時に、スマートサウンドボックスへ上記予め設けられた案内音声を送信し、ただし、上記予め設けられた案内音声は、上記機能の重要指令である。
例えば、ユーザが初めてある機能を使用する時に、スマートサウンドボックスは、若干重要指令を含む音声案内を放送する。例えば、ユーザが初めて音楽を再生したら、サウンドボックスは、放送歌手及び曲名のTTSを放送する以外に、「好きな曲に出会ったら、直接に‘バイドゥバイドゥ、この曲を格納する’を話してください」という話も放送する。このような案内は、ユーザが初めてある機能を使用する時に、全ての機能案内を集まって機能案内を行わず、ユーザに重要指令を教えるので、ユーザーの使用効率を向上することができる。なぜなら、内容が多すぎると、音声インタラクティブが適しなくなり、ユーザーが短時間で多すぎる内容を吸収できないためであり、これは、伝統的なインターフェースインタラクティブ設計とは明らかに異なる。
好ましくは、上記操作指令が非効率的な操作指令で、ユーザの所定期間内に発した回数が予め設けられた回数閾値に到達したという起動条件については、クラウドサーバが、ユーザ操作履歴記録において問い合わせを行い、操作指令がユーザの続けて発したものであり、閾値例えば3回に到達したら、ユーザの発した上記操作指令が非効率的な操作指令であると判断し、自発的な機能案内を起動する。クラウドサーバは、機能案内ライブラリにおいて該起動条件における上記操作指令に対応する予め設けられた案内音声を問い合わせて取得し、スマートサウンドボックスへ上記予め設けられた案内音声を送信し、ただし、上記予め設けられた案内音声は、上記操作指令に対応する効率的な操作指令である。
例えば、ユーザが続けて非効率的なqueryを3回に使用すると、自発的な機能案内を起動する。ユーザーはサウンドボックスの若干機能を理解していない時、いくつかの煩雑で非効率的な指令を使用して音声会話を行う可能性があり、これはユーザ体験を大幅に低減するためである。ユーザは、サウンドボックスを使用する時に音量が小さいと感じると、「バイドゥバイドゥ、音量を少し大きくする」を話したが、まだ音量が小さいと感じると、続けて「バイドゥバイドゥ、音量を少し大きくする」を話し、このように3回連続したら、サウンドボックスが自発的な機能案内を起動し、クラウドサーバは、ユーザを提示するように、スマートサウンドボックスへ「直接に0から100までの音量値、例えば‘バイドゥバイドゥ、音量を50に調整する’を話すことができる」を送信する。このような形態において、ユーザーが混乱で煩雑的な操作を行う場合にのみ、サウンドボックスが自発提示を行い、ユーザに効率的な操作指令を教え、人間的な世話をユーザに感じさせることができる。
好ましくは、ユーザが頻繁に上記操作指令を発し且つ同一の機能を実現する他の操作指令が存在するという起動条件については、クラウドサーバが、ユーザ操作履歴記録において問い合わせを行い、操作指令がユーザ頻繁に発したものであり、且つユーザが同一の機能を実現するための他の類似指令を少しだけ発し又は発したことがないと判断し、自発的な機能案内を起動する。クラウドサーバは、機能案内ライブラリにおいて該起動条件における上記操作指令に対応する予め設けられた案内音声を問い合わせて取得し、スマートサウンドボックスへ上記予め設けられた案内音声を送信し、ただし、上記予め設けられた案内音声は上記機能の他の操作指令である。
例えば、ユーザがしばしば単一化queryを使用し、即ちユーザがある機能に対する同一のqueryを複数回に使用すると、サウンドボックスは、自発的に、ユーザに対して該機能の他の操作指令を話してみることを提示することができる。例えば、ユーザが常に「音楽を再生する」を話し、音楽機能に関する他の再生方式を話したことがない。クラウドサーバは、ユーザ操作指令を実行して歌手及び曲名のTTSを放送する以外に、「直接に歌手の名前、或いは曲名、ベストテンを話して音楽を再生してもよい。」も放送する。このような自発的な推薦は、主にユーザの操作queryを豊富にし、より多くの次元で製品機能を使用することができる。
好ましくは、上記操作指令に新たに出現した類似操作指令或いは機能が存在すると、クラウドサーバは、スマートサウンドボックスに上記操作指令に関する新たな指令、新たな機能が出現したかをチェックし、ユーザ操作指令を実行する同時に、スマートサウンドボックスへ上記新たな指令、新たな機能に関する予め設けられた案内音声を送信する。
好ましくは、クラウドサーバは、スマートサウンドボックスに上記操作指令に関する新たな指令、新たな機能が出現したかをリアルタイム或いは定期にチェックしてもよい。
例えば、ユーザが曲を注文した時に、クラウドサーバはチェックして新たなシーン歌の注文機能の出現を発現すると、「はい、すぐジェイ・チョウの青花瓷を再生し、シーンによって曲を注文してもよく、例えば「地下鉄に適する曲」を話す」を返信し、新たに出現したシーン歌注文機能をユーザに推薦する。このようなシーンは、ユーザに簡単な機能案内を行うことができるが、ユーザを邪魔することを避けるように、頻度を制御して定期的に推薦を行うことが好ましい。
本実施例の好ましい実現形態において、上記予め設けられた案内条件は、上記音声データに対応するのが無効指令であることも含む。上記音声データに対応するのが無効指令であれば、即ち対応する操作指令が識別されていなければ、クラウドサーバは、スマート設備へ使用頻度が最も高い予め設けられた案内音声を送信し、例えば、「音楽を聴きたい場合は、‘音楽を聴きたい’を話してください」等を送信する。ここの案内音声は、ユーザが有効な指令を発するように案内するためのものであり、具体的な案内音声を限定しない。
好ましくは、上記予め設けられた案内音声は録音であってもよく、テキストから音声へ変換するための音声合成ソフトウェアTTS(TTS,Text to Speech)によってテキストデータを転換した音声信号であってもよい。
本発明に係る方法は、受動的な機能案内によって、ユーザの自発質問に対して即時に回答することができ、ユーザに情報の煩雑及び混乱を与えなく、一方、自発的な機能案内によって、ユーザの操作に基づいて相応に起動し、ユーザが混乱で提示が必要する時に提示を行う。ユーザが音声インタラクティブによって効率的で簡単に機能案内を行うことができるようにする。
注意すべきことは、前述各方法の実施例に関して、説明を簡単させるために、それを一連の動作の組み合わせとして表現したが、本開示によれば、あるステップが他の順序でまたは同時に行うことができるので、当業者であれば、本開示は記述された動作の順序によって制限されないことを理解すべきことである。そして、明細書に記載された実施例はいずれも好ましい実施例であり、係る動作及びモジュールが、本発明にとっては必ずしも必要とは限らないことが、当業者であれば理解すべきである。
以上は方法の実施例に関する説明であり、以下、システムの実施例によって本発明に係る技術案を更に説明する。
図2は、本発明に係るスマート設備の機能案内システムの実施例の構成図であり、図2に示すように、ユーザの音声データを取得し、上記音声データに対応する操作指令を得る解析モジュール21と、上記操作指令が予め設けられた案内条件を満足するかを判断し、上記操作指令が予め設けられた案内条件を満足すれば、スマート設備へ案内音声を送信する案内モジュール22と、を含む。
本実施例に係る方法は、クラウドサーバによって実行してもよく、他のサーバによって実行してもよい。
解析モジュール21の好ましい実現形態において、解析モジュール21は、以下のモジュールを含む。
受信サブモジュール211:スマート設備がモニタして取得したユーザの音声データを受信するために用いられる。
ユーザは、音声によってスマート設備とインタラクティブを行うことができ、スマート設備は、ユーザが発した音声情報をモニタして取得することができる。
好ましくは、上記スマート設備、例えばスマートサウンドボックスのMICアレイは、ユーザが発した音声情報をモニタして取得する。受信サブモジュール211は、モニタしたユーザの音声データをクラウドサーバに送信する。
音声識別サブモジュール212:上記音声データに対して音声識別を行い、上記音声データに対応する識別テキストを得るために用いられる。
好ましくは、クラウドサーバは、自動音声識別(Automatic Speech Recognition,ASR)サービスを呼び出し、ユーザの音声データに対して解析を行い、上記音声に対応する音声識別結果を取得し、上記音声識別結果は音声に対応する識別テキストである。
上記音声識別の過程は、従来の音声識別技術を採用することができ、主に、音声データに対して特征抽出を行い、抽出された特征データ及び予め訓練した声学モデル及び言語モデルを利用して復号し、復号する時に音声データに対応する文法セルを確定し、文法セルは、例えば音素或音節であり、復号結果に基づいて当前音声に対応する識別テキストを得る。
意味分析サブモジュール213:上記識別テキストに対して意味分析を行い、上記識別テキストに対応する操作指令を得るために用いられる。
クラウドサーバは、予め所定された操作指令において上記識別テキストに対して精密にマッチングを行い、対応する操作指令を問い合わせ、上記識別テキストに精密にマッチングする操作指令を問い合わせていなければ、上記識別テキストに対して単語分割処理を行って、キーワードを生成し、上記キーワードに基づいて、予め所定された操作指令において上記キーワードにマッチングした操作指令を問い合わせる。
好ましくは、意味識別技術に基づいて、上記識別テキストと予め所定された操作指令とをマッチングすることができる。例えば、意味識別技術に基づいて上記識別テキスト及び予め所定された操作指令を処理し、両者間の類似度を計算し、両者間の類似度が類似度の閾値より大きければ、マッチングが成功したと確定し、そうでなければ、マッチングが成功しなかったと確定する。本実施例において、類似度の閾値を具体的に限定しなく、例えば、類似度の閾値を0.8とすることができる。
案内モジュール22の好ましい実現形態において、上記操作指令が予め設けられた案内条件を満足するかを判断し、対応する予め設けられた案内条件に基づいて、スマート設備へ予め設けられた案内音声を送信する。
上記予め設けられた案内条件は、以下の幾つかの場合と分けることができる。
上記操作指令が自発質問タイプである、
上記操作指令が機能操作タイプである。
上記操作指令が自発質問タイプである場合は、ユーザがスマートサウンドボックスに対して自発的に、ある機能をどのように操作するか或いは機能の使用を質問し、例えばユーザが「どのように便利に音量を調整するか?」、「どの新しい機能があるか?」、「どの機能を使用したことがないか」、「歌手に基づき音楽を注文することができるか?」等というqueryを話す。クラウドサーバは、機能案内ライブラリにおいて上記操作指令に対応する予め設けられた案内音声を問い合わせ、スマート設備へ上記予め設けられた案内音声を送信し、ユーザに対して受動的な機能案内を行う。
好ましくは、機能案内ライブラリにおいて、操作指令に対応する機能の複雑度に基づいて、一回の案内及び複数回の案内と所定する。
一回の案内は内容が少ない機能に適し、複数回の案内は内容が多い機能に適する。
一回の受動的な機能案内の例において、クラウドサーバが、機能案内ライブラリにおいて上記操作指令に対応する予め設けられた案内音声を問い合わせ、スマートサウンドボックスへ上記予め設けられた案内音声を送信する。例えば、ユーザが「どのように便利に音量を調整するか?」というqueryを質問し、クラウドサーバが、機能案内ライブラリにおいて上記操作指令に対応する予め設けられた案内音声を問い合わせ、「直接に‘バイドゥバイドゥ、音を少し低下する’を話してください。或いは、直接に0から100までの音量値、例えば‘バイドゥバイドゥ、音量を50に調整する’を話してください」のように、スマートサウンドボックスへ上記予め設けられた案内音声を送信する。
複数回の受動的な機能案内の例において、内容が多いので、複数回の受動的な機能案内は、使用頻度が高いquery指令を優先に推薦し、ユーザがより多いものを了解したいと、複数回に進むことができる。
好ましくは、上記操作指令に対応する予め設けられた案内音声は、複数の案内音声を含み、それらの使用頻度に基づいて並べ替えし、まずユーザへ1つあるいは複数の使用頻度が高い予め設けられた案内音声を伝送し、そして、ユーザの選択に基づいて続けて他の予め設けられた案内音声を伝送する。
例えば、ユーザが「どのように歌を再生するか?」と質問したら、サウンドボックスは、「例えば‘バイドゥバイドゥ、ジェイ・チョウの歌を聴きたい’のように、直接に歌手を注文することができる。また、例えば‘バイドゥバイドゥ、ジェイ・チョウの青花瓷’のように、歌手の名前+曲名によって注文してもよい。さらに、例えば‘バイドゥバイドゥ、ロック音楽を再生する’のように、直接に歌の分類を話してもよい」と回答する。そして、サウンドボックスは、続けて「更に他の注文方式がほしいか?」を複数回に送信し、ユーザが「はい」を選択したら、続けて機能案内の内容を伝送し、ユーザが「いいえ」を選択したら、機能案内を終了する。
上記実施形態によって、ユーザは、人類言語によって自分の問題を描出することができ、使用機能が混乱であるが、クラウドサーバが対応する機能案内音声を正確にマッチングし解析することで、ユーザーは快速に回答を得ることができ、携帯電話のAppを開いて機能案内ページを問い合わせて回答を得る必要がない。
上記操作指令が機能操作タイプである場合に、ユーザがスマートサウンドボックスと音声インタラクティブ操作を行い、スマートサウンドボックスに対して予め設けられた機能を実行するように指示する。
好ましくは、上記操作指令の予め設けられた起動条件を満足したら、クラウドサーバが、機能案内ライブラリにおいて上記操作指令に対応する予め設けられた案内音声を問い合わせ、スマートサウンドボックスへ上記予め設けられた案内音声を送信する。
上記予め設けられた起動条件は、ユーザが初めてある機能に対して上記操作指令を発すること、上記操作指令が非効率的な操作指令であり、ユーザの所定期間内に発した回数が予め設けられた回数閾値に到達したこと、ユーザが頻繁に上記操作指令を発し且つ同一の機能を実現する他の操作指令が存在すること、及び、上記操作指令に新たに出現した類似操作指令或いは機能が存在すること、を含む。
好ましくは、ユーザが初めてある機能に対して上記操作指令を発するという予め設けられた起動条件については、クラウドサーバが、ユーザ操作履歴記録において問い合わせを行い、操作指令がユーザの初めて発したものであり、即ちユーザが初めて上記操作指令に対応する機能を使用すると判断し、自発的な機能案内を起動する。クラウドサーバは、機能案内ライブラリにおいて該起動条件における上記操作指令に対応する予め設けられた案内音声を問い合わせて取得し、ユーザ操作指令を実行する同時に、スマートサウンドボックスへ上記予め設けられた案内音声を送信し、ただし、上記予め設けられた案内音声は、上記機能の重要指令である。
例えば、ユーザが初めてある機能を使用する時に、スマートサウンドボックスは、若干重要指令を含む音声案内を放送する。例えば、ユーザが初めて音楽を再生したら、サウンドボックスは、放送歌手及び曲名のTTSを放送する以外に、「好きな曲に出会ったら、直接に‘バイドゥバイドゥ、この曲を格納する’を話してください」という話も放送する。このような案内は、ユーザが初めてある機能を使用する時に、全ての機能案内を集まって機能案内を行わず、ユーザに重要指令を教えるので、ユーザーの使用効率を向上することができる。なぜなら、内容が多すぎると、音声インタラクティブが適しなくなり、ユーザーが短時間で多すぎる内容を吸収できないためであり、これは、伝統的なインターフェースインタラクティブ設計とは明らかに異なる。
好ましくは、上記操作指令が非効率的な操作指令で、ユーザの所定期間内に発した回数が予め設けられた回数閾値に到達したという起動条件については、クラウドサーバが、ユーザ操作履歴記録において問い合わせを行い、操作指令がユーザの続けて発したものであり、閾値例えば3回に到達したら、ユーザの発した上記操作指令が非効率的な操作指令であると判断し、自発的な機能案内を起動する。クラウドサーバは、機能案内ライブラリにおいて該起動条件における上記操作指令に対応する予め設けられた案内音声を問い合わせて取得し、スマートサウンドボックスへ上記予め設けられた案内音声を送信し、ただし、上記予め設けられた案内音声は、上記操作指令に対応する効率的な操作指令である。
例えば、ユーザが続けて非効率的なqueryを3回に使用すると、自発的な機能案内を起動する。ユーザーはサウンドボックスの若干機能を理解していない時、いくつかの煩雑で非効率的な指令を使用して音声会話を行う可能性があり、これはユーザ体験を大幅に低減するためである。ユーザは、サウンドボックスを使用する時に音量が小さいと感じると、「バイドゥバイドゥ、音量を少し大きくする」を話したが、まだ音量が小さいと感じると、続けて「バイドゥバイドゥ、音量を少し大きくする」を話し、このように3回連続したら、サウンドボックスが自発的な機能案内を起動し、クラウドサーバは、ユーザを提示するように、スマートサウンドボックスへ「直接に0から100までの音量値、例えば‘バイドゥバイドゥ、音量を50に調整する’を話すことができる」を送信する。このような形態において、ユーザーが混乱で煩雑的な操作を行う場合にのみ、サウンドボックスが自発提示を行い、ユーザに効率的な操作指令を教え、人間的な世話をユーザに感じさせることができる。
好ましくは、ユーザが頻繁に上記操作指令を発し且つ同一の機能を実現する他の操作指令が存在するという起動条件については、クラウドサーバが、ユーザ操作履歴記録において問い合わせを行い、操作指令がユーザ頻繁に発したものであり、且つユーザが同一の機能を実現するための他の類似指令を少しだけ発し又は発したことがないと判断し、自発的な機能案内を起動する。クラウドサーバは、機能案内ライブラリにおいて該起動条件における上記操作指令に対応する予め設けられた案内音声を問い合わせて取得し、スマートサウンドボックスへ上記予め設けられた案内音声を送信し、ただし、上記予め設けられた案内音声は上記機能の他の操作指令である。
例えば、ユーザがしばしば単一化queryを使用し、即ちユーザがある機能に対する同一のqueryを複数回に使用すると、サウンドボックスは、自発的に、ユーザに対して該機能の他の操作指令を話してみることを提示することができる。例えば、ユーザが常に「音楽を再生する」を話し、音楽機能に関する他の再生方式を話したことがない。クラウドサーバは、ユーザ操作指令を実行して歌手及び曲名のTTSを放送する以外に、「直接に歌手の名前、或いは曲名、ベストテンを話して音楽を再生してもよい。」も放送する。このような自発的な推薦は、主にユーザの操作queryを豊富にし、より多くの次元で製品機能を使用することができる。
好ましくは、上記操作指令に新たに出現した類似操作指令或いは機能が存在すると、クラウドサーバは、スマートサウンドボックスに上記操作指令に関する新たな指令、新たな機能が出現したかをチェックし、ユーザ操作指令を実行する同時に、スマートサウンドボックスへ上記新たな指令、新たな機能に関する予め設けられた案内音声を送信する。
好ましくは、クラウドサーバは、スマートサウンドボックスに上記操作指令に関する新たな指令、新たな機能が出現したかをリアルタイム或いは定期にチェックしてもよい。
例えば、ユーザが曲を注文した時に、クラウドサーバはチェックして新たなシーン歌の注文機能の出現を発現すると、「はい、すぐジェイ・チョウの青花瓷を再生し、シーンによって曲を注文してもよく、例えば「地下鉄に適する曲」を話す」を返信し、新たに出現したシーン歌注文機能をユーザに推薦する。このようなシーンは、ユーザに簡単な機能案内を行うことができるが、ユーザを邪魔することを避けるように、頻度を制御して定期的に推薦を行うことが好ましい。
本実施例の好ましい実現形態において、上記予め設けられた案内条件は、上記音声データに対応するのが無効指令であることも含む。上記音声データに対応するのが無効指令であれば、即ち対応する操作指令が識別されていなければ、クラウドサーバは、スマート設備へ使用頻度が最も高い予め設けられた案内音声を送信し、例えば、「音楽を聴きたい場合は、‘音楽を聴きたい’を話してください」等を送信する。ここの案内音声は、ユーザが有効な指令を発するように案内するためのものであり、具体的な案内音声を限定しない。
好ましくは、上記予め設けられた案内音声は録音であってもよく、テキストから音声へ変換するための音声合成ソフトウェアTTS(TTS,Text to Speech)によってテキストデータを転換した音声信号であってもよい。
上記説明から分かるように、上記実施例に係る技術案を採用して、受動的な機能案内によって、ユーザの自発質問に対して即時に回答することができ、ユーザに情報の煩雑及び混乱を与えなく、一方、自発的な機能案内によって、ユーザの操作に基づいて相応に起動し、ユーザが混乱で提示が必要する時に提示を行う。ユーザが音声インタラクティブによって効率的で簡単に機能案内を行うことができるようにする。
図3は、本発明の実施形態を実現するために適する、例示的なコンピュータシステム/サーバ012のブロック図を示す。図3に示すコンピュータシステム/サーバ012は、1つの例だけであり、本発明の実施例の機能及び使用範囲を制限していない。
図3に示すように、コンピュータシステム/サーバ012は、汎用演算設備の形態で表示される。コンピュータシステム/サーバ012の構成要素には、1つ又は複数のプロセッサ016と、システムメモリ028と、異なるシステム構成要素(システムメモリ028とプロセッサ016とを含む)を接続するためのバス018を含んでいるが、これに限定されない。
バス018は、複数種類のバス構成の中の1つ又は複数の種類を示し、メモリバス又はメモリコントローラ、周辺バス、グラフィック加速ポート、プロセッサ又は複数種類のバス構成でのいずれかのバス構成を使用したローカルバスを含む。例えば、それらの架構には、工業標準架構(ISA)バス、マイクロチャンネル架構(MAC)バス、増強型ISAバス、ビデオ電子規格協会(VESA)ローカルバス及び周辺コンポーネント接続(PCI)バスを含んでいるが、これに限定されない。
コンピュータシステム/サーバ012には、典型的には複数の種類の、コンピュータシステムが読取り可能な媒体を含む。それらの媒体は、コンピュータシステム/サーバ012にアクセスされて使用可能な任意な媒体であり、揮発性の媒体と不揮発性の媒体や移動可能な媒体と移動不可な媒体を含む。
メモリ028には、揮発性メモリ形態のコンピュータシステム読取り可能な媒体、例えばランダムアクセスメモリ(RAM)030及び/又はキャッシュメモリ032を含むことができる。コンピュータシステム/サーバ012には、更に他の移動可能/移動不可なコンピュータシステム記憶媒体や揮発性/不揮発性のコンピュータシステム記憶媒体を含むことができる。例として、ストレジ034は、移動不可能な不揮発性磁媒体を読み書くために用いられる(図3に示していないが、常に「ハードディスクドライブ」とも呼ばれる)。図3に示していないが、移動可能な不揮発性磁気ディスク(例えば「フレキシブルディスク」)に対して読み書きを行うための磁気ディスクドライブ、及び移動可能な不揮発性光ディスク(例えばCD-ROM、DVD-ROM又は他の光媒体)に対して読み書きを行うための光ディスクドライブを提供できる。このような場合に、ドライブは、1つ又は複数のデータ媒体インタフェースを介してバス018にそれぞれ接続される。メモリ028には少なくとも1つのプログラム製品を含み、該プログラム製品には1組の(例えば少なくとも1つの)プログラムモジュールを含み、それらのプログラムモジュールは、本発明の各実施例の機能を実行できるように配置される。
1組の(少なくとも1つの)プログラムモジュール042を含むプログラム/実用ツール040は、例えばメモリ028に記憶され、このようなプログラムモジュール042には、オペレーティングシステム、1つの又は複数のアプリケーションプログラム、他のプログラムモジュール及びプログラムデータを含んでいるが、これに限定しておらず、それらの例示での1つ又はある組み合にはネットワーク環境の実現を含む可能性がある。プログラムモジュール042は、常に本発明に記載されている実施例における機能及び/又は方法を実行する。
コンピュータシステム/サーバ012は、1つ又は複数の周辺設備014(例えばキーボード、ポインティングデバイス、ディスプレイ024等)と通信を行ってもよく、本発明において、コンピュータシステム/サーバ012は外部レーダ設備と通信を行い、1つ又は複数のユーザと該コンピュータシステム/サーバ012とのインタラクションを実現することができる設備と通信を行ってもよく、及び/又は該コンピュータシステム/サーバ012と1つ又は複数の他の演算設備との通信を実現することができるいずれかの設備(例えばネットワークカード、モデム等)と通信を行っても良い。このような通信は入力/出力(I/O)インタフェース022によって行うことができる。そして、コンピュータシステム/サーバ012は、ネットワークアダプタ020によって、1つ又は複数のネットワーク(例えばローカルエリアネットワーク(LAN)、広域ネットワーク(WAN)及び/又は公衆回線網、例えばインターネット)と通信を行っても良い。図3に示すように、ネットワークアダプタ020は、バス018によってコンピュータシステム/サーバ012の他のモジュールと通信を行う。もちろん、図3に示していないが、コンピュータシステム/サーバ012と連携して他のハードウェア及び/又はソフトウェアモジュールを使用することができ、マイクロコード、設備ドライブ、冗長処理手段、外部磁気ディスクドライブアレイ、RAIDシステム、磁気テープドライブ及びデータバックアップストレジ等を含むが、これに限定されない。
プロセッサ016は、メモリ028に記憶されているプログラムを実行することで、本発明に記載されている実施例における機能及び/又は方法を実行する。
上記のコンピュータプログラムは、コンピュータ記憶媒体に設けることができ、即ち該コンピュータ記憶媒体にコンピュータプログラムが記憶されており、該プログラムが1つ又は複数のコンピュータに実行される時、1つ又は複数のコンピュータに本発明の上記の実施例に記載されている方法フロー及び/又は装置操作を実行させる。
経時及び技術発達に伴い、媒体の意味もますます広がり、コンピュータプログラムの伝送経路も、有形な媒体に限らず、ネットワーク等から直接的にダウンロードすることもできる。1つ又は複数のコンピュータ読み取り可能な媒体の任意な組合せを採用しても良い。コンピュータ読み取り可能な媒体は、コンピュータ読み取り可能な信号媒体又はコンピュータ読み取り可能な記憶媒体である。コンピュータ読み取り可能な記憶媒体は、例えば、電気、磁気、光、電磁気、赤外線、又は半導体のシステム、装置又はデバイス、或いは上記のものの任意な組合せであるが、これに限定されない。コンピュータが読み取り可能な記憶媒体の更なる具体的な例(網羅的ではないリスト)には、1つ又は複数のワイヤを具備する電気的な接続、携帯式コンピュータ磁気ディスク、ハードディスク、ランダムアクセスメモリ(RAM)、リードオンリーメモリ(ROM)、消去可能なプログラマブルリードオンリーメモリ(EPROM又はフラッシュ)、光ファイバー、携帯式コンパクト磁気ディスクリードオンリーメモリ(CD-ROM)、光メモリ部材、磁気メモリ部材、又は上記のものの任意で適切な組合せを含む。本願において、コンピュータが読み取り可能な記憶媒体は、プログラムを含む又は記憶する任意な有形媒体であってもよく、該プログラムは、命令実行システム、装置又はデバイスに使用される又はそれらと連携して使用されることができる。
コンピュータ読み取り可能な信号媒体には、ベースバンドにおいて伝搬されるデータ信号或いはキャリアの一部として伝搬されるデータ信号を含み、それにコンピュータが読み取り可能なプログラムコードが載っている。このような伝搬されるデータ信号について、複数種類の形態を採用でき、電磁気信号、光信号又はそれらの任意で適切な組合せを含んでいるが、これに限定されない。コンピュータ読み取り可能な信号媒体は、コンピュータ読み取り可能な記憶媒体以外の任意なコンピュータ読み取り可能な媒体であってもよく、該コンピュータ読み取り可能な媒体は、命令実行システム、装置又はデバイスによって使用される又はそれと連携して使用されるプログラムを送信、伝搬又は転送できる。
コンピュータ読み取り可能な媒体に記憶されたプログラムコードは、任意で適正な媒体によって転送されてもよく、無線、電線、光ケーブル、RF等、又は上記のものの任意で適切な組合せが含まれているが、これに限定されない。
1つ又は複数の種類のプログラミング言語又はそれらの組合せで、本発明の操作を実行するためのコンピュータプログラムコードを編集することができ、上記プログラミング言語には、オブジェクト向けのプログラミング言語、例えばJava(登録商標)、Smalltalk、C++が含まれ、通常のプロシージャ向けプログラミング言語、例えば「C」言語又は類似しているプログラミング言語も含まれる。プログラムコードは、完全的にユーザコンピュータに実行されてもよく、部分的にユーザコンピュータに実行されてもよく、1つの独立のソフトウェアパッケージとして実行されてもよく、部分的にユーザコンピュータに実行され且つ部分的に遠隔コンピュータに実行されてもよく、又は完全的に遠隔コンピュータ又はサーバに実行されてもよい。遠隔コンピュータに係る場合に、遠隔コンピュータは、ローカルエリアネットワーク(LAN)又は広域ネットワーク(WAN)を含む任意の種類のネットワークを介して、ユーザコンピュータ、又は、外部コンピュータに接続できる(例えば、インターネットサービス事業者を利用してインターネットを介して接続できる)。
当業者であれば、説明の便宜および簡潔さのために、記述した端末及びサーバーの具体的な作業プロセスは、上述の方法の実施例中の対応過程を参照することができることが分かる。ここでは贅言しない。
本発明に開示されたいくつの実施例で開示された装置および方法などが、他の手段によって実現できることを理解すべきである。例えば、上述の装置に関する実施形態は例示だけであり、例えば、上記手段の区分がロジック機能上の区分だけであり、実際的に実現する時、他の区分形態であってもよく、例えば、複数の手段又は部材は、他の1つのシステムに組み合又は集積してもよく、又は一部の特徴は無視してもよく、実行しなくてもよい。更に、図示または検討した相互の結合または直接結合または通信接続は、いくつかのインタフェース、デバイス、または手段を介した間接的な結合または通信接続であってもよく、電気的、機械的または他の形態であってもよい。
上記の分離部品として説明された手段が、物理的に分離されてもよく、物理的に分離されなくてもよく、手段として表される部品が、物理手段でもよく、物理手段でなくてもよく、1つの箇所に位置してもよく、又は複数のネットワークセルに分布されても良い。実際の必要に基づいて、その中の部分又は全部を選択して、本実施例の態様の目的を実現できる。
また、本発明の各実施例における各機能手段が、1つの処理手段に集積されてもよく、各手段が物理的に独立に存在してもよく、2つ又は2つ以上の手段が1つの手段に集積されても良い。上記集積された手段は、ハードウェアの形式で実現してもよく、ハードウェア+ソフトウェア機能手段の形式で実現しても良い。
最後、説明しようとすることは、上記の実施例が本出願の技術案を説明するためだけに使用され、それを限定されるものではないことである。前述の実施形態を参照して詳細に説明したが、当業者であれば、上記実施例で説明された技術案を修正し、またはそのうちの若干技術特徴を均等に置換することができ、これらの修正又は置換が、相応な技術案の本質が本願の各々実施形態の精神および範囲を超えることを齎さないことを、理解すべきであろう。

Claims (18)

  1. スマート設備の機能案内方法であって、
    ユーザの音声データを取得し、前記音声データに対応する操作指令を取得すること、
    前記操作指令が予め設けられた案内条件を満足するかを判断し、前記操作指令が予め設けられた案内条件を満足すれば、スマート設備へ案内音声を送信すること、を含む
    スマート設備の機能案内方法。
  2. ユーザの音声データを取得し、前記音声データに対応する操作指令を取得することは、
    スマート設備がモニタしたユーザの音声データを受信すること、
    前記音声データに対して音声識別を行い、前記音声データに対応する識別テキストを取得すること、
    前記識別テキストに対して意味分析を行い、前記識別テキストに対応する操作指令を取得すること、を含む
    請求項1に記載されたスマート設備の機能案内方法。
  3. 前記操作指令が予め設けられた案内条件を満足すれば、スマート設備へ案内音声を送信することは、
    前記操作指令が自発的な質問タイプであれば、機能案内ライブラリにおいて前記操作指令に対応する予め設けられた案内音声を問い合わせ、スマート設備へ前記予め設けられた案内音声を送信し、ユーザに対して受動的な機能案内を行うこと、を含む
    請求項1に記載されたスマート設備の機能案内方法。
  4. 前記操作指令に対応する機能の複雑度に基づいて、ユーザに対して一回の受動的な機能案内或いは複数回の受動的な機能案内を行う
    請求項3に記載されたスマート設備の機能案内方法。
  5. 前記操作指令が予め設けられた案内条件を満足すれば、スマート設備へ案内音声を送信することは、
    前記操作指令が機能操作タイプであれば、且つ前記機能操作タイプの指令に関する予め設けられた起動条件を満足すれば、機能案内ライブラリにおいて前記操作指令に対応する予め設けられた案内音声を問い合わせ、スマート設備へ前記予め設けられた案内音声を送信し、ユーザに対して自発的な機能案内を行うこと、を含む
    請求項1に記載されたスマート設備の機能案内方法。
  6. 前記予め設けられた起動条件は、
    ユーザが初めてある機能に対して前記操作指令を発すること、
    前記操作指令が非効率的な操作指令であり、ユーザの所定期間内に発した回数が予め設けられた回数閾値に到達したこと、
    ユーザが頻繁に前記操作指令を発し且つ同一の機能を実現する他の操作指令が存在すること、
    前記操作指令に新たに出現した類似操作指令或いは機能が存在すること、
    の中の少なくとも1つを含む
    請求項5に記載されたスマート設備の機能案内方法。
  7. 前記予め設けられた起動条件が、ユーザが初めてある機能に対して前記操作指令を発することであれば、対応する予め設けられた案内音声は、前記機能の重要指令であり、
    前記予め設けられた起動条件が、前記操作指令が非効率的な操作指令であり、ユーザの所定期間内に発した回数が予め設けられた回数閾値に到達したことであれば、対応する予め設けられた案内音声は、前記操作指令に対応する効率的な操作指令であり、
    前記予め設けられた条件が、ユーザが頻繁に前記操作指令を発し且つ同一の機能を実現する他の操作指令が存在することであれば、対応する予め設けられた案内音声は、前記機能の他の操作指令であり、
    前記予め設けられた条件が、前記操作指令に新たに出現した類似操作指令或いは機能が存在することであれば、対応する予め設けられた案内音声は、新たに出現した類似操作指令或いは機能である
    請求項6に記載されたスマート設備の機能案内方法。
  8. 前記スマート設備の機能案内方法は、
    前記操作指令を実行することを更に含む
    請求項5に記載されたスマート設備の機能案内方法。
  9. スマート設備の機能案内システムであって、
    ユーザの音声データを取得し、前記音声データに対応する操作指令を取得する解析モジュールと、
    前記操作指令が予め設けられた案内条件を満足するかを判断し、前記操作指令が予め設けられた案内条件を満足すれば、スマート設備へ案内音声を送信する案内モジュールと、を含む
    スマート設備の機能案内システム。
  10. 前記解析モジュールは、
    スマート設備がモニタしたユーザの音声データを受信する受信サブモジュールと、
    前記音声データに対して音声識別を行い、前記音声データに対応する識別テキストを取得する音声識別サブモジュールと、
    前記識別テキストに対して意味分析を行い、前記識別テキストに対応する操作指令を取得する意味分析サブモジュールと、を含む
    請求項9に記載されたスマート設備の機能案内システム。
  11. 前記案内モジュールは、具体的に
    前記操作指令が自発的な質問タイプであれば、機能案内ライブラリにおいて前記操作指令に対応する予め設けられた案内音声を問い合わせ、スマート設備へ前記予め設けられた案内音声を送信し、ユーザに対して受動的な機能案内を行うことに用いられる
    請求項9に記載されたスマート設備の機能案内システム。
  12. 前記案内モジュールは、具体的に
    前記操作指令に対応する機能の複雑度に基づいて、ユーザに対して一回の受動的な機能案内或いは複数回の受動的な機能案内を行うことに用いられる
    請求項11に記載されたスマート設備の機能案内システム。
  13. 前記案内モジュールは、具体的に
    前記操作指令が機能操作タイプであれば、且つ前記機能操作タイプの指令に関する予め設けられた起動条件を満足すれば、機能案内ライブラリにおいて前記操作指令に対応する予め設けられた案内音声を問い合わせ、スマート設備へ前記予め設けられた案内音声を送信し、ユーザに対して自発的な機能案内を行うことに用いられる
    請求項9に記載されたスマート設備の機能案内システム。
  14. 前記予め設けられた起動条件は、
    ユーザが初めてある機能に対して前記操作指令を発すること、
    前記操作指令が非効率的な操作指令であり、ユーザの所定期間内に発した回数が予め設けられた回数閾値に到達したこと、
    ユーザが頻繁に前記操作指令を発し且つ同一の機能を実現する他の操作指令が存在すること、
    前記操作指令に新たに出現した類似操作指令或いは機能が存在すること、
    の中の少なくとも1つを含む
    請求項13に記載されたスマート設備の機能案内システム。
  15. 前記予め設けられた起動条件が、ユーザが初めてある機能に対して前記操作指令を発することであれば、対応する予め設けられた案内音声は、前記機能の重要指令であり、
    前記予め設けられた起動条件が、前記操作指令が非効率的な操作指令であり、ユーザの所定期間内に発した回数が予め設けられた回数閾値に到達したことであれば、対応する予め設けられた案内音声は、前記操作指令に対応する効率的な操作指令であり、
    前記予め設けられた条件が、ユーザが頻繁に前記操作指令を発し且つ同一の機能を実現する他の操作指令が存在することであれば、対応する予め設けられた案内音声は、前記機能の他の操作指令であり、
    前記予め設けられた条件が、前記操作指令に新たに出現した類似操作指令或いは機能が存在することであれば、対応する予め設けられた案内音声は、新たに出現した類似操作指令或いは機能である
    請求項13に記載されたスマート設備の機能案内システム。
  16. 前記案内モジュールは、さらに、
    前記操作指令を実行することに用いられる
    請求項13に記載されたスマート設備の機能案内システム。
  17. メモリ、プロセッサ及び前記メモリに記憶され前記プロセッサに実行されるコンピュータプログラムを含むコンピュータ設備であって、
    前記プロセッサが前記プログラムを実行する時、請求項1〜8のいずれか1項に記載されたスマート設備の機能案内方法を実現する。
  18. コンピュータプログラムであって、
    プロセッサによって実行される時、請求項1〜8のいずれか1項に記載されたスマート設備の機能案内方法を実現する。
JP2018212637A 2018-02-01 2018-11-13 スマート設備の機能案内方法及システム Active JP6683794B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201810102549.XA CN108520748B (zh) 2018-02-01 2018-02-01 一种智能设备功能引导方法及系统
CN201810102549.X 2018-02-01

Publications (2)

Publication Number Publication Date
JP2019133634A true JP2019133634A (ja) 2019-08-08
JP6683794B2 JP6683794B2 (ja) 2020-04-22

Family

ID=63432755

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018212637A Active JP6683794B2 (ja) 2018-02-01 2018-11-13 スマート設備の機能案内方法及システム

Country Status (3)

Country Link
US (1) US10937423B2 (ja)
JP (1) JP6683794B2 (ja)
CN (1) CN108520748B (ja)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US12118991B2 (en) * 2018-07-20 2024-10-15 Sony Corporation Information processing device, information processing system, and information processing method
CN109697244A (zh) * 2018-11-01 2019-04-30 百度在线网络技术(北京)有限公司 信息处理方法、装置及存储介质
CN109656531A (zh) * 2018-12-11 2019-04-19 北京像素软件科技股份有限公司 游戏引导方法及装置
CN109979451A (zh) * 2019-03-20 2019-07-05 百度在线网络技术(北京)有限公司 用于输出信息的方法和装置
CN110069657A (zh) * 2019-04-30 2019-07-30 百度在线网络技术(北京)有限公司 一种交互式音乐点播方法、装置及终端
CN112114770A (zh) * 2019-06-19 2020-12-22 百度在线网络技术(北京)有限公司 基于语音交互的界面引导方法、装置及设备
CN110472095B (zh) * 2019-08-16 2023-03-10 百度在线网络技术(北京)有限公司 语音引导方法、装置、设备和介质
CN110517690A (zh) * 2019-08-30 2019-11-29 四川长虹电器股份有限公司 语音控制功能的引导方法及系统
CN110517684B (zh) * 2019-09-10 2022-03-08 百度在线网络技术(北京)有限公司 用于智能设备的控制方法、装置、智能设备及存储介质
CN112579032B (zh) * 2019-09-27 2023-10-03 百度在线网络技术(北京)有限公司 智能设备引导的方法及装置
CN110990599A (zh) * 2019-12-04 2020-04-10 广东小天才科技有限公司 一种交互方法、装置、家教机、计算机设备和存储介质
CN111432362A (zh) * 2020-02-28 2020-07-17 联想(北京)有限公司 声源控制方法、系统及装置
CN111367453A (zh) * 2020-03-06 2020-07-03 广东小天才科技有限公司 一种自动触发引导程序的方法及电子设备
CN111736938B (zh) * 2020-06-19 2024-03-22 海尔优家智能科技(北京)有限公司 信息的显示方法及装置、存储介质和电子装置
CN111752442B (zh) * 2020-08-11 2023-08-15 腾讯科技(深圳)有限公司 显示操作引导信息的方法、装置、终端及存储介质
CN115278335A (zh) * 2022-07-20 2022-11-01 思必驰科技股份有限公司 语音功能使用方法及电子设备和存储介质
CN117690423A (zh) * 2022-09-05 2024-03-12 华为技术有限公司 人机交互方法及相关装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004258233A (ja) * 2003-02-25 2004-09-16 Fujitsu Ltd 適応型音声対話システム及び方法
JP2008268517A (ja) * 2007-04-19 2008-11-06 Matsushita Electric Works Ltd 音声認識機能付き操作器
JP2017090613A (ja) * 2015-11-09 2017-05-25 三菱自動車工業株式会社 音声認識制御システム
CN107146612A (zh) * 2017-04-10 2017-09-08 北京猎户星空科技有限公司 语音引导方法、装置、智能设备及服务器

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL140805A0 (en) * 1998-10-02 2002-02-10 Ibm Structure skeletons for efficient voice navigation through generic hierarchical objects
US6964023B2 (en) * 2001-02-05 2005-11-08 International Business Machines Corporation System and method for multi-modal focus detection, referential ambiguity resolution and mood classification using multi-modal input
WO2009146238A1 (en) * 2008-05-01 2009-12-03 Chacha Search, Inc. Method and system for improvement of request processing
CN202453859U (zh) * 2011-12-20 2012-09-26 安徽科大讯飞信息科技股份有限公司 一种用于家电的语音交互装置
CN103902629B (zh) * 2012-12-28 2017-09-29 联想(北京)有限公司 利用语音提供操作帮助的电子设备和方法
US20170010859A1 (en) * 2014-04-22 2017-01-12 Mitsubishi Electric Corporation User interface system, user interface control device, user interface control method, and user interface control program
CN106302972A (zh) * 2015-06-05 2017-01-04 中兴通讯股份有限公司 语音使用的提示方法以及终端设备
CN105895093A (zh) * 2015-11-02 2016-08-24 乐视致新电子科技(天津)有限公司 语音信息处理方法及装置
CN105975511A (zh) * 2016-04-27 2016-09-28 乐视控股(北京)有限公司 智能对话的方法及装置
CN205881452U (zh) * 2016-07-04 2017-01-11 佛山市顺德区美的电热电器制造有限公司 烹饪电器
CN116844543A (zh) * 2016-08-26 2023-10-03 王峥嵘 一种基于语音交互的控制方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004258233A (ja) * 2003-02-25 2004-09-16 Fujitsu Ltd 適応型音声対話システム及び方法
JP2008268517A (ja) * 2007-04-19 2008-11-06 Matsushita Electric Works Ltd 音声認識機能付き操作器
JP2017090613A (ja) * 2015-11-09 2017-05-25 三菱自動車工業株式会社 音声認識制御システム
CN107146612A (zh) * 2017-04-10 2017-09-08 北京猎户星空科技有限公司 语音引导方法、装置、智能设备及服务器

Also Published As

Publication number Publication date
CN108520748A (zh) 2018-09-11
JP6683794B2 (ja) 2020-04-22
US20190237072A1 (en) 2019-08-01
CN108520748B (zh) 2020-03-03
US10937423B2 (en) 2021-03-02

Similar Documents

Publication Publication Date Title
JP6683794B2 (ja) スマート設備の機能案内方法及システム
CN109658932B (zh) 一种设备控制方法、装置、设备及介质
JP6713034B2 (ja) スマートテレビの音声インタラクティブフィードバック方法、システム及びコンピュータプログラム
US11600265B2 (en) Systems and methods for determining whether to trigger a voice capable device based on speaking cadence
JP6952184B2 (ja) ビューに基づく音声インタラクション方法、装置、サーバ、端末及び媒体
JP7029613B2 (ja) インターフェイススマートインタラクティブ制御方法、装置、システム及びプログラム
CN108133707B (zh) 一种内容分享方法及系统
JP6862632B2 (ja) 音声インタラクション方法、装置、設備、コンピュータ記憶媒体及びコンピュータプログラム
CN109979465B (zh) 电子装置、服务器及其控制方法
KR102304052B1 (ko) 디스플레이 장치 및 그의 동작 방법
TWI511125B (zh) 語音操控方法、行動終端裝置及語音操控系統
US9947333B1 (en) Voice interaction architecture with intelligent background noise cancellation
US11164571B2 (en) Content recognizing method and apparatus, device, and computer storage medium
EP3214842B1 (en) Display apparatus, electronic device, interactive system, and controlling methods thereof
CN109448709A (zh) 一种终端投屏的控制方法和终端
US10853032B1 (en) Curating audio and IR commands through machine learning
JP2000207170A (ja) 情報処理装置および情報処理方法
CN107483993B (zh) 电视的语音输入方法、电视和计算机可读存储介质
WO2023184266A1 (zh) 语音控制方法及装置、计算机可读存储介质、电子设备
KR102584324B1 (ko) 음성 인식 서비스 제공 방법 및 이를 위한 장치
KR20220156786A (ko) 사용자의 발화를 기반으로 컨텐츠를 제공하는 장치 및 시스템
JP6944920B2 (ja) スマートインタラクティブの処理方法、装置、設備及びコンピュータ記憶媒体
JP6715307B2 (ja) 設備の発見方法、装置、設備及びプログラム
CN109275140A (zh) 一种信息处理方法、系统及服务器
CN110289010B (zh) 一种声音采集的方法、装置、设备和计算机存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181113

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20191129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191203

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200219

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200305

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200326

R150 Certificate of patent or registration of utility model

Ref document number: 6683794

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313114

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250