JP2022120100A

JP2022120100A - 指令を認識するための方法、装置、電子機器、記憶媒体、コンピュータプログラムおよび音声インタラクティブスクリーン

Info

Publication number: JP2022120100A
Application number: JP2022094122A
Authority: JP
Inventors: ウェンジュンチャン; Wenjun Zhang; ゼチェンズオ; Zecheng Zhuo; ジャンゴン; Jian Gong; キャンファン; Qiang Huang; グオアンヨウ; Guo'an You; シューパン; Xu Pan
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2021-09-16
Filing date: 2022-06-10
Publication date: 2022-08-17
Also published as: CN113779201B; US20220318503A1; EP4109323A3; CN113779201A; EP4109323A2; KR20220077898A

Abstract

【課題】指令を認識するための方法、装置、電子機器、記憶媒体、コンピュータプログラムおよび音声インタラクティブスクリーンを提供する。【解決手段】方法は、認識すべき指令に対応するテキストベクトルおよび少なくとも１つの単語重要度を取得することと、当該テキストベクトルおよび少なくとも１つの単語重要度に基づいて、指令と指令のテキストベクトルとの対応関係を含む予め設定された指令ライブラリの中から、目標数の仮マッチング指令を選択し、当該指令ライブラリ内の指令は、指令タイプと指令の対象となるキーワードとを含むことと、当該目標数の仮マッチング指令における、指令タイプおよび指令の対象となるキーワードに基づいて、当該認識すべき指令にマッチングする、指令タイプおよび指令の対象となるキーワードを生成することと、を含む。【選択図】図１

Description

本開示は、自然言語処理、クラウドコンピューティング等の人工知能技術の分野に関し、特に、指令を認識するための方法、装置および音声インタラクティブスクリーンに関する。

インターネット技術の発展に伴い、人とコンピュータのインタラクションは益々頻繁になっている。ヒューマンコンピュータインタラクションシーンでは、ユーザの意図を判定するために、含まれた指令を正確に認識することは、特に重要である。

従来技術では、予め設定された規則に従って認識すべき指令からキーワードを抽出して、キーワードと、予め構築された指令タイプのキーワードおよび指令内容のキーワードとが同一であるか否かを比較することにより、指令の認識結果を確定することが多い。

指令を認識するための方法、装置、電子機器、記憶媒体、コンピュータプログラムおよび音声インタラクティブスクリーンを提供する。

第１の態様によれば、認識すべき指令に対応する、テキストベクトルおよび少なくとも１つの単語重要度を取得することと、テキストベクトルおよび少なくとも１つの単語重要度に基づいて、予め設定された指令ライブラリの中から目標数の仮マッチング指令を選択することであって、指令ライブラリには指令と指令のテキストベクトルとの対応関係が含まれ、指令ライブラリ内の指令には、指令タイプと、指令の対象となるキーワードとが含まれる、ことと、目標数の仮マッチング指令における指令タイプおよび指令の対象となるキーワードに基づいて、認識すべき指令にマッチングする指令タイプおよび、認識すべき指令にマッチングする指令の対象となるキーワードを生成することと、を含む、指令を認識するための方法を提供する。

第２のの態様によれば、認識すべき指令に対応する、テキストベクトルおよび少なくとも１つの単語重要度を取得するように構成される取得ユニットと、テキストベクトルおよび少なくとも１つの単語重要度に基づいて、予め設定された指令ライブラリの中から目標数の仮マッチング指令を選択するように構成される選択ユニットであって、指令ライブラリには指令と指令のテキストベクトルとの対応関係が含まれ、指令ライブラリ内の指令には、指令タイプと、指令の対象となるキーワードとが含まれる、選択ユニットと、目標数の仮マッチング指令における、指令タイプおよび指令の対象となるキーワードに基づいて、認識すべき指令にマッチングする指令タイプおよび認識すべき指令にマッチングする指令の対象となるキーワードを生成するように構成される生成ユニットと、を備える指令を認識するための装置を提供する。

第３の態様によれば、少なくとも１つのプロセッサと、上記少なくとも１つのプロセッサと通信接続されたメモリとを備える電子機器であって、メモリには、上記少なくとも１つのプロセッサによって実行可能な指令が格納され、上記指令が少なくとも１つのプロセッサによって実行されると、上記少なくとも１つのプロセッサに第１の態様のいずれかの実施形態に記載の方法が実行される、電子機器を提供する。

第４の態様によれば、コンピュータ指令が格納されている非一時的コンピュータ可読記
憶媒体であって、当該コンピュータ指令は第１の態様のいずれかの実施形態に記載の方法をコンピュータに実行させるために用いられる非一時的コンピュータ可読記憶媒体を提供する。

第５の態様によれば、プロセッサによって実行されると、第１の態様のいずれかの実施形態に記載の方法が実現されるコンピュータプログラムを提供する。

第６の態様によれば、受信した音声を認識して認識すべき指令を生成するように構成される音声認識装置と、第３の態様に記載の電子機器と、認識すべき指令にマッチングする指令タイプおよび指令の対象となるキーワードに基づいて、認識すべき指令にマッチングする内容を表示するように構成される表示装置と、を備える音声インタラクティブスクリーンを提供する。

本開示の技術によれば、セマンティックとバッグ・オブ・ワーズの２つの次元において、認識すべき指令に対応するテキストベクトルおよび少なくとも１つの単語重要度と、予め設定された指令ライブラリ内の指令とをマッチングすることにより、認識すべき指令の指令タイプおよび指令の対象となるキーワードの解析結果を得る。これにより、予め設定された指令ライブラリの情報構築量を削減することができ、セマンティックマッチングにより、より優れたフォールトトレランスと汎化性が実現され、指令認識の効果が向上される。

なお、発明の概要に記載された内容は、本開示の実施形態のかなめとなる特徴または重要な特徴を限定することを意図するものではなく、本開示の範囲を限定するものでもない。本開示の他の特徴は、以下の説明によって容易に理解される。

図面は本開示をよりよく理解するために用いられ、本開示に対する限定ではない。
本開示の第１の実施形態の概略図である。本開示の第２の実施形態の概略図である。本開示の実施形態に係る指令を認識するための方法の一応用シーンの概略図である。本開示の実施形態に係る指令を認識するための装置の概略図である。本開示の実施形態に係る指令を認識するための方法を実現するための電子機器のブロック図である。

以下は図面を参照しながら本開示の例示的な実施形態を説明し、ここでは理解を助けるために、本開示の実施形態の様々な詳細が記載されるが、これらは単なる例示的なものに過ぎない。従って、本開示の範囲および要旨を逸脱しない限り、当業者が本明細書の実施形態に対して様々な変更および修正を行うことができることは自明である。なお、以下の説明では、明確化および簡略化のため、公知の機能および構成については説明を省略する。

図１は、本開示に係る第１の実施形態の概略図１００を示している。当該指令を認識するための方法は、次のステップを含む。

Ｓ１０１では、認識すべき指令に対応するテキストベクトルおよび少なくとも１つの単語重要度を取得する。

本実施形態では、指令を認識するための実行主体は、認識すべき指令に対応するテキス
トベクトルと少なくとも１つの単語重要度とを様々な方法で取得することができる。例示として、上記実行主体は、ローカルまたは通信可能に接続された電子機器から、有線または無線接続方式で、認識すべき指令に対応するテキストベクトルおよび少なくとも１つの単語重要度を取得してもよい。ここで、上記単語重要度は、上記認識すべき指令における単語の上記認識すべき指令全体における重要度を表すために用いることができる。例示として、上記単語重要度は、単語の出現頻度または単語の出現頻度－逆文書頻度指数（ｔｅｒｍｆｒｅｑｕｅｎｃｅ-ｉｎｖｅｒｓｅｄｏｃｕｍｅｎｔｆｒｅｑｕｅｎｃｙ，
ＴＦ－ＩＤＦ）であってもよい。

本実施形態では、上述した認識すべき指令に対応するテキストベクトルおよび少なくとも１つの単語重要度は、様々な方法で生成されてもよい。例示として、認識すべき指令に対応するテキストベクトルおよび少なくとも１つの単語重要度を生成するための実行主体は、まず認識すべき指令を取得してもよい。なお、上記認識すべき指令は、ユーザが入力したテキストであってもよいし、ユーザが入力した音声を音声認識して得られたテキストであってもよく、ここでは限定をしない。そして、上記実行主体は、様々なテキストベクトル化方法（例えば、ＳｅｎｔｅｎｃｅＢＥＲＴモデルを用いること）により、取得した認識対象テキストを対応するテキストベクトルに変換してもよい。ここで、上記テキストベクトルは、通常、認識対象テキストと１対１に対応することができ、例えば、１つの認識対象テキストを１２８次元の浮動小数点数のベクトルに変換する。また、上記実行主体は、各種の単語分割ツールを用いて上記認識対象テキストを単語分割するようにしてもよい。オプションとして、上記実行主体は、例えば、完全な人名、地名を保留するように、細かく分割された単語を併合してもよい。

なお、上記認識すべき指令に対応するテキストベクトルおよび少なくとも１つの単語重要度を生成するための実行主体は、上述した指令を認識するための実行主体と同一であっても異なっていてもよく、ここでは限定をしない。

Ｓ１０２では、テキストベクトルおよび少なくとも１つの単語重要度に基づいて、予め設定された指令ライブラリから目標数の仮マッチング指令を選択する。

本実施形態では、上記予め設定された指令ライブラリには、指令と指令のテキストベクトルとの対応関係が含まれてもよい。上記予め設定された指令ライブラリ内の指令には、指令タイプと、指令の対象となるキーワードとが含まれてもよい。ここで、上記指令タイプは、通常、実行すべき動作の種類、例えば、「ページを開く」、「ページを閉じる」、「モニタ画面（カメラ）を切り替える」、「ズームイン」等を示すために用いられる。上述した指令の対象となるキーワードは、通常、「都市管理」、「交通トラフィック」、「ＸＸ交差点」等、実行すべき動作の対象となる特定のオブジェクトを示すために用いられる。

本実施形態では、例示として、上述した予め設定された指令ライブラリ内の指令の１つは、「（ページを）開く、都市管理、テキストベクトル」であってもよい。ここで、上記テキストベクトルは、「都市管理ページを開く」をテキストベクトル化することで得られたベクトルであってもよい。

本実施形態では、ステップＳ１０１で取得されたテキストベクトルおよび少なくとも１つの単語重要度のそれぞれのマッチング結果に基づいて、上記実行主体は、様々な方法で予め設定された指令ライブラリから目標数の仮マッチング指令を選択することができる。例示として、上記実行主体は、まず、ステップＳ１０１で取得されたテキストベクトルと、上記予め設定された指令ライブラリ内の指令に対応するテキストベクトルとを用いて類似度の計算を行い、最も類似度の高いＭ個のテキストベクトルに対応する指令を候補マッ
チング指令として選択してもよい。そして、上記実行主体は、上記候補マッチング指令のうちの指令に含まれる単語の単語重要度（例えば、「開く」の単語重要度、「都市管理」の単語重要度、「ページ」の単語重要度）を確定することができる。次に、上記実行主体は、上記選択された候補マッチング指令の中から、上記認識すべき指令に対応する単語重要度（例えば、「見せてください」の単語重要度、「都市管理」の単語重要度、「ページ」の単語重要度）における一致する単語（例えば、「都市管理」）の単語重要度以上の単語重要度を有する単語を含む目標数の指令を上記仮マッチング指令として選択することができる。

なお、上記目標数は、例えば５個など、実際の応用シーンによって予め設定された数であってもよい。上記目標数は、例えば、類似度および単語重要度がいずれも所定閾値を超えた指令の数など、規則に従って定められた数であってもよい。

Ｓ１０３では、目標数の仮マッチング指令における指令タイプおよび指令の対象となるキーワードに基づいて、認識すべき指令にマッチングする指令タイプおよび指令の対象となるキーワードを生成する。

本実施形態では、上記実行主体は、ステップＳ１０２で選択された目標数の仮マッチング指令における指令タイプおよび指令の対象となるキーワードに基づいて、様々な方法で認識すべき指令にマッチングする指令タイプおよび指令の対象となるキーワードを生成することができる。

本実施形態では、例示として、上記実行主体は、上記目標数の仮マッチング指令における出現回数が最も多い指令タイプおよび指令の対象となるキーワードそれぞれを、認識すべき指令にマッチングする指令タイプおよび指令の対象となるキーワードとして確定することができる。

本開示の上記実施形態に係る方法は、セマンティックとバッグ・オブ・ワーズの２つの次元において、認識すべき指令に対応するテキストベクトルおよび少なくとも１つの単語重要度と、予め設定された指令ライブラリ内の指令とをマッチングすることにより、認識すべき指令の指令タイプおよび指令の対象となるキーワードの解析結果を得る。これにより、予め設定された指令ライブラリの情報構築量を削減し、セマンティックマッチングすることによって、より優れたフォールトトレランスと汎化性を実現でき、さらに応用効率および認識率などの観点から指令認識の効果を高めることができる。

本実施形態のいくつかのオプション的な実施形態において、上記実行主体は、テキストベクトルおよび少なくとも１つの単語重要度に基づいて、以下のステップによって予め設定された指令ライブラリから目標数の仮マッチング指令を選択することができる。

Ｓ１０２１では、予め設定された指令ライブラリの中から、テキストベクトルにマッチングする第１の数の指令をプリマッチング指令として選択する。

これらの実施形態において、上記実行主体は、様々な方法により上記予め設定された指令ライブラリから、テキストベクトルにマッチングする第１の数の指令をプリマッチング指令として選択することができる。

例示として、上記実行主体は、まず、ステップＳ１０１で取得したテキストベクトルと、上記予め設定された指令ライブラリ内の指令に対応するテキストベクトルとを用いて類似度の計算を行い、最も類似度の高い第１の数（例えば、１０個）のテキストベクトルに対応する指令を候補マッチング指令として選択することができる。

Ｓ１０２２では、予め設定された指令ライブラリから、少なくとも１つの単語重要度にマッチングする第２の数の指令を、プリマッチング指令として選択する。

これらの実施形態において、上記実行主体は、様々な方法により予め設定された指令ライブラリから、少なくとも１つの単語重要度にマッチングする第２の数（例えば１０個）の指令をプリマッチング指令として選択することができる。上記プリマッチング指令には、上記少なくとも１つの単語重要度が示す単語と同じ単語が少なくとも１つ含まれる。

例示として、上記認識すべき指令に対応する少なくとも１つの単語重要度が示す単語は、例えば、「Ａ」および「Ｂ」であってもよい。そして、上記プリマッチング指令には、「Ａ」および「Ｂ」の少なくとも一方が含まれる。

Ｓ１０２３では、選択されたプリマッチング指令のセットから目標数の指令を仮マッチング指令として選択する。

これらの実施形態において、上記実行主体は、様々な方法により上記ステップＳ１０２２で選択されたプリマッチング指令のセットの中から、目標数の指令を仮マッチング指令として選択することができる。例示として、上記ステップＳ１０２１で選択された第１の数のプリマッチング指令と、上記ステップＳ１０２２で選択された第２の数のプリマッチング指令とにおいて同一の指令が存在すると判断された場合、上記実行主体は、上記同一の指令を上記仮マッチング指令として確定してもよい。

上記のオプション的な実施形態に基づいて、本方案は、予め設定された指令ライブラリから仮マッチング指令を選択する方法を豊富にすることができ、それによって、セマンティックとバッグ・オブ・ワーズの２つの次元のさらなる結合によりマッチングの精度を高めることができる。

オプションとして、本実施形態のいくつかのオプション的な実施形態において、上記実行主体は、以下のステップによって予め設定された指令ライブラリから、少なくとも１つの単語重要度にマッチングする第２の数の指令をプリマッチング指令として選択してもよい。

第１ステップでは、予め設定された指令ライブラリから少なくとも１つの目標単語を含む指令を選択し、目標指令セットを生成する。

これらの実施形態において、上記目標単語は、通常、上記認識すべき指令を単語分割することによって得られた単語を含む。上記目標単語は、上述した認識すべき指令に対応する少なくとも１つの単語重要度が示す単語と一致してもよい。

オプションとして、上記予め設定された指令ライブラリに転置インデックス（ＩｎｖｅｒｔｅｄＩｎｄｅｘ）が含まれることにより、上記実行主体は、目標指令を転置インデックスにより高速に選択して、目標指令セットを生成することができる。

第２ステップでは、目標指令セット内の指令について、当該指令における、少なくとも１つの目標単語にマッチングする単語の単語重要度を累加して、当該指令に対応する指令重要度を生成する。

これらの実施形態において、例示として、上記少なくとも１つの目標単語は、「Ａ」および「Ｂ」を含んでもよい。目標指令セット内の指令について、当該指令に目標単語「Ａ
」のみが含まれる場合、当該指令に対応する指令重要度は、目標単語「Ａ」に対応する単語重要度である。当該指令に目標単語「Ａ」と目標単語「Ｂ」とが含まれる場合、当該指令に対応する指令重要度は、目標単語「Ａ」に対応する単語重要度と目標単語「Ｂ」に対応する単語重要度との和である。

第３ステップでは、対応する指令重要度が最も高い上位の第２の数の指令を、第２の数のプリマッチング指令として選択する。

これらの実施形態において、上記実行主体は、上記第２ステップで生成された指令重要度に基づいて、対応する指令重要度が最も高い上位の第２の数の指令を、第２の数のプリマッチング指令として選択することができる。

上記のオプション的な実施形態によれば、本方案は、単語重要度に基づいて第２の数のプリマッチング指令を選択する方法を豊富にし、それによって、バッグ・オブ・ワーズの次元からマッチングする精度を可能な限り向上させた。

オプションとして、本実施形態のいくつかのオプション的な実施形態において、上記実行主体は、以下のステップによって選択されたプリマッチング指令のセットから、目標数の指令を仮マッチング指令として選択してもよい。

第１ステップでは、選択されたプリマッチング指令のセットにおける指令を重複排除して、第３の数のプリマッチング指令を生成する。

これらの実施形態において、上記実行主体は、様々な方法によってステップＳ１０２２で選択されたプリマッチング指令のセットにおける指令を重複排除して第３の数のプリマッチング指令を生成することができる。ここで、上記第３の数は、通常、上記第１の数と上記第２の数との和を超えない。

第２ステップでは、テキスト類似度に基づいて、第３の数のプリマッチング指令の中から目標数の指令を仮マッチング指令として選択する。

これらの実施形態において、上記実行主体は、様々な方法によってテキスト類似度に基づいて、上記第１ステップで生成された第３の数のプリマッチング指令の中から、目標数の指令を仮マッチング指令として選択することができる。ここで、上記テキスト類似度は、上記認識すべき指令と上記第３の数のプリマッチング指令のうちの指令との類似度を表すためのものであってもよい。例示として、上記テキスト類似度は、認識すべき指令に対応するテキストベクトルと、上記プリマッチング指令における指令に対応するテキストベクトルとの類似度であってもよい。上記実行主体は、上記第３の数のプリマッチング指令の中から、テキスト類似度の高から低への順に従って目標数の指令を仮マッチング指令として選択してもよい。また、他の例として、上記実行主体はさらに、上記第３の数のプリマッチング指令の中から、予め設定された類似度閾値よりも大きいテキスト類似度を有する目標数の指令を、仮マッチング指令としてランダムに選択してもよい。

上記のオプション的な実施形態によれば、本方案は、選択されたプリマッチング指令のセットから仮マッチング指令を選択する方式を豊富にし、セマンティックマッチング度を用いて高精度なマッチングを行うことで精度を高いレベルに維持することが確保される。

本実施形態のいくつかのオプション的な実施形態において、上記実行主体は、目標数の仮マッチング指令における指令タイプおよび指令の対象となるキーワードに基づいて、認識すべき指令にマッチングする指令タイプおよび指令の対象となるキーワードを、以下の
ステップによって生成することができる。

第１ステップでは、目標数の仮マッチング指令における指令タイプおよび指令の対象となるキーワードについて、当該指令タイプおよび当該指令の対象となるキーワードに対応する指令のテキスト類似度をそれぞれ累加し、指令タイプおよび指令の対象となるキーワードのそれぞれに対応する累加値を生成する。

これらの実施形態において、例示として、上記仮マッチング指令は、指令１「都市管理、を開く」と指令２「都市交通、を開く」とを含んでもよい。そして、上記実行主体は、指令タイプ「開く」に対応する累加値が、指令１に対応するテキスト類似度と指令２に対応するテキスト類似度との和であると確定することができる。同様に、上記実行主体は、指令の対象となるキーワード「都市管理」に対応する累加値が、指令１に対するテキスト類似度であると確定することができる。上記実行主体は、指令の対象となるキーワード「都市交通」に対応する累加値が、指令２に対応するテキスト類似度であると確定することができる。

第２ステップでは、累加値が最も大きい指令タイプおよび累加値が最も大きい指令の対象となるキーワードのそれぞれを、認識すべき指令にマッチングする、指令タイプおよび指令の対象となるキーワードとして確定する。

これらの実施形態において、上記実行主体は、上記第１ステップで生成された累加値のうちの累加値が最も大きい指令タイプおよび累加値が最も大きい指令の対象となるキーワードのそれぞれを、認識すべき指令にマッチングする指令タイプおよび指令の対象となるキーワードとして確定することができる。

以上のオプション的な実施形態によれば、本方案は、目標数の仮マッチング指令の中から、認識すべき指令にマッチングする指令タイプおよび指令の対象となるキーワードを確定する方法が豊富になり、指令認識の精度が向上される。

次に、本開示に係る第２の実施形態の概略図２００である図２を参照する。当該指令を認識するための方法は、次のステップを含む。

Ｓ２０１では、認識すべき指令に対応するテキストベクトルおよび少なくとも１つの単語重要度を取得する。

Ｓ２０２では、テキストベクトルおよび少なくとも１つの単語重要度に基づいて、予め設定された指令ライブラリから目標数の仮マッチング指令を選択する。

本実施形態では、上記予め設定された指令ライブラリは、以下のステップによって生成される。

Ｓ２０２１では、予め設定された指令テンプレートを取得する。

本実施形態では、上記実行主体は、有線または無線接続方式でローカルまたは通信接続された電子機器から、予め設定された指令テンプレートを取得することができる。ここで、上記指令テンプレートには、指令タイプのスロットと、指令の対象となるキーワードのスロットとが含まれていてもよい。例示として、上記指令テンプレートは、「｛ｏｐｅｎ｝｛ｐａｇｅ｝ページ」であってもよい。

Ｓ２０２２では、予め取得された指令タイプのデータセットおよび指令の対象となるキ
ーワードのデータセットに基づいて、スロット埋込みを行い、事前設定指令セットを生成する。

本実施形態では、上記実行主体は、指令タイプのデータセットと指令の対象となるキーワードのデータセットとを予め取得してもよい。なお、上記の指令タイプのデータセットおよび指令の対象となるキーワードのデータセットには、それぞれ様々な具体的な指令タイプおよび指令の対象となるキーワードが含まれてもよい。例示として、上記指令タイプのデータセットには、「開く」、「閉じる」、「見せてください」などが含まれてもよい。上記の指令の対象となるキーワードのデータセットには、「都市管理」、「文化観光」、「交通トラフィック」などが含まれてもよい。

本実施形態では、上記実行主体は、上記予め取得された指令タイプのデータセットおよび指令の対象となるキーワードのデータセットにおける各データを用いて、上記ステップＳ２０２１における対応するスロットを埋込み、各種の指令を生成し、上記事前設定指令セットを形成することができる。

例示として、上記事前設定指令セット内の指令は、「都市管理ページを開く」、「交通トラフィックページを閉じる」、「文化観光ページを見せてください」などであってもよい。

Ｓ２０２３では、生成された事前設定指令セットにおける指令のテキストベクトル化により、指令とテキストベクトルとの対応関係を生成する。

本実施形態において、上記実行主体は、様々な方法で上記ステップＳ２０２２で生成された事前設定指令セット内の指令をテキストベクトル化して、指令とテキストベクトルとの対応関係を生成することができる。なお、上述したテキストベクトル化の方式は、上述した実施形態におけるステップＳ１０１の対応する記述と一致しており、ここでは限定をしない。

これにより、上記実行主体は、上記事前設定指令セットと、上記の、指令とテキストベクトルとの対応関係との組み合わせを、上記予め設定された指令ライブラリとしてもよい。

本実施形態のいくつかのオプション的な実施形態において、上記指令ライブラリ内の指令は指令内容を含んでもよい。これにより、上記実行主体は、指令内容と、指令タイプと、指令の対象となるキーワードとをトリプレット化することができる。例示として、上記指令は、「都市管理ページを開く、ページを開く、都市管理」であってもよい。

上記オプション的な実施形態によれば、上記予め設定された指令ライブラリはさらに以下のステップによって生成されてもよい。

Ｓ２０２４では、事前設定指令セット内の指令を単語分割して単語セットを生成する。

これらの実施形態において、上記単語分割の方式は、上記の実施形態におけるステップＳ１０１の対応する記述と一致してもよく、ここでは限定をしない。

Ｓ２０２５では、単語セットをインデックスとし、指令ライブラリ内の指令内容をデータベースの記録とし、予め設定された指令ライブラリに対するテキスト転置インデックスを生成する。

これらの実施形態において、上記実行主体は、上記ステップＳ２０２４で生成された単語セット内の単語をインデックスとし、上記予め設定された指令ライブラリにおける、上記インデックスが含まれた指令内容をデータベースの記録として、上記予め設定された指令ライブラリに対するテキスト転置インデックスを生成するようにしてもよい。

上記のオプション的な実施形態によれば、本方案は、指令認識の速度を上げるための基礎を提供するために、上記予め設定された指令ライブラリのためのテキスト転置インデックスを生成することができる。

Ｓ２０３では、目標数の仮マッチング指令における指令タイプおよび指令の対象となるキーワードに基づいて、認識すべき指令にマッチングする指令タイプおよび指令の対象となるキーワードを生成する。

上記Ｓ２０１、Ｓ２０２、Ｓ２０３はそれぞれ、上記の実施形態におけるＳ１０１、Ｓ１０２、Ｓ１０３、およびそれらのオプション的な実施態様と一致してもよく、Ｓ１０１、Ｓ１０２、Ｓ１０３、およびそれらのオプション的な実施態様の記述は、Ｓ２０１、Ｓ２０２、Ｓ２０３にも適用でき、ここではその説明を省略する。

図２から分かるように、本実施形態における指令を認識するための方法のフロー２００は、予め取得されたデータセットに基づいて予め設定された指令テンプレートに対してスロット埋込みを行い、上記予め設定された指令ライブラリを生成するステップを具現化している。このように、本実施形態で記述した方案は、大量のキーワードのマッピング関係を構築した指令ライブラリではなく、指令タイプおよび指令の対象となるキーワードに基づいた標準的な指令ライブラリを構築することにより、収集する必要な類義語などのデータ量が大幅に削減され、テンプレートを介して指令を自動的に生成することにより、労力を省くことができる。

次に、本開示の実施形態に係る指令を認識するための方法の応用シーンの概略図である図３を参照する。図３の応用シーンにおいて、中央管理室のスマートディスプレイの大型スクリーン３０２は、まず、「都市管理ページを見せてください」に対応するテキストベクトルと、「見せてください」、「都市管理」、「ページ」にそれぞれ対応するＴＦ－ＩＤＦ値を単語重要度として取得することができる。あるいは、「都市管理ページを見せてください」に対応する上記のテキストベクトルと、「見せてください」、「都市管理」、「ページ」にそれぞれ対応するＴＦ－ＩＤＦ値は、スマートディスプレイの大型スクリーン３０２によってユーザ３０１が発話した「都市管理ページを見せてください」をテキストベクトル化して単語分割した後に得られたＴＦ－ＩＤＦに基づいて算出することができる。そして、スマートディスプレイの大型スクリーン３０２は、上記テキストベクトルおよび単語重要度に基づいて、予め設定された指令ライブラリ３０３から、目標数の指令を仮マッチング指令として選択することができる。次に、スマートディスプレイの大型スクリーン３０２は、目標数の仮マッチング指令における、指令タイプおよび指令の対象となるキーワードに基づいて、認識すべき指令にマッチングする指令タイプおよび指令の対象となるキーワード３０４を生成することができる。

現在、従来技術の１つは、予め設定された規則に従って認識すべき指令からキーワードを抽出し、キーワードと、予め構築された指令タイプのキーワードおよび指令内容のキーワードとが同一であるか否かを比較することで指令認識結果を確定し、情報抽出モデルを予めトレーニングするステップを追加する必要があり、類義語が収集されていない場合には正確に認識することができず、汎化能力の低下につながる。本開示の上述した実施形態に係る方法は、セマンティックおよびバッグ・オブ・ワーズの２つの次元において、認識すべき指令に対応するテキストベクトルおよび少なくとも１つの単語重要度と、予め設定
された指令ライブラリ内の指令とをマッチングすることにより、認識すべき指令の指令タイプおよび指令の対象となるキーワードの解析結果を得る。これにより、予め設定された指令ライブラリでの情報構築量を削減することができ、セマンティックマッチングにより、より優れたフォールトトレランスと汎化性を実現でき、指令認識の効果を高めることができる。

さらに図４を参照し、上記の各図に示された方法の実施形態として、本開示は、指令を認識するための装置の一実施形態を提供し、当該装置の実施形態は、図１または図２に示された方法の実施形態に対応しており、当該装置は、具体的に様々な電子機器に適用することができる。

図４に示すように、本実施形態に係る指令を認識するための装置４００は、取得ユニット４０１と、選択ユニット４０２と、生成ユニット４０３とを備える。取得ユニット４０１は、認識すべき指令に対応するテキストベクトルと少なくとも１つの単語重要度を取得するように構成される。選択ユニット４０２は、テキストベクトルおよび少なくとも１つの単語重要度に基づいて、予め設定された指令ライブラリの中から目標数の仮マッチング指令を選択するように構成され、指令ライブラリには指令と指令のテキストベクトルとの対応関係が含まれ、指令ライブラリ内の指令には指令タイプと、指令の対象となるキーワードとが含まれる。生成ユニット４０３は、目標数の仮マッチング指令における指令タイプおよび指令の対象となるキーワードに基づいて、認識すべき指令にマッチングする指令タイプおよび、認識すべき指令にマッチングする指令の対象となるキーワードを生成するように構成される。

本実施形態において、指令を認識するための装置４００の取得ユニット４０１、選択ユニット４０２および生成ユニット４０３の具体的な処理並びにそれらの技術効果は、それぞれ図１の対応する実施形態におけるＳ１０１、Ｓ１０２、およびＳ１０３の関連する説明を参照することができ、ここではその説明を省略する。

本実施形態のいくつかのオプション的な実施形態では、上記選択ユニット４０２は、予め設定された指令ライブラリから、テキストベクトルにマッチングする第１の数の指令をプリマッチング指令として選択するように構成される第１の選択モジュール（図示せず）と、予め設定された指令ライブラリから、少なくとも１つの単語重要度にマッチングする第２の数の指令をプリマッチング指令として選択するように構成される第２の選択モジュール（図示せず）と、選択されたプリマッチング指令のセットから目標数の指令を仮マッチング指令として選択するように構成される第３の選択モジュール（図示せず）とを備えてもよい。

本実施形態のいくつかのオプション的な実施形態では、上記第２の選択モジュールは、予め設定された指令ライブラリから少なくとも１つの目標単語を含む指令を選択して目標指令セットを生成し、目標単語は、認識すべき指令を単語分割することによって得られた単語を含んでもよく、目標指令セット内の指令に対して、当該指令における、少なくとも１つの目標単語にマッチングする単語の単語重要度を累加して、当該指令に対応する指令重要度を生成し、対応する指令重要度が最も高い上位の第２の数の指令を、第２の数のプリマッチング指令として選択するようにさらに構成されてもよい。

本実施形態のいくつかのオプション的な実施形態では、上記第３の選択モジュールはさらに、選択されたプリマッチング指令のセット内の指令を重複排除して、第１の数と第２の数との和以下であってもよい第３の数のプリマッチング指令を生成し、テキスト類似度に基づいて、第３の数のプリマッチング指令の中から、目標数の指令を仮マッチング指令として選択するように構成されてもよい。ここで、テキスト類似度は、認識すべき指令と
第３の数のプリマッチング指令のうちの指令との類似度を表すために用いられてもよい。

本実施形態のいくつかのオプション的な実施形態では、上記生成ユニット４０３はさらに、目標数の仮マッチング指令における指令タイプおよび指令の対象となるキーワードに対して、当該指令タイプおよび当該指令の対象となるキーワードに対応する指令についてのテキスト類似度をそれぞれ累加して、各指令タイプおよび指令の対象となるキーワードのそれぞれに対応する累加値を生成し、累加値が最も大きい指令タイプを認識すべき指令にマッチングする指令タイプとし、累加値が最も大きい指令の対象となるキーワードを、認識すべき指令にマッチングする指令の対象となるキーワードとする、ように構成されてもよい。

本実施形態のいくつかのオプション的な実施形態では、上記予め設定された指令ライブラリは、指令タイプのスロットと、指令の対象となるキーワードのスロットとを含む予め設定された指令テンプレートを取得することと、予め取得された指令タイプのデータセットと、指令の対象となるキーワードのデータセットとに基づいて、スロット埋込みを行い、事前設定指令セットを生成することと、生成された事前設定指令セット内の指令のテキストベクトル化により、指令とテキストベクトルとの対応関係を生成することと、によって生成される。

本実施形態のいくつかのオプション的な実施形態では、上記指令ライブラリ内の指令は指令内容をさらに含んでもよい。上記予め設定された指令ライブラリは、さらに、事前設定指令セット内の指令を単語分割して、単語セットを生成することと、単語セットをインデックスとし、指令ライブラリ内の指令内容をデータベースの記録とし、予め設定された指令ライブラリに対するテキスト転置インデックスを生成することと、によって生成されるようにしてもよい。

本開示の上記実施形態に係る装置において、選択ユニット４０２は、セマンティックおよびバッグ・オブ・ワーズの２つの次元において、取得ユニット４０１により取得された、認識すべき指令に対応するテキストベクトルおよび少なくとも１つの単語重要度と、予め設定された指令ライブラリ内の指令とをマッチングすることにより仮マッチング指令セットを取得する。生成ユニット４０３は、仮マッチング指令における指令タイプおよび指令の対象となるキーワードに基づいて、認識すべき指令の指令タイプおよび指令の対象となるキーワードの解析結果を求める。これにより、予め設定された指令ライブラリの情報構築量を削減することができ、セマンティックマッチングにより、より優れたフォールトトレランスと汎化性を実現でき、指令認識の効果を高めることができる。

本開示の技術方案では、関連するユーザ個人情報の収集、記憶、使用、加工、伝送、提供および公開などの処理は、いずれも関連する法律法規の規定に準拠し、且つ公序良俗に反しない。

本開示の実施形態によれば、本開示はさらに電子機器、読み取り可能な記憶媒体およびコンピュータプログラムを提供する。

図５は、本開示の実施形態を実施するために使用できる例示的な電子機器５００の例示的なブロック図を示している。電子機器は、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレード型サーバ、メインフレームコンピュータおよびその他の適切なコンピュータ等の様々な形態のデジタルコンピュータを表す。また、電子機器は、個人デジタル処理、携帯電話、スマートフォン、ウェアラブル機器およびその他の類似する計算装置等の様々な形態のモバイルデバイスを表すことができる。なお、ここで示したコンポーネント、それらの接続関
係、およびそれらの機能はあくまでも例示であり、ここで記述および／または要求した本開示の実施形態を限定することを意図するものではない。

本開示に係る音声インタラクティブスクリーンは、受信した音声を認識して認識すべき指令を生成する音声認識装置と、図５に示すような上記電子機器と、認識すべき指令にマッチングする指令タイプおよび指令の対象となるキーワードに基づいて、認識すべき指令にマッチングする内容を提示する表示装置と、を備えてもよい。ここで、上記実行主体は、指令タイプおよび指令の対象となるキーワードと、指令内容との対応関係を予め取得しておいてもよい。例示として、上記実行主体は、上記指令タイプおよび指令の対象となるキーワードがそれぞれ「ページを開く」および「都市管理」である場合には、都市管理ページを表示するようにしてもよい。

図５に示すように、機器５００は、読み出し専用メモリ（ＲＯＭ）５０２に格納されているコンピュータプログラムまたは記憶ユニット５０８からランダムアクセスメモリ（ＲＡＭ）５０３にロードされたコンピュータプログラムによって様々な適当な動作および処理を実行可能な計算ユニット５０１を備える。ＲＡＭ５０３には、機器５００の動作に必要な様々なプログラムおよびデータがさらに格納されることが可能である。計算ユニット５０１、ＲＯＭ５０２およびＲＡＭ５０３は、バス５０４を介して互いに接続されている。入／出力（Ｉ／Ｏ）インターフェース５０５もバス５０４に接続されている。

機器５００において、キーボード、マウスなどの入力ユニット５０６と、様々なタイプのディスプレイ、スピーカなどの出力ユニット５０７と、磁気ディスク、光ディスクなどの記憶ユニット５０８と、ネットワークカード、モデム、無線通信送受信機などの通信ユニット５０９とを含む複数のコンポーネントは、Ｉ／Ｏインターフェース５０５に接続されている。通信ユニット５０９は、機器５００がインターネットなどのコンピュータネットワークおよび／または様々な電気通信ネットワークを介して他の装置と情報またはデータのやりとりを可能にする。

計算ユニット５０１は、処理および計算能力を有する様々な汎用および／または専用処理コンポーネントであってもよい。計算ユニット５０１のいくつかの例としては、中央処理ユニット（ＣＰＵ）、グラフィックス処理ユニット（ＧＰＵ）、様々な専用人工知能（ＡＩ）計算チップ、機械学習モデルアルゴリズムを実行する様々な計算ユニット、デジタル信号プロセッサ（ＤＳＰ）、および任意の適切なプロセッサ、コントローラ、マイクロコントローラなどを含むが、これらに限定されない。計算ユニット５０１は、上述した、指令を認識するための方法のような各方法および処理を実行する。例えば、いくつかの実施形態では、指令を認識するための方法は、記憶ユニット５０８などのような機械可読媒体に有形に含まれるコンピュータソフトウェアプログラムとして実現されてもよい。いくつかの実施形態では、コンピュータプログラムの一部または全部は、ＲＯＭ５０２および／または通信ユニット５０９を介して機器５００にロードおよび／またはインストールされてもよい。コンピュータプログラムがＲＡＭ５０３にロードされ、計算ユニット５０１によって実行されると、上述した指令を認識するための方法の１つまたは複数のステップを実行可能である。あるいは、他の実施形態では、計算ユニット５０１は、他の任意の適切な方式によって（例えば、ファームウェアを介して）指令を認識するための方法を実行するように構成されていてもよい。

ここで記述したシステムおよび技術の様々な実施形態はデジタル電子回路システム、集積回路システム、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、特定用途向け集積回路（ＡＳＩＣ）、特定用途向け標準製品（ＡＳＳＰ）、システムオンチップ（ＳＯＣ）、コンプレックスプログラマブルロジックデバイス（ＣＰＬＤ）、コンピュータハードウェア、ファームウェア、ソフトウェア、および／またはそれらの組み合わせにおいて実
装され得る。これらの各実施形態は、１つまたは複数のコンピュータプログラムに実装され、当該１つまたは複数のコンピュータプログラムは少なくとも１つのプログラマブルプロセッサを含むプログラマブルシステムにおいて実行および／または解釈することができ、当該プログラマブルプロセッサは専用または汎用プログラマブルプロセッサであってもよく、記憶システム、少なくとも１つの入力装置および少なくとも１つの出力装置からデータおよび指令を受信することができ、且つデータおよび指令を当該記憶システム、当該少なくとも１つの入力装置および当該少なくとも１つの出力装置に伝送することを含み得る。

本開示の方法を実施するためのプログラムコードは、１つまたは複数のプログラミング言語のあらゆる組み合わせで作成され得る。これらのプログラムコードは、汎用コンピュータ、専用コンピュータ、または他のプログラム可能なデータ処理装置のプロセッサまたはコントローラに提供されることができ、これらのプログラムコードがプロセッサまたはコントローラによって実行されると、フローチャートおよび／またはブロック図に規定された機能または動作が実施される。プログラムコードは、完全にデバイス上で実行されることも、部分的にデバイス上で実行されることも、スタンドアロンソフトウェアパッケージとして部分的にデバイス上で実行されながら部分的にリモートデバイス上で実行されることも、または完全にリモートデバイスもしくはサーバ上で実行されることも可能である。

本開示のコンテキストでは、機械可読媒体は、有形の媒体であってもよく、指令実行システム、装置またはデバイスで使用されることに供し、または指令実行システム、装置またはデバイスと組み合わせて使用するためのプログラムを含むか、または格納することができる。機械可読媒体は、機械可読信号媒体または機械可読記憶媒体であり得る。機械可読媒体は、電子的、磁気的、光学的、電磁的、赤外線の、または半導体のシステム、装置または機器、またはこれらのあらゆる適切な組み合わせを含むことができるが、これらに限定されない。機械可読記憶媒体のより具体的な例には、１本または複数本のケーブルに基づく電気的接続、携帯型コンピュータディスク、ハードディスク、ランダムアクセスメモリ（ＲＡＭ）、読み取り専用メモリ（ＲＯＭ）、消去可能プログラマブル読み取り専用メモリ（ＥＰＲＯＭまたはフラッシュメモリ）、光ファイバ、コンパクトディスク読み取り専用メモリ（ＣＤ?ＲＯＭ）、光学記憶装置、磁気記憶装置、またはこれらのあらゆる
適切な組み合わせが含まれ得る。

ユーザとのやりとりを行うために、ここで記述したシステムと技術は、ユーザに情報を表示するための表示装置（例えば、陰極線管（ＣａｔｈｏｄｅＲａｙＴｕｂｅ，ＣＲＴ）またはＬＣＤ（液晶ディスプレイ）モニタ）と、キーボードおよびポインティングデバイス（例えば、マウスまたはトラックボール）とを備えるコンピュータ上で実装することができ、ユーザが当該キーボードおよび当ポインティングデバイスを介してコンピュータに入力を提供できる。他の種類の装置もユーザとのやりとりを行うことに用いることができる。例えば、ユーザに提供されるフィードバックは、例えば、視覚フィードバック、聴覚フィードバック、または触覚フィードバックであるいかなる形態のセンシングフィードバックであってもよく、且つ音入力、音声入力若しくは触覚入力を含むいかなる形態でユーザからの入力を受信してもよい。

ここで記述したシステムおよび技術は、バックエンドコンポーネントを含む計算システム（例えば、データサーバ）に実施されてもよく、またはミドルウェアコンポーネントを含む計算システム（例えば、アプリケーションサーバ）に実施されてもよく、またはフロントエンドコンポーネントを含む計算システム（例えば、グラフィカルユーザインターフェースまたはウェブブラウザを有するユーザコンピュータ）に実施されてもよく、ユーザは該グラフィカルユーザインターフェースまたはウェブブラウザを介してここで記述した
システムおよび技術の実施形態とやりとりを行っていてもよく、またはこのようなバックエンドコンポーネント、ミドルウェアコンポーネントまたはフロントエンドコンポーネントのいずれかの組み合わせを含む計算システムに実施されてもよい。また、システムの各コンポーネントの間は、通信ネットワーク等の任意の形態または媒体を介してデジタルデータ通信により接続されていてもよい。通信ネットワークとしては、ローカルエリアネットワーク（ＬＡＮ）、ワイドエリアネットワーク（ＷＡＮ）およびインターネットなどを含む。

コンピュータシステムは、クライアントとサーバとを含んでもよい。クライアントとサーバは、通常、互いに離れており、通信ネットワークを介してやりとりを行う。クライアントとサーバとの関係は、互いにクライアント－サーバの関係を有するコンピュータプログラムをそれぞれのコンピュータ上で動作することによって生成される。サーバはクラウドサーバであってもよく、分散システムのサーバ、あるいはブロックチェーンを結合したサーバであってもよい。

上述した様々な形態のフローを用いて、ステップを改めて並び替え、追加または削除を行っていてもよいことを理解すべきである。例えば、本開示に記載された各ステップは、本開示に開示された技術方案の所望の結果が達成できる限り、並行して実行されてもよく、順番に実行されてもよく、異なる順番で実行されてもよい。本明細書はここで制限をしない。

上記具体的な実施形態は、本開示の保護範囲を限定するものではない。当業者であれば、設計要件および他の要因に応じて、様々な修正、組み合わせ、副次的な組み合わせ、および置換を行うことができることを理解すべきである。本開示の趣旨および原理を逸脱せずに行われたあらゆる修正、均等な置換および改善などは、いずれも本開示の保護範囲内に含まれるべきである。

Claims

認識すべき指令に対応するテキストベクトルおよび少なくとも１つの単語重要度を取得することと、
前記テキストベクトルおよび少なくとも１つの単語重要度に基づいて、予め設定された指令ライブラリの中から目標数の仮マッチング指令を選択することであって、前記指令ライブラリには指令と指令のテキストベクトルとの対応関係が含まれ、前記指令ライブラリ内の指令には、指令タイプと、指令の対象となるキーワードとが含まれる、ことと、
前記目標数の仮マッチング指令における指令タイプおよび指令の対象となるキーワードに基づいて、前記認識すべき指令にマッチングする指令タイプおよび、前記認識すべき指令にマッチングする指令の対象となるキーワードを生成することと、
を含む、指令を認識するための方法。
前記テキストベクトルおよび少なくとも１つの単語重要度に基づいて、予め設定された指令ライブラリの中から目標数の仮マッチング指令を選択することは、
前記予め設定された指令ライブラリの中から、前記テキストベクトルにマッチングする第１の数の指令をプリマッチング指令として選択することと、
前記予め設定された指令ライブラリの中から、前記少なくとも１つの単語重要度にマッチングする第２の数の指令をプリマッチング指令として選択することと、
選択されたプリマッチング指令のセットから前記目標数の指令を前記仮マッチング指令として選択することと、
を含む請求項１に記載の方法。
前記予め設定された指令ライブラリの中から、前記少なくとも１つの単語重要度にマッチングする第２の数の指令をプリマッチング指令として選択することは、
前記予め設定された指令ライブラリの中から、少なくとも１つの目標単語を含む指令を選択して目標指令セットを生成することであって、前記目標単語には、前記認識すべき指令を単語分割することによって得られた単語が含まれる、ことと、
前記目標指令セット内の指令に対して、当該指令における前記少なくとも１つの目標単語にマッチングする単語の単語重要度を累加して、当該指令に対応する指令重要度を生成することと、
対応する指令重要度が最も高い上位の第２の数の指令を、前記第２の数のプリマッチング指令として選択することと、
を含む請求項２に記載の方法。
選択されたプリマッチング指令のセットから前記目標数の指令を前記仮マッチング指令として選択することは、
選択されたプリマッチング指令のセット内の指令を重複排除して、前記第１の数と前記第２の数との和を超えない第３の数のプリマッチング指令を生成することと、
前記認識すべき指令と前記第３の数のプリマッチング指令のうちの指令との類似度を表すためのテキスト類似度に基づいて、前記第３の数のプリマッチング指令の中から、前記目標数の指令を前記仮マッチング指令として選択することと、
を含む請求項２に記載の方法。
前記目標数の仮マッチング指令における指令タイプおよび指令の対象となるキーワードに基づいて、前記認識すべき指令にマッチングする指令タイプおよび指令の対象となるキーワードを生成することは、
前記目標数の仮マッチング指令における指令タイプおよび指令の対象となるキーワードに対して、当該指令タイプのテキスト類似度および当該指令の対象となるキーワードに対応する指令のテキスト類似度をそれぞれ累加して、各指令タイプに対応する累加値および
指令の対象となるキーワードに対応する累加値をそれぞれ生成することと、
累加値が最も大きい指令タイプを前記認識すべき指令にマッチングする指令タイプとし、累加値が最も大きい指令の対象となるキーワードを、前記認識すべき指令にマッチングする指令の対象となるキーワードとすることと、
を含む請求項４に記載の方法。
前記予め設定された指令ライブラリは、
指令タイプのスロットと、指令の対象となるキーワードのスロットとを含む予め設定された指令テンプレートを取得することと、
予め取得された指令タイプのデータセットおよび指令の対象となるキーワードのデータセットに基づいて、スロット埋込みを行い、事前設定指令セットを生成することと、
生成された事前設定指令セット内の指令のテキストベクトル化により、指令とテキストベクトルとの対応関係を生成することと、
によって生成される請求項１に記載の方法。
前記指令ライブラリ内の指令には指令内容がさらに含まれ、
前記予め設定された指令ライブラリは、さらに、
前記事前設定指令セット内の指令を単語分割して、単語セットを生成することと、
前記単語セットをインデックスとし、前記指令ライブラリ内の指令内容をデータベースの記録とし、前記予め設定された指令ライブラリに対するテキスト転置インデックスを生成することと、
によって生成される請求項６に記載の方法。
認識すべき指令に対応する、テキストベクトルおよび少なくとも１つの単語重要度を取得するように構成される取得ユニットと、
前記テキストベクトルおよび少なくとも１つの単語重要度に基づいて、予め設定された指令ライブラリの中から目標数の仮マッチング指令を選択するように構成される選択ユニットであって、前記指令ライブラリには指令と指令のテキストベクトルとの対応関係が含まれ、前記指令ライブラリ内の指令には、指令タイプと、指令の対象となるキーワードとが含まれる、選択ユニットと、
前記目標数の仮マッチング指令における指令タイプおよび指令の対象となるキーワードに基づいて、前記認識すべき指令にマッチングする指令タイプおよび、前記認識すべき指令にマッチングする指令の対象となるキーワードを生成するように構成される生成ユニットと、
を備える指令を認識するための装置。
前記選択ユニットは、
前記予め設定された指令ライブラリの中から、前記テキストベクトルにマッチングする第１の数の指令をプリマッチング指令として選択するように構成される第１の選択モジュールと、
前記予め設定された指令ライブラリの中から、前記少なくとも１つの単語重要度にマッチングする第２の数の指令をプリマッチング指令として選択するように構成される第２の選択モジュールと、
選択されたプリマッチング指令のセットから前記目標数の指令を前記仮マッチング指令として選択するように構成される第３の選択モジュールと、
を備える請求項８に記載の装置。
前記第２の選択モジュールは、さらに
前記予め設定された指令ライブラリの中から、少なくとも１つの目標単語を含む指令を選択して目標指令セットを生成することであって、前記目標単語には、前記認識すべき指
令を単語分割することによって得られた単語が含まれる、ことと、
前記目標指令セット内の指令に対して、当該指令における前記少なくとも１つの目標単語にマッチングする単語の単語重要度を累加して、当該指令に対応する指令重要度を生成することと、
対応する指令重要度が最も高い上位の第２の数の指令を、前記第２の数のプリマッチング指令として選択することと、
を行うように構成される請求項９に記載の装置。
前記第３の選択モジュールは、さらに
選択されたプリマッチング指令のセット内の指令を重複排除して、前記第１の数と前記第２の数との和を超えない第３の数のプリマッチング指令を生成することと、
前記認識すべき指令と前記第３の数のプリマッチング指令のうちの指令との類似度を表すためのテキスト類似度に基づいて、前記第３の数のプリマッチング指令の中から、前記目標数の指令を前記仮マッチング指令として選択することと、
を行うように構成される請求項９に記載の装置。
前記生成ユニットは、さらに
前記目標数の仮マッチング指令における指令タイプおよび指令の対象となるキーワードに対して、当該指令タイプのテキスト類似度および当該指令の対象となるキーワードに対応する指令のテキスト類似度をそれぞれ累加して、各指令タイプに対応する累加値および指令の対象となるキーワードに対応する累加値をそれぞれ生成することと、
累加値が最も大きい指令タイプを前記認識すべき指令にマッチングする指令タイプとし、累加値が最も大きい指令の対象となるキーワードを、前記認識すべき指令にマッチングする指令の対象となるキーワードとすることと、
を行うように構成される請求項１１に記載の装置。
前記予め設定された指令ライブラリは、
指令タイプのスロットと、指令の対象となるキーワードのスロットとを含む予め設定された指令テンプレートを取得することと、
予め取得された指令タイプのデータセットおよび指令の対象となるキーワードのデータセットに基づいて、スロット埋込みを行い、事前設定指令セットを生成することと、
生成された事前設定指令セット内の指令のテキストベクトル化により、指令とテキストベクトルとの対応関係を生成することと、
によって生成される請求項８に記載の装置。
前記指令ライブラリ内の指令には指令内容がさらに含まれ、
前記予め設定された指令ライブラリは、さらに、
前記事前設定指令セット内の指令を単語分割して、単語セットを生成することと、
前記単語セットをインデックスとし、前記指令ライブラリ内の指令内容をデータベースの記録とし、前記予め設定された指令ライブラリに対するテキスト転置インデックスを生成することと、
によって生成される請求項１３に記載の装置。
少なくとも１つのプロセッサと、前記少なくとも１つのプロセッサと通信接続されたメモリとを備える電子機器であって、
前記メモリには、前記少なくとも１つのプロセッサによって実行可能な指令が格納され、前記指令が前記少なくとも１つのプロセッサによって実行されると、前記少なくとも１つのプロセッサに請求項１～７のいずれか１項に記載の方法を実行させる、電子機器。
コンピュータ指令が格納されている非一時的コンピュータ可読記憶媒体であって、
前記コンピュータ指令はコンピュータに請求項１～７のいずれか１項に記載の方法を実行させるために用いられる非一時的コンピュータ可読記憶媒体。
プロセッサによって実行されると、請求項１～７のいずれか１項に記載の方法が実現されるコンピュータプログラム。
受信した音声を認識して認識すべき指令を生成するように構成される音声認識装置と、
請求項１５に記載の電子機器と、
前記認識すべき指令にマッチングする指令タイプおよび指令の対象となるキーワードに基づいて、前記認識すべき指令にマッチングする内容を表示するように構成される表示装置と、
を備える音声インタラクティブスクリーン。