JP2022103161A

JP2022103161A - 音声検索方法、装置、電子機器、コンピュータ読み取り可能な媒体及びコンピュータプログラム

Info

Publication number: JP2022103161A
Application number: JP2022056210A
Authority: JP
Inventors: ロォン・リウ; Rong Liu; ジアンタオ・リィー; Jiantao Li; シュエイエン・フゥー; Xueyan He
Original assignee: Apollo Intelligent Connectivity Beijing Technology Co Ltd
Current assignee: Apollo Intelligent Connectivity Beijing Technology Co Ltd
Priority date: 2021-05-27
Filing date: 2022-03-30
Publication date: 2022-07-07
Anticipated expiration: 2042-03-30
Also published as: CN113326279A; EP4020951A2; JP7403571B2; EP4020951A3; KR20220054753A; US20220269722A1

Abstract

【課題】包括性を向上させた、音声検索方法、音声検索装置、電子機、記憶媒体及プログラムを提供する。【解決手段】方法は、音声データを取得することと、音声データを認識して、対応するテキストデータを取得することと、テキストデータ及び事前設定されたマッチングすべきデータセットに基づいて、混合マッチングデータセットを取得することと、マッチングすべきデータセットに基づいて、混合マッチングデータセットを選別し、音声データに対応する検索結果セットを取得することと、を含む。【選択図】図１

Description

本開示は、データ処理技術分野に関し、具体的には車両のインターネット、スマートコックピット、音声認識等の技術分野に関し、特に音声検索方法、装置、電子機器、コンピュータ読み取り可能な媒体及びコンピュータプログラムに関する。

端末通話シーンにおいて、ユーザの発音に欠陥がある場合（例えばｌ／ｒ部分、前鼻音・後鼻音が区別されないなど）、音声に対して連絡先検索を行って、連絡先検索結果を得た後、名前のピンインの順だけで並べ替えると、検索結果の並べ替え結果が混乱する問題が発生しやすい。

音声検索方法及び装置、電子機器、コンピュータ読み取り可能な媒体及びコンピュータプログラム製品を提供する。

第１の形態によれば、音声データを取得することと、音声データを認識して、対応するテキストデータを取得することと、テキストデータ及び事前設定されたマッチングすべきデータセットに基づいて、混合マッチングデータセットを取得することと、マッチングすべきデータセットに基づいて、混合マッチングデータセットを選別し、音声データに対応する検索結果セットを取得することとを含んでなる音声検索方法を提供する。

第２の形態によれば、音声データを取得するように配置される収集ユニットと、音声データを認識して、対応するテキストデータを取得するように配置される認識ユニットと、テキストデータ及び事前設定されたマッチングすべきデータセットに基づいて、混合マッチングデータセットを取得するように配置されるマッチングユニットと、マッチングすべきデータセットに基づいて、混合マッチングデータセットを選別し、音声データに対応する検索結果セットを取得するように配置される処理ユニットとを含んでなる音声検索装置を提供する。

第３の形態によれば、少なくとも１つのプロセッサと、少なくとも１つのプロセッサに通信可能に接続されたメモリとを含み、メモリは、少なくとも１つのプロセッサによって実行可能な命令を記憶しており、命令は、少なくとも１つのプロセッサによって実行されて、第１の形態のいずれかの実現形態に説明される方法を少なくとも１つのプロセッサに実行させる電子機器を提供する。

第４の形態によれば、第１の形態のいずれかの実現形態に説明される方法をコンピュータに実行させるためのコンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体を提供する。

第５の形態によれば、プロセッサによって実行されると、第１の形態のいずれかの実現形態に説明される方法を実現するコンピュータプログラムを提供する。

本開示の実施例に係る音声検索方法及び装置は、まず、音声データを取得し、次に、音声データを認識して、対応するテキストデータを取得し、更に、テキストデータ及び事前設定されたマッチングすべきデータセットに基づいて、混合マッチングデータセットを取得し、最後に、マッチングすべきデータセットに基づいて、混合マッチングデータセットを選別し、音声データに対応する検索結果セットを取得する。これにより、テキストデータ及び事前設定されたマッチングすべきデータセットに基づいて取得された混合マッチングデータセットは、テキストデータとマッチングする混合マッチングデータを包括的に拡張し、更に混合マッチングデータに対して、マッチングすべきデータセットに適合であるより合理的な選別を行うことにより、取得された音声データ検索結果がより正確になり、ユーザが音声検索を行うエクスペリエンスが向上する。

理解できるように、この部分に記載の内容は本開示の実施例の肝心な又は重要な特徴を特定することを意図するものでもなく、本開示の範囲を限定するものではない。本開示のほかの特徴は、以下の明細書によって容易に理解されるであろう。

図面は、本手段をより良く理解することに用いられ、本開示を限定するものではない。
本開示に係る音声検索方法の一実施例のフローチャートである。本開示に係る混合マッチングデータセットを取得する方法のフローチャートである。本開示に係る音声データに対応する検索結果セットを取得する方法のフローチャートである。本開示に係る検索データセットを取得する方法のフローチャートである。本開示に係る音声検索装置の実施例の構造模式図である。本開示の実施例の音声検索方法を実現するための電子機器のブロック図である。

以下、図面を参照しながら本開示の例示的な実施例を説明し、理解を助けるように本開示の実施例の様々な細部が含まれているが、単なる例示的なものであると考えられる。従って、当業者が理解できるように、本開示の範囲及び趣旨を逸脱せずに、ここで説明される実施例に対して種々の変更や修正を行うことができる。同様に、明確化及び簡明化のために、以下の説明では公知の機能及び構造についての説明は省略される。

図１は本開示に係る音声検索方法の一実施例のフロー２００を示し、上記音声検索方法は、次のステップを含む。

ステップ１０１：音声データを取得する。

本実施例では、音声検索方法を実行する実行体は、音声データをリアルタイムに取得することができ、当該音声データは、ユーザがユーザ端末を介して送信されたものであるか、ユーザが音声パスワードを介して情報を検索して得られたものであり、音声データは、検索キーワードを含み、音声データを通じて、検索キーワードに関連する検索結果セットを検索することができ、検索結果セットには少なくとも１つの検索結果が含まれ、各検索結果は、いずれも音声データに関連する検索データである。例えば、ユーザが端末上の連絡先を検索する場合、音声データにおける検索キーワードは少なくとも１つの連絡先の情報を含んでもよく、当該情報は名前や電話番号などを含む。

本実施例では、音声検索方法を実行する実行体は、事前にユーザ端末からユーザの連絡先読み取り許可を取得し、端末の名簿から連絡先情報を読み取り、連絡先情報を事前設定されたデータベースに記憶することでき、更に、連絡先情報を充実させるために、名簿の連絡先ピンインライブラリを事前に作成することもでき、連絡先情報における連絡先に関連するピンインはいずれもピンインライブラリに記憶される。

ステップ１０２：音声データを認識して、対応するテキストデータを取得する。

本実施例では、音声検索方法を実行する実行体は、音声データを音声認識した後、音声データをテキストデータに変換することにより、音声データと対応するテキストデータを得る。

ステップ１０３：テキストデータ及び事前設定されたマッチングすべきデータセットに基づいて、混合マッチングデータセットを取得する。

本実施例では、マッチングすべきデータセットは、事前設定された確定済みデータであり、実行体はマッチングすべきデータセットにおけるデータとテキストデータをマッチングし、ユーザ検索意図を確定する。

本実施例では、混合マッチングデータセットは、少なくとも１つのタイプの混合マッチングデータを含み、当該混合マッチングデータは測定すべきテキスト又は中間データ（測定すべきテキストをデータ変換して取得された様々な形式のデータ）とマッチングするデータである。例えば、混合マッチングデータは、ピンインやテキストや文字や記号などを含み、各混合マッチングデータは、いずれも測定すべきテキストとマッチングし、例えば、上記ピンインはテキストデータの発音と同じピンインであり、テキストデータからピンインデータへの変換はピンインツールライブラリを介して完了することができる。

音声検索方式が実行されるさまざまなシーンに応じて、マッチングすべきデータセットの内容が異なり、例えば、ユーザが端末における連絡先情報を検索するシーンの場合、マッチングすべきデータセットは、上記の、データベースに予め記憶されたすべての連絡先情報である。

テキスト形式のテキストデータを取得した後、該マッチングすべきデータセットのマッチングすべきデータをテキストデータとマッチングすることができ、マッチングすべきデータセットにおけるマッチングすべきデータがテキストデータと同じであるか、類似度が類似度のしきい値（たとえば、９０％）より大きい場合、マッチングすべきデータセットがテキストデータとマッチングすると確定され、テキストデータ又はマッチングすべきデータセットにおける複数のデータは混合マッチングデータセットとしてまとめられる。

オプションとして、上記テキストデータ及び事前設定されたマッチングすべきデータセットに基づいて、混合マッチングデータセットを取得することは、テキストデータに対してデータ強化を行い、テキストデータと対応する少なくとも１つの強化テキストデータを取得することと、少なくとも１つの強化テキストデータにおける各強化テキストデータとマッチングすべきデータセットにおける各マッチングすべきデータとマッチングし、マッチングに成功した強化テキストデータを混合マッチングデータセットに追加することとを含む。このオプションの形態では、テキストデータに対してデータ強化を行うことは、テキストデータと同じ発音を持つテキストデータを取得し、取得したテキストデータをテキストデータに追加することにより、テキストデータの量を増やすことであってもよい。

ステップ１０４：マッチングすべきデータセットに基づいて、混合マッチングデータセットを選別し、音声データに対応する検索結果セットを取得することを含む。

本実施例では、検索結果セットは、少なくとも１つの検索結果を含んでもよく、各検索結果はいずれも音声データと対応し、各検索結果はマッチングすべきデータセットと混合マッチングデータとをマッチングした後、選別された、音声データと対応する検索結果であってもよい。検索結果セットをユーザに対して表示する場合、ユーザは、表示された検索結果に応じて異なる操作を実行でき、例えば、音声データが検索連絡先を含む場合、検索結果は、少なくとも１つの、ユーザ音声と対応する連絡先情報を含み、当該連絡先情報は連絡先テキスト、連絡先ピンイン等を含み、ユーザは、連絡先情報を取得した後、当該連絡先に情報を送信することができる。

オプションとして、検索結果セットを取得した後、更に検索結果セットにおける各検索結果を並べ替えることもでき、マッチングすべきデータセットにおける各マッチングすべきデータは独自のシリアル番号を有するが、混合マッチングデータセットにおける各混合マッチングデータはマッチングすべきデータセットにおけるマッチングすべきデータと対応することができ、まず混合マッチングデータセットから各マッチングデータと対応するデータを選別し、次に各マッチングすべきデータのシリアル番号に基づいて、混合マッチングデータセットにおける各混合マッチングデータを並べ替え、これにより、音声データと対応する検索結果を迅速に確定することができる。

本開示の実施例に係る音声検索方法は、まず、音声データを取得し、次に、音声データを認識して、対応するテキストデータを取得し、更に、テキストデータ及び事前設定されたマッチングすべきデータセットに基づいて、混合マッチングデータセットを取得し、最後に、マッチングすべきデータセットに基づいて、混合マッチングデータセットを選別し、音声データに対応する検索結果セットを取得する。これにより、テキストデータ及び事前設定されたマッチングすべきデータセットに基づいて取得された混合マッチングデータセットは、テキストデータとマッチングする混合マッチングデータを包括的に拡張し、更に混合マッチングデータに対して、マッチングすべきデータセットに適合である合理的な選別を行うことにより、取得された音声データ検索結果はより正確になり、ユーザが音声検索を行うエクスペリエンスが向上する。

図２は本開示に係る混合マッチングデータセットを取得する方法のフローチャート２００を示し、上記混合マッチングデータセットを取得する方法は、次のステップを含む。

ステップ２０１：テキストデータをデータ検索し、検索データセットを取得する。

本実施例では、テキストデータをデータ検索することは測定すべきテキストをデータ拡張する過程であり、例えば、テキストデータの検索ピンインデータを検索して取得し、検索された検索ピンインデータをテキストデータへ変換し、測定すべきテキストと同じ発音を持つ同音異義語の検索テキストデータを取得する。本実施例では、ピンインデータのテキストデータへの変換は、テキスト変換ツールを使用して実行することができ、テキスト変換ツールは一般的に使用されるツールであり、ここでは繰り返さない。

本実施例では、検索データセットは少なくとも１つの検索データを含み、各検索データは、いずれもテキストデータに関連するデータであり、検索データの表現形式は、様々であり、例えば、検索データは検索ピンインデータ又は検索テキストデータ等である。

本実施例のいくつかのオプションの実現形態では、上記テキストデータをデータ検索して、検索データセットを取得することは、テキストデータの測定すべきピンインデータを取得することと、測定すべきピンインデータと同じ発音を持つテキストデータを検索して、検索テキストデータを取得することと、テキストデータと検索テキストデータを組み合わせて、検索データセットを取得することとを含む。

本オプションの実現形態では、各中国語テキストはいずれも対応するピンインを持ち、テキストデータをピンインデータに変換してから、ピンインデータと同じ発音を持つテキストデータを検索することにより、テキストデータとはまったく異なる複数の検索テキストデータを取得することができ、複数の検索テキストデータを組み合わせて検索データセットを取得する。

本オプションの実現形態では、テキストデータと同じ発音を持つ検索テキストデータを検索し、検索データセットに追加することにより、検索データセットを充実させ、テキストデータの効果的なマッチングに信頼できる基盤を提供する。

ステップ２０２：検索データセットと事前設定されたマッチングすべきデータセットをマッチングし、混合マッチングデータセットを取得する。

本オプションの実現形態では、検索データセットにおける各検索データをマッチングすべきデータセットにおける各マッチングすべきデータと比較し、両者が完全に同じである場合、現在の完全に同じである検索データを混合マッチングデータセットに追加して、混合マッチングデータセットにおける１つの混合マッチングデータとする。

オプションとして、検索データセットにおける各検索データとマッチングすべきデータにおける各マッチングすべきデータに対して類似度の計算を行い、両者の類似度が類似度のしきい値よりも大きい場合、類似度が類似度のしきい値よりも大きい検索データを混合マッチングデータセットに追加し、混合マッチングデータセットにおける１つの混合マッチングデータとする。

本オプションの実現形態に係る混合マッチングデータセットを取得する方法は、テキストデータを検索し、検索データセットを取得することにより、テキストデータのデータ量を拡張し、ユーザ音声の発音に欠陥のあるテキストデータに対して事前にデータ補正を行うことができるため、ユーザ音声の包括的な検索結果を取得するために信頼できる基盤を提供する。

図３は本開示に係る音声データに対応する検索結果セットを取得する方法のフローチャート３００を示し、上記音声データに対応する検索結果セットを取得する方法は、次のステップを含む。

ステップ３０１：混合マッチングデータセットのうち、検索データセット内の異なる優先度の検索データとマッチングする混合マッチングデータを選別して、優先度の異なる中間データセットを取得する。

本オプションの実現形態では、検索データセットにさまざまなタイプの検索データがある場合、より良い検索結果セットをユーザに提示するために、検索データセットにおけるさまざまなタイプの検索データには事前にさまざまな優先度を割り当てることができ、各タイプの検索データは１種の優先度レベルに対応し、例えば、検索データセットは検索ピンインデータ及び検索テキストデータを含み、検索テキストデータの優先度をレベル１に設定し、検索ピンインデータの優先度をレベル２に設定する。検索ピンインデータの優先度は検索テキストデータよりも低い。

更に、検索データセットにおける異なるタイプの検索データが混合マッチングデータセットにおける混合マッチングデータとマッチングする場合、検索データのタイプに応じて、マッチングして得られた混合マッチングデータを、検索データと対応する優先度に従って混合マッチングデータを分割し、優先度の異なる中間データセットを取得する。それぞれの中間データセットは１種類の検索データに対応し、例えば、検索テキストデータと対応する中間データセットの優先度レベルはレベル１であり、検索ピンインデータと対応する中間データセットの優先度はレベル２である。

本実施例のいくつかのオプションの実現形態では、上記検索データセットは、テキストデータと、優先度がテキストデータよりも低い検索テキストデータを含み、上記した、混合マッチングデータセットのうち、検索データセット内の異なる優先度の検索データとマッチングする混合マッチングデータを選別して、優先度の異なる中間データセットを取得することは、テキストデータと混合マッチングデータセットとをマッチングして、テキストデータとマッチングする測定すべき中間データセットを取得することと、混合マッチングデータセットにおける測定すべき中間データセットを削除して、検索テキストデータとマッチングする検索中間データセットを取得することであって、検索中間データセットの優先度が測定すべき中間データセットよりも低いこととを含む。

本オプションの実現形態では、検索データセットにはテキストデータ及び検索テキストデータの優先度の異なる２つのデータが含まれる場合、テキストデータと検索テキストデータに従って混合マッチングデータセットにおける混合マッチングデータを選別する。優先度の異なる２つの中間データセットの包括性が確保され、優先度の異なる２つの中間データセットがユーザに表示され、ユーザエクスペリエンスが向上する。

本実施例のいくつかのオプションの実現形態では、上記検索データセットは、優先度レベルが順次下がるテキストデータ、検索テキストデータ、修正テキストデータを含み、混合マッチングデータセットのうち、検索データセット内の異なる優先度の検索データとマッチングする混合マッチングデータを選別して、優先度の異なる中間データセットを取得することは、テキストデータと混合マッチングデータセットをマッチングして、テキストデータとマッチングする測定すべき中間データセットを取得することと、混合マッチングデータセットにおける測定すべき中間データを削除して、段階サブセットを取得することと、検索テキストデータと段階サブセットとをマッチングして、検索テキストデータとマッチングする検索中間データセットを取得することと、段階サブセットにおける検索中間データセットを削除して、修正テキストデータとマッチングする修正中間データセットを取得し、測定すべき中間データセット、検索中間データセット、修正中間データセットの優先度順位が順次下がることとを含む。

本オプションの実現形態では、検索データセットには、テキストデータ、検索テキストデータ、修正テキストデータの３つの優先度の異なるデータが含まれる場合、テキストデータ、検索テキストデータ、修正テキストデータに従って混合マッチングデータセットにおける混合マッチングデータを選別する。優先度の異なる３つの中間データセットの包括性が確保され、複数の優先度の中間データセットがユーザに表示され、ユーザエクスペリエンスが向上する。

ステップ３０２：マッチングすべきデータセットにおけるマッチングすべきデータの順で、各中間データセットを並べ替えて組み合わせ、音声データに対応する検索結果セットを取得する。

本実施例では、マッチングすべきデータセットにおけるマッチングすべきデータ又は各中間データセットの優先度順位に基づいて、すべての中間データセットを並べ替えてもよく、並べ替えた後のすべての中間データセットを組み合わせて、ユーザに表示可能な検索結果セットを取得する。

オプションとして、中間データセットはマッチングすべきデータと同じ又は対応するデータ（例えば、マッチングすべきデータの発音と同じもの）を有するので、各中間データセットを並べ替えることは、各中間データセットにおけるデータを並べ替えることであってもよい。

本実施例のいくつかのオプションの実現形態では、上記の、マッチングすべきデータセットにおけるマッチングすべきデータの順で、各中間データセットを並べ替えて組み合わせて、音声データに対応する検索結果セットを取得することは、各中間データセットにおける各中間データをピンインのアルファベットの順で並べ替えて、異なる並べ替えデータセットを取得することと、各並べ替えデータセットに対して、当該並べ替えデータセットに同じピンインを持つ複数の並べ替えデータがあると判断したことに応答して、複数の並べ替えデータを、マッチングすべきデータセットのうち、各並べ替えデータと対応するデータの順で並べ替えることと、各中間データセットの優先度レベルに応じて、すべての並べ替えデータセットを並べ替えて組み合わせて、音声データに対応する検索結果セットを取得することとを含む。

本オプションの実現形態では、まず、各中間データセットにおける各中間データをピンインのアルファベットの順で並べ替え、次に並べ替えた後の並べ替えデータを、マッチングすべきデータセットのうち、各並べ替えデータと対応するデータの順で並べ替える。ピンイン及びテキストがいずれも合理的である検索結果をユーザに表現され、ユーザが正確な選択をするのに便利である。

本実施例は、３つの異なる優先度レベルに従って連絡先並べ替え方法を最適化し、具体的な並べ替えは、１）中国語完全マッチングの程度、２）ピンイン完全マッチングの程度、３）誤り訂正の程度であり、ここで、中国語マッチングの程度を最高の優先度とし、例えば、検索キーワードは、中国語（数字なし）が完全マッチングする結果がある場合、最優先に表示し、次にピンイン（数字なし）完全マッチングの程度を考慮する。ピンインのマッチングと中国語のマッチングがいずれも不完全な場合、検索ピンインと結果ピンインの類似の程度に従って並べ替える。

本オプションの実現形態に係る、音声データと対応する検索結果を取得する方法は、混合マッチングデータセットのうち、検索データセットにおける検索データとマッチングする混合マッチングデータを選別し、これにより、混合マッチングデータセットの、マッチングすべきデータセットとのマッチング效果が異なるデータを階層的に表示することを便利にし、更に、マッチングすべきデータセットにおけるマッチングすべきデータの順で、中間データセットを並べ替えることにより、マッチングされた検索結果の効果的な並べ替えが保証され、ユーザが音声検索を行うエクスペリエンスが向上する。

図４は本開示に係る検索データセットを取得する方法の一実施例のフロー４００を含み、上記検索データセットを取得する方法は、次のステップを含む。

ステップ４０１：テキストデータの測定すべきピンインデータを取得する。

本オプションの実現形態では、テキストデータをピンインデータに変換し、測定すべきピンインデータを取得する。テキストデータをピンインデータに変換するには、従来のピンイン変換ツールを使用することができ、ピンイン変換ツールについては本実施例で繰り返さない。

ステップ４０２：測定すべきピンインデータと同じ発音を持つテキストデータを確定して、検索テキストデータを取得する。

本オプションの実現形態では、測定すべきピンインデータはテキストデータのピンイン形式であり、測定すべきピンインデータを通じて、テキストデータと同じ発音を持つすべてのテキストデータを確定することができ、テキストデータと同じ発音を持つテキストデータは検索テキストデータである。

ステップ４０３：測定すべきピンインデータに対してデータ修正を行い、修正ピンインデータを取得する。

本オプションの実現形態では、測定すべきピンインデータに対してデータ修正を行うことは、測定すべきピンインデータにおける声母を別の声母に置き換えることを含み、例えば、測定すべきピンインデータにおける「ｌ」を「ｒ」に置き換え、又は測定すべきピンインデータにおける「ｒ」を「ｌ」に置き換える。測定すべきピンインデータに対してデータ修正を行うことは、測定すべきピンインデータにおける韻母を別の韻母に置き換えることを更に含み、例えば、測定すべきピンインデータにおける「ｉｎｇ」を「ｉｎ」に置き換える。

ステップ４０４：修正ピンインデータと同じ発音を持つテキストデータを検索して、修正テキストデータを取得する。

本オプションの実現形態では、修正ピンインデータを取得した後、修正ピンインデータと同じ発音を持つテキストデータを確定する。得られたテキストデータは修正テキストデータである。

本オプションの実現形態では、修正テキストデータは検索テキストデータとは完全に異なるテキストデータであり、例えば、１つの検索テキストデータは、「張三」であり、発音がｚｈａｎｇｓａｎであり、対応する修正テキストは「藏三」であってもよく、その発音がｚａｎｇｓａｎである。

ステップ４０５：検索テキストデータ、修正テキストデータ及びテキストデータを組み合わせて、検索データセットを取得する。

本実施例では、検索テキストデータ、修正テキストデータ及びテキストデータを組み合わせるとは、三者を融合して検索データセットに置くことを指す。検索データセットは、少なくとも１つの検索データを含み、各検索データは、検索テキストデータ、修正テキストデータ、又はテキストデータであってもよい。

本オプションの実現形態では、まず、テキストデータの測定すべきピンインデータに基づいて、検索テキストを取得し、これにより、テキストデータの同音異義語の検索データが保証され、更に、測定すべきピンインデータに対してデータ修正を行って、修正ピンインデータを取得し、修正ピンインデータから修正テキストデータを取得することにより、発音に欠陥のある人のテキストデータに対する効果的な補足が保証され、検索データセットの包括性と信頼性が保証される。

１つの例として、ユーザが連絡先情報を検索するシーンに対して、マッチングすべきデータセットは事前に保存された連絡先情報のデータセットであり、本開示の音声検索方法は、次のステップを含む。

第１のステップ：ユーザ端末からユーザの連絡先読み取り許可を取得した後、端末の名簿から連絡先情報を読み取る。

第２のステップ：音声データによって、ユーザが入力した目標連絡先Ｐ１を確定し、音声データを認識してテキストデータに変換し、テキストデータ及びマッチングすべきデータセットに従って、混合マッチングデータセットを取得する。本実施例では、混合マッチングデータセットを取得することは、テキストデータ（例えば張三）を、ピンインツールライブラリを介して測定すべきピンインデータ（ｚｈａｎｇｓａｎ）として認識し、測定すべきピンインデータの発音が完全に同じである検索テキストデータを確定し、その後、事前設定された修正ピンインテーブル（例えば表１に示す）に従って、測定すべきピンインデータを修正して、例えば、ｚｈａｎｓｈａｎｚｈａｎｓａｎ、ｚｈａｎｇｓｈａｎ、ｚｈａｎｇｓｈａｎｇ等の修正ピンインデータを取得することができ、修正ピンインデータを修正テキストデータに変換し、テキストデータ、修正テキストデータを組み合わせて混合マッチングデータセットを取得することである。

第３のステップ：混合マッチングデータセットおける数字をフィルタリングし、数字をフィルタリングした後の混合マッチングデータセットＭから、目標連絡先Ｐ１の中国語と完全マッチングする測定すべき中間データセットＲ１を選別する。

第４のステップ：混合マッチングデータセットＭにおける測定すべき中間データＰ１を削除し、段階サブセットＪ１を取得する。

第５のステップ：段階サブセットＪ１から、目標連絡先Ｐ１の発音と完全マッチングするデータセット、つまり検索テキストデータと完全マッチングするデータセットを選別する。当該データセットに同形異音語が含まれている可能性があり、同時にピンインに対応する中国語も異なる可能性があるため、当該データセットにおいて再度並べ替える必要がある。ルールは次の通りである。

（１）当該データセットでは、中国語のピンインに従って第１のラウンドの並べ替えを行い、例えば、「張楽に電話する」である場合、ｚｈａｎｇｌｅ￥ｚｈａｎｇｙｕｅの２つの結果を取得でき、第１のラウンドでは、ピンインのアルファベット順に従ってピンインを並べ替えてテキストデータセットを取得する。

（２）第１のラウンド並べ替えの結果内では、ピンインが同じな結果グループ（例えば、張三、張散、張傘）は、マッチングすべきデータセットにおける各マッチングすべきデータの順に従って第２のラウンドの並べ替えを行い、最終的な検索中間データセットＲ２を取得し、例えば、ｚｈａｎｇｌｅ￥ｚｈａｎｇｙｕｅに対して、名簿には章楽、張楽、張悦という名前の連絡先があると、検索中間データセットＲ２は、張楽、章楽、張悦であり得る。

第６のステップ：段階サブセットＪ１における検索中間データセットＲ２を削除して、修正テキストデータと完全マッチングするデータセットを取得し、修正テキストデータと完全マッチングするデータセットを、上記の検索中間データセットＲ２と同じ方法で再度並べ替え、修正中間データセットＲ３を取得する。上記の音声データがｚｈａｎｇｓａｎであるようにする場合、名簿に張珊という名前の連絡先があると、張珊は修正中間データセットＲ３中に表示される。これは、彼女のピンインが音声入力の正しいピンインではないためである（正しいピンインはｚｈａｎｇｓａｎである）。

第７のステップ：測定すべき中間データセットＲ１、検索中間データセットＲ２、修正中間データセットＲ３の順で並べ替え、並べ替えた後の測定すべき中間データセットＲ１、検索中間データセットＲ２、修正中間データセットＲ３をユーザに表示する。

本実施例は、３つの異なる優先度レベルに従って連絡先並べ替え方法を最適化し、具体的な並べ替えは、１）中国語完全マッチングの程度、２）ピンイン完全マッチングの程度、３）誤り訂正の程度である。ここで、中国語マッチングの程度を最高の優先度とし、例えば、検索キーワードは、中国語（数字なし）が完全マッチングする結果がある場合、最優先に表示し、次にピンイン（数字なし）完全マッチングの程度を考慮する。ピンインのマッチングと中国語のマッチングがいずれも不完全な場合、検索ピンインと結果ピンインの類似の程度に従って並べ替える。

図５を更に参照すると、上記各図に示す方法に対する実現として、本開示は音声検索装置の１つ実施例を提供し、当該装置の実施例は図１に示す方法の実施例と対応し、当該装置は具体的に様々な電子機器に適用することができる。

図５に示すように、本実施例に係る音声検索装置５００は、収集ユニット５０１、認識ユニット５０２、マッチングユニット５０３、処理ユニット５０４を含む。上記収集ユニット５０１は、音声データを取得するように配置されてもよい。上記認識ユニット５０２は、音声データを認識して、対応するテキストデータを取得するように配置されてもよい。上記マッチングユニット５０３は、テキストデータ及び事前設定されたマッチングすべきデータセットに基づいて、混合マッチングデータセットを取得するように配置されてもよい。上記処理ユニット５０４は、マッチングすべきデータセットに基づいて、混合マッチングデータセットを選別し、音声データに対応する検索結果セットを取得するように配置されてもよい。

本実施例では、音声検索装置５００において、収集ユニット５０１、認識ユニット５０２、マッチングユニット５０３、処理ユニット５０４の具体的な処理及びそれらによってもたらされる技術的効果は、図１の対応する実施例のステップ１０１、ステップ１０２、ステップ１０３、ステップ１０４の関連する説明を参照することができ、ここでは繰り返さない。

本実施例のいくつかのオプションの実現方法では、上記マッチングユニット５０３は、検索モジュール（図示せず）と、マッチングモジュール（図示せず）とを含む。上記検索モジュールは、テキストデータをデータ検索して、検索データセットを取得するように配置されてもよい。上記マッチングモジュールは、検索データセットと事前設定されたマッチングすべきデータセットとをマッチングして、混合マッチングデータセットを取得するように配置されてもよい。

本実施例のいくつかのオプションの実現方法では、上記検索モジュールは、第１の取得サブモジュール（図示せず）と、第１の検索サブモジュール（図示せず）と、第１の組み合わせサブモジュール（図示せず）とを含む。上記第１の取得サブモジュールは、テキストデータの測定すべきピンインデータを取得することができる。上記第１の検索サブモジュールは、測定すべきピンインデータと同じ発音を持つテキストデータを検索して、検索テキストデータを取得するように配置されてもよい。上記第１の組み合わせサブモジュールは、テキストデータと検索テキストデータを組み合わせて、検索データセットを取得するように配置されてもよい。

本実施例のいくつかのオプションの実現形態では、上記検索モジュールは、第２の取得サブモジュール（図示せず）と、確定サブモジュール（図示せず）と、修正サブモジュール（図示せず）と、第２の検索サブモジュール（図示せず）と、第２の組み合わせサブモジュール（図示せず）とを含む。上記第２の取得サブモジュールは、テキストデータの測定すべきピンインデータを取得するように配置されてもよい。上記確定サブモジュールは、測定すべきピンインデータと同じ発音を持つ検索テキストデータを確定して、検索テキストデータを取得するように配置されてもよい。上記修正サブモジュールは、測定すべきピンインデータに対してデータ修正を行い、修正ピンインデータを取得するように配置されてもよい。上記第２の検索サブモジュールは、修正ピンインデータと同じ発音を持つテキストデータを検索して、修正テキストデータを取得するように配置されてもよい。上記第２の組み合わせサブモジュールは、テキストデータ、修正テキストデータ及び検索テキストデータを組み合わせて、検索データセットを取得するように配置されてもよい。

本実施例のいくつかのオプションの実現形態では、上記処理ユニット５０４は、選別モジュール（図示せず）と、並べ替えモジュール（図示せず）とを含む。上記選別モジュールは、混合マッチングデータセットのうち、検索データセット内の異なる優先度の検索データとマッチングする混合マッチングデータを選別して、優先度の異なる中間データセットを取得するように配置されてもよい。上記並べ替えモジュールは、マッチングすべきデータセットにおけるマッチングすべきデータの順で、各中間データセットを並べ替えて組み合わせて、音声データに対応する検索結果セットを取得するように配置されてもよい。

本実施例のいくつかのオプションの実現形態では、上記並べ替えモジュールは、第１の並べ替えサブモジュール（図示せず）と、第２の並べ替えサブモジュール（図示せず）と、取得サブモジュール（図示せず）とを含む。上記第１の並べ替えサブモジュールは、各中間データセットにおける各中間データをピンインのアルファベットの順で並べ替えて、異なる並べ替えデータセットを取得するように配置されてもよい。上記第２の並べ替えサブモジュールは、各並べ替えデータセットに対して、当該並べ替えデータセットに同じピンインを持つ複数の並べ替えデータがあると判断したことに応答して、複数の並べ替えデータを、マッチングすべきデータセットのうち、各並べ替えデータと対応するデータの順で並べ替えるように配置されてもよい。上記取得サブモジュールは、各中間データセットの優先度レベルに応じて、すべての並べ替えデータセットを並べ替えて組み合わせて、音声データに対応する検索結果セットを取得するように配置されてもよい。

本実施例のいくつかのオプションの実現形態では、上記テキストデータ及び優先度がテキストデータよりも低い検索テキストデータを含み、上記選別モジュールは、第１の測定すべきサブモジュール（図示せず）と、第１の削除サブモジュール（図示せず）とを含む。上記第１の測定すべきサブモジュールは、テキストデータと混合マッチングデータセットをマッチングし、テキストデータとマッチングする測定すべき中間データセットを取得するように配置されてもよい。上記第１の削除サブモジュールは、混合マッチングデータセットにおける測定すべき中間データセットを削除して、検索テキストデータとマッチングする検索中間データセットを取得し、検索中間データセットの優先度が測定すべき中間データセットよりも低いように配置されてもよい。

本実施例のいくつかのオプションの実現形態では、上記検索データセットは、優先度レベルが順次下がるテキストデータ、修正テキストデータ及び検索テキストデータを含む。上記選別モジュールは、第２の測定すべきサブモジュール（図示せず）と、第２の削除サブモジュール（図示せず）と、第１のマッチングサブモジュール（図示せず）と、第３の削除サブモジュール（図示せず）とを含む。上記第２の測定すべきサブモジュールは、テキストデータと混合マッチングデータセットとをマッチングして、テキストデータとマッチングする測定すべき中間データセットを取得するように配置されていてもよい。上記第２の削除サブモジュールは、混合マッチングデータセットにおける測定すべき中間データを削除して、段階サブセットを取得するように配置されてもよい。上記第１のマッチングサブモジュールは、検索テキストデータと段階サブセットとをマッチングして、検索テキストデータとマッチングする検索中間データセットを取得するように配置されてもよい。上記第３の削除サブモジュールは、段階サブセットにおける検索中間データセットを削除して、修正テキストデータとマッチングする修正中間データセットを取得し、測定すべき中間データセット、検索中間データセット、修正中間データセットの優先度順位が順次下がるように配置されてもよい。

本開示の実施例提供的音声検索装置は、まず、取得ユニット５０１が音声データを取得し、次に、認識ユニット５０２が音声データを認識して、対応するテキストデータを取得し、更に、マッチングユニット５０３がテキストデータ及び事前設定されたマッチングすべきデータセットに基づいて、混合マッチングデータセットを取得し、最後に、処理ユニット５０４がマッチングすべきデータセットに基づいて、混合マッチングデータセットを選別し、音声データに対応する検索結果セットを取得する。これにより、テキストデータ及び事前設定されたマッチングすべきデータセットに基づいて取得された混合マッチングデータセットは、テキストデータとマッチングする混合マッチングデータを包括的に拡張し、更に混合マッチングデータに対して、マッチングすべきデータセットに適合であるより合理的な選別を行うことにより、取得された音声データ検索結果がより正確になり、ユーザが音声検索を行うエクスペリエンスが向上する。

本開示の実施例によれば、本開示は、電子機器、読み取り可能な記憶媒体及びコンピュータプログラム製品を更に提供する。

図６は、本開示の実施例を実施可能な例示的な電子機器６００の模式ブロック図である。電子機器は、例えば、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、メインフレームコンピュータ、及びその他の適切なコンピュータなど、様々な形式のデジタルコンピュータを表すことを意図している。電子機器は、例えば、パーソナルデジタルアシスタント、セルラー電話、スマートフォン、ウェアラブル機器、及びその他の類似の計算装置など、様々な形式の移動装置を示してもよい。本明細書に示されている部材、それらの接続と関係、及びそれらの機能は、単なる例であるが、本明細書の説明及び／又は要求される本開示の実現を制限することを意図しない。

図６に示すように、機器６００は、読み取り専用（ＲＯＭ）６０２に記憶されたコンピュータプログラム又は記憶ユニット６０８からランダムアクセスメモリ（ＲＡＭ）６０３にロードされたコンピュータプログラムに従って、様々な適切な動作及び処理を実行することができる計算ユニット６０１を含む。ＲＡＭ６０３には、機器６００の操作に必要な様々なプログラム及びデータが記憶されてもよい。計算ユニット６０１、ＲＯＭ６０２及びＲＡＭ６０３は、バス６０４を介して互いに接続されている。入力／出力（Ｉ／Ｏ）インターフェース６０５もバス６０４に接続されている。

機器６００の複数の部材はＩ／Ｏインターフェース６０５に接続され、マウスやキーボード等の入力ユニット６０６と、たとえば、様々なタイプのディスプレイやスピーカー等の出力ユニット６０７と、磁気ディスクや光ディスク等の記憶ユニット６０８と、ネットワークカードやモデムや無線通信トランシーバ等の通信ユニット６０９とを含む。通信ユニット６０９は、機器６００が例えばインターネットのコンピュータネットワーク及び／又は各種の電信ネットワークを介して他の機器と情報／データを交換することを可能とする。

計算ユニット６０１は、処理能力及び計算能力を有する様々な汎用及び／又は専用の処理コンポーネントであってもよい。計算ユニット６０１のいくつかの例は、中央処理ユニット（ＣＰＵ）、グラフィック処理ユニット（ＧＰＵ）、様々な専用人工知能（ＡＩ）計算チップ、機械学習モデルアルゴリズムを実行する様々な計算ユニット、デジタル信号プロセッサ（ＤＳＰ）、及び任意の適切なプロセッサ、コントローラ、マイクロコントローラなどを含むが、これらに限定されるものではない。計算ユニット６０１は、上述した様々な方法及び処理、例えば、音声検索方法を実行する。例えば、いくつかの実施例では、音声検索方法は、記憶ユニット６０８などの機械読み取り可能な媒体に物理的に含まれるコンピュータソフトウェアプログラムとして実現されてもよい。いくつかの実施例では、コンピュータプログラムの一部又は全部を、ＲＯＭ６０２及び／又は通信ユニット６０９を介して機器６００にロード及び／又はインストールすることができる。コンピュータプログラムがＲＡＭ６０３にロードされ、計算ユニット６０１によって実行されると、上述した音声検索方法の１つ又は複数のステップを実行することができる。オプションとして、別の実施例では、計算ユニット６０１は、他の任意の適切な方法で（例えば、ファームウェアによって）、音声検索方法を実行するように構成されてもよい。

本明細書に記載のシステム及び技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、特定用途向け集積回路（ＡＳＩＣ）、特定用途向け標準製品（ＡＳＳＰ）、システムオンチップシステム（ＳＯＣ）、ロードプログラマブルロジック機器（ＣＰＬＤ）、コンピュータハードウェア、ファームウェア、ソフトウェア、及び／又はそれらの組み合わせにおいて実現することができる。これらの様々な実施形態は、１つ又は複数のコンピュータプログラムにおいて実施され、この１つ又は複数のコンピュータプログラムは、少なくとも１つのプログラム可能なプロセッサを含むプログラム可能なシステムで実行及び／又は解釈されることができ、このプログラム可能なプロセッサは専用又は汎用のプログラム可能なプロセッサであってもよく、ストレージシステム、少なくとも１つの入力装置、及び少なくとも１つの出力装置からデータ及び命令を受信し、データ及び命令をこのストレージシステム、この少なくとも１つの入力装置、及びこの少なくとも１つの出力装置に送信することができる。

本開示の方法を実施するためのプログラムコードは１つ又は複数のプログラミング言語の任意の組み合わせで作成することができる。これらのプログラムコードは汎用コンピュータ、専用コンピュータ又は他のプログラム可能な音声検索装置のプロセッサ又はコントローラに提供することができ、それによりプログラムコードはプロセッサ又はコントローラにより実行されると、フローチャート及び／又はブロック図に規定された機能／動作が実施される。プログラムコードは機械で完全に実行されてもよく、部分的に機械で実行されてもよく、独立したソフトウェアパッケージとして一部が機械で実行されかつ一部が遠隔機械で実行されるか、又は完全に遠隔機械又はサーバで実行されてもよい。

本開示の文脈において、機械読み取り可能な媒体はプログラムを含む又は記憶した有形媒体であってもよく、このプログラムは、命令実行システム、装置又は機器により使用されるか、又はそれらと組み合わせて使用されてもよい。機械読み取り可能な媒体は、機械読み取り可能な信号媒体又は機械読み取り可能な記憶媒体であってもよい。機械読み取り可能な媒体は、例えば電子的、磁気的、光学的、電磁的、赤外線、若しくは半導体のシステム、装置、若しくは機器、又は以上の任意の組み合わせを含むことができるが、これらに限られない。機械読み取り可能な記憶媒体のより具体的な例は、１つ又は複数のワイヤによる電気接続、ポータブルコンピュータディスク、ハードディスク、ランダムアクセスメモリ（ＲＡＭ）、読み取り専用メモリ（ＲＯＭ）、消去可能プログラム可読み取り専用メモリ（ＥＰＲＯＭ又はフラッシュメモリ）、光ファイバ、ポータブルコンパクトディスク読み取り専用メモリ（ＣＤ－ＲＯＭ）、光記憶機器、磁気記憶機器、又は上記の任意の適切な組み合わせを含む。

ユーザと対話できるように、ここで記載されるシステム及び技術をコンピュータに実施することができ、このコンピュータは、ユーザに情報を表示するための表示装置（例えば、ＣＲＴ（陰極線管）又はＬＣＤ（液晶ディスプレイ）モニター）、ユーザがコンピュータに入力することを可能とするキーボード及びポインティング装置（例えば、マウスやトラックボール）を有する。他の種類の装置も、ユーザとの対話を提供することができ、例えば、ユーザに提供するフィードバックは、任意の形式の感覚フィードバック（例えば、視覚的フィードバック、聴覚的フィードバック、又は触覚的フィードバック）であってもよく、そして、ユーザからの入力は、任意の形式（音響入力、音声入力、又は触覚入力を含む）で受信できる。

ここで記載されるシステム及び技術は、バックエンドコンポーネントを含むコンピューティングシステム（例えば、データサーバとして）、又はミドルウェアコンポーネントを含むコンピューティングシステム（例えば、アプリケーションサーバ）、又はフロントエンドコンポーネントを含むコンピューティングシステム（例えば、グラフィカルユーザインターフェース又はネットワークブラウザーを備えたユーザコンピュータが挙げられ、ユーザはこのグラフィカルユーザインターフェース又はこのネットワークブラウザーを介してここで記載されるシステム及び技術の実施形態と対話できる）、又はこのようなバックエンドコンポーネント、ミドルウェアコンポーネント、又はフロントエンドコンポーネントの任意の組み合わせを含むコンピューティングシステムにおいて実施できる。システムのコンポーネントは、任意の形式又は媒体のデジタルデータ通信（例えば、通信ネットワーク）を介して相互に接続できる。通信ネットワークの例は、ローカルエリアネットワーク（ＬＡＮ）、ワイドエリアネットワーク（ＷＡＮ）及びインターネットを含む。

コンピュータシステムは、クライアント及びサーバを含むことができる。クライアントとサーバは通常、互いに遠く離れており、通信ネットワークを介してインタラクションする。クライアント及びサーバの関係は、対応するコンピュータで実行されて互いにクライアント－サーバの関係を持つコンピュータプログラムによって生成される。

本開示の技術的解決策では、関連するユーザの個人情報の取得、保存及び適用は、関連する法律及び規制に準拠し、公序良俗に違反していない。

なお、上記の様々な形式のプロセスを用いて、ステップを改めて並べ替えたり、追加したり、削除したりすることができる。例えば、本開示に記載の各ステップは、本開示で開示された技術案の所望の結果が達成できる限り、並行して実施しても、順次実施しても、異なる順次で実施してもよく、本明細書ではそれについて限定しない。

上記の具体的な実施形態は、本開示の保護範囲を制限するものではない。当業者にとって自明なように、設計要件及び他の要因に従って様々な修正、組み合わせ、サブコンビネーション及び置換を行うことができる。本開示の精神及び原則の範囲内で行われた修正、同等の置き換え及び改善等は、本開示の保護範囲に含まれるものとする。

Claims

音声データを取得することと、
前記音声データを認識して、対応するテキストデータを取得することと、
前記テキストデータ及び事前設定されたマッチングすべきデータセットに基づいて、混合マッチングデータセットを取得することと、
前記マッチングすべきデータセットに基づいて、前記混合マッチングデータセットを選別し、前記音声データに対応する検索結果セットを取得することと
を含んでなる音声検索方法。
前記テキストデータ及び事前設定されたマッチングすべきデータセットに基づいて、混合マッチングデータセットを取得することは、
前記テキストデータをデータ検索して、検索データセットを取得することと、
前記検索データセットと事前設定されたマッチングすべきデータセットとをマッチングして、混合マッチングデータセットを取得することと
を含む、請求項１に記載の音声検索方法。
前記テキストデータをデータ検索して、検索データセットを取得することは、
前記テキストデータの測定すべきピンインデータを取得することと、
前記測定すべきピンインデータと同じ発音を持つテキストデータを検索して、検索テキストデータを取得することと、
前記テキストデータ及び前記検索テキストデータを組み合わせて、検索データセットを取得することと
を含む、請求項２に記載の音声検索方法。
前記テキストデータをデータ検索して、検索データセットを取得することは、
前記テキストデータの測定すべきピンインデータを取得することと、
前記測定すべきピンインデータと同じ発音を持つ検索テキストデータを確定して、検索テキストデータを取得することと、
前記測定すべきピンインデータに対してデータ修正を行い、修正ピンインデータを取得することと、
前記修正ピンインデータと同じ発音を持つテキストデータを検索して、修正テキストデータを取得することと、
前記テキストデータ、前記修正テキストデータ及び前記検索テキストデータを組み合わせて、検索データセットを取得することと
を含む、請求項２に記載の音声検索方法。
前記マッチングすべきデータセットに基づいて、前記混合マッチングデータセットを選別し、前記音声データに対応する検索結果セットを取得することは、
前記混合マッチングデータセットのうち、前記検索データセット内の異なる優先度の検索データとマッチングする混合マッチングデータを選別して、優先度の異なる中間データセットを取得することと、
前記マッチングすべきデータセットにおけるマッチングすべきデータの順で、各中間データセットを並べ替えて組み合わせて、前記音声データに対応する検索結果セットを取得することと
を含む、請求項２～４のいずれか一項に記載の音声検索方法。
前記マッチングすべきデータセットにおけるマッチングすべきデータの順で、各中間データセットを並べ替えて組み合わせて、前記音声データに対応する検索結果セットを取得することは、
各中間データセットにおける各中間データをピンインのアルファベットの順で並べ替えて、異なる並べ替えデータセットを取得することと、
各並べ替えデータセットに対して、当該並べ替えデータセットに同じピンインを持つ複数の並べ替えデータがあると判断したことに応答して、前記複数の並べ替えデータを、前記マッチングすべきデータセットのうち、各並べ替えデータと対応するデータの順で並べ替えることと、
各中間データセットの優先度レベルに応じて、すべての並べ替えデータセットを並べ替えて組み合わせて、前記音声データに対応する検索結果セットを取得することと
を含む、請求項５に記載の音声検索方法。
前記検索データセットは、テキストデータ及び前記テキストデータよりも優先度が低い検索テキストデータを含み、
前記混合マッチングデータセットのうち、前記検索データセット内の異なる優先度の検索データとマッチングする混合マッチングデータを選別して、優先度の異なる中間データセットを取得することは、
前記テキストデータと前記混合マッチングデータセットをマッチングして、前記テキストデータとマッチングする測定すべき中間データセットを取得することと、
前記混合マッチングデータセットにおける測定すべき中間データセットを削除して、前記検索テキストデータとマッチングする検索中間データセットを取得することであって、前記検索中間データセットの優先度は前記測定すべき中間データセットよりも低いことと
を含む、請求項５に記載の音声検索方法。
前記検索データセットは、優先度レベルが順次下がる、テキストデータと検索テキストデータと修正テキストデータとを含み、
前記混合マッチングデータセットのうち、前記検索データセット内の異なる優先度の検索データとマッチングする混合マッチングデータを選別して、優先度の異なる中間データセットを取得することは、
前記テキストデータと前記混合マッチングデータセットをマッチングして、前記テキストデータとマッチングする測定すべき中間データセットを取得することと、
前記混合マッチングデータセットにおける測定すべき中間データを削除して、段階サブセットを取得することと、
前記検索テキストデータと前記段階サブセットとをマッチングして、前記検索テキストデータとマッチングする検索中間データセットを取得することと、
前記段階サブセットにおける検索中間データセットを削除して、前記修正テキストデータとマッチングする修正中間データセットを取得し、前記測定すべき中間データセットと前記検索中間データセットと前記修正中間データセットとの優先度順位が順次下がるものであることと
を含む、請求項５に記載の音声検索方法。
音声データを取得するように配置される収集ユニットと、
前記音声データを認識して、対応するテキストデータを取得するように配置される認識ユニットと、
前記テキストデータ及び事前設定されたマッチングすべきデータセットに基づいて、混合マッチングデータセットを取得するように配置されるマッチングユニットと、
前記マッチングすべきデータセットに基づいて、前記混合マッチングデータセットを選別し、前記音声データに対応する検索結果セットを取得するように配置される処理ユニットと
を含んでなる音声検索装置。
前記マッチングユニットは、
前記テキストデータをデータ検索して、検索データセットを取得するように配置される検索モジュールと、
前記検索データセットと事前設定されたマッチングすべきデータセットとをマッチングして、混合マッチングデータセットを取得するように配置されるマッチングモジュールと
を含む、請求項９に記載の音声検索装置。
少なくとも１つのプロセッサと、
前記少なくとも１つのプロセッサに通信可能に接続されたメモリと
を含んでなり、
前記メモリは、前記少なくとも１つのプロセッサによって実行可能な命令を記憶しており、前記命令は、前記少なくとも１つのプロセッサによって実行されて、請求項１～８のいずれか一項に記載の方法を前記少なくとも１つのプロセッサに実行させることを特徴とする、電子機器。
請求項１～８のいずれか一項に記載の方法をコンピュータに実行させるためのコンピュータ命令が記憶されていることを特徴とする、非一時的なコンピュータ読み取り可能な記憶媒体。
プロセッサによって実行されると、請求項１～８のいずれか一項に記載の方法を実現するコンピュータプログラム。