JP2019061662A

JP2019061662A - 情報を抽出する方法及び装置

Info

Publication number: JP2019061662A
Application number: JP2018154667A
Authority: JP
Inventors: パン，シアンユイ; Xiangyu Pang; タン，コアンヤオ; Guangyao Tang
Original assignee: Baidu Online Network Technology Beijing Co Ltd
Current assignee: Baidu Online Network Technology Beijing Co Ltd
Priority date: 2017-09-25
Filing date: 2018-08-21
Publication date: 2019-04-18
Anticipated expiration: 2038-08-21
Also published as: US11217236B2; US20190096402A1; CN107707745A; JP6633153B2

Abstract

【課題】ユーザの本意に一致する連絡者情報をより良く認識でき、抽出された連絡者情報の正確性を向上するる情報抽出装置及び方法を提供する。【解決手段】方法は、ユーザの音声情報を受信し解析して当該音声情報に対応するテキスト情報を生成することと、当該テキスト情報から認識待ち連絡者情報を抽出することと、当該ユーザの、少なくとも二つの連絡者情報を含む連絡帳を取得することと、当該認識待ち連絡者情報に基づいて、少なくとも二つのマッチング用情報を生成することと、当該少なくとも二つのマッチング用情報における各種類のマッチング用情報について、当該種類のマッチング用情報に基づいて、当該認識待ち連絡者情報と当該少なくとも二つの連絡者情報における各連絡者情報とのマッチング度を確定することと、確定されたマッチング度に基づいて当該認識待ち連絡者情報にマッチした連絡者情報を当該連絡帳から抽出する。【選択図】図２

Description

本願は、コンピュータ技術分野に関し、具体的に音声認識技術分野に関し、特に情報を抽出する方法及び装置に関する。

音声認識技術（ＡｕｔｏｍａｔｉｃＳｐｅｅｃｈＲｅｃｏｇｎｉｔｉｏｎ、ＡＳＲ）は、人間の音声における単語内容をコンピュータ読取可能な入力、例えばキー、二値化コード又は文字序列へ変換することを目標とする。音声認識技術は広い範囲に応用され、例えば音声ダイヤル、音声ナビゲーション、室内デバイス制御、音声ファイル検索などである。幾つかのシーンにおいて、認識ユーザの音声により、連絡帳からユーザに所望の連絡者情報を抽出する必要がある。

しかし、従来の連絡帳からユーザに所望の連絡者情報を抽出することは、正確率が低い課題がある。

本願の実施形態は、改善された情報を抽出する方法及び装置を提供して上記の背景技術の部分に言及された技術課題を解決することを目的とする。

第一の局面として、本願の実施形態は情報を抽出する方法を提供する。前記方法は、ユーザの音声情報を受信し解析して、前記音声情報に対応するテキスト情報を生成し、前記テキスト情報から認識待ち連絡者情報を抽出し、前記ユーザの、少なくとも二つの連絡者情報を含む連絡帳を取得し、前記認識待ち連絡者情報に基づいて、少なくとも二つのマッチング用情報を生成し、前記少なくとも二つのマッチング用情報における各種類のマッチング用情報について、当該種類のマッチング用情報に基づいて、前記認識待ち連絡者情報と前記少なくとも二つの連絡者情報における各連絡者情報とのマッチング度を確定し、確定されたマッチング度に基づいて、前記認識待ち連絡者情報にマッチした連絡者情報を前記連絡帳から抽出する、ことを含む。

第二の局面として、本願の実施形態は、情報を抽出する装置を提供する。前記装置は、ユーザの音声情報を受信し解析して、前記音声情報に対応するテキスト情報を生成する解析ユニットと、前記テキスト情報から認識待ち連絡者情報を抽出する第一抽出ユニットと、前記ユーザの少なくとも二つの連絡者情報を含む連絡帳を取得する取得ユニットと、前記認識待ち連絡者情報に基づいて、少なくとも二つのマッチング用情報を生成する生成ユニットと、前記少なくとも二つのマッチング用情報における各種類のマッチング用情報について、当該種類のマッチング用情報に基づいて、前記認識待ち連絡者情報と前記少なくとも二つの連絡者情報における各連絡者情報とのマッチング度を確定する確定ユニットと、確定されたマッチング度に基づいて、前記認識待ち連絡者情報にマッチした連絡者情報を前記連絡帳から抽出する第二抽出ユニットと、を備える。

第三の局面として、本願の実施形態はデバイスを提供する。前記デバイスは、一つ又は複数のプロセッサと、一つ又は複数のプログラムを記憶する記憶装置とを備え、前記一つ又は複数のプログラムが前記一つ又は複数のプロセッサにより実行されると、前記一つ又は複数のプロセッサに第一の局面に記載の方法を実現させる。

第四の局面として、本願の実施形態は、コンピュータプログラムが記憶されており、当該プログラムがプロセッサにより実行されると、第一の局面に記載の方法を実現させるコンピュータ読取可能な記憶媒体を提供する。

本願の実施形態により提供される情報を抽出する方法及び装置によれば、最初に音声認識により、ユーザの音声から認識待ち連絡者情報を抽出し、その後に認識待ち連絡者情報に基づいて少なくとも二つのマッチング用情報を生成し、そして各種類のマッチング用情報に基づいて、認識待ち連絡者情報とユーザの連絡帳における各連絡者情報とのマッチング度を確定し、最後にこれら複数種のマッチング度を利用して連絡者情報を抽出する。これにより、このような過程において、複数種のマッチング用情報を利用してマッチングを行えるので、ユーザの本意に一致する連絡者情報をより良く認識でき、抽出された連絡者情報の正確性を向上させることができる。

以下の図面を参照してなされた制限的でない実施形態に対する詳細的な説明により、本発明の他の特徴、目的及び利点はより明らかになる。

本願が適用される例示的なシステムアーキテクチャ図である。本願の情報を抽出する方法による一実施形態のフローチャートである。本願の情報を抽出する方法によるシーンの模式図である。本願の情報を抽出する装置による一実施形態の構成模式図である。本願の実施形態を実現するためのデバイスに適用されるコンピュータシステムの構成模式図である。

以下、図面及び実施形態を参照しながら本発明をより詳細に説明する。理解すべきことは、ここで説明する具体的な実施形態は、当該発明を説明するものに過ぎず、当該発明を限定するものではない。ただし、説明の便宜上、図面には発明に関連する部分のみが示されている。

なお、衝突しない場合、本願の実施形態及び実施形態における特徴を相互に組み合せてもよい。以下、図面及び実施形態を参照しながら本願を詳細に説明する。

図１は、本願が適用できる情報を抽出する方法又は情報を抽出する装置の実施形態の例示的なシステムアーキテクチャ１００を示した。

図１に示されたように、システムアーキテクチャ１００は、端末デバイス１０１、１０２、１０３と、ネットワーク１０４と、サーバ１０５とを備えても良い。ネットワーク１０４は、端末デバイス１０１、１０２、１０３とサーバ１０５の間に通信リンクの媒体を提供する。ネットワーク１０４は、各種類の接続タイプ、例えば有線、無線通信リンク又は光ファイバ、ケーブルなどを含んでも良い。

ユーザは、端末デバイス１０１、１０２、１０３を使用してネットワーク１０４を介してサーバ１０５とやりとりすることにより、メッセージなどを送受信することができる。端末デバイス１０１、１０２、１０３には、各種類の通信クライアントアプリ、例えば音声補助型のアプリ、買物型のアプリ、検索型のアプリ、即時通信ツール、メールボックスクライアント、交際型のプラットフォームソフトウェアなどがインストールされても良い。

端末デバイス１０１、１０２、１０３は、音声受信機能を有する各種類の電子デバイスであっても良く、スマートフォーン、タブレット、電子書籍閲覧機、ＭＰ３プレーヤ（ＭｏｖｉｎｇＰｉｃｔｕｒｅＥｘｐｅｒｔｓＧｒｏｕｐＡｕｄｉｏＬａｙｅｒＩＩＩ、ムービングピクチャエクスパーシグループオーディオレイヤー３）、ＭＰ４（ＭｏｖｉｎｇＰｉｃｔｕｒｅＥｘｐｅｒｔｓＧｒｏｕｐＡｕｄｉｏＬａｙｅｒＩＶ、ムービングピクチャエクスパーシグループオーディオレイヤー４）プレーヤ、ノードパソコン及びディスクトップコンピュータなどを含むが、それらに限定されない。

サーバ１０５は、各種類のサービスを提供するサーバ、例えば端末デバイス１０１、１０２、１０３における音声補助型のアプリに対してサポートを提供するバックグラウンドサーバであっても良い。バックグラウンドサーバは、受信された音声情報などのデータに対して分析などの処理を行い、処理結果（例えば前記音声情報に基づいて抽出された情報）を端末デバイスにフィードバックすることができる。

説明すべきなのは、本願の実施形態により提供される情報を抽出する方法は、一般的にサーバ１０５により実行される。それに応じて、情報を抽出する装置は一般的にサーバ１０５に設置される。説明すべきなのは、本願の実施形態により提供される情報を抽出する方法は、ある場合に端末デバイス１０１、１０２、１０３により実行されても良い。

理解すべきなのは、図１における端末デバイス、ネットワーク及びサーバの数は例示的なものに過ぎない。実現の必要に応じて、任意の数の端末デバイス、ネットワーク及びサーバを備えても良い。

続いて図２を参照する。図２は、本願の情報を抽出する方法による一実施形態の手順２００を示した。前記情報を抽出する方法は、以下のステップを含む。

ステップ２０１において、ユーザの音声情報を受信し解析して、音声情報に対応するテキスト情報を生成する。

本実施形態において、情報を抽出する方法が運行される電子デバイス（例えば図１に示されたサーバ）は、まずユーザが利用して音声入力が行われる端末デバイスからユーザに入力された音声情報を受信し、そしてユーザの音声情報を解析して前記音声情報に対応するテキスト情報を生成することができる。

本実施形態において、音声認識技術を利用してユーザの音声情報を解析して、前記音声情報に対応するテキスト情報を生成することができ、ここでは詳しく説明しない。

例示として、ユーザの音声情報は、「張三に電話する」に対応する音声であっても良く、生成されたテキスト情報は「張三に電話する」である。

ステップ２０２において、テキスト情報から認識待ち連絡者情報を抽出する。

本実施形態において、前記電子デバイスは前記テキスト情報から認識待ち連絡者情報を抽出することができる。

例示として、語義解析技術を利用してテキスト情報から認識待ち連絡者情報を抽出することができる。例えば、主題モデルを利用して前記テキスト情報におけるキーワードを抽出し、そして、あるルールを利用して、例えばある語の性質のキーワードを抽出し、或いはテキスト情報においてある位置のキーワードを抽出し、前記テキスト情報から認識待ち連絡者情報を抽出することができる。

例示として、連絡者キーワードセットを予め設置し、連絡者キーワードセットにおける連絡者キーワードにマッチする方式を利用し、前記テキスト情報から認識待ち連絡者情報を検索してから認識待ち連絡者情報を抽出することができる。

例示として、テキスト情報が「張三に電話する」であり、このようなテキスト情報から認識待ち連絡者情報として「張三」を抽出することができる。

ステップ２０３において、ユーザの連絡帳を取得する。

本実施形態において、前記電子デバイスは前記ユーザの連絡帳を取得することができる。

本実施形態の一部の選択可能な実現手段において、前記電子デバイスは端末デバイスからユーザの連絡帳を受信することができる。

本実施形態の一部の選択可能な実現手段において、前記電子デバイスは更にローカルで予め記憶されている前記ユーザの連絡帳を取得することができる。

ステップ２０４において、認識待ち連絡者情報に基づいて、少なくとも二つのマッチング用情報を生成する。

本実施形態において、前記電子デバイスは、前記認識待ち連絡者情報に基づいて、少なくとも二つのマッチング用情報を生成することができる。

本実施形態において、マッチング用情報は、認識待ち連絡者情報と連絡帳における連絡者情報とをマッチングするために用いられることにより、認識待ち連絡者情報にマッチした連絡者情報を抽出することができる。

例示として、マッチング用情報は、前記認識待ち連絡者情報に対応するピンイン、前記認識待ち連絡者情報に対応する音波情報、名前のキーワード、名称のキーワードのような情報であっても良いが、それらに限定されない。

本実施形態において、ステップ２０４で生成されたマッチング用情報は少なくとも二つであっても良い。

説明すべきなのは、ユーザに入力される音声は、ユーザの会話の慣習又は発音の慣習の違い、例えば略語を使う傾向があり、話し言葉による表現の傾向があり、方言の発音があるなどによっては、ユーザの音声によりユーザの本意を正確に伝達できない恐れがある。複数種のマッチング用情報を利用してマッチングを行うことにより、ユーザの本意に一致する連絡者情報をより良く認識でき、抽出された連絡者情報の正確性を向上させることができる。

ステップ２０５において、少なくとも二つのマッチング用情報における各種類のマッチング用情報について、当該種類のマッチング用情報に基づいて、認識待ち連絡者情報と少なくとも二つの連絡者情報における各連絡者情報とのマッチング度を確定する。

本実施形態において、前記電子デバイスは、前記少なくとも二つのマッチング用情報における各種類のマッチング用情報について、当該種類のマッチング用情報に基づいて、前記認識待ち連絡者情報と前記少なくとも二つの連絡者情報における各連絡者情報とのマッチング度を確定することができる。

例示として、ステップ２０４においてマッチング用情報Ａとマッチング用情報Ｂを生成した。連絡帳には、連絡者情報Ｃと連絡者情報Ｄが含まれる。マッチング用情報Ａについて、マッチング用情報Ａに基づいて、認識すべき連絡者と連絡者情報Ｃとのマッチング度が９０％、認識すべき連絡者と連絡者情報Ｄとのマッチング度が９５％と確定される。マッチング用情報Ｂについて、マッチング用情報Ｂに基づいて、認識すべき連絡者と連絡者情報Ｃとのマッチング度が８０％、認識すべき連絡者と連絡者情報Ｄとのマッチング度が７０％と確定される。

ステップ２０６において、確定されたマッチング度に基づいて、連絡帳から認識待ち連絡者情報にマッチした連絡者情報を抽出する。

本実施形態において、前記電子デバイスは、確定されたマッチング度に基づいて、前記連絡帳から前記認識待ち連絡者情報にマッチした連絡者情報を抽出することができる。

本実施形態の一部の選択可能な実現手段において、ステップ２０６は、マッチング度の大きい順で、所定の数のマッチング度を選択し、その後に、前記連絡帳から選択されたマッチング度に対応する連絡者情報を抽出するように実現可能である。

本実施形態の一部の選択可能な実現手段において、ステップ２０６は、更に、各種類のマッチング用情報に対して予め重みを設置し、そしてステップ２０５に確定されたマッチング度と対応するマッチング用情報の重みとの積を最終的なマッチング度とすることを含んでも良い。

本実施形態の一部の選択可能な実現手段において、抽出された連絡者情報は複数であっても良い。ステップ２０６の後に、本実施形態に示される方法は、更に、抽出された連絡者情報を前記ユーザに使用される端末デバイスに送信し、その後に、前記端末デバイスによりユーザに対して受信された連絡者情報を展示してユーザに選択させることを含んでも良い。

本実施形態の一部の選択可能な実現手段において、抽出された連絡者情報は一つであっても良い。ステップ２０２において、更に前記テキスト情報からユーザの本意情報を認識しても良い。ステップ２０６の後に、本実施形態に示された方法は、更に、本意情報に対応する制御指令、例えば、ダイヤル指令、新しいメッセージの生成指令などを生成し、抽出された連絡者情報と生成された制御指令を前記ユーザに使用される端末デバイスに送信し、その後に前記端末デバイスにより受信された連絡者情報を利用して前記制御指令を実行することを含んでも良い。

続いて図３を参照する。図３は本実施形態の情報を抽出する方法による応用シーンの模式図である。図３の応用シーンにおいて、ユーザは端末デバイスに対して「パパに電話する」という音声を話した。その後、端末デバイスは音声情報「パパに電話する」をサーバに送信する。その後、サーバは、前記音声情報を受信し解析して前記音声情報に対応するテキスト情報「パパに電話する」を生成する。その後、サーバは前記テキスト情報から認識待ち連絡者情報である「パパ」を抽出することができる。且つ、前記サーバは、前記ユーザの連絡帳を取得することができ、例えば連絡帳に連絡者情報Ａと連絡者情報Ｂが含まれる。そして、前記サーバは、前記認識待ち連絡者情報に基づいて、少なくとも二つのマッチング用情報、例えば、名称のキーワード「パパ」と認識待ち連絡者情報に対応するピンイン「ｌａｏｂａ」を生成することができる。その後に、名称のキーワード「パパ」に基づいて、前記認識待ち連絡者情報と連絡者情報Ａとのマッチング度である甲、前記認識待ち連絡者情報と連絡者情報Ｂとのマッチング度である乙を確定することができ、且つ、ピンイン「ｌａｏｂａ」に基づいて、前記認識待ち連絡者情報と連絡者情報Ａとのマッチング度である丙、前記認識待ち連絡者情報と連絡者情報Ｂとのマッチング度である丁を確定することができる。確定されたマッチング度甲、マッチング度乙、マッチング度丙とマッチング度丁に基づいて、前記連絡帳から前記認識待ち連絡者情報にマッチした連絡者情報を抽出する。例えば、マッチング度甲、マッチング度乙、マッチング度丙とマッチング度丁のうち、マッチング度丙が最大であるので、前記連絡帳からマッチング度丙に対応する連絡者情報、即ち連絡者情報Ａを抽出することができる。

本願の前記実施形態に提供される方法によれば、最初に音声認識を利用してユーザの音声から認識待ち連絡者情報を抽出し、そして認識待ち連絡者情報に基づいて少なくとも二つのマッチング用情報を生成し、その後に各種類のマッチング用情報に基づいて、認識待ち連絡者情報とユーザの連絡帳における各連絡者情報とのマッチング度を確定し、最後にこれら複数種のマッチング度を利用して連絡者情報を抽出する。これにより、このような過程において、複数種のマッチング用情報を利用してマッチングを行えるので、ユーザの本意に一致する連絡者情報をより良く認識でき、抽出された連絡者情報の正確性を向上させることができる。

本実施形態の一部の選択可能な実現手段において、マッチング用情報は、前記認識待ち連絡者情報に対応するピンインであっても良い。

本実施形態の一部の選択可能な実現手段において、ステップ２０４は、前記認識待ち連絡者情報に対応する第一のピンインを確定し、前記連絡帳における各連絡者情報について、当該連絡者情報に対応する第二のピンインを確定することを含んでも良い。

理解できるように、第二のピンインは少なくとも二つを有する。説明の便利のために、第一と第二でピンインを区分する。第一のピンインは、実質的に認識すべき連絡者に対応するピンインである。

例示として、認識待ち連絡者情報は「胡广」、認識待ち連絡者情報に対応する第一のピンインは「ｈｕｇｕａｎｇ」である。

本実施形態の一部の選択可能な実現手段において、ステップ２０５は、前記連絡帳における各連絡者について、前記第一のピンインと当該連絡者情報に対応する第二のピンインを予め作成されたピンイン類似度モデルに導入して前記第一のピンインと当該第二のピンインとのピンイン類似度を生成することを含んでも良い。ここでは、前記ピンイン類似度モデルは、第一のピンイン、第二のピンインの両者とピンイン類似度との対応関係を示す。当該ピンイン類似度を前記認識待ち連絡者情報と当該連絡者情報とのマッチング度として確定する。

本実現手段において、前記ピンイン類似度モデルは、大量のユーザの音声データ（言い間違いと方言情報を含む）に対して本意の標識を行い、標識された音声データを訓練のサンプルとして初期モデルを訓練してピンイン類似度モデルを得るような過程で作成することができる。ここでは、モデルの訓練に用いられるサンプルは、地域により区画して各領域に対応するピンイン類似度モデルを訓練して得られても良い。

本実現手段において、前記ピンイン類似度モデルはルックアップテーブルであっても良い。前記ルックアップテーブルは、ピンイン及びピンイン同士のピンイン類似度をリストアップする。第一のピンインと第二のピンインとの類似度は、ルックアップテーブルからルックアップすることができる。

説明すべきなのは、ピンイン類似度モデルにより、ユーザの発音慣習、例えば方言の発音、発音の不明瞭などに応じて、連絡帳からユーザの本意に一致する連絡者情報を抽出することができる。

本実施形態の一部の選択可能な実現手段において、ステップ２０５は、前記連絡帳における各連絡者情報について、前記第一のピンインと当該連絡者情報に対応する第二のピンインに基づいて、前記認識待ち連絡者情報と当該連絡者情報との編集距離を確定し、当該編集距離を前記認識待ち連絡者情報と当該連絡者情報とのマッチング度として確定することを含んでも良い。

本実現手段において、編集距離は、二つの文字列のうち、一方が他方に変換するのに必要な最も少ない編集操作の回数を示す。例示として、一方の姓名と他方の姓名との編集距離を取得するために、二つの姓名に含まれる文字を順番で比較する必要がある。例えば、「李磊」と「王麗」の編集距離を取得するために、「李」と「王」の編集距離を取得してから「磊」と「麗」の編集距離を取得し、そして二つの編集距離の和を求める必要がある。二つの文字の編集距離を判断することは、二つの文字の声母、韻母と音調を比較する。二つの文字の声母、韻母又は音調のうち何れか一つが異なると、二つの文字の発音の編集距離が１であり、二つが異なると、編集距離が２であり、三つが異なると、編集距離が３である。

本実施形態の一部の選択可能な実現手段において、マッチング用情報は、前記認識待ち連絡者情報に対応する音波情報であっても良い。

本実施形態の一部の選択可能な実現手段において、ステップ２０４は、前記認識待ち連絡者情報に対応する第一の音波情報を取得することを含んでも良い。

本実現手段において、予め記憶されている音波情報から前記第一の音波情報を取得しても良い。

本実現手段において、前記音声情報から前記第一の音波情報を切り取っても良い。

本実施形態の一部の選択可能な実現手段において、ステップ２０４は、更に、前記連絡帳における各連絡者情報について、当該連絡者情報に対応する第二の音波情報を取得することを含んでも良い。

本実施形態の一部の選択可能な実現手段において、ステップ２０５は、前記連絡帳における各連絡者情報について、前記第一の音波情報と当該連絡者情報に対応する第二の音波情報との類似度を前記認識待ち連絡者情報と当該連絡者情報とのマッチング度として確定することを含んでも良い。音波情報同士の類似度をどのように算出するかは、当業者であれば実現できるため、ここでは詳しく説明しない。

本実施形態の一部の選択可能な実現手段において、マッチング用情報は名前のキーワードであっても良い。

本実施形態の一部の選択可能な実現手段において、ステップ２０４は、認識待ち連絡者情報から名前のキーワードを抽出することを含んでも良い。

例示として、認識待ち連絡者情報「鳳儀美女」から名前のキーワード「鳳儀」を抽出することができる。

本実現手段において、名前のキーワードセットを予め設置し、認識待ち連絡者情報から名前のキーワードセットにおける詞を抽出して名前のキーワードとすることができる。

本実施形態の一部の選択可能な実現手段において、ステップ２０５は、前記連絡帳における各連絡者情報について、前記名前のキーワードと当該連絡者情報との一致度を認識待ち連絡者情報と当該連絡者情報とのマッチング度として確定することを含んでも良い。

例示として、連絡帳における連絡者情報は「張鳳儀」と「張三」である。そして、「鳳儀」と「張鳳儀」との一致度、更に「鳳儀」と「張三」との一致度を算出することができる。例示として、一致度は、連絡者情報と名前のキーワードのうち同じ文字の数と、連絡者情報と名前のキーワードのうち文字の総計との比であっても良い。これにより、「鳳儀」と「張鳳儀」の一致度は４０％、「鳳儀」と「張三」の一致度は０である。

説明すべきなのは、名前のキーワードというマッチング用情報を利用することにより、ユーザの幾つかの話し慣習、例えば略語の使用という傾向があるなどに応じて、連絡帳からユーザの本意に一致する連絡者情報を抽出することができる。

本実施形態の一部の選択可能な実現手段において、マッチング用情報は名称のキーワードである。

本実施形態の一部の選択可能な実現手段において、ステップ２０４は、認識待ち連絡者情報から名称のキーワードを抽出することを含んでも良い。

本実現手段において、名称詞セットを予め設置し、前記認識待ち連絡者情報における各詞と名称詞セットにおける名称詞とをマッチングして名称のキーワードを抽出することができる。

本実施形態の一部の選択可能な実現手段において、ステップ２０５は、予め生成された名称詞関連関係情報を取得することを含んでも良い。ここでは、名称詞関連関係情報は、同じ意味を示す名称詞同士の関連関係を示す。

例示として、名称詞「お父さん」と名称詞「パパ」は、同じ意味を示す。

本実施形態の一部の選択可能な実現手段において、ステップ２０５は、更に、前記名称詞関連関係情報に基づいて、前記名称のキーワードと同じ意味を示す目標名称詞を取得することを含んでも良い。

例示として、名称のキーワードが「父」であれば、取得された目標名称詞が「お父さん」、「パパ」、「親父」などを含んでも良い。

本実施形態の一部の選択可能な実現手段において、ステップ２０５は、更に、前記連絡帳における各連絡者情報について、前記名称のキーワードと当該連絡者情報とのマッチング度及び前記目標名称詞と当該連絡者情報とのマッチング度のうち、最も大きいマッチング度を選択して認識待ち連絡者情報と当該連絡者情報とのマッチング度とすることを含んでも良い。

例示として、連絡帳に「美しいはは」と「可愛いパパ」が含まれ、「父」、「お父さん」、「パパ」、「親父」のそれぞれと「美しいはは」とのマッチング度、更に「父」、「お父さん」、「パパ」、「親父」のそれぞれと「可愛いパパ」とのマッチング度を算出することができる。明らかに、このような一連のマッチング度のうち、「パパ」と「可愛いパパ」とのマッチング度が最も高い。

本実施形態の一部の選択可能な実現手段において、名称のキーワードに対して最も高い優先順位を設置し、名称のキーワードに基づいてマッチング度が所定のマッチング度閾値よりも大きい連絡者情報が検索されると、他のマッチング用情報で検索された連絡者情報を採用することではなく、名称のキーワードに基づいて検索された連絡者情報をそのまま抽出することができる。

説明すべきなのは、名称のキーワードというマッチング用情報を利用することにより、ユーザの幾つかの表現の慣習、例えば話し言葉の表現の傾向があるなどに応じて、ユーザの本意に一致する連絡者情報を認識することができる。

説明すべきなのは、前記一連のマッチング用情報によれば、抽出された情報の正確性を向上し、且つユーザの表現の正確性に対する要求を下げることができる。例えば、ユーザにより記憶された連絡者の一部の姓名だけ表現すれば、所望の連絡をマッチングすることができる。

続いて図４を参照する。前記各図に示された方法の実現として、本願は情報を抽出する装置の一実施形態を提供した。当該装置の実施形態は図２に示された方法の実施形態に対応する。当該装置は具体的に各種類の電子デバイスに適用することができる。

図４に示されたように、本実施形態の前記情報を抽出する装置４００は、解析ユニット４０１と、第一抽出ユニット４０２と、取得ユニット４０３と、生成ユニット４０４と、確定ユニット４０５と、第二抽出ユニット４０６とを備える。なお、解析ユニットは、ユーザの音声情報を受信し解析して前記音声情報に対応するテキスト情報を生成する。第一抽出ユニットは、前記テキスト情報から認識待ち連絡者情報を抽出する。取得ユニットは、前記ユーザの少なくとも二つの連絡者情報が含まれる連絡帳を取得する。生成ユニットは、前記認識待ち連絡者情報に基づいて、少なくとも二つのマッチング用情報を生成する。確定ユニットは、前記少なくとも二つのマッチング用情報における各種類のマッチング用情報について、当該種類のマッチング用情報に基づいて、前記認識待ち連絡者情報と前記少なくとも二つの連絡者情報における各連絡者情報とのマッチング度を確定する。第二抽出ユニットは、確定されたマッチング度に基づいて、前記連絡帳から前記認識待ち連絡者情報にマッチした連絡者情報を抽出する。

本実施形態の一部の選択可能な実現手段において、マッチング用情報は前記認識待ち連絡者情報に対応するピンインであり、前記第一生成ユニットは、更に、前記認識待ち連絡者情報に対応する第一のピンインを確定し、前記連絡帳における各連絡者情報について、当該連絡者情報に対応する第二のピンインを確定する。

本実施形態の一部の選択可能な実現手段において、前記確定ユニットは、更に、前記連絡帳における各連絡者情報について、前記第一のピンインと当該連絡者情報に対応する第二のピンインを予め作成された、第一のピンイン、第二のピンインの両者とピンイン類似度との対応関係を示すピンイン類似度モデルに導入して前記第一のピンインと当該第二のピンインとのピンイン類似度を生成し、当該ピンイン類似度を前記認識待ち連絡者情報と当該連絡者情報とのマッチング度として確定する。

本実施形態の一部の選択可能な実現手段において、前記確定ユニットは、前記連絡帳における各連絡者情報について、前記第一のピンインと当該連絡者情報に対応する第二のピンインに基づいて、前記認識待ち連絡者情報と当該連絡者情報との編集距離を確定し、当該編集距離を前記認識待ち連絡者情報と当該連絡者情報とのマッチング度として確定する。

本実施形態の一部の選択可能な実現手段において、マッチング用情報は前記認識待ち連絡者情報に対応する音波情報であり、前記第一生成ユニットは、更に、前記認識待ち連絡者情報に対応する第一の音波情報を取得し、前記連絡帳における各連絡者情報について、当該連絡者情報に対応する第二の音波情報を取得する。

本実施形態の一部の選択可能な実現手段において、前記確定ユニットは、更に、前記連絡帳における各連絡者情報について、前記第一の音波情報と当該連絡者情報に対応する第二の音波情報との類似度を、前記認識待ち連絡者情報と当該連絡者情報とのマッチング度として確定する。

本実施形態の一部の選択可能な実現手段において、マッチング用情報は名前のキーワードであり、前記第一生成ユニットは、更に、前記認識待ち連絡者情報から、名前のキーワードを抽出し、前記確定ユニットは、更に、前記連絡帳における各連絡者情報について、前記名前のキーワードと当該連絡者情報との一致度を、前記認識待ち連絡者情報と当該連絡者情報とのマッチング度として確定する。

本実施形態の一部の選択可能な実現手段において、マッチング用情報は名称のキーワードであり、前記第一生成ユニットは、更に、前記認識待ち連絡者情報から名称のキーワードを抽出する。

本実施形態の一部の選択可能な実現手段において、前記確定ユニットは、更に、予め生成された同じ意味を表現する名称詞同士の関連関係を示す名称詞関連関係情報を取得し、前記名称詞関連関係情報に基づいて、前記名称のキーワードと同じ意味を表現する目標名称詞を取得し、前記連絡帳における各連絡者情報について、前記名称のキーワードと当該連絡者情報とのマッチング度及び前記目標名称詞と当該連絡者情報とのマッチング度のうち、最大のマッチング度を取得して前記認識待ち連絡者情報と当該連絡者情報とのマッチング度とする。

本実施形態において、解析ユニット４０１、第一抽出ユニット４０２、取得ユニット４０３、生成ユニット４０４、確定ユニット４０５及び第二抽出ユニット４０６の具体的な処理及び実現された技術效果は、図２の対応の実施形態におけるステップ２０１、ステップ２０２、ステップ２０３、ステップ２０４、ステップ２０５及びステップ２０６の関連説明をそれぞれ参照することができ、ここでは詳しく説明しない。

説明すべきなのは、本実施形態により提供された情報を抽出する装置における各ユニットの実現の細部及び技術效果は、本願における他の実施形態の説明を参照でき、ここでは詳しく説明しない。

続いて図５を参照する。図５は、本願の実施形態を実現するための電子デバイスに適用されるコンピュータシステム５００の構成模式図を示した。図５に示された電子デバイスは一つの例示に過ぎず、本願の実施形態の機能及び使用範囲に制限しない。

図５に示されたように、コンピュータシステム５００は、読み出し専用メモリ（ＲＯＭ）５０２に記憶されているプログラム又は記憶部５０６からランダムアクセスメモリ（ＲＡＭ）５０３にロードされたプログラムに基づいて様々な適当な動作および処理を実行することができる中央処理装置（ＣＰＵ）５０１を備える。ＲＡＭ５０３には、システム５００の操作に必要な様々なプログラムおよびデータがさらに記憶されている。ＣＰＵ５０１、ＲＯＭ５０２およびＲＡＭ５０３は、バス５０４を介して互いに接続されている。入力／出力（Ｉ／Ｏ）インターフェース５０５もバス５０４に接続されている。

キーボード、マウスなどを含む入力部５０６、陰極線管（ＣＲＴ）、液晶ディスプレイ（ＬＣＤ）など、およびスピーカなどを含む出力部５０７、ハードディスクなどを含む記憶部５０８、およびＬＡＮカード、モデムなどを含むネットワークインターフェースカードの通信部５０９は、Ｉ／Ｏインターフェース５０５に接続されている。通信部５０９は、例えばインターネットのようなネットワークを介して通信処理を実行する。ドライバ５１０は、必要に応じてＩ／Ｏインターフェース５０５に接続される。リムーバブルメディア５１１は、例えば、マグネチックディスク、光ディスク、光磁気ディスク、半導体メモリなどのようなものであり、必要に応じてドライバ５１０に取り付けられ、したがって、ドライバ５１０から読み出されたコンピュータプログラムが必要に応じて記憶部５０８にインストールされる。

特に，本発明の実施形態によれば、上記のフローチャートに参照して説明された過程はコンピュータソフトウェアプログラムに実現されても良い。例えば、本発明の実施形態はコンピュータ読取可能な媒体にロードされるコンピュータプログラムを含むコンピュータプログラム製品を備える。当該コンピュータプログラムは、フローチャートに示される方法を実行するためのプログラムコードを含む。このような実施形態において、当該コンピュータプログラムは、通信部５０９を介してネットワークからダウンロードしてインストールされ、及び／又はリムーバブルメディア５１１からインストールされても良い。当該コンピュータプログラムは、中央処理ユニット（ＣＰＵ）５０１により実行される場合に、本願の方法に限定される前記機能を実行する。

説明すべきなのは、本願のコンピュータ読取可能な媒体は、コンピュータ読取可能な信号媒体、コンピュータ読取可能な記憶媒体、或いは前記両者の任意の組み合わせであっても良い。コンピュータ読取可能な記憶媒体は、例えば電気、磁気、光、電磁気、赤外線、半導体のシステム、サーバ又は部品、或いはこれらの任意の組み合わせであっても良いが、それらに限定されない。コンピュータ読取可能な記憶媒体についてのより具体的な例は、一つ又は複数の導線を含む電気的な接続、携帯可能なコンピュータ磁気ディスク、ハードディスク、ランダムアクセスメモリ（ＲＡＭ）、読取専用メモリ（ＲＯＭ）、消去可能なプログラミング読取専用メモリ（ＥＰＲＯＭ又はフラッシュ）、光ファイバ、携帯可能なコンパクト磁気ディスク読取専用メモリ（ＣＤ−ＲＯＭ）、光学記憶素子、磁気記憶素子、或いは前記任意の適当の組み合わせを含むが、それらに限定されない。本願において、コンピュータ読取可能な記憶媒体は、プログラムを含むか記憶する任意の有形の媒体であっても良い。当該プログラムは、コマンドによりシステム、サーバ又は部品の使用を実行し、或いはそれらに組み合わせて使用されても良い。本願において、コンピュータ読取可能な信号媒体は、ベースバンドに伝送され或いはキャリアの一部として伝送され、コンピュータ読取可能なプログラムコードがロードされるデータ信号を含んでも良い。このような伝送されるデータ信号は、各種類の形式を採用しても良く、電磁気信号、光信号又は前記任意の適当の組み合わせを含むが、それらに限定されない。コンピュータ読取可能な信号媒体は、コンピュータ読取可能な記憶媒体以外の任意のコンピュータ読取可能な媒体であっても良い。当該コンピュータ読取可能な媒体は、コマンドによりシステム、サーバ又は部品の使用を実行し又はそれらと組み合わせて使用されるプログラムを送信し、伝播し又は伝送することができる。コンピュータ読取可能な媒体に含まれるプログラムコードは、任意の適当の媒体で伝送されても良く、無線、電線、光ケーブル、ＲＦなど、或いは前記任意の適当の組み合わせを含むが、それらに限定されない。

図面におけるフローチャート及びブロック図は、本願の各実施形態によるシステム、方法及びコンピュータプログラム製品により実現可能なシステム構造、機能及び操作を示した。この点において、フローチャート又はブロック図における各ブロックは、一つのモジュール、プログラムセグメント、又はコードの一部を表すことができる。当該モジュール、プログラムセグメント、コードの一部には、一つ又は複数の所定のロジック機能を実現するための実行可能なコマンドが含まれる。注意すべきなのは、幾つかの置換としての実現において、ブロックに示される機能は図面に示される順序と異なって発生されても良い。例えば、二つの接続的に表示されるブロックは実際に基本的に併行に実行されても良く、場合によっては逆な順序で実行されても良く、関連の機能に従って決定される。注意すべきなのは、ブロック図及び／又はフローチャートにおける各ブロック、及びブロック図及び／又はフローチャートにおけるブロックの組み合わせは、所定の機能又は操作を実行する専用のハードウェアによるシステムで実現されても良く、或いは専用のハードウェアとコンピュータコードの組み合わせで実現されても良い。

本願の実施形態に説明されたユニットは、ソフトウェアの手段で実現されても良く、ハードウェアの手段で実現されても良い。説明されたユニットは、プロセッサに設置されても良い。例えば、解析ユニットと、第一抽出ユニットと、取得ユニットと、生成ユニットと、確定ユニットと、第二抽出ユニットとを備えるプロセッサとして記載されても良い。なお、これらのユニットの名称は場合によってユニットの自身に対する限定とされない。例えば、解析ユニットは、「ユーザの音声情報を受信し解析して前記音声情報に対応するテキスト情報を生成するユニット」と記載されても良い。

他の局面として、本願は更にコンピュータ読取可能な媒体を提供した。当該コンピュータ読取可能な媒体は、前記実施形態に説明された装置に含まれたものであっても良く、当該装置に実装されずに別途に存在するものであっても良い。前記コンピュータ読取可能な媒体には、一つ又は複数のプログラムがロードされる。前記一つ又は複数のプログラムが当該装置により実行されると、当該装置に、ユーザの音声情報を受信し解析して前記音声情報に対応するテキスト情報を生成し、前記テキスト情報から認識待ち連絡者情報を抽出し、前記ユーザの少なくとも二つの連絡者情報が含まれる連絡帳を取得し、前記認識待ち連絡者情報に基づいて、少なくとも二つのマッチング用情報を生成し、前記少なくとも二つのマッチング用情報における各種類のマッチング用情報について、当該種類のマッチング用情報に基づいて、前記認識待ち連絡者情報と前記少なくとも二つの連絡者情報における各連絡者情報とのマッチング度を確定し、確定されたマッチング度に基づいて、前記連絡帳から前記認識待ち連絡者情報にマッチした連絡者情報を抽出するように実行させる。

以上の記載は、ただ本発明の好適な実施形態及び運用される技術原理に対する説明である。当業者であればわかるように、本発明にかかる発明範囲は、前記技術特徴の特定の組み合わせからなる技術案に限定されず、前記発明構想から逸脱されない場合に前記技術特徴又は均等の特徴による任意の組み合わせで形成される他の技術案も同時に含まれるべきである。例えば前記特徴と本発明に開示された（それらに限定されない）類似の機能を具備する技術特徴が互いに置換されて得られる技術案は該当する。

Claims

情報を抽出する方法であって、
ユーザの音声情報を受信し解析して、前記音声情報に対応するテキスト情報を生成し、
前記テキスト情報から認識待ち連絡者情報を抽出し、
前記ユーザの、少なくとも二つの連絡者情報を含む連絡帳を取得し、
前記認識待ち連絡者情報に基づいて、少なくとも二つのマッチング用情報を生成し、
前記少なくとも二つのマッチング用情報における各種類のマッチング用情報について、当該種類のマッチング用情報に基づいて、前記認識待ち連絡者情報と前記少なくとも二つの連絡者情報における各連絡者情報とのマッチング度を確定し、
確定されたマッチング度に基づいて、前記認識待ち連絡者情報にマッチした連絡者情報を前記連絡帳から抽出する、
ことを含むことを特徴とする方法。
マッチング用情報は、前記認識待ち連絡者情報に対応するピンインであり、
前記認識待ち連絡者情報に基づいて、少なくとも二つのマッチング用情報を生成することは、
前記認識待ち連絡者情報に対応する第一のピンインを確定し、
前記連絡帳における各連絡者情報について、当該連絡者情報に対応する第二のピンインを確定する、
ことを含むことを特徴とする請求項１に記載の方法。
前記少なくとも二つのマッチング用情報における各種類のマッチング用情報について、当該種類のマッチング用情報に基づいて、前記認識待ち連絡者情報と前記少なくとも二つの連絡者情報における各連絡者情報とのマッチング度を確定することは、
前記連絡帳における各連絡者情報について、前記第一のピンインと当該連絡者情報に対応する第二のピンインとを、予め作成されたピンイン類似度モデルに導入して、前記第一のピンインと当該第二のピンインとのピンイン類似度を生成し、当該ピンイン類似度を前記認識待ち連絡者情報と当該連絡者情報とのマッチング度として確定することであって、前記ピンイン類似度モデルは、第一のピンイン、第二のピンインのこの両者とピンイン類似度との対応関係を示す、ことを含むことを特徴とする請求項２に記載の方法。
前記少なくとも二つのマッチング用情報における各種類のマッチング用情報について、当該種類のマッチング用情報に基づいて、前記認識待ち連絡者情報と前記少なくとも二つの連絡者情報における各連絡者情報とのマッチング度を確定することは、
前記連絡帳における各連絡者情報について、前記第一のピンインと、当該連絡者情報に対応する第二のピンインとに基づいて、前記認識待ち連絡者情報と当該連絡者情報との編集距離を確定し、当該編集距離を前記認識待ち連絡者情報と当該連絡者情報とのマッチング度として確定することを含むことを特徴とする請求項２に記載の方法。
マッチング用情報は、前記認識待ち連絡者情報に対応する音波情報であり、
前記認識待ち連絡者情報に基づいて、少なくとも二つのマッチング用情報を生成することは、
前記認識待ち連絡者情報に対応する第一の音波情報を取得し、
前記連絡帳における各連絡者情報について、当該連絡者情報に対応する第二の音波情報を取得する、ことを含むことを特徴とする請求項１に記載の方法。
前記少なくとも二つのマッチング用情報における各種類のマッチング用情報について、当該種類のマッチング用情報に基づいて、前記認識待ち連絡者情報と前記少なくとも二つの連絡者情報における各連絡者情報とのマッチング度を確定することは、
前記連絡帳における各連絡者情報について、前記第一の音波情報と、当該連絡者情報に対応する第二の音波情報との類似度を、前記認識待ち連絡者情報と当該連絡者情報とのマッチング度として確定することを含むことを特徴とする請求項５に記載の方法。
マッチング用情報は、名前のキーワードであり、
前記認識待ち連絡者情報に基づいて、少なくとも二つのマッチング用情報を生成することは、
前記認識待ち連絡者情報から名前のキーワードを抽出することを含み、
前記少なくとも二つのマッチング用情報における各種類のマッチング用情報について、当該種類のマッチング用情報に基づいて、前記認識待ち連絡者情報と前記少なくとも二つの連絡者情報における各連絡者情報とのマッチング度を確定することは、
前記連絡帳における各連絡者情報について、前記名前のキーワードと当該連絡者情報との一致度を、前記認識待ち連絡者情報と当該連絡者情報とのマッチング度として確定することを含む、
ことを特徴とする請求項１に記載の方法。
マッチング用情報は名称のキーワードであり、
前記認識待ち連絡者情報に基づいて、少なくとも二つのマッチング用情報を生成することは、
前記認識待ち連絡者情報から名称のキーワードを抽出することを含む、
ことを特徴とする請求項１に記載の方法。
前記少なくとも二つのマッチング用情報における各種類のマッチング用情報について、当該種類のマッチング用情報に基づいて、前記認識待ち連絡者情報と前記少なくとも二つの連絡者情報における各連絡者情報とのマッチング度を確定することは、
予め生成された、同一の意味を示す名称詞同士の関連関係を示す名称詞関連関係情報を取得し、
前記名称詞関連関係情報に基づいて、前記名称のキーワードと同一の意味を示す目標名称詞を取得し、
前記連絡帳における各連絡者情報について、前記名称のキーワードと当該連絡者情報とのマッチング度及び前記目標名称詞と当該連絡者情報とのマッチング度の中で、最大のマッチング度を、前記認識待ち連絡者情報と当該連絡者情報とのマッチング度として選択する、ことを含むことを特徴とする請求項８に記載の方法。
情報を抽出する装置であって、
ユーザの音声情報を受信し解析して、前記音声情報に対応するテキスト情報を生成する解析ユニットと、
前記テキスト情報から認識待ち連絡者情報を抽出する第一抽出ユニットと、
前記ユーザの少なくとも二つの連絡者情報を含む連絡帳を取得する取得ユニットと、
前記認識待ち連絡者情報に基づいて、少なくとも二つのマッチング用情報を生成する生成ユニットと、
前記少なくとも二つのマッチング用情報における各種類のマッチング用情報について、当該種類のマッチング用情報に基づいて、前記認識待ち連絡者情報と前記少なくとも二つの連絡者情報における各連絡者情報とのマッチング度を確定する確定ユニットと、
確定されたマッチング度に基づいて、前記認識待ち連絡者情報にマッチした連絡者情報を前記連絡帳から抽出する第二抽出ユニットと、
を備えることを特徴とする装置。
一つ又は複数のプロセッサと、
一つ又は複数のプログラムを記憶する記憶装置と、を備え、
前記一つ又は複数のプログラムが前記一つ又は複数のプロセッサにより実行されると、前記一つ又は複数のプロセッサに請求項１〜９の何れか一つに記載の方法を実現させることを特徴とするデバイス。
コンピュータプログラムが記憶されており、当該プログラムがプロセッサにより実行されると、請求項１〜９の何れか一つに記載の方法を実現させるコンピュータ読取可能な記憶媒体。
プロセッサにより実行されると、請求項１〜９の何れか一つに記載の方法を実現させるコンピュータプログラム。