JP2019008771A - 情報入力方法 - Google Patents

情報入力方法 Download PDF

Info

Publication number
JP2019008771A
JP2019008771A JP2018017188A JP2018017188A JP2019008771A JP 2019008771 A JP2019008771 A JP 2019008771A JP 2018017188 A JP2018017188 A JP 2018017188A JP 2018017188 A JP2018017188 A JP 2018017188A JP 2019008771 A JP2019008771 A JP 2019008771A
Authority
JP
Japan
Prior art keywords
word
identification
phrase
pinyin
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018017188A
Other languages
English (en)
Other versions
JP6612907B2 (ja
Inventor
ファン,ミンフ
min hu Fan
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Publication of JP2019008771A publication Critical patent/JP2019008771A/ja
Application granted granted Critical
Publication of JP6612907B2 publication Critical patent/JP6612907B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting

Abstract

【課題】入力システムにユーザが入力した音声のうち、例えばユーザの新造語のなどの単語を正確に識別し、さらに入力システムの音声入力において、ユーザに正確な候補結果を提供する。【解決手段】ユーザにより入力された音声情報を受信するステップと、音声情報をサーバに送信し、サーバから送信された、音声情報に対して音声識別を実行して得た識別語句と、音声情報に対して音声識別を実行して得た識別語句を分解した単語のうち確信度が閾値より低い単語のピンインとを受信するステップと、予め設定されたシソーラスにおいてピンインに対応する単語を捜し出し、識別語句のうち確信度が閾値より低い単語を、捜し出されたピンインに対応する単語で切り替えてジョインティング語句を取得するステップと、ジョインティング語句に対応する重みと識別語句に対応する重みの比較結果に基づいて、ユーザに表示する候補結果を確定するステップとを含む。【選択図】図2

Description

本出願は、コンピュータ分野に関するものであり、具体的には、入力システム分野に関するものであり、特に、情報入力方法に関するものである。
現在、一部の入力システムにおいて、ユーザに音声入力機能を提供する。ユーザにより音声情報を入力した後、ユーザに表示する候補結果は、サーバが音声情報に対して音声識別を実行した後の通用結果である。
しかしながら、異なるユーザが使用する単語の個性化特徴を考慮していないため、ユーザにより入力した音声のうちのユーザの新造語のような単語を正確に識別することができず、さらに入力システムの音声入力において、ユーザに正確な候補結果を提供することができなくなる。
本出願は、上記背景技術部分に存在する技術問題を解決するための情報入力方法を提供する。
本出願は、情報入力方法を提供し、当該方法は、ユーザにより入力された音声情報を受信するステップと、前記音声情報をサーバに送信し、且つ、サーバから送信された、前記音声情報に対して音声識別を実行して得た識別語句とピンインとを受信するステップであって、前記ピンインは、前記識別語句を分解した単語のうち確信度が閾値より低い単語のピンインである、ステップと、予め設定されたシソーラスにおいて、前記ピンインに対応する単語を捜し出し、且つ、前記識別語句のうち前記確信度が閾値より低い単語を、捜し出された前記ピンインに対応する単語で切り替えて、ジョインティング語句を取得するステップと、前記ジョインティング語句に対応する重みと識別語句に対応する重みの比較結果に基づいて、ユーザに表示する候補結果を確定するステップと、を含む。
本出願は、情報入力方法を提供し、当該方法は、端末から送信された音声情報を受信するステップと、前記音声情報に対して音声識別を実行して識別語句を取得し、且つ、前記識別語句を分解して複数の単語を取得するステップと、前記複数の単語のうち確信度が閾値より低い単語を確定して、前記識別語句と前記確定された単語のピンインとを端末に送信するステップと、を含む。
本出願に係る情報入力方法は、ユーザにより入力された音声情報を受信し、音声情報をサーバに送信し、且つサーバから送信された、音声情報に対して音声識別を実行して得た識別語句と、前記識別語句を分解した単語のうち確信度が閾値より低い単語のピンインとを受信し、予め設定されたシソーラスにおいてピンインに対応する単語を捜し出し、且つ識別語句のうち確信度が閾値より低い単語を、捜し出されたピンインに対応する単語で切り替えてジョインティング語句を取得し、ジョインティング語句に対応する重みと識別語句に対応する重みの比較結果に基づいて、ユーザに表示する候補結果を確定することによって、ユーザが入力システムに入力した音声のうちの例えばユーザの新造語のような単語を正確に識別し、さらに入力システムの音声入力において、ユーザに正確な候補結果を提供することを実現する。
本出願の他の特徴、目的、および利点は、下記の図面を参照して行われた、非限定的の実施例に対する詳しい説明を閲読することによって、さらに明らかになる。
本出願の情報入力方法に適用可能な例示的なシステム構造を示す。 本出願に係る情報入力方法の一つの実施例のフローチャートを示す。 本出願に係る情報入力方法の別の一つの実施例のフローチャートを示す。
下記に図面と実施例を組み合わせて、本出願に対してさらに詳しく説明する。ここで説明する具体的な実施例は、関連発明を解釈するためのものだけであり、当該発明を限定するものではない、ことが理解できる。なお、説明すべきなことは、説明の便宜上、図面において該当する発明と関連する部分のみを図示する。
説明すべきなことは、矛盾しない状況で、本出願の実施例、および実施例における特徴は、互いに組み合わせることができる。以下、図面を参照し、実施例と組み合わせて本出願を詳しく説明する。
図1は、本出願の情報入力方法に適用可能な例示的なシステム構造を示す。
図1に示されたように、システム構造は、端末101、102、103、ネットワーク104、及びサーバ105を含んでもよい。ネットワーク104は、端末101、102、103とサーバ105の間で伝送リンクの媒体を提供する。ネットワーク104は、いろいろな接続種類を含んでもよく、例えば、有線、無線転送リンクまたは光ケーブルなどを含む。
ユーザは、端末101、102、103を用いて、ネットワーク104を介してサーバ105とインタラクションしてメッセージなどを送受信することができる。端末101、102、103には、例えば、入力システム類のアプリケーション、ブラウザ類のアプリケーション、検索類のアプリケーション、インスタントメッセンジャー類のアプリケーションなどのいろいろな通信アプリケーションをインストールすることができる。
端末101、102、103は、ディスプレーを有し、ネットワーク通信をサポートするいろいろな電子機器であってもよく、スマートフォン、タブレットPC、電子ブックリーダー、MP3(Moving Picture Experts Group Audio Layer III)プレーヤー、MP4(Moving Picture Experts Group Audio Layer IV)プレーヤー、ノートパソコン、及びデスクトップなどを含むが、これに限定されない。
サーバ105は、端末101、102、103上の入力システム類のアプリケーションをサポートするサーバであってもよい。サーバ105は、端末101、102、103から送信された、ユーザにより入力された音声を識別して識別語句を取得し、且つ識別語句を分解し、分解して得られた複数の単語のうち確信度が閾値より低い単語のピンインを確定し、識別語句と、確信度が閾値より低い単語のピンインとを端末101、102、103に送信することができる。端末101、102、103において実行される入力システムは、例えば、システムシソーラス、ユーザシソーラス、新造語シソーラスのようないろいろなシソーラスを含む。
図2を参照すると、本出願による情報入力方法の一つの実施例の流れを示す。説明すべきなことは、本出願の実施例に係る情報入力方法は、例えば図1の端末101、102、103のような端末により実行されることができる。当該方法は、下記のステップを含む。
ステップ201において、ユーザにより入力された音声情報を受信する。
本実施例において、音声情報は、ユーザが入力システムにおいて入力した音声であってもよい。ユーザが入力システムを利用して音声を入力するとき、入力システムを利用可能なクライアントは、ユーザにより入力された音声情報が受信される。
ステップ202において、音声情報をサーバに送信し、且つサーバから送信された識別語句とピンインを受信する。
本実施例において、ステップ201を通じてユーザにより入力された音声情報を受信した後、音声情報をサーバに送信することができる。サーバは、受信された、ユーザにより入力された音声情報に対して音声識別を実行して識別語句を取得することができる。その後、サーバは、識別語句を分解して複数の単語を取得することができる。サーバは、識別語句を分解して複数の単語を取得した後、識別語句を分解して得られた複数の単語のうち確信度が閾値より低い単語を確定することができる。
本実施例において、識別語句を分解して得られる一つの単語の確信度は、単語のうちの字の音節により構成可能な単語の数、単語と、識別語句を分解して得られる、当該単語と隣接する単語とのマッチング程度によって確定することができる。
例えば、識別語句を分解して得られる一つの単語のうちの字の音節により構成可能な単語の新しい単語の数が多いほど、すなわち音節が異なる声調を採用する場合に組み合わせて得られる新しい単語の数が多いほど、当該単語の確信度は低い。識別語句を分解して得られる一つの単語と、識別語句を分解して得られる複数の単語のうち当該単語と隣接する単語とのマッチング程度が低いほど、すなわち単語組み合わせを構成する可能性が低いほど、当該単語の確信度は低い。
サーバは、識別語句を分解し、識別語句を分解して得られた複数の単語のうち確信度が閾値より低い単語を確定した後、識別語句を分解して得られた複数の単語のうち確信度が閾値より低い単語のピンインを確定することができる。
本実施例において、サーバが、受信されたユーザにより入力された音声情報に対して音声識別を実行して、識別語句を取得し、識別語句を分解して得られた複数の単語のうち確信度が閾値より低い単語のピンインを確定した後、サーバから返信された識別語句と、識別語句を分解して得られた複数の単語のうち確信度が閾値より低い単語のピンインとを受信することができる。
ステップ203において、予め設定されたシソーラスにおいてピンインに対応する単語を捜し出し、ジョインティング語句を取得する。
本実施例において、ステップ202を通じて、サーバから返信された識別語句、及び識別語句を分解して得られた複数の単語のうち確信度が閾値より低い単語のピンインを受信した後、予め設定されたシソーラスにおいて、例えばユーザシソーラスにおいて当該確信度が閾値より低い単語のピンインに対応する単語を捜し出し、識別語句のうち確信度が閾値より低い単語を、予め設定されたシソーラスにおいて捜し出された確信度が閾値より低い単語のピンインに対応する単語で切り替えて、確信度が閾値より低い単語のピンインに対応する単語と、識別語句のうち切り替えられていない他の単語とを含むジョインティング語句を取得することができる。
本実施例の一部の選択可能な実現形態において、予め設定されたシソーラスは、新造語シソーラスを含む。サーバから返信された識別語句、及び識別語句を分解して得られた複数の単語のうち確信度が閾値より低い単語のピンインを受信した後、新造語シソーラスにおいて確信度が閾値より低い単語のピンインに対応する単語を捜し出すことができる。例えば、ユーザにより入力された音声情報に新造語が含まれている場合、サーバは、ユーザにより入力された音声情報に対して音声識別を実行して得た識別語句を分解した複数の単語のうち、当該新造語に対応する単語の確信度が閾値より低いと確定することができるため、ユーザにより入力された音声情報に対して音声識別を実行して得た識別語句を分解した当該新造語に対応する単語を、確信度が閾値より低い単語とすることができる。その後、サーバから返信された、音声情報に対して音声識別を実行して得た複数の単語のうち確信度が閾値より低い単語のピンインを受信することができるため、新造語シソーラスにおいて確信度が閾値より低い単語のピンインに対応する単語を捜し出すことができる。即ち、新造語シソーラスにおいて、ユーザにより入力された音声情報のうちの新造語を捜し出すことができる。ユーザにより入力された音声情報のうちの新造語を捜し出した後、サーバが音声情報に対して音声識別を実行して得た識別語句のうち確信度が閾値より低い単語、すなわち新造語に対応する単語を、捜し出されたピンインに対応する単語すなわち新造語で切り替えて、新造語と、識別語句のうち切り替えられていない他の単語とを含むジョインティング語句を取得することができる。
ステップ204において、ジョインティング語句に対応する重みと識別語句に対応する重みの比較結果に基づいて、ユーザに表示する候補結果を確定する。
本実施例において、ステップ203を通じて、識別語句のうち確信度が閾値より低い単語を、捜し出されたピンインに対応する単語で切り替えてジョインティング語句を取得した後、ジョインティング語句に対応する重みと識別語句に対応する重みの比較結果に基づいて、ユーザに表示する候補結果を確定することができる。
本実施例において、一つの語句に対応する重みは、下記の方式で計算することができる。語句のうちの各単語は、単語図構造における一つのノードに対応し、互いに隣接するノード同士の関連度を計算し、すなわち互いに隣接する単語同士の関連度を計算し、関連度の和を、語句に対応する重みとすることができる。
本実施例の一部の選択可能な実現方式において、ジョインティング語句に対応する重みが識別語句に対応する重みより大きい場合、ジョインティング語句を、ユーザに表示する候補結果とすることができる。即ち、ジョインティング語句を、ユーザに表示する、ユーザが端末で実行される入力システムに入力した音声の候補結果とする。ジョインティング語句に対応する重みが識別語句に対応する重みより小さい場合、識別語句を、ユーザに表示する候補結果にすることができる。即ち、識別語句を、ユーザに表示する、ユーザが端末で実行される入力システムにユーザが入力した音声の候補結果とすることができる。
例えば、ユーザにより入力された音声情報に新造語が含まれている場合、サーバは、ユーザにより入力された音声情報に対して音声識別を実行して得た識別語句を分解した、当該新造語に対応する単語の確信度が閾値より低いと確定することができるため、ユーザにより入力された音声情報に対して音声識別を実行して得た識別語句を分解した、当該新造語に対応する単語を、確信度が閾値より低い単語とすることができる。その後、サーバから返信された、音声情報に対して音声識別を実行して得た単語のうち確信度が閾値より低い単語のピンインを受信することができるため、新造語シソーラスにおいて、確信度が閾値より低い単語のピンインに対応する単語、すなわちユーザにより入力された音声情報のうちの新造語を捜し出すことができる。ユーザにより入力された音声情報のうちの新造語が捜し出された後、サーバが音声情報に対して音声識別を実行して得た識別語句のうち確信度が閾値より低い単語、すなわち新造語に対応する単語を、捜し出されたピンインに対応する単語、すなわち新造語で切り替えて、新造語と、識別語句のうち切り替えられていない他の単語とを含むジョインティング語句を取得することができる。
正確に識別された、ユーザにより入力された音声情報のうちの新造語で、識別語句のうち確信度が閾値より低い単語を切り替えたため、新造語を含むジョインティング語句に対応する重みはサーバが音声情報に対して音声識別を実行して得た識別語句に対応する重みより大きく、そのため、新造語を含むジョインティング語句を、ユーザに表示する候補結果とし、入力システムにおいて入力した音声の正確な候補結果をユーザに提供することができる。
図3を参照すると、本出願による情報入力方法の他の一つの実施例の流れを示す。説明すべきなことは、本出願の実施例に係る情報入力方法は、サーバ、例えば図1のサーバ105により実行されることができる。当該方法は、下記のステップを含む。
ステップ301において、端末から送信された音声情報を受信する。
本実施例において、ユーザが端末において音声情報を入力した後、端末から送信された音声情報を受信することができる。
本実施例の一部の選択可能な実現方式において、音声情報とは、ユーザが端末で実行される入力システムに入力した音声であってもよい。ユーザが入力システムを用いて音声を入力する場合、端末から送信された音声情報を受信することができる。
ステップ302において、音声情報に対して音声識別を実行して識別語句を取得し、且つ識別語句を分解して複数の単語を取得する。
本実施例において、ステップ301を通じて端末から送信された音声情報を受信した後、音声情報に対して音声識別を実行して識別語句を取得し、且つ識別語句を分解して複数の単語を取得することができる。
ステップ303において、複数の単語のうち確信度が閾値より低い単語を確定し、且つ識別語句と確定された単語のピンインを端末に送信する。
本実施例において、ステップ302を通じて、識別語句を分解して複数の単語を取得した後、識別語句を分解して得られた複数の単語のうち確信度が閾値より低い単語を確定し、かつ識別語句と、確定された確信度が閾値より低い単語のピンインとを端末に送信することができる。
本実施例において、識別語句を分解して得られる一つの単語の確信度は、単語のうちの字の音節により構成可能な単語の量、単語と、識別語句を分解して得られる、単語と隣接する単語とのマッチング程度によって確定することができる。
例えば、識別語句を分解して得られる一つの単語のうちの字の音節により構成可能な単語の新しい単語の量が多いほど、音節が異なる声調を採用する場合に組み合わせて得られる新しい単語の量が多いほど、当該単語の確信度は低い。識別語句を分解して得られる一つの単語と、識別語句を分解して得られる複数の単語のうち当該単語と隣接する単語とのマッチング程度が低いほど、すなわち単語組み合わせを構成する可能性が低いほど、当該単語の確信度は低い。
本実施例において、識別語句を分解し得られた複数の単語のうち確信度が閾値より低い単語を確定した後、確信度が閾値より低い単語のピンインを確定し、識別語句と確信度が閾値より低い単語のピンインとを端末に送信することができる。
端末は、識別語句と確信度が閾値より低い単語のピンインとを受信した後、予め設定されたシソーラスにおいて、確信度が閾値より低い単語のピンインに対応する単語を捜し出すことができ、識別語句のうち確信度が閾値より低い単語を、捜し出されたピンインに対応する単語で切り替えてジョインティング語句を取得する。端末は、ジョインティング語句に対応する重みと識別語句に対応する重みの比較結果に基づいて、ユーザに表示する、ユーザが端末で実行される入力システムに入力した音声の候補結果を確定することができる。
本実施例において、一つの語句に対応する重みは、下記の方式で計算することができる。語句のうちの各単語は、単語図構造における一つのノードに対応し、互いに隣接するノード同士の関連度を計算し、すなわち互いに隣接する単語同士の関連度を計算し、関連度の和を、語句に対応する重みとすることができる。
本実施例の一部の選択可能な実現方式において、端末が、識別語句を分解して得られた複数の単語のうち確信度が閾値より低い単語のピンインを受信した後、端末は、端末の予め設定されたシソーラスにおいて、確信度が閾値より低い単語のピンインに対応する単語を捜し出すことができる。その後、端末から送信された、端末の予め設定されたシソーラスにおいて捜し出された確信度が閾値より低い単語のピンインに対応する単語を受信することができ、識別語句のうち確信度が閾値より低い単語を、予め設定されたシソーラスにおいて捜し出された確信度が閾値より低い単語のピンインに対応する単語で切り替えて、ジョインティング語句を取得する。予め設定されたシソーラスは、新造語シソーラスであってもよい。ジョインティング語句に対応する重みが識別語句に対応する重みより大きい場合、ジョインティング語句を、端末に送信する語句とすることができ、そのため、端末は、ジョインティング語句を、ユーザに表示する、ユーザが端末で実行される入力システムに入力した音声の候補結果とすることができる。ジョインティング語句に対応する重みが識別語句に対応する重みより小さい場合、識別語句を、端末に送信する語句とすることができ、そのため、端末は、識別語句を、ユーザに表示する、ユーザが端末で実行される入力システムに入力した音声の候補結果とすることができる。
本出願は、端末をさらに提供し、当該端末には、一つまたは複数のプロセッサ、一つまたは複数のプログラムを記憶するためのメモリが設けられることができ、一つまたは複数のプログラムには、上記ステップ201〜204において説明された動作を実行するための命令が含まれてもよい。一つまたは複数のプログラムが一つまたは複数のプロセッサにより実行される場合、一つまたは複数のプロセッサが上記ステップ201〜204において説明された動作を実行するようにする。
本出願は、サーバをさらに提供し、当該サーバには、一つまたは複数のプロセッサ、一つまたは複数のプログラムを記憶するためのメモリが設けられることができ、一つまたは複数のプログラムには、上記ステップ301〜303において説明された動作を実行するための命令が含まれてもよい。一つまたは複数のプログラムが一つまたは複数のプロセッサにより実行される場合、一つまたは複数のプロセッサが上記ステップ301〜303において説明された動作を実行するようにする。
本出願は、コンピュータ読取り可能な非揮発性媒体をさらに提供し、当該コンピュータ読取り可能な媒体は、端末に含まれてもよく、単独に存在して端末に設けられなくてもよい。当該コンピュータ読取り可能な非揮発性媒体には、一つまたは複数のプログラムがローディングされており、一つまたは複数のプログラムが端末により実行される場合、端末が、ユーザにより入力された音声情報を受信し、音声情報をサーバに送信し、且つサーバから送信された、音声情報に対して音声識別を実行して得た識別語句と、前記識別語句を分解した単語のうち確信度が閾値より低い単語のピンインとを受信し、予め設定されたシソーラスにおいてピンインに対応する単語を捜し出し、且つ識別語句のうち確信度が閾値より低い単語を、捜し出されたピンインに対応する単語で切り替えてジョインティング語句を取得し、ジョインティング語句に対応する重みと識別語句に対応する重みの比較結果に基づいて、ユーザに表示する候補結果を確定するようにする。
本出願は、コンピュータ読取り可能な非揮発性媒体をさらに提供し、当該コンピュータ読取り可能な非揮発性媒体は、サーバに含まれてもよく、単独に存在してサーバに設けられなくてもよい。当該コンピュータ読取り可能な非揮発性媒体には、一つまたは複数のプログラムがローディングされており、一つまたは複数のプログラムがサーバにより実行される場合、サーバが、端末から送信された音声情報を受信し、音声情報に対して音声識別を実行して識別語句を取得し、且つ識別語句を分解して複数の単語を取得し、複数の単語のうち確信度が閾値より低い単語を確定し、識別語句と確定された単語のピンインとを端末に送信するようにする。
説明すべきなことは、上記コンピュータ読取り可能な非揮発性媒体は、コンピュータ読取り可能な信号媒体、またはコンピュータ読取り可能な非揮発性記憶媒体、または上記両者のいずれの組み合わせであってもよい。コンピュータ読取り可能な記憶媒体は、例えば、電気、磁気、光、電磁気、赤外線または半導体のシステム、装置または素子、または上記媒体のいずれの組み合わせを含んでもいいが、これに限定されない。コンピュータ読取り可能な非揮発性記憶媒体のより具体的な例は、一つまたは複数の導線を有する電気的接続、携帯式コンピュータディスク、ハードディスク、RAM、ROM、EPROMまたはフラッシュメモリ、光ファイバー、携帯式コンパクト磁気ディスクローム(CD−ROM)、光記憶素子、磁気記憶素子または上記メモリのいずれの適切な組み合わせを含んでもいいが、これに限定されない。本出願において、コンピュータ読取り可能な非揮発性記憶媒体は、プログラムを含むか記憶するいずれかの種類の媒体であってもよく、当該プログラムは、命令実行システム、装置または素子により使用されるか、またはそれと組み合わせて使用されることができる。一方、本出願において、コンピュータ読取り可能な信号媒体は、ベースバンドまたはキャリアの一部として伝播されるデータ信号に含まれてもよく、その中には、コンピュータ読取り可能なプログラムコードがローディングされている。このように伝播されるデータ信号は、いろいろな形を採用することができ、電磁気信号、光信号または上記信号のいずれの適切な組み合わせを含むが、これに限定されない。コンピュータ読取り可能な信号媒体は、さらにコンピュータ読取り可能な非揮発性記憶媒体以外のコンピュータ読取り可能ないずれかの非揮発性媒体であってもよく、当該コンピュータ読取り可能な媒体は、命令実行システム、装置または素子により使用されるかまたはそれと組み合わせて使用されるプログラムを送信、伝播または伝送することができる。コンピュータ読取り可能な媒体に含まれるプログラムコードは、いずれかの適切な媒体で伝送することができ、無線、電気線、光ケーブル、RFなど、または上記媒体のいずれかの適切な組み合わせを含むが、これに限定されない。
以上の説明は、本出願の比較的好ましい実施例、及び応用する技術原理に対する説明だけである。当業者は、本出願の発明の範囲が上記技術的特徴の特定の組み合わせからなる技術案に限定されないとともに、上記発明の趣旨を離脱しない状況で、上記技術的特徴または均等特徴を任意に組み合わせて形成される他の技術案も含むべきである、ということを理解すべきである。例えば、上記特徴と本出願において開示された(しかし、これに限定されない)類似な機能を有する技術的特徴を互いに切り替えて形成される技術案を含むべきである。

Claims (10)

  1. ユーザにより入力された音声情報を受信するステップと、
    前記音声情報をサーバに送信し、且つ、サーバから送信された、前記音声情報に対して音声識別を実行して得た識別語句とピンインとを受信するステップであって、前記ピンインは、前記識別語句を分解した単語のうち確信度が閾値より低い単語のピンインである、ステップと、
    予め設定されたシソーラスにおいて、前記ピンインに対応する単語を捜し出し、且つ、前記識別語句のうち前記確信度が閾値より低い単語を、捜し出された前記ピンインに対応する単語で切り替えて、ジョインティング語句を取得するステップと、
    前記ジョインティング語句に対応する重みと識別語句に対応する重みの比較結果に基づいて、ユーザに表示する候補結果を確定するステップと、
    を含むことを特徴とする情報入力方法。
  2. 前記ジョインティング語句に対応する重みと識別語句に対応する重みの比較結果に基づいて、ユーザに表示する候補結果を確定するステップは、
    前記ジョインティング語句に対応する重みが識別語句に対応する重みより大きい場合、前記ジョインティング語句を、ユーザに表示する候補結果とするステップと、
    前記ジョインティング語句に対応する重みが識別語句に対応する重みより小さい場合、前記識別語句を、ユーザに表示する候補結果とするステップと、
    を含むことを特徴とする請求項1に記載の情報入力方法。
  3. 予め設定されたシソーラスは、新造語シソーラスを含むことを特徴とする請求項2に記載の情報入力方法。
  4. 端末から送信された音声情報を受信するステップと、
    前記音声情報に対して音声識別を実行して識別語句を取得し、且つ、前記識別語句を分解して複数の単語を取得するステップと、
    前記複数の単語のうち確信度が閾値より低い単語を確定して、前記識別語句と前記確定された単語のピンインとを端末に送信するステップと、
    を含むことを特徴とする情報入力方法。
  5. 端末から送信された、新造語シソーラスを含む予め設定されたシソーラスにおいて捜し出された、前記ピンインに対応する単語を受信し、且つ、識別語句のうち確信度が閾値より低い単語を前記ピンインに対応する単語で切り替えてジョインティング語句を取得するステップと、
    前記ジョインティング語句に対応する重みが識別語句に対応する重みより大きい場合、前記ジョインティング語句を端末に送信するステップと、
    前記ジョインティング語句に対応する重みが識別語句に対応する重みより小さい場合、前記識別語句を端末に送信するステップと、
    をさらに含むことを特徴とする請求項4に記載の情報入力方法。
  6. 音声情報とは、ユーザが端末で実行される入力システムに入力した音声であることを特徴とする請求項5に記載の情報入力方法。
  7. 一つまたは複数のプロセッサと、
    一つまたは複数のプログラムを記憶するためのメモリと、を含む端末であって、
    前記一つまたは複数のプログラムが前記一つまたは複数のプロセッサにより実行される場合、前記一つまたは複数のプロセッサが請求項1乃至3のいずれか一項に記載の方法を実現するようにすることを特徴とする端末。
  8. 一つまたは複数のプロセッサと、
    一つまたは複数のプログラムを記憶するためのメモリと、を含むサーバであって、
    前記一つまたは複数のプログラムが前記一つまたは複数のプロセッサにより実行される場合、前記一つまたは複数のプロセッサが請求項4乃至6のいずれか一項に記載の方法を実現するようにすることを特徴とするサーバ。
  9. コンピュータプログラムが記憶されているコンピュータ読取り可能な記憶媒体であって、
    当該プログラムがプロセッサにより実行される場合、請求項1乃至3のいずれか一項に記載の方法を実現することを特徴とするコンピュータ読取り可能な記憶媒体。
  10. コンピュータプログラムが記憶されているコンピュータ読取り可能な記憶媒体であって、
    当該プログラムがプロセッサにより実行される場合、請求項4乃至6のいずれか一項に記載の方法を実現することを特徴とするコンピュータ読取り可能な記憶媒体。
JP2018017188A 2017-06-23 2018-02-02 情報入力方法 Active JP6612907B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201710486956.0A CN107301866B (zh) 2017-06-23 2017-06-23 信息输入方法
CN201710486956.0 2017-06-23

Publications (2)

Publication Number Publication Date
JP2019008771A true JP2019008771A (ja) 2019-01-17
JP6612907B2 JP6612907B2 (ja) 2019-11-27

Family

ID=60135972

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018017188A Active JP6612907B2 (ja) 2017-06-23 2018-02-02 情報入力方法

Country Status (3)

Country Link
JP (1) JP6612907B2 (ja)
KR (1) KR102046486B1 (ja)
CN (1) CN107301866B (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113506584A (zh) * 2021-07-06 2021-10-15 腾讯音乐娱乐科技(深圳)有限公司 数据处理方法以及设备
CN113506584B (zh) * 2021-07-06 2024-05-14 腾讯音乐娱乐科技(深圳)有限公司 数据处理方法以及设备

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108509416B (zh) * 2018-03-20 2022-10-11 京东方科技集团股份有限公司 句意识别方法及装置、设备和存储介质
CN109062891B (zh) * 2018-07-09 2022-07-26 重庆邂智科技有限公司 媒体处理方法、装置、终端和介质
CN110619879A (zh) * 2019-08-29 2019-12-27 深圳市梦网科技发展有限公司 一种语音识别的方法及装置
CN110767234B (zh) * 2019-10-31 2022-12-23 抖音视界有限公司 音频信息处理方法、装置、电子设备及存储介质
CN111160014B (zh) * 2019-12-03 2023-05-16 北京博瑞彤芸科技股份有限公司 一种智能分词方法
CN111192586B (zh) * 2020-01-08 2023-07-04 北京小米松果电子有限公司 语音识别方法及装置、电子设备、存储介质
CN112259182B (zh) * 2020-11-05 2023-08-11 中国联合网络通信集团有限公司 一种电子病历的生成方法和装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012063526A (ja) * 2010-09-15 2012-03-29 Ntt Docomo Inc 端末装置、音声認識方法および音声認識プログラム
JP2014145842A (ja) * 2013-01-28 2014-08-14 Fujitsu Ltd 発話解析装置、音声対話制御装置、方法、及びプログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101513615B1 (ko) 2008-06-12 2015-04-20 엘지전자 주식회사 이동 단말기 및 그 음성 인식 방법
CN102867512A (zh) * 2011-07-04 2013-01-09 余喆 自然语音识别方法和装置
CN105302795B (zh) * 2015-11-11 2018-03-20 河海大学 基于汉语模糊发音和语音识别的中文文本校验系统及方法
CN106598939B (zh) * 2016-10-21 2019-09-17 北京三快在线科技有限公司 一种文本纠错方法及装置、服务器、存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012063526A (ja) * 2010-09-15 2012-03-29 Ntt Docomo Inc 端末装置、音声認識方法および音声認識プログラム
JP2014145842A (ja) * 2013-01-28 2014-08-14 Fujitsu Ltd 発話解析装置、音声対話制御装置、方法、及びプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113506584A (zh) * 2021-07-06 2021-10-15 腾讯音乐娱乐科技(深圳)有限公司 数据处理方法以及设备
CN113506584B (zh) * 2021-07-06 2024-05-14 腾讯音乐娱乐科技(深圳)有限公司 数据处理方法以及设备

Also Published As

Publication number Publication date
JP6612907B2 (ja) 2019-11-27
KR20190000776A (ko) 2019-01-03
CN107301866B (zh) 2021-01-05
CN107301866A (zh) 2017-10-27
KR102046486B1 (ko) 2019-11-19

Similar Documents

Publication Publication Date Title
JP6612907B2 (ja) 情報入力方法
KR102490776B1 (ko) 디지털 개인 비서 내에서 헤드리스로 작업을 완료하기 위한 기법
US20190081914A1 (en) Method and apparatus for generating candidate reply message
CN107731229B (zh) 用于识别语音的方法和装置
CN111428010B (zh) 人机智能问答的方法和装置
US10860289B2 (en) Flexible voice-based information retrieval system for virtual assistant
US10754885B2 (en) System and method for visually searching and debugging conversational agents of electronic devices
US10956480B2 (en) System and method for generating dialogue graphs
CN109858045B (zh) 机器翻译方法和装置
CN109829164B (zh) 用于生成文本的方法和装置
CN111428042A (zh) 对话服务中的实体级澄清
KR20200084260A (ko) 전자 장치 및 이의 제어 방법
CN112509562A (zh) 用于文本后处理的方法、装置、电子设备和介质
CN104714942A (zh) 用于针对自然语言处理任务的内容可用性的方法和系统
JP2023550211A (ja) テキストを生成するための方法および装置
CN110232920B (zh) 语音处理方法和装置
CN112182255A (zh) 用于存储媒体文件和用于检索媒体文件的方法和装置
CN111026849B (zh) 数据处理方法和装置
CN110223694B (zh) 语音处理方法、系统和装置
JP2021108095A (ja) スピーチ理解における解析異常の情報を出力するための方法
CN109949806B (zh) 信息交互方法和装置
CN113053392B (zh) 语音识别方法、语音识别装置、电子设备及介质
WO2021098876A1 (zh) 一种基于知识图谱的问答方法及装置
KR20220127935A (ko) 정보 상호작용을 위한 방법 및 장치
CN112148847A (zh) 一种语音信息的处理方法及装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180205

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190301

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190524

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191004

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191031

R150 Certificate of patent or registration of utility model

Ref document number: 6612907

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250