JP2019185737A - 検索方法及びそれを用いた電子機器 - Google Patents

検索方法及びそれを用いた電子機器 Download PDF

Info

Publication number
JP2019185737A
JP2019185737A JP2019005952A JP2019005952A JP2019185737A JP 2019185737 A JP2019185737 A JP 2019185737A JP 2019005952 A JP2019005952 A JP 2019005952A JP 2019005952 A JP2019005952 A JP 2019005952A JP 2019185737 A JP2019185737 A JP 2019185737A
Authority
JP
Japan
Prior art keywords
string
keyword
input
character string
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019005952A
Other languages
English (en)
Other versions
JP6625772B2 (ja
Inventor
洪文彬
Wen Bin Hong
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pegatron Corp
Original Assignee
Pegatron Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pegatron Corp filed Critical Pegatron Corp
Publication of JP2019185737A publication Critical patent/JP2019185737A/ja
Application granted granted Critical
Publication of JP6625772B2 publication Critical patent/JP6625772B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/243Natural language query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2452Query translation
    • G06F16/24526Internal representations for queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3343Query execution using phonetics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90332Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

【課題】自然言語処理の効果をハードウェア機能の低いローエンド製品に提供できる検索方法及びそれを用いた電子機器を提供する。【解決手段】検索方法は、電子機器でネットワークを通じて検索するために応用されるものであり、入力文字列を受け取るステップと、入力文字列が電子機器に保存されているデフォルト規則に対応しているかどうかを判断するステップと、対応している場合、デフォルト規則に基づいて入力文字列を少なくとも第1キーワード文字列及び第2キーワード文字列に解析するステップと、第1キーワード文字列に関連付けられるデフォルト条件に従い、ネットワークを通じて第2キーワード文字列のネットワーク検索を起動させるステップと、を含む。電子機器は、デフォルト規則を保存又は読み取るための規則モジュールと、ネットワークを通じて検索する検索システムと、を含み。【選択図】図2

Description

本発明は、検索方法及び該方法を用いた電子機器に関し、特に、字句内の意味を自動的に理解すると共にネットワークを通じて対応相対検索動作できる検索方法及びそれを用いた電子機器に関する。
科学技術として、人工知能技術の使用に益々多く用いられ、各種製品のメーカも如何にして自然言語処理技術をハードウェア機能の低いローエンド製品に加えるかを考慮し始め、その研究開発方向性も如何にしてハードウェア機能の低いローエンド製品に対し自然言語処理技術を提供できるかという方向に徐々に向かっている。
人工知能分野において、各々コンピュータビジョン(Computer Vision)及び自然言語処理(Natural Language Processing)という少なくとも2大研究分野がある。自然言語処理において、関係する従来の方法には命令型及び機器学習の2つがある。
ユーザーの意図解析は、容易でなく、小規模のソフトウェア或いはアプリが命令型の手段を使用する。ユーザーは、サポートするソフトウェア或いは機器に命令を正しく話(或いは出力)すことで、ソフトウェア或いは機器の機能を実行させることができる。ソフトウェア或いは機器は、ユーザーから話しかけられた字句がサポートしている命令のうちのいずれか1つにマッチしたかどうかを判断するだけで、マッチすることで対応の機能を実行する。ただし、ソフトウェア或いは機器は、マッチした命令のみを識別してから、機能を実行させることができ、ユーザーが自然に話す(入力する)方法でコマンドを発することができない。自然に話す(入力する)方式とは、ユーザーが非常に多くの”連体詞”の字句を使用することをいい、例えば「できるの」、「あるの」、「あの」、「この」等である。”連体詞”が字句にあると、ソフトウェア或いは機器が本来サポートしている命令にマッチしないため、命令型の発話(入力)方式になると自然言語処理を実現できない。また、ユーザーの字句に情報が含まれており、例えば:「(テレビ)35チャンネルを見たい」、「クーラーを15度に調整して」、「xxxの歌が聞きたい」がある。命令型の入力は、ユーザーの字句内から情報を捕捉することができず、またユーザーの全ての情報をサポートしている命令としてリストアップすることは不可能なことである。
機械学習面において、現在最もホットな話題は、深層学習(Deep−Learning)に関する技術である。そのプログラムは、人間の神経細胞をシミュレーションし、ニューラルネットワークを構築することで、学習の機能をシミュレーションする。ニューラルネットワークにより自然言語処理後のモデルを学習し、人間が自然に話す方式で出されたデマンド或いは質問を効果的に理解して、対応する機能を実行できる。
ニューラルネットワーク学習後のモデルは、ユーザーの語意を理解できるが、ニューラルネットワークモデルの訓練コストが非常に高い。1つのニューラルネットワークにチャットボット(Chatbot)の機能を持たせるまで訓練する場合、まず全ての使用する単語(1万以上の単語がある)を収集し、単語ベクトル(Word Vector)として訓練する必要がある。更に再帰型ニューラルネットワーク(recurrent neural network)ユニット或いは類似変形のユニット(例:長短期記憶(Long Short−Term Memory、LSTM)、GRUユニット(Gated Recurrent Units、GRUs))を介して多層ネットワーク(大脳の記憶力をシミュレーションできる)に集結させ、1つの使用可能なチャットボット(ChatBot)の訓練は数日から1週間の期間を費やすかもしれない。かつ使用する中央処理装置(Central Processing Unit、CPU)或いは演算を支援するグラフィックス プロセッシング ユニット(Graphics Processing Unit、GPU)が、高規格の場合においてのみ、達成できる。これは、エンドユーザー(End−user)の手にある機器の性能にとって、ニューラルネットワークの訓練実現には非常に大きな困難度がある。よって、一般的に、ニューラルネットワークの自然言語処理は、通常クラウド上のサービスに使用され、ビッグデータを擁する会社(例:Google、Amazon、Microsoft)等だけがこのよう規模維持を有する能力があり、従って人工知能技術を使用した装置を提供する能力がある。
本発明の一目的は、自然言語処理の効果をハードウェア機能の低いローエンド製品に提供できる検索方法を提供することである。
本発明の他の目的は、エンドユーザーが電子機器にローカルの自然言語処理機能を実現できる電子機器を提供することである。
本発明の検索方法は、電子機器でネットワークを通じて検索するために応用されるものであり、入力文字列を受け取るステップと、入力文字列が電子機器に保存されているデフォルト規則に対応しているかどうかを判断するステップと、対応している場合、デフォルト規則に基づいて入力文字列を少なくとも第1キーワード文字列及び第2キーワード文字列に解析するステップと、第1キーワード文字列に関連付けられるデフォルト条件に従い、ネットワークを通じて第2キーワード文字列のネットワーク検索を起動させるステップと、を含む。
本発明の電子機器は、デフォルト規則を保存又は読み取るための規則モジュールと、ネットワークを通じて検索する検索システムと、を含み、検索システムが入力文字列を受け取るための情報入力レシーバーと、情報入力レシーバーとカップリングし、入力文字列がデフォルト規則に対応するかどうかを判断し、デフォルト規則に基づいて前記入力文字列を解析すると共にデフォルト条件に基づきネットワークを通じて少なくとも1つの文字列のネットワーク検索を起動させるための情報プロセッサと、を含む。
本発明の一実施例に係る検索システムを示す模式図である。 本発明の検索方法のフローチャートである。 異なる入力字句の処理の実施例を示す図である。 異なる入力字句の処理の実施例を示す図である。 異なる入力字句の処理の実施例を示す図である。
本発明は、上記状況について1つの軽量型の自然言語解析システムを設計し、エンドユーザーの電子機器においてローカルの自然言語解析を実行させることができ、例えばスマートスピーカー(Smart−Speaker)、チャットボット(Chatbot)等の自然言語処理を必要とするアプリケーションプログラムのために比較的簡単なソリューションを提供できる。電子機器は、スマートスピーカー、タブレットコンピュータ、ノートパソコン、デスクトップコンピュータ、スマートフォン、携帯情報端末、電子書籍、デジタル写真立て、デジタルオーディオプレーヤー、電子辞書、グローバル・ポジショニング・システム等が挙げられる。
図1は、本発明の一実施例を示す模式図である。図1に示すように、本発明の電子機器800は、デフォルト規則を保存するための規則モジュール300と、ネットワークを通じて検索するための検索システム100とを含む。検索システム100は、入力文字列を受け取るための情報入力レシーバー200と、情報入力レシーバー200とカップリングする情報プロセッサ150とを含む。本実施例において、情報入力レシーバー200は、ユーザーの入力文字列SIを受け取ると共に対応の入力信号を生成する。例えば、情報入力レシーバー200は、音声センサー(例えばデジタルマイク)の場合、情報入力レシーバー200がユーザーの音声を感知すると共に対応の入力信号を生成できる。しかしながら、情報入力レシーバー200は、音声メッセージを感知或いは受け取るだけではない。具体的に、その他の異なる実施例において、情報入力レシーバー200も文字メッセージを感知或いは受け取ることができ、例えば情報入力レシーバー200は、文字で入力された文字列を受け取るキーボード又は画像認識装置とすることができる。更に、ユーザーの入力文字列SIは、音声或いは文字を含み、情報入力レシーバー200が対応するレシーバーとすることができる。
本実施例において、情報入力レシーバー200及び情報プロセッサ150が同一の物理的な装置内に形成されることができ、例えば1つのスマートスピーカー内に形成され、スマートスピーカーが電子機器800であり、情報入力レシーバー200が内蔵マイクであるが、これに限定されない。その他の異なる実施例において、情報入力レシーバー200及び情報プロセッサ150は、各々異なる物理的な装置内に位置することができ、かつ互いに信号が接続する。例えば、情報入力レシーバー200は、電子機器800とするスマートフォンに接続する外付けマイクとすることができ、ユーザーの音声指示又はコマンドを受信できる。この場合において、情報入力レシーバー200は、情報プロセッサ150と信号接続又は電気的な接続をし、かつ情報プロセッサ150が前記信号又は電気的な接続を通じて情報入力レシーバー200から入力文字列SIに対応して生成した情報信号を受信できる。
本実施例において、情報プロセッサ150は、コンピュータプロセッサ或いはマイクロプロセッサとすることができる。その他の異なる実施例において、情報プロセッサ150も集積回路或いは組込み電路とすることができる。例えば電子機器800は、スマートフォンの態様で実施する場合、情報プロセッサ150が前記スマートフォン内の集積回路又はマイクロプロセッサとすることができ、例えばクアルコム社製或いはARMホールディングス社製マイクロプロセッサである。
規則モジュール300は、1つ以上のデフォルト設定又はコンフィギュレーション設定のデフォルト規則を保存或いは読み取ることができる。これらデフォルト設定又はコンフィギュレーション設定は、検索システム100が如何にして受信した入力信号を処理するか、及び入力信号に対しどのようなアクションを取るかを定義するために用いられる。一実施例において、規則モジュール300は、電子機器800内の1つのデータ記憶装置とすることができ、例えばデータベース或いはメモリであり、デフォルト規則を保存すために用いられる。しかしながら、その他の異なる実施例において、規則モジュール300が電子機器800内の1つのデータ読取装置とすることができ、1つのクラウドストレージスペース或いはその他の関連のリモートストレージデバイスに保存されているデフォルト規則を読み取るために用いられる。
本実施例において、情報プロセッサ150は、検索システム100が指定され、ネットワーク検索を通じて少なくとも1つの検索対象となる装置を起動及び/或いは駆動するために用いられる。例えば検索システム100は、ネットワーク上のYoutubeサービスプラットフォームに対しあるキーワード文字列を検索するよう指定する場合、情報プロセッサ150がYoutubeに関連付けられるコンピュータ或いはサービスコンポーネントを起動してコマンド出力Aを進めて前記キーワード文字列のネットワーク検索を完了させる。
図2は、電子機器800に使用できる検索方法の一実施例のフローチャートである。図2に示すように、本発明の検索方法は、ステップS100乃至S130を含み、以下の通り更に詳細に説明する。
ステップS100は、入力文字列を受け取ることを含む。具体的に、本実施例において、検索システム100の情報入力レシーバー200が入力文字列SIを受け取ることができる。例えば情報入力レシーバー200が音又は音声センサの場合、情報入力レシーバー200が受け取った入力文字列SIは、検出したユーザーの音声入力文字列とすることができるが、これに限定されない。その他の異なる実施例において、入力文字列SIが文字入力の文字列とすることができ、例えばユーザーの発話文字列である。例えば、検索システム100がチャットボット(Chatbot)内に応用されている場合、ユーザーはチャットボットに対し文字列のコマンド、例えば「ロックバンドメイデイの曲名であるテンダーネスを再生してちょうだい」等の文字列コマンドを発することができる。
ステップS110は、前記入力文字列は規則モジュール300が保存或いは読み取ることができるデフォルト規則に対応しているかを判断することを含む。デフォルト規則の大まかな構造は、次のようになる。
<REGX name=”grammer”expr=”specified characteristics”>
<call name=”grammer_next_levell”>!arg2$</call>
<call name=”grammer_next_level2”>!arg3$</call>
<call name=”TextToVoice”>machine−speaking</call>
</REGX>
上記規則構造において、
「name = “grammer”」は、構文名を指定し、この名前である “grammer”がこの“<REGX>… </REGX>”カッコ内の一組の規則の名をいう。
「expr = “specified characteristics”」は、本発明の自然言語処理エンジンがどのような特徴でユーザー発話内のキーワード文字列を探すのかを指定する。
「<call name= “grammer_next_level1”>!arg2$</call>」内の!arg2$は、本発明の自然言語処理エンジンが指定された上記特徴(expr=“…)に従い入力文字列SIの字句の文字列を分割した後、特徴文字列の前の文字列(すなわち、前置詞句)であることを指す。次の層の「“grammer_next_level1”」は、分割後の前置詞文字列を継続して分析できる。
「<call name= “grammer_next_level2”>!arg3$</call>」内の!arg3$は、本発明の自然言語処理エンジンが指定された上記特徴(expr=“…)に従い入力文字列SIの字句文字列を分割した後、特徴文字列後の後ろの文字列(すなわち、後置詞句)であることを指す。
「<call name=“TextToVoice”>machine−speaking</call>」:本発明の自然言語処理エンジンは、 “TextToVoice”という構文名を見た時、後ろの文字列“machine−speaking”をシステムのText−To−Speech (TTS)の合成音声機能でユーザーに応答する。
本実施例において、検索システム100がステップS110を実行した時、情報プロセッサ150は、情報入力レシーバー200から入力文字列SIに関連付けられる情報信号を受信することができる。本実施例において、情報入力レシーバー200は、入力文字列SIを対応する字句文字列に変換すると共に情報信号を情報プロセッサ150に伝送する。この場合、情報プロセッサ150が、この字句文字列を規則モジュール300が保存又は読み取った一組以上のデフォルト規則と比較して判断し、かつ字句文字列内に某組のデフォルト規則内で指定された特徴(expr=“…)を含み、或いは任意の一組のデフォルト規則の特徴にマッチングしなかった時、情報プロセッサ150がマッチング結果に基づいて該判断結果が生成される。
例えば、規則モジュール300内のデフォルト規則が、次の通りとする。
<REGX name=“play_song_by_searching_Youtube_English” expr=“(some)? Song(s)? of”>
<call name=“search_Youtue_by_Keyword”>!arg3$</call>
</REGX>
図3の実施例を例にすると、仮に入力文字列SIの字句文字列は、「give me some song of bonjovi thank you」の場合、上記ステップS110によれば、情報プロセッサ150が先にこの字句文字列を上記デフォルト規則と比較して判断し、かつ判断過程において、この字句文字列内に規則内で指定された「some song of」の特徴があることを発見し、すなわち、字句文字列がデフォルト規則に対応する。
ステップS120は、デフォルト規則に基づき該入力文字列の少なくとも第1キーワード文字列及び第2キーワード文字列を解析することを含む。具体的に、比較結果において入力文字列SIの字句文字列が一組の規則に対応することを示している時、情報プロセッサ150は該組の規則で指定した条件により字句文字列を解析する。上記図3の実施例を例にすると、情報プロセッサ150は、字句文字列を解析し、字句文字列内の特徴キーワード文字列が第1キーワード文字列(すなわち、第1キーワード文字列が「some song of」)であると定義する。次に、情報プロセッサ150が字句文字列内の第1キーワード文字列の前にある文字列を前置詞句(「give me」)として解析し、並びに字句文字列の第1キーワード文字列の後にある文字列を後置詞句(「bonjovi thank you」)として開設する。この実施例において、上記マッチングした該組規則は、!arg3$のタグを使用したため、後置詞句の「bonjovi thank you」が第2キーワード文字列として設定される。
一実施例において、ステップS120を実行した後、情報プロセッサ150は、第2キーワード文字列に対し1つのフィルタリングステップを実行できる。例えば、図3の実施例で言うと、情報プロセッサ150は、あらかじめ設定されるフィルタ条件に基づき、第2キーワード文字列内の冗語を除去できる。例えば、「thank you」、「ok」、「all right」が冗語と定義され、情報プロセッサ150は第2キーワード文字列内の「thank you」を除去できる。言い換えると、第2キーワード文字列は最終的に「bonjovi」と設定される。
ステップS130は、第1キーワード文字列に関連付けられるデフォルト条件により、ネットワークを通じて第2キーワード文字列のネットワーク検索を起動させることを含む。デフォルト条件は、使用するメディアプラットフォーム及び検索エンジンを含む。具体的に、同様に上記図3の実施例を例にすると、検索システム100の情報プロセッサ150は、デフォルト条件によりネットワークを通じて第2キーワード文字列のネットワーク検索タスクを起動する。本実施例において、情報プロセッサ150は、1個以上の異なるコンピュータ或いはプログラムのコンポーネントを含むことができ、各種異なるメディアプラットフォーム、検索エンジン、音楽/画像プラットフォームとコミュニケーションを図る。本実施例において、第1キーワード文字列「some song of」は、呼び出しプログラムコード“search_Youtube_by_Keyword”と関連付ける。情報プロセッサ150が第2キーワード文字列を得た後、デフォルト規則内の上記呼び出しプログラムコードの名前に従い、情報プロセッサ150は、第2キーワード文字列文字列?「bonjovi」をそれらプログラムコンポーネントのうちのいずれかのYoutubeに関連付けられるプログラムコンポーネントに伝送して、第2キーワード文字列「bonjovi」を検索する。言い換えると、前記Youtubeに関連付けられるプログラムコンポーネントは、情報プロセッサ150を起動し、かつ情報プロセッサ150が駆動されることで、Youtubeプラットフォームにリンクし、また「bonjovi」の第2キーワード文字列に基づいてYoutubeプラットフォームで検索する。一実施例において、検索しない場合、モバイルデバイスは1つのコマンドの送信を介して情報入力レシーバーに入力文字列を再度受け取らせ、すなわち、ステップS100に戻る。
一実施例において、デフォルト規則は、少なくとも1つの動詞キーワードを含み、情報プロセッサ150がこの少なくとも1つの動詞キーワードに基づいて、字句を前置詞句、第1キーワード文字列及び後置詞句として解析する。情報プロセッサ150は、入力文字列に動詞キーワードがあると判断すると、入力文字列がデフォルト規則に対応する。図3に示す実施例において、動詞キーワードが「give」であり、情報プロセッサ150は字句文字列を前置詞句が「me」、第1キーワード文字列が「some song of」及び後置詞句が「bonjovi thank you」として解析する。一実施例において、本発明の検索方法は、更に第1キーワード文字列と前置詞句、後置詞句の前後順序を判断し、またその判断に基づいて動詞順序結果を生成することを含む。更に情報プロセッサ150は、入力文字列及び動詞キーワードに基づき、動詞順序結果を生成する。
一実施例において、デフォルト規則は、言語設定を有する。言語設定は、更に第1キーワード文字列、前置詞句及び後置詞句の順序に関連付けられる。判断ステップは、動詞順序結果及び言語設定に基づき、第2キーワード文字列を前置詞句或いは後置詞句に設定することを更に含む。情報プロセッサ150は、動詞順序結果及び言語設定に基づきネットワークを通じて検索する文字列を取得する。具体的に、図4は他の実施例を示す模式図であり、図3の実施例に比べると、本実施例において、検索システム100がマッチングしたデフォルト規則では中国語で検索することを指定し、すなわち、中国語設定を有する。例えばユーザーの字句が
Figure 2019185737
である場合、情報プロセッサ150は規則モジュール300内でマッチングした一組のデフォルト規則は、おおよそ次の通りである。
<REGX name=“play_song_by_searching_Youtube_Chinese” expr=“(點播|播放|想(要)?聽|来)((一)(首|手|點))?”>
<call name=“search_Youtue_by_Keyword”>!arg3$</call>
</REGX>
この場合において、「Youtube_Chinese」に基づき、この組のデフォルト規則の言語を「中国語」と設定し、かつその関連する字句特徴も中国語の文字列とする。本実施例において、デフォルト規則内で指定される特徴(expr= “…)は、「點播」、「播放」、「想」、「想要」、「聽」及び「来」に関わる先頭文字列に「一」字及び「首」、「手」或いは「点」の末尾文字列を加える。例えば、「點播一首」は、先頭文字列の「點播」に「一」字及び末尾文字列の「首」を加える。第1キーワード文字列の「點播一首」に基づき、情報プロセッサ150は、字句
Figure 2019185737
内の第1キーワード文字列の「點播一首」と後置詞句の「五月天的温柔」との組み合わせ(すなわち、前置詞句なし)と判断し、かつデフォルト規則が!arg3$のタグを使用したため、情報プロセッサ150は、後置詞句の「五月天的温柔」を第2キーワード文字列と設定する。更に例えば
Figure 2019185737
等の連体詞を除去し、情報プロセッサ150がネットワークを通じて後続の第2キーワード文字列のネットワーク検索を起動する。情報プロセッサ150は、動詞キーワードに対応するデフォルト条件に基づき、ネットワークを通じて文字列のネットワーク検索を起動させる。デフォルト条件には、使用するメディアプラットフォーム及び検索エンジンを含む。
図5は、他の実施例を示す模式図である。図5に示すように、本発明の検索システム100は、日本語の字句にも応用できる。具体的に、例えばデフォルト規則は、次の通りの場合、
<REGX name=“play_song_by_searching_Youtube_Japanese” expr=“の(歌|曲)(を)?”>
<call name=“search_Youtue_by_Keyword”>!arg2$</call>
</REGX>
情報プロセッサ150は、デフォルト規則内の言語設定が「日本語」であることを検出し、かつ使用する!arg2$が第1キーワード文字列の「の歌|曲を」の前置詞句である「安室奈美恵」を第2キーワード文字列と設定することを指定する。この場合において、情報プロセッサ150は、ネットワークを通じて「安室奈美恵」の第2キーワード文字列の後続ネットワーク検索を起動させる。
本発明の検索システム及び方法を介して、本発明はユーザーの使用習慣の変更或いは流行の専門語の変更に迎合でき、かつ多言語サポート及び速やかにカスタマイズさせることができ、各種異なる電子製品に応用させることもできる。かつ本発明のデフォルト規則のメカニズム及び構造は、現時点のプログラム言語(例如C、C++、C#、Java(登録商標)等)よりハイエンドな記述言語であり、自然言語処理(Natural Language Processing)の設計がソフトウェアエンジニアでなくとも、仕事に上手く当たることができる。特に、一般営業員は通常各種言語の専門家(英語、日本語、韓国語等)であり、営業員がソフトウェアエンジニアではない場合、プログラム言語で自然言語処理を設計できない。構文がよりハイエンドかつ簡潔な本願発明の自然言語処理のデフォルト規則構造設計を通じて、営業部署も自然言語処理の業務に取り組むことができる。
具体的実施形態の以上で述べたのは、全面的に本明細書に記載される実施形態の一般性質を開示し、現在掌握している知識を運用した後、本発明の実施形態は本発明の精神と領域を脱しない範囲内で修正でき、よって修正時全面的に本発明の実施形態の均等・形式的な意味及び範囲を全面的に理解する。本明細書で用いる用語或いは専門用語は、記述のみに使用し、本発明を限定するものではないことに理解すべきである。よって、具体的実施形態を記述すると同時に、本明細書に記載される実施形態は実施時本発明の精神と領域を脱しない範囲内で修正できることを当業者が理解する。
100 検索システム
150 情報プロセッサ
200 情報入力レシーバー
300 規則モジュール
800 電子機器
SI 入力文字列
A コマンド出力
S100〜S130 ステップ

Claims (13)

  1. 電子機器でネットワークを通じて検索するために応用される検索方法であって、
    入力文字列を受け取るステップと、
    前記入力文字列が電子機器に保存されているデフォルト規則に対応しているかどうかを判断するステップと、
    対応している場合、前記デフォルト規則に基づいて前記入力文字列を少なくとも第1キーワード文字列及び第2キーワード文字列に解析するステップと、
    第1キーワード文字列に関連付けられるデフォルト条件に従い、ネットワークを通じて第2キーワード文字列のネットワーク検索を起動させるステップと、
    を含むことを特徴とする、検索方法。
  2. 前記入力文字列は、音声又は文字であることを特徴とする、請求項1に記載の検索方法。
  3. 前記入力文字列が字句であり、前記デフォルト規則が少なくとも1つの動詞キーワードを含み、前記入力文字列と前記デフォルト規則を判断する前記ステップは、
    前記少なくとも1つの動詞キーワードに基づいて、前記字句を前置詞句、前記第1キーワード文字列及び後置詞句として解析することをさらに含むこと、
    を特徴とする、請求項1に記載の検索方法。
  4. 前記第1キーワード文字列と前記前置詞句、前記後置詞句の前後順序を判断し、またその判断に基づいて動詞順序結果を生成することをさらに含むことを特徴とする、請求項3に記載の検索方法。
  5. 前記デフォルト規則が前記第1キーワード文字列、前記前置詞句及び前記後置詞句の順序と関連付ける言語設定を有し、前記判断ステップは、
    前記動詞順序結果及び前記デフォルト規則内の言語設定に基づいて、前記第2キーワード文字列を前記前置詞句或いは前記後置詞句に設定することをさらに含むこと、
    を特徴とする、請求項4に記載の検索方法。
  6. 前記デフォルト条件は、使用するメディアプラットフォーム及び検索エンジンを含むことを特徴とする、請求項5に記載の検索方法。
  7. デフォルト規則を保存又は読み取るための規則モジュールと、
    入力文字列を受け取るための情報入力レシーバーと、前記情報入力レシーバーとカップリングし、前記入力文字列が前記デフォルト規則に対応するかどうかを判断し、前記デフォルト規則に基づいて前記入力文字列を解析すると共にデフォルト条件に基づきネットワークを通じて少なくとも1つの文字列のネットワーク検索を起動させるための情報プロセッサと、を含むネットワークを通じて検索する検索システムと、
    を含むことを特徴とする、電子機器。
  8. 前記デフォルト規則は、少なくとも1つの動詞キーワードを含み、前記情報プロセッサが前記入力文字列に前記動詞キーワードがあると判断すると、前記入力文字列が前記デフォルト規則に対応することを特徴とする、請求項7に記載の電子機器。
  9. 前記情報プロセッサは、前記入力文字列及び前記動詞キーワードに基づいて動詞順序結果を生成することを特徴とする、請求項8に記載の電子機器。
  10. 前記デフォルト規則は、言語設定を有し、前記情報プロセッサが前記動詞順序結果及び前記言語設定に基づいて前記ネットワークを通じて検索する前記文字列を取得することを特徴とする、請求項9に記載の電子機器。
  11. 前記情報プロセッサは、前記動詞キーワードに対応する前記デフォルト条件に基づいて、ネットワークを通じて前記入力文字列のネットワーク検索を起動することを特徴とする、請求項8に記載の電子機器。
  12. 前記デフォルト条件は、使用するメディアプラットフォーム及び検索エンジンを含むことを特徴とする、請求項8に記載の電子機器。
  13. 前記情報入力レシーバーは、音声或いは文字を受け取って前記入力文字列に変換することを特徴とする、請求項8に記載の電子機器。
JP2019005952A 2018-04-02 2019-01-17 検索方法及びそれを用いた電子機器 Active JP6625772B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
TW107111684 2018-04-02
TW107111684A TWI660341B (zh) 2018-04-02 2018-04-02 一種搜尋方法以及一種應用該方法的電子裝置

Publications (2)

Publication Number Publication Date
JP2019185737A true JP2019185737A (ja) 2019-10-24
JP6625772B2 JP6625772B2 (ja) 2019-12-25

Family

ID=65685144

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019005952A Active JP6625772B2 (ja) 2018-04-02 2019-01-17 検索方法及びそれを用いた電子機器

Country Status (6)

Country Link
US (1) US20190303393A1 (ja)
EP (1) EP3550449A1 (ja)
JP (1) JP6625772B2 (ja)
KR (1) KR102140391B1 (ja)
CN (1) CN110347901A (ja)
TW (1) TWI660341B (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11393455B2 (en) 2020-02-28 2022-07-19 Rovi Guides, Inc. Methods for natural language model training in natural language understanding (NLU) systems
US11574127B2 (en) 2020-02-28 2023-02-07 Rovi Guides, Inc. Methods for natural language model training in natural language understanding (NLU) systems
US11626103B2 (en) * 2020-02-28 2023-04-11 Rovi Guides, Inc. Methods for natural language model training in natural language understanding (NLU) systems
US11392771B2 (en) 2020-02-28 2022-07-19 Rovi Guides, Inc. Methods for natural language model training in natural language understanding (NLU) systems

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0756933A (ja) * 1993-06-24 1995-03-03 Xerox Corp 文書検索方法
JP3617096B2 (ja) * 1994-05-25 2005-02-02 富士ゼロックス株式会社 関係表現抽出装置および関係表現検索装置、関係表現抽出方法、関係表現検索方法
JPH09231233A (ja) * 1996-02-26 1997-09-05 Fuji Xerox Co Ltd ネットワーク検索装置
WO1998009228A1 (en) * 1996-08-29 1998-03-05 Bcl Computers, Inc. Natural-language speech control
WO2000011571A1 (en) * 1998-08-24 2000-03-02 Bcl Computers, Inc. Adaptive natural language interface
CN1831937A (zh) * 2005-03-08 2006-09-13 台达电子工业股份有限公司 语音辨识与语言理解分析的方法与装置
US7818176B2 (en) * 2007-02-06 2010-10-19 Voicebox Technologies, Inc. System and method for selecting and presenting advertisements based on natural language processing of voice-based input
TW200933391A (en) * 2008-01-24 2009-08-01 Delta Electronics Inc Network information search method applying speech recognition and sysrem thereof
KR101042515B1 (ko) * 2008-12-11 2011-06-17 주식회사 네오패드 사용자의 의도에 기반한 정보 검색방법 및 정보 제공방법
US8731939B1 (en) * 2010-08-06 2014-05-20 Google Inc. Routing queries based on carrier phrase registration
CN102789464B (zh) * 2011-05-20 2017-11-17 陈伯妤 基于语意识别的自然语言处理方法、装置和系统
EP2856358A4 (en) * 2012-05-24 2016-02-24 Soundhound Inc SYSTEMS AND METHODS AUTHORIZING TREATMENT IN NATURAL LANGUAGE
JP2014110005A (ja) * 2012-12-04 2014-06-12 Nec Software Tohoku Ltd 情報検索装置及び情報検索方法
CN102982020A (zh) * 2012-12-17 2013-03-20 杭州也要买电子商务有限公司 一种搜索系统中的中文分词方法
JP6223744B2 (ja) * 2013-08-19 2017-11-01 株式会社東芝 方法、電子機器およびプログラム
TW201541379A (zh) * 2014-04-18 2015-11-01 Qware Systems & Services Corp 用於商品及服務之語音關鍵字搜尋系統及其方法
CN105609104A (zh) * 2016-01-22 2016-05-25 北京云知声信息技术有限公司 一种信息处理方法、装置及智能语音路由控制器
CN105740900A (zh) * 2016-01-29 2016-07-06 百度在线网络技术(北京)有限公司 信息识别的方法和装置
US9898250B1 (en) * 2016-02-12 2018-02-20 Amazon Technologies, Inc. Controlling distributed audio outputs to enable voice output
CN107145509B (zh) * 2017-03-28 2020-11-13 深圳市元征科技股份有限公司 一种信息搜索方法及其设备
CN107222757A (zh) * 2017-07-05 2017-09-29 深圳创维数字技术有限公司 一种语音搜索方法、机顶盒、存储介质、服务器和系统
CN107748784B (zh) * 2017-10-26 2021-05-25 江苏赛睿信息科技股份有限公司 一种通过自然语言实现结构化数据搜索的方法

Also Published As

Publication number Publication date
JP6625772B2 (ja) 2019-12-25
TWI660341B (zh) 2019-05-21
KR20190115405A (ko) 2019-10-11
US20190303393A1 (en) 2019-10-03
EP3550449A1 (en) 2019-10-09
KR102140391B1 (ko) 2020-08-03
TW201942896A (zh) 2019-11-01
CN110347901A (zh) 2019-10-18

Similar Documents

Publication Publication Date Title
US11887590B2 (en) Voice enablement and disablement of speech processing functionality
JP6588637B2 (ja) 個別化されたエンティティ発音の学習
US9805718B2 (en) Clarifying natural language input using targeted questions
KR101418163B1 (ko) 컨텍스트 정보를 이용한 음성 인식 복구
US11455989B2 (en) Electronic apparatus for processing user utterance and controlling method thereof
US10860289B2 (en) Flexible voice-based information retrieval system for virtual assistant
JP6625772B2 (ja) 検索方法及びそれを用いた電子機器
EP3736807B1 (en) Apparatus for media entity pronunciation using deep learning
McTear et al. Voice application development for Android
US11756538B1 (en) Lower latency speech processing
US11657805B2 (en) Dynamic context-based routing of speech processing
US11830497B2 (en) Multi-domain intent handling with cross-domain contextual signals
CN114860910A (zh) 智能对话方法及系统
KR20200101103A (ko) 사용자 입력을 처리하는 전자 장치 및 방법
US20220415311A1 (en) Early invocation for contextual data processing
US11966663B1 (en) Speech processing and multi-modal widgets
US11935533B1 (en) Content-related actions based on context
KR101914582B1 (ko) 보안성을 강화한 의미-무관 사용자 성문 인증을 제공하는 방법, 대화형 ai 에이전트 시스템 및 컴퓨터 판독가능 기록 매체
WO2022271555A1 (en) Early invocation for contextual data processing
CN115410558A (zh) 集外词处理方法、电子设备和存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190121

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190827

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191106

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191119

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191127

R150 Certificate of patent or registration of utility model

Ref document number: 6625772

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250