JP7354072B2

JP7354072B2 - 情報処理装置、情報処理方法、及び情報処理プログラム

Info

Publication number: JP7354072B2
Application number: JP2020155831A
Authority: JP
Inventors: 伸裕鍜治; 孝太坪内; 拓明田口
Original assignee: Yahoo Japan Corp
Current assignee: Yahoo Japan Corp
Priority date: 2020-09-16
Filing date: 2020-09-16
Publication date: 2023-10-02
Anticipated expiration: 2040-09-16
Also published as: JP2022049571A

Description

本発明は、情報処理装置、情報処理方法、及び情報処理プログラムに関する。

ユーザが入力した文字列であるクエリに対して様々の情報の検索サービスを行うための技術が提供されている。そのような検索サービスにおいては、ユーザが入力したクエリに誤記が含まれる場合等において、その誤記を変換した上で検索結果をユーザに提供する技術が提供されている（例えば特許文献１等）。

特許第６５２９４５６号

しかしながら、上記の従来技術では、ユーザが望んだ検索となっていない場合がある。例えば、従来技術では第１文字列とその第１文字列の誤記として入力され得る第２文字列とを対応付けた辞書を用いて、文字列を変換しているに過ぎず、ユーザが第２文字列を用いて検索を行うことを望んでいる場合には対応することが難しい。そのため、ユーザが入力したクエリの変更要否を適切に判定することが望まれている。

本願は、上記に鑑みてなされたものであって、ユーザが入力したクエリの変更要否を適切に判定する情報処理装置、情報処理方法、及び情報処理プログラムを提供することを目的とする。

本願に係る情報処理装置は、第１ユーザが入力したクエリである第１クエリと、前記第１クエリの入力に関するコンテキストを示すコンテキスト情報である第１コンテキスト情報を取得する取得部と、過去に第２ユーザにより入力されたクエリである第２クエリ及び前記第２クエリに対応する前記コンテキスト情報である第２コンテキスト情報を含む履歴情報と、前記第１クエリと、前記第１コンテキスト情報とに基づいて、前記第１クエリの表記に変更が必要か否かを判定する判定部と、を備えたことを特徴とする。

実施形態の一態様によれば、ユーザが入力したクエリの変更要否を適切に判定することができるという効果を奏する。

図１は、実施形態に係る情報処理システムによる処理の一例を示す図である。図２は、実施形態に係る情報処理装置の構成例を示す図である。図３は、実施形態に係る学習用データ記憶部の一例を示す図である。図４は、実施形態に係るモデル情報記憶部の一例を示す図である。図５は、実施形態に係る端末装置の構成例を示す図である。図６は、実施形態に係る情報処理装置による処理の一例を示すフローチャートである。図７は、実施形態に係る端末装置による処理の一例を示すフローチャートである。図８は、ハードウェア構成の一例を示す図である。

以下に、本願に係る情報処理装置、情報処理方法、及び情報処理プログラムを実施するための形態（以下、「実施形態」と呼ぶ）について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る情報処理装置、情報処理方法、及び情報処理プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。

（実施形態）
〔１．情報処理〕
図１を用いて、実施形態に係る情報処理の一例について説明する。図１は、実施形態に係る情報処理システムによる処理の一例を示す図である。図１では、情報処理装置１００は、ユーザが入力したクエリ（文字列）と、クエリの入力に関するコンテキストを示すコンテキスト情報に基づいて、クエリに変更が必要か否かを判定する。なお、コンテキストについての詳細は後述するが、コンテキストとは、クエリの入力に関する様々な情報を含む概念であり、例えばクエリが入力された際の環境（日時、天候等）やクエリを入力したユーザ等に関連する状況を示す情報を含む。すなわち、コンテキストは、クエリの入力に関するものであれば、クエリを入力したユーザに限らず、様々な状況を示す情報であってもよい。

まず、情報処理システム１の構成について説明する。図１に示すように、情報処理システム１は、端末装置１０と、情報処理装置１００とが含まれる。端末装置１０と、情報処理装置１００とは図示しない所定の通信網を介して、有線または無線により通信可能に接続される。なお、図１に示した情報処理システム１には、複数台の端末装置１０や、複数台の情報処理装置１００が含まれてもよい。

情報処理装置１００は、ユーザが入力したクエリであるクエリと、クエリの入力に関するコンテキストを示すコンテキスト情報に基づいて、クエリの変更要否を判定する情報処理装置である。以下では、変更要否の判定対象となるクエリを第１クエリと記載し、モデルの生成に用いられるクエリを第２クエリと記載する場合がある。また、第１クエリを入力したユーザを第１ユーザと記載し、第２クエリを入力したユーザを第２ユーザと記載する場合があるが、第１ユーザは第２ユーザでもあってもよい。また、第１クエリの入力に関するコンテキスト情報を第１コンテキスト情報と記載し、第２クエリの入力に関するコンテキスト情報を第２コンテキスト情報と記載する場合がある。

図１では、情報処理装置１００は、第１クエリを入力した第１ユーザが利用する端末装置１０に、検索結果を提供する検索装置としても機能する。例えば、情報処理装置１００は、ウェブページの対象として検索処理を実行する検索エンジンとしての機能を有する。なお、変更要否を判定し用いるクエリを確定した後の処理、すなわちクエリを用いて検索を行う点は通常の検索エンジンと同様であるため、適宜詳細な説明を省略する。例えば、情報処理装置１００は、クエリを用いた検索処理の対象となる対象情報群であるウェブページ群が、インデックスされて格納されたデータベースを有し、そのデータベースの情報を対象として検索処理を実行する。なお、検索される対象は、ウェブページに限らず、クエリを用いて検索可能であれば、どのような情報であってもよく、例えば電子商取引における商品等の取引対象等、様々な検索対象であってもよい。

図１では情報処理装置１００が検索装置としても機能する、すなわち情報処理装置１００と検索装置とが一体である場合を説明するが、情報処理装置１００と検索装置とは別体であってもよい。この場合、情報処理システム１には、クエリを対象とした検索処理を実行し、検索結果を提供する検索サービスを提供する検索装置が含まれる。例えば、情報処理装置１００は、ユーザが入力したクエリ、または変更後のクエリを検索装置へ送信し、検索装置から検索結果を受信し、その検索結果をユーザが利用する端末装置１０に送信する。なお、検索装置が直接ユーザが利用する端末装置１０へ検索結果を送信してもよい。

端末装置１０は、ユーザによって利用されるデバイス（コンピュータ）である。端末装置１０は、ユーザによる操作を受け付ける。端末装置１０は、ユーザによるクエリの入力を受け付ける。端末装置１０は、情報処理装置１００から提供された検索結果を表示する。

また、端末装置１０は、加速度センサやジャイロセンサ等を有し、ユーザの運動状態を検知する。また、端末装置１０は、ＧＰＳセンサ等の位置センサを有し、ユーザの位置情報を検知する。また、端末装置１０は、温度センサや気圧センサ等の種々の機能を有し、温度や気圧等のユーザの置かれている環境情報を検知し、取得可能であってもよい。また、端末装置１０は、心拍センサ等の種々の機能を有し、ユーザの生体情報を検知し、取得可能であってもよい。例えば、端末装置１０を利用するユーザは、端末装置１０と通信可能なウェアラブルデバイスを身に付けることにより、端末装置１０によりユーザ自身のコンテキスト情報を取得可能としてもよい。例えば、端末装置１０を利用するユーザは、端末装置１０と通信可能なリストバンド型のウェアラブルデバイスを身に付けることにより、端末装置１０によりユーザ自身の心拍（脈拍）に関する情報を端末装置１０が取得可能としてもよい。また、端末装置１０は、画像センサを有してもよい。なお、上記は一例であり、端末装置１０は、様々な情報を検知するセンサを有してもよい。

また、以下では、端末装置１０をユーザと表記する場合がある。すなわち、以下では、ユーザを端末装置１０と読み替えることもできる。なお、端末装置１０は、例えば、スマートフォンや、タブレット型端末や、ノート型ＰＣ（Personal Computer）や、デスクトップＰＣや、携帯電話機や、ＰＤＡ（Personal Digital Assistant）等により実現される。図１の例では、端末装置１０がタッチパネル機能を有するスマートフォンである場合を示す。

以下、図１を用いて、情報処理の一例を説明する。図１では、ユーザがユーザＩＤ「Ｕ１」により識別されるユーザ（以下、「ユーザＵ１」とする場合がある）である場合を示す。

まず、モデルの学習処理について説明する。情報処理装置１００は、クエリの変更要否を判定する判定モデルの学習に用いる学習用データ群ＤＳ１を取得する（ステップＳ１１）。学習用データ群ＤＳ１には、過去に第２ユーザにより入力されたクエリである第２クエリ及び第２クエリに対応する第２コンテキスト情報との組合せと、その第２クエリに変更が必要か否かを示す正解データとのセットが複数含まれる。例えば、「正解データ」は、クエリの変更が必要であった場合「１」が格納され、クエリの変更が必要ではなかった場合「０」となる機械学習に用いる正解情報である。

例えば、クエリＱＥ１は、対応するコンテキスト情報がコンテキスト情報ＣＴ１であり、正解データＲＴ１が対応付けられている。クエリＱＥ１は、具体的な文字列である。また、例えば、クエリＱＥ１に変更が必要であった場合、正解データＲＴ１は「１」であり、クエリＱＥ１に変更が必要なかった場合、正解データＲＴ１は「０」である。

コンテキスト情報ＣＴ１は、クエリＱＥ１が入力された際の環境やクエリＱＥ１を入力したユーザ等に関連する各種情報が含まれる。このように、コンテキストは、クエリが入力された際の環境やクエリを入力したユーザ等に関連する状況を意味する。コンテキストは、クエリが入力された際の日時、天候、気温、湿度等を示す情報であってもよい。また、コンテキストは、ユーザの属性、ユーザの現在位置、ユーザが置かれた物理環境、ユーザが置かれた社会環境、ユーザの運動状態、および、推定されるユーザの感情、心理状態等の様々なユーザの状況を示す情報であってもよい。例えば、コンテキストは、クエリ入力時のユーザに関連する状況、クエリを入力したユーザの年齢、性別、職業等のデモグラフィック属性またはサイコグラフィック属性、ユーザが過去に入力したクエリの変更要否の傾向等様々な情報が含まれる。例えば、コンテキスト情報には、ユーザが入力ミスをしやすいユーザであるか否かを示す情報が含まれてもよい。この場合、ユーザが過去に入力したクエリの変更が必要であった回数が所定の回数以上である場合、コンテキスト情報には、そのユーザが入力ミスが多いユーザであることを示す情報が含まれる。また、ユーザが過去に入力したクエリの変更が必要であった回数が所定の回数未満である場合、コンテキスト情報には、そのユーザが入力ミスが少ないユーザであることを示す情報が含まれる。

図１の例では、コンテキスト情報として、クエリを入力時にユーザが運動状態であるか否かを示す情報、クエリの入力に用いた端末装置１０の仕様（機種や入力形式等）、ユーザの属性を用いる場合を一例として説明する。入力形式には、例えばフリック入力、キーボード入力等のユーザがクエリを入力する際の入力インターフェイスを示す。例えば、コンテキスト情報ＣＴ１には、クエリＱＥ１を入力したユーザが運動状態であるか否かを示す情報、クエリＱＥ１の入力に用いられた端末装置１０、クエリＱＥ１を入力したユーザの属性を示す情報が含まれる。ユーザが運動状態であるか否かを示す情報は、例えばセンサにより検知されたユーザの速度情報や加速度情報等であってもよい。なお、上記は一例であり、コンテキスト情報には、上記に限らず、例えば、クエリが入力された時点に対応する時間帯を示す情報等、様々な情報が含まれてもよい。

そして、情報処理装置１００は、学習用データ群ＤＳ１を用いて、クエリとコンテキスト情報とを入力として、そのクエリの変更要否を示すスコアを出力する判定モデルであるモデルＭ１を学習する（ステップＳ１２）。図１では、情報処理装置１００は、クエリとコンテキスト情報とを含む入力用データＩＮの入力に応じて、入力用データＩＮに含まれるクエリの変更要否の度合いを示すスコアを出力するモデルＭ１を学習する。例えば、情報処理装置１００は、ニューラルネットワークのネットワーク構成を有するモデルＭ１を学習する。なお、モデルＭ１のネットワーク構成は、クエリの変更要否を示すスコアを出力可能であれば、どのようなネットワーク構成であってもよい。

情報処理装置１００は、クエリＱＥ１及びコンテキスト情報ＣＴ１が入力された場合に、正解データＲＴ１が出力されるようにモデルＭ１の重み等のパラメータを学習する。例えば、正解データＲＴ１が「１」の場合、情報処理装置１００は、クエリＱＥ１及びコンテキスト情報ＣＴ１が入力された場合に、スコア「１」が出力されるようにモデルＭ１の重み等のパラメータを学習する。また、例えば、正解データＲＴ１が「０」の場合、情報処理装置１００は、クエリＱＥ１及びコンテキスト情報ＣＴ１が入力された場合に、スコア「０」が出力されるようにモデルＭ１の重み等のパラメータを学習する。情報処理装置１００は、モデルＭ１のネットワーク構成や学習したパラメータ等を含むモデルデータＭＴＤ１を生成する。これにより、情報処理装置１００は、判定モデルであるモデルＭ１を生成する。モデルＭ１の学習処理には、任意の手法が採用可能である。

例えば、情報処理装置１００は、バックプロパゲーション（誤差逆伝播法）等の手法により学習処理を行う。例えば、情報処理装置１００は、学習処理により、ノード間で値が伝達する際に考慮される重み（すなわち、接続係数）の値を調整する。このように、情報処理装置１００は、モデルＭ１における出力（スコア）と、入力に対応する正解（正解データ）との誤差が少なくなるようにパラメータ（接続係数）を補正するバックプロパゲーション等の処理によりモデルＭ１を学習する。例えば、情報処理装置１００は、所定の損失（ロス）関数を最小化するようにバックプロパゲーション等の処理を行うことによりモデルＭ１を生成する。これにより、情報処理装置１００は、モデルＭ１のパラメータを学習する学習処理を行うことができる。

ここから、クエリの変更要否の判定について説明する。端末装置１０は、ユーザＵ１による「ＸＸＸＸ」というクエリの入力を受け付ける（ステップＳ１３）。なお、「ＸＸＸＸ」は具体的な文字列であるものとする。図１に示す例において、ユーザＵ１は、端末装置１０の画面に表示された検索サイトのページ中の検索窓にクエリ「ＸＸＸＸ」を入力し、検索実行のボタンを押下する。

そして、端末装置１０は、クエリ「ＸＸＸＸ」と、ユーザＵ１のコンテキスト情報を情報処理装置１００へ送信する（ステップＳ１４）。端末装置１０は、クエリ「ＸＸＸＸ」とともに、端末装置１０の仕様、ユーザＵ１がクエリ「ＸＸＸＸ」の入力時に運動状態であったか否かを示す情報、ユーザＵ１が利用する端末装置１０の仕様を示す情報、ユーザＵ１の属性を示す情報等を含むコンテキスト情報を情報処理装置１００へ送信する。

端末装置１０からクエリ「ＸＸＸＸ」及びユーザＵ１に対応するコンテキスト情報を受信した情報処理装置１００は、受信したクエリ「ＸＸＸＸ」及びユーザＵ１に対応するコンテキスト情報をモデルＭ１に入力する（ステップＳ１５）。クエリ「ＸＸＸＸ」及びユーザＵ１に対応するコンテキスト情報が入力されたモデルＭ１は、スコアを出力する（ステップＳ１６）。図１の例では、モデルＭ１は、出力ＯＴに示すようにスコア「０．７」を出力する。

そして、情報処理装置１００は、モデルＭ１が出力したスコアと閾値との比較に基づいて、クエリ「ＸＸＸＸ」の変更要否を判定する（ステップＳ１７）。図１の例では、閾値は「０．６」であるものとする。なお、情報処理装置１００は、外部装置から取得してもよいし、記憶部１２０（図２参照）に記憶した閾値を用いてもよい。図１では、情報処理装置１００は、判定結果ＲＳに示すように、モデルＭ１が出力したスコア「０．７」が閾値「０．６」以上であるため、クエリ「ＸＸＸＸ」に変更が必要であると判定する。なお、情報処理装置１００は、モデルＭ１が出力したスコアが閾値未満である場合、クエリの表記に変更が必要ではないと判定する。

例えば、情報処理装置１００は、変更が必要であると判定したクエリを、所定の情報を用いて変更する変更処理を実行する。例えば、情報処理装置１００は、文字列（クエリ）と、その文字列が変更要と判定された場合に、変更先となる文字列（変換後クエリ）とが対応付けられた変換用リストを用いて、変更処理を実行する。図１の例では、変換用リストは、クエリ「ＸＸＸＸ」に、変換後クエリ「ＹＹＹＹ」が対応付けられている。クエリ「ＸＸＸＸ」と変換後クエリ「ＹＹＹＹ」とは、読みは同じであるが、漢字の表記が異なる文字列であってもよい。情報処理装置１００は、クエリ「ＸＸＸＸ」を変換後クエリ「ＹＹＹＹ」に変更する。そして、情報処理装置１００は、変換後クエリ「ＹＹＹＹ」を用いて、検索処理を実行する。

そして、情報処理装置１００は、変換後クエリ「ＹＹＹＹ」の検索結果をユーザＵ１が利用する端末装置１０へ提供する（ステップＳ１８）。図１の例では、情報処理装置１００は、クエリ「ＸＸＸＸ」ではなく変換後クエリ「ＹＹＹＹ」での検索結果であることを通知する情報と共に、「ＹＹＹＹ」の検索結果を表示するコンテンツを端末装置１０へ提供してもよい。なお、情報処理装置１００が行う情報提供が上記限らず、様々な態様であってもよい。例えば、情報処理装置１００は、検索結果を提供する前に、クエリ「ＸＸＸＸ」を変換後クエリ「ＹＹＹＹ」に変更するか否かをユーザＵ１に確認する情報を提供してもよい。この場合、情報処理装置１００は、ユーザＵ１が選択したクエリに対応する検索結果を端末装置１０へ提供してもよい。また、情報処理装置１００は、変換後クエリ「ＹＹＹＹ」の検索結果とともに、クエリ「ＸＸＸＸ」の検索結果を提供してもよい。

上述したように、情報処理装置１００は、ユーザが入力したクエリを、コンテキストに基づいて判定することにより、ユーザが入力したクエリの変更要否を適切に判定することができる。例えば、情報処理装置１００は、日本語のように、同じ読みであるが、漢字、仮名、カタカナの組合せによって、異なる意味に対応する文字列があるような言語において、ユーザが入力したクエリの変更要否を適切に判定することができる。すなわち、情報処理装置１００は、同じクエリであっても、コンテキストに応じてそのクエリに変更が必要であるか否かを適切に判定することで、あるクエリが入力された場合に一律に変更するのではなく、必要と判定した場合のみクエリを変更することで、適切に変更を行うことができる。

〔１－１．判定〕
なお、上記の例では、判定モデルを用いて、クエリの変更要否を判定する場合を示したが、情報処理装置１００は、判定モデルを用いる場合に限らず、例えばルールベースにより、クエリの変更要否を判定してもよい。例えば、情報処理装置１００は、クエリに対応するコンテキスト情報がルールベースに規定されたルールに該当する場合、そのクエリに変更が必要であると判定してもよい。この場合、情報処理装置１００は、ルールの一覧リストと、どのルールに該当する場合にクエリの変更が必要と判定するかの判定条件とを記憶部１２０に記憶し、一覧リスト中の各ルールと、コンテキスト情報との比較し、判定条件を満たすか否かにより、クエリの変更要否を判定してもよい。例えば、情報処理装置１００は、クエリを入力したユーザが運動中であり、そのユーザが過去に入力したクエリの変更が必要であった回数が所定の回数以上である場合、クエリの表記の変更が必要であると判定する。

〔１－２．正解データの収集〕
なお、学習用データに含まれる正解データは、種々の態様により収集されてもよい。例えば、正解データは、第２クエリに対応する検索結果に対する第２ユーザの行動に基づいて収集されてもよい。

例えば、情報処理装置１００は、第２クエリを入力した第２ユーザに対して、第２クエリを変更した変更後のクエリに対する検索結果を提供し、その検索結果を第２ユーザが選択した場合、第２クエリには変更が必要であったとの正解データを第２クエリと第２コンテキスト情報との組合せに対応付ける。

例えば、情報処理装置１００は、第２クエリを入力した第２ユーザに対して、第２クエリに対する検索結果を提供し、その検索結果を第２ユーザが選択した場合、第２クエリには変更が不要であったとの正解データを第２クエリと第２コンテキスト情報との組合せに対応付ける。

例えば、情報処理装置１００は、第２クエリを入力した第２ユーザに対して、第２クエリに対する検索結果（通常検索結果）、及び第２クエリを変更した変更後のクエリに対する検索結果（変更検索結果）を提供してもよい。この場合、第２ユーザが通常検索結果を第２ユーザが選択した場合、第２クエリには変更が不要であったとの正解データを第２クエリと第２コンテキスト情報との組合せに対応付け、変更検索結果を第２ユーザが選択した場合、第２クエリには変更が不要であったとの正解データを第２クエリと第２コンテキスト情報との組合せに対応付ける。なお、上記は一例であり、情報処理装置１００は、種々の情報を適宜用いて正解データを収集してもよいし、外部装置から正解データを取得してもよい。

〔２．情報処理装置の構成〕
次に、図２を用いて、実施形態に係る情報処理装置１００の構成について説明する。図２は、実施形態に係る情報処理装置１００の構成例を示す図である。図２に示すように、情報処理装置１００は、通信部１１０と、記憶部１２０と、制御部１３０とを有する。なお、情報処理装置１００は、情報処理装置１００の管理者等から各種操作を受け付ける入力部（例えば、キーボードやマウス等）や、各種情報を表示するための表示部（例えば、液晶ディスプレイ等）を有してもよい。

（通信部１１０）
通信部１１０は、例えば、ＮＩＣ（Network Interface Card）等によって実現される。そして、通信部１１０は、所定の通信網（ネットワーク）と有線または無線で接続され、端末装置１０との間で情報の送受信を行う。

（記憶部１２０）
記憶部１２０は、例えば、ＲＡＭ（Random Access Memory）、フラッシュメモリ（Flash Memory）等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。実施形態に係る記憶部１２０は、図２に示すように、学習用データ記憶部１２１と、モデル情報記憶部１２２とを有する。

なお、記憶部１２０は、モデルが出力するスコアとの比較に用いる閾値の情報やクエリの表記に変更が必要と判定した場合に、クエリの表記の変換に用いる一覧表である変換用リストを記憶する。例えば、変換用リストは、第１文字列と、その第１文字列の誤記として入力され得る第２文字列とを対応付けた一覧表である。図１の例では、変換用リストは、第１文字列「ＹＹＹＹ」に、その誤記として入力され得る第２文字列「ＸＸＸＸ」、「ＺＺＺＺ」等が対応付けられた一覧表である。なお、変換用リストは、情報処理装置１００が生成してもよいし、変換用リストを生成する外部装置から情報処理装置１００が取得してもよい。

（学習用データ記憶部１２１）
実施形態に係る学習用データ記憶部１２１は、学習に用いるデータに関する各種情報を記憶する。学習用データ記憶部１２１は、学習に用いる学習データ（データセット）を記憶する。図３は、本開示の実施形態に係る学習用データ記憶部の一例を示す図である。例えば、学習用データ記憶部１２１は、学習に用いる学習データや精度評価（測定）に用いる評価用データ等の種々のデータに関する各種情報を記憶する。図３に、実施形態に係る学習用データ記憶部１２１の一例を示す。図３の例では、学習用データ記憶部１２１は、「データセットＩＤ」、「データＩＤ」、「クエリ」、「コンテキスト情報」、「正解データ」といった項目が含まれる。

「データセットＩＤ」は、データセットを識別するための識別情報を示す。「データＩＤ」は、各学習用データを識別するための識別情報を示す。

「クエリ」は、クエリを示す。「クエリ」は、モデルの入力として用いられるクエリ（文字列）である入力用データを示す。図１の例では「クエリ」を「ＱＥ１」等の抽象的な符号で図示するが、具体的な文字列であるものとする。

また、「コンテキスト情報」は、対応するクエリを入力したユーザのコンテキスを示すコンテキスト情報である。図１の例では「コンテキスト情報」を「ＣＴ１」等の抽象的な符号で図示するが、クエリの入力に関するコンテキストを示す具体的な情報であるものとする。

「正解データ」は、対応するクエリ及びコンテキス情報の組合せに対応する正解を示す。図３の例では、「正解データ」は、クエリ及びコンテキス情報の組合せの場合にそのクエリの表記に変更が必要であるか否かを示す。「正解データ」は、クエリの表記に変更が必要である場合「１」が格納され、クエリの表記に変更が必要ではない場合「０」が格納されてもよい。

図３の例では、データセットＩＤ「ＤＳ１」により識別されるデータセット（データセットＤＳ１）には、データＩＤ「ＤＩＤ１」、「ＤＩＤ２」、「ＤＩＤ３」等により識別される複数の学習用データが含まれることを示す。データＩＤ「ＤＩＤ１」により識別される学習用データに含まれるクエリＱＥ１とコンテキスト情報ＣＴ１との組合せは、正解データが「ＲＴ１」であることを示す。

なお、学習用データ記憶部１２１は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、学習用データ記憶部１２１は、各データが学習データであるか、評価用データであるか等を特定可能に記憶してもよい。例えば、学習用データ記憶部１２１は、学習データと評価用データとを区別可能に記憶する。学習用データ記憶部１２１は、各データが学習データや評価用データであるかを識別する情報を記憶してもよい。情報処理装置１００は、学習データとして用いられるクエリ及びコンテキス情報の組合せと正解データとに基づいて、モデルを学習する。情報処理装置１００は、評価用データとして用いられるクエリ及びコンテキス情報の組合せと正解データとに基づいて、モデルの精度を測定する。

（モデル情報記憶部１２２）
実施形態に係るモデル情報記憶部１２２は、モデルに関する情報を記憶する。例えば、モデル情報記憶部１２２は、学習処理により学習（生成）された学習済みモデル（モデル）の情報（モデルデータ）を記憶する。図４は、本開示の第１の実施形態に係るモデル情報記憶部の一例を示す図である。図４に、第１の実施形態に係るモデル情報記憶部１２２の一例を示す。図４に示した例では、モデル情報記憶部１２２は、「モデルＩＤ」、「用途」、「モデルデータ」といった項目が含まれる。

「モデルＩＤ」は、モデルを識別するための識別情報を示す。「用途」は、対応するモデルの用途を示す。「モデルデータ」は、モデルのデータを示す。図４等では「モデルデータ」に「ＭＤＴ１」といった概念的な情報が格納される例を示したが、実際には、モデルの構成（ネットワーク構成）の情報やパラメータに関する情報等、そのモデルを構成する種々の情報が含まれる。例えば、「モデルデータ」には、ネットワークの各層におけるノードと、各ノードが採用する関数と、ノードの接続関係と、ノード間の接続に対して設定される接続係数とを含む情報が含まれる。

図４に示す例では、モデルＩＤ「Ｍ１」により識別されるモデル（モデルＭ１）は、用途が「変更要否判定」であることを示す。すなわち、モデルＭ１は、入力されたクエリの表記に変更が必要であるか否かを示す情報（スコア）を出力するモデルであることを示す。また、モデルＭ１のモデルデータは、モデルデータＭＤＴ１であることを示す。

なお、モデル情報記憶部１２２は、上記に限らず、目的に応じて種々の情報を記憶してもよい。

（制御部１３０）
図２の説明に戻って、制御部１３０は、コントローラ（controller）であり、例えば、ＣＰＵ（Central Processing Unit）やＭＰＵ（Micro Processing Unit）等によって、情報処理装置１００内部の記憶装置に記憶されている各種プログラム（情報処理プログラムの一例に相当）がＲＡＭを作業領域として実行されることにより実現される。また、制御部１３０は、コントローラであり、例えば、ＡＳＩＣ（Application Specific Integrated Circuit）やＦＰＧＡ（Field Programmable Gate Array）等の集積回路により実現される。

図２に示すように、制御部１３０は、取得部１３１と、学習部１３２と、判定部１３３と、処理部１３４と、提供部１３５とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部１３０の内部構成は、図２に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。また、制御部１３０が有する各処理部の接続関係は、図２に示した接続関係に限られず、他の接続関係であってもよい。

（取得部１３１）
取得部１３１は、記憶部１２０から各種の情報を取得する。取得部１３１は、学習用データ記憶部１２１から学習に用いるデータを取得する。取得部１３１は、モデル情報記憶部１２２からモデルの情報を取得する。

取得部１３１は、第１ユーザが入力したクエリである第１クエリと、第１クエリの入力に関するコンテキストを示すコンテキスト情報である第１コンテキスト情報を取得する。取得部１３１は、履歴情報に基づいて学習されたモデルであって、クエリと当該クエリに対応するコンテキスト情報との入力に応じて、当該クエリの表記に変更が必要か否かを示すスコアを出力するモデルを取得する。

取得部１３１は、第１クエリと、第１クエリの入力時のコンテキストを示す第１コンテキスト情報を取得する。取得部１３１は、第１クエリと、第１クエリの入力時に第１ユーザが運動状態であるかを示す第１コンテキスト情報を取得する。取得部１３１は、第１クエリと、第１クエリの入力に用いた端末装置１０の仕様を示す第１コンテキスト情報を取得する。取得部１３１は、第１クエリと、第１クエリの入力時の時間帯を示す第１コンテキスト情報を取得する。取得部１３１は、第１クエリと、第１ユーザの属性を示す第１コンテキスト情報を取得する。取得部１３１は、第１クエリと、第１ユーザが過去に入力したクエリの表記の変更要否の傾向を示す第１コンテキスト情報を取得する。

取得部１３１は、通信部１１０を介して、端末装置１０から情報を受信する。取得部１３１は、ユーザが入力したクエリと、クエリの入力に関するコンテキスト情報を端末装置１０から受信する。

取得部１３１は、端末装置１０から学習用データを取得してもよい。取得部１３１は、端末装置１０において、変更要否判定処理の対象となったクエリと、そのクエリの入力に関するコンテキスト情報と、クエリの表記が変更されたか否かを示す情報（正解データ）とを学習用データとして端末装置１０から収集する。

（学習部１３２）
学習部１３２は、モデルを学習する。学習部１３２は、外部の情報処理装置からの情報や記憶部１２０に記憶された情報に基づいて、各種情報を学習する。学習部１３２は、学習用データ記憶部１２１に記憶された情報に基づいて、各種情報を学習する。学習部１３２は、学習により生成したモデルをモデル情報記憶部１２２に格納する。

学習部１３２は、第２クエリと第２コンテキスト情報との各組合せと、各組合せの第２クエリの表記に変更が必要であったか否かを示す正解データとを用いた機械学習の処理により、モデルを学習する。学習部１３２は、第２クエリに対応する検索結果に対する第２ユーザの行動に基づく正解データを用いて、モデルを学習する。

学習部１３２は、モデル（ネットワーク）のパラメータを学習する。学習部１３２は、接続されたノード間の接続係数（重み）等のパラメータを学習する。学習部１３２は、種々の機械学習に関する技術を用いて、モデルを学習する。学習部１３２は、モデルに入力するデータと、そのデータが入力された場合の出力を示す正解データとを用いて行う学習処理、すなわち教師有り学習の手法によりモデルのパラメータを学習する。なお、上記は一例であり、学習部１３２は、モデルのパラメータを学習可能であれば、どのような学習処理により、モデルのパラメータを学習してもよい。

（判定部１３３）
判定部１３３は、種々の情報を判定する。判定部１３３は、過去に第２ユーザにより入力されたクエリである第２クエリ及び第２クエリに対応するコンテキスト情報である第２コンテキスト情報を含む履歴情報と、第１クエリと、第１コンテキスト情報とに基づいて、第１クエリの表記に変更が必要か否かを判定する。例えば、判定部１３３は、モデル情報記憶部１２２に記憶されたモデルと、記憶部１２０に記憶された閾値とを用いて、クエリの変更要否を判定する。判定部１３３は、学習部１３２により学習されたモデルを用いて、第１クエリの表記に変更が必要か否かを判定する。

判定部１３３は、第１クエリと第１コンテキスト情報とをモデルに入力することにより、モデルが出力するスコアに基づいて、第１クエリの表記に変更が必要か否かを判定する。判定部１３３は、モデルが出力するスコアと閾値との比較に基づいて、第１クエリの表記に変更が必要か否かを判定する。判定部１３３は、モデルが出力するスコアが閾値以上である場合、第１クエリの表記に変更が必要であると判定する。判定部１３３は、モデルが出力するスコアが閾値未満である場合、第１クエリの表記に変更が必要ではないと判定する。

判定部１３３は、第１クエリの入力時の第１ユーザのコンテキストに基づいて、第１クエリの表記に変更が必要か否かを判定する。判定部１３３は、第１ユーザが運動状態であるか否かに基づいて、第１クエリの表記に変更が必要か否かを判定する。判定部１３３は、端末装置の仕様に基づいて、第１クエリの表記に変更が必要か否かを判定する。判定部１３３は、第１クエリの入力時の時間帯に基づいて、第１クエリの表記に変更が必要か否かを判定する。判定部１３３は、第１ユーザの属性に基づいて、第１クエリの表記に変更が必要か否かを判定する。判定部１３３は、第１ユーザの傾向に基づいて、第１クエリの表記に変更が必要か否かを判定する。

（処理部１３４）
処理部１３４は、各種の処理を実行する。処理部１３４は、ユーザが入力したクエリに基づく検索処理を実行する。処理部１３４は、判定部１３３によりユーザが入力したクエリに変更が不要と判定された場合、ユーザが入力したクエリを用いて検索処理を実行する。処理部１３４は、ユーザに提供する情報を生成する。処理部１３４は、ユーザに提供するコンテンツを生成する。

処理部１３４は、判定部１３３によりユーザが入力したクエリに変更が必要と判定された場合、ユーザが入力したクエリの表記を変更する。例えば、処理部１３４は、ユーザが入力したクエリの表記を、記憶部１２０に記憶された変換用リストを用いて、表記を変更した文字列を生成する。処理部１３４は、ユーザが入力したクエリと、記憶部１２０に記憶された変換用リスト中の第２文字列群とを比較し、クエリに一致した第２文字列に対応する第１文字列にクエリの表記を変換する。そして、処理部１３４は、変換した変換後のクエリを用いて検索処理を実行する。

（提供部１３５）
提供部１３５は、通信部１１０を介して、端末装置１０へ情報を送信する。提供部１３５は、ユーザが利用する端末装置１０へ検索サービスを提供する。例えば、提供部１３５は、処理部１３４による検索処理の結果である検索結果を端末装置１０へ送信する。提供部１３５は、処理部１３４により生成された情報を端末装置１０へ送信する。

〔３．端末装置の構成〕
次に、図５を用いて、実施形態に係る端末装置１０の構成について説明する。図５は、実施形態に係る端末装置１０の構成例を示す図である。図５に示すように、端末装置１０は、通信部１１と、記憶部１２と、入力部１３と、表示部１４と、制御部１５とを有する。なお、端末装置１０は、各種情報を音声出力するための音声出力部（例えばスピーカ等）を有してもよい。

（通信部１１）
通信部１１は、例えば、通信回路等によって実現される。そして、通信部１１は、図示しない所定の通信網と有線または無線で接続され、情報処理装置１００との間で情報の送受信を行う。

（記憶部１２）
記憶部１２は、例えば、ＲＡＭ、フラッシュメモリ等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。記憶部１２は、例えば、端末装置１０にインストールされているアプリケーション（例えば情報表示アプリ等）に関する情報、例えばプログラム等を記憶する。

（入力部１３）
入力部１３は、ユーザからの各種操作を受け付ける。入力部１３は、音声を検知する機能を有し、ユーザの発話による音声入力を受け付ける。入力部１３は、音声を検知するマイクにより検知されたユーザによる発話を入力として受け付ける。

また、入力部１３は、タッチパネル機能により表示面を介してユーザからの各種操作を受け付けてもよい。また、入力部１３は、端末装置１０に設けられたボタンや、端末装置１０に接続されたキーボードやマウスからの各種操作を受け付けてもよい。

例えば、入力部１３は、端末装置１０の表示部１４を介してユーザの指定操作等の操作を受け付ける。例えば、入力部１３は、タッチパネルの機能によりユーザの操作を受け付ける受付部として機能する。この場合、入力部１３と受付部１５１とは一体であってもよい。なお、入力部１３によるユーザの操作の検知方式には、タブレット端末では主に静電容量方式が採用されるが、他の検知方式である抵抗膜方式、表面弾性波方式、赤外線方式、電磁誘導方式など、ユーザの操作を検知できタッチパネルの機能が実現できればどのような方式を採用してもよい。

（表示部１４）
表示部１４は、例えば液晶ディスプレイや有機ＥＬ（Electro-Luminescence）ディスプレイ等によって実現されるタブレット端末等の表示画面であり、各種情報を表示するための表示装置である。

（制御部１５）
制御部１５は、コントローラであり、例えば、ＣＰＵやＭＰＵ等によって、端末装置１０内部の記憶部１２などの記憶装置に記憶されている各種プログラムがＲＡＭを作業領域として実行されることにより実現される。例えば、この各種プログラムは、インストールされているアプリケーション（例えばメッセージアプリ等）のプログラムが含まれる。また、制御部１５は、コントローラであり、例えば、ＡＳＩＣやＦＰＧＡ等の集積回路により実現される。

図５に示すように、制御部１５は、受付部１５１と、送信部１５２と、受信部１５３と、処理部１５４とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部１５の内部構成は、図５に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。

（受付部１５１）
受付部１５１は、各種情報を受け付ける。例えば、受付部１５１は、入力部１３を介してユーザによる入力を受け付ける。受付部１５１は、ユーザによる操作を受け付ける。受付部１５１は、表示部１４により表示された情報に対するユーザの操作を受け付ける。受付部１５１は、ユーザによるクエリの入力を受け付ける。例えば、受付部１５１は、ユーザＵ１による文字列「ＸＸＸＸ」というクエリの入力を受け付ける。

受付部１５１は、表示部１４に表示された情報に対するユーザの操作を受け付ける。受付部１５１は、表示部１４に表示された検索結果に関する情報に対するユーザの操作を受け付ける。

（送信部１５２）
送信部１５２は、通信部１１を介して、情報処理装置１００へ情報を送信する。送信部１５２は、ユーザが入力したクエリを情報処理装置１００へ送信する。送信部１５２は、コンテキスト情報を情報処理装置１００へ送信する。送信部１５２は、受付部１５１によるユーザの操作の受け付けに応じて、ユーザの操作を示す情報を情報処理装置１００へ送信する。送信部１５２は、情報処理装置１００から提供された情報に対する、ユーザによる選択を示す情報を情報処理装置１００へ送信する。

（受信部１５３）
受信部１５３は、通信部１１を介して、情報処理装置１００から情報を受信する。受信部１５３は、ユーザが入力したクエリに対応する検索結果を情報処理装置１００から受信する。受信部１５３は、ユーザが入力した第１クエリと異なる第２クエリに関する検索情報を受信する。受信部１５３は、ユーザが入力した第１クエリと異なる第２クエリを提案する検索情報を受信する。受信部１５３は、第２クエリを用いて検索を行う事を推奨する検索情報を受信する。

受信部１５３は、ユーザが入力したクエリの表記が変更されていない場合、ユーザが入力したクエリを用いた検索結果を情報処理装置１００から受信する。受信部１５３は、ユーザが入力したクエリの表記が変更された場合、変換後のクエリに対応する検索結果を含む情報を情報処理装置１００から受信する。

（処理部１５４）
処理部１５４は、各種の処理を実行する。処理部１５４は、受信部１５３が受信した情報を表示部１４に表示する。処理部１５４は、ユーザが入力したクエリに対応する検索結果を表示部１４に表示する。

処理部１５４は、ユーザが入力した第１クエリと異なる第２クエリに関する検索情報を表示部１４に表示する。処理部１５４は、ユーザが入力した第１クエリと異なる第２クエリを提案する検索情報を表示部１４に表示する。処理部１５４は、第２クエリを用いて検索を行う事を推奨する検索情報を表示部１４に表示する。

なお、上述した制御部１５による各処理は、例えば、ＪａｖａＳｃｒｉｐｔ（登録商標）などにより実現されてもよい。また、上述した表示処理が所定のアプリケーション（例えば情報表示アプリ等）により行われる場合や推論処理等の処理が専用アプリにより行われる場合、制御部１５は、例えば、所定のアプリや専用アプリを制御するアプリ制御部を有してもよい。

〔４．処理フロー〕
次に、図６を用いて、実施形態に係る情報処理システム１による情報処理の手順について説明する。図６は、実施形態に係る情報処理装置による処理の一例を示すフローチャートである。

図６に示すように、情報処理装置１００は、ユーザが入力したクエリと、クエリの入力に関するコンテキストを示すコンテキスト情報を取得する（ステップＳ１０１）。

情報処理装置１００は、クエリと、コンテキスト情報とに基づいて、クエリの表記に変更が必要か否かを判定する（ステップＳ１０２）。例えば、情報処理装置１００は、クエリと、コンテキスト情報とを判定モデル（モデルＭ１等）に入力し、判定モデルが出力したスコアに基づいて、クエリの表記に変更が必要か否かを判定する。また、情報処理装置１００は、クエリの表記に変更要否の判定結果に基づく検索処理を行い、その検索結果をユーザが利用する端末装置１０へ提供する。

次に、図７を用いて端末装置１０におけるモデルを用いた推論等の処理の流れを示す。図７は、実施形態に係る端末装置による処理の一例を示すフローチャートである。

図７に示すように、端末装置１０は、クエリの入力を受け付けていない場合（ステップＳ２０１：Ｎｏ）、クエリが入力されるまで待機する。端末装置１０は、クエリの入力を受け付けた後（ステップＳ２０１：Ｙｅｓ）、クエリとコンテキスト情報とを送信する（ステップＳ２０２）。例えば、端末装置１０は、クエリとコンテキスト情報とを情報処理装置１００へ送信する。

端末装置１０は、検索結果を受信する（ステップＳ２０３）。例えば、端末装置１０は、クエリとコンテキスト情報との送信先である情報処理装置１００から、検索結果を受信する。そして、端末装置１０は、検索結果を表示する（ステップＳ２０４）。

〔５．効果〕
上述してきたように、実施形態に係る情報処理装置１００は、取得部１３１と、判定部１３３とを有する。取得部１３１は、第１ユーザが入力したクエリである第１クエリと、第１クエリの入力に関するコンテキストを示すコンテキスト情報である第１コンテキスト情報を取得する。判定部１３３は、過去に第２ユーザにより入力されたクエリである第２クエリ及び第２クエリに対応するコンテキスト情報である第２コンテキスト情報を含む履歴情報と、第１クエリと、第１コンテキスト情報とに基づいて、第１クエリの表記に変更が必要か否かを判定する。

これにより、実施形態に係る情報処理装置１００は、ユーザが入力したクエリと、クエリの入力に関するコンテキストを基に、クエリに変更が必要か否かを判定することにより、ユーザが入力したクエリの変更要否を適切に判定することができる。

また、実施形態に係る情報処理装置１００において、取得部１３１は、履歴情報に基づいて学習されたモデルであって、クエリと当該クエリに対応するコンテキスト情報との入力に応じて、当該クエリの表記に変更が必要か否かを示すスコアを出力するモデルを取得する。判定部１３３は、第１クエリと第１コンテキスト情報とをモデルに入力することにより、モデルが出力するスコアに基づいて、第１クエリの表記に変更が必要か否かを判定する。

これにより、実施形態に係る情報処理装置１００は、過去の履歴を基に学習されたモデルを用いることにより、ユーザが入力したクエリの変更要否を適切に判定することができる。

また、実施形態に係る情報処理装置１００において、判定部１３３は、モデルが出力するスコアと閾値との比較に基づいて、第１クエリの表記に変更が必要か否かを判定する。

これにより、実施形態に係る情報処理装置１００は、モデルが出力するスコアと閾値との比較により、クエリの変更要否を判定することにより、ユーザが入力したクエリの変更要否を適切に判定することができる。

また、実施形態に係る情報処理装置１００において、判定部１３３は、モデルが出力するスコアが閾値以上である場合、第１クエリの表記に変更が必要であると判定する。

これにより、実施形態に係る情報処理装置１００は、モデルが出力するスコアが閾値以上である場合、クエリに変更が必要であると判定することにより、ユーザが入力したクエリの変更要否を適切に判定することができる。

また、実施形態に係る情報処理装置１００において、判定部１３３は、モデルが出力するスコアが閾値未満である場合、第１クエリの表記に変更が必要ではないと判定する。

これにより、実施形態に係る情報処理装置１００は、モデルが出力するスコアが閾値未満である場合、クエリの表記に変更が必要ではないと判定することにより、ユーザが入力したクエリの変更要否を適切に判定することができる。

また、実施形態に係る情報処理装置１００において、取得部１３１は、第１クエリと、第１クエリの入力時のコンテキストを示す第１コンテキスト情報を取得する。判定部１３３は、第１クエリの入力時の第１ユーザのコンテキストに基づいて、第１クエリの表記に変更が必要か否かを判定する。

これにより、実施形態に係る情報処理装置１００は、クエリの入力時のユーザのコンテキストに基づいて、クエリの変更要否を判定することにより、ユーザが入力したクエリの変更要否を適切に判定することができる。

また、実施形態に係る情報処理装置１００において、取得部１３１は、第１クエリと、第１クエリの入力時に第１ユーザが運動状態であるかを示す第１コンテキスト情報を取得する。判定部１３３は、第１ユーザが運動状態であるか否かに基づいて、第１クエリの表記に変更が必要か否かを判定する。

これにより、実施形態に係る情報処理装置１００は、ユーザが運動状態であるか否かに基づいて、クエリの変更要否を判定することにより、ユーザが入力したクエリの変更要否を適切に判定することができる。

また、実施形態に係る情報処理装置１００において、取得部１３１は、第１クエリと、第１クエリの入力に用いた端末装置１０の仕様を示す第１コンテキスト情報を取得する。判定部１３３は、端末装置の仕様に基づいて、第１クエリの表記に変更が必要か否かを判定する。

これにより、実施形態に係る情報処理装置１００は、ユーザがクエリの入力に用いた端末装置１０の仕様に基づいて、クエリの変更要否を判定することにより、ユーザが入力したクエリの変更要否を適切に判定することができる。

また、実施形態に係る情報処理装置１００において、取得部１３１は、第１クエリと、第１クエリの入力時の時間帯を示す第１コンテキスト情報を取得する。判定部１３３は、第１クエリの入力時の時間帯に基づいて、第１クエリの表記に変更が必要か否かを判定する。

これにより、実施形態に係る情報処理装置１００は、クエリの入力時の時間帯に基づいて、クエリの変更要否を判定することにより、ユーザが入力したクエリの変更要否を適切に判定することができる。

また、実施形態に係る情報処理装置１００において、取得部１３１は、第１クエリと、第１ユーザの属性を示す第１コンテキスト情報を取得する。判定部１３３は、第１ユーザの属性に基づいて、第１クエリの表記に変更が必要か否かを判定する。

これにより、実施形態に係る情報処理装置１００は、ユーザの属性に基づいて、クエリの変更要否を判定することにより、ユーザが入力したクエリの変更要否を適切に判定することができる。

また、実施形態に係る情報処理装置１００において、取得部１３１は、第１クエリと、第１ユーザが過去に入力したクエリの表記の変更要否の傾向を示す第１コンテキスト情報を取得する。判定部１３３は、第１ユーザの傾向に基づいて、第１クエリの表記に変更が必要か否かを判定する。

これにより、実施形態に係る情報処理装置１００は、ユーザが過去に入力したクエリの表記の変更要否の傾向に基づいて、クエリの変更要否を判定することにより、ユーザが入力したクエリの変更要否を適切に判定することができる。

また、実施形態に係る情報処理装置１００は、学習部１３２を有する。学習部１３２は、第２クエリと第２コンテキスト情報との各組合せと、各組合せの第２クエリの表記に変更が必要であったか否かを示す正解データとを用いた機械学習の処理により、モデルを学習する。判定部１３３は、学習部１３２により学習されたモデルを用いて、第１クエリの表記に変更が必要か否かを判定する。

これにより、実施形態に係る情報処理装置１００は、第２クエリと第２コンテキスト情報との各組合せと、正解データを用いてモデルを学習し、学習したモデルを用いることにより、ユーザが入力したクエリの変更要否を適切に判定することができる。

また、実施形態に係る情報処理装置１００において、学習部１３２は、第２クエリに対応する検索結果に対する第２ユーザの行動に基づく正解データを用いて、モデルを学習する。

これにより、実施形態に係る情報処理装置１００は、ユーザの検索結果に対する行動に基づく正解データを用いることにより、適切にモデルを柔軟に学習することができる。

〔６．ハードウェア構成〕
また、上述した実施形態に係る端末装置１０や情報処理装置１００は、例えば図８に示すような構成のコンピュータ１０００によって実現される。以下、情報処理装置１００を例に挙げて説明する。図８は、ハードウェア構成の一例を示す図である。コンピュータ１０００は、出力装置１０１０、入力装置１０２０と接続され、演算装置１０３０、一次記憶装置１０４０、二次記憶装置１０５０、出力Ｉ／Ｆ（Interface）１０６０、入力Ｉ／Ｆ１０７０、ネットワークＩ／Ｆ１０８０がバス１０９０により接続された形態を有する。

演算装置１０３０は、一次記憶装置１０４０や二次記憶装置１０５０に格納されたプログラムや入力装置１０２０から読み出したプログラム等に基づいて動作し、各種の処理を実行する。演算装置１０３０は、例えばＣＰＵ（Central Processing Unit）、ＭＰＵ（Micro Processing Unit）、ＡＳＩＣ（Application Specific Integrated Circuit）やＦＰＧＡ（Field Programmable Gate Array）等により実現される。

一次記憶装置１０４０は、ＲＡＭ（Random Access Memory）等、演算装置１０３０が各種の演算に用いるデータを一次的に記憶するメモリ装置である。また、二次記憶装置１０５０は、演算装置１０３０が各種の演算に用いるデータや、各種のデータベースが登録される記憶装置であり、ＲＯＭ（Read Only Memory）、ＨＤＤ（Hard Disk Drive）、ＳＳＤ（Solid State Drive）、フラッシュメモリ等により実現される。二次記憶装置１０５０は、内蔵ストレージであってもよいし、外付けストレージであってもよい。また、二次記憶装置１０５０は、ＵＳＢメモリやＳＤ（Secure Digital）メモリカード等の取り外し可能な記憶媒体であってもよい。また、二次記憶装置１０５０は、クラウドストレージ（オンラインストレージ）やＮＡＳ（Network Attached Storage）、ファイルサーバ等であってもよい。

出力Ｉ／Ｆ１０６０は、ディスプレイ、プロジェクタ、及びプリンタ等といった各種の情報を出力する出力装置１０１０に対し、出力対象となる情報を送信するためのインターフェイスであり、例えば、ＵＳＢ（Universal Serial Bus）やＤＶＩ（Digital Visual Interface）、ＨＤＭＩ（登録商標）（High Definition Multimedia Interface）といった規格のコネクタにより実現される。また、入力Ｉ／Ｆ１０７０は、マウス、キーボード、キーパッド、ボタン、及びスキャナ等といった各種の入力装置１０２０から情報を受信するためのインターフェイスであり、例えば、ＵＳＢ等により実現される。

また、出力Ｉ／Ｆ１０６０及び入力Ｉ／Ｆ１０７０はそれぞれ出力装置１０１０及び入力装置１０２０と無線で接続してもよい。すなわち、出力装置１０１０及び入力装置１０２０は、ワイヤレス機器であってもよい。

また、出力装置１０１０及び入力装置１０２０は、タッチパネルのように一体化していてもよい。この場合、出力Ｉ／Ｆ１０６０及び入力Ｉ／Ｆ１０７０も、入出力Ｉ／Ｆとして一体化していてもよい。

なお、入力装置１０２０は、例えば、ＣＤ（Compact Disc）、ＤＶＤ（Digital Versatile Disc）、ＰＤ（Phase change rewritable Disk）等の光学記録媒体、ＭＯ（Magneto-Optical disk）等の光磁気記録媒体、テープ媒体、磁気記録媒体、又は半導体メモリ等から情報を読み出す装置であってもよい。

ネットワークＩ／Ｆ１０８０は、ネットワークＮを介して他の機器からデータを受信して演算装置１０３０へ送り、また、ネットワークＮを介して演算装置１０３０が生成したデータを他の機器へ送信する。

演算装置１０３０は、出力Ｉ／Ｆ１０６０や入力Ｉ／Ｆ１０７０を介して、出力装置１０１０や入力装置１０２０の制御を行う。例えば、演算装置１０３０は、入力装置１０２０や二次記憶装置１０５０からプログラムを一次記憶装置１０４０上にロードし、ロードしたプログラムを実行する。

例えば、コンピュータ１０００が情報処理装置１００として機能する場合、コンピュータ１０００の演算装置１０３０は、一次記憶装置１０４０上にロードされたプログラムを実行することにより、制御部１３０の機能を実現する。また、コンピュータ１０００の演算装置１０３０は、ネットワークＩ／Ｆ１０８０を介して他の機器から取得したプログラムを一次記憶装置１０４０上にロードし、ロードしたプログラムを実行してもよい。また、コンピュータ１０００の演算装置１０３０は、ネットワークＩ／Ｆ１０８０を介して他の機器と連携し、プログラムの機能やデータ等を他の機器の他のプログラムから呼び出して利用してもよい。

〔７．その他〕
以上、本願の実施形態を説明したが、これら実施形態の内容により本発明が限定されるものではない。また、前述した構成要素には、当業者が容易に想定できるもの、実質的に同一のもの、いわゆる均等の範囲のものが含まれる。さらに、前述した構成要素は適宜組み合わせることが可能である。さらに、前述した実施形態の要旨を逸脱しない範囲で構成要素の種々の省略、置換又は変更を行うことができる。

また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部又は一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部又は一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。

また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部又は一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的又は物理的に分散・統合して構成することができる。

例えば、上述した情報処理装置１００は、複数のサーバコンピュータで実現してもよく、また、機能によっては外部のプラットホーム等をＡＰＩ（Application Programming Interface）やネットワークコンピューティング等で呼び出して実現するなど、構成は柔軟に変更できる。

また、上述してきた実施形態及び変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。

また、上述してきた「部（section、module、unit）」は、「手段」や「回路」などに読み替えることができる。例えば、取得部は、取得手段や取得回路に読み替えることができる。

１情報処理システム
１００情報処理装置
１２０記憶部
１２１学習用データ記憶部
１２２モデル情報記憶部
１３０制御部
１３１取得部
１３２学習部
１３３判定部
１３４処理部
１３５提供部
１０端末装置
１１通信部
１２記憶部
１３入力部
１４表示部
１５制御部
１５１受付部
１５２送信部
１５３受信部
１５４処理部

Claims

第１ユーザが入力したクエリである第１クエリと、前記第１クエリの入力に関するコンテキストを示すコンテキスト情報である第１コンテキスト情報を取得する取得部と、
過去に第２ユーザにより入力されたクエリである第２クエリ及び前記第２クエリに対応する前記コンテキスト情報である第２コンテキスト情報を含む履歴情報と、前記第１クエリと、前記第１コンテキスト情報とに基づいて、前記第１クエリの表記に変更が必要か否かを判定する判定部と、
を備え、
前記取得部は、
前記履歴情報に基づいて学習されたモデルであって、クエリと当該クエリに対応する前記コンテキスト情報との入力に応じて、当該クエリの表記に変更が必要か否かを示すスコアを出力するモデルを取得し、
前記判定部は、
前記第１クエリと前記第１コンテキスト情報とを前記モデルに入力することにより、前記モデルが出力するスコアに基づいて、前記第１クエリの表記に変更が必要か否かを判定する
ことを特徴とする情報処理装置。
前記判定部は、
前記モデルが出力する前記スコアと閾値との比較に基づいて、前記第１クエリの表記に変更が必要か否かを判定する
ことを特徴とする請求項１に記載の情報処理装置。
前記判定部は、
前記モデルが出力する前記スコアが前記閾値以上である場合、前記第１クエリの表記に変更が必要であると判定する
ことを特徴とする請求項２に記載の情報処理装置。
前記判定部は、
前記モデルが出力する前記スコアが前記閾値未満である場合、前記第１クエリの表記に変更が必要ではないと判定する
ことを特徴とする請求項２または請求項３に記載の情報処理装置。
前記取得部は、
前記第１クエリと、前記第１クエリの入力時の前記コンテキストを示す前記第１コンテキスト情報を取得し、
前記判定部は、
前記第１クエリの入力時の前記第１ユーザの前記コンテキストに基づいて、前記第１クエリの表記に変更が必要か否かを判定する
ことを特徴とする請求項１～４のいずれか１項に記載の情報処理装置。
前記取得部は、
前記第１クエリと、前記第１クエリの入力時に前記第１ユーザが運動状態であるかを示す前記第１コンテキスト情報を取得し、
前記判定部は、
前記第１ユーザが運動状態であるか否かに基づいて、前記第１クエリの表記に変更が必要か否かを判定する
ことを特徴とする請求項５に記載の情報処理装置。
前記取得部は、
前記第１クエリと、前記第１クエリの入力に用いた端末装置の仕様を示す前記第１コンテキスト情報を取得し、
前記判定部は、
前記端末装置の仕様に基づいて、前記第１クエリの表記に変更が必要か否かを判定する
ことを特徴とする請求項５または請求項６に記載の情報処理装置。
前記取得部は、
前記第１クエリと、前記第１クエリの入力時の時間帯を示す前記第１コンテキスト情報を取得し、
前記判定部は、
前記第１クエリの入力時の前記時間帯に基づいて、前記第１クエリの表記に変更が必要か否かを判定する
ことを特徴とする請求項５～７のいずれか１項に記載の情報処理装置。
前記取得部は、
前記第１クエリと、前記第１ユーザの属性を示す前記第１コンテキスト情報を取得し、
前記判定部は、
前記第１ユーザの前記属性に基づいて、前記第１クエリの表記に変更が必要か否かを判定する
ことを特徴とする請求項１～８のいずれか１項に記載の情報処理装置。
前記取得部は、
前記第１クエリと、前記第１ユーザが過去に入力したクエリの表記の変更要否の傾向を示す前記第１コンテキスト情報を取得し、
前記判定部は、
前記第１ユーザの前記傾向に基づいて、前記第１クエリの表記に変更が必要か否かを判定する
ことを特徴とする請求項１～９のいずれか１項に記載の情報処理装置。
前記第２クエリと前記第２コンテキスト情報との各組合せと、前記各組合せの前記第２クエリの表記に変更が必要であったか否かを示す正解データとを用いた機械学習の処理により、前記モデルを学習する学習部、
をさらに備え、
前記判定部は、
前記学習部により学習された前記モデルを用いて、前記第１クエリの表記に変更が必要か否かを判定する
ことを特徴とする請求項１～１０のいずれか１項に記載の情報処理装置。
前記学習部は、
前記第２クエリに対応する検索結果に対する前記第２ユーザの行動に基づく前記正解データを用いて、前記モデルを学習する
ことを特徴とする請求項１１に記載の情報処理装置。
コンピュータが実行する情報処理方法であって、
第１ユーザが入力したクエリである第１クエリと、前記第１クエリの入力に関するコンテキストを示すコンテキスト情報である第１コンテキスト情報を取得する取得工程と、
過去に第２ユーザにより入力されたクエリである第２クエリ及び前記第２クエリに対応する前記コンテキスト情報である第２コンテキスト情報を含む履歴情報と、前記第１クエリと、前記第１コンテキスト情報とに基づいて、前記第１クエリの表記に変更が必要か否かを判定する判定工程と、
を含み、
前記取得工程は、
前記履歴情報に基づいて学習されたモデルであって、クエリと当該クエリに対応する前記コンテキスト情報との入力に応じて、当該クエリの表記に変更が必要か否かを示すスコアを出力するモデルを取得し、
前記判定工程は、
前記第１クエリと前記第１コンテキスト情報とを前記モデルに入力することにより、前記モデルが出力するスコアに基づいて、前記第１クエリの表記に変更が必要か否かを判定する
ことを特徴とする情報処理方法。
第１ユーザが入力したクエリである第１クエリと、前記第１クエリの入力に関するコンテキストを示すコンテキスト情報である第１コンテキスト情報を取得する取得手順と、
過去に第２ユーザにより入力されたクエリである第２クエリ及び前記第２クエリに対応する前記コンテキスト情報である第２コンテキスト情報を含む履歴情報と、前記第１クエリと、前記第１コンテキスト情報とに基づいて、前記第１クエリの表記に変更が必要か否かを判定する判定手順と、
をコンピュータに実行させ、
前記取得手順は、
前記履歴情報に基づいて学習されたモデルであって、クエリと当該クエリに対応する前記コンテキスト情報との入力に応じて、当該クエリの表記に変更が必要か否かを示すスコアを出力するモデルを取得し、
前記判定手順は、
前記第１クエリと前記第１コンテキスト情報とを前記モデルに入力することにより、前記モデルが出力するスコアに基づいて、前記第１クエリの表記に変更が必要か否かを判定する
ことを特徴とする情報処理プログラム。