WO2021200200A1

WO2021200200A1 - 情報処理装置及び情報処理方法

Info

Publication number: WO2021200200A1
Application number: PCT/JP2021/011010
Authority: WO
Inventors: 亮介三谷
Original assignee: ソニーグループ株式会社
Priority date: 2020-03-30
Filing date: 2021-03-18
Publication date: 2021-10-07
Also published as: JP2021162917A

Abstract

本開示に係る情報処理装置は、品詞の推定対象となる文字列を取得する取得部と、前記文字列が変換されたバイト列に基づいて、前記文字列の品詞を推定する品詞推定情報を生成する生成部と、を備える。

Description

情報処理装置及び情報処理方法

　本開示は、情報処理装置及び情報処理方法に関する。

　文章中の各単語（文字列）の品詞を推定する技術が提供されている。例えば、形態素の単位に分割して品詞を付与する形態素解析システムが提供されている（例えば、特許文献１）。

特開２０１９－１４４８４４号公報

　従来技術によれば、入力文章を受け取り、事前に定義された形態素の単位に分割し、品詞などを付与する。

　しかしながら、従来技術は、文字列の品詞を適切に推定することができるとは限らない。例えば、従来技術は、日本語を対象として、事前に定義された形態素の単位に分割し、その分割を基に品詞を付与している。そのため、従来技術は、日本語以外の言語に対応することが難しく、また、事前に定義された形態素に含まれない文字列（未知語）の品詞を適切に推定することは難しいといった課題がある。そのため、柔軟な文字列の品詞推定を可能にすることが望まれている。

　そこで、本開示では、柔軟な文字列の品詞推定を可能にすることができる情報処理装置及び情報処理方法を提案する。

　上記の課題を解決するために、本開示に係る一形態の情報処理装置は、品詞の推定対象となる文字列を取得する取得部と、前記文字列が変換されたバイト列に基づいて、前記文字列の品詞を推定する品詞推定情報を生成する生成部と、を備える。

本開示の実施形態に係る情報処理の一例を示す図である。本開示の実施形態に係る品詞推定情報の生成処理の一例を示す図である。本開示の実施形態に係る情報処理装置の構成例を示す図である。本開示の実施形態に係るモデル情報記憶部の一例を示す図である。本開示の実施形態に係る品詞推定情報記憶部の一例を示す図である。本開示の実施形態に係るモデルの一例を示す図である。本開示の実施形態に係る情報処理の手順を示すフローチャートである。品詞推定の一例を示す図である。品詞推定の一例を示す図である。品詞推定のフローの一例を示す図である。形態素解析のフローの一例を示す図である。応用アプリケーションのフローの一例を示す図である。アプリケーション全体のフローの一例を示す図である。形態素解析の処理概要を示す図である。未知語を含む形態素解析の処理の一例を示す図である。未知語を含む形態素解析の処理の一例を示す図である。未知語を含む形態素解析の処理の一例を示す図である。本開示の変形例に係る情報処理システムの構成例を示す図である。本開示の変形例に係る情報処理装置の構成例を示す図である。情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。

　以下に、本開示の実施形態について図面に基づいて詳細に説明する。なお、この実施形態により本願にかかる情報処理装置及び情報処理方法が限定されるものではない。また、以下の各実施形態において、同一の部位には同一の符号を付することにより重複する説明を省略する。

　以下に示す項目順序に従って本開示を説明する。
　　１．実施形態
　　　１－１．本開示の実施形態に係る情報処理の概要
　　　　１－１－１．背景及び効果等
　　　　１－１－２．モデルの生成
　　　１－２．実施形態に係る情報処理装置の構成
　　　　１－２－１．モデル例
　　　１－３．実施形態に係る情報処理の手順
　　　１－４．品詞推定情報生成例
　　　１－５．処理フロー例
　　　　１－５－１．品詞推定のフロー例
　　　　１－５－２．形態素解析のフロー例
　　　　１－５－３．応用アプリケーションのフロー例
　　　　１－５－４．アプリケーション統合フロー例
　　　１－６．形態素解析
　　　　１－６－１．未知語を含む形態素解析の事例その１
　　　　１－６－２．未知語を含む形態素解析の事例その２
　　　　１－６－３．未知語を含む形態素解析の事例その３
　　２．その他の実施形態
　　　２－１．変形例
　　　２－２．その他の構成例
　　　２－３．その他
　　３．本開示に係る効果
　　４．ハードウェア構成

［１．実施形態］
［１－１．本開示の実施形態に係る情報処理の概要］
　図１及び図２は、本開示の実施形態に係る情報処理の一例を示す図である。具体的には、図１は、文字列が未知語であるか否かに応じて、品詞を推定する処理（推定処理）の一例を示す図である。図２は、未知語を対象として品詞を推定する場合の品詞推定モデル（以下単に「モデル」ともいう）を用いた推定処理の概要を示す。なお、ここで言う未知語とは、所定の辞書に含まれていない文字列をいう。例えば、未知語とは、コーパス等に基づく辞書に含まれていない文字列をいう。

　本開示の実施形態に係る情報処理は、図３に示す情報処理装置１００によって実現される。図３に示す情報処理装置１００は、品詞推定を行う情報処理装置の一例である。情報処理装置１００は、実施形態に係る情報処理を実行する情報処理装置である。情報処理装置１００は、ユーザに利用される端末装置である。図１では、ユーザが利用する端末装置である情報処理装置１００が品詞推定を行う例を示す。例えば、情報処理装置１００は、スマートフォンや、タブレット型端末や、スマートスピーカや、ノート型ＰＣ（Personal　Computer）や、デスクトップＰＣや、携帯電話機や、ＰＤＡ（Personal　Digital　Assistant）等、ユーザによって利用される種々の装置であってもよい。

　なお、品詞推定を行う装置はユーザが利用する端末装置に限らず、どのような装置であってもよい。例えば、品詞推定を行う情報処理装置と、ユーザが利用する端末装置とは別体であってもよい。なお、サーバ側で品詞推定を行う場合のシステム構成等については後述する。

　図１の例では、日本語を一例として説明するが、情報処理装置１００が実行する情報処理は、日本語に限らず、英語やフランス語や韓国語等の種々の言語が対象であってもよい。例えば、情報処理装置１００が実行する情報処理は、後述する辞書情報がある言語であれば、どのような言語を対象としてもよい。例えば、情報処理装置１００が実行する情報処理は、品詞推定モデルがある言語であれば、どのような言語を対象としてもよい。すなわち、情報処理装置１００は、後述する品詞推定の処理が実行可能であれば、どのような言語を対象に処理を行ってもよい。

　図１の例では、説明のために品詞の分類（カテゴリ）として、「noun」、「verb」、「adverb」、「preposition」「adjective」、「auxiliary　verb」の６個を一例として示す。すなわち、図１の例では、対象とする文字列の品詞が、名詞、動詞、副詞、前置詞、形容詞、助動詞のいずれであるかを、情報処理装置１００が推定する場合を示す。なお、図１に示す品詞の分類は一例であり、品詞の分類は上記の６個に限らず、種々の分類であってもよい。また、品詞の分類は、６個より少ない分類であってもよいし、６個より多い分類であってもよい。

　例えば、品詞の分類は、下記の文献に開示されるような十数以上の分類（カテゴリ）であってもよい。このように、品詞の分類には、多言語共通タグセットの情報が用いられてもよい。
　・Universal　POS　tags　<https://universaldependencies.org/u/pos/>

　また、例えば、対象とする言語が日本語である場合、品詞の分類は、下記の文献に開示されるような分類（カテゴリ）であってもよい。このように、品詞の分類には、日本語unidicの情報が用いられてもよい。この場合、例えば品詞の分類として、最上位の分類（大分類）が用いられてもよいし、それよりも下位の分類（中分類、小分類、細分類等）が用いられてもよい。
　・UniDicの品詞体系　<https://www.ogiso.net/wiki/index.php?%BC%F8%B6%C8%BB%F1%CE%C1/UniDic%A4%CE%C9%CA%BB%EC%C2%CE%B7%CF>

　なお、上述した各文献での品詞の分類も一例に過ぎず、品詞の分類は、対象とする言語や分類した品詞の用途等に応じて種々の分類であってもよい。

　また、図１の例では、辞書情報記憶部１４１に記憶されていない文字列を「未知語」として処理する場合を示す。辞書情報記憶部１４１には、辞書に関する情報（以下「辞書情報」ともいう）が格納される。図１に示す辞書情報記憶部１４１は、日本語に関する辞書情報が格納される。例えば、辞書情報記憶部１４１は、各文字列が用いられた文章や各単語の品詞の確率分布を記憶する。例えば、品詞の確率分布は、文字列が用いられた文章のうち、その単語がその品詞として用いられた文章の割合を示す情報である。例えば、図１において単語Ｘの文章が１００個あり、そのうち９０個の文章で単語Ｘが動詞として用いられ、１０個の文章で副詞として用いられている場合、単語Ｘは、動詞が「０．９（＝９０／１００）」、副詞が「０．１（＝１０／１００）」、残りの４つの品詞が「０」の確率分布となる。

　以下、図１について具体的に説明する。図１では、辞書に含まれる文字列、すなわち未知語ではない場合の処理を説明した後、未知語に対する処理を説明する。

　情報処理装置１００は、品詞推定の対象となる文字列ＣＳ１である「注文する」を取得する。例えば、情報処理装置１００は、解析対象となる文章中に含まれる文字列ＣＳ１を取得する。そして、情報処理装置１００は、文字列ＣＳ１が未知語であるか否かを判定する（ステップＳ１１）。情報処理装置１００は、文字列ＣＳ１である「注文する」と、辞書情報記憶部１４１中の文字列とを比較し、文字列ＣＳ１が辞書情報記憶部１４１に含まれているかを判定する。情報処理装置１００は、対象とする文字列と、辞書情報記憶部１４１中の文字列とを比較し、対象とする文字列が辞書情報記憶部１４１に含まれている場合、未知語ではないと判定する。

　図１では、情報処理装置１００は、結果情報ＲＳ１に示すように、文字列ＣＳ１である「注文する」の情報が辞書情報記憶部１４１に含まれているため、文字列ＣＳ１を未知語ではない既知の文字列（以下「既知語」ともいう）であると判定する。すなわち、情報処理装置１００は、文字列ＣＳ１である「注文する」が未知語ではないと判定する。辞書情報記憶部１４１には、文字列ＣＳ１である「注文する」のコーパスや確率分布が記憶されているものとする。図１では、辞書情報記憶部１４１は、文字列ＣＳ１である「注文する」について、名詞が「０．０１」、動詞が「０．９５」、副詞が「０．０２」、前置詞が「０」、形容詞が「０．０１」、助動詞が「０」の確率分布を記憶している。そのため、情報処理装置１００は、文字列ＣＳ１である「注文する」が既知語であると判定する。

　情報処理装置１００は、辞書情報記憶部１４１の情報を用いて、文字列ＣＳ１である「注文する」の品詞を推定する情報（「品詞推定情報」ともいう）を生成する（ステップＳ１２）。情報処理装置１００は、辞書情報記憶部１４１の情報を用いて、文字列ＣＳ１の品詞推定情報を生成する。図１では、情報処理装置１００は、辞書情報記憶部１４１の情報を用いて、文字列ＣＳ１についての品詞の確率分布を示す品詞推定情報ＩＮＦ１を生成する。情報処理装置１００は、辞書情報記憶部１４１から文字列ＣＳ１である「注文する」の情報を抽出し、品詞推定情報ＩＮＦ１を生成する。情報処理装置１００は、名詞がスコア「０．０１」、動詞がスコア「０．９５」、副詞がスコア「０．０２」、前置詞がスコア「０」、形容詞がスコア「０．０１」、助動詞がスコア「０」の確率分布を示す品詞推定情報ＩＮＦ１を生成する。

　このように、情報処理装置１００は、品詞推定の対象となる文字列の情報が既知語である場合、辞書情報記憶部１４１の情報を用いて、その文字列の品詞推定情報を生成する。そして、情報処理装置１００は、品詞推定の対象となる文字列の情報が既知語である場合、辞書情報記憶部１４１の情報を用いて生成した品詞推定情報を用いて、その文字列の品詞を推定する。例えば、情報処理装置１００は、文字列の品詞を、スコアが最大の品詞であると推定してもよい。例えば、情報処理装置１００は、文字列ＣＳ１である「注文する」の品詞を最大のスコア「０．９５」の動詞であると推定してもよい。なお、上記の品詞推定は一例であり、品詞推定情報を用いた具体的な処理については後述する。

　情報処理装置１００は、品詞推定の対象となる文字列ＣＳ２である「タピる」を取得する。例えば、情報処理装置１００は、解析対象となる文章中に含まれる文字列ＣＳ２を取得する。そして、情報処理装置１００は、文字列ＣＳ２が未知語であるか否かを判定する（ステップＳ２１）。情報処理装置１００は、文字列ＣＳ２である「タピる」と、辞書情報記憶部１４１中の文字列とを比較し、文字列ＣＳ２が辞書情報記憶部１４１に含まれているかを判定する。情報処理装置１００は、対象とする文字列と、辞書情報記憶部１４１中の文字列とを比較し、対象とする文字列が辞書情報記憶部１４１に含まれていない場合、未知語であると判定する。

　図１では、情報処理装置１００は、結果情報ＲＳ２に示すように、文字列ＣＳ２である「タピる」の情報が辞書情報記憶部１４１に含まれていないため、文字列ＣＳ２を未知語であると判定する。図１では、辞書情報記憶部１４１には、文字列ＣＳ２である「タピる」の情報が記憶されていないものとする。そのため、情報処理装置１００は、文字列ＣＳ２である「タピる」が未知語であると判定する。

　情報処理装置１００は、辞書情報記憶部１４１の情報を用いて、文字列ＣＳ２である「タピる」の品詞を推定する情報（品詞推定情報）を生成する。図１の例では、情報処理装置１００は、バイト列を入力とし、複数の品詞の各々に対応する複数のスコアを出力する品詞推定モデルＭ１（以下単に「モデルＭ１」ともいう）を用いて、文字列ＣＳ２の品詞を推定する品詞推定情報を生成する。このように、情報処理装置１００は、文字列ＣＳ２に対応するバイト列をモデルＭ１に入力し、文字列ＣＳ２について各品詞のスコアからなる確率分布を示す品詞推定情報を生成する。以下、処理を具体的に説明する。

　まず、情報処理装置１００は、文字列ＣＳ２である「タピる」中の各文字を所定の文字コードに変換する（ステップＳ２２）。情報処理装置１００は、文字列ＣＳ２中の３文字「タ」、「ピ」、「る」の各々を所定の文字コードに変換する。図１では、情報処理装置１００は、「タ」、「ピ」、「る」の各々を文字コード「ＵＴＦ－８」に対応するバイトに変換する。この場合、情報処理装置１００は、「タ」、「ピ」、「る」の各々をＵＴＦ－８に対応する３バイトに変換する。なお、各文字を変換する文字コードは、ＵＴＦ－８に限らず、文字をバイト等の数値へ変換する文字コードであれば、どのような文字コードであってもよい。例えば、各文字を変換する文字コードは、ＵＴＦ－１６、Ｓｈｉｆｔ＿ＪＩＳ、ＥＵＣ等であってもよい。なお、上記は一例であり、各文字を変換する文字コードは、上記以外の文字コードであってもよい。

　情報処理装置１００は、文字列ＣＳ２である「タピる」中の各文字を所定の文字コードに変換する変換処理により、文字列ＣＳ２に対応するバイト列ＢＳ２を生成する。情報処理装置１００は、文字「タ」をＵＴＦ－８に対応する３バイト「０ｘｅ３」、「０ｘ８２」、「０ｘｂｆ」に変換する。情報処理装置１００は、文字「ピ」をＵＴＦ－８に対応する３バイト「０ｘｅ３」、「０ｘ８３」、「０ｘ９４」に変換する。情報処理装置１００は、文字「る」をＵＴＦ－８に対応する３バイト「０ｘｅ３」、「０ｘ８２」、「０ｘ８ｂ」に変換する。これにより、情報処理装置１００は、文字列ＣＳ２に対応するバイト列ＢＳ２を生成する。

　そして、情報処理装置１００は、バイト列ＢＳ２をモデルＭ１に入力する（ステップＳ２３）。ここで、図２を用いて、モデルＭ１の概要について説明する。図２は、本開示の実施形態に係る品詞推定情報の生成処理の一例を示す図である。なお、図１と同様の点については同じ符号を付して説明を省略する。図２に示すように、モデルＭ１は、文字列ＣＳ２が変換されたバイト列ＢＳ２のようなバイト列を入力として、その入力されたバイト列に対応する文字列の品詞を推定する情報（スコア）を出力する。図２では、モデルＭ１は、バイト列が入力された場合、入力されたバイト列に対応する文字列に対する複数の品詞の確率分布を示す情報（スコア）を出力する。このように、モデルＭ１は、バイト列が入力された場合、入力されたバイト列に対応する文字列について、複数の品詞の各々に対応する複数のスコアを出力する。

　図２に示す例では、モデルＭ１は、「Input　embedding」で示す入力層と、「Intermediate　representation」で示す中間層と、「Series　of　POS　probability」で示す出力層とを有するネットワーク構成である。例えば、モデルＭ１は、図６に示すネットワークＮＷ１のようなネットワーク構成であってもよい。例えば、モデルＭ１は、文字列が変換されたバイト列が入力層に入力された場合、入力されたバイト列に対応する文字列が各品詞である可能性（確率）を示すスコアを出力層から出力する。図２に示す例では、モデルＭ１は、「noun」、「verb」、「adverb」、「preposition」「adjective」、「auxiliary　verb」の６個の品詞の各々のスコアを出力する。

　モデルＭ１は、バイト列ＢＳ２の入力に応じて、出力スコアＳＣ１に示すような各品詞のスコアを出力する。モデルＭ１は、バイト列ＢＳ２に対応する文字列「タピる」について、名詞のスコア「０．２１」、動詞のスコア「０．８６」、副詞のスコア「０．０２」、前置詞のスコア「０．０１」、形容詞のスコア「０．１５」、助動詞のスコア「０．０１」を出力する。

　図１に戻って、説明を続ける。情報処理装置１００は、モデルＭ１の出力結果を用いて、文字列ＣＳ２品詞推定情報を生成する。図１では、情報処理装置１００は、モデルＭ１の出力結果を用いて、文字列ＣＳ２についての品詞の確率分布を示す品詞推定情報ＩＮＦ２を生成する。情報処理装置１００は、辞書情報記憶部１４１から文字列ＣＳ２である「タピる」の情報を抽出し、品詞推定情報ＩＮＦ２を生成する。情報処理装置１００は、名詞がスコア「０．２１」、動詞がスコア「０．８６」、副詞がスコア「０．０２」、前置詞がスコア「０．０１」、形容詞がスコア「０．１５」、助動詞がスコア「０．０１」の確率分布を示す品詞推定情報ＩＮＦ２を生成する。

　このように、情報処理装置１００は、品詞推定の対象となる文字列の情報が未知語である場合、モデルＭ１を用いて、その文字列の品詞推定情報を生成する。そして、情報処理装置１００は、品詞推定の対象となる文字列の情報が未知語である場合、モデルＭ１の出力結果を用いて生成した品詞推定情報を用いて、その文字列の品詞を推定する。例えば、情報処理装置１００は、文字列の品詞を、スコアが最大の品詞であると推定してもよい。例えば、情報処理装置１００は、文字列ＣＳ２である「タピる」の品詞を最大のスコア「０．８６」の動詞であると推定してもよい。このように、上記の図１では、品詞がわからない単語「タピる」を入力した場合を示す。この場合、未知語「タピる」は動詞であると解析されることが期待される。なお、上記の品詞推定は一例であり、品詞推定情報を用いた具体的な処理については後述する。

　上述のように、情報処理装置１００は、文字列が既知語と未知語とのいずれであるかに応じて、品詞の推定に用いる情報を切り替えて、文字列の品詞を推定する品詞推定情報を生成する。具体的には、情報処理装置１００は、文字列が既知語である場合、辞書の情報を用いて、文字列の品詞推定情報を生成する。また、情報処理装置１００は、文字列が未知語である場合、文字列を変換したバイト列と、そのバイト列を入力とするモデルとを用いて、文字列の品詞推定情報を生成する。これにより、情報処理装置１００は、文字列が未知語である場合であっても、文字列の品詞を適切に推定することができる。したがって、情報処理装置１００は、柔軟な文字列の品詞推定を可能にすることができる。

[１－１－１．背景及び効果等]
　例えば、テキスト文字列を形態素（意味を持つ最小要素）に分割する形態素解析では、どの文字列が１形態素になるかをあらかじめ定義された辞書を用いて解析（文字列からの単語認定と品詞付与）を行う。この際、辞書に登録されていない単語（未知語）が生起した際、どのような単語を認定すればいいのかがわからなくなり、解析がストップするなどの不正な解析結果を出力してしまう場合がある。

　従来は、文字種の連続性に着目するルールや生起しやすい品詞を列挙するルール、文字列の先頭、末尾N文字を抽出しておくルール等のルールベースアルゴリズムで解析を行っていた。しかし、言語ごとに異なるルールを考案する、または、実装方式を変更する必要があり、実装、メンテナンスのためのコストが高いという課題がある。

　一方で、情報処理装置１００は、未知語候補の文字列に対して直接品詞を推定するアルゴリズムを用いて、文字列の品詞を推定する。このアルゴリズムでは、入力である単語候補（文字列）をbyte単位に分割した上で、機械学習による特徴量抽出を行う。その結果を分類アルゴリズムによって、品詞毎の生起確率へ回帰させる。その結果、情報処理装置１００は、出力として、単語候補への品詞毎の確率分布を得ることができる。

　これにより、情報処理装置１００は、「#tion」、「pre#」、「#ly」のような先頭、接尾の文字列が持つ情報や、既存の辞書に登録済みの単語が持つ情報によって、未知の単語に対する品詞の確率分布を補完、予測することが可能となる。また、情報処理装置１００は、byte単位で情報を抽出することで、日本語、中国語などのマルチバイト文字を頻繁に用いる言語であっても同じアルゴリズムで運用が可能となる。また、情報処理装置１００は、既存の実装でよく用いられる「#tion」は名詞になりやすいといったヒューリスティックスに関しても、データから直接的に学習が可能であるために、各言語における同様の知識を要求することなく、適切な品詞の推定が可能となる。

　また、情報処理装置１００は、上述のように、文字単位での処理、図１の例ではバイト単位で処理することにより、大幅なベクトル空間サイズの減少を行うことができる。また、情報処理装置１００は、分割単位の決定時に複数の未知の分割候補を仮定できるために、分割誤りを抑制することができる。

［１－１－２．モデルの生成］
　ここで、図１に示すモデルＭ１のような品詞推定モデルの生成について説明する。情報処理装置１００は、辞書情報を用いて、モデルＭ１のような品詞推定モデルを生成する。情報処理装置１００は、日本語の辞書情報を用いて、モデルＭ１を生成する。例えば、情報処理装置１００は、辞書情報記憶部１４１中の日本語の辞書情報を用いて、モデルＭ１を生成する。

　情報処理装置１００は、日本語の辞書情報中の既知語とその既知語の確率分布とを用いて、日本語の品詞推定モデルであるモデルＭ１を生成する。情報処理装置１００は、既知語の確率分布を、その既知語の正解情報として用いる。この場合、情報処理装置１００は、既知語に対応するバイト列が入力された場合に、その既知語の確率分布に対応する各品詞のスコアが出力されるように学習処理を行うことで、日本語に対応するモデルＭ１を生成する。

　例えば、情報処理装置１００は、既知語「注文する」の正解情報として、辞書情報記憶部１４１中の既知語「注文する」の確率分布を用いる。この場合、情報処理装置１００は、既知語「注文する」の正解情報として、名詞がスコア「０．０１」、動詞がスコア「０．９５」、副詞がスコア「０．０２」、前置詞がスコア「０」、形容詞がスコア「０．０１」、助動詞がスコア「０」の確率分布を用いる。例えば、情報処理装置１００は、既知語「注文する」に対応するバイト列が入力された場合に、既知語「注文する」の確率分布に対応する各品詞のスコアが出力されるように学習処理を行う。この場合、情報処理装置１００は、名詞に対応する出力値が「０．０１」、動詞に対応する出力値が「０．９５」、副詞に対応する出力値が「０．０２」、前置詞に対応する出力値が「０」、形容詞に対応する出力値が「０．０１」、助動詞に対応する出力値が「０」になるように学習処理を行う。このように、情報処理装置１００は、既知語の情報を用いて、品詞推定モデルを学習する。なお、上記は一例であり、情報処理装置１００は、種々の手法によりモデルＭ１等の品詞推定モデルを学習してもよい。

　また、情報処理装置１００は、英語の辞書情報を用いて、図８及び図９に示すようなモデルＭ２を生成する。情報処理装置１００は、英語の辞書情報中の既知語とその既知語の確率分布とを用いて、英語の品詞推定モデルであるモデルＭ２を生成する。情報処理装置１００は、既知語の確率分布を、その既知語の正解情報として用いる。この場合、情報処理装置１００は、既知語に対応するバイト列が入力された場合に、その既知語の確率分布に対応する各品詞のスコアが出力されるように学習処理を行うことで、英語に対応するモデルＭ２を生成する。なお、情報処理装置１００は、上述した日本語、英語に限らず、スペイン語やアラビア語やロシア語等、種々の言語に対応する品詞推定モデルを生成する。

　なお、品詞の分類が共通である言語（「分類共通言語」ともいう）が複数ある場合、情報処理装置１００は、複数の分類共通言語に共通して対応可能な品詞推定モデル（「共通品詞推定モデル」ともいう）を生成してもよい。例えば、情報処理装置１００は、言語ＬＡと言語ＬＢとが分類共通言語である場合、言語ＬＡと言語ＬＢとの両方に対応可能な共通品詞推定モデルを生成してもよい。この場合、情報処理装置１００は、言語ＬＡの辞書情報と、言語ＬＢの辞書情報とを用いて、共通品詞推定モデルを生成する。情報処理装置１００は、言語ＬＡの未知語等の文字列に対して共通品詞推定モデルを用いて、その文字列の品詞推定情報を生成する。また、情報処理装置１００は、言語ＬＢの未知語等の文字列に対して共通品詞推定モデルを用いて、その文字列の品詞推定情報を生成する。

　例えば、情報処理装置１００は、日本語と英語とが分類共通言語である場合、日本語と英語との両方に対応可能な共通品詞推定モデルを生成してもよい。この場合、モデルＭ１とモデルＭ２とは同じ品詞推定モデルであってもよい。

　また、情報処理装置１００は、バイト列以外を入力とする品詞推定モデルを生成してもよい。例えば、情報処理装置１００は、文字列の画像を入力とする品詞推定モデルを生成してもよい。この場合、情報処理装置１００は、文字列の各文字の画像群を入力として、その画像群に対応する文字列の品詞推定情報を出力（生成）する品詞推定モデルを学習（生成）してもよい。この場合、情報処理装置１００は、品詞の推定対象の文字列の各文字の画像群を品詞推定モデルに入力し、品詞推定情報を生成してもよい。また、例えば、情報処理装置１００は、文字列を発話した音声等の時系列情報を入力とする品詞推定モデルを生成してもよい。この場合、情報処理装置１００は、文字列を発話した音声等の時系列情報を入力として、その時系列情報に対応する文字列の品詞推定情報を出力（生成）する品詞推定モデルを学習（生成）してもよい。この場合、情報処理装置１００は、品詞の推定対象の文字列を発話した音声等の時系列情報を品詞推定モデルに入力し、品詞推定情報を生成してもよい。

　なお、情報処理装置１００は、品詞推定モデルの生成を行わない場合、品詞推定モデルを生成する外部のモデル生成装置から、品詞推定モデルを取得してもよい。例えば、情報処理装置１００は、品詞推定の対象となる言語（対象言語）に対応可能な品詞推定モデルを、モデル生成装置から取得してもよい。例えば、情報処理装置１００は、品詞推定の対象となる言語（対象言語）に対応する品詞推定モデルをモデル生成装置に要求し、モデル生成装置から対象言語の品詞推定モデルを取得してもよい。

［１－２．実施形態に係る情報処理装置の構成］
　次に、実施形態に係る情報処理を実行する情報処理装置の一例である情報処理装置１００の構成について説明する。図３は、本開示の実施形態に係る情報処理装置１００の構成例を示す図である。例えば、図３に示す情報処理装置１００は、情報処理装置の一例である。情報処理装置１００は、後述する情報処理装置としての機能を実現するコンピュータである。

　図３に示すように、情報処理装置１００は、通信部１１と、入力部１２と、表示部１３と、記憶部１４と、制御部１５とを有する。図３の例では、情報処理装置１００は、情報処理装置１００の管理者等から各種操作を受け付ける入力部１２（例えば、キーボードやマウス等）や、各種情報を表示するための表示部１３（例えば、液晶ディスプレイ等）を有する。

　通信部１１は、例えば、ＮＩＣ（Network　Interface　Card）や通信回路等によって実現される。通信部１１は、通信網Ｎ（インターネット等のネットワーク）と有線又は無線で接続され、通信網Ｎを介して、他の装置等との間で情報の送受信を行う。

　入力部１２は、ユーザから各種操作が入力される。入力部１２は、ユーザによる入力を受け付ける。入力部１２は、ユーザによる学習方法の選択を受け付けてもよい。入力部１２は、情報処理装置１００に設けられたキーボードやマウスやタッチパネルを介してユーザからの各種操作を受け付けてもよい。

　表示部１３は、各種情報を表示する。表示部１３は、ディスプレイ等の表示装置（表示部）であり、各種情報を表示する。表示部１３は、生成部１５３により生成された情報を表示する。表示部１３は、解析部１５４による解析結果の情報を表示する。

　また、情報処理装置１００は、表示部１３に限らず、情報を出力する機能構成を有してもよい。なお、情報処理装置１００は、情報を音声として出力する機能を有してもよい。例えば、情報処理装置１００は、音声を出力するスピーカー等の音声出力部を有してもよい。

　記憶部１４は、例えば、ＲＡＭ（Random　Access　Memory)、フラッシュメモリ（Flash　Memory）等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。記憶部１４は、辞書情報記憶部１４１と、モデル情報記憶部１４２と、品詞推定情報記憶部１４３とを有する。

　図示を省略するが、辞書情報記憶部１４１には、辞書に関する各種情報が格納される。辞書情報記憶部１４１は、辞書情報を記憶する。辞書情報記憶部１４１は、単語に関する辞書情報を記憶する。例えば、辞書情報記憶部１４１は、各単語が用いられた文章等の文字情報（コーパス）や各単語の品詞の確率分布を記憶する。

　辞書情報記憶部１４１には、言語ごとの辞書情報が記憶されてもよい。この場合、辞書情報記憶部１４１には、日本語用の辞書情報である日本語辞書情報や、英語用の辞書情報である英語辞書情報や、ドイツ語用の辞書情報であるドイツ語辞書情報や、中国語用の辞書情報である中国語辞書情報等、種々の言語の辞書情報が記憶されてもよい。

　また、辞書情報記憶部１４１は、各データが学習用データであるか、評価用データであるか等を特定可能に記憶する。例えば、辞書情報記憶部１４１は、学習用データと評価用データとを区別可能に記憶する。辞書情報記憶部１４１は、各データが学習用データや評価用データであるかを識別する情報を記憶してもよい。情報処理装置１００は、学習用データとして用いられる各データと正解情報とに基づいて、モデルを学習する。情報処理装置１００は、評価用データとして用いられる各データと正解情報とに基づいて、モデルの精度を測定する。情報処理装置１００は、評価用データを入力した場合にモデルが出力する出力結果と、正解情報とを比較した結果を収集することにより、モデルの精度を測定する。

　実施形態に係るモデル情報記憶部１４２は、モデルに関する情報を記憶する。例えば、モデル情報記憶部１４２は、モデル（ネットワーク）の構造を示す情報（モデルデータ）を記憶する。図４は、本開示の実施形態に係るモデル情報記憶部の一例を示す図である。図４に、実施形態に係るモデル情報記憶部１４２の一例を示す。図４に示した例では、モデル情報記憶部１４２は、「モデルＩＤ」、「用途」、「モデルデータ」といった項目が含まれる。

　「モデルＩＤ」は、モデルを識別するための識別情報を示す。「用途」は、対応するモデルの用途を示す。「モデルデータ」は、モデルのデータを示す。図４では「モデルデータ」に「ＭＤＴ１」といった概念的な情報が格納される例を示したが、実際には、モデルに含まれるネットワークに関する情報や関数等、そのモデルを構成する種々の情報が含まれる。

　図４に示す例では、モデルＩＤ「Ｍ１」により識別されるモデル（モデルＭ１）は、用途が「品詞推定」であることを示す。モデルＭ１は、単語の品詞推定に用いられるモデルであることを示す。また、モデルＭ１のモデルデータは、モデルデータＭＤＴ１であることを示す。図４では、モデルＭ１のみを図示するが、モデル情報記憶部１４２は、複数のモデルを記憶してもよい。モデル情報記憶部１４２は、モデルＭ１やモデルＭ２等、各言語の各々に対応する品詞推定モデルを記憶してもよい。

　なお、モデル情報記憶部１４２は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、モデル情報記憶部１４２は、学習処理により学習（生成）されたモデルの情報を記憶する。モデル情報記憶部１４２は、学習処理により学習（生成）されたモデルＭ１のパラメータ情報を記憶する。

　品詞推定情報記憶部１４３は、品詞推定に関する各種情報を記憶する。図５は、本開示の実施形態に係る品詞推定情報記憶部の一例を示す図である。例えば、品詞推定情報記憶部１４３は、品詞推定の対象となった未知語等の文字列やその品詞の推定結果に関する各種情報を記憶する。図５では、品詞推定の結果として、各品詞のスコアに基づく確率分布を記憶する場合を示す。実施形態に係る品詞推定情報記憶部１４３の一例を示す。図５の例では、辞書情報記憶部１４１は、「対象文字列」、「品詞ＩＤ」、「品詞」、「確率分布（スコア）」といった項目が含まれる。

　「対象文字列」は、品詞推定の対象となった文字列を示す。「品詞ＩＤ」は、品詞を識別するための識別情報を示す。また、「品詞」は、品詞ＩＤに対応する品詞を示す。「確率分布（スコア）」は、対応する品詞の確率分布（スコア）を示す。「確率分布（スコア）」の値が大きい品詞ほど、対象文字列の品詞である可能性が高いことを示す。

　図５の例では、対象文字列「タピる」の品詞となり得る候補には、品詞ＩＤ「ＰＳ１」～「ＰＳ６」等により識別される複数の品詞が含まれることを示す。品詞ＩＤ「ＰＳ１」により識別される品詞（品詞ＰＳ１）は、「noun」、すなわち名詞であることを示す。品詞ＩＤ「ＰＳ２」により識別される品詞（品詞ＰＳ２）は、「verb」、すなわち動詞であることを示す。品詞ＩＤ「ＰＳ３」により識別される品詞（品詞ＰＳ３）は、「adverb」、すなわち副詞であることを示す。品詞ＩＤ「ＰＳ４」により識別される品詞（品詞ＰＳ４）は、「preposition」、すなわち前置詞であることを示す。品詞ＩＤ「ＰＳ５」により識別される品詞（品詞ＰＳ５）は、「adjective」、すなわち形容詞であることを示す。品詞ＩＤ「ＰＳ６」により識別される品詞（品詞ＰＳ６）は、「auxiliary　verb」、すなわち助動詞であることを示す。

　図１の例では、対象文字列「タピる」の品詞は、名詞が「０．２１」、動詞が「０．８６」、副詞が「０．０２」、前置詞が「０．０１」、形容詞が「０．１５」、助動詞が「０．０１」となる確率分布であることを示す。

　なお、品詞推定情報記憶部１４３は、上記に限らず、目的に応じて種々の情報を記憶してもよい。品詞推定情報記憶部１４３は、「確率分布（スコア）」の各品詞のスコアを、各データに対応する正解情報（正解ラベル）として記憶する。

　図３に戻り、説明を続ける。制御部１５は、例えば、ＣＰＵ（Central　Processing　Unit）やＭＰＵ（Micro　Processing　Unit）等によって、情報処理装置１００内部に記憶されたプログラム（例えば、本開示に係る情報処理プログラム）がＲＡＭ（Random　Access　Memory）等を作業領域として実行されることにより実現される。また、制御部１５は、コントローラ（controller）であり、例えば、ＡＳＩＣ（Application　Specific　Integrated　Circuit）やＦＰＧＡ（Field　Programmable　Gate　Array）等の集積回路により実現されてもよい。

　図３に示すように、制御部１５は、取得部１５１と、学習部１５２と、生成部１５３と、解析部１５４と、送信部１５５とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部１５の内部構成は、図３に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。

　取得部１５１は、各種情報を取得する。取得部１５１は、外部の情報処理装置から各種情報を取得する。取得部１５１は、記憶部１４から各種情報を取得する。取得部１５１は、入力部１２により受け付けられた情報を取得する。

　取得部１５１は、記憶部１４から各種情報を取得する。取得部１５１は、辞書情報記憶部１４１やモデル情報記憶部１４２や品詞推定情報記憶部１４３から各種情報を取得する。取得部１５１は、学習用データを取得する。取得部１５１は、辞書情報記憶部１４１から辞書情報を取得する。

　取得部１５１は、モデルを取得してもよい。取得部１５１は、モデルのネットワーク構造を示す情報を取得してもよい。取得部１５１は、モデルを提供する外部の情報処理装置や記憶部１４からモデルを取得する。例えば、取得部１５１は、モデルＭ１をモデル情報記憶部１４２から取得する。例えば、取得部１５１は、モデルＭ１のネットワーク構造を示す情報をモデル情報記憶部１４２から取得する。取得部１５１は、機械学習によるモデルの学習に用いる学習用データを取得する。取得部１５１は、辞書情報記憶部１４１からモデルの学習に用いる学習用データを取得する。

　取得部１５１は、学習部１５２が学習した各種情報を取得する。取得部１５１は、生成部１５３が生成した各種情報を取得する。取得部１５１は、解析部１５４が解析した各種情報を取得する。

　取得部１５１は、品詞の推定対象となる文字列を取得する。取得部１５１は、未知語である文字列を取得する。取得部１５１は、辞書情報に含まれない未知語である文字列を取得する。取得部１５１は、文字列に対応する言語の辞書情報に含まれず、言語での未知語である文字列を取得する。

　学習部１５２は、学習処理を行う。学習部１５２は、各種学習を行う。学習部１５２は、取得部１５１により取得された情報に基づいて、各種情報を学習する。学習部１５２は、モデルを学習（生成）する。学習部１５２は、モデル等の各種情報を学習する。学習部１５２は、学習によりモデルを生成する。学習部１５２は、種々の機械学習に関する技術を用いて、モデルを学習する。例えば、学習部１５２は、モデル（ネットワーク）のパラメータを学習する。学習部１５２は、種々の機械学習に関する技術を用いて、モデルを学習する。

　学習部１５２は、各種学習を行う。学習部１５２は、記憶部１４に記憶された情報に基づいて、各種情報を学習する。学習部１５２は、辞書情報記憶部１４１やモデル情報記憶部１４２に記憶された情報に基づいて、モデルを学習する。

　学習部１５２は、ネットワークのパラメータを学習する。例えば、学習部１５２は、モデルＭ１やモデルＭ２のネットワークのパラメータを学習する。学習部１５２は、モデルＭ１やモデルＭ２のネットワークのパラメータを学習することにより、モデルＭ１やモデルＭ２を学習する。

　学習部１５２は、学習用バイト列と学習用バイト列に対応する正解情報との組合せである学習データを用いてモデルを学習する。学習部１５２は、文字列に対応する言語の学習データを用いて言語に対応するモデルを学習する。学習部１５２は、辞書情報記憶部１４１に記憶された学習用データ（教師データ）に基づいて、学習処理を行うことにより、モデルを生成する。学習部１５２は、辞書情報記憶部１４１に記憶された学習用データを用いて、学習処理を行うことにより、モデルを生成する。例えば、学習部１５２は、品詞推定に用いられるモデルを生成する。学習部１５２は、モデルＭ１やモデルＭ２のネットワークのパラメータを学習し、モデルＭ１やモデルＭ２を生成する。

　学習部１５２による学習の手法は特に限定されないが、例えば、文字列に対応するバイト列と、その文字列の確率分布とを紐づけた学習用データを用意し、その学習用データを多層ニューラルネットワークに基づいた計算モデルに入力して学習してもよい。また、例えばＣＮＮ（Convolutional　Neural　Network）、３Ｄ－ＣＮＮ等のＤＮＮ（Deep　Neural　Network）に基づく手法が用いられてもよい。学習部１５２は、再帰型ニューラルネットワーク（Recurrent　Neural　Network：ＲＮＮ）やＲＮＮを拡張したＬＳＴＭ（Long　Short-Term　Memory　units）に基づく手法を用いてもよい。

　学習部１５２は、学習により生成したモデルをモデル情報記憶部１４２に格納する。学習部１５２は、モデルＭ１やモデルＭ２を生成する。この場合、学習部１５２は、生成したモデルＭ１やモデルＭ２をモデル情報記憶部１４２に格納する。学習部１５２は、学習用データとして用いられる各データと正解情報とに基づいて、モデルを学習する。

　生成部１５３は、各種生成を行う。生成部１５３は、取得部１５１により取得された情報に基づいて、各種情報を生成する。生成部１５３は、学習部１５２により学習されたモデルに基づいて、各種情報を生成する。生成部１５３は、記憶部１４に記憶された情報に基づいて、各種情報を生成する。生成部１５３は、辞書情報記憶部１４１やモデル情報記憶部１４２や品詞推定情報記憶部１４３に記憶された情報に基づいて、各種情報を生成する。

　生成部１５３は、各種判定を行う。生成部１５３は、文字列が未知語であるか否かを判定する。生成部１５３は、取得部１５１により取得された情報に基づいて、各種判定を行う。生成部１５３は、学習部１５２により学習されたモデルに基づいて、各種判定を行う。生成部１５３は、記憶部１４に記憶された情報に基づいて、各種判定を行う。生成部１５３は、辞書情報記憶部１４１やモデル情報記憶部１４２や品詞推定情報記憶部１４３に記憶された情報に基づいて、各種判定を行う。

　生成部１５３は、表示部１３に表示する各種情報を生成してもよい。生成部１５３は、表示部１３に表示する文字情報やグラフといった画像情報などの各種情報を生成してもよい。この場合、生成部１５３は、画面に関する情報（画像）を画像に関連する種々の従来技術を適宜用いて生成する。生成部１５３は、画像をＧＵＩに関する種々の従来技術を適宜用いて生成する。例えば、生成部１５３は、ＣＳＳ、ＪａｖａＳｃｒｉｐｔ（登録商標）、ＨＴＭＬ、あるいは、上述した情報表示や操作受付等の情報処理を記述可能な任意の言語により画像を生成してもよい。

　生成部１５３は、文字列が変換されたバイト列に基づいて、文字列の品詞を推定する品詞推定情報を生成する。生成部１５３は、文字列が複数の品詞のうちいずれの品詞であるかを推定する品詞推定情報を生成する。生成部１５３は、文字列の言語に対応する品詞体系に含まれる複数の品詞のうち、文字列がいずれの品詞であるかを推定する品詞推定情報を生成する。

　生成部１５３は、文字列が複数の品詞のいずれであるかを示すスコアを含む品詞推定情報を生成する。生成部１５３は、複数の品詞の各々に対応する複数のスコアを含む品詞推定情報を生成する。生成部１５３は、文字列に対する複数の品詞の確率分布を示す品詞推定情報を生成する。

　生成部１５３は、バイト列を入力とするモデルを用いて、文字列の品詞を推定する品詞推定情報を生成する。生成部１５３は、文字列が複数の品詞のいずれであるかを示すスコアを出力するモデルを用いて、文字列の品詞を推定する品詞推定情報を生成する。生成部１５３は、複数の品詞の各々に対応する複数のスコアを出力するモデルを用いて、文字列の品詞を推定する品詞推定情報を生成する。

　生成部１５３は、学習用バイト列と学習用バイト列に対応する正解情報との組合せである学習データを用いて学習されたモデルを用いて、文字列の品詞を推定する品詞推定情報を生成する。生成部１５３は、文字列に対応する言語の学習データを用いて学習された言語に対応するモデルを用いて、文字列の品詞を推定する品詞推定情報を生成する。

　生成部１５３は、未知語である文字列の品詞を推定する品詞推定情報を生成する。生成部１５３は、辞書情報に含まれない文字列の品詞を推定する品詞推定情報を生成する。生成部１５３は、言語での未知語である文字列の品詞を推定する品詞推定情報を生成する。生成部１５３は、文字列に含まれる文字の各々が複数バイトに変換されたバイト列に基づいて、文字列の品詞を推定する品詞推定情報を生成する。生成部１５３は、文字列が少なくとも日本語を含む言語群のいずれかである場合、文字列に含まれる文字の各々が複数バイトに変換されたバイト列に基づいて、文字列の品詞を推定する品詞推定情報を生成する。

　解析部１５４は、解析処理を行う。解析部１５４は、各種情報を解析する。解析部１５４は、外部の情報処理装置から取得された情報に基づいて、各種情報を解析する。解析部１５４は、記憶部１４に記憶された情報に基づいて、各種情報を解析する。解析部１５４は、辞書情報記憶部１４１やモデル情報記憶部１４２や品詞推定情報記憶部１４３に記憶された情報に基づいて、各種情報を解析する。

　解析部１５４は、解析結果に関する情報を記憶部１４に格納する。解析部１５４は、生成部１５３により生成された情報に基づいて、各種解析処理を行う。例えば、解析部１５４は、図１３～図１７に示すような形態素解析処理を行う。

　解析部１５４は、文章等の文字情報を、形態素解析等の自然言語処理技術を適宜用いた解析を実行する。解析部１５４は、文章等の文字情報に対する意味解析により、文章等の文字情報の内容を推定（特定）する。解析部１５４は、意味解析を適宜用いて文字情報を解析することにより、文字情報の内容を推定（特定）する。例えば、解析部１５４は、文字情報を構文解析等の種々の従来技術を適宜用いて解析することにより、文字情報の内容を推定する。

　解析部１５４は、生成部１５３により生成された品詞推定情報を用いて、文字列が含まれる文字情報を解析する。解析部１５４は、文字列に対して推定される品詞と文字列との組合せを用いて、文字情報を解析する。解析部１５４は、品詞推定情報を用いて、文字列が含まれる文字情報に対する形態素解析を実行する。

　送信部１５５は、各種情報を送信する。送信部１５５は、各種情報の提供を行う。送信部１５５は、外部の情報処理装置へ各種情報を提供する。送信部１５５は、外部の情報処理装置へ各種情報を送信する。送信部１５５は、記憶部１４に記憶された情報を送信する。送信部１５５は、辞書情報記憶部１４１やモデル情報記憶部１４２や品詞推定情報記憶部１４３に記憶された情報を送信する。送信部１５５は、学習部１５２により学習されたモデルの情報を送信する。送信部１５５は、生成部１５３により生成された情報を送信する。送信部１５５は、解析部１５４による解析結果を送信する。

［１－２－１．モデル例］
　ここで、図６を用いて、情報処理装置１００が用いるモデルのネットワーク構造の一例を説明する。図６は、本開示の実施形態に係るモデルの一例を示す図である。図６に示すネットワークＮＷ１は、入力層ＩＮＬと出力層ＯＵＴＬとの間に複数（多層）の中間層を含むニューラルネットワークを示す。例えば、図６に示すネットワークＮＷ１は、モデルＭ１やモデルＭ２のネットワークの一例である。

　図６に示すネットワークＮＷ１は、モデルＭ１のネットワークに対応し、品詞推定に用いられるニューラルネットワーク（モデル）を示す概念的な図である。例えば、ネットワークＮＷ１は、入力層ＩＮＬ側から例えば文字列に対応するバイト列が入力された場合に、出力層ＯＵＴＬからそのバイト列に対応する文字列の品詞を推定する情報（スコア）を出力する。例えば、情報処理装置１００は、ネットワークＮＷ１中の入力層ＩＮＬに情報を入力することにより、出力層ＯＵＴＬから入力に対応する文字列の品詞を推定する情報（スコア）を出力させる。

　なお、図６では、モデル（ネットワーク）の一例としてネットワークＮＷ１を示すが、ネットワークＮＷ１は、用途等に応じて種々の形式であってもよい。例えば、情報処理装置１００は、図６に示すネットワークＮＷ１の構造を有するモデルＭ１のパラメータ（重み）を学習することにより、モデルＭ１を学習する。なお、情報処理装置１００は、モデルＭ２についても上記と同様に学習する。

［１－３．実施形態に係る情報処理の手順］
　次に、図７を用いて、実施形態に係る情報処理の手順について説明する。図７は、本開示の実施形態に係る情報処理の手順を示すフローチャートである。

　図７に示すように、情報処理装置１００は、品詞の推定対象となる文字列を取得する（ステップＳ１０１）。例えば、情報処理装置１００は、未知語に対応する文字列を取得する。情報処理装置１００は、文字列が変換されたバイト列に基づいて、文字列の品詞を推定する品詞推定情報を生成する（ステップＳ１０２）。例えば、情報処理装置１００は、未知語に対応する文字列について、各品詞の確率分布を示す品詞推定情報を生成する。

［１－４．品詞推定情報生成例］
　図８及び図９を用いて、品詞推定情報生成例について説明する。図８及び図９は、品詞推定の一例を示す図である。

　まず、図８について説明する。図８に示す生成例ＥＸ１は、英語の単語「rarely」を対象の文字列とした場合に、情報処理装置１００が品詞推定情報を生成する例を示す。図８中のモデルＭ２は、英語の文字列を対象とする品詞推定モデルである。モデルＭ２は、モデルＭ１と同じネットワーク構成であってもよい。また、上述したようにモデルＭ１とモデルＭ２は、同じ品詞推定モデルであってもよい。

　モデルＭ２中の「Input　embedding」は、所定の行列（図８の場合２５５×Ｄ行列）が設定される。モデルＭ２中の「Intermediate　representation」は、例えばＣＮＮ（Convolutional　Neural　Network）や、ＲＮＮ（Recurrent　Neural　Network）やtransfer等の各種のモデル（ネットワーク構成）であってもよい。モデルＭ２中の「Series　of　POS　probability」の各要素の値は、以下の式（１）に示すような式により算出される。

　すなわち、図８の場合、「noun」、「verb」、「adverb」、「preposition」「adjective」、「auxiliary　verb」の６個の品詞の各々のスコアは、式（１）を基に算出される。

　図８の例では、情報処理装置１００は、文字列「rarely」中の各文字を所定の文字コードに変換する変換処理により、文字列「rarely」に対応するバイト列を生成する。情報処理装置１００は、文字「r」をＵＴＦ－８に対応する１バイト「０ｘ７２」に変換する。情報処理装置１００は、文字「a」をＵＴＦ－８に対応する１バイト「０ｘ６１」に変換する。情報処理装置１００は、文字「r」をＵＴＦ－８に対応する１バイト「０ｘ７２」に変換する。情報処理装置１００は、文字「e」をＵＴＦ－８に対応する１バイト「０ｘ６５」に変換する。情報処理装置１００は、文字「l」をＵＴＦ－８に対応する１バイト「０ｘ６ｃ」に変換する。情報処理装置１００は、文字「y」をＵＴＦ－８に対応する１バイト「０ｘ７９」に変換する。これにより、情報処理装置１００は、文字列「rarely」に対応するバイト列を生成する。

　そして、情報処理装置１００は、文字列「rarely」に対応するバイト列をモデルＭ２に入力し、文字列「rarely」について各品詞のスコアをモデルＭ２に出力させる。モデルＭ２は、文字列「rarely」に対応するバイト列の入力に応じて、図８に示すような各品詞のスコアを出力する。モデルＭ１は、文字列「rarely」について、名詞のスコア「０．０１」、動詞のスコア「０．１６」、副詞のスコア「０．９４」、前置詞のスコア「０．０５」、形容詞のスコア「０．３１」、助動詞のスコア「０．０１」を出力する。これにより、情報処理装置１００は、名詞がスコア「０．０１」、動詞がスコア「０．１６」、副詞がスコア「０．９４」、前置詞がスコア「０．０５」、形容詞がスコア「０．３１」、助動詞がスコア「０．０１」の確率分布を示す品詞推定情報を生成する。

　次に、図９について説明する。図９に示す生成例ＥＸ２は、英語の単語「google」を対象の文字列とした場合に、情報処理装置１００が品詞推定情報を生成する例を示す。図９中のモデルＭ２は、英語の文字列を対象とする品詞推定モデルである。

　図９の例では、情報処理装置１００は、文字列「google」中の各文字を所定の文字コードに変換する変換処理により、文字列「google」に対応するバイト列を生成する。情報処理装置１００は、文字「g」をＵＴＦ－８に対応する１バイト「０ｘ６７」に変換する。情報処理装置１００は、文字「o」をＵＴＦ－８に対応する１バイト「０ｘ６ｆ」に変換する。情報処理装置１００は、文字「o」をＵＴＦ－８に対応する１バイト「０ｘ６ｆ」に変換する。情報処理装置１００は、文字「g」をＵＴＦ－８に対応する１バイト「０ｘ６７」に変換する。情報処理装置１００は、文字「l」をＵＴＦ－８に対応する１バイト「０ｘ６ｃ」に変換する。情報処理装置１００は、文字「e」をＵＴＦ－８に対応する１バイト「０ｘ６５」に変換する。これにより、情報処理装置１００は、文字列「google」に対応するバイト列を生成する。

　そして、情報処理装置１００は、文字列「google」に対応するバイト列をモデルＭ２に入力し、文字列「google」について各品詞のスコアをモデルＭ２に出力させる。モデルＭ２は、文字列「google」に対応するバイト列の入力に応じて、図９に示すような各品詞のスコアを出力する。モデルＭ１は、文字列「google」について、名詞のスコア「０．８１」、動詞のスコア「０．３６」、副詞のスコア「０．０４」、前置詞のスコア「０．０５」、形容詞のスコア「０．１１」、助動詞のスコア「０．０１」を出力する。これにより、情報処理装置１００は、名詞がスコア「０．８１」、動詞がスコア「０．３６」、副詞がスコア「０．０４」、前置詞がスコア「０．０５」、形容詞がスコア「０．１１」、助動詞がスコア「０．０１」の確率分布を示す品詞推定情報を生成する。

　上述のように、図８、９は動作の一例を示す。具体的には、図８、９は品詞がわからない単語rarelyとgoogleを入力した結果のイメージ図を示す。この際、それぞれの文字種構成と学習時に使った辞書内での文字種の構成とその組み合わせから、rarelyには、副詞、googleには固有名詞である確率が高く推定されることが期待される。

［１－５．処理フロー例］
　ここから、図１０～図１３を用いて、処理フローについて説明する。

［１－５－１．品詞推定のフロー例］
　まず、図１０を用いて、品詞推定のフローについて説明する。図１０は、品詞推定のフローの一例を示す図である。具体的には、図１０は、品詞の生起確率を推定するアルゴリズムのフローの一例を示す図である。

　図１０に示す処理フローＰＳ１は、Byte単位へ分割する処理、Byte単位埋め込み層に関する処理、品詞確率出力の処理を含む。Byte単位へ分割する処理に対応するバイト単位分割では、入力テキスト（形態素候補）をbyte単位で分割する。例えば、文字「a」は「0x61」に変換され,文字「あ」は「0xe3,0x81,0x82」に変換される。

　また、Byte単位埋め込み層に関する処理に対応する埋め込み層では、ＲＮＮやＣＮＮなどのアーキテクチャを多段に重ね合わせ、byte列の情報を固定長ベクトルに埋め込む。そして、前工程で得た埋め込み表現を用いて、sigmoid関数により、ある品詞の生起確率を得る。具体的には、定義されている品詞の数だけsigmoid関数を出力層に持つ全結合unitを用意し、形態素候補の品詞毎の確率分布を得る。

　例えば、Byte単位へ分割する処理は、「Input　embedding」で示す入力層への入力に対応する。例えば、Byte単位埋め込み層に関する処理は、「Intermediate　representation」で示す中間層に対応する。例えば、品詞確率出力の処理は、「Series　of　POS　probability」で示す出力層に対応する。

［１－５－２．形態素解析のフロー例］
　次に図１１を用いて形態素解析のフローの例について説明する。図１１は、形態素解析のフローの一例を示す図である。

　図１１に示す形態素解析部ＭＡは、未知語に対して上述した品詞推定モデルを用いずに、所定のルール情報（以下「未知語ルール」ともいう）を用いて処理する場合を示す。形態素解析部ＭＡは、単語辞書を用いて辞書引きを行い、未知語ルールを用いて未知語処理を行い、文法制約を用いてラティスを構築し、経路最適化を行う。なお、図１１に示す形態素解析部ＭＡの処理は、一般的な形態素解析の処理と同様であるため詳細な説明は省略する。

［１－５－３．応用アプリケーションのフロー例］
　次に、図１２を用いて、応用アプリケーションのフローについて説明する。図１２は、応用アプリケーションのフローの一例を示す図である。

　図１２に示す応用アプリＡＰは、例えば、ＮＬＰ（自然言語処理：Natural　Language　Processing）アプリケーションである。例えば、情報処理装置１００は、応用アプリＡＰに対応する機能を有してもよい。情報処理装置１００の制御部１３０は、応用アプリＡＰに対応する機能を実現する実行部を有してもよい。

　応用アプリＡＰは、形態素列を用いて以下の処理を行う。応用アプリＡＰは、特徴量化を行い、既知／未知の判定を行い、学習コーパスを用いて類似事例検索を行い、学習済みモデルを用いてモデルのアップデートを行い、システム出力を行う。

［１－５－４．アプリケーション統合フロー例］
　次に、図１３を用いて、アプリケーションの統合フローについて説明する。図１３は、形態素解析を含むアプリケーション全体のフローの一例を示す図である。具体的には、図１３は、未知語解析を形態素解析ツールに組み込んだ場合の全体フロー図を示す。なお、図１３において、図１１や図１２と同様の点については適宜説明を省略する。

　例えば、情報処理装置１００は、図１３中の全体フローＦＡ１を実行する機能を有してもよい。情報処理装置１００の制御部１３０は、図１３中の全体フローＦＡ１を実行する機能を有してもよい。情報処理装置１００の解析部１３４は、図１３中の形態素解析部ＭＡを実行する機能を有してもよい。情報処理装置１００の実行部は、図１３中の応用アプリＡＰを実行する機能を有してもよい。

　図１３中の全体フローＦＡ１は、図１３中の形態素解析部ＭＡと図１３中の応用アプリＡＰとを一連の処理として実行する処理フローである。図１３中の形態素解析部ＭＡは、未知語に対する処理の点で、図１１中の形態素解析部ＭＡと相違する。図１３中の形態素解析部ＭＡは、図１１中の形態素解析部ＭＡのようなルールベースの処理ではなく、モデルＭ１やモデルＭ２のような品詞推定モデルを用いた処理である。

　図１３中の全体フローＦＡ１に示すように、図１３中の形態素解析部ＭＡは、未知語に対して図１０に示すような品詞推定の処理を実行することで、未知語に対する処理（「未知語解析」ともいう）を実行する。

　例えば、応用アプリＡＰが行う処理には、テキストの分類タスクがある。例えば、テキストの分類タスクとは、入力テキストに対して、ある特定のラベルを与えるタスクである。ここで、正解のラベル列が既に判明しているテキストに対して、未知語が生起している入力文が持つ意味を考える。文のような単位では、あらゆる単語の組み合わせに対して、ラベルを用意しておくことは困難である。そのため、入力文との完全マッチで正解付き事例が見つかる可能性は低い。

　一方で、単語単位で似た出現分布を持つ別の単語を探すために、単語の分散表現同士の距離を測る方法が存在する。さらに、分散表現を獲得する際は、文字列のみを用いることが一般的であるが、そこに品詞を付与し、同時に分散表現を得ることで、品詞の違いを考慮した距離を定義することが可能である。この技術と未知語解析結果を組み合わせ、形態素解析辞書、トレーニングデータ共に未出現でありながら、テストデータで出現した単語に品詞を割り当て、その単語と似たベクトルを持つ単語を大規模なテキストデータを解析したコーパスから探索する。探索結果として見つかった候補（未知語言いかえ候補）が含まれるトレーニング事例から、入力事例と意味が似ている文を取り出すことで、未知語の意味と品詞を同時に推定することができ、ユーザ発話への再現率が向上する。

　また、未知語解析を行うことで、上述のような応用アプリＡＰの動作頑健性を向上させることが可能である。このように、情報処理装置１００は、形態素解析ツールに未知語解析のアルゴリズムを適応することで、言語への知識を記述したヒューリスティックスをベースにしたルールの除外することができる。つまり、情報処理装置１００は、形態素解析ツールに未知語解析のアルゴリズムを適応することで、言語拡張の容易さを向上させることができる。

　以下、図１３に示す全体フローＦＡ１に対応する動作例を説明する。ここでは、ＳＬＵ（Spoken　Language　Understanding）を一例として説明する。具体的には、電子商取引、いわゆる通販サイトを介した商品購入（ネットショッピング）にＳＬＵを適用した場合の動作例を説明する。また、以下の例では、スマートスピーカを利用してユーザの発話により処理を行う場合を示す。この場合、情報処理装置１００は、スマートスピーカであってもよい。

　まず、ユーザは買い物をするために通販サイトを閲覧し、スマートスピーカで注文を行う。ユーザは「今日発売したＸＸＸカートを注文したい。」と発話する。なお、「ＸＸＸ」は人気キャラクター名であるものとする。

　スマートスピーカの内部サービスでは、「BUY_BOOKS」、「BUY_GAMES」のように、何かを購入したがっているユーザがいる場合に、その商品カテゴリが判明すればタスク実行可能な状態であるものとする。例えば、「BUY_BOOKS」や「BUY_GAMES」は、発話するユーザの意図を示す情報（ラベル）である。また、このサービス実現のために、情報処理装置１００は、“「ＸＸＸワールドを注文したい」->BUY_GAMES”、“「今週の週刊誌ＷＭ」->BUY_BOOKS”のように、各カテゴリに属する発話事例をトレーニングデータとして大量に収集しているとする。

　そして、新しく出現した単語、すなわち未知語「ＸＸＸカート」は既存の学習コーパスに事例が存在しないため、ユーザが何を欲しがっているかはわからない。そのため、情報処理装置１００は、ＸＸＸカートは未知語解析の結果によると固有名詞として出現しているようだと推定する。

　情報処理装置１００は、固有名詞“スーパーＸＸＸ”と似たベクトルを持つ単語を大規模コーパスから検索する。例えば、情報処理装置１００は、“スーパーＸＸＸ”、“ＸＸＸワールド”を検出する。情報処理装置１００は、検出結果を含む事例と、未知語「ＸＸＸカート」を含む「今日発売したＸＸＸカートを注文したい。」とを比較する。

　過去のラベル付きデータ“ＸＸＸワールドを注文したい”と“（今日発売した）ＸＸＸカートを注文したい”は距離が近い。そのため、情報処理装置１００は、入力発話「今日発売したＸＸＸカートを注文したい。」がBUY_GAMESに関連する発話であると推定する。

　情報処理装置１００は、上述のように単語辞書に記載されていない文字列について、品詞毎の確率分布を推定可能となる。また、情報処理装置１００は、未登録語の品詞がわかることで、トレーニングセットにおける類似事例を条件付きで探索可能となる。

［１－６．形態素解析］
　次に、図１４～図１７を用いて、形態素解析について説明する。

　まず、図１４を用いて、形態素解析の概要について簡単に記載する。図１４は、形態素解析の処理概要を示す図である。情報処理装置１００は、以下に示すような形態素解析の処理を実行する。なお、以下の説明では、従来の形態素解析の処理と同様の点については、詳細な説明を適宜省略する。

　情報処理装置１００は、形態素解析の処理により、入力テキスト（文字情報）を、品詞タグが付与された形態素（単語）の集合に変換する。例えば、情報処理装置１００は、入力された文章（文字情報）に対して、辞書中に含まれている単語全てを検索し、抽出する。そして、情報処理装置１００は、単語の候補を列挙したグラフ構造であるラティス構造（単に「ラティス」ともいう）を生成する。このように、情報処理装置１００は、形態素解析の処理において、グラフの一種であるラティスを生成する。図１４中のラティスＬＴ１は、「東京都出身」という文字情報を対象とした場合に生成されるラティスを示す。図１４中のＢＯＳ（Beginning　Of　Sentence）は、文頭を示すノードであり、ＥＯＳ（End　Of　Sentence）は、文末を示すノードである。例えば、ラティスの文頭ノード（図１４中の「ＢＯＳ」）から文末ノード（図１４中の「ＥＯＳ」）までのパスが、形態素解析結果になる。

　このように、情報処理装置１００は、形態素解析の対象となる文字情報中の部分一致する全文字列（単語）を辞書から抽出し、単語の候補を列挙したラティス（単語ラティス）を生成する。例えば、情報処理装置１００は、事前に生成可能な単語列（ラティス）を、辞書を用いて網羅的に列挙する。そして、情報処理装置１００は、各単語間の連結部において両単語が連結して出現する確率に相当するスコアを付与する。情報処理装置１００は、単語同士の多くの組み合わせの中から、文章として最も確からしい（尤もらしい）と推定される単語の並びを選択する。

［１－６－１．未知語を含む形態素解析の事例その１］
　次に、図１５～図１７を用いて、形態素解析の処理の例を示す。図１５～図１７は、未知語を含む形態素解析の処理の一例を示す図である。まず、図１５について説明する。図１５は、未知語を含む形態素解析の事例その１である。

　図１５中の事例ＭＥ１に示すように、入力文字列「東京都知事」が取得された場合、システム辞書を用いて、ラティスを生成し、入力文字列「東京都知事」を形態素に分割した情報が出力される。図１５の例では、入力文字列「東京都知事」を、「東京」、「都」、「知事」の３つの形態素（文字列）に分割した結果が出力される。

　例えば、“東京都知事”という文字列を１トークン（１つの文字列）として処理したい場合、図１５の場合、辞書には含まれない単語は、解析候補として扱われないために、解析不可能となる。なお、解析にはラティス（図中ＢＯＳから始まり、ＥＯＳで終わるグラフ）が用いられる。ここで、ラティス中のノードには、文字列と品詞と生起コストの３つの情報が対応付けられている。詳細な説明は省略するが、品詞と品詞のつながりのよさを示す接続コストが別途付与され、接続コストと生起コストとによって、経路上の最短パスが求められ、解析結果として出力される。

［１－６－２．未知語を含む形態素解析の事例その２］
　次に、図１６について説明する。図１６は、未知語を含む形態素解析の事例その２である。なお、図１５と同様の点については説明を省略する。

　図１６の例では、情報処理装置１００は、入力文字列「東京都知事」から“東京都”をキーワード抽出し、アプリ辞書へ“東京都”を未知語として単語登録する。例えば、情報処理装置１００は、システム辞書やアプリ辞書の情報を記憶部１２０に記憶してもよい。

　そして、情報処理装置１００は、未知語「東京都」の生起コストを設定する。情報処理装置１００は、種々の情報を適宜用いて未知語「東京都」の生起コストを設定する。例えば、情報処理装置１００は、情報処理装置１００の管理者等が指定した値を、未知語「東京都」の生起コストに設定してもよい。情報処理装置１００の管理者等は、システム辞書を参照して未知語「東京都」の生起コストを指定したり、未知語「東京都」の生起コストを小さい値に設定したりする。また、情報処理装置１００は、自動で未知語「東京都」の生起コストを設定してもよい。例えば、情報処理装置１００は、未知語「東京都」を含むパス（経路）が選択されやすくなるように、未知語「東京都」の生起コストを設定してもよい。

　図１６中の事例ＭＥ２に示すように、情報処理装置１００は、入力文字列「東京都知事」を取得した場合、システム辞書やアプリ辞書を用いて、ラティスを生成し、入力文字列「東京都知事」を形態素に分割した情報を出力（生成）する。図１６の例では、ＢＯＳからＥＯＳまでの各パス（経路）のうち、「東京都」、「知事」を通るパス（Path）がその他のパス（Path）よりもコストが小さいラティスが生成されるものとする。情報処理装置１００は、入力文字列「東京都知事」を、「東京都」、「知事」の２つの形態素（文字列）に分割した結果を生成する。例えば、情報処理装置１００は、システム辞書やアプリ辞書の情報を記憶部１２０から取得してもよいし、システム辞書やアプリ辞書の情報を提供する外部の装置から取得してもよい。

［１－６－３．未知語を含む形態素解析の事例その３］
　次に、図１７について説明する。図１７は、未知語を含む形態素解析の事例その３である。なお、図１５及び図１６と同様の点については説明を省略する。

　図１７の例では、情報処理装置１００は、入力文字列「東京都知事」から“東京都知事”をキーワード抽出し、アプリ辞書へ“東京都知事”を未知語として単語登録する。

　そして、情報処理装置１００は、未知語「東京都知事」の生起コストを設定する。情報処理装置１００は、種々の情報を適宜用いて未知語「東京都知事」の生起コストを設定する。例えば、情報処理装置１００は、情報処理装置１００の管理者等が指定した値を、未知語「東京都知事」の生起コストに設定してもよい。例えば、情報処理装置１００は、未知語「東京都知事」を含むパス（経路）が選択されやすくなるように、未知語「東京都知事」の生起コストを設定してもよい。

　図１７中の事例ＭＥ３に示すように、情報処理装置１００は、入力文字列「東京都知事」を取得した場合、システム辞書やアプリ辞書を用いて、ラティスを生成し、入力文字列「東京都知事」を形態素に分割した情報を出力（生成）する。図１７の例では、ＢＯＳからＥＯＳまでの各パス（経路）のうち、「東京都」、「知事」を通るパス（Path）がその他のパス（Path）よりもコストが小さいラティスが生成されるものとする。すなわち、図１７の例では、「東京都」、「知事」を通るパス（Path）のコストが「東京都知事」を通るパス（Path）のコストよりも小さい。情報処理装置１００は、入力文字列「東京都知事」を、「東京都」、「知事」の２つの形態素（文字列）に分割した結果を生成する。なお、情報処理装置１００の管理者等は、「東京都知事」の１つの形態素（文字列）に分割した結果を生成したい場合、未知語「東京都知事」の生起コストをさらに小さく設定してもよい。

　ここで、従来手法では、未知語処理として“東京都知事”を解析結果の候補として抽出できたとしても、ヒューリスティックなルールを使わない場合、品詞が何かがわからずに結果として解析することができない。一方で、情報処理装置１００は、品詞推定情報を生成することによって、“東京都知事：名詞”のようなノードをラティスに追加することができる。情報処理装置１００は、未知語に品詞の情報を付加した後、文字列と品詞を特徴量として、どの程度１トークンとしてでやすいかを示すスコアを付与することで、経路の最適化を実行することができる。

［２．その他の実施形態］
　上述した各実施形態に係る処理は、上記各実施形態以外にも種々の異なる形態（変形例）にて実施されてよい。例えばシステム構成は、上述した例に限らず、種々の態様であってもよい。この点について以下説明する。なお、以下では、実施形態に係る情報処理装置１００と同様の点については、適宜説明を省略する。

［２－１．変形例］
　例えば、上述した例では、ユーザが利用する端末装置である情報処理装置１００が品詞推定を行う例を示したが、品詞推定を行う情報処理装置と、ユーザが利用する端末装置とは別体であってもよい。この点について、図１８及び図１９を用いて説明する。図１８は、本開示の変形例に係る情報処理システムの構成例を示す図である。図１９は、本開示の変形例に係る情報処理装置の構成例を示す図である。

　図１８に示すように、情報処理システム１には、端末装置１０と、情報処理装置１００Ａとが含まれる。端末装置１０及び情報処理装置１００Ａは通信網Ｎを介して、有線又は無線により通信可能に接続される。なお、図１８に示した情報処理システム１には、複数台の端末装置１０や、複数台の情報処理装置１００Ａが含まれてもよい。この場合、情報処理装置１００Ａは、通信網Ｎを介して端末装置１０と通信し、端末装置１０への情報の提供やユーザが端末装置１０を介して入力した文字情報を対象として、品詞推定や形態素解析等の処理を行なったりしてもよい。また、情報処理装置１００Ａは、ユーザが端末装置１０を介して指定したパラメータ等の情報を基に、モデルの学習を行なったりしてもよい。

　端末装置１０は、ユーザによって利用される情報処理装置である。端末装置１０は、例えば、ノート型ＰＣ（Personal　Computer）や、デスクトップＰＣや、スマートフォンや、タブレット型端末や、携帯電話機や、ＰＤＡ（Personal　Digital　Assistant）等により実現される。なお、端末装置１０は、情報処理装置１００Ａが提供する情報を表示可能であればどのような端末装置であってもよい。端末装置１０は、クライアント端末である。

　また、端末装置１０は、ユーザによる操作を受け付ける。図１８に示す例において、端末装置１０は、情報処理装置１００Ａが提供する情報を画面に表示する。また、端末装置１０は、ユーザによる操作を示す情報等の情報を情報処理装置１００Ａへ送信する。例えば、端末装置１０は、品詞の推定対象となる文字列を情報処理装置１００Ａへ送信する。端末装置１０は、未知語である文字列を情報処理装置１００Ａへ送信する。端末装置１０は、辞書情報に含まれない未知語である文字列を情報処理装置１００Ａへ送信する。端末装置１０は、文字列に対応する言語の辞書情報に含まれず、言語での未知語である文字列を情報処理装置１００Ａへ送信する。端末装置１０は、解析の対象となる文字情報を情報処理装置１００Ａへ送信する。端末装置１０は、品詞の推定対象となる文字列を含む文字情報を情報処理装置１００Ａへ送信する。

　端末装置１０は、情報処理装置１００Ａから受信した情報を表示する。端末装置１０は、情報処理装置１００Ａから受信した品詞推定の結果を表示する。端末装置１０は、情報処理装置１００Ａから受信した解析結果を表示する。

　情報処理装置１００Ａは、端末装置１０に情報を提供したり、端末装置１０から情報を取得したりする点で情報処理装置１００と相違する以外は、情報処理装置１００と同様の情報処理を実現する。情報処理装置１００Ａは、クライアント端末である端末装置１０にサービスを提供するサーバである。例えば、情報処理装置１００Ａは、端末装置１０から取得した文字情報を基に、品詞推定や形態素解析の処理を実行し、その実行結果を端末装置１０へ送信する。

　図１９に示すように、情報処理装置１００Ａは、通信部１１と、記憶部１４と、制御部１５Ａとを有する。通信部１１は、通信網Ｎ（インターネット等）と有線又は無線で接続され、通信網Ｎを介して、端末装置１０との間で情報の送受信を行う。この場合、情報処理装置１００Ａは、情報処理装置１００のような情報を表示する機能を有しなくてもよい。なお、情報処理装置１００Ａは、情報処理装置１００Ａの管理者等が利用する入力部（例えば、キーボードやマウス等）や表示部（例えば、液晶ディスプレイ等）を有してもよい。

　制御部１５Ａは、例えば、ＣＰＵやＭＰＵ等によって、情報処理装置１００Ａ内部に記憶されたプログラム（例えば、本開示に係る情報処理プログラム）がＲＡＭ等を作業領域として実行されることにより実現される。また、制御部１５Ａは、例えば、ＡＳＩＣやＦＰＧＡ等の集積回路により実現されてもよい。

　図１９に示すように、制御部１５Ａは、取得部１５１Ａと、学習部１５２と、生成部１５３と、解析部１５４と、送信部１５５Ａとを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部１５Ａの内部構成は、図１９に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。

　取得部１５１Ａは、取得部１５１と同様に各種情報を取得する。取得部１５１Ａは、端末装置１０から各種情報を取得する。取得部１５１Ａは、端末装置１０からユーザの操作情報を取得する。取得部１５１Ａは、記憶部１４から各種情報を取得する。

　送信部１５５Ａは、送信部１５５と同様に各種情報の提供を行う。送信部１５５Ａは、端末装置１０に各種情報を提供する。送信部１５５Ａは、端末装置１０へ各種情報を送信する。送信部１５５Ａは、生成部１５３により生成された情報を端末装置１０に提供する。送信部１５５Ａは、解析部１５４による解析結果を端末装置１０に提供する。送信部１５５Ａは、端末装置１０に表示させる情報を端末装置１０に送信する。送信部１５５Ａは、生成部１５３による品詞推定の結果や、解析部１５４による形態素解析の結果を端末装置１０へ送信する。

［２－２．その他の構成例］
　また、上述した各実施形態や変形例に係る処理は、上記実施形態や変形例以外にも種々の異なる形態（変形例）にて実施されてよい。例えば、モデルを学習する装置（学習装置）と、モデルを用いて品詞を推定する装置（推定装置）と、形態素解析等の解析処理を実行する装置（解析装置）とは別体であってもよい。この場合、情報処理システムは、学習装置と、品詞推定を行う情報処理装置である推定装置と、解析装置とを含んでもよい。なお、上記は一例であり、情報処理システムは種々の構成により実現されてもよい。

［２－３．その他］
　また、上記各実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。

　また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。

　また、上述してきた各実施形態及び変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。

　また、本明細書に記載された効果はあくまで例示であって限定されるものでは無く、他の効果があってもよい。

［３．本開示に係る効果］
　上述のように、本開示に係る情報処理装置（実施形態では情報処理装置１００、１００Ａ）は、取得部（実施形態では取得部１５１、１５１Ａ）と、生成部（実施形態では生成部１５３）とを備える。取得部は、品詞の推定対象となる文字列を取得する。生成部は、文字列が変換されたバイト列に基づいて、文字列の品詞を推定する品詞推定情報を生成する。

　これにより、本開示に係る情報処理装置は、品詞の推定対象となる文字列が変換されたバイト列に基づいて、文字列の品詞を推定する品詞推定情報を生成することで、文字列をバイトという別の情報に変換したうえでその文字列の品詞を推定することができる。また、情報処理装置は、文字列をバイト列に変換することで、どの言語であってもバイト列として品詞推定の処理を行うことができるため、言語に依存しない品詞推定が可能となる。したがって、情報処理装置は、柔軟な文字列の品詞推定を可能にすることができる。

　また、生成部は、文字列が複数の品詞のうちいずれの品詞であるかを推定する品詞推定情報を生成する。これにより、情報処理装置は、文字列が複数の品詞のうちいずれの品詞であるかを推定することができる。

　また、生成部は、文字列の言語に対応する品詞体系に含まれる複数の品詞のうち、文字列がいずれの品詞であるかを推定する品詞推定情報を生成する。これにより、情報処理装置は、文字列の言語に対応する品詞体系の中で、文字列が複数の品詞のうちいずれの品詞であるかを推定することができる。

　また、生成部は、文字列が複数の品詞のいずれであるかを示すスコアを含む品詞推定情報を生成する。これにより、情報処理装置は、文字列が複数の品詞のいずれであるかを示すスコアにより、柔軟な文字列の品詞推定を可能にすることができる。

　また、生成部は、複数の品詞の各々に対応する複数のスコアを含む品詞推定情報を生成する。これにより、情報処理装置は、複数の品詞の各々に対応する複数のスコアにより、柔軟な文字列の品詞推定を可能にすることができる。

　また、生成部は、文字列に対する複数の品詞の確率分布を示す品詞推定情報を生成する。これにより、情報処理装置は、文字列に対する複数の品詞の確率分布により、柔軟な文字列の品詞推定を可能にすることができる。

　また、生成部は、バイト列を入力とするモデルを用いて、文字列の品詞を推定する品詞推定情報を生成する。これにより、情報処理装置は、バイト列を入力とするモデルを用いることで、柔軟な文字列の品詞推定を可能にすることができる。また、情報処理装置は、バイト列を入力とするモデルを用いることで、どの言語であってもバイト列として品詞推定の処理を行うことができるため、言語に依存しない品詞推定が可能となる。

　また、生成部は、文字列が複数の品詞のいずれであるかを示すスコアを出力するモデルを用いて、文字列の品詞を推定する品詞推定情報を生成する。これにより、情報処理装置は、モデルが出力し、文字列が複数の品詞のいずれであるかを示すスコアにより、柔軟な文字列の品詞推定を可能にすることができる。

　また、生成部は、複数の品詞の各々に対応する複数のスコアを出力するモデルを用いて、文字列の品詞を推定する品詞推定情報を生成する。これにより、情報処理装置は、モデルが出力し、複数の品詞の各々に対応する複数のスコアにより、柔軟な文字列の品詞推定を可能にすることができる。

　また、生成部は、学習用バイト列と学習用バイト列に対応する正解情報との組合せである学習データを用いて学習されたモデルを用いて、文字列の品詞を推定する品詞推定情報を生成する。これにより、情報処理装置は、学習データを用いて学習されたモデルを用いることで、柔軟な文字列の品詞推定を可能にすることができる。

　また、生成部は、文字列に対応する言語の学習データを用いて学習された言語に対応するモデルを用いて、文字列の品詞を推定する品詞推定情報を生成する。これにより、情報処理装置は、文字列に対応する学習データを用いて学習されたモデルを用いることで、柔軟な文字列の品詞推定を可能にすることができる。

　また、取得部は、未知語である文字列を取得する。生成部は、未知語である文字列の品詞を推定する品詞推定情報を生成する。これにより、情報処理装置は、推定対象となる文字列が未知語である場合であっても、柔軟な文字列の品詞推定を可能にすることができる。

　また、取得部は、辞書情報に含まれない未知語である文字列を取得する。生成部は、辞書情報に含まれない文字列の品詞を推定する品詞推定情報を生成する。これにより、情報処理装置は、推定対象となる文字列が辞書情報に含まれない単語（未知語）である場合であっても、柔軟な文字列の品詞推定を可能にすることができる。

　また、取得部は、文字列に対応する言語の辞書情報に含まれず、言語での未知語である文字列を取得する。生成部は、言語での未知語である文字列の品詞を推定する品詞推定情報を生成する。これにより、情報処理装置は、推定対象となる文字列が、文字列に対応する言語の辞書情報に含まれない単語（未知語）である場合であっても、柔軟な文字列の品詞推定を可能にすることができる。

　また、生成部は、文字列に含まれる文字の各々が複数バイトに変換されたバイト列に基づいて、文字列の品詞を推定する品詞推定情報を生成する。これにより、情報処理装置は、文字列に含まれる文字の各々が複数バイトに変換されたバイト列に基づいて、文字列の品詞を推定する品詞推定情報を生成することで、マルチバイトにも対応し、柔軟な文字列の品詞推定を可能にすることができる。

　また、生成部は、文字列が少なくとも日本語を含む言語群のいずれかである場合、文字列に含まれる文字の各々が複数バイトに変換されたバイト列に基づいて、文字列の品詞を推定する品詞推定情報を生成する。これにより、情報処理装置は、日本語等のように１文字が複数バイトに変換され得る言語が対象となる場合であっても、柔軟な文字列の品詞推定を可能にすることができる。

［４．ハードウェア構成］
　上述してきた各実施形態に係る情報処理装置１００、１００Ａ等の情報機器は、例えば図２０に示すような構成のコンピュータ１０００によって実現される。図２０は、情報処理装置１００、１００Ａ等の情報処理装置の機能を実現するコンピュータ１０００の一例を示すハードウェア構成図である。以下、実施形態に係る情報処理装置１００を例に挙げて説明する。コンピュータ１０００は、ＣＰＵ１１００、ＲＡＭ１２００、ＲＯＭ（Read　Only　Memory）１３００、ＨＤＤ（Hard　Disk　Drive）１４００、通信インターフェイス１５００、及び入出力インターフェイス１６００を有する。コンピュータ１０００の各部は、バス１０５０によって接続される。

　ＣＰＵ１１００は、ＲＯＭ１３００又はＨＤＤ１４００に格納されたプログラムに基づいて動作し、各部の制御を行う。例えば、ＣＰＵ１１００は、ＲＯＭ１３００又はＨＤＤ１４００に格納されたプログラムをＲＡＭ１２００に展開し、各種プログラムに対応した処理を実行する。

　ＲＯＭ１３００は、コンピュータ１０００の起動時にＣＰＵ１１００によって実行されるＢＩＯＳ（Basic　Input　Output　System）等のブートプログラムや、コンピュータ１０００のハードウェアに依存するプログラム等を格納する。

　ＨＤＤ１４００は、ＣＰＵ１１００によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を非一時的に記録する、コンピュータが読み取り可能な記録媒体である。具体的には、ＨＤＤ１４００は、プログラムデータ１４５０の一例である本開示に係る情報処理プログラムを記録する記録媒体である。

　通信インターフェイス１５００は、コンピュータ１０００が外部ネットワーク１５５０（例えばインターネット）と接続するためのインターフェイスである。例えば、ＣＰＵ１１００は、通信インターフェイス１５００を介して、他の機器からデータを受信したり、ＣＰＵ１１００が生成したデータを他の機器へ送信したりする。

　入出力インターフェイス１６００は、入出力デバイス１６５０とコンピュータ１０００とを接続するためのインターフェイスである。例えば、ＣＰＵ１１００は、入出力インターフェイス１６００を介して、キーボードやマウス等の入力デバイスからデータを受信する。また、ＣＰＵ１１００は、入出力インターフェイス１６００を介して、ディスプレイやスピーカーやプリンタ等の出力デバイスにデータを送信する。また、入出力インターフェイス１６００は、所定の記録媒体（メディア）に記録されたプログラム等を読み取るメディアインターフェイスとして機能してもよい。メディアとは、例えばＤＶＤ（Digital　Versatile　Disc）、ＰＤ（Phase　change　rewritable　Disk）等の光学記録媒体、ＭＯ（Magneto-Optical　disk）等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。

　例えば、コンピュータ１０００が実施形態に係る情報処理装置１００として機能する場合、コンピュータ１０００のＣＰＵ１１００は、ＲＡＭ１２００上にロードされた情報処理プログラムを実行することにより、制御部１５等の機能を実現する。また、ＨＤＤ１４００には、本開示に係る情報処理プログラムや、記憶部１４内のデータが格納される。なお、ＣＰＵ１１００は、プログラムデータ１４５０をＨＤＤ１４００から読み取って実行するが、他の例として、外部ネットワーク１５５０を介して、他の装置からこれらのプログラムを取得してもよい。

　なお、本技術は以下のような構成も取ることができる。
（１）
　品詞の推定対象となる文字列を取得する取得部と、
　前記文字列が変換されたバイト列に基づいて、前記文字列の品詞を推定する品詞推定情報を生成する生成部と、
　を備える情報処理装置。
（２）
　前記生成部は、
　前記文字列が複数の品詞のうちいずれの品詞であるかを推定する前記品詞推定情報を生成する、
　（１）に記載の情報処理装置。
（３）
　前記生成部は、
　前記文字列の言語に対応する品詞体系に含まれる複数の品詞のうち、前記文字列がいずれの品詞であるかを推定する前記品詞推定情報を生成する、
　（２）に記載の情報処理装置。
（４）
　前記生成部は、
　前記文字列が複数の品詞のいずれであるかを示すスコアを含む前記品詞推定情報を生成する、
　（２）または（３）に記載の情報処理装置。
（５）
　前記生成部は、
　複数の品詞の各々に対応する複数のスコアを含む前記品詞推定情報を生成する、
　（４）に記載の情報処理装置。
（６）
　前記生成部は、
　前記文字列に対する複数の品詞の確率分布を示す前記品詞推定情報を生成する、
　（２）～（５）のいずれか１項に記載の情報処理装置。
（７）
　前記生成部は、
　前記バイト列を入力とするモデルを用いて、前記文字列の品詞を推定する品詞推定情報を生成する、
　（１）～（６）のいずれか１項に記載の情報処理装置。
（８）
　前記生成部は、
　前記文字列が複数の品詞のいずれであるかを示すスコアを出力する前記モデルを用いて、前記文字列の品詞を推定する品詞推定情報を生成する、
　（７）に記載の情報処理装置。
（９）
　前記生成部は、
　複数の品詞の各々に対応する複数のスコアを出力する前記モデルを用いて、前記文字列の品詞を推定する品詞推定情報を生成する、
　（７）または（８）に記載の情報処理装置。
（１０）
　前記生成部は、
　学習用バイト列と前記学習用バイト列に対応する正解情報との組合せである学習データを用いて学習された前記モデルを用いて、前記文字列の品詞を推定する品詞推定情報を生成する、
　（７）～（９）のいずれか１項に記載の情報処理装置。
（１１）
　前記生成部は、
　前記文字列に対応する言語の前記学習データを用いて学習された前記言語に対応する前記モデルを用いて、前記文字列の品詞を推定する品詞推定情報を生成する、
　（１０）に記載の情報処理装置。
（１２）
　前記取得部は、
　未知語である前記文字列を取得し、
　前記生成部は、
　前記未知語である前記文字列の品詞を推定する品詞推定情報を生成する、
　（１）～（１１）のいずれか１項に記載の情報処理装置。
（１３）
　前記取得部は、
　辞書情報に含まれない前記未知語である前記文字列を取得し、
　前記生成部は、
　前記辞書情報に含まれない前記文字列の品詞を推定する品詞推定情報を生成する、
　（１２）に記載の情報処理装置。
（１４）
　前記取得部は、
　前記文字列に対応する言語の前記辞書情報に含まれず、前記言語での前記未知語である前記文字列を取得し、
　前記生成部は、
　前記言語での前記未知語である前記文字列の品詞を推定する品詞推定情報を生成する、
　（１３）に記載の情報処理装置。
（１５）
　前記生成部は、
　前記文字列に含まれる文字の各々が複数バイトに変換された前記バイト列に基づいて、前記文字列の品詞を推定する品詞推定情報を生成する、
　（１）～（１４）のいずれか１項に記載の情報処理装置。
（１６）
　前記生成部は、
　前記文字列が少なくとも日本語を含む言語群のいずれかである場合、前記文字列に含まれる文字の各々が複数バイトに変換された前記バイト列に基づいて、前記文字列の品詞を推定する品詞推定情報を生成する、
　（１５）に記載の情報処理装置。
（１７）
　品詞の推定対象となる文字列を取得し、
　前記文字列が変換されたバイト列に基づいて、前記文字列の品詞を推定する品詞推定情報を生成する、
　処理を実行する情報処理方法。

　１００、１００Ａ　情報処理装置
　１１　通信部
　１２　入力部
　１３　表示部（ディスプレイ）
　１４　記憶部
　１４１　辞書情報記憶部
　１４２　モデル情報記憶部
　１４３　品詞推定情報記憶部
　１５、１５Ａ　制御部
　１５１、１５１Ａ　取得部
　１５２　学習部
　１５３　生成部
　１５４　解析部
　１５５、１５５Ａ　送信部

Claims

　品詞の推定対象となる文字列を取得する取得部と、
　前記文字列が変換されたバイト列に基づいて、前記文字列の品詞を推定する品詞推定情報を生成する生成部と、
　を備える情報処理装置。
　前記生成部は、
　前記文字列が複数の品詞のうちいずれの品詞であるかを推定する前記品詞推定情報を生成する、
　請求項１に記載の情報処理装置。
　前記生成部は、
　前記文字列の言語に対応する品詞体系に含まれる複数の品詞のうち、前記文字列がいずれの品詞であるかを推定する前記品詞推定情報を生成する、
　請求項２に記載の情報処理装置。
　前記生成部は、
　前記文字列が複数の品詞のいずれであるかを示すスコアを含む前記品詞推定情報を生成する、
　請求項２に記載の情報処理装置。
　前記生成部は、
　複数の品詞の各々に対応する複数のスコアを含む前記品詞推定情報を生成する、
　請求項４に記載の情報処理装置。
　前記生成部は、
　前記文字列に対する複数の品詞の確率分布を示す前記品詞推定情報を生成する、
　請求項２に記載の情報処理装置。
　前記生成部は、
　前記バイト列を入力とするモデルを用いて、前記文字列の品詞を推定する品詞推定情報を生成する、
　請求項１に記載の情報処理装置。
　前記生成部は、
　前記文字列が複数の品詞のいずれであるかを示すスコアを出力する前記モデルを用いて、前記文字列の品詞を推定する品詞推定情報を生成する、
　請求項７に記載の情報処理装置。
　前記生成部は、
　複数の品詞の各々に対応する複数のスコアを出力する前記モデルを用いて、前記文字列の品詞を推定する品詞推定情報を生成する、
　請求項７に記載の情報処理装置。
　前記生成部は、
　学習用バイト列と前記学習用バイト列に対応する正解情報との組合せである学習データを用いて学習された前記モデルを用いて、前記文字列の品詞を推定する品詞推定情報を生成する、
　請求項７に記載の情報処理装置。
　前記生成部は、
　前記文字列に対応する言語の前記学習データを用いて学習された前記言語に対応する前記モデルを用いて、前記文字列の品詞を推定する品詞推定情報を生成する、
　請求項１０に記載の情報処理装置。
　前記取得部は、
　未知語である前記文字列を取得し、
　前記生成部は、
　前記未知語である前記文字列の品詞を推定する品詞推定情報を生成する、
　請求項１に記載の情報処理装置。
　前記取得部は、
　辞書情報に含まれない前記未知語である前記文字列を取得し、
　前記生成部は、
　前記辞書情報に含まれない前記文字列の品詞を推定する品詞推定情報を生成する、
　請求項１２に記載の情報処理装置。
　前記取得部は、
　前記文字列に対応する言語の前記辞書情報に含まれず、前記言語での前記未知語である前記文字列を取得し、
　前記生成部は、
　前記言語での前記未知語である前記文字列の品詞を推定する品詞推定情報を生成する、
　請求項１３に記載の情報処理装置。
　前記生成部は、
　前記文字列に含まれる文字の各々が複数バイトに変換された前記バイト列に基づいて、前記文字列の品詞を推定する品詞推定情報を生成する、
　請求項１に記載の情報処理装置。
　前記生成部は、
　前記文字列が少なくとも日本語を含む言語群のいずれかである場合、前記文字列に含まれる文字の各々が複数バイトに変換された前記バイト列に基づいて、前記文字列の品詞を推定する品詞推定情報を生成する、
　請求項１５に記載の情報処理装置。
　品詞の推定対象となる文字列を取得し、
　前記文字列が変換されたバイト列に基づいて、前記文字列の品詞を推定する品詞推定情報を生成する、
　処理を実行する情報処理方法。