JP6961906B1

JP6961906B1 - 外国人の国籍推定システム、外国人の母国語推定システム、外国人の国籍推定方法、外国人の母国語推定方法、及びプログラム

Info

Publication number: JP6961906B1
Application number: JP2021067998A
Authority: JP
Inventors: 真二郎山口
Original assignee: 真二郎山口
Priority date: 2021-02-24
Filing date: 2021-02-24
Publication date: 2021-11-05
Anticipated expiration: 2041-02-24
Also published as: JP2022129328A

Abstract

【課題】外国人の国籍又は母国語を高い精度で推定可能な、国籍推定システム、母国語推定システム、及びこれらのシステムを機能させるプログラムを提供すること。【解決手段】本発明の外国人の国籍推定システム１は、少なくとも記憶手段２０、学習手段３０、取得手段４０、分解手段５０、及び推定手段６０を備え、単語情報Ａ１、音声情報Ａ２、及び国籍情報Ａ３、を紐づけてなる複数の言語発音データＡを学習用データとする機械学習によって学習済みモデルＸを取得し、生言語発音データＢに学習済みモデルＸを適用して、国籍を推定する。本発明の外国人の母国語推定システム１’は、少なくとも記憶手段２０、学習手段３０、取得手段４０、分解手段５０、及び推定手段６０を備え、単語情報Ａ１、音声情報Ａ２、及び母国語情報Ａ４、を紐づけてなる複数の言語発音データＡを学習用データとする機械学習によって学習済みモデルＸを取得し、生言語発音データＢに学習済みモデルＸを適用して、母国語を推定する。【選択図】図１

Description

本発明は、外国人の発声による特定言語から当該外国人の国籍を推定するシステム、外国人の発声による特定言語から当該外国人の母国語を推定するシステム、及びこれらのシステムを機能させるプログラムに関する。

生産年齢人口の減少による労働力不足、政府の観光立国構想の推進、経済のグローバル化等の要因によって、近年、日本を訪問／滞在する外国人の人口が激増している。
日本国内に滞在する外国人の国籍は多様であり、営業サービスの質の向上、マーケティングの効率化、治安の維持、又は安全保障上の理由等の様々な目的のため、パスポート等の公的書類や本人の申告によらずに、当該外国人の国籍を判別する需要が存在する。
特許文献１には、個人の人種・形質のような生物学的特性、民族といった文化人類学的特性、発声した言語の属する母国語ないし方言といった言語学的特性その他の個人の外部的特徴によって、個人の国籍を自動的に判定する技術が開示されている。

特開２０１０−１９１５３０号公報

武漢ウィルスの世界的蔓延によってマスクの着用が生活標準となった現在では、特許文献１のような、顔認証によって国籍を判断する技術の実効性は著しく低下している。
また、特許文献１の内、言語学的特性を利用する技術は、外国人の発声する母国語に基づいて機械的に国籍を割り振るものであるが、例えば接客サービスや電話による問い合わせなど日本国内に居住する外国人が会話する場面では、会話の相手方が日本人であり、会話が日本語で行われることが通常であるため、そもそも対象の外国人の母国語を把握することが難しい。

近年では、受付ロボットを使用する無人ホテルが知られている。当該受付ロボットは、ＡＩ（人工知能）と音声認識を利用して客と会話を行うことで、客の要求を把握して、宿泊やこれに付随するサービスを提供する。
また、駅や空港の交通施設において、ＡＩが音声を認識する無人案内サービスが知られている。
これらのサービスにおいて、客が外国人旅行客である場合、外国人の話す日本語から当該外国人の国籍が推定できれば、会話の途中から受付ロボットの言語を当該外国人の母国語に切り替えることで、よりスムーズで快適な接客が可能となる。

犯罪捜査の現場では、外国人の容疑者が自らの氏名や国籍を黙秘する場合がある。
また、空港や港湾における入国管理の現場では、他人によるなりすましを防ぐため、外国人とパスポート記載の人物との照合が必要となる場合がある。
これらの場合、外国人の話す日本語から当該外国人の国籍が推定できれば、大使館への問い合わせなどによって、当該外国人の特定が容易になるなど、捜査や入国管理に資することが考えられる。

以上は全て日本語を中心にした例であるが、日本語に限らず、ある特定言語を母国語としない国の者（以下「外国人」と定義）の使用する特定言語から、当該外国人の国籍や母国語を推定する需要が広く存在する。
本発明は、上記のような課題を解決するための、外国人の国籍推定システム、外国人の母国語推定システム、及びプログラムを提供することを目的とするものである。

本発明の外国人の国籍推定システムは、特定言語を母国語としない外国人の音声から外国人の国籍を推定するシステムであって、複数の言語発音データであって、特定言語の単位言語からなる単語情報と、外国人が単位言語を発音した音声からなる音声情報と、外国人の国籍からなる国籍情報と、を紐づけてなる、複数の言語発音データを記憶する、記憶手段と、記憶手段内の複数の言語発音データを学習用データとする機械学習によって、特定の単語情報における音声情報と国籍情報を関連付けた、学習済みモデルを取得する、学習手段と、外国人が特定言語を発音した音声からなる、生言語発音データを取得する、取得手段と、取得手段が取得した生言語発音データを単位言語に分解した、複数の分解言語発音データを生成する、分解手段と、複数の分解言語発音データに、学習済みモデルを適用することで、生言語発音データに係る外国人の国籍を推定する、推定手段と、を備えることを特徴とする。

本発明の外国人の国籍推定システムは、推定手段が、１の生言語発音データにおける複数の分解言語発音データの国籍を個別に推定する一次推定と、一次推定の結果を積算して１の生言語発音データの国籍を推定する二次推定と、二次推定の結果を積算して複数の生言語発音データに係る１の外国人の国籍を推定する三次推定と、を行ってもよい。

本発明の外国人の国籍推定システムは、複数の言語発音データが、音声情報に紐づけた外国人の性別からなる性別情報を更に有し、学習手段が、特定の単語情報における音声情報と、国籍情報と、性別情報と、を関連付けた、学習済みモデルを取得してもよい。

本発明の外国人の国籍推定システムは、複数の言語発音データが、音声情報に紐づけた外国人の性別からなる性別情報と、音声情報に紐づけた外国人の年齢又は年代からなる年齢情報と、を有し、学習手段が、特定の単語情報における音声情報と、国籍情報と、性別情報と、年齢情報と、を関連付けた、学習済みモデルを取得してもよい。

本発明の外国人の母国語推定システムは、特定言語を母国語としない外国人の音声から外国人の母国語を推定するシステムであって、複数の言語発音データであって、特定言語の単位言語からなる単語情報と、外国人が単位言語を発音した音声からなる音声情報と、外国人の母国語からなる母国語情報と、を紐づけてなる、複数の言語発音データを記憶する、記憶手段と、記憶手段内の複数の言語発音データを学習用データとする機械学習によって、特定の単語情報における音声情報と母国語情報を関連付けた、学習済みモデルを取得する、学習手段と、外国人が特定言語を発音した音声からなる、生言語発音データを取得する、取得手段と、取得手段が取得した生言語発音データを単位言語に分解した、複数の分解言語発音データを生成する、分解手段と、複数の分解言語発音データに、学習済みモデルを適用することで、生言語発音データに係る外国人の母国語を推定する、推定手段と、を備えることを特徴とする。

本発明の外国人の母国語推定システムは、推定手段が、１の生言語発音データにおける複数の分解言語発音データの母国語を個別に推定する一次推定と、一次推定の結果を積算して１の生言語発音データの母国語を推定する二次推定と、二次推定の結果を積算して複数の生言語発音データに係る１の外国人の母国語を推定する三次推定と、を行ってもよい。

本発明の外国人の母国語推定システムは、複数の言語発音データが、音声情報に紐づけた外国人の性別からなる性別情報を更に有し、学習手段が、特定の単語情報における音声情報と、母国語情報と、性別情報と、を関連付けた、学習済みモデルを取得してもよい。

本発明の外国人の母国語推定システムは、複数の言語発音データが、音声情報に紐づけた外国人の性別からなる性別情報と、音声情報に紐づけた外国人の年齢又は年代からなる年齢情報と、を有し、学習手段が、特定の単語情報における音声情報と、母国語情報と、性別情報と、年齢情報と、を関連付けた、学習済みモデルを取得してもよい。

本発明のプログラムは、コンピュータを、本発明の国籍推定システム、又は本発明の母国語推定システムとして機能させることを特徴とする。

本発明のコンピュータ読み取り可能な記録媒体は、本発明のプログラムを記録したことを特徴とする。

本発明の外国人の国籍推定方法は、特定言語を母国語としない外国人の音声から外国人の国籍を推定する方法であって、複数の言語発音データであって、特定言語の単位言語からなる単語情報と、外国人が単位言語を発音した音声からなる音声情報と、外国人の国籍からなる国籍情報と、を紐づけてなる、複数の言語発音データを記憶する、記憶ステップと、記憶ステップで記憶した複数の言語発音データを学習用データとする機械学習によって、特定の単語情報における音声情報と国籍情報を関連付けた、学習済みモデルを取得する、学習ステップと、外国人が特定言語を発音した音声からなる、生言語発音データを取得する、取得ステップと、取得ステップで取得した生言語発音データを単位言語に分解した、複数の分解言語発音データを生成する、分解ステップと、複数の分解言語発音データに、学習済みモデルを適用することで、生言語発音データに係る外国人の国籍を推定する、推定ステップと、を備えることを特徴とする。

本発明の外国人の国籍推定方法は、推定ステップにおいて、１の生言語発音データにおける複数の分解言語発音データの国籍を個別に推定する一次推定と、一次推定の結果を積算して１の生言語発音データの国籍を推定する二次推定と、二次推定の結果を積算して複数の生言語発音データに係る１の外国人の国籍を推定する三次推定と、を行ってもよい。

本発明の外国人の国籍推定方法は、複数の言語発音データが、音声情報に紐づけた外国人の性別からなる性別情報を更に有し、学習ステップにおいて、特定の単語情報における音声情報と、国籍情報と、性別情報と、を関連付けた、学習済みモデルを取得してもよい。

本発明の外国人の国籍推定方法は、複数の言語発音データが、音声情報に紐づけた外国人の性別からなる性別情報と、音声情報に紐づけた外国人の年齢又は年代からなる年齢情報と、を有し、学習ステップにおいて、特定の単語情報における音声情報と、国籍情報と、性別情報と、年齢情報と、を関連付けた、学習済みモデルを取得してもよい。

本発明の外国人の母国語推定方法は、特定言語を母国語としない外国人の音声から外国人の母国語を推定する方法であって、複数の言語発音データであって、特定言語の単位言語からなる単語情報と、外国人が単位言語を発音した音声からなる音声情報と、外国人の母国語からなる母国語情報と、を紐づけてなる、複数の言語発音データを記憶する、記憶ステップと、記憶ステップで記憶した複数の言語発音データを学習用データとする機械学習によって、特定の単語情報における音声情報と母国語情報を関連付けた、学習済みモデルを取得する、学習ステップと、外国人が特定言語を発音した音声からなる、生言語発音データを取得する、取得ステップと、取得ステップで取得した生言語発音データを単位言語に分解した、複数の分解言語発音データを生成する、分解ステップと、複数の分解言語発音データに、学習済みモデルを適用することで、生言語発音データに係る外国人の母国語を推定する、推定ステップと、を備えることを特徴とする。

本発明の外国人の母国語推定方法は、推定ステップにおいて、１の生言語発音データにおける複数の分解言語発音データの母国語を個別に推定する一次推定と、一次推定の結果を積算して１の生言語発音データの母国語を推定する二次推定と、二次推定の結果を積算して複数の生言語発音データに係る１の外国人の母国語を推定する三次推定と、を行ってもよい。

本発明の外国人の母国語推定方法は、複数の言語発音データが、音声情報に紐づけた外国人の性別からなる性別情報を更に有し、学習ステップにおいて、特定の単語情報における音声情報と、母国語情報と、性別情報と、を関連付けた、学習済みモデルを取得してもよい。

本発明の外国人の母国語推定方法は、複数の言語発音データが、音声情報に紐づけた外国人の性別からなる性別情報と、音声情報に紐づけた外国人の年齢又は年代からなる年齢情報と、を有し、学習ステップにおいて、特定の単語情報における音声情報と、母国語情報と、性別情報と、年齢情報と、を関連付けた、学習済みモデルを取得してもよい。

本発明によれば、機械学習によって外国人の国籍又は母国語を高い精度で推定することができる。また、推定結果のフィードバックにより、推定の精度を永続的に向上させ続けることができる。

本発明の国籍推定システムの説明図。本発明の母国語推定システムの説明図。実施例２の説明図。実施例３の説明図。

以下、実施例を参照しながら本発明の外国人の国籍推定システム、母国語推定システム、及びプログラムについて詳細に説明する。
本発明において「特定言語」とは日本語、英語、スペイン語等の任意の１種類の言語を意味する。また、「外国人」とは特定言語を母国語としない者を意味し、必ずしも本発明を実施する国の国籍に基づくものではない。

［国籍推定システム］
本発明の国籍推定システム１は、外国人の発声による特定言語から当該外国人の国籍を推定するシステムである。
非特許文献１には、英語を母国語としない者の英語には、母国語の影響による訛りがあり、経験のある船員であれば、ＶＨＦ無線から聞こえる英語の訛りによって相手の国籍が判断できることが開示されている。これは英語の例であるが、いずれの言語においても、その言語を母国語としない外国人の発音には程度の差こそあれ当該外国人の国籍に由来する特徴が表れる。すなわち、外国人による特定言語の発音は、当該外国人の国籍と相関関係を有する。
そこで、本発明の国籍推定システム１は、外国人が母国語以外の特定言語を話す際の発音の特徴（例えば訛り）に着目して、これを教師データとした機械学習によって学習モデルを取得し、未知の外国人が特定言語を話した音声に当該学習モデルを適用することで、未知の外国人の国籍を高精度に推定しようとする発明である。
なお、本実施例では「特定言語」が日本語である場合について説明するが、これは例示に過ぎず、本発明の国籍推定システム１は、いかなる言語にも適用が可能である。

［国籍推定システムの構成］
国籍推定システム１は、少なくとも記憶手段２０、学習手段３０、取得手段４０、分解手段５０、及び推定手段６０を備える（図１）。本例では、更に生成手段１０を備え、これらの各手段に情報処理を実行させるプログラムを、情報処理装置（コンピュータ）にインストールしてなる。
この情報処理装置は単体である必要はなく、複数の情報処理装置（演算装置、制御装置、記憶装置、入力装置、出力装置等を備えた装置）を、ネットワークを介して相互に接続して、１つの国籍推定システム１を構成してもよい。
プログラムは、汎用のシステムに機能追加する形で導入するプラグイン形式のプログラムであってもよい。あるいはクラウドシステムを介して提供されてもよい。また、プログラムは、情報処理装置で読み取り可能な記憶媒体に格納することができる。

（言語発音データ）
言語発音データＡは、機械学習の学習用データとなるデータである。
言語発音データＡは、少なくとも、単語情報Ａ１と、単語情報Ａ１と紐づけた音声情報Ａ２及び国籍情報Ａ３と、を含む。
単語情報Ａ１とは、特定言語の単位言語からなる。ここで「単位言語」とは、特定言語における意味のある文章を、単語、文節、文等の任意の単位に区切ったものであり、予め多数の単位言語をリスト化しておくことができる。
音声情報Ａ２は、外国人が単位言語を発音した音声からなる。
国籍情報Ａ３は、外国人の国籍からなる。なお、該当国が広域である場合、地域によって言語特性が大きく異なる場合等には、国籍情報Ａ３を同一国内の複数の地域に細分してもよい。

［生成手段］
生成手段１０は、言語発音データＡを生成する手段である。
生成手段１０は、外国人の発音による音声情報Ａ２に、対応する単語情報Ａ１を紐づけ、これに正解データである国籍情報Ａ３を付加して、言語発音データＡを生成する。
詳細には、例えば収音マイク等を用いて音声による空気の振動を波形データに変換し、環境音などのノイズを取り除くことで音声情報Ａ２を生成する。
続いて、音声情報Ａ２に公知の音声認識技術（後述）を適用して単位言語ごとに解析し、テキスト情報である単語情報Ａ１を生成する。
最後に、単語情報Ａ１に紐づいた音声情報Ａ２に、音声情報Ａ２の発音に係る外国人の国籍情報Ａ３を付加する。
言語発音データＡは後述する学習手段３０の学習用データセットとし使用するため、多数の単位言語について相当量を生成する必要がある。
多数の言語発音データＡを取得する方法には、例えば外国人モニターに特定言語のリストを読み上げさせ、その音声を収音する方法、テレビやラジオ等の放送媒体から取得する方法、インターネット上でクローリングした動画データ等からＡＩが音声情報Ａ２であると機械的に判断したデータを収集する方法、電話サービスの通話音声から取集する方法、等を用いることができる。
この場合、言語発音データＡから、当該外国人の氏名や電話番号を削除したり、動画であれば付随する画像データを削除するなどの匿名加工を行うことで、言語発音データＡを、個人を特定できない匿名加工情報とするのが望ましい。
また、言語発音データＡが欠測値や外れ値である場合には、当該言語発音データＡを除去することができる。
以上の手順により、言語発音データＡを生成して、記憶手段２０へ送信する（生成ステップＳ１）。

［記憶手段］
記憶手段２０は、複数の言語発音データＡを保存する手段である。
記憶手段２０は、主記憶部及び補助記憶部を含むことができる。例えば、主記憶部はＲＡＭなどの揮発性メモリであり、補助記憶部は、ＲＯＭ、ＥＥＰＲＯＭ、フラッシュメモリ、又はハードディスクなどの不揮発性メモリである。
記憶手段２０は、生成手段１０によって入力された言語発音データＡを記憶し、多数の言語発音データＡを蓄積して、機械学習用の学習用データセットを構成する（記憶ステップＳ２）。

［学習手段］
学習手段３０は、複数の言語発音データＡを学習データとした機械学習に基づいて、学習済みモデルＸを取得する手段である。
学習手段３０は、記憶手段２０内に保存した大量の言語発音データＡからなる学習用データセットを、公知の機械学習アルゴリズムに基づいて機械学習して、学習済みパラメータが組み込まれた学習済みモデルＸを取得する（学習ステップＳ３）。
この学習済みモデルＸは、多数の単位言語における多数の音声情報Ａ２と国籍情報Ａ３の相関から導き出した一定の規則を反映したモデルである。
機械学習は、例えばディープラーニングの方法により、サポートベクターマシーン（ＳＶＭ）、ロジスティック回帰、ランダムフォレスト（決定木）等の公知の様々なアルゴリズムを利用できる。

（生言語発音データ）
生言語発音データＢは、推定の対象となる外国人による音声のデータである。
生言語発音データＢは、少なくとも外国人が特定言語を発音した音声データである生音声情報Ｂ１を含む。

［取得手段］
取得手段４０は、生言語発音データＢを取得する手段である。
取得手段４０は、例えば収音マイクや電話回線である。
取得手段４０により、推定の対象となる外国人の会話から生言語発音データＢを収音して、分解手段５０へ送信する（取得ステップＳ４）。

（単位言語発音データ）
単位言語発音データＣは、生言語発音データＢを単位言語ごとに分解してなるデータである。
単位言語発音データＣは、分解音声情報Ｃ１と、分解音声情報Ｃ１に紐づいた分解テキスト情報Ｃ２と、を有する。
単位言語発音データＣは、元になる生言語発音データＢごとにグループ化される。

［分解手段］
分解手段５０は、生言語発音データＢを単位言語毎に分解して、分解言語発音データＣを生成する手段である。
分解手段５０は、最初に、取得手段４０が取得した生言語発音データＢを、音声認識によってテキスト化する。
詳細には、例えば、生言語発音データＢを、音響分析、音響モデル、発音辞書、言語モデル等の要素を用いて解析し、音声情報をテキスト情報に変換する。
続いてテキスト情報を、自然言語処理（ＮａｔｕｒａｌＬａｎｇｕａｇｅＰｒｏｃｅｓｓｉｎｇ）によって、当該テキスト情報を単位言語ごとに分節して、分解テキスト情報Ｃ２を生成する。
自然言語処理とは、人間の言語（自然言語）を機械で処理して内容を抽出する技術である。本例では、例えば特定言語の文法の性質を利用して言語間の境界を判断する文節構造モデルや、確率的言語モデルを適用することができる。
続いて、分解テキスト情報Ｃ２の区分に基づいて、生言語発音データＢの生音声情報Ｂ１を分解音声情報Ｃ１に分解する。
こうして、生言語発音データＢごとの複数の分解音声情報Ｃ１と、各分解音声情報Ｃ１に紐づけた分解テキスト情報Ｃ２を有する、単位言語発音データＣが得られる（分解ステップＳ５）。
具体的には、例えば、生言語発音データＢが、外国人の発声による日本語「今日は頭が痛いので、アルバイトを休みます。」からなる場合、分解手段５０によって、この生言語発音データＢを、「今日は」「頭が」「痛いので」「アルバイトを」「休みます」との文節による５つの単位言語に分解し、それぞれの単位言語に対応する分解音声情報Ｃ１と分解テキスト情報Ｃ２を得る。
この他、例えば「今日」「は」「頭」「が」「痛い」「ので」「アルバイト」「を」「休みます」と、単語による９つの単位言語に分解してもよいし、「今日は」「頭が痛いので」「アルバイトを休みます」と３つの単位言語に分解してもよい。

［推定手段］
推定手段６０は、外国人の国籍を推定する手段である。
推定手段６０は、分解手段５０が生成した分解言語発音データＣに、学習手段３０が取得した学習済みモデルＸを適用して、分解言語発音データＣの発音に係る外国人の国籍を推定する（推定ステップＳ６）。国籍の推定は、少なくとも一次推定及び二次推定を含む。
詳細には、推定手段６０は、１の生言語発音データＢに係る複数の分解言語発音データＣを取得し、各分解言語発音データＣの分解テキスト情報Ｃ２によって、各分解言語発音データＣにかかる単位言語を特定する。
続いて、特定した単位言語に対応する学習済みモデルＸを選択する。この際、対応する学習済みモデルＸを有さない単位言語については、推定の対象から除くことができる。
各分解言語発音データＣの分解音声情報Ｃ１に、単位言語に対応する学習済みモデルＸを適用して、分解言語発音データＣごとに国籍を推定する（一次推定）。一次推定の結果は、各分解言語発音データＣにおける、複数の国別の推定率（％）として記録することができる。
上記の手順により、１の生言語発音データＢ内にグループ化された全ての分解言語発音データＣに一次推定を行い、全ての一次推定の積算により、当該１の生言語発音データＢ全体の国籍を推定する（二次推定）。二次推定の結果は、当該１の生言語発音データＢにおける、複数の国別の推定率（％）として記録することができる。
１の外国人から複数の生言語発音データＢを取得できる場合には、一次推定及び二次推定に加えて、複数の二次推定結果を積算してなる三次推定を行うことができる。詳細な実施例について次項で説明する。

［一次推定及び二次推定］
例えば、１つの生言語発音データＢ（ＡＡ００００１）が「今日は」「頭が」「痛いので」「アルバイトを」「休みます」の５つの分解言語発音データＣからなる場合、推定手段６０は、以下の手順で一次推定及び二次推定を行う（表１）。
この５つの単位言語から、対応する学習済みモデルＸを有さない「アルバイトを」を除いた４つの単位言語に、この単位言語に対応する学習済みモデルＸをそれぞれ適用し、分解言語発音データＣ「今日は」に対応する国籍を［Ａ国：７１．１％Ｂ国：２１．７％Ｃ国：７．２％］と推定する。
同様に、分解言語発音データＣ「頭が」に対応する国籍を［Ａ国：５５．６％Ｂ国：２８．２％Ｃ国：９．０％Ｄ国：７．２％］と、分解言語発音データＣ「痛いので」に対応する国籍を［Ａ国：４５．２％Ｂ国：５１．７％Ｄ国：３．１％］と、分解言語発音データＣ「休みます」に対応する国籍を［Ａ国：３８．９％Ｂ国：３２．０％Ｃ国：２９．１％］と、それぞれ一次推定する。
続いて、４つの単位言語それぞれの一次推定率を積算して、生言語発音データＢ（ＡＡ００００１）の二次推定率を算出する。本例では二次推定率は［Ａ国：５２．７％Ｂ国：３３．４％Ｃ国：１１．３％Ｄ国：２．６％］と算出される。
なお、本例では説明の便宜上、複数の一次推定率を単純に合算して二次推定率を算出したが、実際には、特定言語の種類（発音の特徴が顕著に表れる特定言語とそうでない特定言語等）、特定言語の長さ、特定言語の発音順等によって、一次推定の結果に重みづけを行ったり、推定率の分布から信頼性の低い推定結果を除外するなど、統計処理上の各種の調整を行ってもよい。

［三次推定］
続いて推定手段６０は、生言語発音データＢ（ＡＡ００００１）を含む、同一の外国人に係る複数の生言語発音データＢ（ＡＡ００００１、ＡＡ００００２、ＡＡ００００３・・・）の二次推定率を積算して、当該外国人に係る三次推定率を算出する（表２）。
本例では三次推定の結果が［Ａ国：７４．２％Ｂ国：１７．４％Ｃ国：５．８％Ｄ国：１．０％Ｅ国：１．３％・・］と算出される。
以上の結果より、最終的に当該外国人の国籍を７４．２％の推定率で、Ａ国であると推定する。
なお、三次推定にも、二次推定と同様の各種の統計処理上の調整を行うことができる。

［母国語推定システム］
本発明の母国語推定システム１’は、外国人の発声による特定言語から当該外国人の母国語を推定するシステムである（図２）。
本発明の母国語推定システム１’は、外国人が母国語以外の特定言語を話す際の発音の特徴（例えば訛り）に着目して、これを教師データとした機械学習によって学習モデルを取得し、未知の外国人が特定言語を話した音声に学習モデルを適用することで、未知の外国人の母国語を高精度に推定しようとする発明である。
母国語推定システム１’は、少なくとも記憶手段２０、学習手段３０、取得手段４０、分解手段５０、及び推定手段６０を備える。本例では、更に生成手段１０を備える。
母国語推定システム１’の具体的構成と母国語の推定方法は、（１）言語発音データＡが、国籍情報Ａ３ではなく、外国人の母国語の情報である母国語情報Ａ４を備える点、（２）学習手段３０が、国籍情報Ａ３ではなく母国語情報Ａ４を紐付けた機械学習に基づいて学習済みモデルＸを取得する点、及び（３）推定手段６０が、最終的に外国人の母国語を推定する点、以外は実施例１の国籍推定システム１と同一である。

［言語発音データが性別情報を有する例］
本発明の国籍推定システム１及び母国語推定システム１’において、言語発音データＡに、性別情報Ａ５を備えてさせてもよい（図３）。
性別情報Ａ５とは、外国人の性別の情報である。
学習手段３０は、特定の単語情報Ａ１について、音声情報Ａ２と、国籍情報Ａ３（又は母国語情報Ａ４）と、性別情報Ａ５を関連付けて、学習済みモデルＸを取得する。
本例の場合、学習済みモデルＸに、性別による音声の違いを反映させることで、より精度の高い推定が可能となる。

［言語発音データが年齢情報を有する例］
本発明の国籍推定システム１及び母国語推定システム１’において、言語発音データＡに、年齢情報Ａ６を備えてさせてもよい（図４）。
年齢情報Ａ６とは、外国人の年齢又は年代の情報である。
学習手段３０は、特定の単語情報Ａ１について、音声情報Ａ２と、国籍情報Ａ３（又は母国語情報Ａ４）と、年齢情報Ａ６を関連付けて、学習済みモデルＸを取得する。
本例の場合、学習済みモデルＸに、年齢や年代による音声の違いを反映させることで、より精度の高い推定が可能となる。
なお、実施例３と実施例４を掛け合わせ、性別情報Ａ５を年齢情報Ａ６に加える構成としてもよい。

１国籍推定システム
１’ 母国語推定システム
１０生成手段
２０記憶手段
３０学習手段
４０取得手段
５０分解手段
６０推定手段
Ｓ１生成ステップ
Ｓ２記憶ステップ
Ｓ３学習ステップ
Ｓ４取得ステップ
Ｓ５分解ステップ
Ｓ６推定ステップ
Ａ言語発音データ
Ａ１単語情報
Ａ２音声情報
Ａ３国籍情報
Ａ４母国語情報
Ａ５性別情報
Ａ６年齢情報
Ｂ生言語発音データ
Ｂ１生音声情報
Ｃ分解言語発音データ
Ｃ１分解音声情報
Ｃ２分解テキスト情報
Ｘ学習済みモデル

Claims

特定言語を母国語としない外国人の音声から外国人の国籍を推定する、外国人の国籍推定システムであって、
複数の言語発音データであって、前記特定言語の単位言語からなる単語情報と、外国人が前記単位言語を発音した音声からなる音声情報と、外国人の国籍からなる国籍情報と、を紐づけてなる、複数の言語発音データを記憶する、記憶手段と、
前記記憶手段内の前記複数の言語発音データを学習用データとする機械学習によって、特定の前記単語情報における前記音声情報と前記国籍情報を関連付けた、学習済みモデルを取得する、学習手段と、
外国人が前記特定言語を発音した音声からなる、生言語発音データを取得する、取得手段と、
前記取得手段が取得した前記生言語発音データを単位言語に分解した、複数の分解言語発音データを生成する、分解手段と、
前記複数の分解言語発音データに、前記学習済みモデルを適用することで、前記生言語発音データに係る外国人の国籍を推定する、推定手段と、を備え、
前記推定手段が、１の前記生言語発音データにおける複数の前記分解言語発音データの国籍を個別に推定する一次推定と、前記一次推定の結果を積算して前記１の生言語発音データの国籍を推定する二次推定と、前記二次推定の結果を積算して複数の前記生言語発音データに係る１の外国人の国籍を推定する三次推定と、を行うことを特徴とする、
国籍推定システム。
特定言語を母国語としない外国人の音声から外国人の母国語を推定する、外国人の母国語推定システムであって、
複数の言語発音データであって、前記特定言語の単位言語からなる単語情報と、外国人が前記単位言語を発音した音声からなる音声情報と、外国人の母国語からなる母国語情報と、を紐づけてなる、複数の言語発音データを記憶する、記憶手段と、
前記記憶手段内の前記複数の言語発音データを学習用データとする機械学習によって、特定の前記単語情報における前記音声情報と前記母国語情報を関連付けた、学習済みモデルを取得する、学習手段と、
外国人が前記特定言語を発音した音声からなる、生言語発音データを取得する、取得手段と、
前記取得手段が取得した前記生言語発音データを単位言語に分解した、複数の分解言語発音データを生成する、分解手段と、
前記複数の分解言語発音データに、前記学習済みモデルを適用することで、前記生言語発音データに係る外国人の母国語を推定する、推定手段と、を備え、
前記推定手段が、１の前記生言語発音データにおける複数の前記分解言語発音データの母国語を個別に推定する一次推定と、前記一次推定の結果を積算して前記１の生言語発音データの母国語を推定する二次推定と、前記二次推定の結果を積算して複数の前記生言語発音データに係る１の外国人の母国語を推定する三次推定と、を行うことを特徴とする、
母国語推定システム。
コンピュータを、請求項１に記載の国籍推定システム、又は請求項２に記載の母国語推定システムとして機能させるための、
プログラム。
特定言語を母国語としない外国人の音声から外国人の国籍を推定する、外国人の国籍推定方法であって、
複数の言語発音データであって、前記特定言語の単位言語からなる単語情報と、外国人が前記単位言語を発音した音声からなる音声情報と、外国人の国籍からなる国籍情報と、を紐づけてなる、複数の言語発音データを記憶する、記憶ステップと、
前記記憶ステップで記憶した前記複数の言語発音データを学習用データとする機械学習によって、特定の単語情報における前記音声情報と前記国籍情報を関連付けた、学習済みモデルを取得する、学習ステップと、
外国人が前記特定言語を発音した音声からなる、生言語発音データを取得する、取得ステップと、
前記取得ステップで取得した前記生言語発音データを単位言語に分解した、複数の分解言語発音データを生成する、分解ステップと、
前記複数の分解言語発音データに、前記学習済みモデルを適用することで、前記生言語発音データに係る外国人の国籍を推定する、推定ステップと、を備え、
前記推定ステップにおいて、１の前記生言語発音データにおける複数の前記分解言語発音データの国籍を個別に推定する一次推定と、前記一次推定の結果を積算して前記１の生言語発音データの国籍を推定する二次推定と、前記二次推定の結果を積算して複数の前記生言語発音データに係る１の外国人の国籍を推定する三次推定と、を行うことを特徴とする、
国籍推定方法。
特定言語を母国語としない外国人の音声から外国人の母国語を推定する、外国人の母国語推定方法であって、
複数の言語発音データであって、前記特定言語の単位言語からなる単語情報と、外国人が前記単位言語を発音した音声からなる音声情報と、外国人の母国語からなる母国語情報と、を紐づけてなる、複数の言語発音データを記憶する、記憶ステップと、
前記記憶ステップで記憶した前記複数の言語発音データを学習用データとする機械学習によって、特定の単語情報における前記音声情報と前記母国語情報を関連付けた、学習済みモデルを取得する、学習ステップと、
外国人が前記特定言語を発音した音声からなる、生言語発音データを取得する、取得ステップと、
前記取得ステップで取得した前記生言語発音データを単位言語に分解した、複数の分解言語発音データを生成する、分解ステップと、
前記複数の分解言語発音データに、前記学習済みモデルを適用することで、前記生言語発音データに係る外国人の母国語を推定する、推定ステップと、を備え、
前記推定ステップにおいて、１の前記生言語発音データにおける複数の前記分解言語発音データの母国語を個別に推定する一次推定と、前記一次推定の結果を積算して前記１の生言語発音データの母国語を推定する二次推定と、前記二次推定の結果を積算して複数の前記生言語発音データに係る１の外国人の母国語を推定する三次推定と、を行うことを特徴とする、
母国語推定方法。