JP6913848B2

JP6913848B2 - ユーモア識別に基づく感情対話方法とロボットシステム

Info

Publication number: JP6913848B2
Application number: JP2018164941A
Authority: JP
Inventors: 朱定局
Original assignee: 大国創新智能科技（東莞）有限公司
Priority date: 2017-09-04
Filing date: 2018-09-03
Publication date: 2021-08-04
Anticipated expiration: 2038-09-03
Also published as: CN107564542B; JP2019046476A; CN107564542A

Description

本発明は人工知能技術分野を取り上げて、具体的には感情対話方法とシステムであり、特にユーモア識別に基づく感情対話方法とロボットシステムである。

ロボット技術の急速な発展に伴い、ユーザーがロボット機能に対する要求はますます高まり、感情とユーモアがスマートロボットにとって最も重要な内容の一つである。

既存の感情計算の主な機能が感情の識別と表現であり、既存のユーモア計算の主な機能がユーモアの識別と生成であるが、既存の感情計算技術とユーモア計算技術は別々に実行し、結合していない。

また、既存のロボットがすべてユーモア知識ベースを検索することによってユーモラス語句あるいはユーモラスな成分を識別し、ユーモア知識ベースの中のユーモラス語句あるいはユーモラスな成分の数量が限られているため、ユーモア知識ベースの中に収集されておらないユーモラス語句が識別できなく、ユーモアの識別レベルが低い。

中国特許出願公開第１０４９６５５５２号明細書

本発明の目的は上記の現在の技術中の問題を解決するため、ユーモア識別に基づく感情対話方法を提供し、その方法がユーモア識別を通じてユーザーのユーモアを識別でき、これによりロボットのユーモア識別能力を検証し、そして感情表現を通じて識別の結果を表現することにある。

本発明のもう一つの目的はユーモア識別に基づく感情対話ロボットシステムを提供することにある。

本発明は以下の技術プランを通じて実現する：

ユーモア識別に基づく感情対話方法は、前記方法がロボットとユーモア検証装置を通じて実現され、

ロボットがユーザーの入力した文を取得し、ユーザー文とするステップ、

ロボットがユーザー文を識別し、ユーザー文のユーモア程度を取得するステップ、

ユーモア検証装置がユーザー文の実際ユーモア程度を取得するステップ、

ユーモア検証装置が識別されたユーモア程度とユーザー文の実際ユーモア程度の差異を比べることによって、ユーモア識別の精度を判断するステップを含む。

更に、前記方法は、ユーモア検証装置がユーザー文の実際ユーモア程度を取得する前に、

ロボットがユーザー文のユーモア程度に基づき、フィードバックされる感情程度を計算するステップ、

ロボットがフィードバックされる感情程度に基づき、感情計算で感情を表すステップ、

ユーモア検証装置が表現された感情に対する感情識別を通じて、フィードバックされた感情程度を取得するステップ、

ユーモア検証装置が感情識別の結果の中のフィードバックされた感情程度に基づき、識別取得されたユーモア程度を計算するステップを含む。

更に、前記ロボットがユーザー文を識別し、ユーザー文のユーモア程度を取得するステップは、具体的には、

ユーザー文の属性データを取得するステップ、

ユーザー文の属性データから各部分のデータを各スモールデータとして取り出し、スモールデータコレクションに保存するステップ、

ビッグデータを取得するステップ、

スモールデータコレクションの中の各スモールデータとユーザー文との関連度を計算するステップ、

スモールデータコレクションの中の各スモールデータとユーザー文の関連度に基づき、スモールデータコレクションの中の各スモールデータとユーザー文の関連ダイバシティファクタを計算するステップ、

スモールデータコレクションの中の各スモールデータとユーザー文の関連ダイバシティファクタをニューラルネットワークあるいはディープニューラルネットワークに入力し、ユーザー文のユーモア程度を取得するステップを含む。

更に、前記スモールデータコレクションの中の各スモールデータとユーザー文との関連度を計算するステップは、具体的には、

ユーザー文のビッグデータでの類似データの数量を統計し、第一数量とするステップ、

スモールデータコレクションの各スモールデータのビッグデータでの類似データの数量を統計し、当該スモールデータの第二数量とするステップ、

当該スモールデータとユーザー文が組み合わせた後に得られたデータのビッグデータでの類似データの数量を統計し、当該スモールデータの第三数量とするステップ、

第一数量、当該スモールデータの第二数量及び第三数量に基づき、当該スモールデータとユーザー文の関連度を取得ステップを含み、その中に、前記当該スモールデータとユーザー文の関連度の具体的な計算公式は：当該スモールデータの第三数量／（（第一数量×当該スモールデータの第二数量）１／２）であり、

前記スモールデータコレクションの中の各スモールデータとユーザー文の関連度に基づき、スモールデータコレクションの中の各スモールデータとユーザー文の関連ダイバシティファクタを計算するステップは、具体的には、

各スモールデータとユーザー文の関連度の平均値を計算するステップ、

各スモールデータとユーザー文の関連度、各スモールデータとユーザー文の関連度の平均値及びスモールデータコレクションの中のスモールデータの数に基づき、スモールデータコレクションの中の各スモールデータとユーザー文の関連ダイバシティファクタを計算するステップを含み、その中に、前記スモールデータコレクションの各スモールデータとユーザ語句の関連ダイバシティファクタについて、具体的な計算公式は：（スモールデータコレクションの中の各スモールデータとユーザー文との関連度−スモールデータコレクションの中の各スモールデータとユーザー文との関連度の平均値）＾（１／スモールデータコレクションの中のスモールデータの数）である。

ユーザー文に基づいて検索し、検索結果を取得するステップ、

検索結果の中からユーザー文との一致度の降順によりトップｍ個の語句をそれぞれｍ個の第一語句として選別するステップ（その中に、ｍが正整数であり）、

ユーザー文の属性データを取得するステップ、

属性データを毎個の第一語句にそれぞれ合併し、第一語句にそれぞれ対応するｍ個の合併語句を取得するステップ、

毎個の第一語句及び毎個の第一語句に対応する合併語句にそれぞれ基づき、毎個の第一語句のユーモラスパラメーターを計算ステップ、

一致度の一番大きい第一語句に対応するユーモラスパラメーターと一番小さなユーモラスパラメーターとの間の階差、及び一番大きなユーモラスパラメーターと一致度の一番大きい第一語句に対応するユーモラスパラメーターの間の階差に基づき、ユーザー文のユーモア程度を取得するステップを含む。

本発明のもう一つの目的は以下の技術プランを通じて実現される：

ユーモア識別に基づく感情対話ロボットシステムは、ロボットとユーモア検証装置を含み、

前記ロボットは下記をユーザー文取得モジュール、ユーモア程度識別モジュールを含み、

前記ユーザー文取得モジュールは、ユーザーの入力語句をユーザー文として取得し、

前記ユーモア程度識別モジュールは、ロボットがユーザー文を識別してユーザー文のユーモア程度を取得し、

前記ユーモア検証装置は実際ユーモア程度取得モジュール、精度判断モジュールを含み、

前記実際ユーモア程度取得モジュールは、ユーザー文の実際ユーモア程度を取得し、

前記精度判断モジュールは、ロボットに識別取得されたユーモア程度とユーザー文の実際ユーモア程度との差異を比べて、ロボットのユーモア識別の精度を判断する。

更に、前記ロボットは感情程度計算モジュール、感情表現モジュールも含み、

前記感情程度計算モジュールは、ロボットがユーザー文のユーモア程度に基づき、フィードバックされる感情程度を計算し、

前記感情表現モジュールは、ロボットがフィードバックされる感情程度に基づいて感情計算を通じて感情を表現し、

前記ユーモア検証装置は感情程度取得モジュール、ユーモア程度計算モジュールも含み、

前記感情程度取得モジュールは、ロボットの表現した感情に対して感情識別を行ってロボットに識別取得されたユーモア程度を計算し、

前記ユーモア程度計算モジュールは、感情識別の結果でのロボットにフィードバックされた感情程度に基づき、ロボットに識別取得されたユーモア程度を計算する。

更に、前記ユーモア程度識別モジュールは、具体的には第一属性データ取得ユニット、スモールデータコレクション取得ユニット、ビッグデータ取得ユニット、関連度計算ユニット、関連ダイバシティファクタ計算ユニット、第一ユーモア程度取得ユニットを含み、

前記第一属性データ取得ユニットは、ユーザー文の属性データを取得し、

前記スモールデータコレクション取得ユニットは、ユーザー文の属性データの中から各部分のデータを各スモールデータとしてアクセスし、スモールデータコレクションに保存し、

前記ビッグデータ取得ユニットは、ビッグデータを取得し、

前記関連度計算ユニットは、スモールデータコレクションの各スモールデータとユーザー文との関連度を計算し、

前記関連ダイバシティファクタ計算ユニットは、スモールデータコレクションの中の各スモールデータとユーザー文との関連度に基づき、スモールデータコレクションの中の各スモールデータとユーザー文との関連ダイバシティファクタを計算し、

前記第一ユーモア程度取得ユニットは、スモールデータコレクションの中の各スモールデータとユーザー文との関連ダイバシティファクタをニューラルネットワークあるいはディープニューラルネットワークに入力し、ユーザー文のユーモア程度を取得する。

更に、前記関連度計算ユニットは、具体的には第一統計サブユニット、第二統計サブユニット、第三統計サブユニット、関連度計算サブユニットを含み、

前記第一統計サブユニットは、ユーザー文のビッグデータでの類似データの数量を第一数量として統計し、

前記第二統計サブユニットは、スモールデータコレクションの中の各スモールデータのビッグデータでの類似データの数量を当該スモールデータの第二数量として統計し、

前記第三統計サブユニットは、当該スモールデータをユーザー文と組み合わせた後で得たデータのビッグデータでの類似データの数量を第三数量として統計し、

前記関連度計算サブユニットは、第一数量、当該スモールデータの第二数量及び第三数量に基づき、当該スモールデータのユーザー文との関連度を取得し、その中に、前記当該スモールデータとユーザー文の関連度について、具体的な計算公式は：当該スモールデータの第三数量／（（第一数量×当該スモールデータの第二数量）１／２）；

前記関連ダイバシティファクタ計算ユニットは、具体的には関連度平均値計算サブユニット、関連ダイバシティファクタ計算サブユニットを含み、

前記関連度平均値計算サブユニットは、各スモールデータとユーザー文との関連度の平均値を計算し、

前記関連ダイバシティファクタ計算サブユニットは、各スモールデータとユーザー文との関連度、各スモールデータとユーザー文との関連度の平均値及びスモールデータコレクションの中のスモールデータの数に基づき、スモールデータコレクションの中の各スモールデータとユーザー文との関連ダイバシティファクタを計算し、その中に、前記スモールデータコレクションの中の各スモールデータとユーザー文との関連ダイバシティファクタの具体的な計算公式は：（スモールデータコレクションの中の各スモールデータとユーザー文の関連度−スモールデータコレクションの中の各スモールデータとユーザー文との関連度の平均値）＾（１／スモールデータコレクションの中のスモールデータの数）である。

更に、前記ユーモア程度識別モジュールは、具体的には検索ユニット、選別ユニット、第二属性データ取得ユニット、合併ユニット、ユーモラスパラメーター計算ユニット、第二ユーモア程度取得ユニット
を含み、

前記検索ユニットは、ユーザー文に基づいて検索し、検索結果を取得し、

前記選別ユニットは、検索結果の中からユーザー文との一致度の降順によりトップｍ個の語句をそれぞれｍ個の第一語句として選別し、その中に、ｍが正整数であり、

前記第二属性データ取得ユニットは、ユーザー文の属性データを取得し、

前記合併ユニットは、属性データをそれぞれ毎個の第一語句に合併し、第一語句にそれぞれ対応するｍ個の合併語句を取得し、

前記ユーモラスパラメーター計算ユニットは、毎個の第一語句及び毎個の第一語句に対応する合併語句にそれぞれ基づき、毎個の第一語句のユーモラスパラメーターを計算し、

前記第二ユーモア程度取得ユニットは一致度の一番大きい第一語句に対応するユーモラスパラメーターと一番低いユーモラスパラメーターの間の階差に基づき、ユーザー文のユーモア程度を取得する。

本発明は既存の技術に対して下記の有益効果がある：

１、本発明はロボットのユーモア程度が外部に出力されることができる時、ロボットがユーザー文に対する識別を通じて、識別したユーザー文のユーモア程度を直接に出力でき、ロボットのユーモア程度が直接に外部に出力されない時、ロボットがまず感情表現を通じて識別した結果を生き生きと表現し、それからユーモア検証装置が識別された結果に基づいてロボットに識別取得されたユーモア程度を間接的に推定し、ユーモア検証装置が識別されたユーモア程度と実際ユーモア程度の差異を比較することによって、ユーモア識別の精度を判断し、精度によりロボットのユーモア識別に対する能力を検証でき、精度が期待値に達するあるいは超える場合、ロボットのユーモア識別能力が強いことがわかり、精度が期待値に達されておらない場合、ほかのロボットの既存のユーモア識別の方法あるいは改善を経ったユーモア識別方法を採用し、精度が期待値に達するまで実験を改めて実施し、これによりロボットに強いユーモア識別能力を持たせる。

２、本発明はビッグデータの中からユーザー文とユーザーデータの関連ダイバシティファクタを取得することによって、ユーザー文のユーモア程度を識別し、ロボットのユーモア識別レベルを効果的に高め、また後続のステップを通じてロボットのユーモア識別能力を検証し、精度が期待値に達されておらない場合、訓練されたニューラルネットワークあるいはディープニューラルネットワークに基づき、実験を通じてロボットに強いユーモア識別能力を持たせることができる。

３、本発明はビッグデータ検索を通じてユーザー文のユーモア程度を計算でき、ロボットのユーモア識別レベルを効果的に高め、また後続のステップを通じてロボットのユーモア識別能力を検証し、精度が期待値に達されておらない場合、引き続きビッグデータ検索エンジン実験を通じてロボットに強いユーモア識別能力を持たせることができる。

図１は本発明実施例１のユーモア識別に基づく感情対話方法のフローチャートである。図２は本発明実施例２のユーザー文の識別フローチャートである。図３は本発明実施例２のスモールデータコレクションの中の各スモールデータとユーザー文との関連度計算フローチャートである。図４は本発明実施例２のスモールデータコレクションの中の各スモールデータとユーザー文との関連ダイバシティファクタ計算フローチャートである。図５は本発明実施例３のユーザー文の識別フローチャートである。図６は本発明実施例３のユーザー文の属性データの取得フローチャートである。図７は本発明実施例３の毎個の第一語句のユーモラスパラメーターの計算フローチャートである。図８は本発明実施例５のユーモア識別に基づく感情対話ロボットシステムの構造フロー図である。図９は本発明実施例６のユーモア程度識別モジュールの構造フロー図である。図１０は本発明実施例６の関連度計算ユニットの構造フロー図である。図１１は本発明実施例６の関連ダイバシティファクタ計算ユニットの構造フロー図である。図１２は本発明実施例７のユーモア程度識別モジュールの構造フロー図である。図１３は本発明実施例７の第二属性データ取得ユニットの構造フロー図である。図１４は本発明実施例７のユーモラスパラメーター取得ユニットの構造フロー図である。

下記に実施例と附図を交えて本発明について詳しく説明し、しかし本発明の実施方式はこれらに限らないものである。

実施例１：

ユーザーがテキストあるいは音声でユーモラス語句を入力し、当該ユーモラス語句を取得するロボットがユーモア計算を通じて感知して笑い、ロボットの笑いなどの楽しい感情が感情計算により表現されることができる。この時、当該ユーモラス語句を取得したロボットが笑ったというのは、ロボットが当該ユーモラス語句を成功に識別できることである。この過程はロボットのユーモア識別能力の検証に用いられることができる。

図１が示すように、本実施例はユーモア識別に基づく感情対話方法を提供し、その方法がロボットとユーモア検証装置を通じて実現され、ステップＳ１０１〜Ｓ１０８を含み、

Ｓ１０１、ロボットがユーザーの入力した文をユーザー文として取得する。

本実施例の中に、ロボットは知能ロボットを指し、一切の人間行為あるいは思想及びその他の生物を真似る機械を含み、また、一部分のコンピュータープログラムを含み、例えば、チャットロボットプログラムなどである。ユーザーがロボットと対話しようとする時、ユーザーがロボットにユーザー文を入力でき、これによりロボットがユーザーの入力した文を取得でき、その中に、ユーザー文がテキストおよび音声、ひいてはビデオでもよく、文が一つの語句または複数の語句を含む。

Ｓ１０２、ロボットがユーザー文を識別し、ユーザー文のユーモア程度を取得する。

ロボットがユーザー文を識別し、既存のユーモア識別方法を通じてユーザーの入力した文を識別でき、ユーザー文のユーモア程度を取得し、ユーモア程度が０〜１の間の数値（小数点までの精度がある）に定義でき、１に近ければ近いほど、ユーモラスになる。

ロボットがユーザー文を受信した（例えば聞く）時、ロボットがユーザーに「あなたが入力した文がユーモラスでありません」あるいは「あなたが入力した文がとてもユーモラスです」あるいは「あなたが入力した文のユーモア程度が０．８です」を出力（例えばユーザーに言う）すれば、ぎこちなくなる嫌いがあり、人間の交流習慣に合わなく、その故に本実施例のロボットが外部に出力するのはユーモア程度ではなく、ユーザー文に対する感情フィードバックであり、従ってまた感情計算を通じてロボットの識別したユーモア程度を間接的に推定する必要があり、ユーモア程度の推定が下記のステップＳ１０３〜Ｓ１０６で実現される。

Ｓ１０３、ロボットがユーザー文のユーモア程度に基づき、フィードバックされる感情程度を計算する。

ロボットにフィードバックされる感情程度がユーザー文のユーモア程度に正比例し、すなわちユーザー文がユーモラスであればあるほど、ロボットにフィードバックされる感情程度が大きくなりなり、ユーモア程度が０〜１の間の数値であるため、これらの数値に基づき、採点の方式でフィードバックされる感情程度を区分でき、例えばユーモア程度が０〜１の間の数値であれば、フィードバックされる感情程度が０〜１の間の対応する数値になることもでき、基本的な方法が直接にユーモア程度の数値をフィードバックされる感情程度の数値にすることである。

その中に、感情程度の中の感情のタイプは事前に設定でき、下記の方法を採用し取得することもできる：人々が本当のユーモラス語句を聞いた時にフィードバックする感情タイプを検出し、感情程度の中の感情のタイプにする。例えば、一万人が１００個の本当のユーモラス語句に対する感情フィードバックを検出し、またその中の一番多くな感情タイプを感情程度の中の感情のタイプをし、もちろん、その他の方式でも感情程度の中の感情タイプを取得でき、ひいては、感情程度の中の感情タイプが複数の感情タイプの比例的な組み合わせであっても良い。本当のユーモラス語句は、ユーモア程度の高い語句を指す。感情程度の中の感情のタイプが事前に設定あるいは取得されておらない場合、感情程度の中の感情のタイプが自動的にハッピー感情に設定され、何故かと言うと人々がユーモラス語句を聞くと、ほとんどのリアクションが笑うことであり、笑いがハッピー感情である。下記の実施例の中には感情程度の中の感情タイプに対してハッピー感情をデフォルト感情タイプとする。

その中に、ユーモア程度と感情程度の間の対応関係が事前に設定でき、例えば感情程度＝ｆ（ユーモア程度）、ｆが正相関関数であり、ユーモア程度と感情程度の間の対応関係がデフォルトで同等の関係であり、何故かと言うと一般的には、ユーモア程度が高ければ高いほど、取得する感情フィードバックが大きくなり、ユーモア程度と感情程度の間の対応関係がディープ学習によっても取得でき：人々が異なるユーモア程度の語句を聞いた時にフィードバックした感情程度を検出し、そのユーモア程度とフィードバックされた感情程度をそれぞれディープ学習の入力と出力にしてディープ学習のニューラルネットワークに対し訓練を行い、それからユーモア程度をそのディープ学習のニューラルネットワークに入力しディープ学習を通じて感情程度を取得する。

Ｓ１０４、ロボットがフィードバックされる感情程度に基づき、感情計算で感情を表する。

感情知識ベースに基づき、フィードバックされる感情程度に対応する感情表現方式を検索でき、ロボットが動作、音声及びテキストの少なくとも一つを通じて表現でき、フィードバックされる感情程度がデフォルト感情程度に高いあるいは同等である時、ロボットが笑うべきと判断し、動作、音声及びテキストの少なくとも一つを通じてハッピー感情を表し、例えばロボットが笑顔を見せ、笑い声を出し、テキストで「笑う」に関する言葉（ｈｕｍｏｒ、ｈａｈａなど）を出力し、フィードバックされる感情程度が高ければ高いほど、ロボットの笑顔の幅が大きくなり、笑い声のデシベルが高くなり、テキストの中で「笑う」に関する言葉の文字数が多くなり、
フィードバックされる感情程度がデフォルト感情程度より低い時、ロボットが笑うわけにはいかないと判断し、動作、音声及びテキストの少なくとも一つを通じて厳粛の感情を表し、フィードバックされる感情程度が低ければ低いほど、厳粛の程度が大きくなりなる。

Ｓ１０５、ユーモア検証装置が表現された感情に対する感情識別を通じて、フィードバックされた感情程度を取得する。

ユーモア検証装置はロボットのユーザー文に対するフィードバックした感情を監視し、ユーモア検証装置はカメラ、マイク、テキスト識別モジュールなどを含み、それがカメラでロボットの顔の表情を検出でき、あるいはマイクでロボットの音を検出でき、あるいはテキスト識別モジュールでロボットの出力したテキストを検出でき、感情を監視することによって、ロボットのフィードバックした感情程度を取得し、ハッピー感情が監視されれば、カメラがロボットの顔に笑顔があることを検出し、あるいはマイクがロボットが笑い声を出したことを検出し、あるいはテキスト識別モジュールがロボットの出力したテキストの中にｈｕｍｏｒまたはｈａｈａという言葉があることを検出し、感情程度がデフォルト感情程度に高いあるいは同等であることがわかり、この時に感情程度が笑顔の幅、笑い声のデシベル、ｈｕｍｏｒあるいはｈａｈａの文字数の中のいずれかで確定できるし、その中の二つあるいは三つの結合でも確定でき、
ハッピー感情以外の感情が監視されれば、感情程度がデフォルト感情程度より低いことが代わり、感情程度も類似な方式により確定できる。

Ｓ１０６、ユーモア検証装置が感情識別の結果の中のフィードバックされた感情程度に基づき、識別取得されたユーモア程度を計算する。

感情識別の結果の中にロボットがフィードバックした感情程度が高いほど、ステップＳ１０３においてロボットが識別取得したユーモア程度が高いことがわかり、
感情識別の結果の中にロボットがフィードバックした感情程度が小さくなるほど、ステップＳ１０３においてロボットが識別取得したユーモア程度が小さくなることがわかり、
ステップＳ１０３が示すように、感情識別の結果の中でフィードバックされた感情程度が１の場合、ロボットが識別取得したユーモア程度が１であり、
感情識別の結果の中でフィードバックされた感情程度が０の場合、ロボットが識別取得したユーモア程度も０であり、
感情識別の結果の中でフィードバックされた感情程度がその他の数値の場合、計算で対応するユーモア程度が取得される。

Ｓ１０７、ユーモア検証装置がユーザー文の実際ユーモア程度を取得する。

ユーザー文の実際ユーモア程度はユーザーが入力でき、実際ユーモア程度はユーザーが過去の経験に基づいて取得でき、あるいはユーザーが何人かのその語句を聞いた時の反応に基づいて取得できる。

Ｓ１０８、ユーモア検証装置が識別されたユーモア程度とユーザー文の実際ユーモア程度の差異を比べることによって、ユーモア識別の精度を判断する。

本ステップにおいて識別取得されたユーモア程度がＳ１０６でのユーモア検証装置に識別取得されたユーモア程度であり、識別取得されたユーモア程度とユーザー文の実際ユーモア程度の差異を比べることによって、すなわち両者の階差を計算し、階差が両者の間の差の絶対値であり、階差がユーモア識別の精度に反比例し、階差が大きいほど、ユーモア識別の精度が低く、階差が小さいほど、ユーモア識別の精度が高く、ユーモア識別の精度の計算公式が：１−階差／実際ユーモア程度、例えば識別取得されたユーモア程度が７であり、実際ユーモア程度が６であり、ユーモア識別の精度が８３．３３％になり、期待値が８０％であると仮定する場合、精度が期待値を超え、ロボットのユーモア識別能力が強いことがわかり、精度が期待値に達していない場合、その他のロボットの既存のユーモア識別方法、あるいは改善を経ったユーモア識別方法を選択し、上記ステップＳ１０１〜Ｓ１０７に基づき、精度が期待値に達するまで実験を繰り返し、これによりロボットに強いユーモア識別能力を備えさせる。

実施例２：

本実施例のその他のステップは実施例１と同じであり、異なる部分はステップＳ１０２がビッグデータに基づく相関性分析の方法を通じて実現されることであり、図２が示すように、具体的にはステップＳ１０２１〜Ｓ１０２６を含み、

Ｓ１０２１、ユーザー文の属性データを取得する。

ユーザー文の属性データがユーザーの属性データ、語句内容の属性データ、対話の時間属性データ、対話の空間属性データ、対話の場面属性データ及びその他の相関属性データを含む。

ロボットがユーザーと対話する過程で、ロボットの感官が複数のスモールデータを得ることができ、例えばロボットの目にカメラが取付けられ、ユーザーのビデオ画像データを得ることができ、ロボットの耳にピックアップが取付けられ、ユーザーのオーディオデータを得ることができ、その他の各種センサーがセンスデータ（例えばユーザーの体温、心拍数など）を取得し、各種端末がユーザーの入力したテキストデータ（例えばユーザー属性、言葉など）を取得し、取得した複数のスモールデータ（石）をビッグデータ（池）の中に「投げ」、これによりユーモアを識別あるいは生成し（一石が千層波を巻き起こす）、ユーモアを識別あるいは生成する過程がスモールデータとビッグデータの間に関連データマイニングを行い、これによりスモールデータあるいはビッグデータだけで識別あるいは生成できないユーモアを生成し、このユーモアがビッグデータとスモールデータに基づくロボットのユーモア識別と生成の結果である。

Ｓ１０２２、ユーザー文の属性データから各部分のデータを各スモールデータとして取り出し、スモールデータコレクションに保存する。

スモールデータがロボットとユーザーが対話する過程ならではの個性化データであり、一回の対話の過程で、異なる方法で複数のスモールデータを取得でき、例えばユーザー属性、対話場面、対話時間、対話場所、ロボット属性などである。

Ｓ１０２３、ビッグデータを取得する。

ビッグデータは大量のユーザーが長時間にわたって蓄積してきたデータであり、例えばインターネットビッグデータは無数ののインターネットユーザーが長時間にわたって蓄積してきたデータであり、したがってロボット及び対話過程にとってビッグデータが外部データであり、本実施例のロボットがサーバーからビッグデータを取得できる。

Ｓ１０２４、スモールデータコレクションの中の各スモールデータとユーザー文との関連度を計算する。

スモールデータコレクションの中の各スモールデータとユーザー文との関連度は、既存のビッグデータに基づいて関連性分析を行う技術により実現でき、図３の方式でも実現でき、具体的には下ステップＳ１０２４１〜Ｓ１０２４４を含み、

Ｓ１０２４１、ユーザー文のビッグデータでの類似データの数量を統計し、第一数量とし、ｍで記録し、

Ｓ１０２４２、スモールデータコレクションの各スモールデータのビッグデータでの類似データの数量を統計し、当該スモールデータの第二数量とし、ｎで記録し、

Ｓ１０２４３、当該スモールデータとユーザー文を組み合わせた後に得たデータのビッグデータでの類似データの数量を統計し、当該スモールデータの第三数量とし、ｏで記録し、

Ｓ１０２４４、第一数量ｍ、当該スモールデータの第二数量ｎ及び第三数量ｏに基づき、当該スモールデータとユーザー文の関連度ｒを取得し、その中に、前記当該スモールデータとユーザー文の関連度について、具体的な計算公式は：当該スモールデータの第三数量／（（第一数量×当該スモールデータの第二数量）１／２）であり、

具体的に、当該スモールデータとユーザー文の関連度ｒについて、計算公式が下記の通りである：

ｒ＝ｏ／（（ｍ×ｎ）１／２）（１）

上記の数量統計が既存のｍａｐｒｅｄｕｃｅモデルを採用し、ｈａｄｏｏｐあるいはｓｐａｒｋを利用してビッグデータ向きの快速統計を行うことができる。

Ｓ１０２５、スモールデータコレクションの中の各スモールデータとユーザー文の関連度に基づき、スモールデータコレクションの中の各スモールデータとユーザー文の関連ダイバシティファクタを計算する。

当該ステップは図４の方式で実現し、具体的にはステップＳ１０２５１〜Ｓ１０２５２を含む：

Ｓ１０２５１、各スモールデータとユーザー文の関連度の平均値を計算し、ｒａで記録し、

Ｓ１０２５２、各スモールデータとユーザー文の関連度、各スモールデータとユーザー文の関連度の平均値及びスモールデータコレクションの中のスモールデータの数に基づき、スモールデータコレクションの中の各スモールデータとユーザー文の関連ダイバシティファクタを計算し、ｄで記録し、

スモールデータコレクションの中のスモールデータの数をｃで記録し、スモールデータコレクションの中の各スモールデータとユーザー文の関連ダイバシティファクタの計算公式が下記の通りである：

ｄ＝（ｒ−ｒａ）１／ｃ（２）

Ｓ１０２６、スモールデータコレクションの中の各スモールデータとユーザー文の関連ダイバシティファクタをニューラルネットワークあるいはディープニューラルネットワークに入力し、ユーザー文のユーモア程度を取得する。

本実施例は事前に既知の関連ダイバシティファクタ及び対応の実際ユーモア程度のトレーニングデータを通じてニューラルネットワークあるいはディープニューラルネットワークをトレーニングし、トレーニングを経ったニューラルネットワークあるいはディープニューラルネットワークを取得し、トレーニングを経ったニューラルネットワークあるいはディープニューラルネットワークが本ステップの入力する必要があるニューラルネットワークあるいはディープニューラルネットワークであり、スモールデータコレクションの中の各スモールデータとユーザー文の関連ダイバシティファクタを入力した後、ユーザー文のユーモア程度を取得でき、実施例１のように、ユーモア程度は０〜１の間の数値（小数点までの精度がある）に定義される場合、１に近いほど、ユーモラスである。

本実施例はビッグデータからユーザー文とユーザーデータの関連ダイバシティファクタを取得することによって、ユーザー文のユーモア程度を識別し、これによりロボットのユーモアの識別能力を高める。

実施例３：

本実施例のその他のステップが実施例１と同じ、異なるところはステップＳ１０２がビッグデータ検索の方法を採用し実現することにあり、図５が示すように、具体的にはステップＳ１０２１〜Ｓ１０２６を含み、

Ｓ１０２１、ユーザー文に基づいて検索し、検索結果を取得する。

ユーザー文に基づいて検索し、検索結果を取得でき、その中に、検索結果が複数の語句を含み、検索結果の中の語句の数が検索結果の数であり、検索された語句がユーザー文に関する。

Ｓ１０２２、検索結果の中からユーザー文との一致度の降順によりトップｍ個の語句をそれぞれｍ個の第一語句として選別する。

その中に、ｍが正整数であり、ユーザー文に基づいて検索する時、より多くな検索結果を得る可能性があり、その中に一部の検索結果が合理でない可能性があり、全部のデータを処理すれば時間の無駄になり、したがって検索結果を選択してより合理的な語句を選択する必要があり、一般的に、ユーザー文との一致度の高い語句がより合理的であるため、検索結果からユーザー文との一致度の最も高いトップｍ個の語句を選択してそれぞれｍ個の第一語句とすることである。具体的には、デフォルト照合により検索結果に順序を付け、検索リストを取得し、デフォルト照合は一致度の降順でも類似度の降順というルールなどを採用でき、これにより検索リストからトップｍ個の語句を取得して第一語句とし、すなわちユーザー文との一致度の一番大きいトップｍ個の語句はユーザー文との一致度を降順で順序付け、先頭に配列されるトップｍ個の語句を指す。ビッグデータ検索エンジン自体が対応のデフォルト照合があり、例えば、百度（中国の検索エンジン）のビッグデータ検索エンジンは対応のデフォルト照合があり、ユーザー文を取得して百度ビッグデータ検索エンジンにより検索する時、その対応するデフォルト照合に基づいて順序付けられた検索結果リストがページに表示され、ユーザーがページで見たのは検索結果が検索エンジン自身のデフォルト照合によって順序付けられた後の結果である。

Ｓ１０２３、ユーザー文の属性データを取得する。

ユーザー文の属性データとは、語句の内容に関する属性であり、例えば語句内容の中の主語あるいは／及び客語である属性、また語句内容の中の場面である属性である。ユーザー文の属性データを取得するについては、ユーザー文の主語属性を例とし、図６の方式を通じて実現でき、具体的にはステップＳ１０２３１〜Ｓ１０２３３を含み、

Ｓ１０２３１、ユーザー文に主語がなくあるいはその主語が第一人称となる時、ユーザーの登録情報あるいは対話ボックスの中の属性入力を通じてユーザー文の主語属性を取得し、

Ｓ１０２３２、ユーザー文の主語が第二人称である時、ロボットの登録情報あるいは対話ボックスの中の属性入力を通じてユーザー文の主語属性を取得し、

Ｓ１０２３３、ユーザー文の主語が第三人称である時、対話ボックスの中の属性入力を通じてあるいはユーザー文の主語を電子辞書または検索エンジンの入力として検索し、ユーザー文の主語属性を取得する。

属性データは、ユーザー文の主語属性を例として、例えば、ユーザー文の主語が「私」である場合、対応の属性がユーザー属性であり、ユーザーがロボットと対話する前に、まずロボットの中にユーザー登録し、ユーザー登録情報を取得し、その中にユーザーの属性などの情報が含まれ、例えば、一人の女性が登録する時、ユーザーの名前、年齢及び性別属性などの情報を得る必要があり、例えば、若い女性がその女性の登録した性別属性であり、したがって登録情報により当該女性の当該情報を取得でき、したがってユーザー文の主語属性を取得し、あるいはポップアップ対話ボックスの方式でユーザーに聞くことができ、ユーザーがダイアログボックスの中に主語属性を入力し、これによりユーザー文の主語属性を取得し、
ユーザー文に主語がない場合、主語を「私」にデフォルトし、
ユーザー文の主語が御前様あるいはあなたである場合、それに対してロボットの属性となり、ロボットの属性データが事前にロボットの中に登録されたたものであり、すなわちロボット登録情報であり、ロボットの登録情報に基づいて主語属性を取得でき、あるいは対話ボックスの中の属性入力を通じて主語属性を取得でき、
ユーザー文の主語が第三人称である場合、対話ボックスの中の属性入力を通じて主語情報を取得でき、電子辞典または検索エンジンでの検索を通じて主語属性を取得することもでき、例えば、ユーザー文の主語が「彼」であれば、主語属性が男性であり、ユーザー文の主語が「彼女」であれば、主語属性が女性である。

Ｓ１０２４、属性データをそれぞれ毎個の第一語句に合併し、それぞれ第一語句に対応する合併語句ｍ個を取得する。

第一語句の数と得た合併語句の数が同じであり、例えば、第一語句がｍ個あり、それに対して合併語句をｍ個得て、すなわち第一語句を選別するときに、第一語句を更新した後、第一語句の数量が変化し、それに対して合併語句の数量も対応的に変化する。第一語句がｍ個あり、属性データをそれぞれ毎個の第一語句に合併し、合併語句をｍ個得て、毎個の合併語句に対応する第一語句が一つあり、すなわち一つの第一語句に一つの合併語句が対応し、例えば、第一語句が三個あり、それぞれＡ、Ｂ、Ｃであり、属性データがＤであり、属性データをそれぞれ毎個の第一語句に合併し、すなわちＤをそれぞれＡ、Ｂ、Ｃに合併し、ＡＤ、ＢＤ、ＣＤという合併語句を３個得て、この３条の合併語句がそれぞれ第一語句に対応するものであり、すなわち合併語句ＡＤが第一語句Ａに対応し、合併語句ＢＤが第一語句Ｂに対応し、合併語句ＣＤが第一語句Ｃに対応する。属性データは、ユーザー文の主語属性を例として、ユーザー文の主語が「私」であるあるいはない場合、主語属性がユーザー属性である。ユーザー文の主語が「御前様」あるいは「あなた」の場合、主語属性がロボット属性である。ユーザー文の主語が「彼」であれば、主語属性が男性であり、ユーザー文の主語が「彼女」であれば、主語属性が女性である。ユーザー文の主語がどうな人でも、どんなものでも、どんなことでもよく、それに対して主語属性が対応する人の属性、対応するものの属性あるいは対応することの属性である。語句と主語が中国語でもよく、英語またはその他の言語でもよい。

属性データは、ユーザーの主語属性を例として、ユーザー分の主語の属性を取得する方法として、ユーザーの登録情報を照会することや、対話ボックスをポップアップさせることがあり、例えば、ユーザーが青年の男性を入力すれば、主語属性が青年男性となり、ほかの対話方式あるいは照会方式でもできる。ユーザー文の主語が「私」、「あなた」、「御前様」、「彼」、「彼女」、具体的な人名及び動物名を含むが、これらに限定されていない。ユーザー文に主語がない場合、デフォルトでユーザー文の主語が「私」となる。ユーザー文の主語属性を取得してそれぞれ毎個の第一語句に合併してｍ個の合併語句を取得した後、毎個の合併語句に基づいてそれぞれ検索し、合併語句に対応する数の検索結果を取得する。

Ｓ１０２５、毎個の第一語句及び毎個の第一語句に対応する合併語句にそれぞれ基づき、毎個の第一語句のユーモラスパラメーターを計算する。

合併語句が第一語句と属性データの合併により取得されるものであるため、毎個の第一語句に対してそれと対応する合併語句があり、これにより毎個の第一語句及び毎個の第一語句に対応する合併語句にそれぞれ基づき、毎個の第一語句のユーモラスパラメーターを計算して取得できる。第一語句のユーモラスパラメーターが第一語句の検索結果の数量及び第一語句に対応する合併語句の検索結果の数量の両方によって決められ、すなわち第一語句のユーモラスパラメーターが第一語句の検索結果の数量及び第一語句に対応する合併語句の検索結果の数量に関わるものである。検索結果の数量が合理レベルに対応し、第一語句の検索結果の数量が多ければ多いほど、第一語句がより合理になり、合理レベルが大きくなり、合併語句の検索結果の数量が多ければ多いほど、合併語句が合理なり、合理レベルが大きくなり、合併語句の検索結果の数量が少なければ少ないほど、合併語句が合理でなくなり、合併語句が第一語句と属性データの合併により取得されたため、合併語句が合理でなければないほど、第一語句が属性データに対し合理でなく、対応する第一語句がユーモラスであり、すなわち第一語句が合理であればあるほど、合併語句が合理でなくなり、第一語句のユーモラスパラメーターが大きくなる。

理解できるのは、第一語句のユーモラスパラメーターが第一語句の検索結果の数量が第一語句の総検索結果の数量での比重及び第一語句に対応する合併語句の検索結果の数量が合併語句の総検索結果の数量での比重で共同に決まられることができ、すなわち第一語句のユーモラスパラメーターが第一語句の検索結果の数量が第一語句の総検索結果の数量での比重及び第一語句に対応する合併語句の検索結果の数量が合併語句の総検索結果の数量での比重に関係がある。合併語句の検索結果の数量の比重が第一語句の検索結果の数量の比重に対し小さければ小さいほど、あるいは第一語句の検索結果の数量の比重が合併語句の検索結果の数量の比重に対し大きければ大きいほど、ユーモラスパラメーターが大きくなる。第一語句の総検索結果の数量が毎個の第一語句の検索結果の数量の総数であり、合併語句の総検索結果の数量がそれぞれの合併語句の検索結果の数量の総数であり、比重が大きければ大きいほど、合理レベルが大きくなる。

識別待ちの入力語句により検索を行い、検索結果の中から識別待ちの入力語句との一致度の最も高いトップｍ個の語句をｍ個の第一語句とすることによって、ｍ個の語句が識別待ちの入力語句と最もマッチングすることと、第一語句の合理性を確保する。識別待ちの入力語句の属性データを得て、属性データをそれぞれ毎個の第一語句に合併し、ｍ個の合併語句を得て、毎個の第一語句及び毎個の第一語句に対応する合併語句にそれぞれ基づき、毎個の第一語句のユーモラスパラメーターを計算する。

ステップＳ１０２５の実現は図７のように、具体的にはステップＳ１０２５１〜Ｓ１０２５３を含み、

Ｓ１０２５１、毎個の第一語句にそれぞれ基づいて検索を行い、取得した検索結果の数量を第一語句の検索結果の数量とする。

第一語句の検索結果の数量が多ければ多いほど人々の認識に正相関するようになり、人々に認められるようになる。ｍ個の第一語句を取得した後、毎個の第一語句にそれぞれ基づいて検索し、検索結果の数量を取得して第一語句の検索結果の数量とし、検索結果の数量が第一語句により検索し取得されたものでああるため、検索結果の数量が第一語句に対応し、すなわち第一語句に対応する検索結果の数量を取得し、ｍ個の第一語句があり、ｍ回検索し、ｍ個の検索結果の数量を取得し、毎個の検索結果の数量が一つの第一語句に対応し、すなわちｍ個の第一語句があるため、毎個の第一語句に基づいて検索し、これによりｍ個の検索結果の数量を取得してそれぞれ第一語句の検索結果の数量とし、単一の検索結果の数量を単一の第一語句の検索結果の数量とする。例えば、Ａ、Ｂという二つの第一語句があり、第一語句Ａに基づいて検索し、取得した検索結果の数量が３０であり、第一語句Ｂに基づいて検索し、取得した検索結果の数量が１０であり、つまりそれぞれ行われた二回の検索の検索結果の数量がそれぞれ３０と１０であり、その二つの検索結果の数量をそれぞれ第一語句の検索結果の数量とし、３０が第一語句Ａに対応し、１０が第一語句Ｂに対応する。検索は検索エンジンが呼び出されて自動的に行うものあるいはデフォルトビッグデータに対する検索であり、第一語句の対応する検索結果の数量の大きさから人々の第一語句に対する共感度が分かり、検索結果の数量が大きれば大きいほど人々の第一語句に対する共感度が高くなり、その第一語句がより合理になり、第一語句の合理レベルが大きくなり、すなわち第一語句の検索結果の数量が第一語句の合理性に対応し、第一語句の検索結果の数量を第一語句の合理性パラメーターとし、第一語句の検索結果の数量が大きいほど、第一語句の合理性パラメーターが大きくなる。

Ｓ１０２５２、毎個の合併語句にそれぞれ基づいて検索を行い、取得する検索結果の数量を合併語句の検索結果の数量とする。

合併語句の検索結果の数量が少なければ少ないほど人々の識別に負相関するようになり、人々に識別されなくなる。具体的には、識別待ちの入力語句の属性データを取得し、属性データをそれぞれ毎個の第一語句に合併してｍ個の合併語句を取得し、それぞれの合併語句に基づいて検索し、検索結果の数量を合併語句の検索結果の数量とし、すなわち合併語句に対応する検索結果の数量を取得する。ｍ個の合併語句があり、ｍ回検索し、ｍ個の検索結果の数量を取得し、毎個の検索結果の数量がそれぞれ一条の合併語句に対応し、すなわちｍ個の合併語句があるため、それぞれの合併語句に基づいて検索し、これによりｍ個の検索結果の数量を取得してそれぞれ合併語句の検索結果の数量とでき、単一の検索結果の数量を単一の合併語句の検索結果の数量とする。合併語句の対応する検索結果の数量の大きさから人々の合併語句に対する共感度が分かり、数量が少なければ少ないほど、人々がその合併語句に対する共感度が低くなり、その合併語句が合理でなくなり、合併語句の合理レベルが小さくなり、すなわち合併語句の検索結果の数量が合併語句の合理性に対応し、合併語句の検索結果の数量を合併語句の合理性パラメーターとし、合併語句の検索結果の数量が多ければ多いほど、合併語句の合理性パラメーターが大きくなる。

Ｓ１０２５３、毎個の第一語句の検索結果の数量と毎個の第一語句に対応する合併語句の検索結果の数量との比率をそれぞれ計算し、これにより毎個の第一語句のユーモラスパラメーターを取得する。

負相関と正相関の比率の方法及び人々の識別の正相関と負相関の対立と統一を通じて、最大のユーモラスパラメーターに対応する第一語句が最も人々に認められないと同時に認められ、何故かと言うとユーモラスパラメーターが大きければ大きいほど人々に認められなくなり、しかし第一語句が人々に認められるものであり、ユーモラスであることを示する。

毎個の第一語句にそれに対応する合併語句が一つあり、例えば、二つの第一語句がそれぞれＡとＢであり、第一語句Ａに対応する合併語句がＡＤであり、第一語句Ｂに対応する合併語句がＢＤであり、第一語句Ａの検索結果の数量と第一語句Ａに対応する合併語句ＡＤの検索結果の数量との比率を計算し、第一語句Ａのユーモラスパラメーターを取得し、第一語句Ｂの検索結果の数量と第一語句Ｂに対応する合併語句ＢＤの検索結果の数量との比率を計算し、第一語句Ｂのユーモラスパラメーターを取得し、これにより毎個の第一語句の検索結果の数量と毎個の第一語句に対応する合併語句の検索結果の数量との比率をそれぞれ計算することにより、毎個の第一語句のユーモラスパラメーターを取得できる。

理解できるのは、第一語句の検索結果の数量が人々の第一語句に対する共感度を代表し、すなわち第一語句の合理性であり、合併語句が対応する検索結果の数量が人々が合併語句に対する共感度を代表し、すなわち合併語句の合理性である。第一語句が対応する検索結果の数量が多ければ多いほど合理になり、合併語句が対応する検索結果の数量が少なければ少ないほど合理でなくなり、合併語句がよりユーモラスになり、ある第一語句の検索結果の数量が多ければ多いほど、それに対応する合併語句の検索結果の数量が少ないほど、その第一語句の検索結果の数量とその第一語句に対応する合併語句の検索結果の数量との比率が大きくなることを示し、その第一語句の合理性と対応する合併語句の合理性のコントラストが大きくなることを示し、本質的にその第一語句の合理性と対応する主語の合理性のコントラストが大きくなることを示し、すなわちその第一語句が合理であるものの、対応する主語の属性に一致しなく、当該第一語句がユーザーにとって最もユーモラスであり、従って、第一語句の検索結果の数量と第一語句に対応する合併語句の検索結果の数量との比率を第一語句のユーモラスパラメーターとし、すなわち第一語句の合理性パラメーターと対応する合併語句の合理性との比率をユーモラスパラメーターとし、ユーモラスパラメーターの最も大きな語句を出力語句として出力し、これにより、出力語句の合理性を確保する同時に、ロボットとの対話のユーモアのセンスを高め、すなわちロボットの知恵化とユーモア化にメリットを与える。返答の合理性を満足する同時に、ユーモアのセンスを満足する。第一語句がｍ個あり、対応する合併語句がｍ個あるため、すなわち毎個の第一語句にそれに対応する合併語句が一条あり、これにより毎個の第一語句の検索結果の数量と毎個の第一語句に対応する合併語句の検索結果の数量との比率をそれぞれ計算することにより、毎個の第一語句のユーモラスパラメーターを取得できる。

ほかに、第一語句のユーモラスパラメーターは、第一語句の検索結果の数量が第一語句の総検索結果の数量での比重と、対応する合併語句の検索結果の数量が合併語句の総検索結果の数量での比重との比率を計算することによっても取得できる。第一語句の検索結果の数量が第一語句の総検索結果の数量での比重を第一語句の合理性パラメーターとし、合併語句の検索結果の数量が合併語句の総検索結果の数量での比重を合併語句の合理性パラメーターとし、比重が大きければ大きいほど、合理になり、合理性パラメーターが大きくなり、第一語句の合理性パラメーターと合併語句の合理性パラメーターとの比率を第一語句のユーモラスパラメーターとする。

Ｓ１０２６、一致度の一番大きい第一語句に対応するユーモラスパラメーターと一番小さなユーモラスパラメーターとの間の階差、及び一番大きなユーモラスパラメーターと一致度の一番大きい第一語句に対応するユーモラスパラメーターの間の階差に基づき、ユーザー文のユーモア程度を取得する。

一致度の一番大きい第一語句に対応するユーモラスパラメーターを一番小さなユーモラスパラメーターと比較し、階差が大きければ大きいほど、ユーザー文のユーモア程度が大きくなり、
階差が０である場合、ユーザー文のユーモア程度が一番小さい。

あるいは一番大きなユーモラスパラメーターを一致度が一番大きな第一語句に対応するユーモラスパラメーターと比較し、
階差が０である場合、ユーザー文のユーモア程度が一番大きく、
階差が大きければ大きいほど、ユーザー文のユーモア程度が小さくなる。

一番小さなユーモラスパラメーターに対応する第一語句がユーザー文のアンユーモラス意味である。

具体的に、（一致度の一番大きい第一語句に対応するユーモラスパラメーターと一番小さなユーモラスパラメーターとの階差）と（一番大きなユーモラスパラメーターと一番小さなユーモラスパラメーターとの階差）との比率をユーザー文のユーモア程度とし、
比率が１に近ければ近いほど、ユーザー文のユーモア程度が大きくなり、
比率が０に近ければ近いほど、ユーザー文のユーモア程度が小さくなる。

本実施例に対する第一の適用実例が下記の通りである：

まず、ユーザー文を受信し、例えば、「お腹が痛くて、妊娠しているようです」である。

ユーザー文「お腹が痛くて、妊娠しているようです」をＧｏｏｇｌｅ検索エンジンの入力語句として検索し、検索リストが一致度の降順でソートを行って得た結果であり、検索リストのトップ５０の語句を選択して５０個の第一語句とし、その５０個の語句の中に入力語句のキーワードが含まれ、５０個の語句でのキーワードにカラーマークをつける。

５０個の第一語句をビッグデータ検索エンジンの５０回の入力語句として５０回検索し、５０個の検索結果の数量を得る。

５０個の検索結果の数量を降順でソートし、ソートした後のシーケンスのトップ９個の検索結果の数量に対応する９個の第一語句を選択し、シーケンスのトップ９個の検索結果の数量に対応する９個の第一語句及び対応する検索結果の数量が下記の通りである：

お腹が痛くて、妊娠していますか（検索結果の数量が６２８００００である）。

毎月月経が終わるとお腹が痛くなります（検索結果の数量が２８８００００である）。

お腹が痛くて、胃も痛いです（検索結果の数量が１９６００００である）。

更年期でお腹が痛いです（検索結果の数量が１９４００００である）。

お腹が痛くて、下痢をします（検索結果の数量が１３８００００である）。

お腹が痛くなるほど笑っています（検索結果の数量が１１７００００である）。

お腹が痛くて、大便がしたいです（検索結果の数量が４８６０００である）。

お腹が痛くて、トイレに行って大便がしたいです（検索結果の数量が３６８０００である）。

汗を掻くほどお腹が痛くて、胃腸炎ではないでしょうか（検索結果の数量が２７１００である）。

入力語句の主語属性を取得し、ユーザーがロボットに「お腹が痛くて、妊娠しているようです」と言うとき、ここの主語が「私」であるため、主語属性がユーザー属性である。ロボットはユーザーの登録情報を検索することによってユーザー属性を取得でき、例えば、男性である。ロボットは対話ボックスの方式でユーザーに聞くことによってユーザー属性を取得でき、例えば、ユーザーは対話ボックスに若い男性と入力すれば、主語属性が若い男性となる。また、ロボットは「目」すなわちカメラを通じてユーザー属性を識別することもでき、他の方式でもできる。取得したユーザー属性が「若い男性」であれば、入力語句の主語属性「若い男性」をそれぞれ上記９個の第一語句に合併して９個の合併語句を取得し、その９個の合併語句がそれぞれ前記９個の第一語句に一対一対応し、９個の合併語句が下記の通りである。

お腹が痛くて、妊娠していますか＋若い男性。

毎月月経が終わるとお腹が痛くなります＋若い男性。

お腹が痛くて、胃も痛いです＋若い男性

更年期でお腹が痛いです＋若い男性

お腹が痛くて、下痢をします＋若い男性

お腹が痛くなるほど笑っています＋若い男性

お腹が痛くて、大便がしたいです＋若い男性

お腹が痛くて、トイレに行って大便がしたいです＋若い男性

汗を掻くほどお腹が痛くて、胃腸炎ではないでしょうか＋若い男性

前記９個の合併語句を百度ビッグデータ検索エンジンの９回の入力語句として９回検索し、９個の合併語句に対応する検索結果の数量を取得し、９個の合併語句及び合併語句に対応する検索結果の数量が下記の通りである：

お腹が痛くて、妊娠していますか＋若い男性（検索結果の数量が６０７００である）。

毎月月経が終わるとお腹が痛くなります＋若い男性（検索結果の数量が８０７００である）。

お腹が痛くて、胃も痛いです＋若い男性（検索結果の数量が２７２０００である）。

更年期でお腹が痛いです＋若い男性（検索結果の数量が４２２００である）。

お腹が痛くて、下痢をします＋若い男性（検索結果の数量が５２６０００である）。

お腹が痛くなるほど笑っています＋若い男性（検索結果の数量が１２９０００である）。

お腹が痛くて、大便がしたいです＋若い男性（検索結果の数量が１８００００である）。

お腹が痛くて、トイレに行って大便がしたいです＋若い男性（検索結果の数量が１３７０００である）。

汗を掻くほどお腹が痛くて、胃腸炎ではないでしょうか＋若い男性（検索結果の数量が９６３０である）。

９個の第一語句に対応する検索結果の数量をそれぞれ９個の第一語句に対応する合併語句の検索結果の数量で割ると、９つの商を得て、計算結果が下記の通りである。

６２８００００／６０７００＝１０３．４６。

２８８００００／８０７００＝３５．６９。

１９６００００／２７２０００＝７．２１。

１９４００００／４２２００＝４５．９７。

１３８００００／５２６０００＝１．９０。

１１７００００／１２９０００＝９．０７。

４８６０００／１８００００＝２．７。

３６８０００／１３７０００＝２．６９。

２７１００／９６３０＝２．８１。

前記９個の第一語句の中に「お腹が痛くて、妊娠していますか」の検索結果の数量とそれに対応する合併語句「お腹が痛くて、妊娠していますか＋若い男性」の検索結果の数量との比率が一番大きく、１０３．４６である。

前記９個の第一語句の中に「お腹が痛くて、下痢をします」の検索結果の数量とそれに対応する合併語句「お腹が痛くて、下痢をします＋若い男性」の検索結果の数量との比率が一番小さく、１．９０である。

前記９個の第一語句の中に識別待ちの語句「お腹が痛くて、妊娠しているようです」との一致度の一番大きい第一語句「お腹が痛くて、妊娠していますか」に対応するユーモラスパラメーターが１０３．４６である。

全部の第一語句の中に、入力語句との一致度の一番大きい第一語句に対応するユーモラスパラメーターは、必然的に入力語句に対応するユーモラスパラメーターに一番近く、従って一致度の一番大きい第一語句に対応するユーモラスパラメーターは必然によって近似的に入力語句に対応するユーモラスパラメーターとされることができる。

一番大きなユーモラスパラメーターと一致度の一番大きい第一語句に対応するユーモラスパラメーターを比較し、
階差が０であれば、ユーザー文のユーモア程度が一番高いことを示す。一番小さなユーモラスパラメーターに対応する第一語句「お腹が痛くて、下痢をします」がユーザー文のアンユーモラス意味である。

（一致度の一番大きい第一語句に対応するユーモラスパラメーターと一番小さなユーモラスパラメーターとの階差）と（一番大きなユーモラスパラメーターと一番小さなユーモラスパラメーターとの階差）との比率＝１であり、ユーザー文のユーモア程度として、比率が１であれば、ユーモア程度が一番高いことを示す。

識別の結果が事実と一致し、男性が絶対に妊娠する可能性がないため、ユーモア性が非常に強い。

本実施例に対する第二の適用実例が下記の通りである：

まず、ユーザー文を受信し、例えば、「お腹が痛くて、下痢ですか」である。

ユーザー文「お腹が痛くて、下痢ですか」をＧｏｏｇｌｅ検索エンジンの入力語句として検索し、検索リストを得て、検索リストが一致度の降順でソートを行って得た結果であり、検索リストのトップ５０の語句を選択して５０個の第一語句とし、その５０個の語句の中に入力語句のキーワードが含まれ、５０個の語句でのキーワードにカラーマークをつける。

入力語句の主語属性を取得し、ユーザーがロボットに「お腹が痛くて、下痢ですか」と言うとき、ここの主語が「私」であるため、主語属性がユーザー属性である。ロボットはユーザーの登録情報を検索することによってユーザー属性を取得でき、例えば、男性である。ロボットは対話ボックスの方式でユーザーに聞くことによってユーザー属性を取得することもでき、例えば、ユーザーは対話ボックスに若い男性と入力すれば、主語属性が若い男性となる。また、ロボットは「目」すなわちカメラを通じてユーザー属性を識別することもでき、他の方式でもできる。取得したユーザー属性が「若い男性」であれば、入力語句の主語属性「若い男性」をそれぞれ上記９個の第一語句に合併して９個の合併語句を取得し、その９個の合併語句がそれぞれ前記９個の第一語句に一々対応し、９個の合併語句が下記の通りである。

お腹が痛くて、妊娠していますか＋若い男性

毎月月経が終わるとお腹が痛くなります＋若い男性

お腹が痛くて、胃も痛いです＋若い男性

更年期でお腹が痛いです＋若い男性

お腹が痛くて、下痢をします＋若い男性

お腹が痛くなるほど笑っています＋若い男性

お腹が痛くて、大便がしたいです＋若い男性

６２８００００／６０７００＝１０３．４６。

２８８００００／８０７００＝３５．６９。

１９６００００／２７２０００＝７．２１。

１９４００００／４２２００＝４５．９７。

１３８００００／５２６０００＝１．９０。

１１７００００／１２９０００＝９．０７。

４８６０００／１８００００＝２．７。

３６８０００／１３７０００＝２．６９。

２７１００／９６３０＝２．８１。

前記９個の第一語句の中に識別待ちの語句「お腹が痛くて、下痢ですか」との一致度の一番大きい第一語句「お腹が痛くて、下痢をします」に対応するユーモラスパラメーターが１．９０である。

一番小さなユーモラスパラメーターと一致度の一番大きい第一語句「お腹が痛くて、下痢をします」に対応するユーモラスパラメーターを比較し、階差が０であり、ユーザー文「お腹が痛くて、下痢ですか」がユーモラスでないことを示す。

（一致度の一番大きい第一語句に対応するユーモラスパラメーターと一番小さなユーモラスパラメーターとの階差）と（一番大きなユーモラスパラメーターと一番小さなユーモラスパラメーターとの階差）との比率＝０であり、ユーザー文のユーモア程度として、比率が０であれば、ユーモア程度が零である。

識別の結果が事実と一致し、男性のお腹が痛いなら、下痢の可能性が極めて高いから、ユーモラス性がない。

本実施例に対する第三の適用実例が下記の通りである：

まず、ユーザー文を受信し、例えば、「更年期でお腹が痛いです」である。

ユーザー文「更年期でお腹が痛いです」をＧｏｏｇｌｅ検索エンジンの入力語句として検索し、検索リストが一致度の降順でソートを行って得た結果であり、検索リストのトップ５０の語句を選択して５０個の第一語句とし、その５０個の語句の中に入力語句のキーワードが含まれ、５０個の語句でのキーワードにカラーマークをつける。

入力語句の主語属性を取得し、ユーザーがロボットに「更年期でお腹が痛いです」と言うとき、ここの主語が「私」であるため、主語属性がユーザー属性である。ロボットはユーザーの登録情報を検索することによってユーザー属性を取得でき、例えば、男性である。ロボットは対話ボックスの方式でユーザーに聞くことによってユーザー属性を取得することもでき、例えば、ユーザーは対話ボックスに若い男性と入力すれば、主語属性が若い男性となる。また、ロボットは「目」すなわちカメラを通じてユーザー属性を識別することもでき、他の方式でもできる。取得したユーザー属性が「若い男性」であれば、入力語句の主語属性「若い男性」をそれぞれ上記９個の第一語句に合併して９個の合併語句を取得し、その９個の合併語句がそれぞれ前記９個の第一語句に一々対応し、９個の合併語句が下記の通りである。

お腹が痛くて、妊娠していますか＋若い男性

毎月月経が終わるとお腹が痛くなります＋若い男性

お腹が痛くて、胃も痛いです＋若い男性

更年期でお腹が痛いです＋若い男性

お腹が痛くて、下痢をします＋若い男性

お腹が痛くなるほど笑っています＋若い男性

お腹が痛くて、大便がしたいです＋若い男性

６２８００００／６０７００＝１０３．４６。

２８８００００／８０７００＝３５．６９。

１９６００００／２７２０００＝７．２１。

１９４００００／４２２００＝４５．９７。

１３８００００／５２６０００＝１．９０。

１１７００００／１２９０００＝９．０７。

４８６０００／１８００００＝２．７。

３６８０００／１３７０００＝２．６９。

２７１００／９６３０＝２．８１。

前記９個の第一語句の中に識別待ちの語句「更年期でお腹が痛いです」との一致度の一番大きい第一語句「更年期でお腹が痛いです＋若い男性」に対応するユーモラスパラメーターが４５．９７である。

一番小さなユーモラスパラメーターに対応する第一語句「お腹が痛くて、下痢をします」がユーザー文「更年期でお腹が痛いです」のアンユーモラス意味である。

（一致度の一番大きい第一語句に対応するユーモラスパラメーターと一番小さなユーモラスパラメーターとの階差）と（一番大きなユーモラスパラメーターと一番小さなユーモラスパラメーターとの階差）との比率＝（４５．９７−１．９０）／（１０３．４６−１．９０）約０．４３であり、
ユーザー文のユーモア程度として、比率が１に近ければ近いほど、ユーモア程度が大きくなり、
比率が０に近ければ近いほど、ユーモア程度が小さくなり、
従って、ユーザー文が一定のユーモア性がある。

識別の結果が事実と一致し、男性にも更年期があるため、お腹が痛いことがある。しかし、若い男性の場合になると事実と一致しなく、何故かと言うと若い男性は更年期になるわけがない。従ってこの識別待ちの語句は一定のユーモア性があるものの、ユーモア性が「お腹が痛くて、妊娠していますか」より小さく、何故かと言うと男性が妊娠する可能性がなく、ユーモア性がより強い。

実施例４：

本実施例のロボットは外部にユーモア程度を出力でき、故に当該ロボットが感情表現という方式を採用しなく、実施例１との区別が直接にステップＳ１０２が識別し取得したユーモア程度をステップＳ１０８の精度判断の中に適用し、ステップＳ１０３〜Ｓ１０６で処理する必要がないことであり、その他が実施例１、２あるいは３と同じである。

実施例５：

図８が示すように、本実施例はユーモア識別に基づく感情対話ロボットシステムを提供し、当該システムはロボット８０１とユーモア検証装置８０２を含み、前記ロボット８０１はユーザー文取得モジュール８０１１、ユーモア程度識別モジュール８０１２、感情程度計算モジュール８０１３及び感情表現モジュール８０１４を含み、前記ユーモア検証装置８０２は感情程度取得モジュール８０２１、ユーモア程度計算モジュール８０２２、実際ユーモア程度取得モジュール８０２３及び精度判断モジュール８０２４を含み、

前記ロボット８０１の中の各モジュールの具体的な機能が下記の通りである：

前記ユーザー文取得モジュール８０１１は、ユーザーの入力語句をユーザー文として取得し、

前記ユーモア程度識別モジュール８０１２は、ユーザー文を識別し、ユーザー文のユーモア程度を取得し、既存のユーモア識別方式を通じてユーザーの入力した文を識別でき、

前記感情程度計算モジュール８０１３は、ユーザー文のユーモア程度に基づき、フィードバックされる感情程度を計算し、

前記感情表現モジュール８０１４は、フィードバックされる感情程度に基づき、感情計算を通じて感情を表現し、

前記ユーモア検証装置８０２の中の各モジュールの具体的な機能が下記の通りである：

前記感情程度取得モジュール８０２１は、ロボットに表現された感情を感情識別して、ロボットのフィードバックした感情程度を得て、ロボットがフィードバックされた感情程度を取得し、

前記ユーモア程度計算モジュール８０２２は、感情識別の結果でのロボットにフィードバックされた感情程度に基づき、ロボットに識別取得されたユーモア程度を計算する。

前記実際ユーモア程度取得モジュール８０２３は、ユーザー文の実際ユーモア程度を取得し、

前記精度判断モジュール８０２４は、ロボットに識別取得されたユーモア程度とユーザー文の実際ユーモア程度との差異を比べて、ロボットのユーモア識別の精度を判断する。

実施例６：

本実施例のその他のモジュールが実施例５と同じであるが、区別がユーモア程度識別モジュール８０１２の実現にあり、図９が示すように、前記ユーモア程度識別モジュール８０１２は第一属性データ取得ユニット８０１２１、スモールデータコレクション取得ユニット８０１２２、ビッグデータ取得ユニット８０１２３、関連度計算ユニット８０１２４、関連ダイバシティファクタ計算ユニット８０１２５及び第一ユーモア程度取得ユニット８０１２６を含み、各ユニットの具体的な機能が下記の通りである：

前記第一属性データ取得ユニット８０１２１は、ユーザー文の属性データを取得し、

前記スモールデータコレクション取得ユニット８０１２２は、ユーザー文の属性データの中から各部分のデータを各スモールデータとしてアクセスし、スモールデータコレクションに保存し、

前記ビッグデータ取得ユニット８０１２３は、ビッグデータを取得し、

前記関連度計算ユニット８０１２４は、スモールデータコレクションの各スモールデータとユーザー文との関連度を計算し、図１０の示すように、当該関連度計算ユニット８０１２４は第一統計サブユニット８０１２４１、第二統計サブユニット８０１２４２、第三統計サブユニット８０１２４３、関連度計算サブユニット８０１２４４を含み、

前記第一統計サブユニット８０１２４１は、ユーザー文のビッグデータでの類似データの数量を第一数量として統計し、

前記第二統計サブユニット８０１２４２は、スモールデータコレクションの中の各スモールデータのビッグデータでの類似データの数量を当該スモールデータの第二数量として統計し、

前記第三統計サブユニット８０１２４３は、当該スモールデータをユーザー文と組み合わせた後で得たデータのビッグデータでの類似データの数量を第三数量として統計し、

前記関連度計算サブユニット８０１２４４は、第一数量、当該スモールデータの第二数量及び第三数量に基づき、当該スモールデータのユーザー文との関連度を取得し、具体的な計算が実施例２を参考でき、

前記関連ダイバシティファクタ計算ユニット８０１２５は、スモールデータコレクションの中の各スモールデータとユーザー文との関連度に基づき、スモールデータコレクションの中の各スモールデータとユーザー文との関連ダイバシティファクタを計算し、図１１の示すように、当該関連ダイバシティファクタ計算ユニット８０１２５は関連度平均値計算サブユニット８０１２５１、関連ダイバシティファクタ計算サブユニット８０１２５２を含む：

前記関連度平均値計算サブユニット８０１２５１は、各スモールデータとユーザー文との関連度の平均値を計算し、

前記関連ダイバシティファクタ計算サブユニット８０１２５２は、各スモールデータとユーザー文との関連度、各スモールデータとユーザー文との関連度の平均値及びスモールデータコレクションの中のスモールデータの数に基づき、スモールデータコレクションの中の各スモールデータとユーザー文との関連ダイバシティファクタを計算し、具体的な計算が実施例２を参考できる。

前記第一ユーモア程度取得ユニット８０１２６は、スモールデータコレクションの中の各スモールデータとユーザー文との関連ダイバシティファクタをニューラルネットワークあるいはディープニューラルネットワークに入力し、ユーザー文のユーモア程度を取得する。

実施例７：

本実施例のその他のモジュールが実施例５と同じであるが、区別がユーモア程度識別モジュール８０１２の実現にあり、図１２が示すように、前記ユーモア程度識別モジュール８０１２は検索ユニット８０１２１、選別ユニット８０１２２、第二属性データ取得ユニット８０１２３、合併ユニット８０１２４、ユーモラスパラメーター計算ユニット８０１２５及び第二ユーモア程度取得ユニット８０１２６を含み、各ユニットの具体的な機能が下記の通りである：

前記検索ユニット８０１２１は、ユーザー文に基づいて検索し、検索結果を取得し、

前記選別ユニット８０１２２は、検索結果の中からユーザー文との一致度の降順によりトップｍ個の語句をそれぞれｍ個の第一語句として選別し、その中に、ｍが正整数であり、

前記第二属性データ取得ユニット８０１２３は、ユーザー文の属性データを取得し、図１３の示すように、当該第二属性データ取得ユニット８０１２３は第一属性データ取得サブユニット８０１２３１、第二属性データ取得サブユニット８０１２３２、第三属性データ取得サブユニット８０１２３３を含み、

前記第一属性データ取得サブユニット８０１２３１は、ユーザー文に主語がないあるいは主語が第一人称である時、ユーザーの登録情報あるいは対話ボックスの中の属性入力を通じてユーザー文の属性データを取得し、

前記第二属性データ取得サブユニット８０１２３２は、ユーザー文の主語が第二人称である時、ロボットの登録情報あるいは対話ボックスの中の属性入力を通じてユーザー文の属性データを取得し、

前記第三属性データ取得サブユニット８０１２３３は、ユーザー文の主語が第三人称であるとき、対話ボックスの中の属性入力によってあるいはユーザー文の主語を電子辞書または検索エンジンの入力として検索することによって、ユーザー文の属性データを取得し、

前記合併ユニット８０１２４は、属性データをそれぞれ毎個の第一語句に合併し、第一語句にそれぞれ対応するｍ個の合併語句を取得し、

前記ユーモラスパラメーター計算ユニット８０１２５は、毎個の第一語句及び毎個の第一語句に対応する合併語句にそれぞれ基づき、毎個の第一語句のユーモラスパラメーターを計算し、図１４の示すように、当該ユーモラスパラメーター計算ユニット８０１２５は第一検索結果の数量取得サブユニット８０１２５１、第一検索結果の数量取得サブユニット８０１２５２、ユーモラスパラメーター取得サブユニット８０１２５３を含み、

前記第一検索結果の数量取得サブユニット８０１２５１は、それぞれ毎個の第一語句に基づいて検索し、検索結果の数量を取得し第一語句の検索結果の数量とし、

前記第一検索結果の数量取得サブユニット８０１２５２は、それぞれの合併語句に基づいて検索し、検索結果の数量を取得し合併語句の検索結果の数量とする。

前記ユーモラスパラメーター取得サブユニット８０１２５３は、毎個の第一語句の検索結果の数量と毎個の第一語句に対応する合併語句の検索結果の数量との比率をそれぞれ計算し、これにより毎個の第一語句のユーモラスパラメーターを取得する。

前記第二ユーモア程度取得ユニット８０１２６は一致度の一番大きい第一語句に対応するユーモラスパラメーターと一番低いユーモラスパラメーターの間の階差に基づき、ユーザー文のユーモア程度を取得する。

実施例８：

本実施例のロボットは外部にユーモア程度を出力でき、故に当該ロボットが感情表現という方式を採用しなく、実施例５との区別はユーモア程度識別モジュール８０１２に識別取得されたユーモア程度を直接に精度判断モジュール８０２４に適用することにあり、感情程度計算モジュール８０１３、感情表現モジュール８０１４、感情程度取得モジュール８０２１、ユーモア程度計算モジュール８０２２を使わなくても実現でき、その他が実施例５、６あるいは７と同じである。

ここで説明する必要があるのは、上記各実施例が提供するロボットシステムは前記各機能モジュールの区分によって例をあげて説明し、実際の応用の中で、ニーズに応じて上記機能を異なる機能モジュールに配って完成し、すなわち内部構造を異なる機能モジュールに区分し、上記の全部あるいは一部分の機能を完成する。

理解できるのは、前記各実施例のロボットシステムが使用する「第一」、「第二」などの術語が各種のユニットを説明でき、しかしこれらのユニットがこれらの術語に限定されない。これらの術語は、一番目のユニットをほかのユニットと区別するためにのみ使用される。例えば、本発明の範囲から離れない場合に、第一ユーモア程度取得ユニットを第二ユーモア程度取得ユニットと呼べ、同様に、第二ユーモア程度取得ユニットを第一ユーモア程度取得ユニットと呼べ、第一ユーモア程度取得ユニットと第二ユーモア程度取得ユニットがともにユーモア程度取得ユニットであるが、同じユーモア程度取得ユニットではなく、同様に、第一属性データ取得ユニットと第二属性データ取得ユニットが同じである。

以上に述べたのはただ本実用新型のより良い実施例で、本実用新型を限定することに使わないである。本実用新型の意義と原則のもとで行う全ての修正、同等の入れ替えと改善などは本実用新型の保護範囲に含まれる。

Claims

ユーモア識別に基づく感情対話方法は、ロボットとユーモア検証装置を通じて実現し、
ロボットがユーザーの入力した文を取得し、ユーザー文とするステップ、
ロボットがユーザー文を識別し、ユーザー文のユーモア程度を取得するステップ、
ユーモア検証装置がユーザー文の実際ユーモア程度を取得するステップ、
及びユーモア検証装置が識別されたユーモア程度とユーザー文の実際ユーモア程度の差異を比べることによって、ユーモア識別の精度を判断するステップを含み、
前記方法はユーモア検証装置がユーザー文の実際ユーモア程度を取得する前に、
ロボットがユーザー文のユーモア程度に基づき、フィードバックされる感情程度を計算するステップ、
ロボットがフィードバックされる感情程度に基づき、感情計算で感情を表すステップ、
ユーモア検証装置が表現された感情に対する感情識別を通じて、フィードバックされた感情程度を取得するステップ、
及びユーモア検証装置が感情識別の結果の中のフィードバックされた感情程度に基づき、識別取得されたユーモア程度を計算するステップを含み、
前記ロボットがユーザー文を識別し、ユーザー文のユーモア程度を取得するステップについて、具体的には、
ユーザー文の属性データを取得するステップ、
ユーザー文の属性データから各部分のデータを各スモールデータとして取り出し、スモールデータコレクションに保存するステップ、
ビッグデータを取得するステップ、
スモールデータコレクションの中の各スモールデータとユーザー文との関連度を計算するステップ、
スモールデータコレクションの中の各スモールデータとユーザー文の関連度に基づき、スモールデータコレクションの中の各スモールデータとユーザー文の関連ダイバシティファクタを計算するステップ、
及びスモールデータコレクションの中の各スモールデータとユーザー文の関連ダイバシティファクタをニューラルネットワークあるいはディープニューラルネットワークに入力し、ユーザー文のユーモア程度を取得するステップを含み、
前記スモールデータコレクションの中の各スモールデータとユーザー文との関連度を計算するステップについて、具体的には、
ユーザー文のビッグデータでの類似データの数量を統計し、第一数量とするステップ、
スモールデータコレクションの各スモールデータのビッグデータでの類似データの数量を統計し、当該スモールデータの第二数量とするステップ、
当該スモールデータとユーザー文が組み合わせた後に得られたデータのビッグデータでの類似データの数量を統計し、当該スモールデータの第三数量とするステップ、
及び第一数量、当該スモールデータの第二数量及び第三数量に基づき、当該スモールデータとユーザー文の関連度を取得するステップを含み、
前記スモールデータコレクションの中の各スモールデータとユーザー文の関連度に基づき、スモールデータコレクションの中の各スモールデータとユーザー文の関連ダイバシティファクタを計算するステップについて、具体的には、
各スモールデータとユーザー文の関連度の平均値を計算するステップ、
及び各スモールデータとユーザー文の関連度、各スモールデータとユーザー文の関連度の平均値及びスモールデータコレクションの中のスモールデータの数に基づき、スモールデータコレクションの中の各スモールデータとユーザー文の関連ダイバシティファクタを計算するステップを含み、
前記ロボットがユーザー文を識別し、ユーザー文のユーモア程度を取得するステップについて、具体的には下記を含む：
ユーザー文に基づいて検索し、検索結果を取得ステップ、
検索結果の中からユーザー文との一致度の降順によりトップｍ個の語句をそれぞれｍ個の第一語句として選別するステップ（その中に、ｍが正整数である）、
ユーザー文の属性データを取得するステップ、
属性データを毎個の第一語句にそれぞれ合併し、第一語句にそれぞれ対応するｍ個の合併語句を取得するステップ、
毎個の第一語句及び毎個の第一語句に対応する合併語句にそれぞれ基づき、毎個の第一語句のユーモラスパラメーターを計算するステップ、
及び一致度の一番大きい第一語句に対応するユーモラスパラメーターと一番小さなユーモラスパラメーターとの間の階差、及び一番大きなユーモラスパラメーターと一致度の一番大きい第一語句に対応するユーモラスパラメーターの間の階差に基づき、ユーザー文のユーモア程度を取得するステップを含む。
ユーモア識別に基づく感情対話ロボットシステムであって、前記システムはロボットとユーモア検証装置を含み、
前記ロボットはユーザー文取得モジュールとユーモア程度識別モジュールを含み、
前記ユーザー文取得モジュールは、ユーザーの入力語句をユーザー文として取得し、
前記ユーモア程度識別モジュールは、ロボットがユーザー文を識別してユーザー文のユーモア程度を取得し、
前記ユーモア検証装置は実際ユーモア程度取得モジュールと精度判断モジュールを含み、
前記実際ユーモア程度取得モジュールは、ユーザー文の実際ユーモア程度を取得し、
前記精度判断モジュールは、ロボットに識別取得されたユーモア程度とユーザー文の実際ユーモア程度との差異を比べて、ロボットのユーモア識別の精度を判断し、
前記ロボットは感情程度計算モジュールと感情表現モジュールも含み、
前記感情程度計算モジュールは、ロボットがユーザー文のユーモア程度に基づき、フィードバックされる感情程度を計算し、
前記感情表現モジュールは、ロボットがフィードバックされる感情程度に基づいて感情計算を通じて感情を表現し、
前記ユーモア検証装置は感情程度取得モジュールとユーモア程度計算モジュールも含み、
前記感情程度取得モジュールは、ロボットの表現した感情に対して感情識別を行ってロボットに識別取得されたユーモア程度を計算し、
前記ユーモア程度計算モジュールは、感情識別の結果でのロボットにフィードバックされた感情程度に基づき、ロボットに識別取得されたユーモア程度を計算する。
前記ユーモア程度識別モジュールは、具体的には第一属性データ取得ユニット、スモールデータコレクション取得ユニット、ビッグデータ取得ユニット、関連度計算ユニット、関連ダイバシティファクタ計算ユニットと第一ユーモア程度取得ユニットを含み、
前記第一属性データ取得ユニットは、ユーザー文の属性データを取得し、
前記スモールデータコレクション取得ユニットは、ユーザー文の属性データの中から各部分のデータを各スモールデータとしてアクセスし、スモールデータコレクションに保存し、
前記ビッグデータ取得ユニットは、ビッグデータを取得し、
前記関連度計算ユニットは、スモールデータコレクションの各スモールデータとユーザー文との関連度を計算し、
前記関連ダイバシティファクタ計算ユニットは、スモールデータコレクションの中の各スモールデータとユーザー文との関連度に基づき、スモールデータコレクションの中の各スモールデータとユーザー文との関連ダイバシティファクタを計算し、
前記第一ユーモア程度取得ユニットは、スモールデータコレクションの中の各スモールデータとユーザー文との関連ダイバシティファクタをニューラルネットワークあるいはディープニューラルネットワークに入力し、ユーザー文のユーモア程度を取得する。
前記関連度計算ユニットは、具体的には第一統計サブユニット、第二統計サブユニット、第三統計サブユニットと関連度計算サブユニットを含み、
前記第一統計サブユニットは、ユーザー文のビッグデータでの類似データの数量を第一数量として統計し、
前記第二統計サブユニットは、スモールデータコレクションの中の各スモールデータのビッグデータでの類似データの数量を当該スモールデータの第二数量として統計し、
前記第三統計サブユニットは、当該スモールデータをユーザー文と組み合わせた後で得たデータのビッグデータでの類似データの数量を第三数量として統計し、
前記関連度計算サブユニットは、第一数量、当該スモールデータの第二数量及び第三数量に基づき、当該スモールデータのユーザー文との関連度を取得し、
前記関連ダイバシティファクタ計算ユニットは、具体的には関連度平均値計算サブユニットと関連ダイバシティファクタ計算サブユニットを含み、
前記関連度平均値計算サブユニットは、各スモールデータとユーザー文との関連度の平均値を計算し、
前記関連ダイバシティファクタ計算サブユニットは、各スモールデータとユーザー文との関連度、各スモールデータとユーザー文との関連度の平均値及びスモールデータコレクションの中のスモールデータの数に基づき、スモールデータコレクションの中の各スモールデータとユーザー文との関連ダイバシティファクタを計算し、
前記ユーモア程度識別モジュールは、具体的には検索ユニット、選別ユニット、第二属性データ取得ユニット、合併ユニット、ユーモラスパラメーター計算ユニットと第二ユーモア程度取得ユニットを含み、
前記検索ユニットは、ユーザー文に基づいて検索し、検索結果を取得し、
前記選別ユニットは、検索結果の中からユーザー文との一致度の降順によりトップｍ個の語句をそれぞれｍ個の第一語句として選別し、その中に、ｍが正整数であり、
前記第二属性データ取得ユニットは、ユーザー文の属性データを取得し、
前記合併ユニットは、属性データをそれぞれ毎個の第一語句に合併し、第一語句にそれぞれ対応するｍ個の合併語句を取得し、
前記ユーモラスパラメーター計算ユニットは、毎個の第一語句及び毎個の第一語句に対応する合併語句にそれぞれ基づき、毎個の第一語句のユーモラスパラメーターを計算し、
前記第二ユーモア程度取得ユニットは一致度の一番大きい第一語句に対応するユーモラスパラメーターと一番低いユーモラスパラメーターの間の階差に基づき、ユーザー文のユーモア程度を取得する。