JP2005173651A - コメント自動生成システム - Google Patents
コメント自動生成システム Download PDFInfo
- Publication number
- JP2005173651A JP2005173651A JP2003408251A JP2003408251A JP2005173651A JP 2005173651 A JP2005173651 A JP 2005173651A JP 2003408251 A JP2003408251 A JP 2003408251A JP 2003408251 A JP2003408251 A JP 2003408251A JP 2005173651 A JP2005173651 A JP 2005173651A
- Authority
- JP
- Japan
- Prior art keywords
- comment
- rule
- data
- sentence
- phrase
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
【課題】本発明は、スポーツコメント等のコメント自動生成システムに関するものである。
【解決手段】データを受信するデータ受信部と、受信データを基に得られる単語や数値などのデータを保存し蓄積する第1データベース部と、コメントとしての定型句又は定型文を分析して複数のデータの組合せとした条件式とし、これに対するコメントとしての定型句又は定型文を表示するルール群からなるルールテーブルと、該ルールテーブルで定義されたコメントとしての定型句又は定型文を登録した第2データベース部と、前記第1データベース部に蓄積されたデータを基に前記ルールテーブルの各ルールの条件式と比較し、条件式が一致したルールを適用して前記コメントを呼び出し、条件式に一致した単語又は数値データを差し込んで自動的にコメントとしての語句等を生成する推論処理部とを有し、出力部からコメントとしての語句等を整形して出力することを特徴とする。
【選択図】 図1
【解決手段】データを受信するデータ受信部と、受信データを基に得られる単語や数値などのデータを保存し蓄積する第1データベース部と、コメントとしての定型句又は定型文を分析して複数のデータの組合せとした条件式とし、これに対するコメントとしての定型句又は定型文を表示するルール群からなるルールテーブルと、該ルールテーブルで定義されたコメントとしての定型句又は定型文を登録した第2データベース部と、前記第1データベース部に蓄積されたデータを基に前記ルールテーブルの各ルールの条件式と比較し、条件式が一致したルールを適用して前記コメントを呼び出し、条件式に一致した単語又は数値データを差し込んで自動的にコメントとしての語句等を生成する推論処理部とを有し、出力部からコメントとしての語句等を整形して出力することを特徴とする。
【選択図】 図1
Description
本発明は、スポーツコメントなどのコメント自動生成システムに関するものである。
ほとんどの大規模スポーツイベントや大規模スポーツシリーズではリザルトデータがXML形式でリアルタイムに提供されており、放送局でもそのうちのいくつかの情報を試合データとして利用しているが、情報提供各社から提供されるリザルトデータを試合データとしてそのまま放送しており、特に蓄積、分析は行なわれていない。
情報提供各社から提供されるデータは、すでに統計処理がなされており内容的にも情報量が豊富である。また、シーズンを通して一貫した整合性のあるデータであり、蓄積、分析の対象とすることもできる。選手ごと、チームごと、対戦相手ごとといった切り口で分析することもできるが、スポーツ知識をあまり用いて分析しなくても、十分な情報量がある。
このデータを蓄積し自動的に検索できれば、たとえば今までの累積ゴール数が0の選手に関しては、「x選手、シーズン初ゴールで勝利を飾る」とか、その試合直前には打率が3割以下だったという過去のデータがあれば、「x選手、これで打率を3割にのせた」というコメントが、以前までの試合を見ていなくても、作成可能になる。
しかし、従来は、そのスポーツの知識や対象チームの過去の成績に精通した記者でなければ、スポーツコメントを書くことは難しかった。たとえスポーツに詳しい記者でも、過去の成績についての記憶があいまいなときは、調査に時間を要していた。
このことはスポーツに限らず、各種分野においても、事実としてデータは容易に得られるが、現在および過去の事実を組合せてコメントとして表現することは困難であり、同様の問題となっている。
情報提供各社から提供されるデータは、すでに統計処理がなされており内容的にも情報量が豊富である。また、シーズンを通して一貫した整合性のあるデータであり、蓄積、分析の対象とすることもできる。選手ごと、チームごと、対戦相手ごとといった切り口で分析することもできるが、スポーツ知識をあまり用いて分析しなくても、十分な情報量がある。
このデータを蓄積し自動的に検索できれば、たとえば今までの累積ゴール数が0の選手に関しては、「x選手、シーズン初ゴールで勝利を飾る」とか、その試合直前には打率が3割以下だったという過去のデータがあれば、「x選手、これで打率を3割にのせた」というコメントが、以前までの試合を見ていなくても、作成可能になる。
しかし、従来は、そのスポーツの知識や対象チームの過去の成績に精通した記者でなければ、スポーツコメントを書くことは難しかった。たとえスポーツに詳しい記者でも、過去の成績についての記憶があいまいなときは、調査に時間を要していた。
このことはスポーツに限らず、各種分野においても、事実としてデータは容易に得られるが、現在および過去の事実を組合せてコメントとして表現することは困難であり、同様の問題となっている。
また、特開2002−197097号公報には、新聞記事などを読み込む入力手段と,フレーム名と記事に現れやすい文章またはその一部のパターン情報とが格納されたルールテーブルと,上記ルールテーブル中のパターン情報と入力記事との照合によって入力記事から単語情報を抽出する手段と,上記ルールテーブル中のフレーム名によって決定されるテンプレートを記憶する手段と,上記テンプレートと,上記で抽出された単語情報とによって入力記事の要約文を生成する手段と、上記で生成された要約文を出力する手段とを有することを特徴とする記事要約文生成装置ないし方法が開示されている。
この構成では、重要な語句を抽出し、この抽出された語句を予め用意されているテンプレートにそのまま埋め込むことで要約文を生成している。
しかし、上記構成は、記事に使用された語をそのまま用いた要約文を生成するものであって、現在および過去の一定の事実の組合せを基にして、事実の評価をしたコメントとしての語句や文章を推論して、新たな語句や文章を生成することはできなかった。
特開2002−197097号公報
この構成では、重要な語句を抽出し、この抽出された語句を予め用意されているテンプレートにそのまま埋め込むことで要約文を生成している。
しかし、上記構成は、記事に使用された語をそのまま用いた要約文を生成するものであって、現在および過去の一定の事実の組合せを基にして、事実の評価をしたコメントとしての語句や文章を推論して、新たな語句や文章を生成することはできなかった。
この発明は上記事情に鑑みて創案されたものであって、入力されるデータから要素となる数値情報を抽出し、この抽出された数値情報と、過去の蓄積データとを基に所定の評価をした語句や文章を推論して生成して、コメントの経験が少ないスタッフや当該分野の知識のないスタッフでも、新たなコメントを作ることができるようにしたコメント生成援助システムを提供することにある。
上記課題を達成するために、請求項1の発明では、
データプロバイダーからのデータを受信するデータ受信部と、受信データから得られる単語や数値などの所定のデータを検索可能に保存し、蓄積する第1データベース部と、コメントとしての定型句または定型文を辞書的情報に基づいて分析して複数のデータの組合せとした条件式とし、これに対するアクションとしてコメントとしての定型句または定型文を表示するルール群からなるルールテーブルと、該ルールテーブルで定義されたコメントとしての定型句または定型文を登録した第2データベース部と、前記第1データベース部に蓄積された現在および過去のデータを基に、前記ルールテーブルの各ルールの条件式と比較し、条件式が一致した場合に当該ルールを適用して前記コメントとしての定型句または定型文を呼び出し、必要に応じて条件式に一致した単語または数値データを差し込んで自動的にコメントとしての句または文章を生成する推論処理部と、生成されたコメントとしての句または文章を必要に応じて整形して出力する出力部とからなる、という技術的手段を講じている。
また、請求項2の発明では、
前記ルールの条件式が、受信データから得られた所定の数値データを基にして、該数値データが一定の数値を超えたか、または一定の数値を超えないかを判定する条件を有した条件式からなっている、という技術的手段を講じている。
請求項3の発明では、
前記ルールの条件式が3つ以上の条件の組合せからなっており、部分的に条件が一致した場合に一致の度合いを判定し、部分的に一致するルールが複数あった場合に、一致の度合いが高いルールを優先して適用する、という技術的手段を講じている。
また、請求項4の発明では、
前記ルールの条件式が、受信データから得られた所定の数値データを基にして、該数値が所定の基準値より少ない場合、または多い場合に、その差分を基に一致の度合いを判定し、部分的に一致するルールが複数あった場合に、一致の度合いが高いルールを優先して適用する、という技術的手段を講じている。
請求項5の発明では、
前記部分的に一致するルールが複数あった場合に、一致の度合いが所定以上であれば全てのルールを適用する、という技術的手段を講じている。
また、、請求項6の発明では、
前記ルールテーブルによる過去のルールの適用と定型文の選択の履歴を登録すると共に、これに対する修正やコメントおよび状況をパターン登録する学習機能を備える、という技術的手段を講じている。
更に、請求項7の発明では、
前記ルールテーブルによる過去の定型文の選択の履歴を登録して、一定の期間内に同じ文が生成されないように制御する制御手段を設ける、という技術的手段を講じている。
請求項8の発明では、
前記出力部が、生成されたコメントとしての句または文章を、所望の字数、様式、禁則などに応じて整形する整形部を有していることを特徴とする請求項1に記載
データプロバイダーからのデータを受信するデータ受信部と、受信データから得られる単語や数値などの所定のデータを検索可能に保存し、蓄積する第1データベース部と、コメントとしての定型句または定型文を辞書的情報に基づいて分析して複数のデータの組合せとした条件式とし、これに対するアクションとしてコメントとしての定型句または定型文を表示するルール群からなるルールテーブルと、該ルールテーブルで定義されたコメントとしての定型句または定型文を登録した第2データベース部と、前記第1データベース部に蓄積された現在および過去のデータを基に、前記ルールテーブルの各ルールの条件式と比較し、条件式が一致した場合に当該ルールを適用して前記コメントとしての定型句または定型文を呼び出し、必要に応じて条件式に一致した単語または数値データを差し込んで自動的にコメントとしての句または文章を生成する推論処理部と、生成されたコメントとしての句または文章を必要に応じて整形して出力する出力部とからなる、という技術的手段を講じている。
また、請求項2の発明では、
前記ルールの条件式が、受信データから得られた所定の数値データを基にして、該数値データが一定の数値を超えたか、または一定の数値を超えないかを判定する条件を有した条件式からなっている、という技術的手段を講じている。
請求項3の発明では、
前記ルールの条件式が3つ以上の条件の組合せからなっており、部分的に条件が一致した場合に一致の度合いを判定し、部分的に一致するルールが複数あった場合に、一致の度合いが高いルールを優先して適用する、という技術的手段を講じている。
また、請求項4の発明では、
前記ルールの条件式が、受信データから得られた所定の数値データを基にして、該数値が所定の基準値より少ない場合、または多い場合に、その差分を基に一致の度合いを判定し、部分的に一致するルールが複数あった場合に、一致の度合いが高いルールを優先して適用する、という技術的手段を講じている。
請求項5の発明では、
前記部分的に一致するルールが複数あった場合に、一致の度合いが所定以上であれば全てのルールを適用する、という技術的手段を講じている。
また、、請求項6の発明では、
前記ルールテーブルによる過去のルールの適用と定型文の選択の履歴を登録すると共に、これに対する修正やコメントおよび状況をパターン登録する学習機能を備える、という技術的手段を講じている。
更に、請求項7の発明では、
前記ルールテーブルによる過去の定型文の選択の履歴を登録して、一定の期間内に同じ文が生成されないように制御する制御手段を設ける、という技術的手段を講じている。
請求項8の発明では、
前記出力部が、生成されたコメントとしての句または文章を、所望の字数、様式、禁則などに応じて整形する整形部を有していることを特徴とする請求項1に記載
この発明は、データプロバイダーから受信したデータを基に、数値データを抽出し、この抽出されたデータを複数組み合わせたルールテーブルに基づいて所定の評価をしたコメントとしての定型句や定型文を推論して生成するので、予備調査をする必要がなく、またコメントの経験が少ないスタッフや当該分野の知識のないスタッフであっても、新たなコメントを容易に作り、または表現することができる。
以下に、この発明のコメント自動生成システムをスポーツコメントに適用した場合の好適実施例について図面を参照しながら説明する。
このコメント自動生成システム1は、図1に示すように、スポーツデータプロバイダー10からのデータを受信するデータ受信部2と、受信データから得られる単語や数値などの所定のデータを検索可能に保存し、蓄積する第1データベース部3と、条件式とこれに対するアクションを定義したルール群からなるルールテーブル4と、該ルールテーブル4で定義されたコメントとしての定型句または定型文を登録した第2データベース部5と、前記ルールテーブル4に基づいて自動的にコメントとしての句または文章を生成する推論処理部6と、生成されたコメントを出力する出力部7と、必要に応じてコメントの文章を整形する整形部8とからなっている。
スポーツプロバイダー10から、リザルトデータがリアルタイムに提供されており、コンピュータネットワークNに接続された端末としてのデータ受信部2では、上記リザルトデータをXMLファイルとして受信する。
データ受信部2で受信されたXMLファイルは、XML形式のまま第1データベース部3に記録される。
従って、XML用の検索処理により、試合データ内容の検索、計算を行うことができる。
データ受信部2で受信されたXMLファイルは、XML形式のまま第1データベース部3に記録される。
従って、XML用の検索処理により、試合データ内容の検索、計算を行うことができる。
[第1データベース部]
スポーツデータプロバイダー10から受け取るXMLファイルは、そのまま第1データベース部3に記録され、原則としてXMLを直接照会して目的のデータを得たり、プロダクションルールのルールの真偽値を判定したりするのに使用する。
例えば、
ルール1)
G(x) & Nationality(y)=Japanese → say(日本人選手xがゴール)
このルールを全選手に対して適用して、左辺が真になるxを求める。
スポーツデータプロバイダー10から受け取るXMLファイルは、そのまま第1データベース部3に記録され、原則としてXMLを直接照会して目的のデータを得たり、プロダクションルールのルールの真偽値を判定したりするのに使用する。
例えば、
ルール1)
G(x) & Nationality(y)=Japanese → say(日本人選手xがゴール)
このルールを全選手に対して適用して、左辺が真になるxを求める。
累積データで使用頻度が高いデータは、各時点での累積データをリレーショナルデータベース(以下RDBと略す)に再構成して保存する。
また、データが英語データの場合には、変換テーブル(図示省略)を用いて、選手名、チーム名、都市名、技名その他のデータの日本語訳を用意しておき、後述のコメント作成時に日本語に変換する。
また、データが英語データの場合には、変換テーブル(図示省略)を用いて、選手名、チーム名、都市名、技名その他のデータの日本語訳を用意しておき、後述のコメント作成時に日本語に変換する。
[推論処理部]
次ぎに、推論処理部6は、前記第1データベース部3に蓄積された試合データと、ルールテーブル4として登録されたルール群とを比較し、決められた基準に基づいて、一致する、あるいは一致の度合いが大きいルールを抽出する。
そして、上記ルールによって、後述の第2データベース部8に記録されているコメントの定型句や定型文を呼び出して、コメント文章を自動的に構成する。
次ぎに、推論処理部6は、前記第1データベース部3に蓄積された試合データと、ルールテーブル4として登録されたルール群とを比較し、決められた基準に基づいて、一致する、あるいは一致の度合いが大きいルールを抽出する。
そして、上記ルールによって、後述の第2データベース部8に記録されているコメントの定型句や定型文を呼び出して、コメント文章を自動的に構成する。
[ルールテーブル]
推論用のルールテーブル4は、プロダクションルールを使って、データに一致する文(あるいはアクション)を生成する。
プロダクションルールは、「もしA(条件)ならばB(行動)する」という文の集合であり、ここでは「A → B」と表記する。
左辺Aには複数の条件の列を書き、論理積で条件が一致したとき、右辺Bを実行する。
推論用のルールテーブル4は、プロダクションルールを使って、データに一致する文(あるいはアクション)を生成する。
プロダクションルールは、「もしA(条件)ならばB(行動)する」という文の集合であり、ここでは「A → B」と表記する。
左辺Aには複数の条件の列を書き、論理積で条件が一致したとき、右辺Bを実行する。
一致するルールが複数あった場合に、一致の度合い(一致度)に応じて実行するルールを決めてもよい。
例えば、ルールの条件式の条件の数が多い場合を少ない場合に比して一致度が高いとするなどである。
例1)
ルール1)雨が降っている → 傘を持っていく
ルール2)雨が降る予報が出ている → 傘を持っていく
この例では、雨が降っているか予報が出ていれば、自動的に傘を持っていくという動作が決まる。
ルール3)雨が降っている&サッカーを見に行く → レーンコートを持っていく
雨が降っていてサッカーを見に行く場合は、ルール1とルール3の両方ともに一致するが、ルール1では条件が1つであるのに対して、ルール3では条件が2つであるからルール3の方が一致度が高いと判定し、ルール3を採用する。
また、場合によっては両方採用する方式もある。
その場合、ルール1とルール3が採用され、傘とレーンコートを持っていくという動作になる。
例えば、ルールの条件式の条件の数が多い場合を少ない場合に比して一致度が高いとするなどである。
例1)
ルール1)雨が降っている → 傘を持っていく
ルール2)雨が降る予報が出ている → 傘を持っていく
この例では、雨が降っているか予報が出ていれば、自動的に傘を持っていくという動作が決まる。
ルール3)雨が降っている&サッカーを見に行く → レーンコートを持っていく
雨が降っていてサッカーを見に行く場合は、ルール1とルール3の両方ともに一致するが、ルール1では条件が1つであるのに対して、ルール3では条件が2つであるからルール3の方が一致度が高いと判定し、ルール3を採用する。
また、場合によっては両方採用する方式もある。
その場合、ルール1とルール3が採用され、傘とレーンコートを持っていくという動作になる。
また、前記一致度は、条件式に設定された複数の条件のうち、一部の条件が一致しなくても、一致した条件の度合いを点数で評価するようにしてもよい。
一致度に高低や多少がある場合は、一般的には、一致度が高いルールを優先するが、全部のルールあるいは所定の一致度を超えたものを適用してもよい。
ルールの一致度の高い順や、ルールごとに決めた優先度によって、動作の実行順序を決めることができる。
一致度に高低や多少がある場合は、一般的には、一致度が高いルールを優先するが、全部のルールあるいは所定の一致度を超えたものを適用してもよい。
ルールの一致度の高い順や、ルールごとに決めた優先度によって、動作の実行順序を決めることができる。
例)スポーツ(サッカー)の場合
ルール2)
{Σ(i=1、n−1)(G(i)(x))}=0 & G(n)(x)>0 → Say(x選手がシーズン初ゴール)
(ただし、G(i)(x)は、第i試合での選手名xのゴール数、G(n)(x)は、第n試合での選手名xのゴール数。第n試合が最新の試合とする。)
ルール2)
{Σ(i=1、n−1)(G(i)(x))}=0 & G(n)(x)>0 → Say(x選手がシーズン初ゴール)
(ただし、G(i)(x)は、第i試合での選手名xのゴール数、G(n)(x)は、第n試合での選手名xのゴール数。第n試合が最新の試合とする。)
この場合、上記ルールでは、第1試合から第n試合の直前の試合まで選手名xのゴール数が0であるという条件と、第n試合で選手名xのゴール数が0より多いという条件とが論理積(&)となる条件式からなっており、これが一致すると「x選手がシーズン初ゴール」のコメントの定型句が呼び出され、xに選手名のデータ、例えば「中田」が差し込まれて、「中田選手がシーズン初ゴール」のコメントが生成される。
ルール3)
LineUp(n)∋x & T(n)(x)<90 → Say(x、途中T(n)分で交代)
(ただし、LineUp(n)はラインナップリスト、T(n)(x)は第n試合の選手名xの出場時間とする。)
そして、例えば、xが「中村」、T(n)が第3試合、35分とすると、「中村、途中35分で交代」のコメントとなる。
LineUp(n)∋x & T(n)(x)<90 → Say(x、途中T(n)分で交代)
(ただし、LineUp(n)はラインナップリスト、T(n)(x)は第n試合の選手名xの出場時間とする。)
そして、例えば、xが「中村」、T(n)が第3試合、35分とすると、「中村、途中35分で交代」のコメントとなる。
次ぎに、この発明では、あいまいな語句については、入力されるデータから要素となる数値データを抽出して行う。
即ち、前記ルールの条件式で、あいまいな語句を辞書的情報を基に分析して、前記要素となる数値の基準値を定めて数式で定義しておく。
例えば、サッカーの場合に、シュート数の数値データや、ファール数の数値データや、ゴール数の数値データや、観客数の数値データなどが、それぞれの基準値より多いか、少ないか、または一定の基準値範囲に含まれるか否かなどの数式として定義することができる。
即ち、前記ルールの条件式で、あいまいな語句を辞書的情報を基に分析して、前記要素となる数値の基準値を定めて数式で定義しておく。
例えば、サッカーの場合に、シュート数の数値データや、ファール数の数値データや、ゴール数の数値データや、観客数の数値データなどが、それぞれの基準値より多いか、少ないか、または一定の基準値範囲に含まれるか否かなどの数式として定義することができる。
この数式は、単独で、または複数組み合わせてルールの条件式となるが、これは、スポーツに使われる「あいまいな」コメント(キーワード)を定義している辞書的情報に他ならない。
ルール4)
Shoot(n)<5 & Foul(n)<5 & Goal(n)<1 → Say(動きの少ない試合展開)
第n試合において、シュート、ファウルが5個未満で、ゴールがないとき、「動きの少ない試合」となる。
ルール5)
Goal(n)=0 & ShotsOnGoal(n)(x)>6 → Say(xのシュートがことごとくキーパーに阻まれた)
(ただし、Goal(n)が第n試合でのゴール数、ShotsOnGoal(n)(x)が第n試合での選手名xのシュート数とする。)
この例では、6回以上シュートしたが1回もゴールを割ることができなかった事実を「ことごとく阻まれる」という語句の定義としている。
ルール6)
Foul>30 & (Yellow_Card + Red_Card) >5 → Say(ラフな試合展開)
(ただし、Foul、Yellow_Card、Red_Cardはそれぞれその試合で出たファウル、イエローカード、レッドカードの数とする。)
この例では、ファウルが31以上出て、イェローカードとレッドカードが合計6枚以上出た試合を「ラフな試合展開」と定義している。
ルール4)
Shoot(n)<5 & Foul(n)<5 & Goal(n)<1 → Say(動きの少ない試合展開)
第n試合において、シュート、ファウルが5個未満で、ゴールがないとき、「動きの少ない試合」となる。
ルール5)
Goal(n)=0 & ShotsOnGoal(n)(x)>6 → Say(xのシュートがことごとくキーパーに阻まれた)
(ただし、Goal(n)が第n試合でのゴール数、ShotsOnGoal(n)(x)が第n試合での選手名xのシュート数とする。)
この例では、6回以上シュートしたが1回もゴールを割ることができなかった事実を「ことごとく阻まれる」という語句の定義としている。
ルール6)
Foul>30 & (Yellow_Card + Red_Card) >5 → Say(ラフな試合展開)
(ただし、Foul、Yellow_Card、Red_Cardはそれぞれその試合で出たファウル、イエローカード、レッドカードの数とする。)
この例では、ファウルが31以上出て、イェローカードとレッドカードが合計6枚以上出た試合を「ラフな試合展開」と定義している。
次ぎに、あいまいな語句の定義は、以下の例のように0から1までの値を用いて、一致度係数を求めることができる。
ルール4')
Shoot(n)<5 & Foul(n)<5 & Goal(n)<1
& ConditionMatchvalue={(5−Shoot (n))+(5−Foul(n))}/10
ルール4')
Shoot(n)<5 & Foul(n)<5 & Goal(n)<1
& ConditionMatchvalue={(5−Shoot (n))+(5−Foul(n))}/10
即ち、上記条件式中の{(5−Shoot)+(5−Foul)}/10が一致度係数となるもので、0から1までの値を用いて表すことができる。
たとえば、シュート、ファウルが両方0ならば、一致度係数が1となり、両方4ならば一致度数0.2となる。
このように0〜1の数値として表現された一致度係数を用い、他のルールで算出された一致度係数と比較し、1に近い方を優先して採用する。
このように、どのルールを優先して使用するかの優先順位をつけることができる。
たとえば、シュート、ファウルが両方0ならば、一致度係数が1となり、両方4ならば一致度数0.2となる。
このように0〜1の数値として表現された一致度係数を用い、他のルールで算出された一致度係数と比較し、1に近い方を優先して採用する。
このように、どのルールを優先して使用するかの優先順位をつけることができる。
同様に、ルール5、ルール6の場合は、例えば下記のようなルールとすることができる。
ルール5’)
Goal(n)=0 & ShotsOnGoal(n)(x)>6 & ConditionMatchvalue=(ShootOnGoal(n)/6)
ルール6’)
Foul>30 & (Yellow_Card + Red_Card) >5 & ConditionMatchvalue= {(Foul/30)+(Yellow_Card + Red_Card)/5}/2
これらの場合は、1以上の数値として表現された一致度係数を用い、他のルールで算出された一致度係数と比較し、1よりもより大きい数値を一致の度合いが高いものとして優先して採用しうる。
ルール5’)
Goal(n)=0 & ShotsOnGoal(n)(x)>6 & ConditionMatchvalue=(ShootOnGoal(n)/6)
ルール6’)
Foul>30 & (Yellow_Card + Red_Card) >5 & ConditionMatchvalue= {(Foul/30)+(Yellow_Card + Red_Card)/5}/2
これらの場合は、1以上の数値として表現された一致度係数を用い、他のルールで算出された一致度係数と比較し、1よりもより大きい数値を一致の度合いが高いものとして優先して採用しうる。
上記のようにこの発明では、ルールの条件式は、コメントとなる語句の定義とほとんど一致しており、スポーツに使われるコメント(キーワード)を定義している辞書的情報に他ならない。
例えば、「初勝利」は、いままで一勝もしないで今回の試合に勝ったということで定義される。
ルール7)
{Σ(i=1、n−1)Win(i)}=0 & Win(n)=True
この式の真偽値をデータベースを検索して調べることにより、「初勝利」か否かを判定する。
これにより、ある試合について述べることができるコメントのキーワードを自動抽出し表示することができ、記者やスタッフ等の援助を行うことができる。
例えば、「初勝利」は、いままで一勝もしないで今回の試合に勝ったということで定義される。
ルール7)
{Σ(i=1、n−1)Win(i)}=0 & Win(n)=True
この式の真偽値をデータベースを検索して調べることにより、「初勝利」か否かを判定する。
これにより、ある試合について述べることができるコメントのキーワードを自動抽出し表示することができ、記者やスタッフ等の援助を行うことができる。
次ぎに、プロダクションルールと、そこで用いるコメントとしての定型句や定型文は、過去の数シーズンの例を事前に収集しておき、どの条件のときに、どの例文を出したかを基に整理・分析して前記第2データベース部5に登録しておく。
また、毎シーズンごとに、手入力した修正やコメントとそのときの試合の状況をパターン登録しておける学習機能部を付加しておく。
更に、ルールテーブルに基づいて出力されたコメントの履歴を第2データベース部5に保存しておき、同一シーズンに、同じコメントが生成されないように、制御する制御部を設けてもよい。
また、毎シーズンごとに、手入力した修正やコメントとそのときの試合の状況をパターン登録しておける学習機能部を付加しておく。
更に、ルールテーブルに基づいて出力されたコメントの履歴を第2データベース部5に保存しておき、同一シーズンに、同じコメントが生成されないように、制御する制御部を設けてもよい。
前記推論処理部6による処理の結果は、出力部7からコメント文として出力され外部表示される。
ここで、出力部7には、必要に応じて句や文章を整形する整形部を設けることが好ましい。
ここで、出力部7には、必要に応じて句や文章を整形する整形部を設けることが好ましい。
[整形部]
整形部8では、生成されたコメントとしての単語、定型句や定型文を、所望の字数、様式、禁則などに応じて整形する。
整形方法の例1は、推論処理部6で出力したコメントとしての単語の組合せや定形句を一致条件の優先順に並べて外部表示しただけであってもよい。
この表示を見て、記者等が自由に切り貼りして自分でコメントを作成する。
これによって、前知識の少ない記者であっても、事実を正確に分析したコメント文を作ることができる。
整形部8では、生成されたコメントとしての単語、定型句や定型文を、所望の字数、様式、禁則などに応じて整形する。
整形方法の例1は、推論処理部6で出力したコメントとしての単語の組合せや定形句を一致条件の優先順に並べて外部表示しただけであってもよい。
この表示を見て、記者等が自由に切り貼りして自分でコメントを作成する。
これによって、前知識の少ない記者であっても、事実を正確に分析したコメント文を作ることができる。
整形方法の例2は、推論処理部6によって出力されたコメントとしての単語、定型句や定型文を、日本語として意味が通じるように並べる構成である。
日本語用の生成構文規則をベースにして自由に文章を生成するが、簡単な雛型文に単語を当てはめて作るものでもよい。
例えば、次のような雛型文があったとする。
雛型例文1)
「x(形容詞)な試合展開の後、前半y(数値)分にz(選手名)がゴール。これが決め手となって、一点を守って勝利。」
このとき、x,y,zに当てはまり、かつ文の内容に一致する句が生成してあれば、この雛型をそのまま用いて変数x,y,zに値を代入して、文章を完成する。もし、試合の状況がこの例文の内容に合わないときは、この雛型は採用されない。
日本語用の生成構文規則をベースにして自由に文章を生成するが、簡単な雛型文に単語を当てはめて作るものでもよい。
例えば、次のような雛型文があったとする。
雛型例文1)
「x(形容詞)な試合展開の後、前半y(数値)分にz(選手名)がゴール。これが決め手となって、一点を守って勝利。」
このとき、x,y,zに当てはまり、かつ文の内容に一致する句が生成してあれば、この雛型をそのまま用いて変数x,y,zに値を代入して、文章を完成する。もし、試合の状況がこの例文の内容に合わないときは、この雛型は採用されない。
雛形例文2)(試合展開に関する句a)+「で」+(前半のゴールに関する句b)+「と」+(後半に関する句c)+「によって」+(勝利チーム名d)+「が」+(勝利チームに関して特筆すべき事象e)+「した。」
このとき、前段の句出力が、以下のようだったとする。
a=動きの少ない試合。
b=前半40分中田ゴール。
c=(後半はゴールなしのため、空文)
d=ペルージヤ
e=シーズン初勝利
とすると、完成した文は、
「動きの少ない試合で、前半40分中田ゴールによって、ペルージャがシーズン初勝利した。」となる。(後半のゴール情報が空文なので文中の「と」が、自動的にとり除かれた。)
このとき、前段の句出力が、以下のようだったとする。
a=動きの少ない試合。
b=前半40分中田ゴール。
c=(後半はゴールなしのため、空文)
d=ペルージヤ
e=シーズン初勝利
とすると、完成した文は、
「動きの少ない試合で、前半40分中田ゴールによって、ペルージャがシーズン初勝利した。」となる。(後半のゴール情報が空文なので文中の「と」が、自動的にとり除かれた。)
このような雛型文埋め込みロジックにするために、要部生成部6の出力では、その定型句や文単体だけでなく、それらの属性情報を付加しておく。
その属性情報とは、要部生成部6から出力された定型句や語が、試合展開を記述したものか、ゴールの情報か、勝ち負けの情報か、点差情報かなどの区別である。
また、語句の形態素情報も付加しておく。
上記属性情報によって、ロジックによって定型句や文を識別できるようになり、前記雛型文に埋め込むことが容易になる。
その属性情報とは、要部生成部6から出力された定型句や語が、試合展開を記述したものか、ゴールの情報か、勝ち負けの情報か、点差情報かなどの区別である。
また、語句の形態素情報も付加しておく。
上記属性情報によって、ロジックによって定型句や文を識別できるようになり、前記雛型文に埋め込むことが容易になる。
上記実施例ではスポーツのリザルトデータを用いてスポーツコメントを自動生成するシステムについて説明したが、この発明はスポーツに限らず各種ジャンルにおいても適用しうる。
その他、要するにこの発明の要旨を変更しない範囲で種々設計変更しうること勿論である。
その他、要するにこの発明の要旨を変更しない範囲で種々設計変更しうること勿論である。
1 自動生成システム
2 データ受信部
3 第1データベース部
4 ルールテーブル
5 第2データベース部
6 推論処理部
7 出力部
8 整形部
10 スポーツデータプロバイダー
2 データ受信部
3 第1データベース部
4 ルールテーブル
5 第2データベース部
6 推論処理部
7 出力部
8 整形部
10 スポーツデータプロバイダー
Claims (8)
- データプロバイダーからのデータを受信するデータ受信部と、
受信データを基に得られる単語や数値などの所定のデータを検索可能に保存し、蓄積する第1データベース部と、
コメントとしての定型句または定型文を辞書的情報に基づいて分析して複数のデータの組合せとした条件式とし、これに対するアクションとしてコメントとしての定型句または定型文を表示するルール群からなるルールテーブルと、
該ルールテーブルで定義されたコメントとしての定型句または定型文を登録した第2データベース部と、
前記第1データベース部に蓄積された現在および過去のデータを基に、前記ルールテーブルの各ルールの条件式と比較し、条件式が一致した場合に当該ルールを適用して前記コメントとしての定型句または定型文を呼び出し、必要に応じて条件式に一致した単語または数値データを差し込んで自動的にコメントとしての句または文章を生成する推論処理部と、
生成されたコメントとしての句または文章を必要に応じて整形して出力する出力部とからなることを特徴とするコメント自動生成システム。 - ルールの条件式が、受信データから得られた所定の数値データを基にして、該数値データが一定の数値を超えたか、または一定の数値を超えないかを判定する条件を有した条件式からなっていることを特徴とする請求項1に記載のコメント自動生成システム。
- ルールの条件式が3つ以上の条件の組合せからなっており、
部分的に条件が一致した場合に一致の度合いを判定し、
部分的に一致するルールが複数あった場合に、一致の度合いが高いルールを優先して適用することを特徴とする請求項1に記載のコメント自動生成システム。 - ルールの条件式が、受信データから得られた所定の数値データを基にして、該数値が所定の基準値より少ない場合、または多い場合に、その差分を基に一致の度合いを判定し、
部分的に一致するルールが複数あった場合に、一致の度合いが高いルールを優先して適用することを特徴とする請求項1に記載のコメント自動生成システム。 - 部分的に一致するルールが複数あった場合に、一致の度合いが所定以上であれば全てのルールを適用することを特徴とする請求項3または4に記載のコメント自動生成システム。
- ルールテーブルによる過去のルールの適用と定型文の選択の履歴を登録すると共に、これに対する修正やコメントおよび状況をパターン登録する学習機能を備えることを特徴とする請求項1に記載のコメント自動生成システム。
- ルールテーブルによる過去の定型文の選択の履歴を登録して、一定の期間内に同じ文が生成されないように制御する制御手段を設けることを特徴とする請求項1に記載のコメント自動生成システム。
- 前記出力部が、生成されたコメントとしての句または文章を、所望の字数、様式、禁則などに応じて整形する整形部を有していることを特徴とする請求項1に記載のコメント自動生成システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003408251A JP2005173651A (ja) | 2003-12-05 | 2003-12-05 | コメント自動生成システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003408251A JP2005173651A (ja) | 2003-12-05 | 2003-12-05 | コメント自動生成システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005173651A true JP2005173651A (ja) | 2005-06-30 |
JP2005173651A5 JP2005173651A5 (ja) | 2006-08-03 |
Family
ID=34729999
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003408251A Pending JP2005173651A (ja) | 2003-12-05 | 2003-12-05 | コメント自動生成システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005173651A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007219579A (ja) * | 2006-02-14 | 2007-08-30 | Profield Co Ltd | ドキュメント変換装置、およびプログラム |
CN107305549A (zh) * | 2016-04-18 | 2017-10-31 | 北京搜狗科技发展有限公司 | 语言数据处理方法、装置以及用于语言数据处理的装置 |
JP2018206079A (ja) * | 2017-06-05 | 2018-12-27 | 株式会社Jvcケンウッド | チャット端末装置、チャットシステム、チャット表示方法、及びチャット表示プログラム |
-
2003
- 2003-12-05 JP JP2003408251A patent/JP2005173651A/ja active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007219579A (ja) * | 2006-02-14 | 2007-08-30 | Profield Co Ltd | ドキュメント変換装置、およびプログラム |
JP4519081B2 (ja) * | 2006-02-14 | 2010-08-04 | 株式会社プロフィールド | ドキュメント変換装置、およびプログラム |
CN107305549A (zh) * | 2016-04-18 | 2017-10-31 | 北京搜狗科技发展有限公司 | 语言数据处理方法、装置以及用于语言数据处理的装置 |
JP2018206079A (ja) * | 2017-06-05 | 2018-12-27 | 株式会社Jvcケンウッド | チャット端末装置、チャットシステム、チャット表示方法、及びチャット表示プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102119385B (zh) | 用于在内容检索服务系统内检索媒体内容的方法和子系统 | |
CN106776523B (zh) | 基于人工智能的新闻速报生成方法及装置 | |
US5991755A (en) | Document retrieval system for retrieving a necessary document | |
US20210042467A1 (en) | Method for automatically summarizing internet web page and text information | |
CN108108426B (zh) | 自然语言提问的理解方法、装置及电子设备 | |
WO2019136841A1 (zh) | 直播间内容标签提取方法、存储介质、电子设备及系统 | |
CN104978314B (zh) | 媒体内容推荐方法及装置 | |
CN107608960B (zh) | 一种命名实体链接的方法和装置 | |
CN106372060A (zh) | 搜索文本的标注方法和装置 | |
JPH07219969A (ja) | 画像部品を検索する装置及びその方法 | |
CN106227719B (zh) | 中文分词歧义消除方法和系统 | |
CN104484380A (zh) | 个性化搜索方法及装置 | |
US8428948B1 (en) | Usage based query response | |
CN110096572B (zh) | 一种样本生成方法、装置及计算机可读介质 | |
CN109634594A (zh) | 一种考虑代码语句顺序信息的代码片段推荐方法 | |
JP2008090401A (ja) | 文書検索装置、文書検索方法および文書検索プログラム | |
Korn et al. | Automatically generating interesting facts from wikipedia tables | |
Weissbock et al. | Combining textual pre-game reports and statistical data for predicting success in the national hockey league | |
Aleksandrova et al. | Multilingual sentence-level bias detection in Wikipedia | |
CN105279289A (zh) | 基于指数衰减窗口的个性化音乐推荐排序方法 | |
US20200401767A1 (en) | Summary evaluation device, method, program, and storage medium | |
Constant et al. | The LIGM-Alpage architecture for the SPMRL 2013 shared task: Multiword expression analysis and dependency parsing | |
Sandesh et al. | Text-mining based localisation of player-specific events from a game-log of cricket | |
US8112707B2 (en) | Capturing reading styles | |
JP2005173651A (ja) | コメント自動生成システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060616 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060616 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080402 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080924 |