JP5440814B2 - 判定装置、判定方法、及びプログラム - Google Patents

判定装置、判定方法、及びプログラム Download PDF

Info

Publication number
JP5440814B2
JP5440814B2 JP2011512300A JP2011512300A JP5440814B2 JP 5440814 B2 JP5440814 B2 JP 5440814B2 JP 2011512300 A JP2011512300 A JP 2011512300A JP 2011512300 A JP2011512300 A JP 2011512300A JP 5440814 B2 JP5440814 B2 JP 5440814B2
Authority
JP
Japan
Prior art keywords
utilization
determination target
determination
change
description
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011512300A
Other languages
English (en)
Other versions
JPWO2010128574A1 (ja
Inventor
穣 岡嶋
真一 安藤
聡 中澤
貴士 大西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2011512300A priority Critical patent/JP5440814B2/ja
Publication of JPWO2010128574A1 publication Critical patent/JPWO2010128574A1/ja
Application granted granted Critical
Publication of JP5440814B2 publication Critical patent/JP5440814B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、入力キーワードが示す物やサービス等の有効性を判定するために利用される、判定装置、判定方法、及びプログラムに関する。
多くのテキストデータの中から、古くなった記述、及び変更が必要となった記述を発見することは、テキストデータの維持管理や検索を行う上で重要である。特に、記述に含まれている物及びサービス等の利用が困難になっている場合、それらの効果が得られなくなっている場合、即ち有効性が変化している場合は、その記述の削除又は変更が必要になる。
例えば、旅行ガイドブックに、ある遊園地を推奨する記事が記述され、その後、この遊園地が廃業した場合は、遊園地の有効性が変化しているため、記事の記述の削除、又は変更が必要となる。このような、有効性が時間と共に変化するものの例としては、物理的な商品及び施設、更には、無形の制度及びサービス等、多岐に渡って挙げられる。なお、以下の説明では、これらを総称して「物・サービス等」とする。
ところで、このような物・サービス等の有効性にいつ変化が生じたのかを知るための方法としては、この物・サービスを表す語(キーワード)を含む文書を調べる方法が挙げられる。
例えば、特許文献1は、キーワードの出現の数に基づき長い間話題になっていない古すぎるキーワードを特定し、これを除去する技術を開示している。特許文献1に開示された技術は、上述した、物・サービス等を利用する上での有効性を直接的に判定する技術ではない。但し、有効性を判定したい物・サービス等を表すキーワードを入力とし、この技術を用いて、古すぎるキーワードを特定することで、判定対象となる物・サービス等の有効性が低下しているかどうかを判定できると考えられる。
特開2001−312513号公報(第5頁、第6図)
しかしながら、キーワードの出現が、必ず、物・サービス等が有効であることを示していると考えることは困難である。よって、上記特許文献1に開示されているキーワードの出現に基づく手法には、物・サービス等の有効性を正しく判定することができないという問題がある。
例えば、判定対象となる物・サービス等について、既に有効性が切れているにも関わらず、過去の物・サービス等として言及している文書等が存在する場合がある。この場合、キーワードの出現が必ずしも物・サービスの有効性を反映しているとは言えないため、上記特許文献1に開示の技術では、上述したように、物・サービス等の有効性の正確な判断は不可能である。
本発明の目的は、上記問題を解消し、キーワードが示す物・サービス等が有効となった時点又は有効でなくなった時点を適切に判定し得る、判定装置、判定方法、及びプログラムを提供することにある。
上記目的を達成するため、本発明における判定装置は、入力されたキーワードが示す判定対象が有効となった時点又は有効でなくなった時点を判定する判定装置であって、
時間情報を有する複数の文書の中に含まれる、前記判定対象の開始に関わる記述、及び前記判定対象の終了に関わる記述のうち少なくとも一方を特定し、特定された前記記述を含む文書から、前記判定対象の有効性が変化している変化時点を推定する変化時点推定部と、
前記複数の文書の中に含まれる、前記判定対象の利用又は活用に関わる記述を特定し、特定された前記記述を含む文書から、前記判定対象が期間毎にどの程度利用又は活用されているのかを示す利活用度を推定する利活用度推定部と、
前記利活用度推定部が推定した利活用度を用いて、前記変化時点推定部が推定した変化時点が適切であるかどうかを判定する変化時点判定部と、
を備えていることを特徴とする。
また、上記目的を達成するため、本発明における判定方法は、入力されたキーワードが示す判定対象が有効となった時点又は有効でなくなった時点を判定するための方法であって、
(a)時間情報を有する複数の文書の中に含まれる、前記判定対象の開始に関わる記述、及び前記判定対象の終了に関わる記述のうち少なくとも一方を特定し、特定された前記記述を含む文書から、前記判定対象の有効性が変化している変化時点を推定する、ステップと、
(b)前記複数の文書の中に含まれる、前記判定対象の利用又は活用に関わる記述を特定し、特定された前記記述を含む文書から、前記判定対象が期間毎にどの程度利用又は活用されているのかを示す利活用度を推定する、ステップと、
(c)前記(b)のステップで推定した利活用度を用いて、前記(a)のステップで推定した変化時点が適切であるかどうかを判定する、ステップと、
を有することを特徴とする。
更に、上記目的を達成するため、本発明におけるプログラムは、コンピュータによって、入力されたキーワードが示す判定対象が有効となった時点又は有効でなくなった時点を判定するためのプログラムであって、
前記コンピュータによって、
(a)時間情報を有する複数の文書の中に含まれる、前記判定対象の開始に関わる記述、及び前記判定対象の終了に関わる記述のうち少なくとも一方を特定し、特定された前記記述を含む文書から、前記判定対象の有効性が変化している変化時点を推定する、ステップと、
(b)前記複数の文書の中に含まれる、前記判定対象の利用又は活用に関わる記述を特定し、特定された前記記述を含む文書から、前記判定対象が期間毎にどの程度利用又は活用されているのかを示す利活用度を推定する、ステップと、
(c)前記(b)のステップで推定した利活用度を用いて、前記(a)のステップで推定した変化時点が適切であるかどうかを判定する、ステップと、
を実行することを特徴とする。
以上の特徴により、本発明における判定装置、判定方法、及びコンピュータ読み取り可能な記録媒体によれば、キーワードが示す物・サービス等が有効となった時点又は有効でなくなった時点を適切に判定することができる。
図1は、本発明の実施の形態1における判定装置の構成を示すブロック図である。 図2は、図1に示す文書集合データベースに記憶されている文書集合の一例を示す図である。 図3(a)〜図3(c)は、それぞれ、図1に示した変化表現辞書に登録されている表現の例を示す図である。 図4(a)及び図4(b)は、それぞれ、図1に示した変化時点推定部が出力するデータの一例を示す図である。 図5は、図1に示した利活用度推定部が出力するデータの一例を示す図である。 図6は、図1に示した判定装置の動作を示す流れ図である。 図7は、変化時点候補と利活用度との対応関係を説明する図である。 図8は、図1に示した判定装置の最終的な出力結果の一例を示す図である。 図9は、本発明の実施の形態2における判定装置の構成を示すブロック図である。 図10(a)及び図10(b)は、それぞれ、図9に示した利活用表現辞書に登録されている利活用表現の例を示す図である。 図11は、図9に示した利活用度推定部が出力するデータの一例を示す図である。 図12は、本発明の実施の形態1または2におけるプログラムを実行可能なコンピュータを示すブロック図である。
(実施の形態1)
以下、本発明の実施の形態1における判定装置、判定方法、及びプログラムについて、図1〜図8を参照しながら説明する。最初に、本実施の形態1における判定装置の構成について図1を用いて説明する。図1は、本発明の実施の形態1における判定装置の構成を示すブロック図である。
図1に示す本実施の形態1における判定装置1は、外部から入力されたキーワードが示す判定対象が有効となった時点又は有効でなくなった時点を判定する装置である。図1に示すように、判定装置1は、変化時点推定部2と、利活用度推定部3と、変化時点判定部4とを備えている。
このうち、変化時点推定部2は、時間情報を有する複数の文書の中に含まれる、判定対象の開始に関わる記述(開始記述)、及び判定対象の終了に関わる記述(終了記述)のうち少なくとも一方を特定する。そして、変化時点推定部2は、特定された記述を含む文書から、判定対象の有効性が変化している変化時点を推定する。
また、利活用度推定部3は、複数の文書の中に含まれる、判定対象の利用又は活用に関わる記述(利活用記述)を特定し、特定された記述を含む文書から、利活用度を推定する。「利活用度」は、判定対象が期間毎にどの程度利用又は活用されているのかを示す指標である。変化時点判定部4は、利活用度推定部3が推定した利活用度を用いて、変化時点推定部2が推定した変化時点が適切であるかどうかを判定する。
このように、判定装置1は、キーワードで表現された判定対象物、即ち、物・サービス等の有効性が変化したことを示唆する記述と、物・サービス等が利用又は活用されていることを示唆する記述とを検出する。つまり、判定装置1は、検出した二種類の記述を用いて変化時点を判定している。このため、判定装置1によれば、文書集合中に出現するキーワードの出現頻度のみから判定する場合と異なり、キーワードが示す物・サービス等が有効となった時点又は有効でなくなった時点を適切に判定することができる。
ここで、判定装置1の構成について、図1に加え、図2〜図5を用いて更に具体的に説明する。図1に示すように、本実施の形態1では、変化時点推定部2及び利活用度推定部3によって利用される複数の文書(文書集合)は、文書集合データベース(DB)5によって提供されている。文書集合データベース5は、例えば、図2に示す文書集合を格納している。
図2は、図1に示す文書集合データベースに記憶されている文書集合の一例を示す図である。図2に示す文書の具体例としては、例えば、インターネット上に公開されているブログ、同じくWebページ、及び電子メール等から取得されたテキストデータが挙げられる。また、時間情報としては、ブログ又はWebページに付されている更新日、電子メールの送信及び受信日時が挙げられる。時間情報は、文書が作成された時間を表していても良いし、文書が発信された時間を表していても良い。また、時間情報に含まれる時間の単位は、年、月、日、時、分、秒のどのレベルであっても良い。
また、本実施の形態1では、変化時点推定部2は、変化表現辞書6を用いて、開始記述及び終了記述のうち少なくとも一方を特定する。変化表現辞書6は、開始を意味する表現及び終了を意味する表現のうち少なくともどちらか一種類を登録している。ここで、図3(a)〜図3(c)を用いて変化表現辞書について説明する。
図3(a)〜図3(c)は、それぞれ、図1に示した変化表現辞書に登録されている表現の例を示す図である。図3(a)〜図3(c)に示すように、変化表現辞書には、「始まる」、「開始」、「終る」、「終了」等の有効性の変化を表す表現が登録されている。また、変化表現辞書に登録される変化表現の種類は、図3(a)に示すように、1種類だけであっても良いし、図3(b)に示すように、「開始(+)」と「終了(−)」との2種類に区別されていても良い。
更に、変化表現辞書に登録される変化表現の種類は、図3(c)に示すように、「開始(+)」、「終了(−)」、及び「その他」の3種類に区別されていても良い。この場合、「その他」の区分には、開始及び終了のいずれとも決められないが、物・サービス等の有効性を示している表現が含まれる。例えば、文書に「サービスAが移転する」と書かれていたとする。そして、この記載には、海外から国内にサービスAが移転してくることで新たに利用可能になる意味と、国内から海外にサービスAが移転してその利用が不可能になる意味とが含まれる。このような開始と終了とのどちらの場合もありうる表現は、「その他」と区別される。
また、変化表現辞書に登録される変化表現は、単一の語だけからなる表現であっても、複数の語を組み合わせた複雑な表現であっても良い。例えば「終了した。」というような事実を述べる表現は変化表現として登録し、一方「終了したらいいなあ。」というような願望を述べる表現は変化表現として登録しない、など、複雑な表現を細かく登録することもできる。
本実施の形態1では、変化時点推定部2及び利活用度推定部3へのキーワードの入力は、キーボード等の入力機器によって、又はネットワーク等で接続された外部のコンピュータ等によって行われる。キーワードは、特に限定されるものではなく、例えば、ユーザが現在の有効性を判定したいもの、例えば、以前話題になっていた物、サービス、組織、イベント等が挙げられる。また、入力されるキーワードは、一つであっても良いし、単一の物・サービス等を表すのであれば、複数であっても良い。また、変化時点推定部2及び利活用度推定部3は、複数のキーワードの入力を受け付ける場合は、「and」、「or」のいずれの関係でも受け付けることができる。「or」の関係を持った複数のキーワードの入力の受け付けは、ユーザが有効性を判定したい物・サービス等に別名が存在する場合に有用である。
また、本実施の形態1では、変化時点推定部2は、変化表現辞書6を用いて、複数の文書の中から、外部から入力されたキーワードと変化辞書に登録されている変化表現とを含む記述を特定する。このキーワードと変化表現とを含む記述が、上述した開始記述又は終了記述となる。そして、変化時点推定部2は、特定した記述から変化表現の種類を抽出し、更に特定した記述を含む文書から、判定対象の有効性が変化している変化時点を推定する。この結果を図4(a)に示す。図4(a)は、図1に示した変化時点推定部2によって抽出された変化表現の種類と変化時点との一例を示す図である。
具体的には、変化時点推定部2は、キーワードが入力されると、文書集合データベース5内の時間情報付き文書集合を検索して、入力されたキーワードを含む文書集合を取得し、この取得した文書集合の中から、変化表現辞書6に登録されている変化表現を抽出する。この変化表現が抽出された文書には、上記のキーワードと変化表現とを含む記述が含まれている。
また、本実施の形態1では、変化表現の抽出には、キーワードと変化表現との距離に応じて、制限がかけられているのが好ましい。例えば、キーワードと変化表現とが「同じ文書内」、「同じセンテンス内」、「設定された個数の語(n語)以内」、又は「係り受け関係にある」等の場合にのみ、変化表現が抽出されるのが好ましい。更に、変化表現の抽出には、否定の有無、又は近接する言語表現の種類等によって制限をかけても良い。例えば、「サービスAが終了した。」は変化表現と見なされて抽出されるが、「サービスAが終了したらいいなあ。」は変化表現と見なされないで抽出されないのが好ましい。なお、これらの制限は、上述したように予め変化表現辞書6に登録されていても良い。
更に、変化時点推定部2は、判定対象の有効性が変化している変化時点を推定するが、このとき、文書に付与された時間情報の日付をそのまま変化時点としても良いし、文書中の表現を手がかりにして、判定対象物との関係が深い日付を推定し、推定した日付を変化時点としても良い。例えば、「店A」がキーワードであり、付与されている時間情報の日付が「2008年4月2日」である文書中に、「昨日、店Aが閉店した」と記載されている場合を例に挙げる。この例では、「閉店した」が変化表現であり、この時点から見た昨日、即ち「2008年4月1日」が実際の変化時点である。よって、変化時点推定部2は、この場合は、「2008年4月1日」が変化時点であると推定するのが好ましい。
また、変化時点推定部2は、一つの文書中に、複数の種類の変化表現が出現している場合は、それぞれ別の組として複数の変化点を推定して出力するのが好ましい。例えば、一つの文書中に「サービスAは2008/4/3に開始され、2008/4/10に終了した」と記載されている場合を例に挙げる。この例では、<2008/4/3、開始>と、<2008/4/10、終了>との二組を二つの変化時点として出力する。
更に、変化時点推定部2は、変化時点を、日付ではなく、期間として推定することもできる。例えば、変化時点推定部2は、文書中に「こないだ終った」と記載されている場合は、文書に付与されている時間情報の日付の前のH日間を変化時点として推定することができる。また、変化時点推定部2は、文書中に「そろそろ終る」と記載されている場合は、文書に付与されている時間情報の日付の後のH日間を変化時点として推定することもできる。なお、「H」は任意の自然数である。即ち、本実施の形態1において、推定される「変化時点」には、期間も含まれる。
上述した開始記述、終了記述、又は両方の特定、これらに対応する変化時点の推定が終了すると、変化時点推定部2は、続いて、特定された記述に含まれる表現の種類を、特定された記述に対応する変化時点と合わせて、変化時点判定部4に出力する。
但し、図4(a)に示したように、ほぼ同時期の変化点を表している複数の記述が存在する場合は、同一の変化点に関する記述であると見なして、ひとつの変化点としてまとめることができる。また、この変化点は複数の記述を手がかりに推定した変化点であるとして、変化点に対応する記述の数を元に、推定の確かさを表すスコアを割り振ることができる。
具体的には、本実施の形態1では、変化時点推定部2は、特定した複数個の記述を、各記述を含む文書から推定された変化時点に基づいて、グループ分けし、グループ毎に、各グループに属する記述についての変化時点から、各グループの代表となる時点を算出する。更に、変化時点推定部2は、グループ毎に、当該グループに属する記述の数に基づいてスコアを算出し、図4(b)に示すように、算出したグループ毎の代表となる時点とスコアとを組にして、変化時点判定部に出力する。図4(b)は、図1に示した変化時点推定部2が出力するデータの一例を示す図である。なお、図4(b)の例では、更に、変化表現の種類(記述の種類)もデータの一部として出力されている。
上述のグループ分けは、例えば、記述に含まれる変化表現の種類と記述に対応する変化時点とが同じ場合に、同一グループとなるように行うことができる。また、変化表現の種類が同一の記述のうち、対応する変化時点が近い記述が、同一のクラスタに含まれるように、クラスタリングを行い、これによってグループ分けを行うこともできる。クラスタリング手法としては、既知の任意のクラスタリング手法を用いることができる。
上述の各グループの代表となる時点は、グループに属する各記述に対応する変化時点の平均値等を用いる。また、代表の時点は、一つの日付にまとめられていなくても良く、<2008/4/1−2008/4/3、開始>等のように期間であっても良い。
また、上述のスコアの算出は、多くの文書の文書情報が指し示している日付が、正しい日付である可能性が高いと考えて、グループに属する記述の数、即ち文書の数をそのままスコアとする処理であっても良い。更に、記述の数の対数を求め、これをスコアとすることもできる。
利活用度推定部3は、本実施の形態1では、文書集合データベース5に格納されている文書集合の中でキーワードが出現している記述を、利活用記述として特定することができる。更に、利活用度推定部3は、本実施の形態1では、利活用記述を含む文書の時間情報が示す時点を、判定対象の利用又は活用が生じている時点と見なして、期間毎の利活用度を推定することができる。
また、利活用度推定部3は、判定対象の利活用記述を含む文書の時間情報と、これら記述を含む文書中に記述された、判定対象の利用又は活用が生じている時間とのうち、いずれか一方又は両方を組み合わせて、期間毎の前記利活用度を推定することもできる。
具体的には、本実施の形態1では、利活用度推定部3は、入力されたキーワードについて、文書集合データベース5に格納されている文書集合を検索し、キーワードが出現している文書の時間情報と、この文書でのキーワードの出現数とを取得する。この場合、文書の時間情報が表す期間毎のキーワードの出現数が、「利活用度」に相当する。図5は、図1に示した利活用度推定部が出力するデータの一例を示す図である。
また、長い文章中にたまたま出現するキーワードは、利用又は活用に関しては意味が薄いとも考えられる。このため、例えば、利活用度推定部3は、出現数の代わりに、出現数を出現した文章の長さで除算して得られた値を「利活用度」として用いることもできる。なお、「利活用度」は、上述したように、判定対象が期間毎にどの程度利用又は活用されているのかを示す指標であれば良く、特に限定されるものではない。
変化時点判定部4は、本実施の形態1では、図4に示した変化時点推定部2の出力結果と、図5に示した利活用度推定部3の出力結果とを用いて、変化時点推定部2によって推定された変化時点(変化時点候補)が適切かどうかを判定する。つまり、変化時点判定部4は、変化時点推定部2が出力したM個の変化時点(変化時点候補)の中から、実際の変化時点K個を選択する(M≧K、M及びKは非負の整数)。また、このとき、変化時点判定部4は、変化表現の種類毎に、変化時点推定部2が推定した変化時点が適切であるかどうかを判定することもできる。
また、本実施の形態1では、適切かどうかの判定は、次のように行うことができる。例えば、変化時点判定部4は、変化時点推定部2が推定した変化時点(変化時点候補)を基準とし、この基準よりも過去におけるキーワードの利活用度と、この基準よりも未来におけるキーワードの利活用度とを比較し、比較結果に基づいて、判定することもできる。
具体的には、変化時点判定部4は、各変化時点候補を基準とした過去のJ日間と未来のJ日間とについて、それぞれの利活用度を合計し、両者の比率を求め、求めた過去と未来との比率が一定の閾値を超えているかどうかを判定する。判定の結果、閾値を超えている場合に、変化時点判定部4は、この変化時点候補は適切であると判断することができる。なお、閾値は、予め変化時点が分かっている実験データを用いることによって設定できる。また、Jは任意の自然数である。
また、過去の利活用度と未来の利活用度との間の落差の大きさが、変化時点の判定には重要と考えることもできる。この場合は、変化時点判定部4は、過去と未来とのJ日間の合計を求める代わりに、過去のJ日間と未来のJ日間とにおいて最も高い利活用度と、過去のJ日間と未来のJ日間とにおいて最も低い利活用度との比を求めることができる。なお、この場合も、求めた比が一定の閾値を超えているかどうかによって、適切かどうかが判断される。また、この場合の閾値も上述した手法によって設定できる。
更に、変化時点候補の付近は未だ変化の途中である場合が多く、変化時点の判定において考慮すべきでないと考えることもできる。この場合は、変化時点判定部4は、変化時点候補の前後J日間は計算に加えずに、判定を行うのが好ましい。Jは任意の自然数である。
また、変化時点候補の前後のJ日間を比較する場合において、この期間内に他の変化時点候補による変化が混在した場合では、正確な判定が困難になる可能性がある。よって、このような場合においては、変化時点判定部4は、混在している他の変化時点候補よりも基準に近い日付の利活用度のみを用いて判定を行うのが好ましい。
更に、本実施の形態1では、変化時点推定部2が上述したようにグループ分けを行い、グループ毎にスコアを算出している場合は、変化時点判定部4は、スコアを利用して、グループ毎の代表の時点が適切であるかどうかを判定することができる。この場合、変化時点推定部2は、グループ毎に算出されたスコアを用い、スコアの値が高い程、代表となる時点が適切である可能性が高いと判定する。
また、変化時点候補にスコアが付与されている場合は、スコア毎に、上述した閾値が変更される態様とすることもできる。例えば、スコアが高い場合は、それだけで実際に変化時点である可能性が高いと考えられるので、変化時点判定部4は、利活用度の変化がわずかであっても適切な変化時点であると判定することができる。逆に、スコアが低い場合は、変化時点判定部4は、利活用度の変化が非常に大きくないと適切な変化時点であると判定しない。
具体的には、上述した閾値の基本値が「a」に設定されているとする。このとき、基本値aに、各変化時点候補のスコアsの逆数を乗算し、得られた値(a/s)を上述した判定に用いられる閾値とすれば良い。なお、ここで言う「利活用度の変化」には、上述した過去のJ日間及び未来のJ日間それぞれの利活用度の合計の比率、過去及び未来における最も高い利活用度と最も低い利活用度との比等が含まれる。
また、本実施の形態1では、変化時点判定部4は、上述した変化時点候補の前後の利活用度から求められた比率の代わりに、他の統計的な指標を用いることもできる。他の統計的な指標としては、例えば、カイ2乗検定値が挙げられる。カイ2乗検定値は、例えば、下記の(数1)によって算出することができる。また、この場合、利活用度推定部3は、文書集合データベース5に対して入力キーワードを用いて検索を行い、キーワードが出現している文書の時間情報及び文書の数と、キーワードが出現していない文書の時間情報及び文書の数とを取得し、これらを利活用度として出力する。
また、下記の(数1)において、αは、カイ2乗検定値である。aは、基準となる変化時点候補より過去の時間情報が付与された文書のうちキーワードが出現している文書の数を示している。bは、基準となる変化時点候補より過去の時間情報が付与された文書のうちキーワードが出現していない文書の数を示している。cは、基準となる変化時点候補より未来の時間情報が付与された文書のうちキーワードが出現している文書の数である。dは、基準となる変化時点候補より未来の時間情報が付与された文書のうちキーワードが出現していない文書の数である。
Figure 0005440814
上記の(数1)によって算出されたαの大小により、キーワードの出現が変化時点候補の前後で有意に変化しているかどうかの判定が可能となる。具体的には、この場合も、変化時点判定部4は、αの値が一定の閾値を超えているかどうかを判定する。判定の結果、閾値を超えている場合に、変化時点判定部4は、この変化時点候補は適切であると判断することができる。なお、この場合も、閾値は、予め変化時点が分かっている実験データを用いることによって設定できる。
更に、本実施の形態1では、変化時点判定部4は、変化時点候補の時点での利活用度の時間変化の傾きを求め、求めた傾きが一定の閾値より大きいかどうかを判断することによって、変化時点候補が適切であるかどうかを判定することもできる。また、この場合も、閾値は、予め変化時点が分かっている実験データを用いることによって設定できる。
加えて、本実施の形態1では、変化時点判定部4は、変化時点候補の有する変化表現の種類を、判定に利用することもできる。例えば、変化時点候補の種類が「開始」であるならば、変化時点判定部4は、利活用度が増加する方向に変化している場合にのみ、適切な変化時点である判定することができる。逆に、変化時点候補の種類が「終了」であるならば、変化時点判定部4は、利活用度が減少する方向に変化している場合にのみ、適切な変化時点であると判定することができる。
なお、変化時点推定部2から変化時点候補が出力された段階では、変化時点候補の種類が、「開始」とも「終了」とも未だ決まっていないこともある。つまり、変化表現辞書において、図3(a)に示すように「開始」及び「終了」といった変化表現の種類の区別が登録されていない場合や、図3(c)に示すように変化表現の種類が「その他」である場合等である。このような場合は、変化時点判定部4は、未定の変化時点候補の前後の利活用度の増減を検出し、前後で利活用度が増加していれば「開始」と見なし、前後で利活用度が減少してれば「終了」と見なすことができる。
また、本実施の形態1では、変化時点判定部4は、変化時点推定部2が推定した変化時点候補のうち適切であると判定した変化時点候補に基づいて、判定装置1の動作時点、又は、ユーザによって指定された時点における判定対象の有効性を判定することができる。更に、この場合、変化時点判定部4は、この判定結果を外部に出力することもできる。これにより、ユーザは、入力したキーワードが示す判定対象の有効性を即座に知ることができる。
なお、「判定装置1の動作時点」とは、判定装置が動作を開始してから終了するまでの任意の時点を意味し、例えば、キーワードが入力された時点、動作開始からの設定された時間が経過した時点、等が含まれる。また、特定のキーワードに対して有効性が変化しているかどうか一定期間毎に判定を行い、有効性に変化があった場合にのみ判定結果を外部に出力しても良い。
次に、本発明の実施の形態1における判定装置1の動作について図6を用いて説明する。図6は、図1に示した判定装置の動作を示す流れ図である。なお、本実施の形態1における判定方法は、判定装置1を動作させることによって実施できる。よって、本実施の形態1における判定方法の説明は、以下の判定装置1の動作の説明に代える。また、以下の説明においては、適宜、図1〜図5を参酌する。
図6に示すように、先ず、変化時点推定部2及び利活用度推定部3によってキーワードの入力が受け付けられる(ステップS1)。なお、ステップS1の実行の前に、予め、文書集合データベース5には、大量の文書が格納され、変化表現辞書には、2種類に区別された変化表現が登録されている(図3(b)参照)。
次に、変化時点推定部2により、複数個の変化時点候補が推定され(ステップS2)。推定された変化時点候補は、変化時点判定部4に出力される(図4(a)及び(b)参照)。具体的には、ステップS2では、変化時点推定部2は、変化表現辞書6を用い、文書集合データベース5の中から、キーワードと変化辞書に登録されている変化表現とを含む記述(開始記述又は終了記述)を特定する。更に、変化時点推定部2は、特定した記述に含まれる変化表現の種類と、特定した記述を含む文書の時間情報とを抽出し、これらを用いて、変化時点候補を推定する。
次に、利活用度推定部3により、文書集合データベース5に格納されている文書集合の中から利活用記述が特定され、更にこれらを含む文書から、利活用度が推定される(ステップS3)。推定された利活用度は、変化時点判定部4に出力される(図5参照)。具体的には、ステップS3では、利活用度推定部3は、入力されたキーワードについて、文書集合データベース5に格納されている文書集合を検索し、キーワードが出現している文書の時間情報と、この文書でのキーワードの出現数とを取得している。なお、ステップS3は、ステップS2と同時に実行されても良いし、ステップS2の前に実行されても良い。
その後、変化時点判定部4により、ステップS3で出力された利活用度を用いて、ステップS2で出力された変化時点候補が適切であるかどうかが判定される(ステップS4)。具体的には、ステップS4では、変化時点判定部4は、変化時点候補を基準とし、この基準よりも過去におけるキーワードの利活用度と、この基準よりも未来におけるキーワードの利活用度とを比較し、比較結果に基づいて、適切であるかどうかを判定する。
例えば、図4(b)に示した変化時点候補が推定され、更に、図5に示した利活用度が推定されているとする。両者の結果を重ね合わせると、図7に示す通りとなる。図7は、変化時点候補と利活用度との対応関係を説明する図である。
図4(b)に示された変化時点候補のうち、2008年4月8日を基準とすると、図7に示すように、その前後において利活用度は一定となっている。一方、2008年4月3日と2008年4月11日とのそれぞれにおいては、利活用度は変動している。このため、図8に示すように、図7の例では、変化時点判定部4は、2008年4月3日と2008年4月11日とは適切であるが、2008年4月8日は不適切であると判定している。なお、図8は、図1に示した判定装置の最終的な出力結果の一例を示す図である。
また、本実施の形態1におけるプログラムは、コンピュータに、図6に示すステップS1〜S4を実行させるプログラムであれば良い。このプログラムをコンピュータにインストールし、実行すれば、判定装置1及び判定方法を実現することができる。この場合、コンピュータのCPU(central processing unit)は、変化時点推定部2、利活用度推定部3、及び変化時点判定部4として機能し、処理を行なう。
また、変化表現辞書6及び文書集合データベース5は、コンピュータに備えられたハードディスク等の記憶装置に、これらを構成するデータファイルを格納することによって実現できる。更に、変化表現辞書6及び文書集合データ5を実現する記憶装置は、本実施の形態におけるプログラムを実行するコンピュータとは、別のコンピュータに備えられていても良い。
以上のように、本実施の形態1における判定装置1によれば、上述したように、文書集合中に出現するキーワードの出現頻度のみから判定する場合と異なり、キーワードが示す物・サービス等が有効となった時点又は有効でなくなった時点を適切に判定できる。
(実施の形態2)
次に、本発明の実施の形態2における判定装置、判定方法、及びプログラムについて、図9〜図11を用いて説明する。図9は、本発明の実施の形態2における判定装置の構成を示すブロック図である。
図9に示すように、本実施の形態2における判定装置11では、利活用度推定部13は、実施の形態1において図1に示した利活用度推定部3と異なり、判定対象の利用又は活用を意味する表現が利活用表現として登録されている利活用表現辞書17を利用する。
利活用度推定部13は、利活用表現辞書17を利用して、文書集合データベース15に登録されている文書集合の中から、入力されたキーワードと利活用表現との両方が出現する記述を、利活用記述として特定する。そして、利活用度推定部13は、特定された利活用記述を含む文書から、判定対象が期間毎にどの程度利用又は活用されているのかを示す利活用度を推定する。
更に、本実施の形態2では、利活用度推定部13による利活用表現辞書17の利用により、変化時点判定部14は、実施の形態1において図1に示した変化時点判定部4と異なる動作を行う場合もある。
なお、上述した点以外については、判定装置11は、実施の形態1において図1に示した判定装置1と同様に構成されている。つまり、変化時点推定部12、変化表現辞書16、及び文書集合データベース15は、それぞれ、図1に示した、変化時点推定部2、変化表現辞書6、及び文書集合データベース5と同様に構成されている。また、判定装置11に入力されるキーワードも、実施の形態1と同様である。
以下に、実施の形態1との相違点について図10及び図11を用いて具体的に説明する。図10(a)及び図10(b)は、それぞれ、図9に示した利活用表現辞書に登録されている利活用表現の例を示す図である。図11は、図9に示した利活用度推定部が出力するデータの一例を示す図である。
図10(a)及び(b)に示すように、利活用表現辞書17は、利活用表現として、物・サービス等がある時点で利用又は活用されていることを意味する表現が登録されている。利用又は活用されていることを意味する表現の種類は、図10(a)及び(b)において、(+)と示されている。一方、利用又は活用されていないことを意味する表現の種類は、図10(b)において、(−)と示されている。
利活用表現の例としては、図10(a)及び(b)に示した表現が挙げられる。但し、この例は一例であり、利活用度表現は、動詞だけでも良いし、名詞、助動詞、及びその他の修飾表現で構成されていても良い。また、利活用表現辞書17においては、表現は細かく指定することができる。例えば、「今日〜に行きました。」は利活用表現として登録されるが、「昔〜に行きました」は利活用表現として登録されないようにすることもできる。
そして、利活用度推定部13は、例えば、文書集合データベース15を検索し、種類が(+)となる利活用表現の出現数と、種類が(−)となる利活用表現の出現数とを取得し、これらをそのまま利活用度として推定することができる。この場合、利活用度推定部13は、更に、利活用表現が出現している文書の時間情報も取得し、図11に示すように、時間情報と種類毎の利活用表現の出現数とを組データとして、変化時点判定部14に出力する。このように、利用又は活用されていることを示す情報と、利用又は活用されていないことを示す情報とを出力することにより、変化時点判定部14での判定精度の向上が図られることとなる。
また、本実施の形態2においては、利活用度推定部13は、利活用表現辞書17中の種類が(+)の利活用表現だけを用い、物・サービス等の利用又は活用されていることを示す表現だけを特定することができる。この場合、利活用度推定部13は、種類が(+)となる利活用表現の出現数のみをそのまま利活用度して推定しても良いし、種類が(+)となる利活用表現が出現している文書の数を利活用度として推定しても良い。後者の場合、同じ文書に複数の有効度表現が出現していても、文書の数は1とされる。
単に、文書中に出現したキーワードの出現数のみを利活用度と見なす場合では、「昔、サービスAというサービスをやっていた。」等の、物・サービス等がその時点で利用又は活用されていることを示さない記述までをも、利活用度の計算に入れてしまう可能性がある。しかし、上記したように、物・サービス等が利用又は活用されていることを示す表現だけを特定した場合は、利活用度推定部13は、このような可能性を排除することができる。
なお、本実施の形態2においては、利活用度推定部13は、利活用表現辞書17中の(−)の利活用表現だけを用い、物・サービス等が利用又は活用されていないことを示す表現だけを特定することもできる。
また、利活用度推定部13は、入力されたキーワードと利活用表現との両方が出現する記述を特定するに際して、キーワードと利活用表現との関係に制限を設定することができる。例えば、設定される制限としては、「キーワードと利活用表現とが係り受けの関係になければならない」等が挙げられる。その他、実施の形態1において述べた、キーワードと変化表現との関係に設定された制限と同様の制限も挙げられる。なお、これらの制限は、利活用表現辞書17に予め登録されていても良い。
更に、本実施の形態では、利活用度として、種類が(+)となる利活用表現の出現数と、種類が(−)となる利活用表現の出現数とから算出される値を用いることができる。例えば、この場合の利活用度をβ、種類が(+)となる利活用表現の出現数をx、種類が(−)となる利活用表現の出現数をyとすると、利活用度βは、下記の(数2)によって算出することができる。なお、下記(数2)において、e、fは任意の係数である。また、fは、種類が(−)となる利活用表現の出現数yの係数であることから、負の値に設定される。
(数2)
β=ex+fy
また、利活用度βは、下記の(数3)によっても算出することができる。下記の(数3)において、zは文書毎のキーワードの出現数である。また、gは、e及びfと同様の任意の係数である。
(数3)
β=ex+fy+gz
変化時点判定部14は、利活用度推定部13が、利活用表現として1種類のみを用いて利活用度を推定しているのであれば、実施の形態1において図1に示した変化時点判定部4と同様の処理を実行する。しかしながら、変化時点判定部14は、利活用度推定部13が、利活用表現として2種類(図10(b)参照)を用いて利活用度を推定しているのであれば、変化時点判定部4と異なる処理を実行する。
具体的には、変化時点判定部14は、例えば、図11に示すように、種類が(−)の利活用度が含まれている場合において、基準となる変化時点候補の後J日以内について、(−)の利活用度の合計を算出し、算出された値が閾値を超えているかどうかを判断する。そして、変化時点判定部14は、算出された値が閾値を超えている場合は、基準となった変化時点候補は適切でないと判断することができる。
また、変化時点判定部14は、基準となる変化時点候補の後J日以内について、(−)の利活用度の合計と(+)の利活用度の合計とのそれぞれを算出し、算出された値それぞれについて、対応する閾値を超えているかどうかを判断する。そして、変化時点判定部14は、(−)の利活用度の合計値が閾値を超え、且つ、(+)の利活用度の合計値が閾値を下回っている場合も、基準となった変化時点候補は適切でないと判断することができる。
このように、本実施の形態2によれば、より精度の高い利活用度を利用することができるため、キーワードが示す物・サービス等が有効となった時点又は有効でなくなった時点をより適切に判定できる。なお、本実施の形態2における判定方法は、判定装置11を動作させることによって実行される。また、判定装置11の動作の流れも、実施の形態1において図6に示した流れと同様となる。更に、本実施の形態2におけるプログラムは、コンピュータに判定装置11の動作を実行させるプログラムであれば良い。
ここで、実施の形態1または2におけるプログラムを実行することによって、判定装置を実現するコンピュータについて図12を用いて説明する。図12は、本発明の実施の形態1または2におけるプログラムを実行可能なコンピュータを示すブロック図である。
図12に示すように、コンピュータ110は、CPU111と、メインメモリ112と、記憶装置113と、入力インターフェイス114と、表示コントローラ115と、データリーダ/ライタ116と、通信インターフェイス117とを備える。これらの各部は、バス121を介して、互いにデータ通信可能に接続される。
CPU111は、記憶装置113に格納された、本実施の形態1または2におけるプログラム(コード)をメインメモリ112に展開し、これらを所定順序で実行することにより、各種の演算を実施する。メインメモリ112は、典型的には、DRAM(Dynamic Random Access Memory)等の揮発性の記憶装置である。また、本実施の形態1または2におけるプログラムは、コンピュータ読み取り可能な記録媒体120に格納された状態で提供される。なお、本実施の形態1または2におけるプログラムは、通信インターフェイス117を介して接続されたインターネット上で流通するものであっても良い。
また、記憶装置113の具体例としては、ハードディスクの他、フラッシュメモリ等の半導体記憶装置が挙げられる。入力インターフェイス114は、CPU111と、キーボード及びマウスといった入力機器118との間のデータ伝送を仲介する。表示コントローラ115は、ディスプレイ装置119と接続され、ディスプレイ装置119での表示を制御する。データリーダ/ライタ116は、CPU111と記録媒体120との間のデータ伝送を仲介し、記録媒体120からのプログラムの読み出し、及び処理結果の記録媒体120への書き込みを実行する。通信インターフェイス117は、CPU111と、他のコンピュータとの間のデータ伝送を仲介する。
また、記録媒体120の具体例としては、CF(Compact Flash)及びSD(Secure Digital)等の汎用的な半導体記憶デバイス、フレキシブルディスク(Flexible Disk)等の磁気記憶媒体、又はCD−ROM(Compact Disk
Read Only Memory)等の光学記憶媒体が挙げられる。
以上、実施の形態を参照して本願発明を説明したが、本願発明は上記実施の形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
この出願は、2009年5月7日に出願された日本出願特願2009−112806を基礎とする優先権を主張し、その開示の全てをここに取り込む。
本願発明における、判定装置、判定方法、及びコンピュータ読み取り可能な記録媒体は、以下の特徴を有する。
(1)入力されたキーワードが示す判定対象が有効となった時点又は有効でなくなった時点を判定する判定装置であって、
時間情報を有する複数の文書の中に含まれる、前記判定対象の開始に関わる記述、及び前記判定対象の終了に関わる記述のうち少なくとも一方を特定し、特定された前記記述を含む文書から、前記判定対象の有効性が変化している変化時点を推定する変化時点推定部と、
前記複数の文書の中に含まれる、前記判定対象の利用又は活用に関わる記述を特定し、特定された前記記述を含む文書から、前記判定対象が期間毎にどの程度利用又は活用されているのかを示す利活用度を推定する利活用度推定部と、
前記利活用度推定部が推定した利活用度を用いて、前記変化時点推定部が推定した変化時点が適切であるかどうかを判定する変化時点判定部と、
を備えていることを特徴とする判定装置。
(2)前記変化時点推定部が、開始を意味する表現及び終了を意味する表現のうち少なくともどちらか一種類を登録している変化表現辞書を用いて、前記複数の文書の中から、前記キーワードと前記変化辞書に登録されている前記表現とを含む記述を、前記判定対象の開始に関わる記述、又は前記判定対象の終了に関わる記述として特定する、上記(1)に記載の判定装置。
(3)前記変化時点推定部が、特定された前記記述に含まれる前記表現の種類を、特定された前記記述を含む文書から推定した変化時点と合わせて、前記変化時点判定部に出力し、
前記変化時点判定部が、前記表現の種類毎に、前記変化時点推定部が推定した変化時点が適切であるかどうかを判定する、上記(2)に記載の判定装置。
(4)前記変化時点推定部が、前記複数の文書の中から、前記判定対象の開始に関わる記述、及び前記判定対象の終了に関わる記述のうち少なくとも一方を複数個特定し、
特定した複数個の前記記述を、各記述を含む文書から推定された前記変化時点に基づいて、グループ分けし、そして、
前記グループ毎に、各グループに属する前記記述についての前記変化時点から、各グループの代表となる時点を算出し、更に、前記グループ毎に、当該グループに属する前記記述の数に基づいてスコアを算出し、算出したグループ毎の前記代表となる時点と前記スコアとを組にして、前記変化時点判定部に出力し、
前記変化時点判定部が、前記グループ毎の前記代表となる時点が適切であるかどうかを判定し、その際、前記グループ毎に算出された前記スコアを用い、前記スコアの値が高い程、前記代表となる時点が適切である可能性が高いと判定する、上記(1)に記載の判定装置。
(5)前記変化時点推定部が、前記判定対象の開始に関わる記述又は前記判定対象の終了に関わる記述を含む文書の前記時間情報が示す時点を、前記判定対象の有効性が変化している変化時点と推定する、上記(1)に記載の判定装置。
(6)前記変化時点推定部が、前記判定対象の開始に関わる記述又は前記判定対象の終了に関わる記述を含む文書の前記時間情報と、前記記述を含む文書中に記述された前記判定対象の開始又は終了の時間とのうち、いずれか一方又は両方を組み合わせて、前記判定対象の有効性が変化している変化時点を推定する、上記(1)に記載の判定装置。
(7)前記利活用度推定部が、前記複数の文書の中で前記キーワードが出現している記述を、前記判定対象の利用又は活用に関わる記述として特定する、上記(1)に記載の判定装置。
(8)前記利活用度推定部が、前記判定対象の利用又は活用を意味する表現が利活用表現として登録されている利活用表現辞書を用いて、前記複数の文書の中から、前記キーワードと前記利活用表現との両方が出現する記述を、前記判定対象の利用又は活用に関わる記述として特定する、上記(1)に記載の判定装置。
(9)前記利活用度推定部が、前記判定対象の利用又は活用に関わる記述を含む文書の前記時間情報が示す時点を当該判定対象の利用又は活用が生じている時点と見なして、期間毎の前記利活用度を推定する、上記(1)に記載の判定装置。
(10)前記利活用度推定部が、判定対象の利用又は活用に関わる記述を含む文書の前記時間情報と、前記記述を含む文書中に記述された前記判定対象の利用又は活用が生じている時間とのうち、いずれか一方又は両方を組み合わせて、前記期間毎の前記利活用度を推定する、上記(1)に記載の判定装置。
(11)前記変化時点判定部が、前記変化時点推定部が推定した前記変化時点を基準として、前記基準よりも過去における前記キーワードの利活用度と、前記基準よりも未来における前記キーワードの利活用度とを比較し、比較結果に基づいて、前記変化時点推定部が推定した前記変化時点が適切であるかどうかを判定する、上記(1)に記載の判定装置。
(12)前記変化時点判定部が、前記変化時点推定部が推定した前記変化時点のうち適切であると判定した変化時点に基づいて、当該判定装置の動作時点、又は、指定された時点における前記判定対象の有効性を判定し、判定結果を出力する、上記(1)に記載の判定装置。
(13)入力されたキーワードが示す判定対象が有効となった時点又は有効でなくなった時点を判定するための方法であって、
(a)時間情報を有する複数の文書の中に含まれる、前記判定対象の開始に関わる記述、及び前記判定対象の終了に関わる記述のうち少なくとも一方を特定し、特定された前記記述を含む文書から、前記判定対象の有効性が変化している変化時点を推定する、ステップと、
(b)前記複数の文書の中に含まれる、前記判定対象の利用又は活用に関わる記述を特定し、特定された前記記述を含む文書から、前記判定対象が期間毎にどの程度利用又は活用されているのかを示す利活用度を推定する、ステップと、
(c)前記(b)のステップで推定した利活用度を用いて、前記(a)のステップで推定した変化時点が適切であるかどうかを判定する、ステップと、
を有することを特徴とする判定方法。
(14)前記(a)のステップで、開始を意味する表現及び終了を意味する表現のうち少なくともどちらか一種類を登録している変化表現辞書を用いて、前記複数の文書の中から、前記キーワードと前記変化辞書に登録されている前記表現とを含む記述を、前記判定対象の開始に関わる記述、又は前記判定対象の終了に関わる記述として特定する、上記(13)に記載の判定方法。
(15)前記(a)のステップで、特定された前記記述に含まれる前記表現の種類を、特定された前記記述を含む文書から推定した変化時点と合わせて、出力し、
前記(c)のステップで、前記表現の種類毎に、前記変化時点推定部が推定した変化時点が適切であるかどうかを判定する、上記(14)に記載の判定方法。
(16)前記(a)のステップで、前記複数の文書の中から、前記判定対象の開始に関わる記述、及び前記判定対象の終了に関わる記述のうち少なくとも一方を複数個特定し、
特定した複数個の前記記述を、各記述を含む文書から推定された前記変化時点に基づいて、グループ分けし、そして、
前記グループ毎に、各グループに属する前記記述についての前記変化時点から、各グループの代表となる時点を算出し、更に、前記グループ毎に、当該グループに属する前記記述の数に基づいてスコアを算出し、算出したグループ毎の前記代表となる時点と前記スコアとを組にして出力し、
前記(c)のステップで、前記グループ毎の前記代表となる時点が適切であるかどうかを判定し、その際、前記グループ毎に算出された前記スコアを用い、前記スコアの値が高い程、前記代表となる時点が適切である可能性が高いと判定する、上記(13)に記載の判定方法。
(17)前記(a)のステップで、前記判定対象の開始に関わる記述又は前記判定対象の終了に関わる記述を含む文書の前記時間情報が示す時点を、前記判定対象の有効性が変化している変化時点と推定する、上記(13)に記載の判定方法。
(18)前記(a)のステップで、前記判定対象の開始に関わる記述又は前記判定対象の終了に関わる記述を含む文書の前記時間情報と、前記記述を含む文書中に記述された前記判定対象の開始又は終了の時間とのうち、いずれか一方又は両方を組み合わせて、前記判定対象の有効性が変化している変化時点を推定する、上記(13)に記載の判定方法。
(19)前記(b)のステップで、前記複数の文書の中で前記キーワードが出現している記述を、前記判定対象の利用又は活用に関わる記述として特定する、上記(13)に記載の判定方法。
(20)前記(b)のステップで、前記判定対象の利用又は活用を意味する表現が利活用表現として登録されている利活用表現辞書を用いて、前記複数の文書の中から、前記キーワードと前記利活用表現との両方が出現する記述を、前記判定対象の利用又は活用に関わる記述として特定する、上記(13)に記載の判定方法。
(21)前記(b)のステップで、前記判定対象の利用又は活用に関わる記述を含む文書の前記時間情報が示す時点を当該判定対象の利用又は活用が生じている時点と見なして、期間毎の前記利活用度を推定する、上記(13)に記載の判定方法。
(22)前記(b)のステップで、前記判定対象の利用又は活用に関わる記述を含む文書の前記時間情報と、前記記述を含む文書中に記述された前記判定対象の利用又は活用が生じている時間とのうち、いずれか一方又は両方を組み合わせて、前記期間毎の前記利活用度を推定する、上記(13)に記載の判定方法。
(23)前記(c)のステップで、前記(a)のステップによって推定した前記変化時点を基準として、前記基準よりも過去における前記キーワードの利活用度と、前記基準よりも未来における前記キーワードの利活用度とを比較し、比較結果に基づいて、前記(a)のステップによって推定した前記変化時点が適切であるかどうかを判定する、上記(13)に記載の判定方法。
(24)前記(c)のステップで、前記(a)のステップによって推定した前記変化時点のうち適切であると判定した変化時点に基づいて、当該判定方法を実行する時点、又は、指定された時点における前記判定対象の有効性を判定し、判定結果を出力する、上記(13)に記載の判定方法。
(25)コンピュータによって、入力されたキーワードが示す判定対象が有効となった時点又は有効でなくなった時点を判定するためのプログラムであって、
前記コンピュータによって、
(a)時間情報を有する複数の文書の中に含まれる、前記判定対象の開始に関わる記述、及び前記判定対象の終了に関わる記述のうち少なくとも一方を特定し、特定された前記記述を含む文書から、前記判定対象の有効性が変化している変化時点を推定する、ステップと、
(b)前記複数の文書の中に含まれる、前記判定対象の利用又は活用に関わる記述を特定し、特定された前記記述を含む文書から、前記判定対象が期間毎にどの程度利用又は活用されているのかを示す利活用度を推定する、ステップと、
(c)前記(b)のステップで推定した利活用度を用いて、前記(a)のステップで推定した変化時点が適切であるかどうかを判定する、ステップと、
を実行するプログラム。
(26)前記(a)のステップで、開始を意味する表現及び終了を意味する表現のうち少なくともどちらか一種類を登録している変化表現辞書を用いて、前記複数の文書の中から、前記キーワードと前記変化辞書に登録されている前記表現とを含む記述を、前記判定対象の開始に関わる記述、又は前記判定対象の終了に関わる記述として特定する、上記(25)に記載のプログラム
(27)前記(a)のステップで、特定された前記記述に含まれる前記表現の種類を、特定された前記記述を含む文書から推定した変化時点と合わせて、出力し、
前記(c)のステップで、前記表現の種類毎に、前記変化時点推定部が推定した変化時点が適切であるかどうかを判定する、上記(26)に記載のプログラム
(28)前記(a)のステップで、前記複数の文書の中から、前記判定対象の開始に関わる記述、及び前記判定対象の終了に関わる記述のうち少なくとも一方を複数個特定し、
特定した複数個の前記記述を、各記述を含む文書から推定された前記変化時点に基づいて、グループ分けし、そして、
前記グループ毎に、各グループに属する前記記述についての前記変化時点から、各グループの代表となる時点を算出し、更に、前記グループ毎に、当該グループに属する前記記述の数に基づいてスコアを算出し、算出したグループ毎の前記代表となる時点と前記スコアとを組にして出力し、
前記(c)のステップで、前記グループ毎の前記代表となる時点が適切であるかどうかを判定し、その際、前記グループ毎に算出された前記スコアを用い、前記スコアの値が高い程、前記代表となる時点が適切である可能性が高いと判定する、上記(25)に記載のコンピュータ読み取り可能なプログラム
(29)前記(a)のステップで、前記判定対象の開始に関わる記述又は前記判定対象の終了に関わる記述を含む文書の前記時間情報が示す時点を、前記判定対象の有効性が変化している変化時点と推定する、上記(25)に記載のプログラム
(30)前記(a)のステップで、前記判定対象の開始に関わる記述又は前記判定対象の終了に関わる記述を含む文書の前記時間情報と、前記記述を含む文書中に記述された前記判定対象の開始又は終了の時間とのうち、いずれか一方又は両方を組み合わせて、前記判定対象の有効性が変化している変化時点を推定する、上記(25)に記載のプログラム
(31)前記(b)のステップで、前記複数の文書の中で前記キーワードが出現している記述を、前記判定対象の利用又は活用に関わる記述として特定する、上記(25)に記載のプログラム
(32)前記(b)のステップで、前記判定対象の利用又は活用を意味する表現が利活用表現として登録されている利活用表現辞書を用いて、前記複数の文書の中から、前記キーワードと前記利活用表現との両方が出現する記述を、前記判定対象の利用又は活用に関わる記述として特定する、上記(25)に記載のプログラム
(33)前記(b)のステップで、前記判定対象の利用又は活用に関わる記述を含む文書の前記時間情報が示す時点を当該判定対象の利用又は活用が生じている時点と見なして、期間毎の前記利活用度を推定する、上記(25)に記載のプログラム
(34)前記(b)のステップで、前記判定対象の利用又は活用に関わる記述を含む文書の前記時間情報と、前記記述を含む文書中に記述された前記判定対象の利用又は活用が生じている時間とのうち、いずれか一方又は両方を組み合わせて、前記期間毎の前記利活用度を推定する、上記(25)に記載のプログラム
(35)前記(c)のステップで、前記(a)のステップによって推定した前記変化時点を基準として、前記基準よりも過去における前記キーワードの利活用度と、前記基準よりも未来における前記キーワードの利活用度とを比較し、比較結果に基づいて、前記(a)のステップによって推定した前記変化時点が適切であるかどうかを判定する、上記(25)に記載のプログラム
(36)前記(c)のステップで、前記(a)のステップによって推定した前記変化時点のうち適切であると判定した変化時点に基づいて、当該プログラムを実行する時点、又は、指定された時点における前記判定対象の有効性を判定し、判定結果を出力する、上記(25)に記載のプログラム

以上のように、本発明によれば、物・サービス等が有効となった時点及び有効でなくなった時点を適切に判定できる。本発明は産業上の利用可能性を有している。
1、11 判定装置
2、12 変化時点推定部
3、13 利活用度推定部
4、14 変化時点判定部
5、15 文書集合データベース
6、16 変化表現辞書
17 利活用表現辞書
110 コンピュータ
111 CPU
112 メインメモリ
113 記憶装置
114 入力インターフェイス
115 表示コントローラ
116 データリーダ/ライタ
117 通信インターフェイス
118 入力機器
119 ディスプレイ装置
120 記録媒体
121 バス

Claims (33)

  1. 入力されたキーワードが示す判定対象が有効となった時点又は有効でなくなった時点を判定する判定装置であって、
    時間情報を有する複数の文書の中に含まれる、前記判定対象の開始に関わる記述、及び前記判定対象の終了に関わる記述のうち少なくとも一方を特定し、特定された前記記述を含む文書から、前記判定対象の有効性が変化している変化時点を推定する変化時点推定部と、
    前記複数の文書の中に含まれる、前記判定対象の利用又は活用に関わる記述を特定し、特定された前記記述を含む文書から、前記判定対象が期間毎にどの程度利用又は活用されているのかを示す利活用度を推定する利活用度推定部と、
    前記利活用度推定部が推定した利活用度を用いて、前記変化時点推定部が推定した前記変化時点を基準として、前記基準よりも過去における前記利活用度と、前記基準よりも未来における前記利活用度とを比較し、比較結果に基づいて、前記変化時点推定部が推定した変化時点が適切であるかどうかを判定する変化時点判定部と、
    を備えていることを特徴とする判定装置。
  2. 前記変化時点推定部が、開始を意味する表現及び終了を意味する表現のうち少なくともどちらか一種類を登録している変化表現辞書を用いて、前記複数の文書の中から、前記キーワードと前記変化表現辞書に登録されている前記表現とを含む記述を、前記判定対象の開始に関わる記述、又は前記判定対象の終了に関わる記述として特定する、請求項1に記載の判定装置。
  3. 前記変化時点推定部が、特定された前記記述に含まれる前記表現の種類を、特定された前記記述を含む文書から推定した変化時点と合わせて、前記変化時点判定部に出力し、
    前記変化時点判定部が、前記表現の種類毎に、前記変化時点推定部が推定した変化時点が適切であるかどうかを判定する、請求項2に記載の判定装置。
  4. 前記変化時点推定部が、前記複数の文書の中から、前記判定対象の開始に関わる記述、及び前記判定対象の終了に関わる記述のうち少なくとも一方を複数個特定し、
    特定した複数個の前記記述を、各記述を含む文書から推定された前記変化時点に基づいて、グループ分けし、そして、
    前記グループ毎に、各グループに属する前記記述についての前記変化時点から、各グループの代表となる時点を算出し、更に、前記グループ毎に、当該グループに属する前記記述の数に基づいてスコアを算出し、算出したグループ毎の前記代表となる時点と前記スコアとを組にして、前記変化時点判定部に出力し、
    前記変化時点判定部が、前記グループ毎の前記代表となる時点が適切であるかどうかを判定し、その際、前記グループ毎に算出された前記スコアを用い、前記スコアの値が高い程、前記代表となる時点が適切である可能性が高いと判定する、請求項1〜3のいずれかに記載の判定装置。
  5. 前記変化時点推定部が、前記判定対象の開始に関わる記述又は前記判定対象の終了に関わる記述を含む文書の前記時間情報が示す時点を、前記判定対象の有効性が変化している変化時点と推定する、請求項1〜4のいずれかに記載の判定装置。
  6. 前記変化時点推定部が、前記判定対象の開始に関わる記述又は前記判定対象の終了に関わる記述を含む文書の前記時間情報と、前記記述を含む文書中に記述された前記判定対象の開始又は終了の時間とのうち、いずれか一方又は両方を組み合わせて、前記判定対象の有効性が変化している変化時点を推定する、請求項1〜4のいずれかに記載の判定装置。
  7. 前記利活用度推定部が、前記複数の文書の中で前記キーワードが出現している記述を、前記判定対象の利用又は活用に関わる記述として特定する、請求項1〜6のいずれかに記載の判定装置。
  8. 前記利活用度推定部が、前記判定対象の利用又は活用を意味する表現が利活用表現として登録されている利活用表現辞書を用いて、前記複数の文書の中から、前記キーワードと前記利活用表現との両方が出現する記述を、前記判定対象の利用又は活用に関わる記述として特定する、請求項1〜6のいずれかに記載の判定装置。
  9. 前記利活用度推定部が、前記判定対象の利用又は活用に関わる記述を含む文書の前記時間情報が示す時点を当該判定対象の利用又は活用が生じている時点と見なして、期間毎の前記利活用度を推定する、請求項1〜8のいずれかに記載の判定装置。
  10. 前記利活用度推定部が、判定対象の利用又は活用に関わる記述を含む文書の前記時間情報と、前記記述を含む文書中に記述された前記判定対象の利用又は活用が生じている時間とのうち、いずれか一方又は両方を組み合わせて、前記期間毎の前記利活用度を推定する、請求項1〜8のいずれかに記載の判定装置。
  11. 前記変化時点判定部が、前記変化時点推定部が推定した前記変化時点のうち適切であると判定した変化時点に基づいて、当該判定装置の動作時点、又は、指定された時点における前記判定対象の有効性を判定し、判定結果を出力する、請求項1〜10のいずれかに記載の判定装置。
  12. 入力されたキーワードが示す判定対象が有効となった時点又は有効でなくなった時点を判定するための方法であって、
    (a)時間情報を有する複数の文書の中に含まれる、前記判定対象の開始に関わる記述、及び前記判定対象の終了に関わる記述のうち少なくとも一方を特定し、特定された前記記述を含む文書から、前記判定対象の有効性が変化している変化時点を推定する、ステップと、
    (b)前記複数の文書の中に含まれる、前記判定対象の利用又は活用に関わる記述を特定し、特定された前記記述を含む文書から、前記判定対象が期間毎にどの程度利用又は活用されているのかを示す利活用度を推定する、ステップと、
    (c)前記(b)のステップで推定した利活用度を用いて、前記(a)のステップによって推定した前記変化時点を基準として、前記基準よりも過去における前記利活用度と、前記基準よりも未来における前記利活用度とを比較し、比較結果に基づいて、前記(a)のステップで推定した変化時点が適切であるかどうかを判定する、ステップと、
    を有することを特徴とする判定方法。
  13. 前記(a)のステップで、開始を意味する表現及び終了を意味する表現のうち少なくともどちらか一種類を登録している変化表現辞書を用いて、前記複数の文書の中から、前記キーワードと前記変化表現辞書に登録されている前記表現とを含む記述を、前記判定対象の開始に関わる記述、又は前記判定対象の終了に関わる記述として特定する、請求項12に記載の判定方法。
  14. 前記(a)のステップで、特定された前記記述に含まれる前記表現の種類を、特定された前記記述を含む文書から推定した変化時点と合わせて、出力し、
    前記(c)のステップで、前記表現の種類毎に、前記(a)のステップにおいて推定した変化時点が適切であるかどうかを判定する、請求項13に記載の判定方法。
  15. 前記(a)のステップで、前記複数の文書の中から、前記判定対象の開始に関わる記述、及び前記判定対象の終了に関わる記述のうち少なくとも一方を複数個特定し、
    特定した複数個の前記記述を、各記述を含む文書から推定された前記変化時点に基づいて、グループ分けし、そして、
    前記グループ毎に、各グループに属する前記記述についての前記変化時点から、各グループの代表となる時点を算出し、更に、前記グループ毎に、当該グループに属する前記記述の数に基づいてスコアを算出し、算出したグループ毎の前記代表となる時点と前記スコアとを組にして出力し、
    前記(c)のステップで、前記グループ毎の前記代表となる時点が適切であるかどうかを判定し、その際、前記グループ毎に算出された前記スコアを用い、前記スコアの値が高い程、前記代表となる時点が適切である可能性が高いと判定する、請求項1214のいずれかに記載の判定方法。
  16. 前記(a)のステップで、前記判定対象の開始に関わる記述又は前記判定対象の終了に関わる記述を含む文書の前記時間情報が示す時点を、前記判定対象の有効性が変化している変化時点と推定する、請求項1215のいずれかに記載の判定方法。
  17. 前記(a)のステップで、前記判定対象の開始に関わる記述又は前記判定対象の終了に関わる記述を含む文書の前記時間情報と、前記記述を含む文書中に記述された前記判定対象の開始又は終了の時間とのうち、いずれか一方又は両方を組み合わせて、前記判定対象の有効性が変化している変化時点を推定する、請求項1215のいずれかに記載の判定方法。
  18. 前記(b)のステップで、前記複数の文書の中で前記キーワードが出現している記述を、前記判定対象の利用又は活用に関わる記述として特定する、請求項1217のいずれかに記載の判定方法。
  19. 前記(b)のステップで、前記判定対象の利用又は活用を意味する表現が利活用表現として登録されている利活用表現辞書を用いて、前記複数の文書の中から、前記キーワードと前記利活用表現との両方が出現する記述を、前記判定対象の利用又は活用に関わる記述として特定する、請求項1217のいずれかに記載の判定方法。
  20. 前記(b)のステップで、前記判定対象の利用又は活用に関わる記述を含む文書の前記時間情報が示す時点を当該判定対象の利用又は活用が生じている時点と見なして、期間毎の前記利活用度を推定する、請求項1219のいずれかに記載の判定方法。
  21. 前記(b)のステップで、前記判定対象の利用又は活用に関わる記述を含む文書の前記時間情報と、前記記述を含む文書中に記述された前記判定対象の利用又は活用が生じている時間とのうち、いずれか一方又は両方を組み合わせて、前記期間毎の前記利活用度を推定する、請求項1219のいずれかに記載の判定方法。
  22. 前記(c)のステップで、前記(a)のステップによって推定した前記変化時点のうち適切であると判定した変化時点に基づいて、当該判定方法を実行する時点、又は、指定された時点における前記判定対象の有効性を判定し、判定結果を出力する、請求項1221のいずれかに記載の判定方法。
  23. コンピュータによって、入力されたキーワードが示す判定対象が有効となった時点又は有効でなくなった時点を判定するためのプログラムであって、
    前記コンピュータによって、
    (a)時間情報を有する複数の文書の中に含まれる、前記判定対象の開始に関わる記述、及び前記判定対象の終了に関わる記述のうち少なくとも一方を特定し、特定された前記記述を含む文書から、前記判定対象の有効性が変化している変化時点を推定する、ステップと、
    (b)前記複数の文書の中に含まれる、前記判定対象の利用又は活用に関わる記述を特定し、特定された前記記述を含む文書から、前記判定対象が期間毎にどの程度利用又は活用されているのかを示す利活用度を推定する、ステップと、
    (c)前記(b)のステップで推定した利活用度を用いて、前記(a)のステップによって推定した前記変化時点を基準として、前記基準よりも過去における前記利活用度と、前記基準よりも未来における前記利活用度とを比較し、比較結果に基づいて、前記(a)のステップで推定した変化時点が適切であるかどうかを判定する、ステップと、
    を実行するプログラム。
  24. 前記(a)のステップで、開始を意味する表現及び終了を意味する表現のうち少なくともどちらか一種類を登録している変化表現辞書を用いて、前記複数の文書の中から、前記キーワードと前記変化表現辞書に登録されている前記表現とを含む記述を、前記判定対象の開始に関わる記述、又は前記判定対象の終了に関わる記述として特定する、請求項23に記載のプログラム。
  25. 前記(a)のステップで、特定された前記記述に含まれる前記表現の種類を、特定された前記記述を含む文書から推定した変化時点と合わせて、出力し、
    前記(c)のステップで、前記表現の種類毎に、前記(a)のステップにおいて推定した変化時点が適切であるかどうかを判定する、請求項24に記載のプログラム。
  26. 前記(a)のステップで、前記複数の文書の中から、前記判定対象の開始に関わる記述、及び前記判定対象の終了に関わる記述のうち少なくとも一方を複数個特定し、
    特定した複数個の前記記述を、各記述を含む文書から推定された前記変化時点に基づいて、グループ分けし、そして、
    前記グループ毎に、各グループに属する前記記述についての前記変化時点から、各グループの代表となる時点を算出し、更に、前記グループ毎に、当該グループに属する前記記述の数に基づいてスコアを算出し、算出したグループ毎の前記代表となる時点と前記スコアとを組にして出力し、
    前記(c)のステップで、前記グループ毎の前記代表となる時点が適切であるかどうかを判定し、その際、前記グループ毎に算出された前記スコアを用い、前記スコアの値が高い程、前記代表となる時点が適切である可能性が高いと判定する、請求項2325のいずれかに記載のプログラム。
  27. 前記(a)のステップで、前記判定対象の開始に関わる記述又は前記判定対象の終了に関わる記述を含む文書の前記時間情報が示す時点を、前記判定対象の有効性が変化している変化時点と推定する、請求項2326のいずれかに記載のプログラム。
  28. 前記(a)のステップで、前記判定対象の開始に関わる記述又は前記判定対象の終了に関わる記述を含む文書の前記時間情報と、前記記述を含む文書中に記述された前記判定対象の開始又は終了の時間とのうち、いずれか一方又は両方を組み合わせて、前記判定対象の有効性が変化している変化時点を推定する、請求項2326のいずれかに記載のプログラム。
  29. 前記(b)のステップで、前記複数の文書の中で前記キーワードが出現している記述を、前記判定対象の利用又は活用に関わる記述として特定する、請求項2328のいずれかに記載のプログラム。
  30. 前記(b)のステップで、前記判定対象の利用又は活用を意味する表現が利活用表現として登録されている利活用表現辞書を用いて、前記複数の文書の中から、前記キーワードと前記利活用表現との両方が出現する記述を、前記判定対象の利用又は活用に関わる記述として特定する、請求項2328のいずれかに記載のプログラム。
  31. 前記(b)のステップで、前記判定対象の利用又は活用に関わる記述を含む文書の前記時間情報が示す時点を当該判定対象の利用又は活用が生じている時点と見なして、期間毎の前記利活用度を推定する、請求項2330のいずれかに記載のプログラム。
  32. 前記(b)のステップで、前記判定対象の利用又は活用に関わる記述を含む文書の前記時間情報と、前記記述を含む文書中に記述された前記判定対象の利用又は活用が生じている時間とのうち、いずれか一方又は両方を組み合わせて、前記期間毎の前記利活用度を推定する、請求項2330のいずれかに記載のプログラム。
  33. 前記(c)のステップで、前記(a)のステップによって推定した前記変化時点のうち適切であると判定した変化時点に基づいて、当該プログラムを実行する時点、又は、指定された時点における前記判定対象の有効性を判定し、判定結果を出力する、請求項2332のいずれかに記載のプログラム。
JP2011512300A 2009-05-07 2010-04-06 判定装置、判定方法、及びプログラム Active JP5440814B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011512300A JP5440814B2 (ja) 2009-05-07 2010-04-06 判定装置、判定方法、及びプログラム

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2009112806 2009-05-07
JP2009112806 2009-05-07
JP2011512300A JP5440814B2 (ja) 2009-05-07 2010-04-06 判定装置、判定方法、及びプログラム
PCT/JP2010/002512 WO2010128574A1 (ja) 2009-05-07 2010-04-06 判定装置、判定方法、及びコンピュータ読み取り可能な記録媒体

Publications (2)

Publication Number Publication Date
JPWO2010128574A1 JPWO2010128574A1 (ja) 2012-11-01
JP5440814B2 true JP5440814B2 (ja) 2014-03-12

Family

ID=43050085

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011512300A Active JP5440814B2 (ja) 2009-05-07 2010-04-06 判定装置、判定方法、及びプログラム

Country Status (2)

Country Link
JP (1) JP5440814B2 (ja)
WO (1) WO2010128574A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5996993B2 (ja) * 2012-10-01 2016-09-21 株式会社ナビタイムジャパン 情報処理システム、情報処理装置、情報処理サーバ、情報処理方法、および情報処理プログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0877178A (ja) * 1994-09-01 1996-03-22 Ibm Japan Ltd 情報検索システム及び方法
JPH10340275A (ja) * 1997-06-09 1998-12-22 Fuji Xerox Co Ltd 情報抽出装置
JP2001216311A (ja) * 2000-02-01 2001-08-10 Just Syst Corp イベント分析装置、及びイベント分析プログラムが格納されたプログラム装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0877178A (ja) * 1994-09-01 1996-03-22 Ibm Japan Ltd 情報検索システム及び方法
JPH10340275A (ja) * 1997-06-09 1998-12-22 Fuji Xerox Co Ltd 情報抽出装置
JP2001216311A (ja) * 2000-02-01 2001-08-10 Just Syst Corp イベント分析装置、及びイベント分析プログラムが格納されたプログラム装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
CSNG200900092022; 中澤聡、外4名: '時系列分析によるWeb文書の情報信頼性判断支援:全体概要' 言語処理学会第15回年次大会発表論文集 , 20090302, p.100-103, 言語処理学会 *
CSNG200900092023; 大西貴士、外4名: '時系列分析によるWeb文書の情報信頼性判断支援:時系列変化からの重要トピックの抽出' 言語処理学会第15回年次大会発表論文集 , 20090302, p.101-107, 言語処理学会 *
JPN6010025319; 中澤聡、外4名: '時系列分析によるWeb文書の情報信頼性判断支援:全体概要' 言語処理学会第15回年次大会発表論文集 , 20090302, p.100-103, 言語処理学会 *
JPN6010025320; 大西貴士、外4名: '時系列分析によるWeb文書の情報信頼性判断支援:時系列変化からの重要トピックの抽出' 言語処理学会第15回年次大会発表論文集 , 20090302, p.101-107, 言語処理学会 *

Also Published As

Publication number Publication date
WO2010128574A1 (ja) 2010-11-11
JPWO2010128574A1 (ja) 2012-11-01

Similar Documents

Publication Publication Date Title
JP4980148B2 (ja) 文書検索方法
JP4974470B2 (ja) Arpa標準フォーマットによる、削除補間nグラム言語モデルの表現
US20150081431A1 (en) Posterior probability calculating apparatus, posterior probability calculating method, and non-transitory computer-readable recording medium
US20100254613A1 (en) System and method for duplicate text recognition
CN109815343B (zh) 获得知识图谱中的数据模型的方法、装置、设备和介质
US10248626B1 (en) Method and system for document similarity analysis based on common denominator similarity
KR20190128246A (ko) 검색 방법 및 장치 및 비-일시적 컴퓨터-판독가능 저장 매체
JP5367632B2 (ja) 知識量推定装置及びプログラム
US8862586B2 (en) Document analysis system
US10719663B2 (en) Assisted free form decision definition using rules vocabulary
CN106874332B (zh) 数据库访问方法和装置
JPWO2010024184A1 (ja) 風評情報検出システム、風評情報検出方法及びプログラム
CN109740156B (zh) 反馈信息处理方法、装置、电子设备及存储介质
JP2009271659A (ja) 情報処理装置、情報処理方法、情報処理プログラム及び記録媒体
JP5406313B2 (ja) 寄与スコアに基づいた文書順位決定システムおよび方法
JP5440814B2 (ja) 判定装置、判定方法、及びプログラム
JP5117744B2 (ja) 単語意味タグ付与装置および方法、プログラム並びに記録媒体
US20070208731A1 (en) Document information processing apparatus, method of document information processing, computer readable medium and computer data signal
CN111191049B (zh) 信息推送方法、装置、计算机设备和存储介质
JP6680472B2 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
WO2017028728A1 (zh) 点击到达率ctr的确定方法及装置
JP5832869B2 (ja) カテゴリーマッチングを用いたキーワード抽出システムおよびキーワード抽出方法
KR101399272B1 (ko) 문서의 유사도 추론방법
JP2016099750A (ja) 行動ネットワーク情報抽出装置、行動ネットワーク情報抽出方法及び行動ネットワーク情報抽出プログラム
JP2005025465A (ja) 文書検索方法及び文書検索装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130814

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131010

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131120

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131203

R150 Certificate of patent or registration of utility model

Ref document number: 5440814

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150