JP5982174B2 - 類似度算出装置、類似番組検索装置、およびそのプログラム - Google Patents
類似度算出装置、類似番組検索装置、およびそのプログラム Download PDFInfo
- Publication number
- JP5982174B2 JP5982174B2 JP2012113602A JP2012113602A JP5982174B2 JP 5982174 B2 JP5982174 B2 JP 5982174B2 JP 2012113602 A JP2012113602 A JP 2012113602A JP 2012113602 A JP2012113602 A JP 2012113602A JP 5982174 B2 JP5982174 B2 JP 5982174B2
- Authority
- JP
- Japan
- Prior art keywords
- expression
- similarity
- text data
- program
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004364 calculation method Methods 0.000 title claims description 73
- 230000014509 gene expression Effects 0.000 claims description 231
- 238000000605 extraction Methods 0.000 claims description 56
- 238000001914 filtration Methods 0.000 claims description 41
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 39
- 230000003321 amplification Effects 0.000 claims description 22
- 230000007704 transition Effects 0.000 claims description 21
- 238000009826 distribution Methods 0.000 claims description 8
- 238000000034 method Methods 0.000 description 70
- 239000000284 extract Substances 0.000 description 21
- 230000008569 process Effects 0.000 description 21
- 239000011159 matrix material Substances 0.000 description 15
- 239000013598 vector Substances 0.000 description 15
- 238000012545 processing Methods 0.000 description 14
- 238000010276 construction Methods 0.000 description 13
- 238000012986 modification Methods 0.000 description 13
- 230000004048 modification Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 230000001364 causal effect Effects 0.000 description 6
- 241000251468 Actinopterygii Species 0.000 description 4
- 206010020772 Hypertension Diseases 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 230000000877 morphologic effect Effects 0.000 description 4
- 239000002344 surface layer Substances 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 201000010099 disease Diseases 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 238000005295 random walk Methods 0.000 description 3
- 150000003839 salts Chemical class 0.000 description 3
- 244000269722 Thea sinensis Species 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000007717 exclusion Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- QWOJMRHUQHTCJG-UHFFFAOYSA-N CC([CH2-])=O Chemical compound CC([CH2-])=O QWOJMRHUQHTCJG-UHFFFAOYSA-N 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 244000061176 Nicotiana tabacum Species 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- 240000001949 Taraxacum officinale Species 0.000 description 1
- 235000005187 Taraxacum officinale ssp. officinale Nutrition 0.000 description 1
- 210000003484 anatomy Anatomy 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 230000003796 beauty Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004040 coloring Methods 0.000 description 1
- 235000009508 confectionery Nutrition 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013498 data listing Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- IXSZQYVWNJNRAL-UHFFFAOYSA-N etoxazole Chemical compound CCOC1=CC(C(C)(C)C)=CC=C1C1N=C(C=2C(=CC=CC=2F)F)OC1 IXSZQYVWNJNRAL-UHFFFAOYSA-N 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 230000000474 nursing effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000035807 sensation Effects 0.000 description 1
- 235000019615 sensations Nutrition 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
また、表現傾向情報とは、あるテキストデータ内でいかなる表現が出現する傾向があるかを表わすデータである。例えば、あるテキストデータ内に出現する表現をすべて列挙したデータは表現傾向情報である。また例えば、あるテキストデータ内に出現する表現ごとの出現頻度(回数)を表わすデータは表現傾向情報である。具体例としては、あるテキストデータ内に出現する単語をすべて抽出してコンマ「,」等で区切って列挙したデータは表現傾向情報である。
また、表現傾向情報を増幅するということは、次のようなデータの操作である。即ち、表現が出現する傾向を表わす情報の空間内で、元の表現傾向を維持したまま、あるいは元の表現傾向情報からのブレを所定範囲内に留めたまま、表現傾向情報に含まれる表現の種類を増やしたり表現の出現頻度の値を全体的に上げたりすることである。
上記の構成によれば、類似性算出部は、第1および第2の増幅後表現傾向情報の間の関係に基づく、前記第1のテキストデータと前記第2のテキストデータとの間の類似度を算出する。つまり、類似性算出部が算出する類似度として、元のテキストデータの短さや、表層に出現する表記の揺れの影響を排除した値を得ることができる。
また、第1のテキストデータに対応するノードから、第2のテキストデータに対応するノードまでのパス上に含まれる全てのノードまでの、それぞれの関連度スコアの総和を、両テキストデータ間の類似度として算出することにより、良好な結果が得られる。
本発明の一実施形態について、以下で、図面を参照しながら説明する。
図1は、本実施形態による類似番組検索装置の機能構成を示すブロック図である。図示するように、類似番組検索装置2は、類似度算出装置1と、番組情報記憶部11と、ランキング部17と、検索結果出力部18とを含んで構成される。また、類似度算出装置1は、文書読込部12と、単語抽出部13(表現抽出部)と、関連単語抽出部14(関連表現抽出部)と、関連単語フィルタリング部15(関連表現フィルタリング部)と、類似性算出部16とを含んで構成される。なお、関連単語抽出部14と、関連単語フィルタリング部15とを合わせたものが、表現増幅部25である。
番組情報記憶部11は、放送等の番組に関する情報を記憶する。番組情報記憶部11は、番組のコンテンツそのもののデータ(映像、音声等)と、その番組を説明した番組概要文のテキストデータとを記憶する。なお、番組情報記憶部11やその他の情報記憶手段としては、磁気ディスク装置や半導体メモリなどを用いる。
文書読込部12は、番組情報記憶部11に記憶されている番組概要文のテキストを順次読み込む。
図3は、類似番組検索装置2の処理の手順を示したフローチャートである。以下、このフローチャートに沿って、説明する。
次にステップS22において、関連単語フィルタリング部15は、ステップS21において選択した関連単語を、暫定的に、除外対象として設定する。
次にステップS23において、関連単語フィルタリング部15は、番組概要文内の単語のうち未処理のものを一つ選択する。但し、このとき、ステップS21において直近で選択した関連単語に直接関連している番組概要文内の単語を除外する。言い換えれば、関連単語フィルタリング部15は、単語抽出部13が当該番組概要文から抽出した単語リストから、ステップS21において直近で選択した関連単語に直接関連している単語を除外し、残りの単語の中の一つを選択する。
参考文献:風間淳一,Stijn De Saeger,鳥澤健太郎,村田真樹,“係り受けの確率的クラスタリングを用いた大規模類似語リストの作成”,言語処理学会第15回年次大会,pp. 84-87,2009年
次にステップS26において、関連単語フィルタリング部15は、番組概要文内の全単語について、ステップS23からS25までの処理を終えたかどうかを判定する。番組概要文内の全単語の処理を終えた場合(ステップS26:YES)には、次のステップS27に進む。番組概要文内の全単語の処理をまだ終えていない場合(ステップS26:NO)には、次の単語を処理するためにステップS23に戻る。
次に、第2の実施形態について説明する。なお、前述した実施形態と共通する機能については、図面において同一の符号を付与する。また、前述した実施形態と共通する事項については説明を省略し、本実施形態に特有の事項を中心に説明する。
図5は、同実施形態による類似番組検索装置の構成を示すブロック図である。図示するように、類似番組検索装置102は、類似度算出装置101を含んで構成される。類似度算出装置101は、文書読込部12と、単語抽出部13と、関連単語抽出部114と、関連グラフ構築部119と、類似性算出部116とを含んで構成される。
第1の実施形態における関連単語抽出部14は、単語抽出部13によって抽出された単語に直接関連する関連単語のみを抽出していた。これに対して、本実施形態の関連単語抽出部114は、単語抽出部13によって抽出された単語に直接関連する関連単語を抽出するだけではなく、それらの関連単語に関連する関連単語をも、関連単語として抽出する。つまり、関連単語抽出部114は、元の文書に含まれていた単語に対して複数の段階の関連を持つ関連単語をも抽出する。
また、本実施形態における関連グラフ構築部119は、単語抽出部13によって抽出される単語と、関連単語抽出部114によって抽出される関連単語の、関連を表わすグラフ(関連性データ)を構築する。このグラフにおいて、ノードは抽出される個々の単語であり、エッジは単語間の関連(関係)である。このグラフの詳細については後述する。
また、第1の実施形態における類似性算出部16は、表現増幅部25によって出力された増幅後表現傾向情報(関連単語を含んだ単語のリスト)同士から、類似性を算出した。これに対して、本実施形態の類似性算出部116は、関連グラフ構築部119が構築したグラフに基づき、2つの文書間の類似性を算出する。この類似性の算出方法については後述する。
また、表現増幅部125は、第1のテキストデータ(d0に相当)を元に増幅した第1の増幅後表現傾向情報に含まれる表現と、第2のテキストデータ(dmに相当)を元に増幅した第2の増幅後表現傾向情報に含まれる表現とに対応するノードと、さらに第1のテキストデータに対応するノードと、第2のテキストデータに対応するノードとに関して、ノード間の関連の有無を表わすグラフデータ(関連性データ)を生成するものである。
つまり、第1の実施形態における表現増幅部25が一段階のみの関連性に基づいて表現傾向情報を増幅したのに対して、本実施形態の表現増幅部125は複数段階(段階数に特に上限を設けないこととしても良い)の関連性に基づいて表現傾向情報を増幅している。
この手法では、グラフにおけるノードd0,dmに関して、式(2)を直接用いることにより、2つの文書d0,dmの類似度Sdirect(d0,dm)を算出する。つまり、類似性算出部116は、下の式(3)により文書d0とdmの間の類似度(つまり、文書のノードd0とdmの間の類似度)を算出する。
この手法では、グラフにおけるノードd0からdmへのパス上にある全ノードに与えられた関連度スコアの値の合計を利用して、2つの文書d0,dmの類似度Srelated(d0,dm)を算出する。つまり、類似性算出部116は、下の式(6)により文書d0とdmの間の類似度を算出する。
図8は、図6に示したグラフにおいて、手法2を用いてノードd0とdmとの間の類似度を算出する際に用いる関連度スコアの範囲を示す概略図である。図中の太線枠が、その範囲を示す。つまり、手法2では、類似性算出部116は、ノードd0から、太線枠に含まれる全てのノードへの関連度スコアを用いて、ノードd0とdmとの間の類似度を算出する。
なお、類似度を算出する際に、手法1を用いるか、手法2を用いるかは、任意であり、適宜決めれば良い。
以上、実施形態を説明したが、本発明はさらに次のような変形例でも実施することが可能である。なお、可能な組合せにおいて、下に列挙する複数の変形例を組み合わせて実施しても良い。
ランキング1位。類似度は、0.321。番組タイトルは「新日曜美術館 彫刻家・舟越桂」。この番組の概要文は、「現代に生きる人々の姿を彫り続けている彫刻家・舟越桂。従来の人物彫刻にはない独特の存在感を放つ舟越の彫刻は、見る人に、今にも語りかけてきそうな印象を与えます。誰もが胸の内に抱える喜びや悲しみ、そして不安。一人の人間として感じることを、舟越は彫刻に彫り込みます。舟越本人の登場を通して、彫刻家・舟越桂の世界をたどります。」である。
ランキング2位。類似度は、0.141。番組タイトルは「世界ふれあい街歩き ラグーサ」。この番組の概要文は「ラグーサは新市街と旧市街が、谷を挟んで2つの山に広がっています。新市街の碁盤の目のように整った道沿いには、飾り窓や彫刻が美しい後期バロック様式の建物が並びます。旧市街イブラは、迷宮のように入り組んだ街です。人の顔の彫刻が支える不思議なベランダを眺めたり、バロック建築のサン・ジョルジョ大聖堂の鐘の音を聞いたりします。まるで中世にタイムスリップしたかような不思議な感覚を味わう街歩きです。」である。
ランキング4位。類似度は、0.037。番組タイトルは「直伝 和の極意 第7回 茶の湯 裏千家」。この番組の概要文は「一服のお茶を仲立ちとして、亭主と客が心を通わせる「茶の湯」。400年以上にわたる伝統を誇る“和”の趣味の代表選手のひとつだ。千利休の伝統を受け継ぐ三千家(表千家、裏千家、武者小路千家)のなかから、裏千家の“茶の湯の極意”に迫る9回シリーズ。第7回は、家庭で簡単に和菓子を作る方法について、伝える。」である。
ランキング5位の第2番目。類似度は、0.001。番組タイトルは「アジアンスマイル 四つ子ナースの物語 韓国」。この番組の概要文は「21年前、韓国インチョンの病院で誕生した四つ子の姉妹が、2010年の看護師国家試験にそろって合格。全員が生まれた病院で働き始めた。当時の韓国で、四つ子はきわめて例が少ないなかでの出産だった。4人の中でも小さく生まれたため、ただ1人集中治療室に入れられた三女ソル。新米ナースとして、新生児集中治療室で赤ちゃんの看護を担当することになった。生まれたばかりの小さな命を守ろうと奮闘する、ソルの日々に密着。」である。
ランキング5位の第4番目。類似度は、0.001。番組タイトルは「ニューヨークウエーブ 砂漠に出現!巨大なアートの祭典」。この番組の概要文は「毎年夏、アメリカのネバダ州の砂漠に巨大なアート作品が出現する。野外で開かれる世界最大のアートの祭典「バーニングマン」だ。地上6メートルのタンポポなど、巨大なアート作品が200点あまり。ダンスや音楽のパフォーマンスが、夜通し開かれる。5万人を超える参加者がテントで共同生活をしながら、最新のアートを楽しむ1週間。そんな不思議な世界に、番組リポーターのはなが潜入。砂漠で繰り広げられる、真夏の夢を追う。」である。
制約1:番組タイトルが同じ番組は取り出さない(例えば、「NHKスペシャル」は1番組のみサンプル)。
制約2:関連番組を2番組以上持つ。
第1の実施形態による手法: 単語間関係を用いて文書に出現する単語を拡張(単語集合を増幅)し、増幅後の単語を要素とするベクトルで文書を表現する。2つの文書間の類似性を、これら2つの文書に対応するベクトル間のコサイン類似度により評価する。
第2の実施形態による「手法1」:図7に示した範囲のノードへの関連性スコアを用いて、文書間の類似性を評価する。
第2の実施形態による「手法2」:図8に示した範囲の全てのノードへの関連性スコアの総和を用いて、文書間の類似性を評価する。
2,102 類似番組検索装置
11 番組情報記憶部
12 文書読込部
13 単語抽出部(表現抽出部)
14,114 関連単語抽出部(関連表現抽出部)
15 関連単語フィルタリング部(関連表現フィルタリング部)
16,116 類似性算出部
17 ランキング部
18 検索結果出力部
25,125 表現増幅部
119 関連グラフ構築部
Claims (7)
- テキストデータから表現を抽出することによって前記表現の種類の出現傾向を表わす表現傾向情報を求める表現抽出部と、
表現と前記表現に関連する関連表現との関係を用いて、前記表現抽出部によって抽出された表現に関連する前記関連表現を抽出することによって前記表現抽出部によって抽出された前記表現傾向情報を増幅し、増幅後表現傾向情報を出力する表現増幅部と、
前記表現抽出部に入力される第1のテキストデータを元に前記表現増幅部から出力される第1の増幅後表現傾向情報と、前記表現抽出部に入力される第2のテキストデータを元に前記表現増幅部から出力される第2の増幅後表現傾向情報との間の関係に基づく、前記第1のテキストデータと前記第2のテキストデータとの間の類似度を算出する類似性算出部と、
を具備する類似度算出装置であって、
前記表現増幅部は、抽出された前記関連表現に関連する関連表現を抽出することによって前記表現傾向情報を増幅するとともに、
前記表現増幅部は、前記第1のテキストデータを元に増幅した前記第1の増幅後表現傾向情報に含まれる表現と、前記第2のテキストデータを元に増幅した前記第2の増幅後表現傾向情報に含まれる表現とに対応するノードと、さらに前記第1のテキストデータに対応するノードと、前記第2のテキストデータに対応するノードとに関して、ノード間の関連の有無を表わす関連性データを生成し、
前記類似性算出部は、前記関連性データに基づいて算出される前記第1のテキストデータと前記第2のテキストデータとの間の関連性の強さを、前記類似度として算出する、
ことを特徴とする類似度算出装置。 - 前記類似性算出部は、前記関連性データに基づく、ノードからノードへの遷移のし易さを表わすデータを当該ノード間の関連度スコアとするとともに、前記第1のテキストデータに対応するノードから、前記第2のテキストデータに対応するノードまでのパス上に含まれる全てのノードまでの、前記関連度スコアの総和を、前記類似度として算出する、
ことを特徴とする請求項1に記載の類似度算出装置。 - 前記類似性算出部は、前記関連性データに基づく、ノードからノードへの遷移のし易さを表わすデータを当該ノード間の関連度スコアとするとともに、前記第1のテキストデータに対応するノードから前記第2のテキストデータに対応するノードまでの前記関連度スコアを、前記類似度として算出する、
ことを特徴とする請求項1に記載の類似度算出装置。 - 前記類似性算出部は、前記表現抽出部に入力される第1のテキストデータを元に前記表現増幅部から出力される第1の増幅後表現傾向情報と、前記表現抽出部に入力される第2のテキストデータを元に前記表現増幅部から出力される第2の増幅後表現傾向情報との間の類似度を算出するものであり、
前記第1の増幅後表現傾向情報は、前記第1のテキストデータに含まれる表現と、前記第1のテキストデータに含まれる表現に直接関連する関連表現との分布を表わす情報であり、
前記第2の増幅後表現傾向情報は、前記第2のテキストデータに含まれる表現と、前記第2のテキストデータに含まれる表現に直接関連する関連表現との分布を表わす情報である、
ことを特徴とする請求項1に記載の類似度算出装置。 - 前記表現増幅部は、抽出された前記関連表現のうち、前記テキストデータとの間の類似性が所定の閾値未満である前記関連表現を除外する関連表現フィルタリング部をさらに備える
ことを特徴とする請求項4に記載の類似度算出装置。 - 請求項1から5までのいずれか一項に記載の類似度算出装置を備え、
指定された番組に関する番組概要文テキストデータを前記第1のテキストデータとして前記類似度算出装置に入力するとともに、他の番組に関する番組概要文テキストデータを前記第2のテキストデータとして前記類似度算出装置に入力し、前記類似度算出装置によって算出された、前記指定された番組と前記他の番組との間の類似度を取得し、複数の前記他の番組に関して算出される前記指定された番組との間の類似度に基づいて、複数の前記他の番組の中から前記指定された番組に類似する前記他の番組を検索する、
ことを特徴とする類似番組検索装置。 - コンピューターを、請求項1から5までのいずれか一項に記載の類似度算出装置として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012113602A JP5982174B2 (ja) | 2012-05-17 | 2012-05-17 | 類似度算出装置、類似番組検索装置、およびそのプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012113602A JP5982174B2 (ja) | 2012-05-17 | 2012-05-17 | 類似度算出装置、類似番組検索装置、およびそのプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013239132A JP2013239132A (ja) | 2013-11-28 |
JP5982174B2 true JP5982174B2 (ja) | 2016-08-31 |
Family
ID=49764087
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012113602A Active JP5982174B2 (ja) | 2012-05-17 | 2012-05-17 | 類似度算出装置、類似番組検索装置、およびそのプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5982174B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112000788B (zh) * | 2020-08-19 | 2024-02-09 | 腾讯云计算(长沙)有限责任公司 | 一种数据处理方法、装置以及计算机可读存储介质 |
JP7536558B2 (ja) * | 2020-09-03 | 2024-08-20 | 株式会社日立製作所 | 文書情報抽出装置及び文書情報抽出方法 |
CN117275655A (zh) * | 2023-11-15 | 2023-12-22 | 中国人民解放军总医院第六医学中心 | 一种基于人工智能的病案统计整理方法及系统 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003108579A (ja) * | 2001-09-28 | 2003-04-11 | Toshiba Corp | 文書検索装置及び文書検索方法 |
JP2010287020A (ja) * | 2009-06-11 | 2010-12-24 | Hitachi Ltd | 同義語展開システム及び同義語展開方法 |
JP5478146B2 (ja) * | 2009-08-19 | 2014-04-23 | 日本放送協会 | 番組検索装置および番組検索プログラム |
-
2012
- 2012-05-17 JP JP2012113602A patent/JP5982174B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2013239132A (ja) | 2013-11-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Parikh et al. | ToTTo: A controlled table-to-text generation dataset | |
JP6813591B2 (ja) | モデル作成装置、テキスト検索装置、モデル作成方法、テキスト検索方法、及びプログラム | |
EP2511869A2 (en) | Method and system for providing user-customized content | |
WO2015175931A1 (en) | Language modeling for conversational understanding domains using semantic web resources | |
CN105975558A (zh) | 建立语句编辑模型的方法、语句自动编辑方法及对应装置 | |
JP2018032213A (ja) | 情報処理装置、情報処理システム、情報処理方法及びプログラム | |
CN109271518A (zh) | 用于对微博信息进行分类显示的方法和设备 | |
JP2006293767A (ja) | 文章分類装置、文章分類方法および分類辞書作成装置 | |
JP6165068B2 (ja) | ストーリーを持つ文章間の類似度を導出する類似検索プログラム、装置及び方法 | |
JP2009217802A (ja) | 文書処理装置、文書処理プログラムおよび記録媒体 | |
CN108780439A (zh) | 用于内容丰富且用于教导阅读并实现理解的系统和方法 | |
CN104408115A (zh) | 一种电视平台上基于语义链接的异构资源推荐方法和装置 | |
CN115470344A (zh) | 一种基于文本聚类的视频弹幕与评论主题融合的方法 | |
JP5982174B2 (ja) | 類似度算出装置、類似番組検索装置、およびそのプログラム | |
Sağlam et al. | Developing Turkish sentiment lexicon for sentiment analysis using online news media | |
JP6773585B2 (ja) | 文書処理装置、文書処理方法及びプログラム | |
JP2006106970A (ja) | 情報検索装置、情報検索方法およびコンピュータプログラム | |
KR102335408B1 (ko) | 영화 속성 언어 관리 방법 및 장치 | |
Karsdorp et al. | The love equation: Computational modeling of romantic relationships in french classical drama | |
JP2004157649A (ja) | 階層化されたユーザプロファイル作成方法およびシステム並びに階層化されたユーザプロファイル作成プログラムおよびそれを記録した記録媒体 | |
Nio et al. | Improving the robustness of example-based dialog retrieval using recursive neural network paraphrase identification | |
CN109284364B (zh) | 一种用于语音连麦互动的互动词汇更新方法及装置 | |
JP6694217B2 (ja) | シナリオプロット生成装置及びシナリオプロット生成方法 | |
KR102279125B1 (ko) | 취향필터에 기반한 추천 정보 제공 단말 및 장치 | |
JP5977199B2 (ja) | 地域連想語抽出装置、地域連想語抽出方法及び地域連想語抽出プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150401 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160311 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160426 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160616 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160705 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160801 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5982174 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |