JP3978221B2 - 辞書作成装置および辞書作成方法 - Google Patents
辞書作成装置および辞書作成方法 Download PDFInfo
- Publication number
- JP3978221B2 JP3978221B2 JP2005516811A JP2005516811A JP3978221B2 JP 3978221 B2 JP3978221 B2 JP 3978221B2 JP 2005516811 A JP2005516811 A JP 2005516811A JP 2005516811 A JP2005516811 A JP 2005516811A JP 3978221 B2 JP3978221 B2 JP 3978221B2
- Authority
- JP
- Japan
- Prior art keywords
- keyword
- dictionary
- text information
- evaluation value
- classification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 37
- 238000011156 evaluation Methods 0.000 claims description 231
- 230000008859 change Effects 0.000 claims description 57
- 238000000605 extraction Methods 0.000 claims description 54
- 238000012217 deletion Methods 0.000 claims description 42
- 230000037430 deletion Effects 0.000 claims description 42
- 238000001914 filtration Methods 0.000 claims description 11
- 239000000284 extract Substances 0.000 claims description 10
- 238000010586 diagram Methods 0.000 description 26
- 230000008569 process Effects 0.000 description 21
- 238000012545 processing Methods 0.000 description 14
- 230000004927 fusion Effects 0.000 description 11
- 230000007423 decrease Effects 0.000 description 9
- 230000014509 gene expression Effects 0.000 description 6
- 230000004044 response Effects 0.000 description 4
- 230000002123 temporal effect Effects 0.000 description 3
- 230000000699 topical effect Effects 0.000 description 3
- 208000031968 Cadaver Diseases 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000007717 exclusion Effects 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008521 reorganization Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/482—End-user interface for program selection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
図1は、本発明の実施の形態1に係る辞書作成装置の構成を示すブロック図である。
図7は、本発明の実施の形態2に係る辞書作成装置の構成を示すブロック図である。なお、実施の形態1と同様の部分については同じ符号を付し、詳細な説明を省略する。
ところで、取り扱うテキスト情報には、内容に応じたカテゴリ分類が与えられている(例えば、個別のテキスト情報に対してジャンル名が付与されている)場合があり、例えばEPGデータであれば、番組の内容に応じて、「ドラマ」、「映画」、「スポーツ」などジャンル名が付与されている。
図12は、本発明の実施の形態4に係る辞書作成装置の構成を示すブロック図である。なお、実施の形態1と同様の部分については同じ符号を付し、詳細な説明を省略する。
ところで、EPG番組検索システム等において番組情報を分類するために用いる分類辞書には、例えば図17に示すように「映画」の分類であれば、「映画」、「洋画」、「邦画」等というように、各分類(カテゴリ)とその分類に含まれる特徴的なキーワードが記載されている。従来、このようにあらかじめ設定された分類辞書の分類情報を利用して番組表の表示形式を変更したり、番組表の内容を分類したりしている。
ところで、インターネット上のディレクトリサービスや電子新聞の分類等、電子的なテキスト情報を分類したものが、ユーザに多く利用されている。ユーザは、自らの気に入った分類パターンを利用して、配信されてくる情報や自らが管理しなければならない情報を分類していることがある。
情報の分類に関しては、専門的な分類を用いているサイトや一般的な分類を用いているサイト等があり、各サイトによってそれぞれの特色で分類を構築している場合が多い。ユーザは、その中から、自らの用途に応じて、適当な分類を参照し、管理すべき情報を分類していることがある。
上記でも述べたように、分類に関する情報は時々刻々と変化している。例えば、話題になっている映画の情報は、年代や月によって異なるため、「映画」に関する情報を抽出するためには、その時代ごとに分類に利用されている特徴キーワードを保持しておく必要がある。また、プロ野球等の情報であれば、「星野監督」という特徴キーワードは、2000年以降であれば、「阪神」に関する情報であるのに対して、1990年代であれば、「中日」に関する情報となるなど、時代に応じて特徴キーワードが異なるものがある。
2、22 キーワード統計部
3、12 キーワード評価値算出部
4、13 判定部
5 辞書登録削除部
11 キーワードデータベース
21 第2キーワード抽出部
100、200 400 辞書作成装置
101、201 401 辞書更新部
102 辞書データベース
103 EPG受信部
104 EPG記憶部
105 EPG選択部
106 文書ベクトル作成部
107 検索条件取得部
108 文書評定値算出部
109 検索結果出力部
110 CDDB受信部
1100、1200、1300、1400 EPG番組検索システム
1101 分類情報取得部
1102 分類キーワード抽出部
1103 分類辞書更新部
1104 利用頻度集計部
1105 判定部
1106、1402 分類辞書データベース
1107、1208 EPG受信部
1108、1209 分類部
1109、1210 番組選択部
1201 第1の情報源の分類情報取得部
1202 第2の情報源の分類情報取得部
1203 分類キーワード抽出部
1204、1401 分類辞書更新部
1205 第1の情報源の分類辞書データベース
1206 第2の情報源の分類辞書データベース
1207 分類辞書選択部
1301 第3の情報源の分類情報取得部
1302 第3の情報源の分類辞書データベース
1303 分類辞書融合編集部
1304 融合分類辞書データベース
1403 EPG蓄積部
Claims (28)
- テキストで記述された情報を検索、分類、またはフィルタリングするために用いられる辞書を作成する辞書作成装置であって、
1つ以上のテキスト情報から構成されるテキスト情報群からキーワードを抽出するキーワード抽出手段と、
前記テキスト情報群における前記キーワードの出現に関する統計量として、前記キーワード抽出手段によって抽出されたキーワードを含む前記テキスト情報の数を求めるキーワード統計手段と、
前記統計量に基づく前記キーワードの評価値として、前記テキスト情報群を構成する全てのテキスト情報の数と前記キーワード統計手段によって求められた前記テキスト情報の数との比を用いて、前記キーワードを含むテキスト情報の前記テキスト情報群における出現頻度を算出するキーワード評価値算出手段と、
前記キーワードおよび当該キーワードの前記評価値を組にして記憶するキーワード記憶手段と、
前記キーワード評価値算出手段により新たに算出された前記キーワードの評価値と前記キーワード記憶手段に記憶されている当該キーワードの評価値との変化量に基づいて、前記キーワードを前記辞書に登録するか否か、または前記辞書から削除するか否かを判定する判定手段と、
前記判定の結果によって前記キーワードを前記辞書に登録または削除する辞書登録削除手段と
を備えることを特徴とする辞書作成装置。 - テキストで記述された情報を検索、分類、またはフィルタリングするために用いられる辞書を作成する辞書作成装置であって、
1つ以上のテキスト情報から構成されるテキスト情報群からキーワードを抽出するキーワード抽出手段と、
前記テキスト情報群における前記キーワードの出現に関する統計量として、前記キーワード抽出手段によって抽出されたキーワードを含む前記テキスト情報の数を求めるキーワード統計手段と、
前記統計量に基づく前記キーワードの評価値として、前記テキスト情報群を構成する全てのテキスト情報の数と前記キーワード統計手段によって求められた前記テキスト情報の数との比を用いて、前記キーワードを含むテキスト情報の前記テキスト情報群における出現頻度を算出するキーワード評価値算出手段と、
前記キーワードおよび当該キーワードの前記評価値を組にして記憶するキーワード記憶手段と、
前記キーワード評価値算出手段により新たに算出された前記キーワードの評価値、および、前記キーワード評価値算出手段により新たに算出された前記キーワードの評価値と前記キーワード記憶手段に記憶されている当該キーワードの評価値との変化量に基づいて、前記キーワードを前記辞書に登録するか否か、または前記辞書から削除するか否かを判定する判定手段と、
前記判定の結果によって前記キーワードを前記辞書に登録または削除する辞書登録削除手段と
を備えることを特徴とする辞書作成装置。 - 前記キーワード評価値算出手段で算出される評価値は、前記テキスト情報群におけるテキスト情報の総数および前記キーワードを含むテキスト情報の数に基づくキーワードのidf(inverse document frequency)値であり、
前記判定手段は、前記キーワードが前記辞書に登録されていなく、かつ前記idf値または前記idf値の変化量がそれぞれの所定の閾値以上である場合に、前記キーワードを前記辞書に登録すると判定する
ことを特徴とする請求項2記載の辞書作成装置。 - 前記判定手段は、前記キーワードが前記辞書に登録されており、かつ前記idf値または前記idf値の変化量がそれぞれの所定の閾値未満である場合に、前記キーワードを前記辞書から削除すると判定する
ことを特徴とする請求項3記載の辞書作成装置。 - 前記キーワード評価値算出手段で算出される評価値は、前記テキスト情報群におけるテキスト情報の総数および前記キーワードを含むテキスト情報の数に基づくキーワードのidf(inverse document frequency)値であり、
前記辞書は、不要語辞書であり、
前記判定手段は、前記キーワードが前記不要語辞書に登録されていなく、かつ前記idf値または前記idf値の変化量がそれぞれの所定の閾値未満である場合に、前記キーワードを前記不要語辞書に登録すると判定する
ことを特徴とする請求項2記載の辞書作成装置。 - 前記判定手段は、前記キーワードが前記不要語辞書に登録されており、かつ前記idf値または前記idf値の変化量がそれぞれの所定の閾値以上である場合に、前記キーワードを前記不要語辞書から削除すると判定する
ことを特徴とする請求項5記載の辞書作成装置。 - 前記判定手段は、前記キーワードが前記辞書に登録されていなく、かつ前記出現頻度または前記出現頻度の変化量がそれぞれの所定の閾値未満である場合に、前記キーワードを前記辞書に登録すると判定する
ことを特徴とする請求項2記載の辞書作成装置。 - 前記判定手段は、前記キーワードが前記辞書に登録されており、かつ前記出現頻度または前記出現頻度の変化量がそれぞれの所定の閾値以上である場合に、前記キーワードを前記辞書から削除すると判定する
ことを特徴とする請求項7記載の辞書作成装置。 - 前記辞書は、不要語辞書であり、
前記判定手段は、前記キーワードが前記不要語辞書に登録されていなく、かつ前記出現
頻度または前記出現頻度の変化量がそれぞれの所定の閾値以上である場合に、前記キーワードを前記不要語辞書に登録すると判定する
ことを特徴とする請求項2記載の辞書作成装置。 - 前記判定手段は、前記キーワードが前記不要語辞書に登録されており、かつ前記出現頻度または前記出現頻度の変化量がそれぞれの所定の閾値未満である場合に、前記キーワードを前記不要語辞書から削除すると判定する
ことを特徴とする請求項9記載の辞書作成装置。 - 前記辞書作成装置は、さらに、
1つ以上のテキスト情報から構成される第2のテキスト情報群からキーワードを抽出する第2のキーワード抽出手段を備え、
前記キーワード統計手段は、さらに、前記第2のテキスト情報群における前記抽出されたキーワードの出現に関する統計量を求め、
前記キーワード評価値算出手段は、前記キーワード抽出手段および前記第2のキーワード抽出手段により抽出されたキーワードの評価値を、前記それぞれの統計量に基づいて算出する
ことを特徴とする請求項1または請求項2記載の辞書作成装置。 - 前記キーワード評価値算出手段で算出される評価値は、前記テキスト情報群におけるテキスト情報の総数および前記キーワードを含むテキスト情報の数に基づくキーワードのidf(inverse document frequency)値であり、
前記判定手段は、前記キーワードが前記辞書に登録されていなく、かつ前記idf値の変化量が所定の閾値以上である場合に、前記キーワードを前記辞書に登録すると判定する
ことを特徴とする請求項1記載の辞書作成装置。 - 前記判定手段は、前記キーワードが前記辞書に登録されており、かつ前記idf値の変化量が所定の閾値未満である場合に、前記キーワードを前記辞書から削除すると判定する
ことを特徴とする請求項12記載の辞書作成装置。 - 前記キーワード評価値算出手段で算出される評価値は、前記テキスト情報群におけるテキスト情報の総数および前記キーワードを含むテキスト情報の数に基づくキーワードのidf(inverse document frequency)値であり、
前記辞書は、不要語辞書であり、
前記判定手段は、前記キーワードが前記不要語辞書に登録されていなく、かつ前記idf値の変化量が所定の閾値未満である場合に、前記キーワードを前記不要語辞書に登録すると判定する
ことを特徴とする請求項1記載の辞書作成装置。 - 前記判定手段は、前記キーワードが前記不要語辞書に登録されており、かつ前記idf値の変化量が所定の閾値以上である場合に、前記キーワードを前記不要語辞書から削除すると判定する
ことを特徴とする請求項14記載の辞書作成装置。 - 前記判定手段は、前記キーワードが前記辞書に登録されていなく、かつ前記出現頻度の変化量が所定の閾値未満である場合に、前記キーワードを前記辞書に登録すると判定する
ことを特徴とする請求項1記載の辞書作成装置。 - 前記判定手段は、前記キーワードが前記辞書に登録されており、かつ前記出現頻度の変化量が所定の閾値以上である場合に、前記キーワードを前記辞書から削除すると判定する
ことを特徴とする請求項16記載の辞書作成装置。 - 前記辞書は、不要語辞書であり、
前記判定手段は、前記キーワードが前記不要語辞書に登録されていなく、かつ前記出現頻度の変化量が所定の閾値以上である場合に、前記キーワードを前記不要語辞書に登録すると判定する
ことを特徴とする請求項1記載の辞書作成装置。 - 前記判定手段は、前記キーワードが前記不要語辞書に登録されており、かつ前記出現頻度の変化量が所定の閾値未満である場合に、前記キーワードを前記不要語辞書から削除すると判定する
ことを特徴とする請求項18記載の辞書作成装置。 - 前記テキスト情報群は、あらかじめ所属するカテゴリの情報が付与された1つ以上のテキスト情報から構成され、
前記キーワード統計手段は、前記テキスト情報群における前記カテゴリに関する統計量を求め、
前記キーワード評価値算出手段は、前記抽出されたキーワードについて前記キーワードの出現に関する統計量および前記カテゴリに関する統計量に基づいて前記評価値を算出する
ことを特徴とする請求項1または請求項2記載の辞書作成装置。 - 前記キーワード評価値算出手段は、前記テキスト情報群におけるテキスト情報の総数、前記テキスト情報群における前記キーワードを含むテキスト情報の数、前記テキスト情報群における前記カテゴリに含まれるテキスト情報の数、および前記カテゴリにおける前記キーワードを含むテキスト情報の数に基づいて、前記評価値を算出し、
前記判定手段は、前記キーワードが前記辞書に登録されていなく、かつ前記評価値が所定の閾値以上である場合に、前記キーワードを前記辞書に登録すると判定する
ことを特徴とする請求項20記載の辞書作成装置。 - 前記判定手段は、前記キーワードが前記辞書に登録されており、かつ前記評価値が所定の閾値未満である場合に、前記キーワードを前記辞書から削除すると判定する
ことを特徴とする請求項21記載の辞書作成装置。 - 前記テキスト情報は、EPG(Electric Program Guide)データであり、
前記辞書は放送波の種類ごとにそれぞれ作成され、
前記キーワード抽出手段は、前記放送波の種類ごとの前記テキスト情報群からキーワードを抽出し、
前記辞書登録削除手段は、前記放送波の種類ごとに前記キーワードをそれぞれの前記辞書に登録または削除する
ことを特徴とする請求項1または請求項2記載の辞書作成装置。 - 前記テキスト情報は、EPG(Electric Program Guide)データであり、
前記辞書は放送の時間帯ごとにそれぞれ作成され、
前記キーワード抽出手段は、前記放送の時間帯ごとの前記テキスト情報群からキーワードを抽出し、
前記辞書登録削除手段は、前記放送の時間帯ごとに前記キーワードをそれぞれの前記辞書に登録または削除する
ことを特徴とする請求項1または請求項2記載の辞書作成装置。 - テキストで記述された情報を検索、分類、またはフィルタリングするために用いられる辞書を作成する辞書作成方法であって、
コンピュータが、1つ以上のテキスト情報から構成されるテキスト情報群からキーワードを抽出するキーワード抽出ステップと、
コンピュータが、前記テキスト情報群における前記キーワードの出現に関する統計量として、前記キーワード抽出手段によって抽出されたキーワードを含む前記テキスト情報の数を求めるキーワード統計ステップと、
コンピュータが、前記統計量に基づく前記キーワードの評価値として、前記テキスト情報群を構成する全てのテキスト情報の数と前記キーワード統計手段によって求められた前記テキスト情報の数との比を用いて、前記キーワードを含むテキスト情報の前記テキスト情報群における出現頻度を算出するキーワード評価値算出ステップと、
コンピュータが、前記キーワードおよび当該キーワードの前記評価値を組にしてキーワード記憶手段へ記憶するキーワード記憶ステップと、
コンピュータが、前記キーワード評価値算出ステップにおいて新たに算出された前記キーワードの評価値と前記キーワード記憶手段に記憶されている当該キーワードの評価値との変化量に基づいて、前記キーワードを前記辞書に登録するか否か、または前記辞書から削除するか否かを判定する判定ステップと、
コンピュータが、前記判定の結果によって前記キーワードを前記辞書に登録または削除する辞書登録削除ステップと
を含むことを特徴とする辞書作成方法。 - テキストで記述された情報を検索、分類、またはフィルタリングするために用いられる辞書を作成する辞書作成方法であって、
コンピュータが、1つ以上のテキスト情報から構成されるテキスト情報群からキーワードを抽出するキーワード抽出ステップと、
コンピュータが、前記テキスト情報群における前記キーワードの出現に関する統計量として、前記キーワード抽出手段によって抽出されたキーワードを含む前記テキスト情報の数を求めるキーワード統計ステップと、
コンピュータが、前記統計量に基づく前記キーワードの評価値として、前記テキスト情報群を構成する全てのテキスト情報の数と前記キーワード統計手段によって求められた前記テキスト情報の数との比を用いて、前記キーワードを含むテキスト情報の前記テキスト情報群における出現頻度を算出するキーワード評価値算出ステップと、
コンピュータが、前記キーワードおよび当該キーワードの前記評価値を組にしてキーワード記憶手段へ記憶するキーワード記憶ステップと、
コンピュータが、前記キーワード評価値算出ステップにおいて新たに算出された前記キーワードの評価値、および、前記キーワード評価値算出ステップにおいて新たに算出された前記キーワードの評価値と前記キーワード記憶手段に記憶されている当該キーワードの評価値との変化量に基づいて、前記キーワードを前記辞書に登録するか否か、または前記辞書から削除するか否かを判定する判定ステップと、
コンピュータが、前記判定の結果によって前記キーワードを前記辞書に登録または削除する辞書登録削除ステップと
を含むことを特徴とする辞書作成方法。 - テキストで記述された情報を検索、分類、またはフィルタリングするために用いられる辞書を作成するためのプログラムであって、
1つ以上のテキスト情報から構成されるテキスト情報群からキーワードを抽出するキーワード抽出ステップと、
前記テキスト情報群における前記キーワードの出現に関する統計量として、前記キーワード抽出手段によって抽出されたキーワードを含む前記テキスト情報の数を求めるキーワード統計ステップと、
前記統計量に基づく前記キーワードの評価値として、前記テキスト情報群を構成する全てのテキスト情報の数と前記キーワード統計手段によって求められた前記テキスト情報の数との比を用いて、前記キーワードを含むテキスト情報の前記テキスト情報群における出現頻度を算出するキーワード評価値算出ステップと、
前記キーワードおよび当該キーワードの前記評価値を組にしてキーワード記憶手段へ記憶するキーワード記憶ステップと、
前記キーワード評価値算出ステップにおいて新たに算出された前記キーワードの評価値と前記キーワード記憶手段に記憶されている当該キーワードの評価値との変化量に基づいて、前記キーワードを前記辞書に登録するか否か、または前記辞書から削除するか否かを判定する判定ステップと、
前記判定の結果によって前記キーワードを前記辞書に登録または削除する辞書登録削除ステップと
をコンピュータに実行させることを特徴とするプログラム。 - テキストで記述された情報を検索、分類、またはフィルタリングするために用いられる辞書を作成するためのプログラムであって、
1つ以上のテキスト情報から構成されるテキスト情報群からキーワードを抽出するキーワード抽出ステップと、
前記テキスト情報群における前記キーワードの出現に関する統計量として、前記キーワード抽出手段によって抽出されたキーワードを含む前記テキスト情報の数を求めるキーワード統計ステップと、
前記統計量に基づく前記キーワードの評価値として、前記テキスト情報群を構成する全てのテキスト情報の数と前記キーワード統計手段によって求められた前記テキスト情報の数との比を用いて、前記キーワードを含むテキスト情報の前記テキスト情報群における出現頻度を算出するキーワード評価値算出ステップと、
前記キーワードおよび当該キーワードの前記評価値を組にしてキーワード記憶手段へ記憶するキーワード記憶ステップと、
前記キーワード評価値算出ステップにおいて新たに算出された前記キーワードの評価値、および、前記キーワード評価値算出ステップにおいて新たに算出された前記キーワードの評価値と前記キーワード記憶手段に記憶されている当該キーワードの評価値との変化量に基づいて、前記キーワードを前記辞書に登録するか否か、または前記辞書から削除するか否かを判定する判定ステップと、
前記判定の結果によって前記キーワードを前記辞書に登録または削除する辞書登録削除ステップと
をコンピュータに実行させることを特徴とするプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003433872 | 2003-12-26 | ||
JP2003433872 | 2003-12-26 | ||
PCT/JP2004/017578 WO2005066837A1 (ja) | 2003-12-26 | 2004-11-26 | 辞書作成装置および辞書作成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP3978221B2 true JP3978221B2 (ja) | 2007-09-19 |
JPWO2005066837A1 JPWO2005066837A1 (ja) | 2007-12-20 |
Family
ID=34746880
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005516811A Expired - Fee Related JP3978221B2 (ja) | 2003-12-26 | 2004-11-26 | 辞書作成装置および辞書作成方法 |
Country Status (4)
Country | Link |
---|---|
US (2) | US7840565B2 (ja) |
JP (1) | JP3978221B2 (ja) |
CN (1) | CN1922605A (ja) |
WO (1) | WO2005066837A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013525868A (ja) * | 2009-12-24 | 2013-06-20 | ズオン−バン ミン | 文書中に表現されているセンチメントを求めるためのシステム及び方法 |
Families Citing this family (49)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060136824A1 (en) * | 2004-11-12 | 2006-06-22 | Bo-In Lin | Process official and business documents in several languages for different national institutions |
US20060242188A1 (en) * | 2005-04-22 | 2006-10-26 | Igor Tsyganskiy | Methods of exposing a missing collection of application elements as deprecated |
JP2008059099A (ja) * | 2006-08-29 | 2008-03-13 | Access Co Ltd | 情報表示装置、情報表示プログラム、および情報表示システム |
US8918318B2 (en) * | 2007-01-16 | 2014-12-23 | Nec Corporation | Extended recognition dictionary learning device and speech recognition system |
TW200836564A (en) * | 2007-02-16 | 2008-09-01 | Mstar Semiconductor Inc | Control circuit of a display with program searching function, and method for controlling the display to receive program information and select program |
US20080215577A1 (en) * | 2007-03-01 | 2008-09-04 | Sony Corporation | Information processing apparatus and method, program, and storage medium |
JP2008234078A (ja) * | 2007-03-16 | 2008-10-02 | Ricoh Co Ltd | 情報処理装置、情報処理方法、情報処理プログラム、及び情報処理プログラムを記録した記録媒体 |
JP2008242836A (ja) * | 2007-03-27 | 2008-10-09 | Toshiba Corp | 辞書更新装置およびプログラム |
CN101286150B (zh) * | 2007-04-10 | 2010-09-15 | 阿里巴巴集团控股有限公司 | 生成更新参数的方法和装置、展示相关关键词的方法和装置 |
US8635251B1 (en) * | 2007-06-29 | 2014-01-21 | Paul Sui-Yuen Chan | Search and computing engine |
JP2009026233A (ja) * | 2007-07-23 | 2009-02-05 | Design Exchange Co Ltd | 検索用キーワード自動生成システム、検索用キーワード自動生成方法、及び検索用キーワード自動生成プログラム |
JP2009043156A (ja) * | 2007-08-10 | 2009-02-26 | Toshiba Corp | 番組検索装置および番組検索方法 |
KR101392273B1 (ko) * | 2008-01-07 | 2014-05-08 | 삼성전자주식회사 | 키워드 제공 방법 및 이를 적용한 영상기기 |
JP2009187376A (ja) * | 2008-02-07 | 2009-08-20 | Canon Inc | ファイル管理装置、ファイル管理方法、及びプログラム |
JP4388137B2 (ja) * | 2008-03-10 | 2009-12-24 | パナソニック株式会社 | コンテンツ検索装置及びコンテンツ検索方法 |
US8214346B2 (en) * | 2008-06-27 | 2012-07-03 | Cbs Interactive Inc. | Personalization engine for classifying unstructured documents |
JP4640554B2 (ja) | 2008-08-26 | 2011-03-02 | Necビッグローブ株式会社 | サーバ装置、情報処理方法およびプログラム |
JP4587236B2 (ja) * | 2008-08-26 | 2010-11-24 | Necビッグローブ株式会社 | 情報検索装置、情報検索方法、およびプログラム |
US8250072B2 (en) * | 2009-03-06 | 2012-08-21 | Dmitri Asonov | Detecting real word typos |
US8271499B2 (en) | 2009-06-10 | 2012-09-18 | At&T Intellectual Property I, L.P. | Incremental maintenance of inverted indexes for approximate string matching |
US20100318542A1 (en) * | 2009-06-15 | 2010-12-16 | Motorola, Inc. | Method and apparatus for classifying content |
TW201109948A (en) * | 2009-09-01 | 2011-03-16 | Inventec Corp | Word interpretation displaying system for integrating different dictionary databases and method thereof |
JP2011095905A (ja) * | 2009-10-28 | 2011-05-12 | Sony Corp | 情報処理装置および方法、並びにプログラム |
KR101302563B1 (ko) * | 2009-12-15 | 2013-09-02 | 한국전자통신연구원 | 개체명 사전 구축 시스템 및 구축 방법 |
US9087038B1 (en) * | 2010-07-21 | 2015-07-21 | Sprint Communications Company L.P. | Messaging with shortcut character strings |
CN101916268B (zh) * | 2010-08-04 | 2012-07-25 | 哈尔滨工业大学深圳研究生院 | 汉语词组库的建立及更新方法 |
JP5483442B2 (ja) * | 2010-10-07 | 2014-05-07 | Necビッグローブ株式会社 | 情報処理装置、辞書更新方法およびプログラム |
CN102541901A (zh) * | 2010-12-26 | 2012-07-04 | 上海量明科技发展有限公司 | 一种文档阅读时的信息识别输出方法及系统 |
JP2012212191A (ja) * | 2011-02-28 | 2012-11-01 | Toshiba Corp | 情報処理装置及び情報処理方法 |
JP5044707B1 (ja) * | 2011-03-31 | 2012-10-10 | 株式会社東芝 | 情報処理システム、情報処理装置およびプログラム |
JPWO2013014824A1 (ja) * | 2011-07-22 | 2015-02-23 | パナソニック株式会社 | メッセージ出力装置およびメッセージ出力方法 |
US10176188B2 (en) * | 2012-01-31 | 2019-01-08 | Tata Consultancy Services Limited | Automated dictionary creation for scientific terms |
US9218333B2 (en) * | 2012-08-31 | 2015-12-22 | Microsoft Technology Licensing, Llc | Context sensitive auto-correction |
WO2014050981A1 (ja) * | 2012-09-27 | 2014-04-03 | 日本電気株式会社 | テキスト情報監視用辞書作成装置、テキスト情報監視用辞書作成方法、及び、テキスト情報監視用辞書作成プログラム |
US20150088493A1 (en) * | 2013-09-20 | 2015-03-26 | Amazon Technologies, Inc. | Providing descriptive information associated with objects |
CN104899201B (zh) * | 2014-03-04 | 2019-05-14 | 腾讯科技(北京)有限公司 | 文本提取方法、敏感词判定方法、装置和服务器 |
US20150319509A1 (en) * | 2014-05-02 | 2015-11-05 | Verizon Patent And Licensing Inc. | Modified search and advertisements for second screen devices |
JP6277921B2 (ja) * | 2014-09-25 | 2018-02-14 | 京セラドキュメントソリューションズ株式会社 | 用語集管理装置および用語集管理プログラム |
JP6382139B2 (ja) * | 2015-03-20 | 2018-08-29 | ヤフー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
US20170116180A1 (en) * | 2015-10-23 | 2017-04-27 | J. Edward Varallo | Document analysis system |
US10062222B2 (en) * | 2015-11-23 | 2018-08-28 | GM Global Technology Operations LLC | Analyzing multilingual diagnostic records |
US20170235720A1 (en) * | 2016-02-11 | 2017-08-17 | GM Global Technology Operations LLC | Multilingual term extraction from diagnostic text |
JP2018013893A (ja) * | 2016-07-19 | 2018-01-25 | Necパーソナルコンピュータ株式会社 | 情報処理装置、情報処理方法、およびプログラム |
EP3324319A1 (en) * | 2016-11-22 | 2018-05-23 | Siemens Healthcare GmbH | Method of mapping a medical imaging acquisition protocol to a lexicon |
CN108334533B (zh) * | 2017-10-20 | 2021-12-24 | 腾讯科技(深圳)有限公司 | 关键词提取方法和装置、存储介质及电子装置 |
US10572586B2 (en) * | 2018-02-27 | 2020-02-25 | International Business Machines Corporation | Technique for automatically splitting words |
US11036936B2 (en) * | 2019-03-21 | 2021-06-15 | International Business Machines Corporation | Cognitive analysis and content filtering |
US11074407B2 (en) * | 2019-03-21 | 2021-07-27 | International Business Machines Corporation | Cognitive analysis and dictionary management |
CN111079428B (zh) * | 2019-12-27 | 2023-09-19 | 北京羽扇智信息科技有限公司 | 一种分词和行业词典构建方法、装置以及可读存储介质 |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US205671A (en) * | 1878-07-02 | Improvement in feed attachments for guano-drills | ||
JPH06282587A (ja) * | 1993-03-24 | 1994-10-07 | Tokyo Electric Power Co Inc:The | 文書の自動分類方法及び装置並びに分類用の辞書作成方法及び装置 |
JPH09153043A (ja) | 1995-11-30 | 1997-06-10 | Nec Corp | 仮名漢字変換方式 |
JPH1074208A (ja) | 1996-08-30 | 1998-03-17 | Canon Inc | 文書処理装置及びシステム及び方法 |
US20030093790A1 (en) * | 2000-03-28 | 2003-05-15 | Logan James D. | Audio and video program recording, editing and playback systems using metadata |
JPH11272706A (ja) * | 1998-03-24 | 1999-10-08 | Minolta Co Ltd | 検索装置 |
JP4431907B2 (ja) | 1999-04-09 | 2010-03-17 | ソニー株式会社 | 情報提供方法及びその装置 |
JP3703994B2 (ja) | 1999-05-10 | 2005-10-05 | シャープ株式会社 | サービス情報提供装置および情報端末 |
JP4010711B2 (ja) | 1999-06-30 | 2007-11-21 | 株式会社ジャストシステム | ターム評価プログラムを記憶した記憶媒体 |
JP3636941B2 (ja) * | 1999-07-19 | 2005-04-06 | 松下電器産業株式会社 | 情報検索方法と情報検索装置 |
JP4497337B2 (ja) * | 2000-06-29 | 2010-07-07 | 株式会社野村総合研究所 | 概念検索装置およびコンピュータプログラムを記録した記録媒体 |
US20040205671A1 (en) | 2000-09-13 | 2004-10-14 | Tatsuya Sukehiro | Natural-language processing system |
JP3672023B2 (ja) * | 2001-04-23 | 2005-07-13 | 日本電気株式会社 | 番組推薦システムおよび番組推薦方法 |
EP1425745A2 (en) * | 2001-08-27 | 2004-06-09 | Gracenote, Inc. | Playlist generation, delivery and navigation |
JP3452558B2 (ja) * | 2001-09-25 | 2003-09-29 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 翻訳対象のリソースと分野別辞書を関連付けるための方法、システムおよびプログラム |
JP3579387B2 (ja) | 2001-10-26 | 2004-10-20 | 株式会社東芝 | デジタル放送受信装置および電子番組表の表示制御装置 |
US6910037B2 (en) * | 2002-03-07 | 2005-06-21 | Koninklijke Philips Electronics N.V. | Method and apparatus for providing search results in response to an information search request |
JP3627715B2 (ja) | 2002-03-27 | 2005-03-09 | ソニー株式会社 | 情報処理装置および方法、記録媒体、プログラム、並びに情報処理システム |
US7725467B2 (en) * | 2002-03-29 | 2010-05-25 | Sony Corporation | Information search system, information processing apparatus and method, and information search apparatus and method |
US7073193B2 (en) * | 2002-04-16 | 2006-07-04 | Microsoft Corporation | Media content descriptions |
JP2004355069A (ja) * | 2003-05-27 | 2004-12-16 | Sony Corp | 情報処理装置および方法、プログラム、並びに記録媒体 |
JP3923513B2 (ja) * | 2004-06-08 | 2007-06-06 | 松下電器産業株式会社 | 音声認識装置および音声認識方法 |
-
2004
- 2004-11-26 JP JP2005516811A patent/JP3978221B2/ja not_active Expired - Fee Related
- 2004-11-26 CN CNA2004800389974A patent/CN1922605A/zh active Pending
- 2004-11-26 WO PCT/JP2004/017578 patent/WO2005066837A1/ja active Application Filing
-
2006
- 2006-06-21 US US11/471,538 patent/US7840565B2/en active Active
- 2006-08-02 US US11/497,357 patent/US7921113B2/en active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013525868A (ja) * | 2009-12-24 | 2013-06-20 | ズオン−バン ミン | 文書中に表現されているセンチメントを求めるためのシステム及び方法 |
Also Published As
Publication number | Publication date |
---|---|
JPWO2005066837A1 (ja) | 2007-12-20 |
US7840565B2 (en) | 2010-11-23 |
US20060271527A1 (en) | 2006-11-30 |
US7921113B2 (en) | 2011-04-05 |
CN1922605A (zh) | 2007-02-28 |
US20060242191A1 (en) | 2006-10-26 |
WO2005066837A1 (ja) | 2005-07-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3978221B2 (ja) | 辞書作成装置および辞書作成方法 | |
US7209942B1 (en) | Information providing method and apparatus, and information reception apparatus | |
KR100988153B1 (ko) | 정보 검색 시스템, 정보 처리 장치 및 방법, 정보 검색장치 및 방법 | |
CA2688921C (en) | Identification of segments within audio, video, and multimedia items | |
JP4129048B2 (ja) | 固有表現抽出装置、方法、及びプログラム | |
JP2000250944A (ja) | 情報提供方法、情報提供装置、情報受信装置、並びに情報記述方法 | |
JP5106455B2 (ja) | コンテンツ推薦装置及びコンテンツ推薦方法 | |
JPWO2006019101A1 (ja) | コンテンツ関連情報取得装置、コンテンツ関連情報取得方法、およびコンテンツ関連情報取得プログラム | |
JPH1042235A (ja) | 受信端末装置 | |
JP6429382B2 (ja) | コンテンツ推薦装置、及びプログラム | |
JP2009043156A (ja) | 番組検索装置および番組検索方法 | |
JP3307613B2 (ja) | 映像検索システム | |
US20080215526A1 (en) | Information processing apparatus, informaition processing method, and information processing program | |
JP2005352754A (ja) | 情報ナビゲーション装置、方法、プログラム、及び記録媒体 | |
JPH11288424A (ja) | 映像インデックス情報を記録した記録媒体、映像インデックス情報を用いた映像情報管理方法、音声インデックス情報を記録した記録媒体および音声インデックス情報を用いた音声情報管理方法 | |
JP2002108892A (ja) | データ管理システム、データ管理方法、及び、記録媒体 | |
US20090070386A1 (en) | Content storage management apparatus and method for managing stored content | |
JP2004362019A (ja) | 情報推薦装置、情報推薦方法、情報推薦プログラム及び記録媒体 | |
JP2007058562A (ja) | コンテンツ分類装置、コンテンツ分類方法、コンテンツ分類プログラムおよび記録媒体 | |
JP2004295102A (ja) | 音声認識辞書作成装置及び情報検索装置 | |
JP2004295102A5 (ja) | ||
JP2006094018A (ja) | 番組推薦装置、番組推薦方法、プログラムおよびそのプログラムを記録した記録媒体 | |
JP5620038B2 (ja) | 自動的に目的にあった映像をアーカイブし、活用する方法 | |
JP6762678B2 (ja) | 違法コンテンツ探索装置、違法コンテンツ探索方法およびプログラム | |
JP2008225584A (ja) | 物品推薦装置、物品推薦システム、物品推薦方法及び物品推薦プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070529 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070622 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100629 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 3978221 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100629 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110629 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120629 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120629 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130629 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |