JP2006251553A - トピック分割処理方法、トピック分割処理装置及びトピック分割処理プログラム。 - Google Patents
トピック分割処理方法、トピック分割処理装置及びトピック分割処理プログラム。 Download PDFInfo
- Publication number
- JP2006251553A JP2006251553A JP2005069912A JP2005069912A JP2006251553A JP 2006251553 A JP2006251553 A JP 2006251553A JP 2005069912 A JP2005069912 A JP 2005069912A JP 2005069912 A JP2005069912 A JP 2005069912A JP 2006251553 A JP2006251553 A JP 2006251553A
- Authority
- JP
- Japan
- Prior art keywords
- topic
- speech
- phonemes
- analysis
- analysis interval
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
音声を音素よりも粒度の細かい音素片として認識した上で直接トピックのセグメンテーションを行い、コンテンツを意味的に等質な部分に分割する。
【課題を解決するための手段】
トピック分割処理方法は、音声を音節や音素や音素片等のサブワードユニットの列として認識する音声符号化過程と、部分符号列を分析区間として切り出しカーネル主成分分析を用いて分析区間ベクトルを生成する分析区間ベクトル生成過程と、分析区間ベクトルをクラスタリングしてトピック分割を行うクラスタリング過程との処理をコンピュータにより実行し、マルチメディアコンテンツに含まれる音声によりコンテンツを意味的に等質な部分に分割する。
【選択図】 図1
Description
{(T,S)|Tはトピックラベル、SはSPS符号列}
のデータベースである。
102 音声符号化手段
103 分析区間ベクトル生成手段
104 クラスタリング手段
201 映像音声分離部
201 SPS符号化部
203 トピック構造情報生成部
204 構造化コンテンツ提示部
205 トピックデータベース
301 分析区間抽出部
302 カーネル主成分分析部
303 分析区間ベクトル生成部
304 教師なしトピック分割部
305 トピックモデル生成部
306 教師ありトピック分割部
307 トピック構造情報統合部
401 コンテンツ蓄積装置
402 トピック情報計算装置
403 構造化コンテンツ提示装置
431 階層表示部
432 コンテンツ再生部
Claims (6)
- マルチメディアコンテンツに含まれる音声を用いて、コンテンツを意味的に等質な部分に分割するためのトピック分割処理方法であって、
音声を音節や音素や音素片等のサブワードユニットの列として認識する音声符号化過程と、
部分符号列を分析区間として切り出しカーネル主成分分析を用いて分析区間ベクトルを生成する分析区間ベクトル生成過程と、
分析区間ベクトルをクラスタリングしてトピック分割を行うクラスタリング過程と
の処理をコンピュータにより実行することを特徴とするトピック分割処理方法。 - 請求項1に記載のトピック分割処理方法において、
前記音声符号化過程においては、音声をSPS(Sub−Phonetic Segment)符号列に変換して、音声を音節や音素や音素片等のサブワードユニットの列として認識する
ことを特徴とするトピック分割処理方法。 - マルチメディアコンテンツに含まれる音声を用いて、コンテンツを意味的に等質な部分に分割するトピック分割処理装置であって、
音声を音節や音素や音素片等のサブワードユニットの列として認識する音声符号化手段と、
部分符号列を分析区間として切り出しカーネル主成分分析を用いて分析区間ベクトルを生成する分析区間ベクトル生成手段と、
分析区間ベクトルをクラスタリングしてトピック分割を行うクラスタリング手段と
を備えることを特徴とするトピック分割処理装置。 - 請求項3に記載のトピック分割処理装置において、
前記音声符号化手段は、音声をSPS(Sub−Phonetic Segment)符号列に変換して、音声を音節や音素や音素片等のサブワードユニットの列として認識することを特徴とするものであるトピック分割処理装置。 - マルチメディアコンテンツに含まれる音声を用いて、コンテンツを意味的に等質な部分に分割する処理をコンピュータにより実行させるトピック分割プログラムであって、
音声を音節や音素や音素片等のサブワードユニットの列として認識する音声符号化ステップと、
部分符号列を分析区間として切り出しカーネル主成分分析を用いて分析区間ベクトルを生成する分析区間ベクトル生成ステップと、
分析区間ベクトルをクラスタリングしてトピック分割を行うクラスタリングステップとの処理をコンピュータに実行させることを特徴とするトピック分割処理プロクラム。 - 請求項5に記載のトピック分割処理プログラムにおいて、
音声符号化ステップの処理においては、音声をSPS(Sub−Phonetic Segment)符号列に変換して、音声を音節や音素や音素片等のサブワードユニットの列として認識する処理を行う
ことを特徴とするものであるトピック分割処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005069912A JP2006251553A (ja) | 2005-03-11 | 2005-03-11 | トピック分割処理方法、トピック分割処理装置及びトピック分割処理プログラム。 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005069912A JP2006251553A (ja) | 2005-03-11 | 2005-03-11 | トピック分割処理方法、トピック分割処理装置及びトピック分割処理プログラム。 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006251553A true JP2006251553A (ja) | 2006-09-21 |
Family
ID=37092094
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005069912A Pending JP2006251553A (ja) | 2005-03-11 | 2005-03-11 | トピック分割処理方法、トピック分割処理装置及びトピック分割処理プログラム。 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006251553A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007316323A (ja) * | 2006-05-25 | 2007-12-06 | National Institute Of Advanced Industrial & Technology | トピック分割処理方法、トピック分割処理装置及びトピック分割処理プログラム。 |
KR101408902B1 (ko) | 2013-03-28 | 2014-06-19 | 한국과학기술원 | 뇌의 음성신호처리에 기반한 잡음 강인성 음성인식 방법 |
KR101434592B1 (ko) * | 2013-03-28 | 2014-08-27 | 한국과학기술원 | 뇌의 음향처리에 기반한 음성신호 프레임 분할 방법 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004229283A (ja) * | 2003-01-17 | 2004-08-12 | Mitsubishi Electric Research Laboratories Inc | ニュースビデオにおいてニュース司会者の遷移を識別する方法 |
-
2005
- 2005-03-11 JP JP2005069912A patent/JP2006251553A/ja active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004229283A (ja) * | 2003-01-17 | 2004-08-12 | Mitsubishi Electric Research Laboratories Inc | ニュースビデオにおいてニュース司会者の遷移を識別する方法 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007316323A (ja) * | 2006-05-25 | 2007-12-06 | National Institute Of Advanced Industrial & Technology | トピック分割処理方法、トピック分割処理装置及びトピック分割処理プログラム。 |
KR101408902B1 (ko) | 2013-03-28 | 2014-06-19 | 한국과학기술원 | 뇌의 음성신호처리에 기반한 잡음 강인성 음성인식 방법 |
KR101434592B1 (ko) * | 2013-03-28 | 2014-08-27 | 한국과학기술원 | 뇌의 음향처리에 기반한 음성신호 프레임 분할 방법 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110534095B (zh) | 语音识别方法、装置、设备以及计算机可读存储介质 | |
CN107315737B (zh) | 一种语义逻辑处理方法及系统 | |
JP3848319B2 (ja) | 情報処理方法及び情報処理装置 | |
JP5440177B2 (ja) | 単語カテゴリ推定装置、単語カテゴリ推定方法、音声認識装置、音声認識方法、プログラム、および記録媒体 | |
US7424427B2 (en) | Systems and methods for classifying audio into broad phoneme classes | |
US7966173B2 (en) | System and method for diacritization of text | |
US9336769B2 (en) | Relative semantic confidence measure for error detection in ASR | |
US8065149B2 (en) | Unsupervised lexicon acquisition from speech and text | |
WO2005122144A1 (ja) | 音声認識装置、音声認識方法、及びプログラム | |
US8688725B2 (en) | Search apparatus, search method, and program | |
JP6323947B2 (ja) | 音響イベント認識装置、及びプログラム | |
CN113766314B (zh) | 视频切分方法、装置、设备、系统及存储介质 | |
CN112818680B (zh) | 语料的处理方法、装置、电子设备及计算机可读存储介质 | |
Dufour et al. | Characterizing and detecting spontaneous speech: Application to speaker role recognition | |
CN114547370A (zh) | 一种视频摘要提取方法及系统 | |
CN114817465A (zh) | 一种用于多语言语义理解的实体纠错方法及智能设备 | |
Kaushik et al. | Automatic audio sentiment extraction using keyword spotting. | |
CN116320607A (zh) | 智能视频生成方法、装置、设备及介质 | |
JP2006251553A (ja) | トピック分割処理方法、トピック分割処理装置及びトピック分割処理プログラム。 | |
CN116524915A (zh) | 一种基于语义交互的弱监督语音-视频定位方法和系统 | |
Zhang et al. | Active learning with semi-automatic annotation for extractive speech summarization | |
Ghannay et al. | A study of continuous space word and sentence representations applied to ASR error detection | |
JP2007316323A (ja) | トピック分割処理方法、トピック分割処理装置及びトピック分割処理プログラム。 | |
Jitaru et al. | Lrro: a lip reading data set for the under-resourced romanian language | |
JP5544575B2 (ja) | 音声言語評価装置、方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070213 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20091127 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091208 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100205 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100511 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111128 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20111128 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111208 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20111208 |