JP2007156286A - 情報認識装置及び情報認識プログラム - Google Patents
情報認識装置及び情報認識プログラム Download PDFInfo
- Publication number
- JP2007156286A JP2007156286A JP2005354310A JP2005354310A JP2007156286A JP 2007156286 A JP2007156286 A JP 2007156286A JP 2005354310 A JP2005354310 A JP 2005354310A JP 2005354310 A JP2005354310 A JP 2005354310A JP 2007156286 A JP2007156286 A JP 2007156286A
- Authority
- JP
- Japan
- Prior art keywords
- word
- recognition
- information
- text
- information recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】授業用マテリアルであるテキストから単語抽出を行い、抽出された単語の出現位置・順序・頻度、授業・講演と同時に収録される筆記情報等から抽出される単語情報と音声情報から抽出される単語情報の位置関係を用いて、映像箇所にタグを付与する装置であって、授業・講演との関連情報を用いて音声認識率を向上させ、付与するタグの精度を向上させる。
【選択図】図1
Description
CPU10101は、起動したプログラムに応じて処理を行う。
CPU1021は、起動したプログラムに応じて処理を行う。
CPU10301は、起動したプログラムに応じて処理を行う。
まず、認識用文字表示パタン単語辞書を用い、格納された点列データ群との対応付けによりテキスト抽出を行う。この結果、複数の単語候補が尤度順に抽出される(12002)。
えば図6Aに示すように、選択された映像コンテンツを解析処理した結果得られた単語がメニュー形式601で表示される(15003)。
ユーザが映像選択メニュー506から映像コンテンツを選択すると、図6Bに示すように、章単位映像箇所選択メニュー・ボタン領域605に、例えば、映像コンテンツを解析した結果得られた各章内容、各章に対応する映像箇所を示すボタンが表示される。
103:ユーザ用端末。
Claims (20)
- 入力される音声情報を認識し、1つまたは複数の音声認識候補とその音声認識についての第1の尤度を算出する音声認識部と、
入力されるテキストデータにテキスト範囲を設定するテキストデータ認識部と、
所定数の上記音声認識候補を単語群とし、該単語群を構成する音声認識候補の上記第1の尤度及び上記設定されたテキスト範囲に含まれる単語を用いて、該単語群と上記テキスト範囲の何れかとを対応づける情報認識部とを有することを特徴とする情報認識装置。 - 上記情報認識部は、上記単語群を構成する音声認識候補と上記テキストデータの単語とを対応づけ、上記テキスト範囲ごとに該テキスト範囲に属する上記単語に対応づけられた音声認識候補の音声認識についての尤度の総和を求め、該総和が最も大きいテキスト範囲を上記単語群と対応づけることを特徴とする請求項1に記載の情報認識装置。
- 上記情報認識部は、音声認識された順に1単語ずつずらすことにより順次所定数の単語群を形成し、過去の単語群とテキスト範囲との対応づけの結果を用いて、該形成された単語群と上記テキスト範囲との対応づけを行うことを特徴とする請求項1または2に記載の情報認識装置。
- 上記テキストデータ認識部は、上記テキストデータから単語を抽出し、該抽出された単語のフォーマット及び項目を示す表記の情報を用いて、上記テキストデータを群に分割し上記テキスト範囲を設定することを特徴とする請求項1乃至3の何れかに記載の情報認識装置。
- 上記情報認識部は、上記音声認識候補が、該音声認識候補の属する単語群と対応づけられた上記テキスト範囲に含まれる単語と一致する場合、該単語を認識結果とすることを特徴とする請求項1乃至4の何れかに記載の情報認識装置。
- 上記情報認識部は、上記音声認識候補が、該音声認識候補の属する単語群と対応づけられた上記テキスト範囲に含まれる単語と一致せず、該テキスト範囲とは異なるテキスト範囲に含まれる単語と一致する場合、該一致する単語を認識結果とすることを特徴とする請求項1乃至4の何れかに記載の情報認識装置。
- 上記情報認識部は、上記音声認識候補が上記テキストデータの単語と一致しない場合、上記第1の尤度が1位の音声認識候補を認識結果とすることを特徴とする請求項1乃至4の何れかに記載の情報認識装置。
- 上記音声認識候補が入力された第1の時刻を抽出する音声時刻抽出部と
入力される文字情報を認識し、1つまたは複数の文字認識候補とその文字認識についての第2の尤度を算出する文字認識部と、
上記文字認識候補が入力された第2の時刻を抽出する文字時刻抽出部とをさらに有し、
上記情報認識部は、上記第1の尤度、上記第2の尤度、上記音声認識候補と上記文字認識候補との類似度、第1の時刻と第2の時刻との時間的距離、を用いて認識結果を決定することを特徴とする請求項1乃至7の何れかに記載の情報認識装置。 - 音声認識部とテキストデータ認識部と情報認識部とを有する情報認識装置において情報認識方法を実行させる情報認識プログラムであって、
上記情報認識方法は、入力される音声情報を認識し1つまたは複数の音声認識候補とその音声認識についての第1の尤度を算出し、入力されるテキストデータにテキスト範囲を設定し、所定数の上記音声認識候補を単語群とし、該単語群を構成する音声認識候補の上記第1の尤度及び上記設定されたテキスト範囲に含まれる単語を用いて該単語群と上記テキスト範囲の何れかとを対応づけることを特徴とする情報認識プログラム。 - 上記情報認識方法は、上記単語群を構成する音声認識候補と上記テキストデータの単語とを対応づけ、該対応づけられた単語に上記音声認識候補の音声認識についての尤度を対応づけ、上記テキスト範囲ごとに該テキスト範囲に属する上記単語の尤度の総和を求め、該総和が最も大きいテキスト範囲を上記単語群と対応づけることを特徴とする請求項9に記載の情報認識プログラム。
- 上記情報認識方法は、上記音声認識候補を算出した順に1単語ずつずらすことにより順次所定数の単語群を形成し、過去の単語群とテキスト範囲との対応づけの結果を用いて、該形成された単語群と上記テキスト範囲との対応づけを行うことを特徴とする請求項9または10に記載の情報認識プログラム。
- 上記情報認識方法は、上記テキストデータから単語を抽出し、該抽出された単語のフォーマット及び項目を示す表記の情報を用いて、上記テキストデータを群に分割し上記テキスト範囲を設定することを特徴とする請求項9乃至11の何れかに記載の情報認識プログラム。
- 上記情報認識方法は、上記音声認識候補が、該音声認識候補の属する単語群と対応づけられた上記テキスト範囲に含まれる単語と一致する場合、該単語を認識結果とすることを特徴とする請求項9乃至12の何れかに記載の情報認識プログラム。
- 上記情報認識方法は、上記音声認識候補が、該音声認識候補の属する単語群と対応づけられた上記テキスト範囲に含まれる単語と一致せず、該テキスト範囲とは異なるテキスト範囲に含まれる単語と一致する場合、該一致する単語を認識結果とすることを特徴とする請求項9乃至12の何れかに記載の情報認識プログラム。
- 上記情報認識方法は、上記音声認識候補が上記テキスト範囲に含まれる単語と一致しない場合、上記第1の尤度が1位の音声認識候補を認識結果とすることを特徴とする請求項9乃至12の何れかに記載の情報認識プログラム。
- 上記情報認識方法は、
上記音声認識候補が入力された第1の時刻を抽出し、
入力される文字情報を認識し1つまたは複数の文字認識候補とその文字認識についての第2の尤度を算出し上記文字認識候補が入力された第2の時刻を抽出し、
上記第1の尤度、上記第2の尤度、上記音声認識候補と上記文字認識候補との類似度、第1の時刻と第2の時刻との時間的距離、を用いて認識結果を決定することを特徴とする請求項9乃至15の何れかに記載の情報認識プログラム。 - 上記情報認識装置は表示部に接続され、
上記情報認識方法は、上記音声認識される単語が入力された時間情報に基づいて該単語と映像とを対応づけ、上記単語を上記表示部に表示し、該表示された単語の何れかが指定されると該指定された単語に対応づけられた映像箇所を上記表示部に表示し、該表示された映像箇所が指定されると該指定された映像箇所から上記映像を再生し上記表示部に表示することを特徴とする請求項13乃至16の何れかに記載の情報認識プログラム。 - 上記情報認識方法は、上記映像箇所に対応づけられた単語数により、該映像箇所の表示を変えることを特徴とする請求項17に記載の情報認識プログラム。
- 上記情報認識方法は、上記表示部に、上記指定された単語の上記テキスト範囲内での位置を明示し表示することを特徴とする請求項17または18に記載の情報認識プログラム。
- 上記情報認識方法は、上記時間情報に基づいて上記テキスト範囲と上記映像とを対応づけ、上記テキスト範囲を上記表示部に表示し、該表示されたテキスト範囲の何れかが指定されると該指定されたテキスト範囲に対応する上記映像を再生し上記表示部に表示することを特徴とする請求項17乃至19の何れかに記載の情報認識プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005354310A JP4802689B2 (ja) | 2005-12-08 | 2005-12-08 | 情報認識装置及び情報認識プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005354310A JP4802689B2 (ja) | 2005-12-08 | 2005-12-08 | 情報認識装置及び情報認識プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007156286A true JP2007156286A (ja) | 2007-06-21 |
JP4802689B2 JP4802689B2 (ja) | 2011-10-26 |
Family
ID=38240713
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005354310A Expired - Fee Related JP4802689B2 (ja) | 2005-12-08 | 2005-12-08 | 情報認識装置及び情報認識プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4802689B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8126714B2 (en) | 2007-04-10 | 2012-02-28 | Mitsubishi Electric Corporation | Voice search device |
KR101773203B1 (ko) | 2010-06-24 | 2017-08-31 | 인터내셔널 비지네스 머신즈 코포레이션 | 사용자 주도의 오디오 콘텐트 탐색 |
KR101832050B1 (ko) * | 2016-03-25 | 2018-02-23 | 김준모 | 음성 데이터 기반 멀티미디어 콘텐츠 태깅 방법 및 이를 이용한 시스템 |
CN111933131A (zh) * | 2020-05-14 | 2020-11-13 | 联想(北京)有限公司 | 一种语音识别方法以及装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0863461A (ja) * | 1994-08-18 | 1996-03-08 | Fujitsu Ltd | ワードプロセッサ |
JPH11282772A (ja) * | 1998-03-27 | 1999-10-15 | Sony Corp | 情報配信システム、情報送信装置、情報受信装置 |
JP2002268667A (ja) * | 2001-03-06 | 2002-09-20 | Canon Inc | プレゼンテーションシステムおよびその制御方法 |
JP2004152063A (ja) * | 2002-10-31 | 2004-05-27 | Nec Corp | マルチメディアコンテンツ構造化方法、構造化装置および構造化プログラム、ならびに提供方法 |
JP2004326404A (ja) * | 2003-04-24 | 2004-11-18 | Nec Corp | インデックス作成装置、インデックス作成方法、および、インデックス作成プログラム |
WO2005027092A1 (ja) * | 2003-09-08 | 2005-03-24 | Nec Corporation | 文書作成閲覧方法、文書作成閲覧装置、文書作成閲覧ロボットおよび文書作成閲覧プログラム |
-
2005
- 2005-12-08 JP JP2005354310A patent/JP4802689B2/ja not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0863461A (ja) * | 1994-08-18 | 1996-03-08 | Fujitsu Ltd | ワードプロセッサ |
JPH11282772A (ja) * | 1998-03-27 | 1999-10-15 | Sony Corp | 情報配信システム、情報送信装置、情報受信装置 |
JP2002268667A (ja) * | 2001-03-06 | 2002-09-20 | Canon Inc | プレゼンテーションシステムおよびその制御方法 |
JP2004152063A (ja) * | 2002-10-31 | 2004-05-27 | Nec Corp | マルチメディアコンテンツ構造化方法、構造化装置および構造化プログラム、ならびに提供方法 |
JP2004326404A (ja) * | 2003-04-24 | 2004-11-18 | Nec Corp | インデックス作成装置、インデックス作成方法、および、インデックス作成プログラム |
WO2005027092A1 (ja) * | 2003-09-08 | 2005-03-24 | Nec Corporation | 文書作成閲覧方法、文書作成閲覧装置、文書作成閲覧ロボットおよび文書作成閲覧プログラム |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8126714B2 (en) | 2007-04-10 | 2012-02-28 | Mitsubishi Electric Corporation | Voice search device |
KR101773203B1 (ko) | 2010-06-24 | 2017-08-31 | 인터내셔널 비지네스 머신즈 코포레이션 | 사용자 주도의 오디오 콘텐트 탐색 |
KR101832050B1 (ko) * | 2016-03-25 | 2018-02-23 | 김준모 | 음성 데이터 기반 멀티미디어 콘텐츠 태깅 방법 및 이를 이용한 시스템 |
WO2017164510A3 (ko) * | 2016-03-25 | 2018-08-02 | 김준모 | 음성 데이터 기반 멀티미디어 콘텐츠 태깅 방법 및 이를 이용한 시스템 |
CN111933131A (zh) * | 2020-05-14 | 2020-11-13 | 联想(北京)有限公司 | 一种语音识别方法以及装置 |
Also Published As
Publication number | Publication date |
---|---|
JP4802689B2 (ja) | 2011-10-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Pavel et al. | Sceneskim: Searching and browsing movies using synchronized captions, scripts and plot summaries | |
JP4218758B2 (ja) | 字幕生成装置、字幕生成方法、及びプログラム | |
CN109783796B (zh) | 预测文本内容中的样式破坏 | |
CN102982021B (zh) | 用于消除语言转换中的多个读法的歧义的方法 | |
US7979268B2 (en) | String matching method and system and computer-readable recording medium storing the string matching method | |
US11657725B2 (en) | E-reader interface system with audio and highlighting synchronization for digital books | |
US10978077B1 (en) | Knowledge point mark generation system and method thereof | |
US20080300872A1 (en) | Scalable summaries of audio or visual content | |
US20080077869A1 (en) | Conference supporting apparatus, method, and computer program product | |
WO2007004408A1 (ja) | 情報処理装置,情報処理方法および情報処理プログラム | |
CN112911326B (zh) | 弹幕信息处理方法、装置、电子设备和存储介质 | |
JP4738847B2 (ja) | データ検索装置および方法 | |
US20220269724A1 (en) | Audio playing method, electronic device, and storage medium | |
JP4802689B2 (ja) | 情報認識装置及び情報認識プログラム | |
CN111078915B (zh) | 一种点读模式下的点读内容获取方法及电子设备 | |
CN111723235B (zh) | 音乐内容识别方法、装置及设备 | |
CN113407775B (zh) | 视频搜索方法、装置及电子设备 | |
WO2021097629A1 (zh) | 数据处理方法、装置、电子设备和存储介质 | |
Vinciarelli et al. | Application of information retrieval technologies to presentation slides | |
CN114297372A (zh) | 个性化的笔记生成方法及系统 | |
JP2008097232A (ja) | 音声情報検索プログラムとその記録媒体、音声情報検索システム、並びに音声情報検索方法 | |
TWI684964B (zh) | 知識點標記生成系統及其方法 | |
Hürst et al. | Searching in recorded lectures | |
CN115083222B (zh) | 信息交互方法、装置、电子设备及存储介质 | |
EP4336379A1 (en) | Tracking concepts within content in content management systems and adaptive learning systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080827 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20101026 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101102 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101227 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110426 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110516 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110712 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110725 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140819 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |