JP4802689B2 - 情報認識装置及び情報認識プログラム - Google Patents
情報認識装置及び情報認識プログラム Download PDFInfo
- Publication number
- JP4802689B2 JP4802689B2 JP2005354310A JP2005354310A JP4802689B2 JP 4802689 B2 JP4802689 B2 JP 4802689B2 JP 2005354310 A JP2005354310 A JP 2005354310A JP 2005354310 A JP2005354310 A JP 2005354310A JP 4802689 B2 JP4802689 B2 JP 4802689B2
- Authority
- JP
- Japan
- Prior art keywords
- recognition
- word
- information
- text
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
CPU10101は、起動したプログラムに応じて処理を行う。
CPU1021は、起動したプログラムに応じて処理を行う。
CPU10301は、起動したプログラムに応じて処理を行う。
まず、認識用文字表示パタン単語辞書を用い、格納された点列データ群との対応付けによりテキスト抽出を行う。この結果、複数の単語候補が尤度順に抽出される(12002)。
えば図6Aに示すように、選択された映像コンテンツを解析処理した結果得られた単語がメニュー形式601で表示される(15003)。
ユーザが映像選択メニュー506から映像コンテンツを選択すると、図6Bに示すように、章単位映像箇所選択メニュー・ボタン領域605に、例えば、映像コンテンツを解析した結果得られた各章内容、各章に対応する映像箇所を示すボタンが表示される。
103:ユーザ用端末。
Claims (18)
- 入力される音声情報を認識し、1つまたは複数の音声認識候補とその音声認識についての第1の尤度を算出する音声認識部と、
入力されるテキストデータにテキスト範囲を設定するテキストデータ認識部と、
所定数の上記音声認識候補を単語群とし、該単語群を構成する音声認識候補と上記テキストデータの単語とを対応づけ、上記テキスト範囲ごとに該テキスト範囲に属する上記単語に対応づけられた音声認識候補の音声認識についての尤度の総和を求め、該総和が最も大きいテキスト範囲を上記単語群と対応づける情報認識部とを有することを特徴とする情報認識装置。 - 上記情報認識部は、音声認識された順に1単語ずつずらすことにより順次所定数の単語群を形成し、過去の単語群とテキスト範囲との対応づけの結果を用いて、該形成された単語群と上記テキスト範囲との対応づけを行うことを特徴とする請求項1に記載の情報認識装置。
- 上記テキストデータ認識部は、上記テキストデータから単語を抽出し、該抽出された単語のフォーマット及び項目を示す表記の情報を用いて、上記テキストデータを群に分割し上記テキスト範囲を設定することを特徴とする請求項1又は2に記載の情報認識装置。
- 上記情報認識部は、上記音声認識候補が、該音声認識候補の属する単語群と対応づけられた上記テキスト範囲に含まれる単語と一致する場合、該単語を認識結果とすることを特徴とする請求項1乃至3の何れかに記載の情報認識装置。
- 上記情報認識部は、上記音声認識候補が、該音声認識候補の属する単語群と対応づけられた上記テキスト範囲に含まれる単語と一致せず、該テキスト範囲とは異なるテキスト範囲に含まれる単語と一致する場合、該一致する単語を認識結果とすることを特徴とする請求項1乃至3の何れかに記載の情報認識装置。
- 上記情報認識部は、上記音声認識候補が上記テキストデータの単語と一致しない場合、上記第1の尤度が1位の音声認識候補を認識結果とすることを特徴とする請求項1乃至3の何れかに記載の情報認識装置。
- 上記音声認識候補が入力された第1の時刻を抽出する音声時刻抽出部と
入力される文字情報を認識し、1つまたは複数の文字認識候補とその文字認識についての第2の尤度を算出する文字認識部と、
上記文字認識候補が入力された第2の時刻を抽出する文字時刻抽出部とをさらに有し、
上記情報認識部は、上記第1の尤度、上記第2の尤度、上記音声認識候補と上記文字認識候補との類似度、第1の時刻と第2の時刻との時間的距離、を用いて認識結果を決定することを特徴とする請求項1乃至6の何れかに記載の情報認識装置。 - 音声認識部とテキストデータ認識部と情報認識部とを有する情報認識装置において情報認識方法を実行させる情報認識プログラムであって、
上記情報認識方法は、入力される音声情報を認識し1つまたは複数の音声認識候補とその音声認識についての第1の尤度を算出し、入力されるテキストデータにテキスト範囲を設定し、所定数の上記音声認識候補を単語群とし、該単語群を構成する音声認識候補と上記テキストデータの単語とを対応づけ、該対応づけられた単語に上記音声認識候補の音声認識についての尤度を対応づけ、上記テキスト範囲ごとに該テキスト範囲に属する上記単語に対応づけられた音声認識候補の音声認識についての尤度の総和を求め、該総和が最も大きいテキスト範囲を上記単語群と対応づけることを特徴とする情報認識プログラム。 - 上記情報認識方法は、上記音声認識候補を算出した順に1単語ずつずらすことにより順次所定数の単語群を形成し、過去の単語群とテキスト範囲との対応づけの結果を用いて、該形成された単語群と上記テキスト範囲との対応づけを行うことを特徴とする請求項8に記載の情報認識プログラム。
- 上記情報認識方法は、上記テキストデータから単語を抽出し、該抽出された単語のフォーマット及び項目を示す表記の情報を用いて、上記テキストデータを群に分割し上記テキスト範囲を設定することを特徴とする請求項8または9に記載の情報認識プログラム。
- 上記情報認識方法は、上記音声認識候補が、該音声認識候補の属する単語群と対応づけられた上記テキスト範囲に含まれる単語と一致する場合、該単語を認識結果とすることを特徴とする請求項8乃至10の何れかに記載の情報認識プログラム。
- 上記情報認識方法は、上記音声認識候補が、該音声認識候補の属する単語群と対応づけられた上記テキスト範囲に含まれる単語と一致せず、該テキスト範囲とは異なるテキスト範囲に含まれる単語と一致する場合、該一致する単語を認識結果とすることを特徴とする請求項8乃至10の何れかに記載の情報認識プログラム。
- 上記情報認識方法は、上記音声認識候補が上記テキスト範囲に含まれる単語と一致しない場合、上記第1の尤度が1位の音声認識候補を認識結果とすることを特徴とする請求項8乃至10の何れかに記載の情報認識プログラム。
- 上記情報認識方法は、
上記音声認識候補が入力された第1の時刻を抽出し、
入力される文字情報を認識し1つまたは複数の文字認識候補とその文字認識についての第2の尤度を算出し上記文字認識候補が入力された第2の時刻を抽出し、
上記第1の尤度、上記第2の尤度、上記音声認識候補と上記文字認識候補との類似度、第1の時刻と第2の時刻との時間的距離、を用いて認識結果を決定することを特徴とする請求項8乃至13の何れかに記載の情報認識プログラム。 - 上記情報認識装置は表示部に接続され、
上記情報認識方法は、上記音声認識される単語が入力された時間情報に基づいて該単語と映像とを対応づけ、上記単語を上記表示部に表示し、該表示された単語の何れかが指定されると該指定された単語に対応づけられた映像箇所を上記表示部に表示し、該表示された映像箇所が指定されると該指定された映像箇所から上記映像を再生し上記表示部に表示することを特徴とする請求項11乃至14の何れかに記載の情報認識プログラム。 - 上記情報認識方法は、上記映像箇所に対応づけられた単語数により、該映像箇所の表示を変えることを特徴とする請求項15に記載の情報認識プログラム。
- 上記情報認識方法は、上記表示部に、上記指定された単語の上記テキスト範囲内での位置を明示し表示することを特徴とする請求項15または16に記載の情報認識プログラム。
- 上記情報認識方法は、上記時間情報に基づいて上記テキスト範囲と上記映像とを対応づけ、上記テキスト範囲を上記表示部に表示し、該表示されたテキスト範囲の何れかが指定されると該指定されたテキスト範囲に対応する上記映像を再生し上記表示部に表示することを特徴とする請求項15乃至17の何れかに記載の情報認識プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005354310A JP4802689B2 (ja) | 2005-12-08 | 2005-12-08 | 情報認識装置及び情報認識プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005354310A JP4802689B2 (ja) | 2005-12-08 | 2005-12-08 | 情報認識装置及び情報認識プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007156286A JP2007156286A (ja) | 2007-06-21 |
JP4802689B2 true JP4802689B2 (ja) | 2011-10-26 |
Family
ID=38240713
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005354310A Expired - Fee Related JP4802689B2 (ja) | 2005-12-08 | 2005-12-08 | 情報認識装置及び情報認識プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4802689B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5072415B2 (ja) | 2007-04-10 | 2012-11-14 | 三菱電機株式会社 | 音声検索装置 |
US9715540B2 (en) | 2010-06-24 | 2017-07-25 | International Business Machines Corporation | User driven audio content navigation |
KR101832050B1 (ko) * | 2016-03-25 | 2018-02-23 | 김준모 | 음성 데이터 기반 멀티미디어 콘텐츠 태깅 방법 및 이를 이용한 시스템 |
CN111933131A (zh) * | 2020-05-14 | 2020-11-13 | 联想(北京)有限公司 | 一种语音识别方法以及装置 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0863461A (ja) * | 1994-08-18 | 1996-03-08 | Fujitsu Ltd | ワードプロセッサ |
JPH11282772A (ja) * | 1998-03-27 | 1999-10-15 | Sony Corp | 情報配信システム、情報送信装置、情報受信装置 |
JP2002268667A (ja) * | 2001-03-06 | 2002-09-20 | Canon Inc | プレゼンテーションシステムおよびその制御方法 |
JP2004152063A (ja) * | 2002-10-31 | 2004-05-27 | Nec Corp | マルチメディアコンテンツ構造化方法、構造化装置および構造化プログラム、ならびに提供方法 |
JP3938096B2 (ja) * | 2003-04-24 | 2007-06-27 | 日本電気株式会社 | インデックス作成装置、インデックス作成方法、および、インデックス作成プログラム |
WO2005027092A1 (ja) * | 2003-09-08 | 2005-03-24 | Nec Corporation | 文書作成閲覧方法、文書作成閲覧装置、文書作成閲覧ロボットおよび文書作成閲覧プログラム |
-
2005
- 2005-12-08 JP JP2005354310A patent/JP4802689B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2007156286A (ja) | 2007-06-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Pavel et al. | Sceneskim: Searching and browsing movies using synchronized captions, scripts and plot summaries | |
JP4218758B2 (ja) | 字幕生成装置、字幕生成方法、及びプログラム | |
CN109783796B (zh) | 预测文本内容中的样式破坏 | |
KR101160597B1 (ko) | 의미 연관성에 기초한 콘텐츠 검색 | |
JP5257071B2 (ja) | 類似度計算装置及び情報検索装置 | |
US10978077B1 (en) | Knowledge point mark generation system and method thereof | |
US20070055493A1 (en) | String matching method and system and computer-readable recording medium storing the string matching method | |
US20080077869A1 (en) | Conference supporting apparatus, method, and computer program product | |
WO2007004408A1 (ja) | 情報処理装置,情報処理方法および情報処理プログラム | |
CN112911326B (zh) | 弹幕信息处理方法、装置、电子设备和存储介质 | |
JP4738847B2 (ja) | データ検索装置および方法 | |
JP3545824B2 (ja) | データ検索装置 | |
JP4802689B2 (ja) | 情報認識装置及び情報認識プログラム | |
US20220269724A1 (en) | Audio playing method, electronic device, and storage medium | |
CN111078915B (zh) | 一种点读模式下的点读内容获取方法及电子设备 | |
CN112382295A (zh) | 语音识别方法、装置、设备及可读存储介质 | |
CN111723235B (zh) | 音乐内容识别方法、装置及设备 | |
CN113407775B (zh) | 视频搜索方法、装置及电子设备 | |
Vinciarelli et al. | Application of information retrieval technologies to presentation slides | |
JP2007188410A (ja) | 電子辞書装置、電子辞書検索方法、及び電子辞書プログラム | |
CN114297372A (zh) | 个性化的笔记生成方法及系统 | |
JP2008097232A (ja) | 音声情報検索プログラムとその記録媒体、音声情報検索システム、並びに音声情報検索方法 | |
TWI684964B (zh) | 知識點標記生成系統及其方法 | |
JP2009169113A (ja) | 言語モデル作成装置、言語モデル作成方法および言語モデル作成プログラム | |
EP4336379A1 (en) | Tracking concepts within content in content management systems and adaptive learning systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080827 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20101026 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101102 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101227 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110426 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110516 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110712 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110725 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140819 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |