JP2009210747A - 関連文書選択出力装置及びそのプログラム - Google Patents
関連文書選択出力装置及びそのプログラム Download PDFInfo
- Publication number
- JP2009210747A JP2009210747A JP2008052765A JP2008052765A JP2009210747A JP 2009210747 A JP2009210747 A JP 2009210747A JP 2008052765 A JP2008052765 A JP 2008052765A JP 2008052765 A JP2008052765 A JP 2008052765A JP 2009210747 A JP2009210747 A JP 2009210747A
- Authority
- JP
- Japan
- Prior art keywords
- word
- document
- speech
- related document
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000013598 vector Substances 0.000 claims abstract description 92
- 230000002596 correlated effect Effects 0.000 claims 2
- 238000010586 diagram Methods 0.000 description 9
- 238000000034 method Methods 0.000 description 6
- 238000004519 manufacturing process Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】関連文書選択出力装置3は、文書集合Dに含まれる単語の出現頻度・逆出現頻度を予め算出し、文書dj毎に、単語と単語の出現頻度・逆出現頻度とを対応付けて文書djの内容を示す文書ベクトルVjを生成する文書ベクトル生成手段31と、音声単語が文書集合Dに出現する頻度を算出し、音声単語と音声単語の頻度とを対応付けて音声単語列の内容を示す単語ベクトルWjを生成する単語ベクトル生成手段32と、単語ベクトルWjに対する全ての文書ベクトルVjの距離を予め設定した距離尺度に基づいて算出し、距離が最短となる文書ベクトルVjが示す文書を関連文書として選択する関連文書選択手段33と、関連文書出力手段37と、を備える。
【選択図】図2
Description
音声認識誤りと未知語に頑健な音声文字検索手法,西崎 博光他、電子情報通信学会論文誌,No.10 pp.1369−1381,2003年10月 話し言葉による音声対話システム,河原 達也,IPSF Magazine Vol.45,No.10,Oct.2004
このように、関連文書選択出力装置は、文書集合から、受信した音声単語に最も内容が近い文書、例えば、読み上げられて音声認識された文書を、関連文書として選択する。また、この関連文書には、音声認識に含まれる誤りを修正するために必要となる正しい情報が記載されていることが多い。
かかる構成において、関連文書選択出力装置は、単語強調手段によって、オペレータが頻繁に確認する重要単語を強調する。
かかる構成において、関連文書選択出力装置は、修正候補出力手段によって、誤りを修正するときの手掛かりとなる修正候補を出力する。
かかる構成において、関連文書選択出力装置は、警告手段によって、文書集合に関連文書が存在しない旨、警告することができる。
請求項1,5に記載の発明によれば、オペレータによる音声認識誤りの修正作業に必要となる正しい情報が記載さていることが多い関連文書を、人手によらずに、迅速、かつ、正確に選択して出力することができる。また、請求項1,5に記載の発明によれば、関連文書において、受信した音声単語の位置をオペレータに明示するため、オペレータが、音声認識の誤りの修正作業を行いやすくなる。
請求項2に記載の発明によれば、関連文書に含まれる重要単語を強調するため、オペレータが重要単語を視認しやすくなる。
請求項3に記載の発明によれば、誤りを修正するときの手掛かりとなる修正候補を出力するため、オペレータが、音声認識の誤りの修正作業をより行いやすくなる。
請求項4に記載の発明によれば、文書集合中に関連文書が存在しない旨、警告するため、オペレータが、関連性の低い関連文書に基づいて、誤って修正作業を行う事態を低減することができる。
以下、本発明の実施形態について、適宜図面を参照しながら詳細に説明する。
最初に、図1を参照して、本発明の実施形態に係る関連文書選択出力装置を含むリアルタイム字幕生成システムの概要について説明する。図1は、本発明の実施形態に係る関連文書選択出力装置を含むリアルタイム字幕生成システムの概要を示すブロック図である。リアルタイム字幕生成システム1は、ニュース番組において、ニュース原稿を読み上げる音声を音声認識した字幕を、音声認識誤りがある場合にはオペレータAがその誤りを修正してから、ニュース番組に付加するものである。ここでは、リアルタイム字幕生成システム1は、音声認識装置2と、関連文書選択出力装置3と、誤認識修正装置4とを備える。
次に、図2を参照して、本発明の実施形態に係る関連文書選択出力装置の構成について説明する。図2は、本発明の実施形態に係る関連文書選択出力装置の構成を示すブロック図である。図2に示すように、関連文書選択出力装置3は、文書ベクトル生成手段31と、単語ベクトル生成手段32と、関連文書選択手段33と、を備える。また、関連文書選択手段33は、単語強調手段34と、修正候補出力手段35と、警告手段36と、関連文書出力手段37と、を備える。
関連文書選択手段33は、単語ベクトルWiに対する全ての文書ベクトルVjの距離を予め設定した距離尺度に基づいて算出し、距離が最短となる文書ベクトルVjが示す文書を関連文書として選択するものである。具体的には、関連文書選択手段33は、式(2)で定義する距離尺度により、文書dj毎に距離Sjを算出する。なお、関連文書選択手段33の動作については、後記する。
さらに、単語強調手段34は、出現頻度・逆出現頻度が大きい上位P個(Pは1以上の整数)の単語を重要単語として強調しても良い。
また、関連文書選択出力装置3は、図示しないHDD(Hard Disk Drive)等の記憶手段を備え、前記した文書集合D、重要単語リスト、K,L,N等のパラメータを記憶手段に記憶しても良い。以上、関連文書選択出力装置3の構成について説明した。
以下、図4を参照し、警告手段36及び関連文書出力手段37の詳細について説明する(適宜図2参照)。図4は、図2の警告手段及び関連文書出力手段の詳細を説明するための説明図であり、(a)は、音声認識装置が正しく音声認識した音声単語列を示し、(b)は、関連文書選択出力装置が3個目の音声単語を受信したときのディスプレイの出力を示し、(c)は、関連文書選択出力装置が4個目の音声単語を受信したときのディスプレイの出力を示し、(d)は、関連文書選択出力装置が5個目の音声単語を受信したときのディスプレイの出力を示す。なお、図4(b)〜(d)において、下線は、単語強調手段34によって強調された単語を示す。
以下、図5を参照し、修正候補出力手段35の詳細について説明する(適宜図2参照)。図5は、図2の修正候補出力手段の詳細を説明するための説明図であり、(a)は、音声認識装置が誤って音声認識した音声単語列を示し、(b)は、関連文書選択出力装置が3個目の音声単語を受信したときのディスプレイの出力を示し、(c)は、関連文書選択出力装置が4個目の音声単語を受信したときのディスプレイの出力を示し、(d)は、関連文書選択出力装置が5個目の音声単語を受信したときのディスプレイの出力を示す。なお、図5(b)において、下線は、単語強調手段34によって強調された単語を示す。
なお、図4及び図5において、Mの値を1とすると、関連文書選択出力装置3は、前記した処理を、1個の音声単語wi単位で行うことは言うまでも無い。
以下、図6を参照して、文書ベクトル生成手段31が文書単語ベクトルを生成する動作について説明する(適宜図2参照)。図6は、図2の文書ベクトル生成手段の動作を示すフローチャートである。
以下、図7を参照して、関連文書選択手段33が関連文書を選択する動作について説明する(適宜図2参照)。図7は、図2の関連文書選択手段の動作を示すフローチャートである。
2 音声認識装置
3 関連文書選択出力装置
3a ディスプレイ
4 誤認識修正装置
4a タッチパネルディスプレイ
4b キーボード
31 文書ベクトル生成手段
32 単語ベクトル生成手段
33 関連文書選択手段
34 単語強調手段
35 修正候補出力手段
36 警告手段
37 関連文書出力手段
A オペレータ
D 文書集合
d1,d2,d3 文書
Wj 単語ベクトル
Claims (5)
- 文書が読み上げられる音声を音声認識して音声単語列を生成する音声認識装置と、当該音声認識装置における音声認識誤りの修正作業が行われる誤認識修正装置と共に用いられ、前記文書が集合した文書集合から前記音声単語列に関連する関連文書を選択して出力し、前記音声認識誤りの修正作業を支援する関連文書選択出力装置において、
前記文書集合に含まれる単語の出現頻度・逆出現頻度を予め算出し、前記文書毎に、当該単語と当該単語の出現頻度・逆出現頻度とを対応付けて前記文書の内容を示す文書ベクトルを生成する文書ベクトル生成手段と、
前記音声単語列を構成する音声単語を受信する毎に、当該音声単語が前記文書集合に出現する頻度を算出し、当該音声単語と当該音声単語の頻度とを対応付けて前記音声単語列の内容を示す単語ベクトルを生成する単語ベクトル生成手段と、
前記単語ベクトルに対する全ての前記文書ベクトルの距離を予め設定した距離尺度に基づいて算出し、前記距離が最短となる前記文書ベクトルが示す文書を前記関連文書として選択する関連文書選択手段と、
前記関連文書選択手段が選択した関連文書において、前記単語ベクトル生成手段が受信した音声単語に一致する単語を、前記関連文書に含まれる他の単語と区別して出力する関連文書出力手段と、
を備えることを特徴とする関連文書選択出力装置。 - 前記関連文書選択手段が選択した関連文書に含まれる単語が、固有名詞と数字とを予め登録した重要単語リストに含まれる場合、又は、当該単語の出現頻度・逆出現頻度が所定の閾値以上となる場合、当該単語を重要単語として強調する単語強調手段、
をさらに備えることを特徴とする請求項1に記載の関連文書選択出力装置。 - 誤って音声認識された前記音声単語の修正候補を出力する修正候補出力手段、
をさらに備えることを特徴とする請求項1又は請求項2に記載の関連文書選択出力装置。 - 前記音声単語列において、前記関連文書選択手段が選択した関連文書に含まれない単語が、所定の個数以上連続する場合、前記文書集合に前記関連文書が存在しない旨の警告を出力する警告手段、
をさらに備えることを特徴とする請求項1から請求項3のいずれか一項に記載の関連文書選択出力装置。 - 文書が読み上げられる音声を音声認識して音声単語列を生成する音声認識装置と、当該音声認識装置における音声認識誤りの修正作業が行われる誤認識修正装置と共に用いられ、前記文書が集合した文書集合から前記音声単語列に関連する関連文書を選択して出力し、前記音声認識誤りの修正作業を支援するために、コンピュータを、
前記文書集合に含まれる単語の出現頻度・逆出現頻度を予め算出し、前記文書毎に、当該単語と当該単語の出現頻度・逆出現頻度とを対応付けて前記文書の内容を示す文書ベクトルを生成する文書ベクトル生成手段、
前記音声単語列を構成する音声単語を受信する毎に、当該音声単語が前記文書集合に出現する頻度を算出し、当該音声単語と当該音声単語の頻度とを対応付けて前記音声単語列の内容を示す単語ベクトルを生成する単語ベクトル生成手段、
前記単語ベクトルに対する全ての前記文書ベクトルの距離を予め設定した距離尺度に基づいて算出し、前記距離が最短となる前記文書ベクトルが示す文書を前記関連文書として選択する関連文書選択手段、
前記関連文書選択手段が選択した関連文書において、前記単語ベクトル生成手段が受信した音声単語に一致する単語を、前記関連文書に含まれる他の単語と区別して出力する関連文書出力手段、
として機能させることを特徴とする関連文書選択出力プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008052765A JP4809857B2 (ja) | 2008-03-04 | 2008-03-04 | 関連文書選択出力装置及びそのプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008052765A JP4809857B2 (ja) | 2008-03-04 | 2008-03-04 | 関連文書選択出力装置及びそのプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009210747A true JP2009210747A (ja) | 2009-09-17 |
JP4809857B2 JP4809857B2 (ja) | 2011-11-09 |
Family
ID=41183983
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008052765A Active JP4809857B2 (ja) | 2008-03-04 | 2008-03-04 | 関連文書選択出力装置及びそのプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4809857B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012004955A1 (ja) * | 2010-07-06 | 2012-01-12 | 株式会社日立製作所 | テキスト補正方法及び認識方法 |
WO2018117094A1 (ja) * | 2016-12-20 | 2018-06-28 | 日本電信電話株式会社 | 音声認識結果リランキング装置、音声認識結果リランキング方法、プログラム |
JP2019144310A (ja) * | 2018-02-16 | 2019-08-29 | キヤノンマーケティングジャパン株式会社 | 情報処理装置、情報処理システム、制御方法、およびプログラム |
JP2019207371A (ja) * | 2018-05-30 | 2019-12-05 | ソフトバンク株式会社 | 音声認識結果の出力プログラム、通信装置及び音声認識結果の表示システム |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001092493A (ja) * | 1999-09-24 | 2001-04-06 | Alpine Electronics Inc | 音声認識修正方式 |
JP2001306090A (ja) * | 2000-04-25 | 2001-11-02 | Sharp Corp | 対話装置および方法、音声制御装置および方法、ならびにコンピュータを対話装置および音声制御装置として機能させるためのプログラムをそれぞれ記録したコンピュータ読取可能な記録媒体 |
JP2002222193A (ja) * | 2001-01-24 | 2002-08-09 | Kddi Corp | 情報自動フィルタリング方法、情報自動フィルタリングシステム及び情報自動フィルタリングプログラム |
JP2006285212A (ja) * | 2006-02-14 | 2006-10-19 | Mitsubishi Electric Information Systems Corp | オペレータ業務支援システムとしてコンピュータを機能させるためのプログラム |
JP2006331245A (ja) * | 2005-05-30 | 2006-12-07 | Nippon Telegr & Teleph Corp <Ntt> | 情報検索装置、情報検索方法およびプログラム |
-
2008
- 2008-03-04 JP JP2008052765A patent/JP4809857B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001092493A (ja) * | 1999-09-24 | 2001-04-06 | Alpine Electronics Inc | 音声認識修正方式 |
JP2001306090A (ja) * | 2000-04-25 | 2001-11-02 | Sharp Corp | 対話装置および方法、音声制御装置および方法、ならびにコンピュータを対話装置および音声制御装置として機能させるためのプログラムをそれぞれ記録したコンピュータ読取可能な記録媒体 |
JP2002222193A (ja) * | 2001-01-24 | 2002-08-09 | Kddi Corp | 情報自動フィルタリング方法、情報自動フィルタリングシステム及び情報自動フィルタリングプログラム |
JP2006331245A (ja) * | 2005-05-30 | 2006-12-07 | Nippon Telegr & Teleph Corp <Ntt> | 情報検索装置、情報検索方法およびプログラム |
JP2006285212A (ja) * | 2006-02-14 | 2006-10-19 | Mitsubishi Electric Information Systems Corp | オペレータ業務支援システムとしてコンピュータを機能させるためのプログラム |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012004955A1 (ja) * | 2010-07-06 | 2012-01-12 | 株式会社日立製作所 | テキスト補正方法及び認識方法 |
WO2018117094A1 (ja) * | 2016-12-20 | 2018-06-28 | 日本電信電話株式会社 | 音声認識結果リランキング装置、音声認識結果リランキング方法、プログラム |
JPWO2018117094A1 (ja) * | 2016-12-20 | 2019-10-24 | 日本電信電話株式会社 | 音声認識結果リランキング装置、音声認識結果リランキング方法、プログラム |
JP2019144310A (ja) * | 2018-02-16 | 2019-08-29 | キヤノンマーケティングジャパン株式会社 | 情報処理装置、情報処理システム、制御方法、およびプログラム |
JP7231806B2 (ja) | 2018-02-16 | 2023-03-02 | キヤノンマーケティングジャパン株式会社 | 情報処理装置、情報処理システム、制御方法、およびプログラム |
JP2019207371A (ja) * | 2018-05-30 | 2019-12-05 | ソフトバンク株式会社 | 音声認識結果の出力プログラム、通信装置及び音声認識結果の表示システム |
Also Published As
Publication number | Publication date |
---|---|
JP4809857B2 (ja) | 2011-11-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111968649B (zh) | 一种字幕纠正方法、字幕显示方法、装置、设备及介质 | |
JP6251958B2 (ja) | 発話解析装置、音声対話制御装置、方法、及びプログラム | |
US9236045B2 (en) | Methods and apparatus for proofing of a text input | |
US20160055763A1 (en) | Electronic apparatus, pronunciation learning support method, and program storage medium | |
CN109791761B (zh) | 使用校正的术语的声学模型训练 | |
JP2011002656A (ja) | 音声認識結果修正候補検出装置、音声書き起こし支援装置、方法及びプログラム | |
US8688725B2 (en) | Search apparatus, search method, and program | |
JP2006178087A (ja) | 字幕生成装置、検索装置、文書処理と音声処理とを融合する方法、及びプログラム | |
JP2008134475A (ja) | 入力された音声のアクセントを認識する技術 | |
US20130191125A1 (en) | Transcription supporting system and transcription supporting method | |
US9460718B2 (en) | Text generator, text generating method, and computer program product | |
JP2006267319A (ja) | 音声書き起こし支援装置及びその方法ならびに修正箇所決定装置 | |
CN112382295B (zh) | 语音识别方法、装置、设备及可读存储介质 | |
JP4809857B2 (ja) | 関連文書選択出力装置及びそのプログラム | |
JP2008243080A (ja) | 音声を翻訳する装置、方法およびプログラム | |
JP4738847B2 (ja) | データ検索装置および方法 | |
JP5396530B2 (ja) | 音声認識装置および音声認識方法 | |
JP2019020597A (ja) | エンドツーエンド日本語音声認識モデル学習装置およびプログラム | |
JP5160594B2 (ja) | 音声認識装置および音声認識方法 | |
JP2011008784A (ja) | ローマ字変換を用いる日本語自動推薦システムおよび方法 | |
US20130080174A1 (en) | Retrieving device, retrieving method, and computer program product | |
JP2015045689A (ja) | 音声認識システムについての音声認識結果を評価する方法、並びに、そのコンピュータ及びコンピュータ・プログラム | |
JP2009009307A (ja) | 文書画像処理装置及びその方法 | |
JP5696638B2 (ja) | 対話制御装置、対話制御方法及び対話制御用コンピュータプログラム | |
JP2002140094A (ja) | 音声認識装置、音声認識方法および音声認識プログラムを記録したコンピュータ読取可能な記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100310 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110610 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110726 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110819 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140826 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4809857 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |