JP6347939B2 - 発話内重要語抽出装置とその装置を用いた発話内重要語抽出システムと、それらの方法とプログラム - Google Patents

発話内重要語抽出装置とその装置を用いた発話内重要語抽出システムと、それらの方法とプログラム Download PDF

Info

Publication number
JP6347939B2
JP6347939B2 JP2013239472A JP2013239472A JP6347939B2 JP 6347939 B2 JP6347939 B2 JP 6347939B2 JP 2013239472 A JP2013239472 A JP 2013239472A JP 2013239472 A JP2013239472 A JP 2013239472A JP 6347939 B2 JP6347939 B2 JP 6347939B2
Authority
JP
Japan
Prior art keywords
word
keyword
utterance
voice
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013239472A
Other languages
English (en)
Other versions
JP2015099290A (ja
Inventor
吉田 明弘
明弘 吉田
裕司 青野
裕司 青野
石原 晋也
晋也 石原
豊 國田
豊 國田
義男 神田
義男 神田
野村 英司
英司 野村
雄二 大石
雄二 大石
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Nippon Telegraph and Telephone East Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Nippon Telegraph and Telephone East Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp, Nippon Telegraph and Telephone East Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2013239472A priority Critical patent/JP6347939B2/ja
Publication of JP2015099290A publication Critical patent/JP2015099290A/ja
Application granted granted Critical
Publication of JP6347939B2 publication Critical patent/JP6347939B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Description

本発明は、発話内の重要語を抽出する発話内重要語抽出装置と、当該装置を用いた発話内重要語抽出システムと、それらの方法とプログラムに関する。
我々は、生活の中で声を発声して他者との間でコミュニケーションを取っている。その発声には、様々な発話情報が含まれており、その発話情報の中から重要と思われる単語を効率よく抽出することで、ライフログのような個人活動履歴や備忘録の作成などが可能だと考えられる。
利用者の利便性を考慮すると、履歴を残すために、その都度発話するのではなく、常時音声を録音しておき、普段の無意識の生活の中で発せられる発話情報から、情報が得られる方法が好ましい。その発話情報から得られた重要と思われる単語を用いた個人活動履歴や備忘録は、有用な記録になると考えられる。
従来、発話内容から重要語を抽出する方法としては、予め重要語を登録したキーワードリストを用いてキーワードと一致する認識結果を重要語として抽出する方法が知られている(例えば特許文献1)。
特開2008−286921号公報
しかし、重要語とすべき単語は利用者ごとに違うと考えられるので、従来の方法では利用者ごとにキーワードリストを作成しなくてはならない課題がある。また、各利用者の関心の対象は、日々の生活の中で変化するのが一般的であると考えられるため、関心の対象に直結するキーワードのメンテナンスを日々行う必要がある。しかし、キーワードリストを日々メンテナンスするのは現実的ではない。また、普段の会話の対話音声の発話速度は速く、不明瞭な発音をすることも多いため、誤認識した単語を重要語として誤って抽出しまう場合もある。
本発明は、このような課題に鑑みてなされたものであり、キーワードリストを自動的に最新化すると共に、誤認識した単語を重要語として抽出するリスクを低減させた発話内重要語抽出装置と、その装置を用いた発話内重要語抽出システムとそれらの方法とプログラムを提供することを目的とする。
本発明の発話内重要語抽出装置は、キーワードリストと、テキスト入力部と、形態素解析部と、単語登録部と、音声入力部と、音声認識部と、重要語抽出部と、を具備する。キーワードリストにはキーワードが登録される。テキスト入力部は、テキスト情報が入力される。形態素解析部は、テキスト入力部に入力されたテキスト情報を形態素解析して形態素に分割した単語と品詞の情報から成る形態素列を出力する。単語登録部は、形態素解析部が出力する形態素列を入力として、所定の条件を満たす単語を、キーワードとしてキーワードリストに登録する。音声入力部は、音声情報が入力される。音声認識部は、音声入力部に入力された音声情報を音声認識処理して形態素に分割した単語列から成るテキスト文を生成して出力する。重要語抽出部は、音声認識部が出力するテキスト文を入力として、キーワードリストに登録されたキーワードの何れかと一致する単語を重要語として抽出する。
また、この発明の発話内重要語抽出システムは、音声入力端末と、発話内重要語抽出装置と、ネットワークと、認識単語抽出サーバと、を具備する。音声入力端末は、マイクロホンで収音した音声信号を発話内重要語抽出装置に出力する。発話内重要語抽出装置は、入力されるテキスト情報から得た所定の条件を満たす単語をキーワードとして登録すると共に、音声入力端末が出力する音声信号を音声ファイルとして録音した音声ファイルから人が発声した音声部分のみを切り出した音声区間の音声信号とその発声開始時刻情報をネットワークを介して認識単語抽出サーバに送信し、当該認識単語抽出サーバから受信したキーワードと一致する認識単語情報の単語を、重要語として抽出して出力する。認識単語抽出サーバは、発話内重要語抽出装置から音声区間の音声信号と発声開始時刻情報とを受信し、音声区間の音声信号を音声認識処理して形態素に分割した単語列から成るテキスト文を生成し、当該テキスト文を構成する単語を認識単語情報として発話内重要語抽出装置に出力する。
本発明の発話内重要語抽出装置によれば、重要語を特定するキーワードリストは、利用者が入力するテキスト情報から自動的に作成されるので、キーワードリストを作成する手間を省力化する効果を奏する。また、利用者が入力するテキスト情報は、利用者の関心の対象そのものを表現する場合が多く、その誤入力も少ないと考えられるので、そのテキスト情報からキーワードを得るこの発明の方法は重要語を精度良く抽出することができる。
また、本発明の発話内重要語抽出システムによれば、比較的に処理の重い音声認識処理を、ネットワークを介した認識単語抽出サーバに分担させるので、発話内重要語抽出装置の構成を簡単にすることができる。その結果、発話内重要語抽出装置を安価にすると共に小型化することができる。
本発明の発話内重要語抽出装置100の機能構成例を示す図。 発話内重要語抽出装置100の動作フローを示す図であり、(a)はテキスト入力後の処理、(b)は音声入力後の処理を示す。 テキスト入力部110の機能構成例を示す図。 キーワードリスト140の一例を示す図。 本発明の発話内重要語抽出システム200のシステム構成を示す図。 発話内重要語抽出システム200の動作シーケンスを示す図。 本発明の発話内重要語抽出システム300のシステム構成を示す図。 発話内重要語抽出装置320の外観とその利用場面の一例を示す図。
以下、この発明の実施の形態を図面を参照して説明する。複数の図面中同一のものには同じ参照符号を付し、説明は繰り返さない。
図1に、この発明の発話内重要語抽出装置100の機能構成例を示す。その動作フローを図2に示す。発話内重要語抽出装置100は、キーワードリスト140と、テキスト入力部110と、形態素解析部120と、単語登録部130と、音声入力部150と、音声認識部160と、重要語抽出部170と、制御部180と、を具備する。発話内重要語抽出装置100は、例えばROM、RAM、CPU等で構成されるコンピュータに所定のプログラムが読み込まれて、CPUがそのプログラムを実行することで実現されるものである。以降で説明する他の実施例についても同様である。
キーワードリスト140には、キーワードが登録される。テキスト入力部110には、テキスト情報が入力される。図3に、テキスト入力部110の機能構成例を示す。テキスト入力部110は、キーボード111と、タブレット112と、キーボードインターフェース113と、タブレットインターフェース114と、制御部180と、キャッシュメモリ116と、を具備する。キーボード111、タブレット112、キーボードインターフェース113、タブレットインターフェース114、は一般的なものである。制御部180も、発話内重要語抽出装置100を例えばコンピュータで構成した場合にCPUとRAMとROMで構成される一般的なものである。制御部180は、発話内重要語抽出装置100の各部の時系列動作等を制御するものであり、その一部の機能として、キーボード111から入力された情報に基づいて図示しないウェブブラウザを起動したニュースの閲覧や、情報を検索する等の動作を制御してテキスト情報を出力するテキスト入力部110の機能を分担する。キャッシュメモリ116は、ウェブブラウザの一時ファイルである。
テキスト入力部110が出力するテキスト情報には、キャッシュメモリ116に一時的に記録されたテキストや、ブログやマイクロブログで利用者が投稿したテキストが含まれる。テキスト情報の具体例としては、例えば、キャッシュメモリ116に一時記録されたウェブ画面のタイトル文である。タイトル文は、HTMLのタイトルタグが付与されたテキストを取り出せば容易に抽出することができる。例えば、ブラウザソフトの検索キーワードとして「日本代表」を入力して検索された記事のHTMLソース内に「<title>香川、イラク戦不発の「次は別」</title>」があったとする。この<title></title>がタイトルタグであり、タイトルタグで囲まれた文がタイトル文である。
タイトル文以外の、検索キーワードや記事の全文をテキスト情報として扱っても良い。テキスト情報は、発話内重要語抽出装置100を構成するコンピュータの例えばRAM等の記憶部に記憶される。
テキスト入力部110のキーボード111又はタブレット112からテキスト情報が入力されると、形態素解析部120は、テキスト入力部110が出力するテキスト情報を形態素解析して形態素に分割した単語と品詞の情報から成る形態素列を出力する(ステップS120)。このテキスト入力部110にテキスト情報が入力されたか否かの判断は、制御部180が行う(ステップS180のYes)。
単語登録部130は、形態素解析部120が出力する形態素列を入力として、所定の条件を満たす単語を、キーワードとしてキーワードリスト140に登録する(ステップS132)。所定の条件とは、例えば品詞情報のことである。単語登録部130は、所定の条件に従って、例えば固有名詞等の名詞や動詞の品詞情報を持つ単語のみをキーワードとする。
単語登録部130は、形態素解析部120が出力する品詞の情報が、所定の条件に合致しない単語はキーワードとして登録しない(ステップS131のNo)。この形態素解析部120と単語登録部130の処理は、テキスト入力部110にテキスト情報が入力される度に、そのテキスト情報が終了するまで繰り返される(ステップS181のNo)。
図4に、キーワードリスト140に登録されたキーワードの一例を示す。キーワードリスト140には、最低限必要な情報として例えば「渋谷」や「初台」等の単語のみのキーワードを表す単語が登録されれば良い。それらの単語に加えて、図4の1列目に示すようにキーワードを識別する識別子(ID)を付与しても良い。また、そのキーワードを登録した「登録契機」、「登録日時」、「最終利用日時」、なども登録するようにしても良い。ここで「登録契機」とは、キーワードの種別を表す情報である。「初期登録」は、発話内重要語抽出装置100が予め持つキーワードであり、消去されないものである。「テキスト入力」は、ある日時のブログやマイクロブログ、テキストメモなどで利用者が入力したテキスト情報から登録されたキーワードであり、所定時間経過後に消去しても良いものである。「Web閲覧」は、利用者がインターネットをブラウジングして取得したテキスト情報から抽出したキーワードの種別である。
キーワードは、「登録日時」又は「最終利用日時」を基準に計時した所定時間経過後にリセットするようにしても良い。キーワードをリセットする場合、発話内重要語抽出装置100は、図1に破線で示すキーワードリストリセット部190を具備する。
キーワードリストリセット部190は、例えば「最終利用日時」から所定時間の経過を計時した後に、キーワードを個別にリセットする。ここで所定時間の経過は、例えば、24時間、2日、3日、一週間後など、複数の期間が考えられ、例えば「登録契機」の情報に対応させて、その種別に応じて期間を変えても良い。
又は、例えば利用者からのテキスト情報を入力する操作入力に連動させた外部から入力されるリセット信号によって、キーワードリスト140をリセットするようにしても良い。この場合の所定時間は、利用者が操作する間隔であり不定期な時間となる。又は、キーワードリストリセット部190を、所定の時間周期でリセット信号を出力するように構成しても良い。この場合は、所定の時間間隔でキーワードリスト140に登録されたキーワードが全部一度に消去される。このような所定時間でキーワードリスト140をリセットすることで、最新の重要語で構成されるキーワードリスト140を保持し続けることができる。
音声入力部150に音声情報が入力されると(ステップS183のYes)、音声認識部160はその音声情報を音声認識処理して形態素に分割した単語列から成るテキスト文を生成して出力する(ステップS160)。音声入力部150に入力される音声情報は、例えばサンプリング周波数16kHzで離散的なディジタル信号に変換された音声信号に変換される。音声認識部160は、離散値化された音声信号の所定数(例えば320個)を1フレームとしたフレーム毎に、例えばメル周波数ケプストラム係数(MFCC)分析によって音響特徴量を求め、音響尤度と言語尤度の最も高い形態素に分割した単語列から成るテキスト文を生成して出力する。また、テキスト文と同時に単語毎の信頼度を出力してもよく、信頼度はNベスト候補における単語の事後確率に基づいて求める方法、例えば参考文献1(Frank Wessel , Ralf Schluter , Klaus Macherey and Hermann Ney, “Confidence Measures for Large Vocabulary Continuous Speech Recognition”,IEEE Transactions on Speech and Audio Processing,Vol.9,No.3,March 2001.)などを用いれば良い。
重要語抽出部170は、音声認識部160が出力するテキスト文を入力として、キーワードと一致する単語を重要語として抽出する(ステップS172)。また、ここで音声認識部160が出力する信頼度を利用し、キーワードと一致する単語であり、ある閾値以上の信頼度を持った認識単語のみを重要語として抽出しても良い。この音声認識部160と重要語抽出部170の処理は、音声入力部150に音声情報が入力される度に、その音声情報が終了するまで繰り返される(ステップS182のNo)。
以上説明したように発話内重要語抽出装置100は、テキスト入力部に入力したテキスト情報に含まれる単語や、若しくはそのテキスト情報を元にインターネットをブラウジングして取得したテキスト情報に含まれる単語などを、キーワードとしてキーワードリスト140に登録することができ、音声入力部150に入力される音声情報に含まれるキーワードリストに登録されたキーワードの何れかと一致する単語を、重要語として抽出する。
発話内重要語抽出装置100によれば、音声情報から重要語を抽出するので、ライフログのような個人活動履歴や備忘録の作成を容易にする効果を奏する。また、キーワードを特定するキーワードリストを、テキスト入力部に入力されるテキスト情報から自動的に作成するので、キーワードリストを作成する手間を省力化することができる。また、利用者が入力するテキスト情報は、利用者の関心の対象そのものを表現する場合が多く、その入力誤りも少ないと考えられるので、重要語を精度良く抽出することが可能である。
なお、上記した実施例では、キーワードとしてキーワードリスト140に登録する単語の品詞を「名詞」や「動詞」とする例で説明を行ったが、この例に限定されない。例えば2種類以上の品詞が連結する単語列をキーワードとして登録するようにしても良い。例えば「名詞」と「接尾辞」の連続する単語列や、3個以上の単語の連結を、キーワードとして登録して、重要語を抽出するようにしても良い。キーワードを構成する品詞の組み合わせを増やすことで、重要語をより限定して特定することができる。
〔発話内重要語抽出システム〕
図5に、この発明の発話内重要語抽出装置220を含む発話内重要語抽出システム200のシステム構成を示す。発話内重要語抽出システム200は、音声入力端末210と、発話内重要語抽出装置220と、ネットワーク240と、認識単語抽出サーバ250と、を具備する。図6も参照して発話内重要語抽出システム200の動作を説明する。
音声入力端末210は、図示しないマイクロホンで収音(ステップS210)した音声信号を発話内重要語抽出装置220に出力する(ステップS211)。マイクロホンは、常時、利用者が発声する音声を記録するために、例えば利用者の胸元に装着可能な小型なものが好ましい。マイクロホンと音声入力端末とは一体で構成しても良い。その形態は、例えばネクタイピンのようなものであっても良い。
音声信号は、上記したように、例えばサンプリング周波数16kHzで離散的なディジタル信号に変換された信号であり、有線または無線で発話内重要語抽出装置220に出力される。無線の場合は、無線PAN(Personal Area Network)と称される10mくらいまでの距離をカバーする近距離無線技術である例えばBluetooth(登録商標)や無線LANを用いることができる。
〔発話内重要語抽出装置〕
発話内重要語抽出装置220は、入力されるテキスト情報から得た所定の条件を満たす単語をキーワードとして登録すると共に、音声入力端末210が出力する音声信号を音声ファイルとして録音した音声ファイルから人が発声した音声部分のみを切り出した音声区間の音声信号とその発声開始時刻情報をネットワーク240を介して認識単語抽出サーバ250に送信し、当該認識単語抽出サーバ250から受信したキーワードと一致する認識単語情報の単語を、重要語として抽出して出力する。ここで音声区間の抽出は、例えば参考文献2(特開2012−48119号公報)に記載された方法を用いることができる。
図5を参照して発話内重要語抽出装置220の動作を更に詳しく説明する。発話内重要語抽出装置220は、テキスト入力部221と、形態素解析部222と、単語登録部223と、キーワードリスト224と、音声録音部225と、音声区間抽出部226と、音声送出部227と、認識単語情報受信部228と、重要語抽出部229と、重要語表示部230と、を具備する。
テキスト入力部221は、テキスト情報が入力される(ステップS221)。形態素解析部222は、テキスト入力部221に入力されるテキスト情報を形態素解析して形態素に分割した単語と品詞の情報から成る形態素列を出力する(ステップS222)。単語登録部223は、形態素解析部222が出力する形態素列を入力として、所定の条件を満たす単語を、キーワードとしてキーワードリストに登録する(ステップS223)。
音声録音部225は、音声入力端末210から送られて来る音声信号を音声ファイルとして録音する(ステップS225)。この時、音声信号の録音が開始された時刻である録音開始時刻も記録される。音声信号と録音開始時刻は発話内重要語抽出装置220を構成するコンピュータの例えばRAM等の記憶部に記憶される。
音声区間抽出部226は、音声録音部225が録音した音声ファイルから人が発声した音声部分のみを切り出した音声ファイルを作成し、音声送出部227に当該音声ファイルを出力する(ステップS226)。この時に、切り出した音声ファイルの発声開始時刻情報も音声送出部227に出力する。発声開始時刻情報は、音声信号の録音開始時刻と切り出し音声の音声信号録音開始時刻からの経過時間から得られる。つまり、発声開始時刻情報は、音声信号の録音開始時刻に、切り出し音声の音声信号録音開始時刻からの経過時間を加算することで得られる。音声部分のみを切り出す方法は、上記したように周知である。
音声送出部227は、音声区間抽出部226が抽出した音声区間の音声信号と発声開始時刻情報をネットワーク240を介して認識単語抽出サーバ250に送信する(ステップS227)。認識単語情報受信部228は、認識単語抽出サーバ250からネットワーク240を介して送られて来る認識単語情報を受信する(ステップS228)。この認識単語情報は、音声認識部160(図1)が出力するテキスト文と同じものである。
重要語抽出部229は、認識単語情報受信部228で受信した認識単語情報を入力として、キーワードリスト224に登録されたキーワードと一致する単語を重要語として抽出する(ステップS229)。重要語表示部230は、重要語抽出部229が抽出した重要語を表示する(ステップS230)。重要語の表示は、発話内重要語抽出装置220が備える図示しない液晶パネル等の表示手段によって表示される。
発話内重要語抽出装置220の、テキスト入力部221、形態素解析部222、単語登録部223、キーワードリスト224、音声録音部225、音声区間抽出部226、重要語抽出部229、の各部は、装置としては別の装置であるので参照符号を変えているが、発話内重要語抽出装置100(図1)で説明した同一名称の各機能部と同じものである。
〔認識単語抽出サーバ〕
認識単語抽出サーバ250は、図5に示すように、音声受信部251と、音声認識部252と、認識単語情報送信部253と、を具備する。音声受信部251は、発話内重要語抽出装置220からネットワーク240を介して送信されて来る音声信号と発声開始時刻情報とを受信する(ステップS251)。
音声認識部252は、音声受信部251で受信した音声信号を、音声認識処理して形態素に分割した単語列の情報から成るテキスト文を生成して出力する(ステップS252)。認識単語情報送信部253は、音声認識部252が出力するテキスト文と、音声受信部251で受信した発声開始時刻情報とをネットワーク240を介して発話内重要語抽出装置220に出力する(ステップS253)。
以上説明した発話内重要語抽出システム200によれば、比較的に処理の重い音声認識処理を、認識単語抽出サーバ250に分担させるので、発話内重要語抽出装置100と同じ効果を奏する発話内重要語抽出装置220の構成を簡単にすることができる。また、認識単語抽出サーバ250の機能を実現するコンピュータのCPUパワーを高めることで、発話内重要語抽出装置100で行う音声認識性能よりも高速・高精度な音声認識処理を行う事も可能である。
図7に、この発明の発話内重要語抽出システム300のシステム構成を示す。発話内重要語抽出システム300は、発話内重要語抽出システム200に対して発話内重要語抽出装置320の構成のみが異なる。
発話内重要語抽出装置320は、発話内重要語抽出装置220(図5)に対して行動履歴表示部321を備える点で異なる。行動履歴表示部321は、重要語抽出部229が抽出した重要語と、その重要語が抽出された時間帯とを組とした行動履歴を表示する。行動履歴は、発話内重要語抽出装置320が備える図示しない液晶パネル等の表示手段によって表示される。
図8に、音声入力端末210と発話内重要語抽出装置320の外観とその利用場面の一例を示す。音声入力端末210は上記した例のネクタイピン型である。発話内重要語抽出装置320の表示手段に、重要語とその重要語が抽出された時間帯とが、時間帯別に表示されている。このように重要語と時間帯が表示されることで利用者は、一日の行動履歴を確認することができる。
また、利用者が表示手段の重要語又は時間帯を指先でタップすることで、音声録音部225が録音したその時間帯の音声を、図示を省略しているスピーカで再生するようにしても良い。行動履歴に対応する音声を再生する場合、発話内重要語抽出装置320は、更に、行動履歴選択入力部322と、録音データ選択再生部323と、を備える。行動履歴選択入力部322は、利用者が行動履歴を選択する指先が表示手段にタップする入力に対応して、重要語又は時間帯に対応した信号を録音データ選択再生部323に出力する。
録音データ選択再生部323は、音声録音部225が録音した音声ファイルを、行動履歴選択入力部322が出力する重要語又は時間帯に対応した信号に基づいて読み出してスピーカで再生する。重要語又は時間帯に対応する音声ファイルを、音声として聴取可能にすることで、利用者は行動履歴を詳細に振り返ることができる。
以上説明したこの発明の発話内重要語抽出装置とその装置を用いた発話内重要語抽出システムは、利用者が発話内重要語抽出装置に入力するテキスト情報は利用者の関心の対象そのものであり、そのテキスト情報に関連する単語をキーワードとして登録し、そのキーワードと一致する単語を重要語として抽出する。この方法によれば、キーワードリストを自動的に最新化できるのでそのメンテナンスコストを不要にすることができる。また、利用者が入力するテキスト情報には、ほとんど誤りが含まれないと考えられるので、重要語を精度良く抽出することが可能である。
このように優れた効果を奏する本願発明の発話内重要語抽出装置は、ライフログのような個人活動履歴や備忘録の作成が可能であり、利用者に高い利便性を提供することができる。
上記装置における処理手段をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、各装置における処理手段がコンピュータ上で実現される。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記録装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
また、各手段は、コンピュータ上で所定のプログラムを実行させることにより構成することにしてもよいし、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

Claims (9)

  1. キーワードと、上記キーワードの登録日時と上記キーワードの最終利用日時のうちの少なくとも何れか一つの日時を登録したキーワードリストと、
    上記登録日時と上記最終利用日時のうちの何れかの日時を基準とし、所定の時間周期で各キーワードを個別にリセットするキーワードリストリセット部と、
    テキスト情報が入力されるテキスト入力部と、
    上記テキスト情報を形態素解析して形態素に分割した単語と品詞の情報から成る形態素列を出力する形態素解析部と、
    上記形態素列を入力として、所定の条件を満たす単語を、上記キーワードとして上記キーワードリストに登録する単語登録部と、
    音声情報が入力される音声入力部と、
    上記音声情報を音声認識処理して形態素に分割した単語列から成るテキスト文を生成して出力する音声認識部と、
    上記テキスト文を入力として、上記キーワードリストに登録された上記キーワードの何れかと一致する単語を重要語として抽出する重要語抽出部と、
    を具備する発話内重要語抽出装置。
  2. キーワードと、上記キーワードの登録契機と、上記キーワードの登録日時と上記キーワードの最終利用日時のうちの少なくとも何れか一つの日時を登録したキーワードリストを含み、
    上記登録契機の種別として、利用者が入力したテキスト情報から登録されたキーワードであることを示すテキスト入力と利用者がインターネットをブラウジングして取得したテキスト情報から抽出されたキーワードであることを示すWeb閲覧のうちの少なくとも何れか一つと、本装置が予め持つキーワードであることを示す初期登録を含み、
    上記登録日時と上記最終利用日時のうちの何れかの日時を基準とし、各キーワードに対して登録契機の種別に応じて定めた各所定時間の経過後に、各キーワードを個別にリセットするキーワードリストリセット部と、
    テキスト情報が入力されるテキスト入力部と、
    上記テキスト情報を形態素解析して形態素に分割した単語と品詞の情報から成る形態素列を出力する形態素解析部と、
    上記形態素列を入力として、所定の条件を満たす単語を、上記キーワードとして上記キーワードリストに登録する単語登録部と、
    音声情報が入力される音声入力部と、
    上記音声情報を音声認識処理して形態素に分割した単語列から成るテキスト文を生成して出力する音声認識部と、
    上記テキスト文を入力として、上記キーワードリストに登録された上記キーワードの何れかと一致する単語を重要語として抽出する重要語抽出部と、
    を具備する発話内重要語抽出装置。
  3. 音声入力端末と、
    上記音声入力端末と接続する発話内重要語抽出装置と、
    ネットワークと、
    上記ネットワークを介して上記発話内重要語抽出装置と通信を行う認識単語抽出サーバと、
    を具備する発話内重要語抽出システムであって、
    上記音声入力端末は、マイクロホンで収音した音声信号を上記発話内重要語抽出装置に出力するものであり、
    上記発話内重要語抽出装置は、入力されるテキスト情報から得た所定の条件を満たす単語をキーワードとして登録すると共に、上記音声信号を音声ファイルとして録音した音声ファイルから人が発声した音声部分のみを切り出した音声区間の音声信号とその発声開始時刻情報を上記ネットワークを介して上記認識単語抽出サーバに送信し、当該認識単語抽出サーバから受信した上記キーワードと一致する認識単語情報の単語を、重要語として抽出して出力し、上記重要語と、当該重要語が抽出された時間帯とを組とした行動履歴を表示し、利用者が上記重要語または上記時間帯を指定した場合に、該当する時間帯の音声を再生するものであり、
    上記認識単語抽出サーバは、上記発話内重要語抽出装置から音声区間の音声信号と発声開始時刻情報とを受信し、上記音声区間の音声信号を音声認識処理して形態素に分割した単語列から成るテキスト文を生成し、当該テキスト文を構成する単語を上記認識単語情報として上記発話内重要語抽出装置に出力するものである、
    ことを特徴とする発話内重要語抽出システム。
  4. 請求項3に記載した発話内重要語抽出システムで用いられる発話内重要語抽出装置であって、
    さらに、
    上記キーワードを登録したキーワードリストと、
    上記音声入力端末から送られて来る上記音声信号を録音する音声録音部と、
    上記音声録音部に録音された上記音声ファイルから人が発声した音声部分のみを切り出した上記音声区間の音声信号を抽出し、当該音声区間にその開始時刻を表す上記発声開始時刻情報を付与する音声区間抽出部と、
    上記音声区間抽出部で抽出した上記音声区間の音声信号と上記発声開始時刻情報を上記ネットワークを介して上記認識単語抽出サーバに送信する音声送出部と、
    上記テキスト情報が入力されるテキスト入力部と、
    上記テキスト情報を形態素解析して形態素に分割した単語と品詞の情報から成る形態素列を出力する形態素解析部と、
    上記形態素列を入力として、所定の条件を満たす単語を、上記キーワードとして上記キーワードリストに登録する単語登録部と、
    上記認識単語抽出サーバから上記ネットワークを介して送られてくる上記認識単語情報を受信する認識単語情報受信部と、
    上記認識単語情報受信部で受信した上記認識単語情報を入力として、上記キーワードリストに登録された上記キーワードの何れかと一致する単語を上記重要語として抽出する重要語抽出部と、
    を具備する発話内重要語抽出装置。
  5. 請求項1又は2に記載した発話内重要語抽出装置において、
    更に、
    上記重要語と、当該重要語が抽出された時間帯とを組とした行動履歴を表示する行動履歴表示部を、備えることを特徴とする発話内重要語抽出装置。
  6. キーワードリストを含む発話内重要語抽出装置が実行する発話内重要語抽出方法であって、
    上記キーワードリストは、キーワードと、上記キーワードの登録日時と上記キーワードの最終利用日時のうちの少なくとも何れか一つの日時を登録したものであり、
    上記登録日時と上記最終利用日時のうちの何れかの日時を基準とし、所定の時間周期で各キーワードを個別にリセットするキーワードリストリセット過程と、
    テキスト情報が入力されるテキスト入力過程と、
    上記テキスト情報を形態素解析して形態素に分割した単語と品詞の情報から成る形態素列を出力する形態素解析過程と、
    上記形態素列を入力として、所定の条件を満たす単語を、上記キーワードとして上記キーワードリストに登録する単語登録過程と、
    音声情報が入力される音声入力過程と、
    上記音声情報を音声認識処理して形態素に分割した単語列から成るテキスト文を生成して出力する音声認識過程と、
    上記テキスト文を入力として、上記キーワードリストに登録された上記キーワードの何れかと一致する単語を重要語として抽出する重要語抽出過程と、
    を備える発話内重要語抽出方法。
  7. キーワードリストを含む発話内重要語抽出装置が実行する発話内重要語抽出方法であって、
    上記キーワードリストは、キーワードと、上記キーワードの登録契機と、上記キーワードの登録日時と上記キーワードの最終利用日時のうちの少なくとも何れか一つの日時を登録したものであり、
    上記登録契機の種別として、利用者が入力したテキスト情報から登録されたキーワードであることを示すテキスト入力と利用者がインターネットをブラウジングして取得したテキスト情報から抽出されたキーワードであることを示すWeb閲覧のうちの少なくとも何れか一つと、前記発話内重要語抽出装置が予め持つキーワードであることを示す初期登録を含み、
    上記登録日時と上記最終利用日時のうちの何れかの日時を基準とし、各キーワードに対して登録契機の種別に応じて定めた各所定時間の経過後に、各キーワードを個別にリセットするキーワードリストリセット過程と、
    テキスト情報が入力されるテキスト入力過程と、
    上記テキスト情報を形態素解析して形態素に分割した単語と品詞の情報から成る形態素列を出力する形態素解析過程と、
    上記形態素列を入力として、所定の条件を満たす単語を、上記キーワードとして上記キーワードリストに登録する単語登録過程と、
    音声情報が入力される音声入力過程と、
    上記音声情報を音声認識処理して形態素に分割した単語列から成るテキスト文を生成して出力する音声認識過程と、
    上記テキスト文を入力として、上記キーワードリストに登録された上記キーワードの何れかと一致する単語を重要語として抽出する重要語抽出過程と、
    を備える発話内重要語抽出方法。
  8. 音声入力端末が、マイクロホンで収音した音声信号を発話内重要語抽出装置に出力する音声信号出力過程を実行し、
    上記発話内重要語抽出装置が、上記音声信号を音声ファイルとして録音し、録音された音声ファイルから人が発声した音声部分のみを切り出した音声区間の音声信号とその発声開始時刻情報を、ネットワークを介して認識単語抽出サーバに送信する音声送出過程を実行し、
    上記認識単語抽出サーバが、上記発話内重要語抽出装置から上記音声区間の音声信号と上記発声開始時刻情報とを受信し、上記音声区間の音声信号を音声認識処理して形態素に分割した単語列から成るテキスト文を生成し、当該テキスト文を構成する単語を認識単語情報として上記発話内重要語抽出装置に出力する認識単語情報送信過程を実行し、
    上記発話内重要語抽出装置が、テキスト入力部に入力されたテキスト情報から得たキーワードを登録し、当該キーワードと一致する上記認識単語抽出サーバから受信した上記認識単語情報の単語を重要語として抽出して出力する重要語抽出過程と、
    上記重要語と、当該重要語が抽出された時間帯とを組とした行動履歴を表示する行動履歴表示過程と、
    利用者が上記重要語または上記時間帯を指定した場合に、該当する時間帯の音声を再生する音声再生過程を実行する
    発話内重要語抽出システムの方法。
  9. 請求項1,2,4,5の何れかに記載した発話内重要語抽出装置としてコンピュータを機能させるためのプログラム。
JP2013239472A 2013-11-20 2013-11-20 発話内重要語抽出装置とその装置を用いた発話内重要語抽出システムと、それらの方法とプログラム Active JP6347939B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013239472A JP6347939B2 (ja) 2013-11-20 2013-11-20 発話内重要語抽出装置とその装置を用いた発話内重要語抽出システムと、それらの方法とプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013239472A JP6347939B2 (ja) 2013-11-20 2013-11-20 発話内重要語抽出装置とその装置を用いた発話内重要語抽出システムと、それらの方法とプログラム

Publications (2)

Publication Number Publication Date
JP2015099290A JP2015099290A (ja) 2015-05-28
JP6347939B2 true JP6347939B2 (ja) 2018-06-27

Family

ID=53375932

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013239472A Active JP6347939B2 (ja) 2013-11-20 2013-11-20 発話内重要語抽出装置とその装置を用いた発話内重要語抽出システムと、それらの方法とプログラム

Country Status (1)

Country Link
JP (1) JP6347939B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018061824A1 (ja) 2016-09-29 2018-04-05 日本電気株式会社 情報処理装置、情報処理方法およびプログラム記録媒体
JP6640279B2 (ja) * 2018-05-30 2020-02-05 ソフトバンク株式会社 音声認識結果の出力プログラム、通信装置及び音声認識結果の表示システム
CN110515846B (zh) * 2019-08-20 2023-04-28 上海云扩信息科技有限公司 一种关于用户体验测试的数据自动化处理分析系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4114509B2 (ja) * 2003-03-05 2008-07-09 セイコーエプソン株式会社 情報提示方法および情報提示システムならびに情報提示処理プログラム
JP2008287517A (ja) * 2007-05-17 2008-11-27 National Institute Of Information & Communication Technology 強調表示装置及びプログラム
JP5329610B2 (ja) * 2011-07-22 2013-10-30 みずほ情報総研株式会社 説明支援システム、説明支援方法及び説明支援プログラム
JP2013117879A (ja) * 2011-12-02 2013-06-13 Hitachi Ltd 資料表示及び音声再現システム

Also Published As

Publication number Publication date
JP2015099290A (ja) 2015-05-28

Similar Documents

Publication Publication Date Title
US9947313B2 (en) Method for substantial ongoing cumulative voice recognition error reduction
KR102196400B1 (ko) 핫워드 적합성을 결정하는 방법 및 장치
US11037553B2 (en) Learning-type interactive device
JP5042799B2 (ja) 音声チャットシステム、情報処理装置およびプログラム
US8036894B2 (en) Multi-unit approach to text-to-speech synthesis
US8170866B2 (en) System and method for increasing accuracy of searches based on communication network
US8560317B2 (en) Voice recognition apparatus and recording medium storing voice recognition program
US11024298B2 (en) Methods and apparatus for speech recognition using a garbage model
JP7230806B2 (ja) 情報処理装置、及び情報処理方法
CN108630200B (zh) 声音关键字检测装置以及声音关键字检测方法
KR20150014236A (ko) 인터랙티브 캐릭터 기반 외국어 학습 장치 및 방법
JP6280312B2 (ja) 議事録記録装置、議事録記録方法及びプログラム
JP5753769B2 (ja) 音声データ検索システムおよびそのためのプログラム
JP2009042968A (ja) 情報選別システム、情報選別方法及び情報選別用プログラム
JP6347939B2 (ja) 発話内重要語抽出装置とその装置を用いた発話内重要語抽出システムと、それらの方法とプログラム
JP5068225B2 (ja) 音声ファイルの検索システム、方法及びプログラム
JP6347938B2 (ja) 発話内重要語抽出装置とその装置を用いた発話内重要語抽出システムと、それらの方法とプログラム
JP4089861B2 (ja) 音声認識文章入力装置
JP5160594B2 (ja) 音声認識装置および音声認識方法
JP6233867B2 (ja) 音声認識用辞書登録システム、音声認識システム、音声認識サービスシステム、方法およびプログラム
US20230148275A1 (en) Speech synthesis device and speech synthesis method
Rudzionis et al. Web services based hybrid recognizer of Lithuanian voice commands
JP2005215726A (ja) 話者に対する情報提示システム及びプログラム
US20210064640A1 (en) Information processing apparatus and information processing method
JP7453513B2 (ja) 情報処理装置及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160217

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170327

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170411

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170607

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171128

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171226

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180529

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180530

R150 Certificate of patent or registration of utility model

Ref document number: 6347939

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250