JP2007304776A - 文書検索装置 - Google Patents

文書検索装置 Download PDF

Info

Publication number
JP2007304776A
JP2007304776A JP2006131418A JP2006131418A JP2007304776A JP 2007304776 A JP2007304776 A JP 2007304776A JP 2006131418 A JP2006131418 A JP 2006131418A JP 2006131418 A JP2006131418 A JP 2006131418A JP 2007304776 A JP2007304776 A JP 2007304776A
Authority
JP
Japan
Prior art keywords
document
title
unit
keyword
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006131418A
Other languages
English (en)
Inventor
Katsutoshi Ofu
克年 大附
Tetsuo Amakasu
哲郎 甘粕
Yoshiaki Noda
喜昭 野田
Satoshi Takahashi
敏 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2006131418A priority Critical patent/JP2007304776A/ja
Publication of JP2007304776A publication Critical patent/JP2007304776A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】会話からキーワードを抽出し、キーワードから文書を検索し、検索結果を表示して利用者に提供する文書検索装置において、検索結果を利用者が確認し易い形態で提供する。
【解決手段】会話からキーワードが抽出されていない状況でも、一度検索された検索結果の中から未表示の文書タイトルを表示させるタイトル提示更新手段を設け、キーワードが抽出されない状況でもタイトル表示を更新させる。これにより利用者に提供される文書情報の量を増大させ効率よく目的とする文書にたどり着けるようにする。
【選択図】図2

Description

本発明は、音声で交わされる会話の内容に関連する文書を提示することにより会話をしている者や会話を聞いている者の利便を向上する文書検索装置に関する。
従来、例えば商品の製造・販売会社等ではコールセンタへの顧客からの問い合わせに対して、コールセンタのオペレータが知識と経験に基づいて回答をおこなってきた。
しかし、オペレータの知識と経験だけに依存すると、経験の浅いオペレータにあっては顧客応対品質が低下するおそれがある。つまり、オペレータの知識と経験によって応対品質に差が生じる。
オペレータの知識と経験をできるだけ均質化するための訓練には多大なコストがかかる。また、顧客へ提供する商品やサービスが幅広い、複雑である、頻繁に更新されるといった場合、熟練したオペレータであっても業務に必要な知識を維持するのは困難である。
そこで、オペレータの応対をサポートするために、典型的な問い合わせと回答をデータベースに格納したFAQシステムが利用されている。
オペレータがFAQシステムを利用する際には、応対中にキーワードを入力して必要な文書を検索し、検索された文書を表示器に表示し、表示された文書の内容を読み上げる等して必要な情報を顧客に伝達し、顧客の問い合わせに対する応答としている。
さらにオペレータの負担を軽減するために、オペレータの音声あるいは顧客の音声を音声認識装置により認識し、得られた音声認識結果からキーワードを抽出して、その抽出したキーワードを用いてデータベースを検索することも行われている。これによりオペレータがキーワードを考えたり入力したりする労力を削減することができる。
音声入力によりデータベースを検索する技術として、システムとの音声対話を通して目的の文書を検索するシステムが提案されている(非特許文献1)。このシステムはシステムとユーザとの対話により目的の文書を絞り込んでいくことができる。
Yoji Kiyota, Sadao Kurohashi, Teruhisa Misu, Kazunori Komatani, Tatsuya Kawahara ,FuyukoKido : Dialog Nacigator : A Spoken Dialog Q-A System b-ased on Large Text Knowledge Base , In The Companion Volume to the Proceedings of 41st Annual Meeting of the Association for Computer Linguistics (ACL 2003 Interact-ivePosters/Demonstrations Sessions) , pp. 149-152, Sapporo, Japan, July, 2003.
しかしながら、コールセンタのオペレータは顧客と会話をしているためシステムと対話的に文書を絞り込んでいく操作を行うことはできない。
さらに、音声認識装置から得られたキーワードを用いてデータベースを検索したとき、キーワードと一致する文書が多い場合にはそれらをすべて表示しても、オペレータは応対時間中に表示されたすべての文書を確認することができないことがある。
むしろ、すべての検索結果を表示することはオペレータの視線をとらえるにもかかわらずオペレータは表示された検索結果を読み取ることができず業務効率をかえって損ねることになる。
オペレータが確認しやすいようにキーワードに一致した文書のキーワードとの一致度や文書の重要度に基づいて一致度や重要度の高いN個(Nは1以上の自然数)の文書のみ表示することはできるが、一致度や重要度がN+1番目以下にオペレータが必要とする文書が含まれることがある。
つまり、音声認識結果に含まれるキーワードに基づいて検索された文書をすべて表示することはできず、キーワードの組み合わせも適切であるとは限らないため、文書検索性能(表示した文書がオペレータの役に立つか)が低い、という問題があった。
本発明は、上述した従来技術による問題点を解消するためになされたものであり、オペレータと顧客との会話に基づいて、文書情報をオペレータが確認できるように表示しつつ、応対時間中に表示する文書情報の数を可及的に増やして文書検索性能を向上させることができる文書検索装置を提供することを目的とする。
上述の目的を達成するため、本発明による文書検索装置の第一の特徴とする構成は、音声認識結果にキーワードが含まれていた場合に文書検索を行い検索結果を表示する従来の処理に加えて、音声認識結果にキーワードが含まれていない場合には、直前の文書検索結果で表示できなかった文書タイトルを表示するように構成してある点にある。
上述の構成によれば、オペレータが応対中でも確認できるように一度に表示する文書情報の数を増やすことなく、時分割的に複数回にわたって分割表示するから、応対時間中に表示できる文書情報の総数を増やすことができ、応対に対する文書検索性能を向上することができる。
第二の特徴とする構成は、上述の第一の特徴とする構成において、オペレータあるいはユーザの何れか一方の音声に対する音声認識結果にキーワードが含まれていなかった場合に文書のタイトルを提示するように構成してある点にある。
従来の音声認識による文書検索装置では、音声認識結果にキーワードが含まれていた場合にのみ文書情報を提示していたが、キーワードが含まれていない場合にも文書情報を提示するように構成することにより、オペレータが文書情報を確認する手間を増やすことなく、応対時間中に提示することのできる文書情報(タイトル)の数を増やして文書検索性能を向上させることが可能となる。
第三の特徴とする構成は、上述した第二の特徴構成に加えて、音声認識結果が得られた時刻が直前の認識結果が得られた時刻から、あらかじめ指定した最短時間間隔以上経過している場合のみ、文書情報を提示するように構成してある点にある。
これは、第二の特徴とする構成において、直前の認識結果が得られた直後(例えば1秒以内)に次の認識結果が得られた場合、文書情報が1秒以内の間隔で更新されてしまうために、先に提示していた文書情報をオペレータが確認することができないという問題点を解消したものである。
第四の特徴とする構成は、上述した第二乃至第三の特徴とする構成に加えて、直前の音声認識結果が得られた時刻から、あらかじめ指定した最長時間間隔以上経過しても次の音声認識結果が得られない場合は、直前の音声認識結果が得られた時刻から前記最長時間間隔が経過したときに、文書情報を提示するように構成してある点にある。
これは、第二乃至第三の特徴とする構成において、キーワードが含まれるか含まれないかにかかわらず音声認識結果が得られない限り文書情報が提示されないため、音声認識結果が得られない状態(例えばオペレータ音声の音声認識結果が得られないときに文書情報を提示するような構成において、ユーザがずっと話し続けている状態)が続いた場合に新しい文書情報が提示されないという問題点を解消したものである。
第五の特徴とする構成は、上述した第二の特徴とする構成において、音声認識結果の有無に関係なくあらかじめ指定した時間間隔で文書情報を更新するように構成した点にある。
これは、上記第三および第四の特徴構成で解消した問題点を共に解消できるだけでなく、オペレータが一回に提示された文書情報を確認するのに要する時間を時間間隔として指定しておくことで、応対時間中に提示できる文書情報の数をオペレータが確認できる範囲で最大化することができる。
第六の特徴とする構成は、上述した第一乃至第五の特徴構成において、文書情報を提示する際に、直前の文書検索により得られた文書情報のうち、また利用者に提示していない文書情報を提示するように構成してある点にある。
例えば、一度に提示できる文書情報の数が5件である文書検索装置において、文書検索の結果として30件の文書が検索された場合、従来の文書検索装置では、一致度あるいは文書の重要度といったスコアで検索結果を順位付けした上位5件のみを提示する。
本発明の構成では、文書検索結果が30件得られた時点で上位5件を提示し、その後に得られた音声認識結果にキーワードが含まれなかった場合には、まだ提示していない上位6位から10位の5件を提示する。その後も音声認識結果にキーワードが含まれていなければ上位11位から15位、上位16位から20位と提示していく。上位6位以下にオペレータが必要とする文書情報がある場合に、従来の文書検索装置では、その情報を提示することができなかったが、本発明では、上位6位以下にある文書情報を提示することができる。
第七の特徴とする構成は、上述した第一乃至第五の特徴構成において、文書情報を提示する際に、直前の文書検索において用いたキーワードの組み合わせに変更を加えて文書検索を行い、その結果の文書情報を提示するように構成してある点にある。
キーワードを組み合わせて変更する(減らす、増やす、取り替える)ことにより文書検索結果が変わり、オペレータは様々な条件の文書検索結果の中から必要とする文書情報を探すことができるようになる。
第八の特徴とする構成は、上述した第六と第七の特徴とする構成を組み合わせて構成した点にある。
例えば、第六の特徴とする構成で挙げた例の場合、文書検索の結果得られた30件の文書情報(文書のタイトル)をすべて提示した後に、キーワードが含まれない音声認識結果が得られたときには、直前の文書検索に用いたキーワードの組み合わせに変更を加えて文書検索を行い、その結果の文書情報を提示する。
文書検索で得られた文書情報をすべて表示した後に、キーワードが含まれない音声認識結果が得られた場合に、何も表示できないという第六の特徴とする構成の問題点を解消したものである。
第九の特徴とする構成は、上述した第一乃至第八の特徴とする構成に加えて、文書情報を提示する際に、直前にあらかじめ指定した件数以内に提示された文書は提示しないように構成した点にある。
つまり、すでに提示した文書情報を重複して提示しないようにすることにより、提示する文書情報の種類数を増やすことができる。
第十の特徴とする構成は、上述した第一乃至第八の特徴とする構成に加えて、文書情報を提示する際に、直前のあらかじめ指定した提示回数以内に提示された文書は提示しないように構成してある点にある。
すでに提示した文書情報を重複して提示しないようにすることにより、提示する文書情報の種類を増やすことができる。
本発明によれば、オペレータの業務効率を損ねることなく、応対会話時間中に、従来に比べてより多くの条件で検索した結果を、従来に比べてより多く表示することが可能になり、文書検索性能の高い文書検索装置を実現することができる。
つまり、より多くの文書(文書のタイトル)が表示されるので、表示された文書が応対内容と一致する可能性が高くなる。
本発明による文書検索装置を実現する場合、全てをハードウェアによって構成することも可能であるが、最も簡素に実現するにはコンピュータに文書検索プログラムをインストールし、コンピュータに文書検索装置として機能させる実施形態が最良である。
コンピュータに本発明による文書検索装置として機能させるには、コンピュータにインストールした文書検索プログラムによりコンピュータ上に少なくとも音声入力をテキストデータに変換する音声認識部と、音声認識部で音声認識された認識結果が予め用意されたキーワードに該当するか否かを照合し、一致が検出される毎に認識結果をキーワードとして抽出し、抽出したキーワードを順次蓄積するキーワード抽出部と、抽出されたキーワードを用いて文書データベースを検索する文書検索部と、文書検索部の検索結果からタイトルを抽出しこの抽出したタイトルを表示手段に表示させる文書タイトル提示部と、表示手段に表示されたタイトルの何れかを選択し、タイトルで代表される内容を表示することを指定する入力手段と、指定されたタイトルで代表される文書内容を表示手段に表示する文書提示部と、音声認識部に音声認識結果が存在するにも係わらずキーワード抽出部でキーワードの抽出が行われなかった場合に、文書タイトル提示部に新たな文書タイトルの提示を実行させるタイトル提示更新部とを構築し、文書検索装置として機能させる。
以下に本発明をコールセンタのオペレータ支援システムに適用した場合の実施形態について詳細に説明する。この実施例で説明するオペレータ支援システムは、顧客からの問い合わせに対してオペレータがFAQシステムおよび過去の応対履歴を参照して回答するものである。
動作の概要を予め説明する。オペレータと顧客とが電話を介して会話を交わす毎に、音声認識部は音声認識辞書から尤度の高い単語に該当する文字列を音声認識結果として出力する。キーワード抽出部はその文字列をキーワード辞書に用意してあるキーワード群と照合し、キーワードに合致した文字列が存在した場合はその文字列をキーワードとして抽出し、抽出したキーワードを順次蓄積する。文書検索部は生成されたキーワードに従って文書データベースに蓄積された文書群を検索し、キーワードを含む文書データを検索する。検索された文書データから文書タイトルを抽出し、文書タイトルを表示手段に表示する。文書タイトルの表示の更新はオペレータと顧客との会話が続く限り継続され、会話中に新たなキーワードが抽出される毎に検索に用いるキーワードが変更され、変更された検索条件に従って検索が実行され、文書タイトルが追加表示される。
ここで本発明の特徴はオペレータと顧客との会話中にキーワードを含まない会話がされている状況でも、提示中のタイトルの表示を更新させる点にある。つまり、会話の内容が問い合わせに関係しない例えば「えーと」とか、「それでですねー」等の発話が繰り返されている間はキーワード抽出が停止し、新たな検索情報が入力されない状況となる。
このような状況下で、本発明では音声認識結果が得られているにも係わらずキーワードが抽出されない場合は提示中のタイトルに変えて直前に検索された文書情報(タイトル)の中の未提示のタイトルを提示する状況に更新する動作を実行させる点を特徴とするものである。
このようにキーワードが抽出されない状況でも文書タイトルの表示が更新されることにより、文書タイトルは応対中に時分割して順次表示されるから応対中のオペレータに提示される文書タイトルの数を最大化することができる。この結果、適切な内容の文書にたどりつく確率を高めることができる。
以下にその詳細を説明する。
図1はオペレータ支援システム全体の構成例を示している。
オペレータ支援システム101は、電話機102−1〜102−mと端末103−1〜103−mが設置された複数のオペレータ席104−1〜104−mと、文書検索装置105−1〜105−mとによって構成される。
電話機102−1〜102−mは電話回線106に接続されており、電話機102−1〜102−mと電話回線106を介して交わされる会話音声は、文書検索装置105−1〜105−mへ入力される。
端末103−1〜103−mは、通信機能及び情報閲覧機能を備えた汎用の情報処理装置(パーソナルコンピュータ)であり、オペレータは、この端末103−1〜103−mを操作することにより、文書検索装置105−1〜105−mが出力する検索結果である文書タイトルのリストや文書の内容を閲覧することができる。
端末103−1〜103−mと文書検索装置105−1〜105−mはネットワークを介して接続されている。
文書検索装置105−1〜105−mは、電話回線106を介して交わされる会話音声を入力とし、その音声を認識した結果に基づいて検索された一つあるいは複数の文書のタイトルを表示する。また、オペレータが文書のタイトルをキーボードやマウスクリックなどの操作により選択した場合は、該当する文書の内容を表示する。
文書検索装置をオペレータの端末上に構成しても構わないし、ネットワーク上に設置して複数の端末で一つの文書検索装置を利用するように構成しても構わない。
またIP電話機の場合などには、電話機は端末103−1〜103−m上に構成される。
図2は、オペレータ支援システム101における文書検索装置105−1〜105−mの構成例を示している。文書検索装置105−1〜105−mは、音声認識部201、キーワード抽出部202、文書検索部203、文書タイトル提示部204、文書提示部205からなる。
音声認識部201は、音響モデル211、認識辞書212、言語モデル213を用いて入力音声に対する音声認識結果を求める。この実施例では音声認識部201はオペレータと顧客の両方の音声を音声認識対象とした場合を示す。
キーワード抽出部202は、キーワード辞書214を参照して、音声認識結果に含まれるキーワードを抽出し、抽出したキーワードを順次蓄積する。
文書検索部203は、キーワード抽出部202で抽出された一つあるいは複数のキーワードを用いて文書データベース215からキーワードを含む文書を検索する。
文書タイトル提示部204は、文書検索部215で検索された文書のタイトルをオペレータの端末103−1〜103−mに備えた表示手段210に表示する。
文書提示部205は、表示手段210に表示した文書タイトルをオペレータが入力手段209を用いて指定した場合に、指定された文書(タイトルで代表される文書の内容)を各オペレータの端末103−1〜103−mに設けられている表示手段210に表示する。
タイトル提示更新部206は予め設定した条件が検出される毎に文書タイトル提示部205にタイトルの提示内容を更新させる指令を出力する。ここで予め設定した条件とは例えば設定した時間以上音声認識結果が得られない場合等である。
次に、文書検索装置105−1〜105〜mの動作手順を図3を用いて説明する。
キーワード抽出部202は音声認識結果にキーワードが含まれているか否かをキーワード辞書214を参照して判定する(ステップS301)。
音声認識結果にキーワードが含まれている場合には、抽出されたキーワードで文書データベース215を検索する(ステップS302)。
検索結果の上位N件(Nは1以上の自然数)の文書タイトルを表示する(S304)。上位N件とは検索結果に得られた文書中の例えばキーワードのヒット回数の多い順、或いは検索順等で順位を決める。
音声認識結果が存在するにも係わらず、キーワードが抽出されない場合はタイトル提示更新部206が起動され、以前に検索結果が有り無しを判定する。以前に検索結果が有る場合はタイトル提示更新部206は文書タイトル提示部204にタイトル提示更新指令を出力する(ステップS303)。
文書タイトル提示部204は未提示の文書タイトルのうち上位すなわち上位N+1件目から2N件目の文書タイトルを提示し、表示手段210に提示する(ステップS304)。
未提示の文書タイトルが存在しない場合はタイトル提示更新部206は文書タイトル提示部204に待機指令を出力し、キーワード抽出部202からの入力待ちの状態に待機させる(ステップS305)。
上述した動作手順を具体的な例で説明する。まず、一回目のキーワード抽出結果に「インターネット」、「モデム」、「接続」という3つのキーワードが含まれていた場合、この3つのキーワードを用いて文書データベース215を検索する。この検索により例えば20件の検索結果が得られたとして、その上位5件分の文書タイトルを検索結果として提示し、その文書タイトルを表示手段210に表示する。
次に二回目のキーワード検出結果にはキーワードが含まれていない場合(例えば発話が「はい」「いいえ」のような場合)には、先の検索結果の未提示のもののうち上位6位から10位の文書タイトルを表示する。キーワードを含まない会話が続けば未提示の文書タイトルが文書タイトル提示部204により順次提示され、表示手段210に表示される。未提示の文書タイトルが全て提示され、表示されてしまった場合にはキーワード抽出部202からの入力待ちの状態に待機する(ステップS305)。
図4は本発明の第2の実施例を示す。この実施例2では音声認識部201の入力側に音声選択部216を設け、この音声選択部216でオペレータの音声と、顧客の音声の何れかを選択し、音声認識対象を何れか一方の音声に特定する実施例を示す。
この実施例でも、実施例1と同様にキーワードが抽出されなくとも、タイトル提示更新部206の機能により、音声認識部201が音声認識結果を出力する毎にオペレータの手をわずらわせることなくタイトルの表示状況を更新させ、オペレータに効率よく文書情報を提示する。
また、この実施例のように音声認識対象をオペレータか顧客かの何れか一方に特定することにより、顧客からの問い合わせの内容によっては、認識性能が高い場合があり、音声認識性能の向上により文書検索性能の向上を達することができる。また、音声認識対象をオペレータと顧客の何れか一方に特定することにより、音声認識に用いる音響モデル211,認識辞書212、言語モデル213等の規模を小さくすることができ、音声認識処理を簡略化することができる。
図5は本発明の第3の実施例を示す。この実施例3ではタイトル提示更新部206にタイマ217を付設し、このタイマ217に設定した時間に応じて文書タイトルの表示更新時間間隔を制御するように構成した実施例を示す。
文書タイトルの表示更新時間間隔を制御する方法としては、
(1)、更新時間間隔の最短時間(オペレータが表示中のタイトルを認識可能な最短時間)を設定し、音声認識結果の発生時間間隔が最短時間より短い場合は表示の更新を阻止させ、最短時間が経過した時点で表示の更新を行わせる。
(2)、更新時間間隔の最長時間を設定し、キーワードの抽出が無くても最長時間が経過すると表示内容を更新する。
(3)、一定時間間隔で表示の内容を更新する。
が考えられる。
(1)の動作手順を図6を用いて説明する。音声認識結果が得られる毎にタイトル提示更新部206は前回の音声認識結果が得られた時刻からX秒以上経過したか否かを判定する(ステップS601)。ここではX秒をオペレータが表示手段210に表示されたタイトルを認識可能な最短時間とする。音声認識結果が得られた場合に、直前に発生した音声認識結果の発生時刻からの時間が最短時間X秒が経過していればタイトル提示更新部206はキーワード抽出部202に音声認識結果にキーワードが含まれているか否かを判定させる(ステップS301)。
キーワードが含まれていれば文書検索部203は抽出されたキーワードを用いて文書データベース215を検索する(ステップS302)。
文書タイトル提示部204はその検索結果の上位N件のタイトルを提示し、表示手段210に表示し、(ステップS304)。
入力待ちの状態に入る(ステップS305)。
ステップS601で前回の音声認識結果が得られた時刻からX秒以上経過しているが、音声認識結果にキーワードが含まれていなかった場合には、タイトル提示更新部206は過去の検索で得られた未表示の文書タイトルの有無を確認する(ステップS303)。
ステップS303で未表示の文書タイトルが存在した場合にはタイトル提示更新部206は文書タイトル提示部204に表示更新の指令を出力する。文書タイトル提示部204は未表示のタイトル中の上位N件の文書タイトルを表示する(ステップS304)。
ステップS303で未表示の文書タイトルが存在しない場合はタイトル表示更新部206はステップS305に進み、待機状態となる。
ステップS601で前回の音声認識結果の発生時刻からX秒が経過していない場合には直接ステップS305に進み、待機状態となる。
このようにして、音声認識結果が出力される毎に、その中にキーワードが含まれていても、前回の音声認識結果の発生時刻からX秒以上経過していない場合にはタイトルの表示更新を阻止させ、X秒経過した以後にタイトルの表示更新を行わせるから、オペレータには一度表示された文書タイトルを確実に確認する時間が与えられ、確認が未達成のまま文書タイトルの表示が次々と更新される場合より、効率よく目的とする文書情報にたどり着くことができる。また、表示が更新される毎にオペレータは表示中のタイトルを確実に読み取って確認が可能であるから、会話中に確認できるタイトルの総数は従来より多数化することができる。
以上はX秒を最短時間とした場合を説明したが、X秒を最長時間とすることもできる。つまり、会話中にキーワードを含まない会話が長く続いた場合には、従来の文書検索装置では表示中のタイトルの更新がされなかったが、本発明による文書検索装置は上記したX秒を最長時間(例えば20秒程度)とし、この最長時間が経過する間にキーワードの発生及び音声認識結果が発生すれば上述と同様にタイトルの表示を更新させるが、最長時間が経過する間に音声認識結果が一個も得られなくても、この最長時間が経過した時点でタイトル表示更新部206を起動させ、音声認識結果の発生が無であっても、またキーワードの抽出が無であっても、文書タイトル提示部204に文書タイトルの表示更新指令を出力する。つまり、文書タイトル提示部204は図6に示したステップS303で未表示のタイトルの有無を判定し、未表示のタイトルが存在した場合は、その未表示のタイトルの中から上位N件のタイトルを表示する(ステップS304)。
従って、最長時間が例えば20秒間程度、キーワードを含まない会話が続けられている場合でもタイトルの表示を更新することができる。従って、オペレータはキーワードを含まない会話中でも、その会話の時間を無駄にすることなく目的とする文書にたどり着くことができる。
次にX秒を一定時間で表示を更新させる時間として設定することもできる。例えばX秒を上述した最短時間より長く、最長時間より短い例えば10秒程度の時間に設定することにより、10秒間経過する毎に、その間に音声認識結果が発生しなくとも、またキーワードが抽出されなくとも、タイトル提示更新部206が文書タイトル提示部204に表示の更新指令を出力し、これにより文書タイトル提示部204は過去に検索された未表示のタイトルを表示する状態に表示を更新する。
従って、音声認識結果にキーワードが含まれない会話中でも一定時間例えば10秒間程度経過すると、タイトル提示更新部206が起動され、タイトルの表示状態を更新するから、キーワードを含まない会話中も、タイトルの表示が更新される。オペレータはこの時間を無駄にすることなく、目的とする文書にたどり着くことができる。
尚、このX秒を一定時間として設定した場合に、一定時間が経過する間にキーワードが抽出された場合には、その時点でそのキーワードを用いて検索した結果を表示してもよいが、一定時間経過した時点で検索結果を表示するようにしてもよい。
また、上述では図6で説明したように、音声認識結果が得られる毎にキーワードの有無を問わずに前回の表示更新時刻からX秒が経過したか否かを判定(ステップS601)したが、図7に示すように、音声認識結果にキーワードを含まない場合にのみ前回の音声認識結果の発生時刻からの経過時間がX秒経過したか否かを判定(ステップS701)するようにしてもよい。
また、この実施例3において、X秒を最長時間及び一定時間として設定した場合、これらの最長時間及び一定時間が経過すると音声認識結果の有無を問わずにタイトルの表示更新動作を実行させるように構成することができるから、例えば実施例2のように音声認識対象を一方の話者に特定した場合に、非音声認識対象者のみが一方的に長時間発話すると、音声認識結果が長時間発生しない状況が発生するが、このような状況下でも本発明によればタイトルの表示の更新が実行され、オペレータに情報の提供を継続することができる。
図8に本発明の第4の実施例を示す。この実施例4では音声認識結果にキーワードを含まない場合に、過去に取り込んであるキーワードを用いて前回用いたキーワードの組み合わせを変更するキーワード組み合わせ変更部218を設け、変更されたキーワードの組み合わせを用いて文書検索を実行させ、新たな文書情報を検索するように構成した実施例を示す。
つまり、タイトル提示更新部206は音声認識結果が出力されたにも係わらずキーワードが抽出されない状況を検出し、その検出結果をキーワード組み合わせ変更部218に出力し、キーワード組み合わせ変更部218を起動する。キーワード組み合わせ変更部218は前回の文書検索に用いたキーワードの組み合わせを変更し、その変更したキーワードの組み合わせを文書検索部203に入力する。
文書検索部203は組み合わせが変更されたキーワードを用いて文書データベース215を検索し、新たな文書情報を検索する。文書タイトル提示部204は検索された文書情報からタイトルを取り出し、表示手段210に文書タイトルを表示する。
図9にその手順を示す。
音声認識結果にキーワードが含まれているか否かを判定する(ステップS301)。
キーワードが含まれている場合は、実施例1、2、3と同様に抽出されたキーワードで文書データベース215を検索する(ステップS302)。
文書タイトル提示部204は検索された文書情報(タイトル)の上位N件を表示手段210に表示する(ステップS304)。
ステップS301で音声認識結果にキーワードを含まない場合はキーワード組み合わせ変更部218は前回の検索に用いたキーワードの組み合わせを変更する(ステップS901)。
組み合わせが変更されたキーワードが文書検索部203に引き渡され、文書データベース215を検索する(ステップS902)。
検索の結果、上位N件を表示手段210に表示する(ステップS304)。
キーワード組み合わせの変更は、例えばキーワードの組み合わせの中の一部のキーワードを削除する。前々回に用いた検索のキーワードを追加する。キーワードを類似語に置き換えるといった操作を行う。
キーワード組み合わせ変更の具体例を説明する。一回目のキーワード抽出結果に「インターネット」、「モデム」、「接続」という3つのキーワードが含まれていた場合、この3つのキーワードを用いて文書データベース215を検索し、検索結果を表示する。次に二回目のキーワード抽出結果にキーワードが含まれていない例えば「はい」のような発話の場合には、先の検索のキーワードの組み合わせを変えて例えば「モデム」、「接続」の2つのキーワードで検索を実行し、検索結果を表示する。
この際に、「インターネット」、「モデム」、「接続」という3つのキーワードで検索した際に表示した結果は表示しないようにすることにより、オペレータが確認できる文書タイトルの総数を増やすことができる。
また、会話中にキーワードの抽出が無い場合に実施例1〜3で説明した未表示の文書タイトルを表示し、未表示の文書タイトルが無くなった時点で実施例4で説明したキーワードの組み合わせを変えて検索した結果を表示するように構成することもできる(請求項8に対応)。
更に、文書タイトル提示部204において、直前の予め指定した件数以内に提示した文書タイトルは、検索結果の表示履歴から直前のP件に含まれる結果は表示しないように構成することもできる。この構成とすることにより、冗長な検索結果の表示を抑えることができる(請求項9に対応)。
更に、文書タイトル提示部204において、文書タイトルの表示履歴から提示回数を検出し、直前のq回の表示回数に含まれる結果は表示しないように構成することもできる。例えば1回の表示件数を5件としている場合、実施例6で定義したP件の数がP=15とこの実施例7で定義したq回分q=3は同等の条件となり、表示されないことになる(請求項10に対応)。
以上説明した文書検索装置はコンピュータが解読可能なプログラム言語によって記述された文書検索プログラムをコンピュータにインストールすることによりコンピュータに文書検索装置として機能させることができる。
文書検索プログラムはコンピュータが読み取り可能な例えば磁気ディスク、CD−ROM、半導体メモリのような記録媒体に記録され、これらの記録媒体から或いは通信回線を通じてコンピュータにインストールされる。インストールされたプログラムはコンピュータに備えられたCPUによって解読されて文書検索装置として機能する。
本発明による文書検索装置は、コールセンタ等に設置され、オペレータ支援システムの一部として活用される。
一般的なオペレータ支援システムの構成を説明するためのブロック図。 本発明による文書検索装置の一実施例を説明するためのブロック図。 図2に示した文書検索装置の動作手順を説明するためのフローチャート。 本発明の文書検索装置の他の実施例を説明するためのブロック図。 本発明の文書検索装置の更に他の実施例を説明するためのブロック図。 図4に示した文書検索装置の動作手順を説明するためのフローチャート。 図5に示した文書検索装置の動作手順を説明するためのフローチャート。 本発明の文書検索装置の更に他の実施例を説明するためのブロック図。 図8に示した文書検索装置の動作手順を説明するためのフローチャート。
符号の説明
101 オペレータ支援システム 206 タイトル提示更新部
102−1〜102−m 電話機 209 入力手段
103−1〜103−m 端末 210 表示手段
104−1〜104−m オペレータ席 211 音響モデル
105−1〜105−m 文書検索装置 212 認識辞書
106 電話回線 213 言語モデル
201 音声認識部 214 キーワード辞書
202 キーワード抽出部 215 文書データベース
203 文書検索部 216 音声選択部
204 文書タイトル表示部 217 タイマ
205 文書提示部 218 キーワード組み合わせ変更部

Claims (10)

  1. 音声入力をテキストデータに変換する音声認識部と、
    前記音声認識部で音声認識された認識結果が予め用意されたキーワードに該当するか否かを照合し、一致が検出される毎に前記認識結果をキーワードとして抽出し、抽出したキーワードを順次蓄積するキーワード抽出部と、
    抽出されたキーワードを用いて文書データベースを検索する文書検索部と、
    前記文書検索部の検索結果からタイトルを抽出しこの抽出したタイトルを表示手段に表示させる文書タイトル提示部と、
    表示手段に表示されたタイトルの何れかを選択し、タイトルで代表される内容を表示することを指定する入力手段と、
    指定されたタイトルで代表される文書内容を前記表示手段に表示する文書提示部と、
    前記音声認識部に音声認識結果が存在するにも係わらず前記キーワード抽出部でキーワードの抽出が行われなかった場合に、前記文書タイトル提示部に新たな文書タイトルの提示を実行させるタイトル提示更新部と、
    を備える構成としたことを特徴とする文書検索装置。
  2. 請求項1記載の文書検索装置において、前記音声認識部は特定した音声のみを音声認識し、音声認識結果にキーワードを含まない場合も前記タイトル提示更新部は前記文書タイトル提示部に提示中のタイトル更新を指示することを特徴とする文書検索装置。
  3. 請求項1又は2の何れかに記載の文書検索装置において、前記タイトル提示更新部は音声認識結果が得られた時刻が直前に音声認識結果が得られた時刻から、予め指定した最短時間間隔以上経過している場合のみ前記文書タイトル提示部に新たな文書タイトルの提示を行わせることを特徴とする文書検索装置。
  4. 請求項1又は2の何れかに記載の文書検索装置において、前記タイトル提示更新部は直前の音声認識結果が得られた時刻から、予め指定した最長時間間隔以上経過しても次の音声認識結果が得られない場合は、直前の音声認識結果が得られた時刻から前記最長時間間隔が経過した時点で、前記文書タイトル提示部に新たな文書タイトルを提示させることを特徴とする文書検索装置。
  5. 請求項1又は2の何れかに記載の文書検索装置において、前記タイトル提示更新部は音声認識結果の有無に関係なく予め指定した時間間隔で提示中の文書タイトルを更新させることを特徴とする文書検索装置。
  6. 請求項1乃至5の何れかに記載の文書検索装置において、前記文書タイトル提示部は前記タイトル提示更新部の指示により提示中のタイトルを更新する場合に、直前に検索されたタイトルで未提示のタイトルを選択して提示することを特徴とする文書検索装置。
  7. 請求項1乃至6の何れかに記載の文書検索装置において、前記タイトル提示更新部の出力側にキーワード組み合わせ更新部を設け、前記音声認識結果が出力されたにも係わらず前記キーワード抽出部でキーワードが抽出されない状況下では前記タイトル提示更新部は前記キーワード組み合わせ変更部に前回使用したキーワードの組み合わせを変更させる指令を出力し、キーワード組み合わせ変更部は直前の文書検索において用いたキーワードの組み合わせに変更を加えて前記文書検索部に文書検索を行わせ、検索された文書情報から前記文書タイトル提示部に新たな文書タイトルを提示させる構成としたことを特徴とする文書検索装置。
  8. 請求項1乃至7の何れかに記載の文書検索装置において、前記タイトル提示更新部は直前の文書検索により得られた文書タイトルを全て提示したことを確認する機能を備え、前記キーワード組み合わせ変更部は前記タイトル提示更新部が直前の検索により得られた文書タイトルを全て提示したことを確認すると、直前の文書検索に用いたキーワードの組み合わせに変更を加えて文書検索部に文書検索を行わせ、その検索結果に得られたタイトルを提示することを特徴とする文書検索装置。
  9. 請求項1乃至8の何れかに記載の文書検索装置において、直前に予め指定した件数以内に提示された文書タイトルは提示しないことを特徴とする文書検索装置。
  10. 請求項1乃至9の何れかに記載の文書検索装置において、予め指定した提示回数以内に提示された文書タイトルは提示しないことを特徴とする文書検索装置。
JP2006131418A 2006-05-10 2006-05-10 文書検索装置 Pending JP2007304776A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006131418A JP2007304776A (ja) 2006-05-10 2006-05-10 文書検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006131418A JP2007304776A (ja) 2006-05-10 2006-05-10 文書検索装置

Publications (1)

Publication Number Publication Date
JP2007304776A true JP2007304776A (ja) 2007-11-22

Family

ID=38838658

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006131418A Pending JP2007304776A (ja) 2006-05-10 2006-05-10 文書検索装置

Country Status (1)

Country Link
JP (1) JP2007304776A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2477838A (en) * 2010-02-12 2011-08-17 Avaya Inc Determining/sourcing information of a third party/second participant by a user's communication device to provide contact information and/or related documents.
US8909693B2 (en) 2009-08-21 2014-12-09 Avaya Inc. Telephony discovery mashup and presence
US8959030B2 (en) 2010-02-12 2015-02-17 Avaya Inc. Timeminder for professionals
JP2015076039A (ja) * 2013-10-11 2015-04-20 Necパーソナルコンピュータ株式会社 情報処理方法、情報処理装置、及びプログラム
JP2020034897A (ja) * 2018-08-02 2020-03-05 サウンドハウンド,インコーポレイテッド 自然言語会話に関連する情報の視覚的提示
JP2020061087A (ja) * 2018-10-12 2020-04-16 トッパン・フォームズ株式会社 対話型検索システム
JP2020154491A (ja) * 2019-03-19 2020-09-24 富士ゼロックス株式会社 コミュニケーション支援システム及びプログラム

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8909693B2 (en) 2009-08-21 2014-12-09 Avaya Inc. Telephony discovery mashup and presence
GB2477838A (en) * 2010-02-12 2011-08-17 Avaya Inc Determining/sourcing information of a third party/second participant by a user's communication device to provide contact information and/or related documents.
GB2477838B (en) * 2010-02-12 2013-01-09 Avaya Inc Context sensitive, cloud based telephony
US8898219B2 (en) 2010-02-12 2014-11-25 Avaya Inc. Context sensitive, cloud-based telephony
US8959030B2 (en) 2010-02-12 2015-02-17 Avaya Inc. Timeminder for professionals
JP2015076039A (ja) * 2013-10-11 2015-04-20 Necパーソナルコンピュータ株式会社 情報処理方法、情報処理装置、及びプログラム
JP2020034897A (ja) * 2018-08-02 2020-03-05 サウンドハウンド,インコーポレイテッド 自然言語会話に関連する情報の視覚的提示
JP2020061087A (ja) * 2018-10-12 2020-04-16 トッパン・フォームズ株式会社 対話型検索システム
JP2020154491A (ja) * 2019-03-19 2020-09-24 富士ゼロックス株式会社 コミュニケーション支援システム及びプログラム
JP7318243B2 (ja) 2019-03-19 2023-08-01 富士フイルムビジネスイノベーション株式会社 コミュニケーション支援システム及びプログラム

Similar Documents

Publication Publication Date Title
US11423888B2 (en) Predicting and learning carrier phrases for speech input
US11349991B2 (en) Systems and methods to present voice message information to a user of a computing device
AU2021277693B2 (en) Data driven speech enabled self-help systems and methods of operating thereof
CN107039038B (zh) 学习个性化实体发音
JP5851507B2 (ja) インターネット検索に関する方法及び装置
US8335829B1 (en) Facilitating presentation by mobile device of additional content for a word or phrase upon utterance thereof
US9043199B1 (en) Manner of pronunciation-influenced search results
JP2007304776A (ja) 文書検索装置
JP6025785B2 (ja) 自然言語理解のための自動音声認識プロキシシステム
US20060069570A1 (en) System and method for defining and executing distributed multi-channel self-service applications
JP7132538B2 (ja) 検索結果表示装置、検索結果表示方法、及びプログラム
US9436951B1 (en) Facilitating presentation by mobile device of additional content for a word or phrase upon utterance thereof
JP2018128869A (ja) 検索結果表示装置、検索結果表示方法、及びプログラム
WO2021183269A1 (en) Automatically recognizing and surfacing important moments in multi-party conversations
JP2007304793A (ja) 文書検索装置
JP6254504B2 (ja) 検索サーバ、及び検索方法
JP2010182191A (ja) 帳票入力装置、帳票入力システム、帳票入力方法、及びプログラム
US20210104240A1 (en) Description support device and description support method
JP2008216461A (ja) 音声認識・キーワード抽出・知識ベース検索連携装置
US11861146B2 (en) Computer desktop that dynamically adapts to a live multi-channel audio stream, such as for use with wireless telecommunications customer service agents
WO2016136208A1 (ja) 音声対話装置、音声対話システム、および、音声対話装置の制御方法
JP2011065401A (ja) 情報処理装置、そのデータ処理方法、およびプログラム
WO2013048729A1 (en) Techniques for receiving and processing one or more user-specified queries