JPH04252375A - 情報提供方法 - Google Patents

情報提供方法

Info

Publication number
JPH04252375A
JPH04252375A JP3008709A JP870991A JPH04252375A JP H04252375 A JPH04252375 A JP H04252375A JP 3008709 A JP3008709 A JP 3008709A JP 870991 A JP870991 A JP 870991A JP H04252375 A JPH04252375 A JP H04252375A
Authority
JP
Japan
Prior art keywords
topic
information
topics
fields
field
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3008709A
Other languages
English (en)
Inventor
Atsushi Takeshita
敦 竹下
Toru Nakagawa
中川 透
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP3008709A priority Critical patent/JPH04252375A/ja
Publication of JPH04252375A publication Critical patent/JPH04252375A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、例えば対話遂行者やプ
レゼンテーション遂行者に対して対話中の話題および分
野に関連する情報を提供する情報提供方法に関する。
【0002】
【従来の技術】従来、対話やプレゼンテーションを促進
するために、その遂行者は予め話題を予測して、関連の
ある情報を選択しておいたり、または情報が必要になっ
た時点で検索を行って、対話やプレゼンテーションの最
中に必要な情報を得ている。
【0003】
【発明が解決しようとする課題】しかしながら、対話や
プレゼンテーションの内容を予め予測することは、一般
に非常に困難であり、従って関連のある情報をすべて予
め準備することは困難である。
【0004】また、対話やプレゼンテーション中に検索
を行う場合には、種々の情報を含んだ膨大なデータベー
ス群から検索を行うことになるため、必要な情報を得る
までに時間が掛かり、談話の流れが途切れてしまうとい
う問題がある。
【0005】本発明は、上記に鑑みてなされたもので、
その目的とするところは、入力言語情報を解析して話題
および分野に応じた適切な情報を提供する情報提供方法
を提供することにある。
【0006】
【課題を解決するための手段】上記目的を達成するため
、本発明の情報提供方法は、入力言語情報を解析して話
題および分野を抽出し、この抽出した話題および分野を
用いて、データベースから話題および分野に関連する情
報を検索し、この検索した情報を提供することを要旨と
する。
【0007】
【作用】本発明の情報提供方法では、入力言語情報を解
析して話題および分野を抽出し、この話題および分野に
関連する情報をデータベースから検索して提供する。
【0008】
【実施例】以下、図面を用いて本発明の実施例を説明す
る。
【0009】図1は本発明の一実施例に係わる情報提供
方法を実施する情報提供装置の構成を示すブロック図で
ある。同図に示す情報提供装置は、対話やプレゼンテー
ションにおける会話や説明等の発話である音声情報を受
信して電気信号に変換するマイクロフォン1を有し、こ
のマイクロフォン1で電気信号に変換された音声情報は
音声認識装置3で音声認識され、文字列に変換される。 この文字列は形態素解析装置5に供給され、単語毎に区
切られて、単語列に変換され、各単語の品詞や活用語の
活用形等が同定される。
【0010】形態素解析装置5で形態素解析された単語
列は、話題転換箇所検出装置7、分野同定装置9および
話題抽出装置13に供給される。話題転換箇所検出装置
7は、単語列から例えば図3に示すようなテーブルに登
録された話題転換箇所に使用される言語表現、すなわち
「まず第1に」、「次に」、「ところで」、「それから
」、「あと」等の言語表現を検出し、話題転換箇所を検
出し、これにより分野同定装置9および話題抽出装置1
3における分野および話題に関する情報をクリアする。 なお、対話やプレゼンテーションの開始時も話題転換箇
所として検出される。
【0011】分野同定装置9は、例えば図5に示すよう
な各単語に対応して分野が登録されている分野同定用辞
書11を使用し、各単語、特に専門語に対する分野を同
定する。話題抽出装置13は、話題抽出用辞書15を使
用して、各単語列からなる文章から例えば特定の文型、
話題を示す語句、特定の動詞と表層格等をチェックし話
題を抽出する。
【0012】データベース検索装置17は、前記分野同
定装置9および話題抽出装置13によって検出された話
題および分野に基づいて関連する情報を検索し、この検
索した情報を情報表示装置19を介してスピーカ21お
よびディスプレイ23で表示する。
【0013】次に、図2に示すフローチャートを参照し
て作用を説明する。
【0014】対話やプレゼンテーションにおける会話や
説明等の発話である音声情報は、マイクロフォン1によ
って電気信号に変換されて、音声認識装置3に供給され
、文字列に変換される(ステップ110)。この文字列
は、形態素解析装置5に形態素解析され、単語毎に区切
られて、単語列に変換されるとともに、各単語の品詞や
活用語の活用形等が同定される(ステップ120)。
【0015】それから、形態素解析装置5によって形態
素解析された単語列は、話題転換箇所検出装置7に供給
され、例えば図3に示すようなテーブルに登録された話
題転換箇所に使用される言語表現、すなわち「まず第1
に」、「次に」、「ところで」、「それから」、「あと
」等の言語表現が検出され、話題転換箇所が検出される
(ステップ130)。
【0016】話題転換箇所検出装置7による話題転換箇
所の検出の結果、新しい話題が導入されたか否かがチェ
ックされ(ステップ140)、新しい話題が導入された
場合には、後述するように話題分野と話題集合を求める
ためにステップ160,190で使用される変数の値が
クリアされる(ステップ150)。
【0017】また、新しい話題が起こってない場合には
、ステップ160,190に進んで、分野の同定および
話題の抽出が行われる。
【0018】ステップ160における分野の同定につい
ては図4を参照して後述するが、話題についての分野を
分野同定用辞書11を用いて同定する。そして、この分
野の同定の結果、話題の分野に変化があったか否かがチ
ェックされ(ステップ170)、変化があった場合には
、この分野を用いて関連するデータベースを限定する(
ステップ180)。
【0019】また、ステップ190における話題の抽出
については図6を参照して後述するが、話題抽出用辞書
15を使用して、各単語列からなる文章から例えば特定
の文型、話題を示す語句、特定の動詞と表層格等をチェ
ックし話題を抽出する。それから、話題集合に変化があ
るか否かをチェックし(ステップ200)、変化がない
場合には、何もしない(ステップ210)が、話題集合
に変化がある場合には、ステップ180で限定したデー
タベースに対して、話題集合を用いて検索を行う(ステ
ップ220)。そして、検索で得られた情報を情報表示
装置19のスピーカ21によって音声で出力するととも
に、ディスプレイ23によって表示し、情報を提供する
(ステップ230)。
【0020】次に、図4を参照して、前記ステップ16
0の話題分野の同定処理について説明する。まず、形態
素解析装置5によって形態素解析された結果の各単語に
ついて専門用語であるか否かをチェックする(ステップ
310)。この処理は、図5に示すように各単語に対し
て分野が対応して記述されているテーブル形式の分野同
定用辞書11を用い、形態素解析結果から専門語を検出
する。専門語である場合には、対応する専門分野の頻度
カウンタの値をインクリメントし、各分野毎に専門用語
の出現回数をカウントする(ステップ320)。そして
、頻度カウンタの値が最大である分野をその時点での分
野として選択する(ステップ330)。
【0021】また、次に、図6を参照して、前記ステッ
プ190の話題の抽出について説明する。この話題の抽
出は、文型、語句等を分析することにより行われるが、
更に具体的には後述する図7〜9に示す対応テーブルに
記述された自然言語表現を検出して話題を抽出する。こ
の場合、検出すべき自然言語表現の間には優先順位が存
在するので、処理を図6に示すように3つの処理に大別
されている。
【0022】図6においては、まず、特定の文型をチェ
ックして、話題候補があるか否かをチェックする(ステ
ップ410,420)。これは、図7に示すような特定
の文型を検出することにより行われる。図7において、
(話題)が検出する話題であり、*は任意の文字列を示
す。例えば、「XはYです。」という文では、Yが話題
候補として検出される。
【0023】話題候補が検出されると、この検出された
話題候補が例えば代名詞のような特定の概念を表す不適
切語であるか否かチェックされ(ステップ430)、不
適切語でない場合には、この話題候補が話題集合に追加
される(ステップ500)。
【0024】話題候補がない場合および不適切語である
場合、次のステップ440に進み、話題を示す語句をチ
ェックして、話題候補があるか否かをチェックする(ス
テップ440,450)。これは、図8に示すような話
題を示す語句を検出することにより行われる。例えば、
「Xについて」という語句を検出した場合には、このX
を話題候補として検出し、この検出した話題候補が不適
切語であるか否かをチェックし、不適切語でない場合に
は、同様に話題集合に追加する(ステップ460,50
0)。
【0025】また、話題講話がない場合および不適切語
である場合には、ステップ470に進み、話題を示す特
定の動詞とその表層格をチェックして、話題候補がある
か否かチェックする(ステップ470,480)。これ
は、図9に示すような話題を示す動詞とその表層格を検
出することにより行われる。そして、この話題候補を検
出した場合には、この話題候補が不適切語であるか否か
をチェックし、不適切語でない場合には、同様に話題集
合に追加する(ステップ490,500)。話題候補が
ない場合および不適切語である場合には、ステップ41
0に戻る。
【0026】次に、図10に示す対話を例にとり、本発
明の処理方法について具体的に説明する。
【0027】まず、図10に示すように、「郵便物の出
し方についてお伺いしたいんですけど。」という発話A
−1が行われて対話が開始すると、前記ステップ130
で説明したように話題転換箇所が検出され、新しい話題
が導入されたことが検出され、現在の話題やそれに属す
る分野に関する情報がクリアされる。
【0028】それから、前記ステップ160の話題分野
の同定においては、専門用語として、発話A−1および
B−1から「郵便物」が検出され、発話A−2から「国
内便」と「ポスト」が検出される。図5に示すように、
いずれも郵便業務分野に関するものであるが、「ポスト
」はビジネス分野でも使用される用語である。従って、
郵便業務分野の専門用語が3回、ビジネス分野の用語が
1回カウントされ、対話を通して最も頻度の高い郵便業
務分野が現在の分野として選択される。この結果、前記
ステップ180では、ステップ220での検索対象を郵
便業務に関する部分だけに限定することを決定する。
【0029】また、前記ステップ190の話題の抽出に
おいては、各発話は特定の文型および特定の動詞に適合
せず、話題を示す語句に関しては、発話A−1の「につ
いて」と発話A−2の「は」が適合するので、「郵便物
の出し方」と「国内便」が話題として検出される。
【0030】以上の結果、ステップ220のデータベー
ス検索では、「郵便物の出し方」と「国内便」に関連す
る情報が検索され、情報として提供される。
【0031】
【発明の効果】以上説明したように、本発明によれば、
入力言語情報を解析して話題および分野を抽出し、この
抽出した話題および分野に関連する情報をデータベース
から検索して提供するので、例えば対話やプレゼンテー
ションにおける話題および分野を適確に検出し、その関
連する情報が迅速かつ適確に提供され、対話やプレゼン
テーションの進展の促進に有効である。
【図面の簡単な説明】
【図1】本発明の一実施例に係わる情報提供方法を実施
する情報提供装置の構成を示すブロック図である。
【図2】図1の情報提供装置の作用を示すフローチャー
トである。
【図3】話題転換箇所を検出するための言語表現の一例
を示すテーブルである。
【図4】図2のステップ160の話題分野を同定するた
めの処理を示すフローチャートである。
【図5】話題分野の同定に用いるテーブルの一例を示す
表である。
【図6】図2のステップ190の話題の抽出処理を示す
フローチャートである。
【図7】話題抽出用に使用される特定の文型の例を示す
テーブルである。
【図8】話題抽出に使用される語句の例を示すテーブル
である。
【図9】話題抽出に使用される特定の動詞と表層格の例
を示すテーブルである。
【図10】対話例である。
【符号の説明】
5  形態素解析装置 7  話題転換箇所検出装置 9  分野同定装置 13  話題抽出装置 17  データベース検索装置 19  情報表示装置

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】  入力言語情報を解析して話題および分
    野を抽出し、この抽出した話題および分野を用いて、デ
    ータベースから話題および分野に関連する情報を検索し
    、この検索した情報を提供することを特徴とする情報提
    供方法。
  2. 【請求項2】  話題および分野の抽出に関して、表層
    的な言語表現の形をテーブルに記述し、このテーブルを
    用いて、話題転換箇所を検出し、同じ話題が続いている
    セグメントを抽出することを特徴とする請求項1記載の
    情報提供方法。
  3. 【請求項3】  同じ話題が続いているセグメントにお
    ける話題の抽出に際して、表層的な言語表現の形をテー
    ブルに記述し、このテーブルを用いることを特徴とする
    請求項1記載の情報提供方法。
  4. 【請求項4】  同じ話題が続いているセグメントにお
    ける話題分野の抽出に際して、話題に対応して分野を記
    述したテーブルを用いて、各分野の尤度を決定すること
    を特徴とする請求項1記載の情報提供方法。
JP3008709A 1991-01-28 1991-01-28 情報提供方法 Pending JPH04252375A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3008709A JPH04252375A (ja) 1991-01-28 1991-01-28 情報提供方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3008709A JPH04252375A (ja) 1991-01-28 1991-01-28 情報提供方法

Publications (1)

Publication Number Publication Date
JPH04252375A true JPH04252375A (ja) 1992-09-08

Family

ID=11700469

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3008709A Pending JPH04252375A (ja) 1991-01-28 1991-01-28 情報提供方法

Country Status (1)

Country Link
JP (1) JPH04252375A (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06110835A (ja) * 1992-09-30 1994-04-22 Hitachi Ltd 音声対話システムおよびその対話進行制御方法
JP2009528581A (ja) * 2005-11-14 2009-08-06 メイク センス インコーポレイテッド 知識相関サーチエンジン
JP2010117824A (ja) * 2008-11-12 2010-05-27 Yahoo Japan Corp 知識レベルに基づいて広告を配信する装置及び方法
US8024653B2 (en) 2005-11-14 2011-09-20 Make Sence, Inc. Techniques for creating computer generated notes
US8108389B2 (en) 2004-11-12 2012-01-31 Make Sence, Inc. Techniques for knowledge discovery by constructing knowledge correlations using concepts or terms
US8126890B2 (en) 2004-12-21 2012-02-28 Make Sence, Inc. Techniques for knowledge discovery by constructing knowledge correlations using concepts or terms
JP2012047875A (ja) * 2010-08-25 2012-03-08 Nippon Telegr & Teleph Corp <Ntt> 用件区間抽出方法、装置、及びそのプログラム
US8140559B2 (en) 2005-06-27 2012-03-20 Make Sence, Inc. Knowledge correlation search engine
US8898134B2 (en) 2005-06-27 2014-11-25 Make Sence, Inc. Method for ranking resources using node pool
US9330175B2 (en) 2004-11-12 2016-05-03 Make Sence, Inc. Techniques for knowledge discovery by constructing knowledge correlations using concepts or terms

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06110835A (ja) * 1992-09-30 1994-04-22 Hitachi Ltd 音声対話システムおよびその対話進行制御方法
US10467297B2 (en) 2004-11-12 2019-11-05 Make Sence, Inc. Techniques for knowledge discovery by constructing knowledge correlations using concepts or terms
US9330175B2 (en) 2004-11-12 2016-05-03 Make Sence, Inc. Techniques for knowledge discovery by constructing knowledge correlations using concepts or terms
US9311601B2 (en) 2004-11-12 2016-04-12 Make Sence, Inc. Techniques for knowledge discovery by constructing knowledge correlations using concepts or terms
US8108389B2 (en) 2004-11-12 2012-01-31 Make Sence, Inc. Techniques for knowledge discovery by constructing knowledge correlations using concepts or terms
US8126890B2 (en) 2004-12-21 2012-02-28 Make Sence, Inc. Techniques for knowledge discovery by constructing knowledge correlations using concepts or terms
US8898134B2 (en) 2005-06-27 2014-11-25 Make Sence, Inc. Method for ranking resources using node pool
US8140559B2 (en) 2005-06-27 2012-03-20 Make Sence, Inc. Knowledge correlation search engine
US9477766B2 (en) 2005-06-27 2016-10-25 Make Sence, Inc. Method for ranking resources using node pool
JP4864095B2 (ja) * 2005-11-14 2012-01-25 メイク センス インコーポレイテッド 知識相関サーチエンジン
US9213689B2 (en) 2005-11-14 2015-12-15 Make Sence, Inc. Techniques for creating computer generated notes
US8024653B2 (en) 2005-11-14 2011-09-20 Make Sence, Inc. Techniques for creating computer generated notes
JP2009528581A (ja) * 2005-11-14 2009-08-06 メイク センス インコーポレイテッド 知識相関サーチエンジン
JP2010117824A (ja) * 2008-11-12 2010-05-27 Yahoo Japan Corp 知識レベルに基づいて広告を配信する装置及び方法
JP2012047875A (ja) * 2010-08-25 2012-03-08 Nippon Telegr & Teleph Corp <Ntt> 用件区間抽出方法、装置、及びそのプログラム

Similar Documents

Publication Publication Date Title
Gupta et al. Automatic lyrics alignment and transcription in polyphonic music: Does background music help?
US6067520A (en) System and method of recognizing continuous mandarin speech utilizing chinese hidden markou models
US6618726B1 (en) Voice activated web browser
Tong et al. Integrating acoustic, prosodic and phonotactic features for spoken language identification
CN107305541A (zh) 语音识别文本分段方法及装置
Liu et al. Comparing HMM, maximum entropy, and conditional random fields for disfluency detection.
CN106601259A (zh) 一种基于声纹搜索的信息推荐方法及装置
US6763331B2 (en) Sentence recognition apparatus, sentence recognition method, program, and medium
Kubala et al. Integrated technologies for indexing spoken language
Stevenson et al. Experiments on sentence boundary detection
Howell et al. Development of a two-stage procedure for the automatic recognition of dysfluencies in the speech of children who stutter: I. Psychometric procedures appropriate for selection of training material for lexical dysfluency classifiers
Rosenberg et al. Story segmentation of broadcast news in English, Mandarin and Arabic
Kopparapu Non-linguistic analysis of call center conversations
Verbree et al. Dialogue-act tagging using smart feature selection; results on multiple corpora
JPH08248971A (ja) テキスト朗読読み上げ装置
JPH04252375A (ja) 情報提供方法
Zheng et al. Acoustic texttiling for story segmentation of spoken documents
CN114996506A (zh) 语料生成方法、装置、电子设备和计算机可读存储介质
CN112231440A (zh) 一种基于人工智能的语音搜索方法
Brown et al. Capitalization recovery for text
Hillard et al. Impact of automatic comma prediction on POS/name tagging of speech
JP2011123565A (ja) Faq候補抽出システムおよびfaq候補抽出プログラム
JPH04332084A (ja) 自動情報提供方法
CN111429921A (zh) 声纹识别方法、系统、移动终端及存储介质
JP3956730B2 (ja) 言語処理装置