JP2005234572A - 談話機能に対する予測モデルを判定する方法およびシステム - Google Patents
談話機能に対する予測モデルを判定する方法およびシステム Download PDFInfo
- Publication number
- JP2005234572A JP2005234572A JP2005039648A JP2005039648A JP2005234572A JP 2005234572 A JP2005234572 A JP 2005234572A JP 2005039648 A JP2005039648 A JP 2005039648A JP 2005039648 A JP2005039648 A JP 2005039648A JP 2005234572 A JP2005234572 A JP 2005234572A
- Authority
- JP
- Japan
- Prior art keywords
- discourse
- function
- discourse function
- determining
- prosodic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
Abstract
例えば自動音声認識システムにおいて、談話機能の評価モデルを評価する方法およびシステムを提供する。
【解決手段】
音声発話のコーパスを判定し、少なくとも1つの音声発話に関連した少なくとも1つの談話機能を判定する。さらに、前記少なくとも1つの談話機能に関連した少なくとも1つの韻律特徴を判定して、前記韻律特徴および前記談話機能に基づいて談話機能の少なくとも1つの予測モデルを判定する。
【選択図】図2
Description
ブラック エイ;テーラー、ピー:シーエイチエイテイーアール:ジェネリック スピーチ シンセシス システムイン・プロシーデイングス・オブ・コリング74、II 第83−986頁、京都、1994(Black A.; Taylor, P.: CHATR: a generic speech synthesis system" in Proceedings of COLING74, II p.83-986, Kyoto, 1994) ホーラー、エス. フォッサム、テイー。:"ザ アソシエイション ビトイーン サブジェクト マター アンド デイスコース セグメンテーション"、イン ザ プロシーデイングス オブ ザ フロリダ エイエル リサーチ シンポジウム、キー ウエスト、フロリダ、2001年5月(Haller, S. Fossum, T.:"The Association Between Subject Matter and Discourse Segmentation", In The Proceedings of the Florida Al Research Symposium, Key West, Fl. May 2001) ロング、エス.;クーパー、アール.;アボウド、ジー.;アトケソン、シー.、"ラピッド プロトタイピング オブ モバイル コンテキスト‐アウエア アプリケーションズ:ザ サイバー ガイド ケース スタデイ"、イン ザ プロシーデイングス オブ セカンド エイシーエム インターナショナル カンファレンス オン モバイル コンピューテイング アンド ネットワーキング(モビコン`96)97−107ページ、1996年11月10−12日(Long, S.; Kooper, R.; Abowd, G.; Atkeson, C., "Rapid Prototyping of Mobile Context-Aware Applications: the Cyber Guide Case Study", in the Proceedings of the 2nd ACM International Conference on Mobile Computing and Networking (MobiCom '96), pp. 97-107, November 10-12, 1996.) シュリバーグ、イー.;シュトルケ、エイ.;ハッカニ‐ツール、デイレク;ツール、ゴクハン、"プロソデイ‐ベースド セグメンテーション オブ スピーチ アタランシズ インツー センテンシズ アンド トピックス"イン スピーチ コニュミケーションズ、2000、32、1‐2、9月、127‐154ページ(Schriberg, E.; Stolcke, A.; Hakkani-Tur, Dilek; Tur, Gokhan, "Prosody-Based Segmentation of Speech Utterances into Sentences and Topics," in speech Communication, 2000, 32, 1-2, Sept, pp. 127-154) シュトルケ、エイ.;シュリバーグ、イー.;ベイツ、アール.;コッカロ エヌ.;ジュラフスキ、デイー.;マーチン、アール.;メテイーア、エム.;リース、ケイ.;テーラー、ピー.;ヴァン エス‐ダイケマ、シー.、"ダイアログ アクト モデリング フォア カンバセイショナル スピーチ"イン アプライング マシン ラーニング ツー デイスコース プロセッシング.ペーパーズ フロム ザ 1998 エイエイエイアイ スプリング シンポジウム、テクニカル レポート エスエス‐98−01(ジェイ.チュ‐キャロル エトアル、イーデイーエス)スタンフォード カリフォルニア 98‐105ページ、エイエイエイアイ プレス、メンロ パーク、カリフォルニア、1998年(Stolcke., A.; Schriberg, E.; Bates, R.; Coccaro, N.; Jurafsky, D.; Martin, R.; Meteer, M.; Ries, K.; Taylor, P.; Van Ess-Dykema, C., "Dialog Act Modeling for Conversational Speech" in Applying Machine Learning to Discourse Processing. Papers from the 1998 AAAI Spring Symposium, Technical Report SS-98-01 (J. Chu-Carrol et al, eds.) Stanford CA pp.98-105, AAAI Press, Menlo Park CA. 1998) レンデ、ビー.;シュリバーグ、イー.、"スポッテイング `ホットスポット´ イン ミーテイングス:ヒューマン ジャッジメンツ アンド プロスデイック キュウ"イン プロシーデイングス、ユーロスピーチ、ジェネバ、2003(Wrende, B.; Schriberg, E., "Spotting 'HotSpots' in Meetings: Human Judgments and Prosodic Cues" in Proc. Eurospeech, Geneva, 2003)
100 談話機能の予測モデルを判定するためのシステム
200 情報リポジトリ
300 インターネット対応パソコン
400 インターネット対応タブレット・コンピュータ
10 入力/出力回路
20 メモリ
30 プロセッサ
40 韻律特徴判定ルーチンまたは回路
50 談話機能判定ルーチンまたは回路
60 予測モデル判定ルーチンまたは回路
Claims (21)
- 音声発話のコーパスを判定するステップと、
少なくとも1つの音声発話に関連した少なくとも1つの談話機能を判定するステップと、
前記少なくとも1つの談話機能に関連した少なくとも1つの韻律特徴を判定するステップと、
前記韻律特徴および前記談話機能に基づいて談話機能の少なくとも1つの予測モデルを判定するステップを含む、談話機能に対する予測モデルを判定する方法。 - 前記談話機能が談話分析の理論に基づいて判定される、請求項1に記載の方法。
- 前記談話分析の理論が、言語的談話モデル(Linguistic Discourse Model)、統一言語的談話モデル(Unified Linguistic Discourse Model)、修辞構造理論(Rhetorical Structure Theory)、談話構造理論(Discourse Structure Theory)、構造談話表示理論(Structured Discourse Representation Theory)のうちの少なくとも1つである請求項2に記載の方法。
- 前記予測モデルが機械学習、ルールのうちの少なくとも1つに基づいて判定される、請求項1に記載の方法。
- 機械学習に基づく予測モデルが、統計学、決定木、ナイーブベイズのうちの少なくとも1つに基づいて判定される、請求項4に記載の方法。
- 韻律特徴が、関連した談話機能の前、中、後の場所の少なくとも1つで生ずる、請求項4に記載の方法。
- 前記韻律特徴が韻律特徴ベクトル内でコード化される、請求項1に記載の方法。
- 前記韻律特徴ベクトルが多モード特徴ベクトルである、請求項7に記載の方法。
- 前記談話機能がセンテンス内談話機能である、請求項1に記載の方法。
- 前記談話機能がセンテンス間談話機能である、請求項1に記載の方法。
- 少なくとも1つの音声発話のコーパスを検索するための入力/出力回路と、
前記少なくとも1つの音声発話に関連した韻律特徴を判定するプロセッサであって、前記少なくとも1つの音声発話のコーパスに関連した少なくとも1つの談話機能を判定し、前記少なくとも1つの談話機能に関連した少なくとも1つの韻律特徴を判定し、前記韻律特徴および前記談話機能に基づいて談話機能に対する予測モデルを判定するプロセッサと、
を備える、談話機能の予測モデルを判定するシステム。 - 前記談話機能が談話分析の理論に基づいて判定される、請求項11に記載のシステム。
- 前記談話分析の理論が、言語的談話モデル(Linguistic Discourse Model)、統一言語的談話モデル(Unified Linguistic Discourse Model)、修辞構造理論(Rhetorical Structure Theory)、談話構造理論(Discourse Structure Theory)、構造談話表示理論(Structured Discourse Representation Theory)のうちの少なくとも1つである請求項12に記載のシステム。
- 前記予測モデルが機械学習、ルールのうちの少なくとも1つに基づいて判定される、請求項11に記載のシステム。
- 機械学習に基づく予測モデルが、統計学、決定木、ナイーブベイズのうちの少なくとも1つに基づいて判定される、請求項14に記載のシステム。
- 韻律特徴が、関連した談話機能の前、中、後の場所の少なくとも1つで生ずる、請求項11に記載のシステム。
- 前記韻律特徴が韻律特徴ベクトル内でコード化される、請求項11に記載のシステム。
- 前記韻律特徴ベクトルが多モード特徴ベクトルである、請求項17に記載のシステム。
- 前記談話機能がセンテンス内談話機能である、請求項11に記載のシステム。
- 前記談話機能がセンテンス間談話機能である、請求項11に記載のシステム。
- 音声発語のコーパスを判定する命令と、
少なくとも1つの音声発話に関連した少なくとも1つの談話機能を判定する命令と、
少なくとも1つの談話機能に関連した少なくとも1つの韻律特徴を判定する命令と、
前記韻律特徴および前記談話機能に基づいて談話機能の少なくとも1つの予測モデルを判定する命令と、
を含む、談話機能に対する予測モデルを判定するようにコンピュータをプログラムするコンピュータ・プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/781,443 US7542903B2 (en) | 2004-02-18 | 2004-02-18 | Systems and methods for determining predictive models of discourse functions |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005234572A true JP2005234572A (ja) | 2005-09-02 |
JP2005234572A5 JP2005234572A5 (ja) | 2008-04-03 |
Family
ID=34838743
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005039648A Pending JP2005234572A (ja) | 2004-02-18 | 2005-02-16 | 談話機能に対する予測モデルを判定する方法およびシステム |
Country Status (2)
Country | Link |
---|---|
US (3) | US7542903B2 (ja) |
JP (1) | JP2005234572A (ja) |
Families Citing this family (96)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7398209B2 (en) | 2002-06-03 | 2008-07-08 | Voicebox Technologies, Inc. | Systems and methods for responding to natural language speech utterance |
US7693720B2 (en) | 2002-07-15 | 2010-04-06 | Voicebox Technologies, Inc. | Mobile systems and methods for responding to natural language speech utterance |
WO2005064592A1 (ja) * | 2003-12-26 | 2005-07-14 | Kabushikikaisha Kenwood | 機器制御装置、音声認識装置、エージェント装置、車載機器制御装置、ナビゲーション装置、オーディオ装置、機器制御方法、音声認識方法、エージェント処理方法、車載機器制御方法、ナビゲーション方法、オーディオ装置制御方法及びプログラム |
US7542903B2 (en) * | 2004-02-18 | 2009-06-02 | Fuji Xerox Co., Ltd. | Systems and methods for determining predictive models of discourse functions |
US20050187772A1 (en) * | 2004-02-25 | 2005-08-25 | Fuji Xerox Co., Ltd. | Systems and methods for synthesizing speech using discourse function level prosodic features |
KR100590553B1 (ko) * | 2004-05-21 | 2006-06-19 | 삼성전자주식회사 | 대화체 운율구조 생성방법 및 장치와 이를 적용한음성합성시스템 |
US8340971B1 (en) | 2005-01-05 | 2012-12-25 | At&T Intellectual Property Ii, L.P. | System and method of dialog trajectory analysis |
US7640160B2 (en) | 2005-08-05 | 2009-12-29 | Voicebox Technologies, Inc. | Systems and methods for responding to natural language speech utterance |
US7620549B2 (en) | 2005-08-10 | 2009-11-17 | Voicebox Technologies, Inc. | System and method of supporting adaptive misrecognition in conversational speech |
US8977636B2 (en) | 2005-08-19 | 2015-03-10 | International Business Machines Corporation | Synthesizing aggregate data of disparate data types into data of a uniform data type |
US8924212B1 (en) * | 2005-08-26 | 2014-12-30 | At&T Intellectual Property Ii, L.P. | System and method for robust access and entry to large structured data using voice form-filling |
US7949529B2 (en) | 2005-08-29 | 2011-05-24 | Voicebox Technologies, Inc. | Mobile systems and methods of supporting natural language human-machine interactions |
WO2007027989A2 (en) | 2005-08-31 | 2007-03-08 | Voicebox Technologies, Inc. | Dynamic speech sharpening |
US8447592B2 (en) * | 2005-09-13 | 2013-05-21 | Nuance Communications, Inc. | Methods and apparatus for formant-based voice systems |
US8694319B2 (en) * | 2005-11-03 | 2014-04-08 | International Business Machines Corporation | Dynamic prosody adjustment for voice-rendering synthesized data |
US20070129943A1 (en) * | 2005-12-06 | 2007-06-07 | Microsoft Corporation | Speech recognition using adaptation and prior knowledge |
US9135339B2 (en) * | 2006-02-13 | 2015-09-15 | International Business Machines Corporation | Invoking an audio hyperlink |
US8032375B2 (en) * | 2006-03-17 | 2011-10-04 | Microsoft Corporation | Using generic predictive models for slot values in language modeling |
JP4353202B2 (ja) * | 2006-05-25 | 2009-10-28 | ソニー株式会社 | 韻律識別装置及び方法、並びに音声認識装置及び方法 |
US8121890B2 (en) * | 2006-06-09 | 2012-02-21 | International Business Machines Corporation | Method and system for automated service climate measurement based on social signals |
US8073681B2 (en) | 2006-10-16 | 2011-12-06 | Voicebox Technologies, Inc. | System and method for a cooperative conversational voice user interface |
US9318100B2 (en) | 2007-01-03 | 2016-04-19 | International Business Machines Corporation | Supplementing audio recorded in a media file |
US7818176B2 (en) | 2007-02-06 | 2010-10-19 | Voicebox Technologies, Inc. | System and method for selecting and presenting advertisements based on natural language processing of voice-based input |
US8126860B2 (en) * | 2007-07-17 | 2012-02-28 | Ricoh Company, Limited | Method and apparatus for processing data |
US8712758B2 (en) | 2007-08-31 | 2014-04-29 | Microsoft Corporation | Coreference resolution in an ambiguity-sensitive natural language processing system |
US8229970B2 (en) * | 2007-08-31 | 2012-07-24 | Microsoft Corporation | Efficient storage and retrieval of posting lists |
US8229730B2 (en) * | 2007-08-31 | 2012-07-24 | Microsoft Corporation | Indexing role hierarchies for words in a search index |
US8346756B2 (en) * | 2007-08-31 | 2013-01-01 | Microsoft Corporation | Calculating valence of expressions within documents for searching a document index |
US20090070322A1 (en) * | 2007-08-31 | 2009-03-12 | Powerset, Inc. | Browsing knowledge on the basis of semantic relations |
US8316036B2 (en) | 2007-08-31 | 2012-11-20 | Microsoft Corporation | Checkpointing iterators during search |
US8280721B2 (en) * | 2007-08-31 | 2012-10-02 | Microsoft Corporation | Efficiently representing word sense probabilities |
US8868562B2 (en) * | 2007-08-31 | 2014-10-21 | Microsoft Corporation | Identification of semantic relationships within reported speech |
US8209321B2 (en) * | 2007-08-31 | 2012-06-26 | Microsoft Corporation | Emphasizing search results according to conceptual meaning |
US8463593B2 (en) * | 2007-08-31 | 2013-06-11 | Microsoft Corporation | Natural language hypernym weighting for word sense disambiguation |
US7996214B2 (en) * | 2007-11-01 | 2011-08-09 | At&T Intellectual Property I, L.P. | System and method of exploiting prosodic features for dialog act tagging in a discriminative modeling framework |
US8589366B1 (en) * | 2007-11-01 | 2013-11-19 | Google Inc. | Data extraction using templates |
US8140335B2 (en) | 2007-12-11 | 2012-03-20 | Voicebox Technologies, Inc. | System and method for providing a natural language voice user interface in an integrated voice navigation services environment |
US8061142B2 (en) * | 2008-04-11 | 2011-11-22 | General Electric Company | Mixer for a combustor |
US9305548B2 (en) | 2008-05-27 | 2016-04-05 | Voicebox Technologies Corporation | System and method for an integrated, multi-modal, multi-device natural language voice services environment |
US8589161B2 (en) | 2008-05-27 | 2013-11-19 | Voicebox Technologies, Inc. | System and method for an integrated, multi-modal, multi-device natural language voice services environment |
US10127231B2 (en) | 2008-07-22 | 2018-11-13 | At&T Intellectual Property I, L.P. | System and method for rich media annotation |
US8374873B2 (en) * | 2008-08-12 | 2013-02-12 | Morphism, Llc | Training and applying prosody models |
JP5499038B2 (ja) | 2008-09-18 | 2014-05-21 | コーニンクレッカ フィリップス エヌ ヴェ | システム制御方法及び信号処理システム |
US9348816B2 (en) * | 2008-10-14 | 2016-05-24 | Honda Motor Co., Ltd. | Dialog coherence using semantic features |
US9129601B2 (en) * | 2008-11-26 | 2015-09-08 | At&T Intellectual Property I, L.P. | System and method for dialog modeling |
US8326637B2 (en) | 2009-02-20 | 2012-12-04 | Voicebox Technologies, Inc. | System and method for processing multi-modal device interactions in a natural language voice services environment |
US8484225B1 (en) * | 2009-07-22 | 2013-07-09 | Google Inc. | Predicting object identity using an ensemble of predictors |
US9171541B2 (en) | 2009-11-10 | 2015-10-27 | Voicebox Technologies Corporation | System and method for hybrid processing in a natural language voice services environment |
US9502025B2 (en) | 2009-11-10 | 2016-11-22 | Voicebox Technologies Corporation | System and method for providing a natural language content dedication service |
CN102237081B (zh) * | 2010-04-30 | 2013-04-24 | 国际商业机器公司 | 语音韵律评估方法与系统 |
WO2012110690A1 (en) * | 2011-02-15 | 2012-08-23 | Nokia Corporation | Method apparatus and computer program product for prosodic tagging |
TWI441163B (zh) * | 2011-05-10 | 2014-06-11 | Univ Nat Chiao Tung | 中文語音辨識裝置及其辨識方法 |
US9401138B2 (en) * | 2011-05-25 | 2016-07-26 | Nec Corporation | Segment information generation device, speech synthesis device, speech synthesis method, and speech synthesis program |
US8959082B2 (en) | 2011-10-31 | 2015-02-17 | Elwha Llc | Context-sensitive query enrichment |
US10008206B2 (en) * | 2011-12-23 | 2018-06-26 | National Ict Australia Limited | Verifying a user |
US10528913B2 (en) | 2011-12-30 | 2020-01-07 | Elwha Llc | Evidence-based healthcare information management protocols |
US10340034B2 (en) | 2011-12-30 | 2019-07-02 | Elwha Llc | Evidence-based healthcare information management protocols |
US20130173298A1 (en) | 2011-12-30 | 2013-07-04 | Elwha LLC, a limited liability company of State of Delaware | Evidence-based healthcare information management protocols |
US10552581B2 (en) | 2011-12-30 | 2020-02-04 | Elwha Llc | Evidence-based healthcare information management protocols |
US10475142B2 (en) | 2011-12-30 | 2019-11-12 | Elwha Llc | Evidence-based healthcare information management protocols |
US10559380B2 (en) | 2011-12-30 | 2020-02-11 | Elwha Llc | Evidence-based healthcare information management protocols |
US10679309B2 (en) | 2011-12-30 | 2020-06-09 | Elwha Llc | Evidence-based healthcare information management protocols |
US20130325482A1 (en) * | 2012-05-29 | 2013-12-05 | GM Global Technology Operations LLC | Estimating congnitive-load in human-machine interaction |
US9424233B2 (en) | 2012-07-20 | 2016-08-23 | Veveo, Inc. | Method of and system for inferring user intent in search input in a conversational interaction system |
US9465833B2 (en) | 2012-07-31 | 2016-10-11 | Veveo, Inc. | Disambiguating user intent in conversational interaction system for large corpus information retrieval |
US9798799B2 (en) * | 2012-11-15 | 2017-10-24 | Sri International | Vehicle personal assistant that interprets spoken natural language input based upon vehicle context |
RU2530268C2 (ru) * | 2012-11-28 | 2014-10-10 | Общество с ограниченной ответственностью "Спиктуит" | Способ обучения информационной диалоговой системы пользователем |
US9761247B2 (en) * | 2013-01-31 | 2017-09-12 | Microsoft Technology Licensing, Llc | Prosodic and lexical addressee detection |
US10121493B2 (en) | 2013-05-07 | 2018-11-06 | Veveo, Inc. | Method of and system for real time feedback in an incremental speech input interface |
US10186262B2 (en) * | 2013-07-31 | 2019-01-22 | Microsoft Technology Licensing, Llc | System with multiple simultaneous speech recognizers |
CN107003996A (zh) | 2014-09-16 | 2017-08-01 | 声钰科技 | 语音商务 |
WO2016044321A1 (en) | 2014-09-16 | 2016-03-24 | Min Tang | Integration of domain information into state transitions of a finite state transducer for natural language processing |
CN107003999B (zh) | 2014-10-15 | 2020-08-21 | 声钰科技 | 对用户的在先自然语言输入的后续响应的系统和方法 |
US10614799B2 (en) | 2014-11-26 | 2020-04-07 | Voicebox Technologies Corporation | System and method of providing intent predictions for an utterance prior to a system detection of an end of the utterance |
US10431214B2 (en) | 2014-11-26 | 2019-10-01 | Voicebox Technologies Corporation | System and method of determining a domain and/or an action related to a natural language input |
US9852136B2 (en) | 2014-12-23 | 2017-12-26 | Rovi Guides, Inc. | Systems and methods for determining whether a negation statement applies to a current or past query |
US9854049B2 (en) | 2015-01-30 | 2017-12-26 | Rovi Guides, Inc. | Systems and methods for resolving ambiguous terms in social chatter based on a user profile |
TWI562000B (en) * | 2015-12-09 | 2016-12-11 | Ind Tech Res Inst | Internet question answering system and method, and computer readable recording media |
US11210324B2 (en) * | 2016-06-03 | 2021-12-28 | Microsoft Technology Licensing, Llc | Relation extraction across sentence boundaries |
WO2018023106A1 (en) | 2016-07-29 | 2018-02-01 | Erik SWART | System and method of disambiguating natural language processing requests |
JP6461058B2 (ja) * | 2016-09-06 | 2019-01-30 | 国立大学法人京都大学 | 音声対話装置および音声対話装置を用いた自動対話方法 |
US10373515B2 (en) | 2017-01-04 | 2019-08-06 | International Business Machines Corporation | System and method for cognitive intervention on human interactions |
US10235990B2 (en) | 2017-01-04 | 2019-03-19 | International Business Machines Corporation | System and method for cognitive intervention on human interactions |
US10318639B2 (en) | 2017-02-03 | 2019-06-11 | International Business Machines Corporation | Intelligent action recommendation |
CN108717413B (zh) * | 2018-03-26 | 2021-10-08 | 浙江大学 | 一种基于假设性半监督学习的开放领域问答方法 |
JP6969491B2 (ja) * | 2018-05-11 | 2021-11-24 | トヨタ自動車株式会社 | 音声対話システム、音声対話方法及びプログラム |
JP7063779B2 (ja) * | 2018-08-31 | 2022-05-09 | 国立大学法人京都大学 | 音声対話システム、音声対話方法、プログラム、学習モデル生成装置及び学習モデル生成方法 |
US11140110B2 (en) | 2018-10-26 | 2021-10-05 | International Business Machines Corporation | Adaptive dialog strategy for multi turn conversation systems using interaction sequences |
DE102018133694B4 (de) * | 2018-12-28 | 2023-09-07 | Volkswagen Aktiengesellschaft | Verfahren zur Verbesserung der Spracherkennung einer Benutzerschnittstelle |
US11256868B2 (en) | 2019-06-03 | 2022-02-22 | Microsoft Technology Licensing, Llc | Architecture for resolving ambiguous user utterance |
CN110400576B (zh) * | 2019-07-29 | 2021-10-15 | 北京声智科技有限公司 | 语音请求的处理方法及装置 |
TWI721516B (zh) * | 2019-07-31 | 2021-03-11 | 國立交通大學 | 用以產生局部倒語速之估計値之方法與據以產生局部倒語速之預測値之裝置與方法 |
US11928430B2 (en) * | 2019-09-12 | 2024-03-12 | Oracle International Corporation | Detecting unrelated utterances in a chatbot system |
CN110782871B (zh) * | 2019-10-30 | 2020-10-30 | 百度在线网络技术(北京)有限公司 | 一种韵律停顿预测方法、装置以及电子设备 |
US11361754B2 (en) * | 2020-01-22 | 2022-06-14 | Conduent Business Services, Llc | Method and system for speech effectiveness evaluation and enhancement |
CN113688685B (zh) * | 2021-07-26 | 2023-09-22 | 天津大学 | 基于交互场景下的手语识别方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08106298A (ja) * | 1994-08-09 | 1996-04-23 | Toshiba Corp | 対話処理装置及び対話処理方法 |
JP2000200273A (ja) * | 1998-11-04 | 2000-07-18 | Atr Interpreting Telecommunications Res Lab | 発話意図認識装置 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2119397C (en) * | 1993-03-19 | 2007-10-02 | Kim E.A. Silverman | Improved automated voice synthesis employing enhanced prosodic treatment of text, spelling of text and rate of annunciation |
US5751907A (en) | 1995-08-16 | 1998-05-12 | Lucent Technologies Inc. | Speech synthesizer having an acoustic element database |
US5790978A (en) | 1995-09-15 | 1998-08-04 | Lucent Technologies, Inc. | System and method for determining pitch contours |
US20040049391A1 (en) * | 2002-09-09 | 2004-03-11 | Fuji Xerox Co., Ltd. | Systems and methods for dynamic reading fluency proficiency assessment |
US7610190B2 (en) | 2003-10-15 | 2009-10-27 | Fuji Xerox Co., Ltd. | Systems and methods for hybrid text summarization |
US7542971B2 (en) | 2004-02-02 | 2009-06-02 | Fuji Xerox Co., Ltd. | Systems and methods for collaborative note-taking |
US7542903B2 (en) | 2004-02-18 | 2009-06-02 | Fuji Xerox Co., Ltd. | Systems and methods for determining predictive models of discourse functions |
US20050187772A1 (en) | 2004-02-25 | 2005-08-25 | Fuji Xerox Co., Ltd. | Systems and methods for synthesizing speech using discourse function level prosodic features |
-
2004
- 2004-02-18 US US10/781,443 patent/US7542903B2/en not_active Expired - Fee Related
- 2004-03-23 US US10/807,532 patent/US7283958B2/en not_active Expired - Fee Related
- 2004-03-23 US US10/807,009 patent/US7415414B2/en not_active Expired - Fee Related
-
2005
- 2005-02-16 JP JP2005039648A patent/JP2005234572A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08106298A (ja) * | 1994-08-09 | 1996-04-23 | Toshiba Corp | 対話処理装置及び対話処理方法 |
JP2000200273A (ja) * | 1998-11-04 | 2000-07-18 | Atr Interpreting Telecommunications Res Lab | 発話意図認識装置 |
Also Published As
Publication number | Publication date |
---|---|
US7415414B2 (en) | 2008-08-19 |
US7542903B2 (en) | 2009-06-02 |
US20050182625A1 (en) | 2005-08-18 |
US7283958B2 (en) | 2007-10-16 |
US20050182619A1 (en) | 2005-08-18 |
US20050182618A1 (en) | 2005-08-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2005234572A (ja) | 談話機能に対する予測モデルを判定する方法およびシステム | |
JP4846336B2 (ja) | 会話制御装置 | |
JP4849663B2 (ja) | 会話制御装置 | |
US10741170B2 (en) | Speech recognition method and apparatus | |
US6839667B2 (en) | Method of speech recognition by presenting N-best word candidates | |
JP4888996B2 (ja) | 会話制御装置 | |
JP4849662B2 (ja) | 会話制御装置 | |
KR102390940B1 (ko) | 음성 인식을 위한 컨텍스트 바이어싱 | |
US6754626B2 (en) | Creating a hierarchical tree of language models for a dialog system based on prompt and dialog context | |
US20180137109A1 (en) | Methodology for automatic multilingual speech recognition | |
US10902846B2 (en) | Spoken language understanding apparatus and spoken language understanding method using the same | |
JP2007114621A (ja) | 会話制御装置 | |
CN105336322A (zh) | 多音字模型训练方法、语音合成方法及装置 | |
JP2001005488A (ja) | 音声対話システム | |
CN104299623A (zh) | 语音应用中用于自动确认和消歧模块的方法和系统 | |
WO2010100853A1 (ja) | 言語モデル適応装置、音声認識装置、言語モデル適応方法、及びコンピュータ読み取り可能な記録媒体 | |
US6963834B2 (en) | Method of speech recognition using empirically determined word candidates | |
CN115116428B (zh) | 韵律边界标注方法、装置、设备、介质及程序产品 | |
JP2010139745A (ja) | 統計的発音変異モデルを記憶する記録媒体、自動音声認識システム及びコンピュータプログラム | |
JP4269625B2 (ja) | 音声認識辞書作成方法及びその装置と音声認識装置 | |
JP4475628B2 (ja) | 会話制御装置、会話制御方法並びにこれらのプログラム | |
JP3958908B2 (ja) | 書き起こしテキスト自動生成装置、音声認識装置および記録媒体 | |
US11804225B1 (en) | Dialog management system | |
JP2009156941A (ja) | 木構造辞書を記録した記憶媒体、木構造辞書作成装置、及び木構造辞書作成プログラム | |
JP3369121B2 (ja) | 音声認識方法および音声認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080214 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080214 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100721 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100824 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101022 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110419 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20111004 |