JP2015130176A - 会議内容構造化装置及び方法 - Google Patents
会議内容構造化装置及び方法 Download PDFInfo
- Publication number
- JP2015130176A JP2015130176A JP2015001541A JP2015001541A JP2015130176A JP 2015130176 A JP2015130176 A JP 2015130176A JP 2015001541 A JP2015001541 A JP 2015001541A JP 2015001541 A JP2015001541 A JP 2015001541A JP 2015130176 A JP2015130176 A JP 2015130176A
- Authority
- JP
- Japan
- Prior art keywords
- concept
- structuring
- level
- unit
- structured
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 62
- 239000000284 extract Substances 0.000 claims description 15
- 238000004891 communication Methods 0.000 claims description 13
- 238000000605 extraction Methods 0.000 claims description 12
- 238000007373 indentation Methods 0.000 claims description 12
- 238000012937 correction Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 description 24
- 230000006870 function Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 8
- 238000013500 data storage Methods 0.000 description 4
- 210000004556 brain Anatomy 0.000 description 3
- 239000004973 liquid crystal related substance Substances 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 239000011521 glass Substances 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 239000010409 thin film Substances 0.000 description 2
- 210000003423 ankle Anatomy 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 238000005562 fading Methods 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/137—Hierarchical processing, e.g. outlines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2250/00—Details of telephonic subscriber devices
- H04M2250/74—Details of telephonic subscriber devices with voice recognition means
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- User Interface Of Digital Computer (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】 会議内容構造化装置を提供する。【解決手段】 会議内容構造化装置は、音声を認識して、音声に対応するテキストを生成する音声認識部と、生成されたテキストを、主題によってクラスタリングし、1つ以上のクラスターを生成するクラスタリング部と、生成された各クラスターの概念を抽出する概念抽出部と、抽出された各概念のレベルを分析するレベル分析部と、分析結果に基づいて、各概念を構造化する構造化部と、を含む。【選択図】 図1
Description
本発明は、会議内容構造化装置及び方法と関する。
業務において、会議が占める比重は非常に大きい。創意性が大きく強調及び奨励される競争時代である現在、アイディアは、多様な形態の会議を通じて生まれ、集められ、このような会議を効率的に行うための多様な技法やツールが提案されている。
一方、人間の頭脳は、音声で伝達される情報を理解または分析して、頭脳内で構造化して記憶するが、このような記憶は、反復的な学習や強い刺激ではない場合には、経時的に薄れることが一般的である。特に、予測しにくい内容が多様なレベルで展開されるアイディア会議の場合には、頭脳のみで会議内容と流れとを構造化するのには限界がある。「構造化(structuring)」は、「構成」、「形成」、「構築」等と言及されてもよい。
本発明は、会議内容構造化装置及び方法を提供することである。
本発明の一態様による会議内容構造化装置は、音声を認識して、音声に対応するテキストを生成する音声認識部と、生成されたテキストを、主題によってクラスタリングして、1つ以上のクラスターを生成するクラスタリング部と、生成された各クラスターの概念(concept)を抽出する概念抽出部と、抽出された各概念のレベルを分析するレベル分析部と、分析結果に基づいて、前記各概念を構造化する構造化部と、を含みうる。
クラスタリング部は、生成されたテキストからキーワードを抽出し、該抽出されたキーワードに基づいてテキストを、主題によってクラスタリングすることができる。
クラスタリング部は、所定サイスのスライディングウィンドウのテキストに対してクラスタリングすることができる。
概念抽出部は、抽出された概念に基づいて各クラスターを表現する少なくとも1つの文句または文章を生成することができる。
レベル分析部は、あらかじめ構築されたオントロジーに基づいて、各概念のレベルを分析することができる。
構造化部は、上位レベル及び/または下位レベルの概念間の関係が表われるように、レベル別インデントを用いて構造化するインデント方式、または各概念をノードとし、上位レベル及び/または下位レベルの概念間の関係をエッジとするグラフで構造化するグラフ方式を用いて、各概念を構造化することができる。
会議内容構造化装置は、構造化された各概念をディスプレイするディスプレイ部をさらに含みうる。
会議内容構造化装置は、構造を変更するか、構造化された各概念の内容を変更して、構造化された各概念を修正する修正部をさらに含みうる。
会議内容構造化装置は、構造化された各概念を他の装置に伝送する通信部をさらに含みうる。
会議内容構造化装置は、音声の話者を識別する話者識別部をさらに含みうる。
本発明の他の態様による会議内容構造化方法は、音声を認識して、音声に対応するテキストを生成する段階と、生成されたテキストを、主題によってクラスタリングして、1つ以上のクラスターを生成する段階と、生成された各クラスターの概念を抽出する段階と、抽出された各概念のレベルを分析する段階と、分析結果に基づいて抽出された各概念を構造化する段階と、を含みうる。
クラスターを生成する段階は、生成されたテキストからキーワードを抽出する段階と、抽出されたキーワードに基づいてテキストを、主題によってクラスタリングする段階と、を含みうる。
クラスターを生成する段階は、所定サイスのスライディングウィンドウのテキストに対してクラスタリングすることができる。
概念を抽出する段階は、抽出された概念に基づいて生成された各クラスターを表現する少なくとも1つの文句または文章を生成することができる。
概念のレベルを分析する段階は、あらかじめ構築されたオントロジーに基づいて抽出された各概念のレベルを分析することができる。
各概念を構造化する段階は、上位レベル及び/または下位レベルの概念間の関係が表われるように、レベル別インデントを用いて構造化するインデント方式、または前記各概念をノードとし、前記上位レベル及び/または下位レベルの概念間の関係をエッジとするグラフで構造化するグラフ方式を用いて、各概念を構造化することができる。
会議内容構造化方法は、構造化された各概念をディスプレイする段階をさらに含みうる。
会議内容構造化方法は、構造を変更するか、構造化された各概念の内容を変更して、構造化された各概念を修正する段階をさらに含みうる。
会議内容構造化方法は、構造化された各概念を他の装置に伝送する段階をさらに含みうる。
会議内容構造化方法は、音声の話者を識別する段階をさらに含みうる。
次の詳細な説明は、本明細書に記載の方法、装置、及び/またはシステムの包括的な理解を助けるために提供される。しかし、本明細書に記載の方法、装置、及び/またはシステムの多様な変更、修正及び均等物は、当業者に明白である。説明された処理段階及び/または動作の進行は、一例に過ぎず、動作の順序は、本明細書に記載の例に限定されず、特定の順序で必須的に発生する段階及び/または動作を除いては変更されうる。また、当業者に公知の機能及び構造についての説明は、本発明の要旨を不明にする恐れがあるので、省略されうる。
本明細書に説明された特徴は、多様な形態として具現され、本明細書に記載の例に限定されるものと解釈されてはならない。
図1は、会議内容構造化装置100の一実施形態を示すブロック図である。
図1を参照すれば、一実施形態による会議内容構造化装置100は、音声入力部110、ユーザ入力部120、保存部130、ディスプレイ部140、制御部150、及び通信部160を含みうる。
音声入力部110は、ユーザの音声を入力される装置であって、会議内容構造化装置100に内蔵されたマイクまたは会議内容構造化装置100に連結可能な外部マイクなどを含みうる。
ユーザ入力部120は、ユーザから多様な操作信号を入力されて会議内容構造化装置100の動作制御のための入力データを発生させることができる。ユーザ入力部120は、例えば、キーパッド(key pad)、ドームスイッチ(dome switch)、タッチパッド(touch pad)(定圧/静電)、ジョグホイール(Jog wheel)、ジョグスイッチ(Jog switch)、H/Wボタン、及び/または当業者に公知の他の装置などを含みうる。後述するように、タッチパッドがディスプレイ部140と相互レイヤ構造を成す場合、これをタッチスクリーンと言う。
保存部130は、会議内容構造化装置100の機能遂行に必要なデータ及び機能遂行中に発生するデータを保存することができる。また、保存部130は、会議内容構造化装置100の機能遂行結果データを保存することができる。保存部130は、本願により開示される方法の各ステップを会議内容構造化装置100に実行させるコンピュータプログラムを保存する。そのようなコンピュータプログラムは、保存部130に予め保存されていてもよいし、或いは、必要に応じて通信部160を介してダウンロードされてもよい。
保存部130は、フラッシュメモリタイプ(flash memory type)、ハードディスクタイプ(hard disk type)、マルチメディアカードマイクロタイプ(multimedia card micro type)、カードタイプのメモリ(例えば、SDまたはXDメモリなど)、RAM(Random Access Memory)、SRAM(Static Random Access Memory)、ROM(Read Only Memory)、EEPROM(Electrically Erasable Programmable Read Only Momory)、PROM(Programmable Read Only Memory)、磁気メモリ、磁気ディスク、光ディスク、及び/または当業者に公知の記録媒体などを含みうる。また、保存部130は、別途の外部記録媒体をさらに含みうる。
ディスプレイ部140は、会議内容構造化装置100で処理される情報をディスプレイすることができる。「ディスプレイする」は、「表示する」又は「表現する」等と言及されてもよい。また、後述するように、ディスプレイ部140は、会議内容構造化装置100の機能遂行結果をディスプレイすることができる。
ディスプレイ部140は、液晶ディスプレイ(Liquid Crystal Display)、薄膜トランジスタ液晶ディスプレイ(Thin Film Transistor Liquid Crystal Display)、有機発光ダイオード(Organic Light Emitting Diode)、フレキシブルディスプレイ(Flexible Display)、3次元ディスプレイ(3D Display)、及び/または当業者に公知の他の装置などを含みうる。また、ディスプレイ部140は、2個以上のディスプレイを含みうる。
一方、ディスプレイ部140とタッチパッドが、相互レイヤ構造を成してタッチスクリーンで構成され、この場合、ディスプレイ部140は、出力装置以外に入力装置としても使われる。
制御部150は、会議内容構造化装置100の全般的な動作を制御することができる。制御部150は、ユーザ入力部120から入力される入力信号によって会議内容構造化装置100の機能を行い、機能遂行状態及び機能遂行結果などの情報をディスプレイ部140を通じて表示することができる。
また、制御部150は、ユーザが発話した音声を認識して生成されたテキストデータを主題別にクラスタリングし、各クラスターの概念のレベルを分析して構造化することができる。「レベル」は「階層」等と言及されてもよい。制御部150は、構造化された各概念をディスプレイ部140を通じてディスプレイすることができる。
制御部150に関する詳しい説明は、図2及び図3を参照して後述する。
通信部160は、無線インターネット、無線イントラネット、無線電話ネットワーク、無線LAN、ワイファイ(Wi−Fi)ネットワーク、ワイファイダイレクト(Wi−Fi Direct)ネットワーク、3G(Generation)ネットワーク、4G(Generation)LTE(Long Term Evolution)ネットワーク、ブルートゥース(登録商標:Bluetooth)ネットワーク、赤外線通信(Infrared Data Association:IrDA)ネットワーク、RFID(Radio Frequency Identification)ネットワーク、UWB(UltraWideBand)ネットワーク、ジグビー(登録商標:Zigbee)ネットワーク、NFC(Near Field Communication)ネットワーク、及び/または当業者に公知の他のネットワークのような有線または無線ネットワークを通じて他の装置とデータを送受信することができる。このために、通信部160は、移動通信モジュール、無線インターネットモジュール、有線インターネットモジュール、ブルートゥースモジュール、NFCモジュール、及び/または当業者に公知の他のモジュールなどを含みうるが、これらに限定されるものではない。
この場合、会議内容構造化装置100は、通信部160を通じて個人別インタラクションが可能な他の装置(例えば、タブレットPCなど)に機能遂行結果を伝送することによって、機能遂行結果に他の装置とリアルタイムで共有することが可能である。
図2は、制御部150の一実施形態を示すブロック図である。
図2を参照すれば、一実施形態による制御部150は、音声認識部210、クラスタリング部220、概念抽出部230、レベル分析部240、及び構造化部250を含みうる。
音声認識部210は、音声入力部110を通じて入力されたユーザの音声を認識して、ユーザの音声に対応するテキストデータを生成することができる。
さらに具体的に、音声認識部210は、STT(Speech to Text)エンジンを用いて、ユーザの音声に対応するテキストデータを生成することができる。STTエンジンは、従来に開示されている多様なSTTアルゴリズムを用いて入力された音声信号をテキストに変換するためのモジュールである。
例えば、音声認識部210は、ユーザの音声内で、ユーザが発話した音声の開始と終了とを検出して、音声区間を判断することができる。さらに具体的に、音声認識部210は、入力された音声信号のエネルギーを計算し、該計算されたエネルギーによって音声信号のエネルギーレベルを分類して、動的プログラミングを通じて音声区間を検出することができる。そして、音声認識部210は、検出された音声区間内の音声信号で音響モデル(Acoustic Model)に基づいて音声の最小単位である音素を検出して音素データを生成し、該生成された音素データにHMM(Hidden Markov Model)確率モデルを適用して、ユーザの音声をテキストに変換することができる。しかし、このようなユーザの音声を認識する方法は、一実施形態に過ぎず、他の方法を通じてユーザの音声を認識することができる。
クラスタリング部220は、音声認識部210から生成されたテキストデータを主題別にクラスタリングすることができる。「主題(subject)」は「テーマ」、「題目」等と表現されてもよい。
一実施形態によれば、クラスタリング部220は、テキストデータから各文章別に主要キーワードを抽出し、該抽出されたキーワードに基づいて、各文章を類似主題の文章どうしでクラスタリングして、1つ以上のクラスターを生成することができる。この際、クラスタリング部220は、多様なキーワード抽出規則を用いてキーワードを抽出することができる。
例えば、クラスタリング部220は、各文章を構文分析(syntactic analysis)し、分析結果に基づいて名詞を各文章のキーワードとして抽出することができる。
また、クラスタリング部220は、出現頻度の高い単語または文句を、各文章のキーワードとして抽出することができる。「文句」は、「語句」、「フレーズ」、「言い回し」、「表現」等と言及されてもよい。出現頻度の高い単語または文句をキーワードとして抽出する場合、クラスタリング部220は、キーワード抽出対象文章の以前または以後の文章を参考することもでき、この際、参考する文章は、複数個であり得る。「文章」は1つ以上の文を含む。
しかし、前述した方法は、キーワードを抽出する多様な方法のうち1つを例示したものであり、従来に開示されている多様なキーワード抽出アルゴリズムを利用できる。
また、一実施形態によれば、音声データ及び音声データに基づいて生成されたテキストデータは、ストリームデータであり得るので、クラスタリング部220は、テキストデータを所定サイスのスライディングウィンドウ単位で管理することができる。すなわち、クラスタリング部220は、所定サイスのスライディングウィンドウに含まれたテキストデータを主題別にクラスタリングすることができる。
概念抽出部230は、クラスタリング部220から生成されたクラスター別に意味分析(semantic analysis)を通じて概念を抽出し、該抽出された概念に基づいて各クラスターを表現する1つ以上の文句または文章を生成することができる。「概念(concept)」は、「コンセプト」、「観念」等と言及されてもよい。
一実施形態によれば、概念抽出部230は、文書要約(document summarization)技法を用いて、各クラスターを表現する1つ以上の文句または文章を生成することができる。詳しくは、概念抽出部230は、クラスター内のテキストでそのクラスターを代表するほどの文章を抽出して再構成する抽出要約(extract summarization)方式及び抽出したキーワードなどを活用して文章を生成する生成要約(abstract summarization)方式を含む多様な文書要約技法を用いて、各クラスターを表現する1つ以上の文句または文章を生成することができる。
レベル分析部240は、抽出された各概念のレベルを分析することができる。この際、各概念のレベルは、上位レベル及び/または下位レベル概念間の関係を意味する。一例として、概念は、「上位」であるほど一般的又は包括的な内容に対応する。一例として、概念は、「下位」であるほど個別的又は具体的な内容に対応する。
一実施形態によれば、レベル分析部240は、概念の階層構造で構成されたオントロジー(ontology)に基づいて、各概念のレベルを分析することができる。この際、オントロジーは、会議内容構造化装置100にあらかじめ構築されており、会議内容構造化装置100の外部サーバにあらかじめ構築されている。
オントロジーが会議内容構造化装置100の外部サーバにあらかじめ構築されている場合、レベル分析部240は、通信部160を通じて、外部サーバと通信することができる。すなわち、レベル分析部240は、通信部160を通じて外部サーバに概念のレベル分析を要請し、外部サーバから概念のレベル分析結果を受信することができる。この場合、外部サーバは、概念のレベル分析要請を受信して、あらかじめ構築されたオントロジーに基づいて概念のレベルを分析して、その結果を通信部160を通じてレベル分析部240に伝送しうる。
構造化部250は、レベル分析部240の分析結果に基づいて、各概念を構造化することができる。一実施形態によれば、構造化部250は、上位レベル及び/または下位レベル概念間の関係が表われるように、各概念を構造化することができる。
例えば、構造化部250は、インデント方式、グラフ方式などを用いて各概念を構造化することができる。ここで、インデント方式は、書式ある文字列の形態で文頭とレベル別インデントとを通じて構造化する方式を言い、グラフ方式は、ノードとエッジとを含むグラフを利用して構造化する方式を言う。
これに関する詳しい説明は、図4を参照して後述する。
図3は、制御部150の他の実施形態を示すブロック図である。図3を参照すれば、制御部150は、話者識別部310、修正部320をさらに含みうる。ここで、図2に登場する要素と同一の参照符号は、同じ要素を表わすので、その詳細な説明を省略する。
話者識別部310は、入力された音声を分析して話者を識別することができる。
一実施形態によれば、話者識別部310は、入力された音声から音声特徴を抽出し、該抽出された音声特徴に基づいて入力された音声の話者を識別することができる。
他の実施形態によれば、話者識別部310は、あらかじめ生成された話者認識モデルを通じて入力された音声の話者を識別することが可能である。この際、話者認識モデルは、ユーザの音声から抽出された音声特徴を学習させてあらかじめ生成されたモデルであって、GMM(Gaussian Mixture Model)、HMM(Hidden Markov Model)、SVM(Support Vector Machine)など多様なモデル生成技法を用いて生成されうる。
一方、図3は、話者識別部310及び音声認識部210を別個の構成部で区別して別個の機能を行うものと説明したが、これに限定されるものではなく、話者識別部310及び音声認識部210の機能をいずれも行う1つの構成部で具現されることもある。
修正部320は、ユーザの命令に基づいて構造化された各概念を修正することができる。例えば、修正部320は、ユーザ入力部120を通じて入力されたユーザの命令を受信して、構造を変更するか、各概念の内容を変更して、構造化された各概念を修正することができる。これを通じて、ユーザは、構造化された会議内容を修正することが可能である。
図3または図4に示された、制御部150は、プログラムコードの集合及びプログラムコードを実行するマイクロプロセッサとして具現可能である。
図4Aは、各概念をインデント形態で構造化して視覚化した例を示す図面である。図4Aを参照すれば、制御部150は、各概念のレベル、すなわち、上位レベル及び/または下位レベルの概念間の関係が表われるように、レベル別インデントを用いて各概念を構造化することができる。
この際、書式は、あらかじめ設定され、上位レベル概念は、下位レベル概念に比べて、文字サイズが大きく、濃く表示される。また、ユーザの命令に基づいて各概念を修正できるように、修正位置を表わすフレームカーソル410が共に表示される。
しかし、これは、一例に過ぎ、これに限定されるものではない。
図4Bは、各概念をグラフ形態で構造化して視覚化した例を示す図面である。図4Bを参照すれば、制御部150は、各概念のレベル、すなわち、上位レベル及び/または下位レベルの概念間の関係が表われるように、ノードとエッジとで構成されたグラフ形態で各概念を構造化することができる。この際、各ノードは、各概念を表わし、エッジは、上位レベル及び/または下位レベルの概念間の関係を表わすことができる。また、ユーザの命令に基づいて各概念を修正できるように、修正位置を表わすフレームカーソル410が共に表示される。
一方、図4A及び図4Bを説明するに当って、構造化された各概念を視覚化する時、各概念を修正できるように、修正位置を表わすフレームカーソルが共に表示されるものと説明したが、これに限定されるものではなく、カーソルまたはポインターなどを表示しても良い。
また、フレームカーソルをディスプレイする場合には、フレームカーソルを直線、波線、1点鎖線、2点鎖線など多様な形状及び色彩で表示し、フレームカーソルをハイライトで表示するか、表示されるカーソルが一定周期で徐々に表われて消える形式で表示することもできる。
一方、前述した各概念を修正できるように、修正位置を識別するための方法は、一実施形態に過ぎず、多様な方法を使うことができる。また、前述した方法は、ユーザによって変更されうる。
図5は、会議内容構造化方法の一実施形態を示すフローチャートである。図5を参照すれば、一実施形態による会議内容構造化方法は、ユーザの音声を認識して、ユーザの音声に対応するテキストデータを生成する(510)。例えば、会議内容構造化装置100は、STTエンジンを用いて、ユーザの音声に対応するテキストデータを生成することができる。
次いで、生成されたテキストデータを主題別にクラスタリングして、1つ以上のクラスターを生成する(520)。例えば、会議内容構造化装置100は、テキストデータの各文章から主要キーワードを抽出し、該抽出されたキーワードに基づいて、各文章を類似主題の文章どうしでクラスタリングして、1つ以上のクラスターを生成することができる。この際、会議内容構造化装置100は、図2を参照して前述したように、多様なキーワード抽出規則を用いてテキストデータの各文章からキーワードを抽出することができる。
また、音声データ及び音声データに基づいて生成されたテキストデータは、ストリームデータであり得るので、会議内容構造化装置100は、テキストデータを所定サイスのスライディングウィンドウ単位で管理することができる。すなわち、会議内容構造化装置100は、所定サイスのスライディングウィンドウに含まれたテキストデータを主題別にクラスタリングすることができる。
次いで、クラスター別に概念を抽出し、該抽出された概念に基づいて各クラスターを表現する1つ以上の文句または文章を生成する(530)。例えば、会議内容構造化装置100は、意味分析を通じて各クラスターの概念を抽出し、該抽出された概念に基づいて各クラスターを表現する1つ以上の文句または文章を生成することができる。この際、会議内容構造化装置100は、多様な文書要約技法を利用できる。
次いで、各概念のレベルを分析する(540)。例えば、会議内容構造化装置100は、概念の階層構造で構成されたオントロジーに基づいて、各概念のレベルを分析することができる。
次いで、段階540の分析結果に基づいて上位レベル及び/または下位レベルの概念間の関係が表われるように、各概念を構造化することができる。例えば、会議内容構造化装置100は、インデント方式、グラフ方式などを用いて各概念を構造化することができる。ここで、インデント方式は、図4A、グラフ方式は、図4Bを参照して前述した通りである。
図6は、会議内容構造化方法の他の実施形態を示すフローチャートである。図6を参照すれば、他の実施形態による会議内容構造化方法は、入力された音声を分析して入力された音声の話者を識別する段階(505)をさらに含みうる。例えば、会議内容構造化装置100は、ユーザの入力音声から音声特徴を抽出し、該抽出された音声特徴に基づいて入力された音声の話者を識別することができる。
また、会議内容構造化方法は、構造化された各概念をディスプレイする段階(552)をさらに含みうる。例えば、会議内容構造化装置100は、構造化された各概念をディスプレイすることができる。
また、会議内容構造化方法は、構造化された各概念を他の外部装置に伝送する段階(554)をさらに含みうる。例えば、会議内容構造化装置100は、構造化された各概念を他の装置に伝送しうる。これを通じて、会議内容構造化装置100が、構造化した会議内容を個人別インタラクションが可能な他の装置(例えば、タブレットPCなど)とリアルタイムで共有することができる。
また、会議内容構造化方法は、ユーザの命令に基づいて構造化された各概念を修正する段階(556)をさらに含みうる。例えば、会議内容構造化装置100は、構造を変更するか、各概念の内容を変更して、構造化された各概念を修正することができる。
前述した多様なモジュール、要素、及び方法は、1つ以上のハードウェア構成要素、1つ以上のソフトウェア構成要素、または1つ以上のハードウェア構成要素、及び1つ以上のハードウェア構成要素の組合わせで具現可能である。
ハードウェア構成要素は、例えば、1つ以上の動作を物理的に行う物理的装置であり得るが、これに限定されるものではない。ハードウェア構成要素の例は、マイクロホン、増幅器、ローパスフィルター、ハイパスフィルター、バンドパスフィルター、アナログ−デジタルコンバータ、デジタル−アナログコンバータ、及び処理装置を含む。
ソフトウェア構成要素は、例えば、1つ以上の動作を行うためのソフトウェアまたはインストラクションによって制御される処理装置によって具現可能であるが、これに限定されるものではない。1つのソフトウェア構成要素は、1つの処理装置、1つの処理装置によって具現可能な2つ以上のソフトウェア構成要素、2つ以上の処理装置によって具現可能な1つのソフトウェア構成要素、または2つ以上の処理装置によって具現可能な2つ以上のソフトウェア構成要素で具現可能である。
処理装置は、1つ以上の汎用または特殊目的のコンピュータ、例えば、プロセッサ、コントローラとALU(Arithmetic Logic Unit)、デジタル信号プロセッサ、マイクロコンピュータ、FPGA(Field−Programmable Gate Array)、PLU(Programmable Logic Unit)、マイクロプロセッサ、またはソフトウェアを駆動するか、命令語を実行する任意の他の装置で具現可能である。処理装置は、運用体制(OS)を駆動し、運用体制で動作する1つ以上のソフトウェアアプリケーションを駆動することができる。処理装置は、ソフトウェアを駆動するか、命令語を実行する時、データに接近し、データを保存、操作、処理、及び生成することができる。説明の便宜上、本明細書で処理装置として使われるが、当業者は、処理装置は複数の処理要素及び複数の処理要素のタイプを含むということを理解できる。例えば、処理装置は、1つ以上のプロセッサ、または1つ以上のプロセッサと1つ以上のコントローラとを含みうる。また、並列プロセッサまたはマルチコアプロセッサのように異なるプロセッシング構成も可能である。
動作Aを行うソフトウェア構成要素を具現するように構成された処理装置は、動作Aを行うようにプロセッサを制御するために、ソフトウェアを駆動するか、命令語を実行するようにプログラミングされたプロセッサを含みうる。また、動作A、動作B、及び動作Cを行うソフトウェア構成要素を具現するように構成された処理装置は、多様な構成を有しうる。例えば、処理装置は、動作A、B、及びCを行うソフトウェア構成要素を具現するように構成されたプロセッサ;動作Aを行うソフトウェア構成要素を具現するように構成された第1プロセッサ、及び動作B及びCを行うソフトウェア構成要素を具現するように構成された第2プロセッサ;動作A及びBを行うソフトウェア構成要素を具現するように構成された第1プロセッサ、及び動作Cを行うソフトウェア構成要素を具現するように構成された第2プロセッサ;動作Aを行うソフトウェア構成要素を具現するように構成された第1プロセッサ、動作Bを行うソフトウェア構成要素を具現するように構成された第2プロセッサと、動作Cを行うソフトウェア構成要素を具現するように構成された第3プロセッサ;動作A、B、及びCを行うソフトウェア構成要素を具現するように構成された第1プロセッサと、動作A、B、及びCを行うソフトウェア構成要素を具現するように構成された第2プロセッサ;または動作A、B、及びCのうち1つ以上を行うように具現された1つ以上のプロセッサの任意の他の構成を有しうる。以上、3種の動作A、B、及びCに関する例について説明したが、具現される動作の数は、3種に限定されず、所望の結果を果たすか、所望の作業を行うのに必要な動作の個数は多様である。
ソフトウェア構成要素を具現する処理装置を制御するためのソフトウェアまたは命令語は、個別的または集合的に指示(instructing)するか、1つ以上の所望の動作を行う処理装置を構成するために、コンピュータプログラム、コードセグメント、命令語またはこれらの組合わせを含みうる。ソフトウェアまたは命令語は、コンパイラによって生成されたマシンコード及び/またはインタプリタを用いて処理装置によって実行可能なハイレベルコードのような、処理装置によって直接実行可能なマシンコードを含みうる。ソフトウェアまたは命令語と、任意の関連データ、データファイル及びデータ構造は、機械、構成要素、物理的または仮想的装備、コンピュータ記録媒体または装置、または処理装置によって解釈されるか、解釈されうる命令語またはデータを提供することができる伝播された信号波形(propagated signal wave)のうち、任意の類型で永久的または一時的に具現可能である。ソフトウェアまたは命令語と、任意の関連データ、データファイル、データ構造は、また分散された方式で保存及び実行されるようにネットワークで連結されたコンピュータシステム(network−coupled computer systems)に分散されうる。
例えば、ソフトウェアまたは命令語と、任意の関連データ、データファイル、データ構造は、1つ以上の非一時的なコンピュータ可読記録媒体(non−transitorycomputer−readable storage media)に記録、保存または固定されうる。非一時的なコンピュータ可読記録媒体は、ソフトウェアまたは命令語と、任意の関連データ、データファイル、データ構造をコンピュータシステムまたは処理装置が読み取り可能に保存することができる任意のデータ保存装置であり得る。例えば、非一時的なコンピュータ可読記録媒体は、ROM(Read−Only Memory)、RAM(Random−Access Memory)、Flash Memory、CD−ROMs、CD−Rs、CD+Rs、CD−RWs、CD+RWs、DVD−ROMs、DVD−Rs、DVD+Rs、DVD−RWs、DVD+RWs、DVD−RAMs、BD−ROMs、BD−Rs、BD−R LTHs、BD−Res、磁気テープ、フロッピー(登録商標)ディスク、磁気光学データ保存装置(Magneto−Optical Data Storage Devices)、光データ保存装置、ハードディスク、SSD(Solid−State Disks)、または当業者に周知の任意の他の非一時的なコンピュータ可読記録媒体を含みうる。
本明細書に開示された実施形態を具現するための機能的なプログラム、コード、及びコードセグメントは、本明細書から提供される図面及びそれに対応する説明に基づいて、当該技術分野で熟練されたプログラマーによって容易に構成することができる。
非限定的な例示として、本明細書で説明される装置は、携帯電話、スマートフォン、ウェアラブルスマート装置(例えば、指輪、時計、メガネ、腕輪、足首ブラケット(ankle bracket)、ベルト、ネックレス、イヤリング、へアバンド、ヘルメット、衣服に含まれた装置など)、パソコン(PC)、タブレットPC(タブレット)、ファブリック、PDA(Personal Digital Assistant)、デジタルカメラ、携帯用ゲーム機、MP3プレーヤー、携帯用/個人用マルチメディアプレーヤー(PMP)、携帯用電子ブック、UMPC(Ultra−Mobile Personal Computer)、携帯用ラップトップPC、GPSナビゲーションのようなモバイル装置と、HDTV(High Definition TeleVision)、光ディスクプレーヤー、DVDプレーヤー、ブルーレイプレーヤー、セットアップボックスのような装置、または本明細書で説明されたものと一致する無線通信またはネットワーク通信が可能な任意の他の装置に適用可能である。非限定的な例で、ウェアラブル装置は、メガネや腕輪のようにユーザの身体に自己装着が可能である。さらに他の非限定的な例で、ウェアラブル装置は、アームバンドを使ってスマートフォンまたはタブレットをユーザの腕に付着するか、紐を用いてウェアラブル装置をユーザの首にかけることができるなど付着装置を通じてユーザの身体に装着されうる。
本発明は、具体的な実施形態を含むが、特許請求の範囲及び均等範囲を外れずに、形態及び細部事項での多様な変更が、本実施形態で実施可能であるということは当業者に明白である。本明細書で説明される実施形態は、限定的な観点ではなく、説明的な観点で考慮されなければならない。各実施形態での特徴または態様についての説明は、類似した特徴または態様の他の例に適用可能であると見なされなければならない。説明された技術が、他の順序で行われる場合、及び/または説明されたシステム、構造、装置、または回路の構成要素が異なる方式で組合わせられるか、他の構成要素またはそれらの等価物によって置き換えまたは補充される場合に、同じ結果が得られる。したがって、発明の範囲は、詳細な説明ではない、特許請求の範囲及びその均等物によって定義され、特許請求の範囲及びその均等物の範囲内でのあらゆる変形は、本発明に含まれると解釈されねばならない。
100 会議内容構造化装置
110 音声入力部
120 ユーザ入力部
130 保存部
140 ディスプレイ部
150 制御部
160 通信部
110 音声入力部
120 ユーザ入力部
130 保存部
140 ディスプレイ部
150 制御部
160 通信部
Claims (21)
- 音声を認識し、前記音声に対応するテキストを生成する音声認識部と、
生成されたテキストを、主題によってクラスタリングすることにより、1つ以上のクラスターを生成するクラスタリング部と、
生成された各クラスターの概念を抽出する概念抽出部と、
抽出された各概念のレベルを分析するレベル分析部と、
分析結果に基づいて、前記各概念を構造化する構造化部と、
を含む会議内容構造化装置。 - 前記クラスタリング部は、前記生成されたテキストからキーワードを抽出し、該抽出されたキーワードに基づいて、前記テキストを、主題によってクラスタリングする請求項1に記載の会議内容構造化装置。
- 前記クラスタリング部は、所定サイスのスライディングウィンドウのテキストに対してクラスタリングする請求項1又は2に記載の会議内容構造化装置。
- 前記概念抽出部は、前記抽出された概念に基づいて各クラスターを表現する少なくとも1つのフレーズまたは文を生成する請求項1〜3のうち何れか一項に記載の会議内容構造化装置。
- 前記レベル分析部は、あらかじめ構築されたオントロジーに基づいて、前記各概念のレベルを分析する請求項1〜4のうち何れか一項に記載の会議内容構造化装置。
- 前記構造化部は、上位レベル及び/または下位レベルの概念間の関係が表われるように、レベル別インデントを用いて構造化するインデント方式、または前記各概念をノードとし、前記上位レベル及び/または下位レベルの概念間の関係をエッジとするグラフで構造化するグラフ方式を用いて、前記各概念を構造化する請求項1〜5のうち何れか一項に記載の会議内容構造化装置。
- 前記構造化された各概念を表示するディスプレイ部をさらに含む請求項1〜6のうち何れか一項に記載の会議内容構造化装置。
- 構造を変更することにより又は構造化された各概念の内容を変更することにより、構造化された各概念を修正する修正部をさらに含む請求項1〜7のうち何れか一項に記載の会議内容構造化装置。
- 前記構造化された各概念を他の装置に伝送する通信部をさらに含む請求項1〜8のうち何れか一項に記載の会議内容構造化装置。
- 前記音声の話者を識別する話者識別部をさらに含む請求項1〜9のうち何れか一項に記載の会議内容構造化装置。
- 音声を認識し、前記音声に対応するテキストを生成する段階と、
生成されたテキストを、主題によってクラスタリングすることにより、1つ以上のクラスターを生成する段階と、
前記生成された各クラスターの概念を抽出する段階と、
抽出された各概念のレベルを分析する段階と、
分析結果に基づいて、前記抽出された各概念を構造化する段階と、
を含む会議内容構造化方法。 - 前記クラスターを生成する段階は、
前記生成されたテキストからキーワードを抽出する段階と、
抽出されたキーワードに基づいて、前記テキストを、主題によってクラスタリングする段階と、
を含む請求項11に記載の会議内容構造化方法。 - 前記クラスターを生成する段階は、所定サイスのスライディングウィンドウのテキストに対してクラスタリングする請求項11又は12に記載の会議内容構造化方法。
- 前記概念を抽出する段階は、前記抽出された概念に基づいて生成された各クラスターを表現する少なくとも1つのフレーズまたは文を生成する請求項11〜13のうち何れか一項に記載の会議内容構造化方法。
- 前記概念のレベルを分析する段階は、あらかじめ構築されたオントロジーに基づいて、前記抽出された各概念のレベルを分析する請求項11〜14のうち何れか一項に記載の会議内容構造化方法。
- 前記各概念を構造化する段階は、上位レベル及び/または下位レベルの概念間の関係が表われるように、レベル別インデントを用いて構造化するインデント方式、または前記各概念をノードとし、前記上位レベル及び/または下位レベルの概念間の関係をエッジとするグラフで構造化するグラフ方式を用いて、前記各概念を構造化する請求項11〜15のうち何れか一項に記載の会議内容構造化方法。
- 前記構造化された各概念を表示する段階をさらに含む請求項11〜16のうち何れか一項に記載の会議内容構造化方法。
- 構造を変更することにより又は構造化された各概念の内容を変更することにより、構造化された各概念を修正する段階をさらに含む請求項11〜17のうち何れか一項に記載の会議内容構造化方法。
- 前記構造化された各概念を他の装置に伝送する段階をさらに含む請求項11〜18のうち何れか一項に記載の会議内容構造化方法。
- 前記音声の話者を識別する段階をさらに含む請求項11〜19のうち何れか一項に記載の会議内容構造化方法。
- 請求項11〜20のうちの何れか一項に記載の会議内容構造化方法を会議内容構造化装置に実行させるコンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2014-0002028 | 2014-01-07 | ||
KR1020140002028A KR20150081981A (ko) | 2014-01-07 | 2014-01-07 | 회의 내용 구조화 장치 및 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2015130176A true JP2015130176A (ja) | 2015-07-16 |
Family
ID=52396421
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015001541A Pending JP2015130176A (ja) | 2014-01-07 | 2015-01-07 | 会議内容構造化装置及び方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20150194153A1 (ja) |
EP (1) | EP2892051B1 (ja) |
JP (1) | JP2015130176A (ja) |
KR (1) | KR20150081981A (ja) |
CN (1) | CN104765723A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017167433A (ja) * | 2016-03-17 | 2017-09-21 | 株式会社東芝 | サマリ生成装置、サマリ生成方法及びサマリ生成プログラム |
JP2020087105A (ja) * | 2018-11-28 | 2020-06-04 | 株式会社ひらめき | 情報処理方法、情報処理装置及びコンピュータプログラム |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160132796A9 (en) * | 2001-07-26 | 2016-05-12 | Bernd Schneider | CPW method with application in an application system |
US9672203B1 (en) * | 2014-12-01 | 2017-06-06 | Amazon Technologies, Inc. | Calculating a maturity level of a text string |
US10075480B2 (en) * | 2016-08-12 | 2018-09-11 | International Business Machines Corporation | Notification bot for topics of interest on voice communication devices |
US10506089B2 (en) | 2016-08-12 | 2019-12-10 | International Business Machines Corporation | Notification bot for topics of interest on voice communication devices |
KR101934280B1 (ko) | 2016-10-05 | 2019-01-03 | 현대자동차주식회사 | 발화내용 분석 장치 및 방법 |
CN108153732B (zh) * | 2017-12-25 | 2021-08-03 | 浙江讯飞智能科技有限公司 | 一种审讯笔录的审查方法及装置 |
KR102252096B1 (ko) * | 2020-02-20 | 2021-05-17 | (주)폴리티카 | 빅데이터 기반 회의록 가공 서비스 제공 시스템 |
CN111899742B (zh) * | 2020-08-06 | 2021-03-23 | 广州科天视畅信息科技有限公司 | 一种提高会议进行效率的方法及系统 |
WO2022270649A1 (ko) * | 2021-06-23 | 2022-12-29 | 엘지전자 주식회사 | 무선 통신 시스템에서 음성 통신을 수행하기 위한 장치 및 방법 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005122510A (ja) * | 2003-10-17 | 2005-05-12 | Nippon Telegr & Teleph Corp <Ntt> | 話題構造抽出方法及び装置及び話題構造抽出プログラム及び話題構造抽出プログラムを記録したコンピュータ読み取り可能な記憶媒体 |
US20100161604A1 (en) * | 2008-12-23 | 2010-06-24 | Nice Systems Ltd | Apparatus and method for multimedia content based manipulation |
JP2012053855A (ja) * | 2010-09-03 | 2012-03-15 | Ricoh Co Ltd | コンテンツ閲覧装置、コンテンツ表示方法及びコンテンツ表示プログラム |
JP2013250720A (ja) * | 2012-05-31 | 2013-12-12 | Sony Corp | 情報処理装置、プログラム及び情報処理方法 |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5860063A (en) * | 1997-07-11 | 1999-01-12 | At&T Corp | Automated meaningful phrase clustering |
US20020078090A1 (en) * | 2000-06-30 | 2002-06-20 | Hwang Chung Hee | Ontological concept-based, user-centric text summarization |
US7644057B2 (en) * | 2001-01-03 | 2010-01-05 | International Business Machines Corporation | System and method for electronic communication management |
US7137062B2 (en) * | 2001-12-28 | 2006-11-14 | International Business Machines Corporation | System and method for hierarchical segmentation with latent semantic indexing in scale space |
US20050154690A1 (en) * | 2002-02-04 | 2005-07-14 | Celestar Lexico-Sciences, Inc | Document knowledge management apparatus and method |
US7085771B2 (en) * | 2002-05-17 | 2006-08-01 | Verity, Inc | System and method for automatically discovering a hierarchy of concepts from a corpus of documents |
US20040162724A1 (en) * | 2003-02-11 | 2004-08-19 | Jeffrey Hill | Management of conversations |
US7606714B2 (en) * | 2003-02-11 | 2009-10-20 | Microsoft Corporation | Natural language classification within an automated response system |
US9477658B2 (en) * | 2005-10-26 | 2016-10-25 | Cortica, Ltd. | Systems and method for speech to speech translation using cores of a natural liquid architecture system |
KR100776697B1 (ko) * | 2006-01-05 | 2007-11-16 | 주식회사 인터파크지마켓 | 고객 구매행동 분석에 기반한 지능화된 상품 검색 방법 및 시스템 |
US8230332B2 (en) * | 2006-08-30 | 2012-07-24 | Compsci Resources, Llc | Interactive user interface for converting unstructured documents |
US7577643B2 (en) * | 2006-09-29 | 2009-08-18 | Microsoft Corporation | Key phrase extraction from query logs |
US20090164387A1 (en) * | 2007-04-17 | 2009-06-25 | Semandex Networks Inc. | Systems and methods for providing semantically enhanced financial information |
US8572084B2 (en) * | 2009-07-28 | 2013-10-29 | Fti Consulting, Inc. | System and method for displaying relationships between electronically stored information to provide classification suggestions via nearest neighbor |
US8676565B2 (en) * | 2010-03-26 | 2014-03-18 | Virtuoz Sa | Semantic clustering and conversational agents |
US9378202B2 (en) * | 2010-03-26 | 2016-06-28 | Virtuoz Sa | Semantic clustering |
US9703895B2 (en) * | 2010-06-11 | 2017-07-11 | Microsoft Technology Licensing, Llc | Organizing search results based upon clustered content |
EP2585947A1 (en) * | 2010-06-23 | 2013-05-01 | Telefónica, S.A. | A method for indexing multimedia information |
WO2012047214A2 (en) * | 2010-10-06 | 2012-04-12 | Virtuoz, Sa | Visual display of semantic information |
US20120209605A1 (en) * | 2011-02-14 | 2012-08-16 | Nice Systems Ltd. | Method and apparatus for data exploration of interactions |
GB2489489B (en) * | 2011-03-30 | 2013-08-21 | Toshiba Res Europ Ltd | A speech processing system and method |
US9195635B2 (en) * | 2012-07-13 | 2015-11-24 | International Business Machines Corporation | Temporal topic segmentation and keyword selection for text visualization |
US20140278362A1 (en) * | 2013-03-15 | 2014-09-18 | International Business Machines Corporation | Entity Recognition in Natural Language Processing Systems |
US9355088B2 (en) * | 2013-07-12 | 2016-05-31 | Microsoft Technology Licensing, Llc | Feature completion in computer-human interactive learning |
-
2014
- 2014-01-07 KR KR1020140002028A patent/KR20150081981A/ko not_active Application Discontinuation
- 2014-12-23 US US14/580,548 patent/US20150194153A1/en not_active Abandoned
-
2015
- 2015-01-07 CN CN201510007504.0A patent/CN104765723A/zh not_active Withdrawn
- 2015-01-07 EP EP15150322.4A patent/EP2892051B1/en not_active Not-in-force
- 2015-01-07 JP JP2015001541A patent/JP2015130176A/ja active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005122510A (ja) * | 2003-10-17 | 2005-05-12 | Nippon Telegr & Teleph Corp <Ntt> | 話題構造抽出方法及び装置及び話題構造抽出プログラム及び話題構造抽出プログラムを記録したコンピュータ読み取り可能な記憶媒体 |
US20100161604A1 (en) * | 2008-12-23 | 2010-06-24 | Nice Systems Ltd | Apparatus and method for multimedia content based manipulation |
JP2012053855A (ja) * | 2010-09-03 | 2012-03-15 | Ricoh Co Ltd | コンテンツ閲覧装置、コンテンツ表示方法及びコンテンツ表示プログラム |
JP2013250720A (ja) * | 2012-05-31 | 2013-12-12 | Sony Corp | 情報処理装置、プログラム及び情報処理方法 |
Non-Patent Citations (1)
Title |
---|
別所 克人: "話題構造抽出に基づく会議音声インデクシングシステム", 電子情報通信学会論文誌, vol. 第J91−D巻,第9号, JPN6018036401, 1 September 2008 (2008-09-01), pages P.2256−2267 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017167433A (ja) * | 2016-03-17 | 2017-09-21 | 株式会社東芝 | サマリ生成装置、サマリ生成方法及びサマリ生成プログラム |
US10540987B2 (en) | 2016-03-17 | 2020-01-21 | Kabushiki Kaisha Toshiba | Summary generating device, summary generating method, and computer program product |
JP2020087105A (ja) * | 2018-11-28 | 2020-06-04 | 株式会社ひらめき | 情報処理方法、情報処理装置及びコンピュータプログラム |
JP7290851B2 (ja) | 2018-11-28 | 2023-06-14 | 株式会社ひらめき | 情報処理方法、情報処理装置及びコンピュータプログラム |
Also Published As
Publication number | Publication date |
---|---|
EP2892051A2 (en) | 2015-07-08 |
EP2892051B1 (en) | 2017-12-06 |
US20150194153A1 (en) | 2015-07-09 |
KR20150081981A (ko) | 2015-07-15 |
EP2892051A3 (en) | 2015-07-15 |
CN104765723A (zh) | 2015-07-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2015130176A (ja) | 会議内容構造化装置及び方法 | |
US11010645B2 (en) | Interactive artificial intelligence analytical system | |
US20210272551A1 (en) | Speech recognition apparatus, speech recognition method, and electronic device | |
US11769492B2 (en) | Voice conversation analysis method and apparatus using artificial intelligence | |
US20170025117A1 (en) | Speech recognition apparatus and method | |
KR20200046117A (ko) | 공동 오디오-비디오 얼굴 애니메이션 시스템 | |
Lee et al. | Emotion recognition using a hierarchical binary decision tree approach | |
US11380351B2 (en) | System and method for pulmonary condition monitoring and analysis | |
Gu et al. | Speech intention classification with multimodal deep learning | |
US10521723B2 (en) | Electronic apparatus, method of providing guide and non-transitory computer readable recording medium | |
KR20190101325A (ko) | 지능적 음성 인식 방법, 음성 인식 장치 및 지능형 컴퓨팅 디바이스 | |
EP3866160A1 (en) | Electronic device and control method thereof | |
US20210217409A1 (en) | Electronic device and control method therefor | |
KR102484257B1 (ko) | 전자 장치, 그의 문서 표시 방법 및 비일시적 컴퓨터 판독가능 기록매체 | |
JP2019035936A (ja) | ニューラルネットワークを用いた認識方法及び装置並びにトレーニング方法及び電子装置 | |
KR102429583B1 (ko) | 전자 장치, 그의 가이드 제공 방법 및 비일시적 컴퓨터 판독가능 기록매체 | |
KR102529262B1 (ko) | 전자 장치 및 제어 방법 | |
US11030991B2 (en) | Method and device for speech processing | |
US11881209B2 (en) | Electronic device and control method | |
KR20210078133A (ko) | 간투어 검출 모델을 훈련시키기 위한 훈련 데이터 생성 방법 및 장치 | |
KR20210042523A (ko) | 전자 장치 및 이의 제어 방법 | |
US20200257954A1 (en) | Techniques for generating digital personas | |
KR20210078143A (ko) | 신규 도메인의 간투어 검출 모델 생성 방법 및 장치 | |
US10649725B1 (en) | Integrating multi-channel inputs to determine user preferences | |
KR102666316B1 (ko) | 전자 장치 및 제어 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20171113 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180918 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180914 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20190416 |