JP2022117756A - タグ付け方法およびタグ付け装置 - Google Patents

タグ付け方法およびタグ付け装置 Download PDF

Info

Publication number
JP2022117756A
JP2022117756A JP2021014434A JP2021014434A JP2022117756A JP 2022117756 A JP2022117756 A JP 2022117756A JP 2021014434 A JP2021014434 A JP 2021014434A JP 2021014434 A JP2021014434 A JP 2021014434A JP 2022117756 A JP2022117756 A JP 2022117756A
Authority
JP
Japan
Prior art keywords
conference
tag
unit
meeting
tagging
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021014434A
Other languages
English (en)
Inventor
剛生 土田
Takeo Tsuchida
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2021014434A priority Critical patent/JP2022117756A/ja
Publication of JP2022117756A publication Critical patent/JP2022117756A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】予め設定されたタグリストに基づいて、会議の内容に関連する適切なタグを会議に付けるタグ付け方法を提供する。【解決手段】複数の端末装置による会議を提供するサーバのタグ付け方法であって、前記複数の端末装置から前記会議における前記複数の端末装置それぞれの音声データを取得し、前記音声データの音声認識結果および予め設定されたタグ候補を含むタグリストに基づいて、前記会議に付けるタグを決定し、前記会議を識別する会議識別情報と前記決定されたタグとを対応付けて記憶部に記憶させる、処理を備えるタグ付け方法。【選択図】図13

Description

本発明は、タグ付け方法およびタグ付け装置に関する。
従来、インターネット等のネットワークを用いて、複数の参加者間での会議等を実現するシステムが知られている。そして、このような会議において、音声認識を用いた文字起こしにより議事録の作成が行われている。
テレビ会議などのマルチメディア情報を用いた会議システムにおいて、動画入力装置や音声入力装置等から入力されるマルチメディア情報からキーワードを抽出することにより検索用ファイルを作成し、会議録作成時には、検索用ファイルを参照し、重要な項目の会った場面を検索編集することにより会議録を短時間で簡便に編集できる技術が知られている(例えば、特許文献1参照)。
また、会議中の音声及び/又は画像を入力データとして取得し、入力データから会議中に強調された部分を検索し、強調された部分に基づいて、出力データを形成することで、会議中に強調された部分を明確に示すことができる技術が知られている(例えば、特許文献2参照)。
特開平07-182365号公報 特許6561927号公報
複数の会議を開催していると、後で内容を確認しようとしても、どの会議で何を話していたかが分からなくなる場合がある。また、ある内容に関する会議の議事録を確認したい場合、会議タイトルから当該内容の会議を検索しようとしても、タイトルが適切に設定されていないことが多く、その場合、所望の会議を見つけることができず、適切な情報取得が困難になる。
本発明の一態様は、予め設定されたタグリストに基づいて、会議の内容に関連する適切なタグを会議に付けるタグ付け方法を提供することを目的とする。
本発明の一態様に係るタグ付け方法は、複数の端末装置による会議を提供するサーバのタグ付け方法であって、前記会議における前記複数の端末装置それぞれの音声データを取得し、前記音声データの音声認識結果および予め設定されたタグ候補を含むタグリストに基づいて、前記会議に付けるタグを決定し、前記会議を識別する会議識別情報と前記決定されたタグとを対応付けて記憶部に記憶させる、処理を備える
本発明の一態様に係るタグ付け装置は、複数の端末装置による会議を提供するタグ付け装置であって、前記複数の端末装置から前記会議における前記複数の端末装置それぞれの音声データを取得する取得部と、前記音声データの音声認識結果および予め設定されたタグ候補を含むタグリストに基づいて、前記会議に付けるタグを決定するタグ決定部と、前記会議を識別する会議識別情報と前記決定されたタグとを対応付けて記憶部に記憶させるタグ付け部と、を備える。
実施の形態に係る通信システムの構成の一例を示す図である。 実施の形態に係る端末装置のハードウェア構成図の一例である。 実施の形態に係るサーバのハードウェア構成図の一例である。 実施の形態に係る端末装置の構成の一例を示す図である。 実施の形態に係るサーバの構成の一例を示す図である。 名詞辞書の一例である。 関連語辞書の一例である。 類義語辞書の一例である。 テーマ汎用辞書の一例である。 タグリストの一例である。 会議タグの一例である。 実施の形態に係るタグリストの作成処理のシーケンス図の一例である。 実施の形態に係るタグ付け処理のシーケンス図の一例である。 実施の形態に係るタグ付け処理のシーケンス図の変形例である。 実施の形態に係る会議終了後のタグ付け処理のシーケンス図の一例である。
以下、実施の形態について、図面を参照しつつ説明する。なお、図面については、同一又は同等の要素には同一の符号を付し、重複する説明は省略する。
図1は、実施の形態に係る通信システムの構成の一例を示す図である。
通信システム100は、複数の端末装置101およびサーバ201を有する。複数の端末装置101およびサーバ201は、WAN(Wide Area Network)またはLAN(Local Area Network)等のネットワーク301を介して接続され、互いに通信可能である。
通信システム100は、ネットワーク301を介した会議に用いられるシステムである。尚、ここでの会議とは、複数のユーザによるコミュニケーションが必要となる場面を広く表す。即ち、本実施形態における会議とは、複数のユーザが意見交換、審議、意思決定を行う場である狭義の会議に限定されず、セミナーや講演会等の形態を含んでもよい。セミナーは、所定のテーマに沿った勉強会である。講演会は、講師による発表を聴衆が聴く場である。その他、本実施形態の会議は、所与の参加者が発話を行い、他の参加者が当該発話を聞く可能性のある種々の場面を含むことが可能である。
端末装置101は、端末装置101が有するマイクに入力されたユーザの音声のデータ(音声データ)をサーバ201に送信する。
サーバ201は、端末装置101から受信した音声データに対して音声認識処理を行い、音声認識処理の結果を議事録として記憶する。さらに、サーバ201は、音声認識結果と予め用意されたキーワードを含む事前情報とに基づいて、議事録にタグ付けを行う。タグ付けの処理の詳細については後述する。サーバ201は、タグ付け装置の一例である。
尚、通信システム100の構成は図1に限定されず、他の構成を追加する等の変形実施が可能である。例えば、図1では端末装置101が2つである例を示したが、端末装置101の数は3以上であってもよい。
図2は、実施の形態に係る端末装置のハードウェア構成図の一例である。
端末装置101は、プロセッサ191、メモリ192、ディスプレイ193、通信インタフェース194、キーボード195、ポインティングデバイス196、およびマイク197を有する。プロセッサ191、メモリ192、ディスプレイ193、通信インタフェース194、キーボード195、ポインティングデバイス196、およびマイク197は、バス198を介して互いに接続されている。端末装置101は、例えば、PC(パーソナルコンピュータ)、スマートフォン、またはタブレット端末などのコンピュータである。
プロセッサ191は、例えば、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)、DSP(Digital Signal Processor)等、各種のプロセッサを用いることが可能である。
メモリ192は、例えば、SRAM(Static Random Access Memory)、DRAM(Dynamic Random Access Memory)、ROM(Read Only Memory)、フラッシュメモリなどの半導体メモリであってもよいし、レジスタであってもよいし、磁気記憶装置であってもよいし、光学式記憶装置であってもよい。メモリ192は、端末装置101で利用されるデータやプログラムを記憶し、プロセッサ191がプログラムをメモリ192から読み出して実行することにより、後述の処理部111として動作する。
ディスプレイ193は、各種の情報を表示するためのものであり、例えば液晶ディスプレイや有機EL(Electro Luminescence)ディスプレイなどにより実現できる。
通信インタフェース194は、ネットワーク301を介した通信を行うためのインタフェースであり、例えばアンテナ、RF回路、及びベースバンド回路を含む。
キーボード195は、複数のキーを有し、当該キーに対する操作が行われることによって、対応する信号を出力する操作インタフェースである。なおキーボードの具体的な形状、キー配置、接続方法等は種々の変形実施が可能である。
ポインティングデバイス196は、ディスプレイ193に表示されるポインタを移動させるための操作インタフェースである。ポインティングデバイス193は、マウス、ペンタブレット、タッチパッド、トラックボール等、種々のデバイスによって実現できる。
マイク197には、ユーザの音声が入力され、入力された音声を電気信号に変換して出力するインタフェースである。尚、端末装置101は、プロセッサ191からの信号に基づいて、各種の音声を出力する不図示のスピーカを含んでもよい。
図3は、実施の形態に係るサーバのハードウェア構成図の一例である。
サーバ201は、プロセッサ291、メモリ292、および通信インタフェース293を有する。プロセッサ291、メモリ292、および通信インタフェース293は、バス294を介して互いに接続されている。
プロセッサ291は、例えば、CPU、GPU、DSP等、各種のプロセッサを用いることが可能である。
メモリ292は、例えば、SRAM、DRAM、ROM、フラッシュメモリなどの半導体メモリであってもよいし、レジスタであってもよいし、磁気記憶装置であってもよいし、光学式記憶装置であってもよい。メモリ292は、サーバ201で利用されるデータやプログラム(ソフトウエア)を記憶し、プロセッサ291がプログラムをメモリ292から読み出して実行することにより、後述の処理部211(音声取得/認識部212、会議処理部213、およびタグ作成部214)として動作する。
通信インタフェース293は、ネットワーク301を介した通信を行うためのインタフェースであり、例えばアンテナ、RF回路、及びベースバンド回路を含む。
図4は、実施の形態に係る端末装置の構成の一例を示す図である。
端末装置101は、処理部111、記憶部121、通信部131、表示部141、操作入力部151、および音声入力部161を有する。
処理部111は、図2のプロセッサ191に対応する。処理部111は、端末装置101の制御を行い、例えば、操作入力部151に入力された操作に対応する処理、会議への参加する処理、および音声入力部161に入力された音声の音声データを含む参加者データ等を通信部131を介してサーバ201に送信する処理等を行う。
記憶部121は、図2のメモリ192に対応する。記憶部121は、端末装置101で利用されるデータやプログラムを記憶する。
通信部131は、図2の通信インタフェース194に対応する。通信部131は、音声データ等を含む参加者データをサーバ201に送信する。
表示部141は、図2のディスプレイ193に対応する。表示部141は、会議の資料等の各種情報を表示する。
操作入力部151は、図2のキーボード195およびポインティングデバイス196のうちの少なくとも1つに対応する。操作入力部151には、ユーザにより所定の操作が入力され、当該操作に対応する信号を処理部111に出力する。
音声入力部161は、図2のマイク197に対応する。音声入力部161には、ユーザの音声が入力され、入力された音声を電気信号に変換して処理部111に出力する。
図5は、実施の形態に係るサーバの構成の一例を示す図である。
サーバ201は、処理部211、記憶部221、および通信部231を有する。処理部211は、図3のプロセッサ291に対応する。記憶部221は、図3のメモリ292に対応する。通信部231は、図3の通信インタフェース293に対応する。
処理部211は、音声取得/認識部212、会議処理部213、およびタグ処理部214を有する。
音声取得/認識部212は、会議の音声データを取得し、音声データに対して音声認識を行う。
会議処理部213は、会議作成用のデータに基づいて、端末装置101に会議を提供する処理を行う。
タグ処理部214は、タグリスト作成部215、タグ決定部216、およびタグ付け部217を有する。タグリスト作成部215は、会議に付けられるタグの候補のリストを作成する。タグ決定部216は、会議に付けるタグを決定する。タグ付け部217は、タグ付け処理を行い、具体的には、例えば、タグ決定部216で決定されたタグと、会議を識別する会議ID(会議識別情報)と、を対応付けて記憶部221に記憶させる。タグリスト作成部215、タグ決定部216、およびタグ付け部217の処理の詳細は後述する。
記憶部221は、名詞辞書222、関連語辞書223、類義語辞書224、テーマ汎用辞書225、タグリスト226、および会議タグ227を記憶する。また、記憶部221は、端末装置101から受信した音声データを含む会議音声情報(不図示)を記憶する。名詞辞書222、関連語辞書223、類義語辞書224、およびテーマ汎用辞書225、例えば、端末装置101のユーザまたはサーバ201の管理者などにより予め設定され、記憶部221に記憶されている。
図6は、名詞辞書の一例である。
名詞辞書222は、少なくとも1つの名詞を含む名詞のリストである。名詞辞書222の名詞は、例えば、コーパス等から得られる。名詞辞書222には、IDと語句とが対応付けられて記載されている。IDは、名詞辞書222において、対応する語句に割り当てられた識別情報である。語句は、例えば、人、もの、または場所等の物事の名称である名詞である。
例えば、図6の名詞辞書222において、ID=1と語句=東京とが対応付けられて記載されている。
図7は、関連語辞書の一例である。
関連語辞書223は、関連する名詞(関連語)がグループ化された情報である。関連語は、例えば、インターネット上での検索において関連語句として提示されるような、何らかの実データに基づいて設定された語句である。関連語辞書223には、IDと名詞グループとが対応付けられて記載されている。IDは、関連語辞書223において、対応する名詞グループに割り当てられた識別情報である。名詞グループは、関連する名詞のグループである。
例えば、図7の関連語辞書223において、ID=1と名詞グループ=東京、コロナ、・・・とが対応付けられて記載されている。
図8は、類義語辞書の一例である。
類義語辞書224は、名詞の類義語ごとにグループ化された情報である。類義語は、例えば、シソーラス等から得られる。類義語辞書224には、IDと名詞グループとが対応付けられて記載されている。IDは、類義語辞書224において、対応する名詞グループに割り当てられた識別情報である。名詞グループは、名詞の類義語のグループである。
例えば、図8の類義語辞書224において、ID=1と名詞グループ=在り方、状況、・・・とが対応付けられて記載されている。
図9は、テーマ汎用辞書の一例である。
テーマ汎用辞書225は、特定のテーマごとに当該テーマに関する名詞がグループ化された情報である。例えば、あるテーマに関する名詞は、そのテーマでよく使用されるような頻出語句である。テーマ汎用辞書225には、IDとテーマと名詞グループとが対応付けられて記載されている。IDは、テーマ汎用辞書225において、対応する名詞グループに割り当てられた識別情報である。テーマは、テーマ汎用辞書225おいて設定されるビジネス、医療、または金融等の特定の分野を示す。名詞グループは、対応するテーマに関する名詞のグループである。
例えば、図9のテーマ汎用辞書225において、ID=1とテーマ=ビジネスと名詞グループ=ビジネス、企業、ライフワーク、働き方、営業、収入、・・・とが対応付けられて記載されている。すなわち、テーマ汎用辞書225には、ビジネスというテーマに関する名詞として、ビジネス、企業、ライフワーク、働き方、営業、および収入などがグループ化されて記載されている。
図10は、タグリストの一例である。
タグリスト226は、会議に付けられるタグの候補のリストである。タグリスト226には、会議IDとタグ候補とが対応付けられて記載されている。会議IDは、会議を識別する識別情報である。尚、会議IDは、会議を行う場合に端末装置101がアクセスする会議に紐づけられたURL等の会議の情報と紐づけられている。タグ候補は、対応する会議IDの会議に付けられるタグの候補の集合である。
例えば、図10のタグリスト226において、会議ID=1とタグ候補=コロナ、ニューノーマル、企業、カンパニー、働き方、在り方、状況、在宅、ビジネス、ライフワーク、働き方、営業、収入、・・・とが対応付けられて記載されている。尚、タグリスト226の作成処理およびタグリスト226に基づくタグ付け処理の詳細は後述する。
図11は、会議タグの一例である。
会議タグ227は、会議に付けられたタグの情報である。会議タグ227には、会議ID(会議識別情報)とタグとが対応付けられて記載されている。会議IDは、会議を識別する識別情報である。尚、会議IDは、会議を行う場合に端末装置101がアクセスする会議のURL等の会議を示す情報と紐づけられている。また、会議IDは、会議の議事録または会議の音声データを含む会議音声情報と紐づけられていてもよい。タグは、対応する会議IDの会議に付けられたタグである。
例えば、図11の会議タグ227において、会議ID=1とタグ=ニューノーマル、企業、・・・とが対応付けられて記載されている。すなわち、会議ID=1に対応する会議には、タグとして、ニューノーマル、企業、・・・がタグ付けされている。
以下、実施の形態に係る通信システム100の処理の流れについて説明する。先ず、タグリストの作成の処理について説明する。
図12は、実施の形態に係るタグリストの作成処理のシーケンス図の一例である。
ここで、名詞辞書222、関連語辞書223、類義語辞書224、およびテーマ汎用辞書225は、端末装置101のユーザまたはサーバ201の管理者などにより予め設定され、記憶部221に記憶されている。
まずユーザは、端末装置101を用いて会議を作成する操作を行う。ここでのユーザは、例えば会議の主催者であり、端末装置101は当該主催者によって使用される装置である。
ステップS501において、操作入力部151に、例えば主催者により、会議の開始時間、参加者、各参加者に付与される権限等、会議に用いられる設定データを作成する操作が入力される。
ステップS502において、通信部131は、例えば上記設定データを含む会議作成用のデータを、サーバ201に送信する。
ステップS503において、通信部231は、会議作成用のデータを端末装置101から受信する。
ステップS504において、会議処理部213は、受信した会議作成用のデータに基づいて、端末装置101に会議を提供する処理を行う。具体的には、会議処理部213は、会議を識別する会議ID、会議用のURL(Uniform Resource Locator)(会議URL)、およびパスワード等を含む会議に参加するためのデータを生成し、会議の参加者(主催者も含む)として指定された端末装置101に会議に参加するためのデータを通信部231を介して送信する。そして、通信部131は、サーバ201から会議に参加するためのデータを受信する。尚、会議URLは、会議を提供するサーバ201を示す情報を含む。
ステップS505において、操作入力部151に、例えば主催者により、会議のタイトルおよび会議資料を設定する操作が入力される。尚、会議資料は、会議の開始後に設定してもよい。また、会議資料には、文章(テキスト)が含まれる。また、会議資料は、例えば、記憶121に予め記憶されている。
ステップS506において、通信部131は、設定された会議のタイトルおよび会議資料を、サーバ201に送信する。そして、通信部231は、会議のタイトルおよび会議資料を端末装置101から受信し、会議処理部213は会議のタイトルおよび会議資料を会議処理部213に送信する。
ステップS507において、会議処理部213は、通信部231から会議のタイトルおよび会議資料を受信する。
ステップS508において、会議処理部213は、受信した会議のタイトルおよび会議資料に基づく、タグリスト226の作成をタグ処理部214に指示する。
ステップS509~S511において、タグリスト作成部215は、タグリスト226の作成の指示を受信すると、会議のタイトル、会議資料、名詞辞書222、関連語辞書223、類義語辞書224、およびテーマ汎用辞書225に基づいて、タグリスト226の作成を行う。
具体的には、ステップS509において、タグリスト作成部215は、会議のタイトルおよび会議資料に含まれる文章に対して形態素解析を行い、会議のタイトルおよび会議資料に含まれる文章を複数の単語に分割し、各単語の品詞を判定する。そして、タグリスト作成部215は、形態素解析の結果に基づいて、会議のタイトル内の名詞を検索キーとして、名詞辞書222、関連語辞書223、類義語辞書224、およびテーマ汎用辞書225を検索する。さらに、タグリスト作成部215は、会議資料の含まれる文章内の名詞を検索キーとして、名詞辞書222、関連語辞書223、類義語辞書224、およびテーマ汎用辞書225を検索する。
ステップS510において、タグリスト作成部215は、検索結果として該当キーワードを取得する。具体的には、タグリスト作成部215は、名詞辞書222において、会議のタイトル内の名詞と一致する語句を該当キーワードとして取得する。さらに、タグリスト作成部215は、関連語辞書223において、会議のタイトル内の名詞と一致する名詞を含む名詞グループを該当キーワードとして取得してもよい。さらに、タグリスト作成部215は、類義語辞書224において、会議のタイトル内の名詞と一致する名詞を含む名詞グループを該当キーワードとして取得してもよい。さらに、タグリスト作成部215は、テーマ汎用辞書225において、会議のタイトル内の名詞と一致する名詞を含む名詞グループを該当キーワードとして取得してもよい。
さらに、タグリスト作成部215は、名詞辞書222において、会議資料の含まれる文章内の名詞と一致する語句を該当キーワードとして取得する。さらに、タグリスト作成部215は、関連語辞書223において、会議資料の含まれる文章内の名詞と一致する名詞を含む名詞グループを該当キーワードとして取得してもよい。さらに、タグリスト作成部215は、類義語辞書224において、会議資料の含まれる文章内の名詞と一致する名詞を含む名詞グループを該当キーワードとして取得してもよい。さらに、タグリスト作成部215は、テーマ汎用辞書225において、会議資料の含まれる文章内の名詞と一致する名詞を含む名詞グループを該当キーワードとして取得してもよい。
ステップS511において、タグリスト作成部215は、ステップS510で取得した該当キーワードをタグ候補として、ステップS504で生成した会議IDと対応付けて、タグリスト226に登録する。
具体的には、例えば、会議のタイトルが「ニューノーマルにおける企業の在り方」であり、会議ID=1である場合、ステップS509の形態素解析により、「ニューノーマル」、「企業」、および「在り方」が名詞として判定される。そして、タグリスト作成部215は、「ニューノーマル」、「企業」、および「在り方」のそれぞれを検索キーとして、図6の名詞辞書222を検索し、該当キーワードとして「ニューノーマル」、「企業」、および「在り方」を取得する。
さらに、タグリスト作成部215は、「ニューノーマル」を検索キーとして、図7の関連語辞書223を検索し、該当キーワードとして「コロナ」、「ニューノーマル」、「働き方」、「在宅」、・・・を取得する。尚、タグリスト作成部215は、「企業」および「在り方」のそれぞれを検索キーとして、図7の関連語辞書223を検索し、このときの検索結果は無しである(すなわち、該当キーワードは取得されない)。
さらに、タグリスト作成部215は、「企業」を検索キーとして、図8の類義語辞書224を検索し、該当キーワードとして「企業」、「カンパニー」、・・・を取得する。さらに、タグリスト作成部215は、「在り方」を検索キーとして、図8の類義語辞書224を検索し、該当キーワードとして「在り方」、「状況」、・・・を取得する。尚、タグリスト作成部215は、「ニューノーマル」を検索キーとして、図8の類義語辞書224を検索し、このときの検索結果は無しである。
さらに、タグリスト作成部215は、「企業」を検索キーとして、図9のテーマ汎用辞書225検索し、該当キーワードとして「ビジネス」、「企業」、「ライフワーク」、「働き方」、「営業」、「収入」・・・を取得する。尚、タグリスト作成部215は、「ニューノーマル」および「在り方」のそれぞれを検索キーとして、図9のテーマ汎用辞書225検索し、このときの検索結果は無しである。
そして、ステップS511において、タグリスト作成部215は、上記取得した該当キーワードを会議ID=1と対応付けて、タグリスト226に登録し、図10に示すようなタグリスト226が作成される。
次に会議に対するタグ付けの処理について説明する。先ず、会議の最中にリアルタイムでタグ付け処理を行う場合について説明する。
図13は、実施の形態に係るタグ付け処理のシーケンス図の一例である。
ここで、図13のタグ付け処理は、図12のタグリストの作成処理の後に行われるものとする。すなわち、図12の処理により予めタグリスト226が作成されて記憶部221に記憶されており、会議の参加者の端末装置101は、ステップS504で生成された会議に参加するためのデータを受信済みである。
ステップS601において、操作入力部151に、会議の開始後に例えば会議の参加者により、会議URLにアクセスして会議に参加要求する操作が入力される。
ステップS602において、通信部131は、会議に参加するためのデータを用いて、会議への参加要求を送信する。また、参加要求には、会議URLおよびパスワード等が含まれる。そして、通信部231は、端末装置101から会議への参加要求を受信する。
ステップS603において、会議処理部213は、受信した参加要求に基づいて、会議への参加要求を承認する。会議処理部213は、参加要求を承認した場合に、端末装置101からの音声データの受信、および、当該端末装置101への他の端末装置101からの音声データの配信を開始することによって、会議を提供する。
ステップS604において、会議処理部213は、会議を識別する会議IDおよび端末装置101を識別する参加者IDを端末装置101に通信部231を介して送信する。そして通信部131は、会議IDおよび参加者IDを受信する。尚、参加者IDは、端末装置101ごとに異なる値が割り当てられ、会議の参加者の端末装置101に送信される。
上記のステップS601~S604の処理によって、会議処理部213によって会議が提供され、複数の端末装置101が、当該会議に参加した状態となる。
会議中は、複数の端末装置101は、それぞれ所与のタイミングで参加者データを会議処理部213に送信する。参加者データは、参加者の音声の音声データ、会議ID、および端末装置101に割り当てられた参加者IDを含む。会議処理部213は、複数の端末装置101のそれぞれから受信した参加者データに含まれる音声データを複数の端末装置101に配信する。
ステップS607において、複数の端末装置101のうちの所与の端末装置101の音声入力部161に音声が入力される。
ステップS608において、通信部131は、声入力部161入力された音声の音声データ、ステップS604で受信した会議ID、および参加者IDを含む参加者データを、会議処理部213に送信する。尚、ステップS607、S608の処理は、例えば会議の中で繰り返し実行されるものである。
ステップS609において、会議処理部213は、通信部131を介して受信した参加者データに含まれる音声データを抽出し、音声データおよび音声データに対する音声認識処理の依頼を音声取得/認識部212に送信する。さらに、会議処理部213は、音声データを会議IDおよび参加者IDと対応付けて記憶部に221に記憶させてもよい。
ステップS610において、音声取得/認識部212は、音声データを取得し、音声認識処理の依頼を受信すると、取得した音声データに対して音声認識処理を行い、音声認識結果を会議処理部213に送信する。そして、会議処理部213は、音声認識結果を受信する。音声認識結果とは、例えば、音声データをテキストに変換した変換結果を表すデータである。また、音声認識処理は、公知の手法を広く適用可能である。さらに、音声取得/認識部212は、音声認識結果を会議IDおよび参加者IDと対応付けて、会議の議事録として記憶部221に記憶してもよい。
ステップS611において、会議処理部213は、受信した音声認識結果およびタグ付け処理の依頼をタグ処理部214に送信する。
ステップS612において、タグ処理部214は、音声認識結果およびタグ付け処理の依頼を受信する。そして、ステップS612~S616において、タグ処理部214は、音声認識結果、名詞辞書222、関連語辞書223、類義語辞書224、およびテーマ汎用辞書225、およびタグリスト226に基づいて、会議へのタグ付け処理を行う。
具体的には、ステップS612において、タグ決定部216は、タグ付け処理の依頼を受信すると、音声認識結果に対して形態素解析を行い、会議のタイトルおよび会議資料に含まれる文章を複数の単語に分割し、各単語の品詞を判定する。そして、タグ決定部216は、形態素解析の結果に基づいて、音声認識結果内の名詞を検索キーとして、名詞辞書222、関連語辞書223、類義語辞書224、およびテーマ汎用辞書225を検索する。
ステップS613において、タグ決定部216は、検索結果として該当キーワードを取得する。具体的には、タグ決定部216は、名詞辞書222において、音声認識結果内の名詞(検索キー)と一致する語句を該当キーワードとして取得する。さらに、タグ決定部216は、関連語辞書223において、音声認識結果内の名詞(検索キー)と一致する名詞を含む名詞グループを該当キーワードとして取得してもよい。さらに、タグ決定部216は、類義語辞書224において、音声認識結果内の名詞(検索キー)と一致する名詞を含む名詞グループを該当キーワードとして取得してもよい。さらに、タグ決定部216は、テーマ汎用辞書225において、音声認識結果内の名詞(検索キー)と一致する名詞を含む名詞グループを該当キーワードとして取得してもよい。
具体的には、例えば、音声認識結果が「昨今のニューノーマルにおける企業の課題は」である場合、当該音声認識結果内の名詞は「昨今」、「ニューノーマル」、「企業」、「課題」である。タグ決定部216は、「昨今」、「ニューノーマル」、「企業」、「課題」のそれぞれを検索キーとして、名詞辞書222を検索すると、検索キーと一致する「昨今」、「ニューノーマル」、「企業」、「課題」を該当キーワードとして取得する。また、例えば、タグ決定部216は、「ニューノーマル」を検索キーとして、関連語辞書223を検索し、図7において「ニューノーマル」が含まれる名詞グループ=「コロナ」、「ニューノーマル」、「働き方」、「在宅」等を該当キーワードとしてさらに取得してもよい。また、タグ決定部216は、「企業」を検索キーとして、類義語辞書224を検索し、図8において「企業」が含まれる名詞グループ=「企業」、「カンパニー」等を該当キーワードとしてさらに取得してもよい。また、タグ決定部216は、「企業」を検索キーとして、テーマ汎用辞書225を検索し、図9において「企業」が含まれる名詞グループ=「ビジネス」、「企業」、「ライフワーク」、「働き方」、「営業」、「収入」等を該当キーワードとしてさらに取得してもよい。
ステップS614において、タグ決定部216は、会議IDとステップS613で取得した該当キーワードを検索キーとして、タグリスト226を検索する。
ステップS615において、タグ決定部216は、タグリスト226において、会議IDに対応するタグ候補のうち、検索キー(ステップS613で取得した該当キーワード)と一致するタグ候補を該当キーワードとして取得する。そして、タグ決定部216は、取得した該当キーワードを会議に付けるタグとして決定する。
具体的には、例えば、ステップS613で取得した該当キーワードがニューノーマル」、「企業」等である場合、タグ決定部216は、会議ID=1とステップS613で取得した「ニューノーマル」、「企業」等を検索キーとして、タグリスト226を検索し、会議ID=1に対応するタグ候補のうち、検索キーと一致する「ニューノーマル」、「企業」等を該当キーワードとして取得する。そして、タグ決定部216は、取得した該当キーワード=「ニューノーマル」、「企業」等を会議ID=1に対応する会議に付けるタグとして決定する。
ステップS616において、タグ付け部217は、会議IDとステップS615で取得した該当キーワードとをタグ付けする。具体的には、例えば、タグ付け部217は、会議IDとステップS615で取得した該当キーワードとを対応付けて会議タグ227に登録する。具体的には、例えば、タグ付け部217は、図11に示すように、会議ID=1とステップS615で取得した該当キーワード=「ニューノーマル」、「企業」等を対応付けて会議タグ227に登録する。
タグ付けの処理に関して、複数の端末装置101の音声データのうち特定の端末装置101の音声データに基づいて、タグ付けを行ってもよい。特定の端末装置101は、例えば、会議においてプレゼンターに設定された参加者の端末装置101である。プレゼンターは、例えば、会議において会議を主導、会議資料を操作、または発表等を行う会議の参加者である。以下、特定の端末装置101の音声データに基づいて、タグ付けを行う場合を説明する。
図14は、実施の形態に係るタグ付け処理のシーケンス図の変形例である。
ステップS701~704のそれぞれの処理は、ステップS601~S6104のそれぞれの処理と同様であるため、詳細な説明は省略する。
ステップS705において、操作入力部151に、例えば、会議において会議を主導、会議資料を操作、または発表等を行う会議の参加者により、自身をプレゼンターに設定する操作が入力される。プレゼンターに設定された参加者は、例えば、各参加者の端末装置101の表示部141に表示される会議資料に対する操作(拡大、縮小、またはページの切替など)を行うことができる。プレゼンターに設定された参加者の端末装置101は、指定された端末装置101の一例である。
ステップS706において、通信部131は、操作入力部151に自身をプレゼンターに設定する操作が入力されると、プレゼンターの設定通知、および操作が入力された端末装置101がステップS704で受信した当該端末装置101に割り当てられた参加者IDをサーバ201に送信する。そして、会議処理部213は、通信部231を介して受信した参加者IDをプレゼンターであることを示すプレゼンター情報に紐づける。具体的には、例えば、会議処理部213は、プレゼンター情報と参加者IDとを対応付けて、またはプレゼンター情報に参加者IDを付加して記憶部221に記憶させる。
ステップS707において、複数の端末装置101のうちの所与の端末装置101の音声入力部161に音声が入力される。
ステップS708において、通信部131は、声入力部161入力された音声の音声データ、ステップS704で受信した会議ID、および参加者IDを含む参加者データを、会議処理部213に送信する。尚、ステップS707、S708の処理は、例えば会議の中で繰り返し実行されるものである。会議処理部213は、音声データ、会議ID、および参加者IDを含む参加者データを通信部131を介して受信する。
ステップS709において、会議処理部213は、受信した参加者データに含まれる音声データを抽出し、音声データおよび音声データに対する音声認識処理の依頼を音声取得/認識部212に送信する。さらに、会議処理部213は、音声データを会議IDおよび参加者IDと対応付けて記憶部に221に記憶させてもよい。
ステップS710において、音声取得/認識部212は、音声データを取得し、音声認識処理の依頼を受信すると、取得した音声データに対して音声認識処理を行い、音声認識結果を会議処理部213に送信する。そして、会議処理部213は、音声認識結果を受信する。音声認識結果とは、例えば、音声データをテキストに変換した変換結果を表すデータである。また、音声認識処理は、公知の手法を広く適用可能である。さらに、音声取得/認識部212は、音声認識結果を会議IDおよび参加者IDと対応付けて、会議の議事録として記憶部221に記憶させてもよい。
ステップS711において、会議処理部213は、ステップS708で受信した参加者IDを音声認識結果に付加し、参加者IDが付加された音声認識結果、プレゼンター情報、およびタグ付け処理の依頼をタグ処理部214に送信する。
ステップS712において、タグ処理部214は、参加者IDが付加された音声認識結果、プレゼンター情報、およびタグ付け処理の依頼を受信する。そして、タグ処理部214は、ステップS706でプレゼンター情報に紐づけられた参加者IDが音声認識結果に付加された参加者IDと同じ場合、ステップS712~S716において、音声認識結果、名詞辞書222、関連語辞書223、類義語辞書224、およびテーマ汎用辞書225、およびタグリスト226に基づいて、会議へのタグ付け処理を行う。また、タグ処理部214は、プレゼンター情報に紐づけられた参加者IDが音声認識結果に付加された参加者IDと異なる場合、ステップS712~S716におけるタグ付け処理をスキップする。これにより、複数の端末装置のそれぞれから受信した音声データの音声認識結果うち、プレゼンターに設定された参加者の端末装置101からの音声データの音声認識結果のみを用いてタグ付け処理を行うことで、プレゼンターに設定された参加者が発言したキーワードを優先してタグ付けできる。
ステップS713~S716のそれぞれの処理は、ステップS613~S616のそれぞれの処理と同様であるため、詳細な説明は省略する。
また、タグ付け処理は、図13に示すように会議中に実施してもよいが、以下に説明するように会議の終了後に実施してもよい。
図15は、実施の形態に係る会議終了後のタグ付け処理のシーケンス図の一例である。
ここで、図15のタグ付け処理は、図12のタグリストの作成処理の後に行われるものとする。すなわち、図12の処理により予めタグリスト226が作成されて記憶部221に記憶されており、会議の参加者の端末装置101は、ステップS504で生成された会議に参加するためのデータを受信済みである。
ステップS801において、操作入力部151に、会議の開始後に例えば会議の参加者により、会議URLにアクセスして会議に参加要求する操作が入力される。
ステップS802において、通信部131は、会議に参加するためのデータを用いて、会議への参加要求を送信する。また、参加要求には、会議URLおよびパスワード等が含まれる。そして、通信部231は、端末装置101から会議への参加要求を受信する。
ステップS803において、会議処理部213は、受信した参加要求に基づいて、会議への参加要求を承認する。会議処理部213は、参加要求を承認した場合に、端末装置101からの音声データの受信、および、当該端末装置101への他の端末装置101からの音声データの配信を開始することによって、会議を提供する。
ステップS804において、会議処理部213は、会議を識別する会議IDおよび端末装置101を識別する参加者IDを端末装置101に通信部231を介して送信する。そして通信部131は、会議IDおよび参加者IDを受信する。尚、参加者IDは、端末装置101ごとに異なる値が割り当てられ、会議の参加者の端末装置101に送信される。
上記のステップS801~S804の処理によって、会議処理部213によって会議が提供され、複数の端末装置101が、当該会議に参加した状態となる。
会議中は、複数の端末装置101は、それぞれ所与のタイミングで参加者データを会議処理部213に送信する。参加者データは、参加者の音声の音声データ、会議ID、および端末装置101に割り当てられた参加者IDを含む。会議処理部213は、複数の端末装置101のそれぞれから受信した参加者データに含まれる音声データを複数の端末装置101に配信する。
ステップS805において、複数の端末装置101のうちの所与の端末装置101の音声入力部161に音声が入力される。
ステップS806において、通信部131は、声入力部161入力された音声の音声データ、ステップS804で受信した会議ID、および参加者IDを含む参加者データを、会議処理部213に送信する。
ステップS807において、会議処理部213は、通信部131を介して受信した参加者データに含まれる音声データを抽出し、会議IDと対応付けて音声蓄積情報として記憶部221に蓄積(記憶)させる。これにより、同一の会議中の各端末装置101から受信した音声データは、1つの音声蓄積情報として記憶部221に記憶される。また、音声蓄積情報において、参加者IDと音声データと対応付けて記憶し、音声蓄積情報に含まれる音声データがどの端末装置101から受信した音声データであるか分かるようにしてもよい。尚、ステップS805~S807の処理は、例えば会議の中で繰り返し実行されるものである。
ステップS808において、操作入力部151に、例えば、会議の主催者により、会議の終了時に会議を終了する操作が入力される。
ステップS809において、通信部131は、操作入力部151に会議を終了する操作が入力されると、会議の終了通知をサーバ201に送信する。そして、通信部231は、会議の終了通知を端末装置101から受信する。
ステップS810において、会議処理部213は、記憶部221から会議音声情報を取得する。
ステップS811において、会議処理部213は、会議音声情報の含まれる音声データを抽出し、音声データおよび音声データに対する音声認識処理の依頼を音声取得/認識部212に送信する。
ステップS812において、音声取得/認識部212は、音声データを取得し、音声認識処理の依頼を受信すると、取得した音声データに対して音声認識処理を行い、音声認識結果を会議処理部213に送信する。そして、会議処理部213は、音声認識結果を受信する。音声認識結果とは、例えば、音声データをテキストに変換した変換結果を表すデータである。また、音声認識処理は、公知の手法を広く適用可能である。さらに、会議処理部213は、音声データを会議IDおよび参加者IDと対応付けて記憶部に221に記憶させてもよい。
ステップS813~S819のそれぞれの処理は、ステップS611~S616のそれぞれの処理と同様であるため、詳細な説明は省略する。また、ステップS819において、タグ付け部217は、ステップS817で取得した該当キーワードのうち、ステップS817で取得した音声認識結果において出現する頻度が高いキーワードを優先して会議IDにタグ付けしてもよい。具体的には、例えば、タグ付け部217は、ステップS817で取得した該当キーワードのうち、音声認識結果において出現頻度が高い順にN個(例えばN=5)のキーワードを会議IDにタグ付けしてもよい。
実施の形態に係る通信システムによれば、予め設定されたタグリストに基づいて、会議に対して会議の内容に関連する適切なタグを付けることができる。それにより、ユーザが、ある内容がどの会議で話されたか知りたい場合に、会議の内容に関する適切なタグが会議に付けられているため、当該内容に関する語句を検索キーとして会議タグを検索することで、当該内容に関する会議を容易に見つけることができる。例えば、端末装置101からの要求により、サーバ201が図11の会議タグを「ニューノーマル」を検索キーとして検索すると、「ニューノーマル」含むタグに対応する会議ID=1が検出され、会議ID=1に対応する会議の情報を端末装置101に送信し、端末装置101が当該情報を表示することにより、端末装置101のユーザは会議ID=1に対応する会議が「ニューノーマル」に関する会議であることが分かる。さらに、サーバ201は、会議ID=1に紐づけられた会議の議事録や会議音声情報を端末装置101に送信することで、端末装置101のユーザは、「ニューノーマル」に関する会議の内容を確認することができる。また、ある会議に付けられているタグを参照することで、当該会議の内容を把握することが容易になる。
また、実施の形態に係る通信システムによれば、会議のタイトルまたは会議の資料に基づいて、会議に対して付けるタグの候補のリスト(タグリスト)を作成することができる。実施の形態に係る通信システムによれば、タグリストの生成に際して、関連語、類義語、またはテーマ毎の語句がグループ化された辞書を用いることで、会議の内容に関連した多くのタグ候補を含むタグリストを作成することができる。
なお、本発明は、上述した実施の形態に限定されるものではなく変形可能であり、上記の構成は、実質的に同一の構成、同一の作用効果を奏する構成又は同一の目的を達成することができる構成で置き換えることができる。
100 通信システム
101 端末装置
111 処理部
121 記憶部
131 通信部
141 表示部
151 操作入力部
161 音声入力部
201 サーバ
211 処理部
212 音声取得/認識部
213 会議処理部
214 タグ処理部
215 タグリスト作成部
216 タグ決定部
217 タグ付け部
221 記憶部
222 名詞辞書
223 関連語辞書
224 類義語辞書
225 テーマ汎用辞書
226 タグリスト
227 会議タグ
231 通信部

Claims (7)

  1. 複数の端末装置による会議を提供するサーバのタグ付け方法であって、
    前記会議における前記複数の端末装置それぞれの音声データを取得し、
    前記音声データの音声認識結果および予め設定されたタグ候補を含むタグリストに基づいて、前記会議に付けるタグを決定し、
    前記会議を識別する会議識別情報と前記決定されたタグとを対応付けて記憶部に記憶させる、
    処理を備えるタグ付け方法。
  2. 前記タグを決定する処理は、前記音声認識結果に含まれる名詞のうち、前記タグリストに含まれる前記タグ候補と一致する名詞を前記会議に付けるタグとして決定する請求項1記載のタグ付け方法。
  3. 前記タグを決定する処理は、前記音声認識結果に含まれる名詞のうち前記タグ候補と一致する名詞の前記音声認識結果における出現頻度に基づいて、前記会議に付けるタグを決定する請求項2記載のタグ付け方法。
  4. 前記タグを決定する処理は、前記音声認識結果に含まれる名詞に関連する名詞または前記音声認識結果に含まれる名詞の類義語、および前記タグリストに基づいて、前記会議に付けるタグを決定する請求項1記載のタグ付け方法。
  5. 前記タグを決定する処理は、前記複数の端末装置それぞれの前記音声データの前記認識結果のうち指定された端末装置の音声データの認識結果、および前記タグリストに基づいて、前記会議に付けるタグを決定する請求項1乃至4のいずれか1項に記載のタグ付け方法。
  6. 前記会議のタイトルと前記会議の資料の少なくとも一方を取得し、
    前記取得した前記会議のタイトルと前記会議の資料の少なくとも一方に基づいて、前記タグ候補を前記タグリストに登録する
    処理をさらに備える請求項1乃至5のいずれか1項に記載のタグ付け方法。
  7. 複数の端末装置による会議を提供するタグ付け装置であって、
    前記複数の端末装置から前記会議における前記複数の端末装置それぞれの音声データを取得する取得部と、
    前記音声データの音声認識結果および予め設定されたタグ候補を含むタグリストに基づいて、前記会議に付けるタグを決定するタグ決定部と、
    前記会議を識別する会議識別情報と前記決定されたタグとを対応付けて記憶部に記憶させるタグ付け部と、
    を備えるタグ付け装置。
JP2021014434A 2021-02-01 2021-02-01 タグ付け方法およびタグ付け装置 Pending JP2022117756A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021014434A JP2022117756A (ja) 2021-02-01 2021-02-01 タグ付け方法およびタグ付け装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021014434A JP2022117756A (ja) 2021-02-01 2021-02-01 タグ付け方法およびタグ付け装置

Publications (1)

Publication Number Publication Date
JP2022117756A true JP2022117756A (ja) 2022-08-12

Family

ID=82750452

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021014434A Pending JP2022117756A (ja) 2021-02-01 2021-02-01 タグ付け方法およびタグ付け装置

Country Status (1)

Country Link
JP (1) JP2022117756A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7496098B1 (ja) 2023-12-12 2024-06-06 株式会社リブセンス 情報処理システム、情報処理方法及びプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7496098B1 (ja) 2023-12-12 2024-06-06 株式会社リブセンス 情報処理システム、情報処理方法及びプログラム

Similar Documents

Publication Publication Date Title
CN107256267B (zh) 查询方法和装置
US8862615B1 (en) Systems and methods for providing information discovery and retrieval
JP6413256B2 (ja) 会議支援装置、会議支援装置の制御方法、及びプログラム
US20090055186A1 (en) Method to voice id tag content to ease reading for visually impaired
JP2013521567A (ja) クライアント・コンピューティング・デバイスを含むシステム、メディア・オブジェクトにタグ付けする方法、および音声タグ付きメディア・オブジェクトを含むデジタル・データベースをサーチする方法
Pastor et al. A survey of interpreters’ needs and practices related to language technology
CN106888154B (zh) 音乐分享方法及系统
KR100792325B1 (ko) 대화형 다국어 학습을 위한 대화 예제 데이터베이스 구축방법 및 그를 이용한 대화형 다국어 학습 서비스 시스템 및그 방법
TWI270052B (en) System for selecting audio content by using speech recognition and method therefor
US20240061899A1 (en) Conference information query method and apparatus, storage medium, terminal device, and server
CN109600646B (zh) 语音定位的方法及装置、智能电视、存储介质
WO2018094952A1 (zh) 一种内容推荐方法与装置
CN111223487B (zh) 一种信息处理方法及电子设备
US8074176B2 (en) Electronic communications dialog using sequenced digital images stored in an image dictionary
Soffer From textual orality to oral textuality: The case of voice queries
US20160247522A1 (en) Method and system for providing access to auxiliary information
JP2022117756A (ja) タグ付け方法およびタグ付け装置
JP2004341672A (ja) 情報提示方法及び情報提示装置
CN114064943A (zh) 会议管理方法、装置、存储介质及电子设备
JP2011108042A (ja) 人脈検索装置、人脈検索方法、及び人脈検索プログラム
Sa et al. Examining user perception and usage of voice search
JPH11203295A (ja) 情報提供装置および方法
JP6687078B2 (ja) 会議支援装置、会議支援装置の制御方法、及びプログラム
JP2010256962A (ja) 会議情報提供装置及び会議情報提供プログラム
CN113626722A (zh) 舆论引导方法、装置、设备及计算机可读存储介质