JP2021136606A - Information processing device, information processing system, information processing method, and information processing program - Google Patents

Information processing device, information processing system, information processing method, and information processing program Download PDF

Info

Publication number
JP2021136606A
JP2021136606A JP2020032200A JP2020032200A JP2021136606A JP 2021136606 A JP2021136606 A JP 2021136606A JP 2020032200 A JP2020032200 A JP 2020032200A JP 2020032200 A JP2020032200 A JP 2020032200A JP 2021136606 A JP2021136606 A JP 2021136606A
Authority
JP
Japan
Prior art keywords
information
conference
minutes
data
conference terminal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020032200A
Other languages
Japanese (ja)
Inventor
恵輔 藤田
Keisuke Fujita
恵輔 藤田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2020032200A priority Critical patent/JP2021136606A/en
Publication of JP2021136606A publication Critical patent/JP2021136606A/en
Pending legal-status Critical Current

Links

Images

Abstract

To generate a minute book according to a progress state of a conference.SOLUTION: A video conference server (4) includes acquisition units (402, 404, 406) for acquiring transmission destination information showing transmission information transmitted from a conference terminal, identification information of a conference participant, and transmission destination information showing a transmission destination, a generation unit (400) for generating minute book information including the transmission information and the transmission destination information as transmission information of the conference participant on the basis of the acquired information, and a minute book record part (420) for performing control to record minute book information in the storage unit each time the minute book information is generated.SELECTED DRAWING: Figure 5

Description

本開示は、情報処理装置、情報処理システム、情報処理方法、及び情報処理プログラムに関する。 The present disclosure relates to information processing devices, information processing systems, information processing methods, and information processing programs.

従来より、コンピュータ等の複数の端末を通信回線に接続して会議を行う会議システムにおいて、音声データをテキストに変換して議事録を作成する情報処理装置が知られている(例えば、特許文献1を参照)。この情報処理装置は、会議の状況を録音しておき、会議終了後に録音済みの音声信号をテキストデータに変換して議事録などを作成する。また、議事録を作成するために必要な情報を効率よく抽出し、通信システムを利用する遠隔会議の最適な議事録を作成することができる情報処理装置も知られている。 Conventionally, in a conference system in which a plurality of terminals such as a computer are connected to a communication line to hold a conference, an information processing device that converts voice data into text and creates minutes has been known (for example, Patent Document 1). See). This information processing device records the status of the meeting and converts the recorded voice signal into text data after the meeting to create minutes and the like. In addition, an information processing device capable of efficiently extracting the information necessary for creating the minutes and creating the optimum minutes of a remote conference using a communication system is also known.

特開2019−164327号公報JP-A-2019-164327

ところで、複数の出席者を伴う会議では、議事進行に伴って、複数の出席者の一部の出席者が意図的に、その一部の出席者の間で議事内容および関係する内容について確認等のやり取りが行われる場合がある。 By the way, in a meeting involving a plurality of attendees, as the proceedings progress, some attendees of the plurality of attendees intentionally confirm the contents of the proceedings and related contents among the some attendees. May be exchanged.

一方、出席者が発した音声を音声テキストに変換することで、出席者による発言内容を議事録への記録可能なテキストに変換することが可能である。しかしながら、録音された録音データを用いてテキスト変換された議事録を生成する場合、複数の発言者の音声の重なりなどにより変換精度が低下する。また、テキスト変換された議事録は、確認等を示す意図的に行われた一部の出席者によるやり取りであっても一律にテキスト変換された議事録となる。このため、会議の進行状況に応じて一部の出席者の間で意図的に行われたやり取りが議事録に反映されておらず、会議の進行状況に応じた議事録を忠実に生成するのには改善の余地がある。 On the other hand, by converting the voice uttered by the attendee into voice text, it is possible to convert the content of the remarks made by the attendee into text that can be recorded in the minutes. However, when the minutes converted into text are generated using the recorded recorded data, the conversion accuracy is lowered due to the overlap of the voices of a plurality of speakers. In addition, the text-converted minutes will be uniformly text-converted minutes even if some attendees intentionally exchanged information indicating confirmation or the like. For this reason, the minutes intentionally exchanged between some attendees according to the progress of the meeting are not reflected in the minutes, and the minutes are faithfully generated according to the progress of the meeting. Has room for improvement.

本開示は、音声データを変換したテキストデータのみにより会議の議事録を生成する場合と比べて、会議の進行状況に則して議事録を生成できる情報処理装置、情報処理システム、情報処理方法、及び情報処理プログラムを提供することを目的とする。 In this disclosure, an information processing device, an information processing system, an information processing method, which can generate minutes according to the progress of a meeting, as compared with the case where the minutes of a meeting are generated only by text data obtained by converting voice data. And to provide an information processing program.

本開示の第1態様は、各々他の会議端末と情報を授受する複数の会議端末のうちの第1の会議端末から送信された送信情報、前記第1の会議端末を操作する第1の会議参加者を示す識別情報、および、当該第1の会議参加者が前記送信情報の送信先を示す1以上の第2の会議端末を操作する第2の会議参加者を示す送信先情報を取得する取得部と、取得された前記送信情報、前記識別情報および前記送信先情報を、前記第1の会議参加者の発言情報とした議事録情報を生成する生成部と、前記議事録情報が生成される度に当該生成された議事録情報を、記憶部に記憶する制御を行う制御部と、を有する情報処理装置である。 The first aspect of the present disclosure is transmission information transmitted from a first conference terminal among a plurality of conference terminals that exchange information with other conference terminals, and a first conference that operates the first conference terminal. Acquire identification information indicating a participant and destination information indicating a second conference participant in which the first conference participant operates one or more second conference terminals indicating a destination of the transmission information. The acquisition unit, the generation unit that generates the minutes information in which the acquired transmission information, the identification information, and the destination information are used as the remark information of the first conference participant, and the minutes information are generated. It is an information processing device having a control unit that controls to store the generated minutes information in the storage unit each time.

本開示の第2態様は、複数の会議端末と、第1態様に記載の情報処理装置と、を備えた情報処理システムである。 The second aspect of the present disclosure is an information processing system including a plurality of conference terminals and the information processing device according to the first aspect.

本開示の第3態様は、情報処理装置における情報処理方法であって、前記情報処理装置は、各々他の会議端末と情報を授受する複数の会議端末のうちの第1の会議端末から送信された送信情報、前記第1の会議端末を操作する第1の会議参加者を示す識別情報、および、当該第1の会議参加者が前記送信情報の送信先を示す1以上の第2の会議端末を操作する第2の会議参加者を示す送信先情報を取得する取得ステップと、取得された前記送信情報、前記識別情報および前記送信先情報を、前記第1の会議参加者の発言情報とした議事録情報を生成する生成ステップと、前記議事録情報が生成される度に当該生成された議事録情報を、記憶部に記憶する制御を行う制御ステップと、を有する情報処理方法である。 A third aspect of the present disclosure is an information processing method in an information processing device, in which the information processing device is transmitted from a first conference terminal among a plurality of conference terminals that exchange information with other conference terminals. Transmission information, identification information indicating a first conference participant who operates the first conference terminal, and one or more second conference terminals in which the first conference participant indicates a destination of the transmission information. The acquisition step of acquiring the destination information indicating the second conference participant who operates the above, and the acquired transmission information, the identification information, and the destination information are used as the remark information of the first conference participant. It is an information processing method having a generation step of generating minutes information and a control step of controlling to store the generated minutes information in a storage unit each time the minutes information is generated.

本開示の第4態様は、コンピュータを、各々他の会議端末と情報を授受する複数の会議端末のうちの第1の会議端末から送信された送信情報、前記第1の会議端末を操作する第1の会議参加者を示す識別情報、および、当該第1の会議参加者が前記送信情報の送信先を示す1以上の第2の会議端末を操作する第2の会議参加者を示す送信先情報を取得する取得部、取得された前記送信情報、前記識別情報および前記送信先情報を、前記第1の会議参加者の発言情報とした議事録情報を生成する生成部、前記議事録情報が生成される度に当該生成された議事録情報を、記憶部に記憶する制御を行う制御部、として機能させるための情報処理プログラムである。 A fourth aspect of the present disclosure is to operate a computer, transmission information transmitted from a first conference terminal among a plurality of conference terminals that exchange information with other conference terminals, and the first conference terminal. Identification information indicating one conference participant, and destination information indicating a second conference participant in which the first conference participant operates one or more second conference terminals indicating a destination of the transmission information. The acquisition unit, the generation unit that generates the minutes information in which the acquired transmission information, the identification information, and the destination information are used as the remark information of the first conference participant, and the minutes information is generated. It is an information processing program for functioning as a control unit that controls the storage of the generated minutes information in the storage unit each time it is performed.

本開示によれば、音声データを変換したテキストデータのみにより会議の議事録を生成する場合と比べて、会議の進行状況に則して議事録を生成できる、という効果が得られる。 According to the present disclosure, it is possible to obtain the effect that the minutes can be generated according to the progress of the meeting, as compared with the case where the minutes of the meeting are generated only by the text data obtained by converting the voice data.

第1実施形態の情報処理システムの概要を示す図である。It is a figure which shows the outline of the information processing system of 1st Embodiment. 第1実施形態のビデオ会議サーバの構成の一例を示す図である。It is a figure which shows an example of the structure of the video conferencing server of 1st Embodiment. 音声テキスト変換装置の構成の一例を示す図である。It is a figure which shows an example of the structure of the voice-to-text conversion apparatus. 会議端末の構成の一例を示す図である。It is a figure which shows an example of the structure of a conference terminal. ビデオ会議サーバの機能構成の一例を示す図である。It is a figure which shows an example of the functional structure of a video conferencing server. 発言権の有無が記録されたテーブルの一例を示す図である。It is a figure which shows an example of the table which recorded the presence or absence of the right to speak. 音声に関する議事録記録処理の流れの一例を示すフローチャートである。It is a flowchart which shows an example of the flow of the minutes recording process concerning voice. チャットに関する議事録記録処理の流れの一例を示すフローチャートである。It is a flowchart which shows an example of the flow of the minutes record processing about a chat. 音声およびチャットを記録した議事録の一例を示す図である。It is a figure which shows an example of the minutes which recorded voice and chat. 代表的なアイコンで議事録メモを表した議事録の一例を示す図である。It is a figure which shows an example of the minutes which represented the minutes memo with a typical icon. ビデオ会議サーバ4で実行される議事録提供処理の流れの一例を示すフローチャートである。It is a flowchart which shows an example of the flow of the minutes provision processing executed in the video conference server 4. 代表的なアイコンで議事録メモを表した議事録の一例を示す図である。It is a figure which shows an example of the minutes which represented the minutes memo with a typical icon. 代表的なアイコンで議事録メモを表した議事録の一例を示す図である。It is a figure which shows an example of the minutes which represented the minutes memo with a typical icon. 代表的なアイコンで議事録メモを表した議事録の一例を示す図である。It is a figure which shows an example of the minutes which represented the minutes memo with a typical icon. 音声およびチャットを記録した議事録の一例を示す図である。It is a figure which shows an example of the minutes which recorded voice and chat. 代表的なアイコンで議事録メモを表した議事録の一例を示す図である。It is a figure which shows an example of the minutes which represented the minutes memo with a typical icon. 第2実施形態のビデオ会議サーバの構成の一例を示す図である。It is a figure which shows an example of the structure of the video conferencing server of 2nd Embodiment. 代表的なアイコンで議事録メモを表した議事録の一例を示す図である。It is a figure which shows an example of the minutes which represented the minutes memo with a typical icon.

以下、図面を参照して本発明の実施形態に係る情報処理装置の一例を詳細に説明する。なお、動さ、作用、機能が同じ働きを担う構成要素及び処理には、全図面を通して同じ符合を付与し、重複する説明を適宜省略する場合がある。各図面は、本発明を十分に理解できる程度に、概略的に示してあるに過ぎない。よって、本発明は、図示例のみに限定されるものではない。また、本実施形態では、本発明と直接的に関連しない構成や周知な構成については、説明を省略する場合がある。 Hereinafter, an example of the information processing apparatus according to the embodiment of the present invention will be described in detail with reference to the drawings. It should be noted that components and processes in which movement, action, and function have the same function may be given the same sign throughout the drawings, and duplicate explanations may be omitted as appropriate. Each drawing is only schematically shown to the extent that the present invention can be fully understood. Therefore, the present invention is not limited to the illustrated examples. Further, in the present embodiment, description may be omitted for configurations that are not directly related to the present invention and well-known configurations.

[第1実施形態] [First Embodiment]

図1に、本開示の情報処理システム1の構成の一例を示す。
図1に示すように、情報処理システム1は、複数の会議端末2と、ビデオ会議サーバ4と、音声テキスト変換装置5と、を備えている。
FIG. 1 shows an example of the configuration of the information processing system 1 of the present disclosure.
As shown in FIG. 1, the information processing system 1 includes a plurality of conference terminals 2, a video conference server 4, and a voice-text conversion device 5.

図1に示す例では、複数の会議端末2は、会議端末2A、会議端末2B、会議端末2C、及び会議端末2Dを含んで構成されている。会議端末2Aは、会議の出席者Aの操作によって操作され、ビデオ会議サーバ4により開催されるビデオ会議への出席などの処理を行うビデオ会議用の端末装置である。会議端末2B,2C,2Dの各々も、会議端末2Aと同様に、出席者B、出席者C、出席者Dの各々の操作によって操作される端末装置である。これらの会議端末2Aから会議端末2Dの各々を操作する出席者Aから出席者Dの各々は個別のユーザであってもよく、グループのユーザであってもよい。会議端末2Aから会議端末2Dの各々は、通信機能を有するコンピュータによって実現可能である。 In the example shown in FIG. 1, the plurality of conference terminals 2 include a conference terminal 2A, a conference terminal 2B, a conference terminal 2C, and a conference terminal 2D. The conference terminal 2A is a terminal device for a video conference that is operated by the operation of the attendee A of the conference and performs processing such as attending a video conference held by the video conference server 4. Each of the conference terminals 2B, 2C, and 2D is a terminal device operated by the operations of attendee B, attendee C, and attendee D, similarly to the conference terminal 2A. Each of the attendees A to D who operate each of the conference terminals 2A from the conference terminal 2A may be an individual user or a group user. Each of the conference terminal 2A to the conference terminal 2D can be realized by a computer having a communication function.

なお、図1に示す例では、出席者がビデオ会議に出席するための端末装置として会議端末2Aから会議端末2Dの4台を一例として示したが、会議端末は図1に示す例(例えば4台)に限定されるものではなく、3個以上であればよい。以下の説明で、会議端末2Aから会議端末2Dの各々について個別の説明が不要で、会議端末に共通の事項を説明する場合には、会議端末2と称する場合がある。また、会議端末2Aから会議端末2Dの各々を操作する出席者Aから出席者Dについて個別の説明が不要で、共通の事項を説明する場合には、符号を付与せずに出席者と称する場合がある。 In the example shown in FIG. 1, four terminals from the conference terminal 2A to the conference terminal 2D are shown as an example as terminal devices for the attendees to attend the video conference, but the conference terminal is an example shown in FIG. 1 (for example, 4). The number is not limited to 3 or more. In the following description, it is not necessary to individually explain each of the conference terminal 2A to the conference terminal 2D, and when the matters common to the conference terminals are explained, the conference terminal 2 may be referred to. Further, it is not necessary to individually explain the attendees A to D who operate each of the conference terminals 2A from the conference terminal 2A, and when explaining common matters, they are referred to as attendees without assigning a code. There is.

ビデオ会議サーバ4は、ビデオ会議を開催および進行する処理を含む会議システムの管理を実行する処理を行う装置である。 The video conferencing server 4 is a device that performs processing for executing management of the conferencing system, including processing for holding and proceeding with video conferencing.

音声テキスト変換装置5は、主として入力された音声データをテキストデータに変換して出力する処理を行う機能を有する装置である。なお、音声テキスト変換装置5は、個別に構成された装置による構成に限定されるものではない。例えば、音声テキスト変換装置5が有する機能を、ビデオ会議サーバ4が備えるようにしてもよい。 The voice-to-speech conversion device 5 is a device having a function of mainly converting input voice data into text data and outputting the data. The voice-to-speech conversion device 5 is not limited to the configuration of individually configured devices. For example, the video conferencing server 4 may be provided with the functions of the voice-to-text converter 5.

複数の会議端末2と、ビデオ会議サーバ4と、音声テキスト変換装置5は、ネットワーク6を介して、相互に接続される。ネットワーク6は、無線接続による無線ネットワークおよび有線接続による有線ネットワークの少なくとも一方のネットワークが適用可能である。 The plurality of conference terminals 2, the video conference server 4, and the voice-to-text converter 5 are connected to each other via the network 6. As the network 6, at least one network of a wireless network by a wireless connection and a wired network by a wired connection can be applied.

なお、ネットワーク6は、装置間接続の一例を概念として示したものであり、有線及び無線の通信回線を含んでもよく、また、複数のネットワーク間通信、例えば、所謂イントラネット、およびインターネットを介して接続することを含んでもよい。 The network 6 is an example of a device-to-device connection as a concept, and may include wired and wireless communication lines, and is connected via a plurality of network-to-network communications, for example, a so-called intranet and the Internet. May include doing.

情報処理システム1は、本開示の技術の情報処理システムの一例である。ビデオ会議サーバ4は、本開示の技術の情報処理装置の一例である。会議端末2は、本開示の技術の会議端末の一例であり、会議端末2Aから会議端末2Dの何れか1つの会議端末2は、本開示の技術の第1会議端末の一例であり、会議端末2Aから会議端末2Dのうちの何れか1つの会議端末2以外の他の1つの会議端末2は、本開示の技術の第2会議端末の一例である。 The information processing system 1 is an example of an information processing system of the technology of the present disclosure. The video conferencing server 4 is an example of an information processing device of the technology of the present disclosure. The conference terminal 2 is an example of a conference terminal of the technology of the present disclosure, and any one of the conference terminals 2A to 2D of the conference terminal 2D is an example of the first conference terminal of the technology of the present disclosure. The other conference terminal 2 other than the conference terminal 2 from 2A to the conference terminal 2D is an example of the second conference terminal of the technique of the present disclosure.

(ビデオ会議サーバ4)
次に、図2を参照して、本開示の情報処理装置を実現可能なビデオ会議サーバ4の構成の一例を説明する。
(Video conferencing server 4)
Next, with reference to FIG. 2, an example of the configuration of the video conferencing server 4 capable of realizing the information processing apparatus of the present disclosure will be described.

ビデオ会議サーバ4は、コンピュータ本体40を備えており、コンピュータ本体40は、CPU(Central Processing Unit)41、RAM(Random Access Memory)42、ROM(Read−Only memory)43、および入出力ポート(I/O)44を備え、これらはバス46を介して互いに接続されている。バス46には、HDD(Hard Disk Drive)及び不揮発性のフラッシュメモリ等によって実現可能な補助記憶装置45が接続されている。また、I/O44には、外部装置と通信する通信I/F47が接続されている。図2に示す例では省略したが、I/O44には、ディスプレイ、マウス及びキーボードなどの操作表示部が接続可能に構成されている。 The video conferencing server 4 includes a computer main body 40, and the computer main body 40 includes a CPU (Central Processing Unit) 41, a RAM (Random Access Memory) 42, a ROM (Read-Only memory) 43, and an input / output port (I). / O) 44, which are connected to each other via a bus 46. An auxiliary storage device 45 that can be realized by an HDD (Hard Disk Drive), a non-volatile flash memory, or the like is connected to the bus 46. Further, a communication I / F 47 that communicates with an external device is connected to the I / O 44. Although omitted in the example shown in FIG. 2, the I / O 44 is configured to be connectable to an operation display unit such as a display, a mouse, and a keyboard.

補助記憶装置45には、ビデオ会議を開催および進行する処理を含む会議システムの管理を実行する処理を行う機能を有する会議システムプログラム45Mが記憶される。ビデオ会議サーバ4のCPU41は、会議システムプログラム45Mを補助記憶装置45から読み出してRAM42に展開して処理を実行する。これにより、会議システムプログラム45Mを実行したビデオ会議サーバ4は、会議システムを管理し、かつ多地点接続装置(MCU:Multi−point Control Unit)の機能を有する装置として動作する。なお、会議システムの管理を実行する処理を行う機能を有するビデオ会議サーバ4は、公知の技術であるため詳細な説明を省略する。 The auxiliary storage device 45 stores a conference system program 45M having a function of executing management of the conference system including a process of holding and proceeding a video conference. The CPU 41 of the video conferencing server 4 reads the conferencing system program 45M from the auxiliary storage device 45, expands it into the RAM 42, and executes processing. As a result, the video conferencing server 4 that executes the conferencing system program 45M operates as a device that manages the conferencing system and has a function of a multipoint connection device (MCU: Multi-point Control Unit). Since the video conferencing server 4 having a function of executing the management of the conferencing system is a known technique, detailed description thereof will be omitted.

また、補助記憶装置45には、会議システムプログラム45Mおよび後述する情報処理プログラム45Pの各々で利用される各種のデータ45Dが記憶される。例えば、会議システムプログラム45Mの実行により開催された会議の議事録を示す議事録情報が記憶される(詳細は後述)。 Further, the auxiliary storage device 45 stores various data 45D used in each of the conference system program 45M and the information processing program 45P described later. For example, minutes information indicating the minutes of the meeting held by executing the meeting system program 45M is stored (details will be described later).

なお、補助記憶装置45に記憶されるデータ45Dは、ビデオ会議サーバ4に記憶することに限定されない。例えば、外部ストレージ(図示省略)に格納してビデオ会議サーバ4が外部ストレージ(図示省略)に対して通信によって読み書きするようにしてもよい。 The data 45D stored in the auxiliary storage device 45 is not limited to being stored in the video conferencing server 4. For example, it may be stored in an external storage (not shown) so that the video conferencing server 4 reads and writes to the external storage (not shown) by communication.

また、補助記憶装置45には、ビデオ会議サーバ4を本開示の情報処理装置として機能させるための情報処理プログラム45Pが記憶される。情報処理プログラム45Pは、主として、会議システムプログラム45Mの実行により開催された会議の議事録を示す議事録情報をデータ45Dに記憶する処理を実行するプログラムである。具体的には、ビデオ会議サーバ4は、開催されている会議における出席者からの発言を受け付けて、議事録情報を記憶する処理を実行する。すなわち、ビデオ会議サーバ4のCPU41は、情報処理プログラム45Pを補助記憶装置45から読み出してRAM42に展開して処理を実行する。これにより、情報処理プログラム45Pを実行したビデオ会議サーバ4は本開示の情報処理装置として動作する。 Further, the auxiliary storage device 45 stores an information processing program 45P for making the video conferencing server 4 function as the information processing device of the present disclosure. The information processing program 45P is a program that mainly executes a process of storing the minutes information indicating the minutes of the conference held by executing the conference system program 45M in the data 45D. Specifically, the video conferencing server 4 receives remarks from attendees at the conference being held and executes a process of storing the minutes information. That is, the CPU 41 of the video conferencing server 4 reads the information processing program 45P from the auxiliary storage device 45, expands it into the RAM 42, and executes the process. As a result, the video conference server 4 that executes the information processing program 45P operates as the information processing device of the present disclosure.

なお、詳細は後述するが、情報処理プログラム45Pは、議事録記録処理および議事録提供処理の各々を実行するプロセスを含む。 Although the details will be described later, the information processing program 45P includes a process of executing each of the minutes recording process and the minutes providing process.

また、本実施形態では、ビデオ会議サーバ4の補助記憶装置45に情報処理プログラム45Pを記憶しておき、ビデオ会議サーバ4で実行させる場合を説明するが、情報処理プログラム45Pは、通信I/F47を介して外部装置および記録媒体から読み出して取得してもよい。 Further, in the present embodiment, the case where the information processing program 45P is stored in the auxiliary storage device 45 of the video conference server 4 and executed by the video conference server 4 will be described. The information processing program 45P is the communication I / F 47. It may be read out from an external device and a recording medium and acquired via.

(音声テキスト変換装置5)
次に、図3を参照して、音声テキスト変換装置5の構成の一例を説明する。
図3に示すように、音声テキスト変換装置5は、装置本体50を備えており、装置本体50は、CPU51、RAM52、ROM53、およびI/O54を備えたコンピュータによって実現される。
(Voice-text converter 5)
Next, an example of the configuration of the voice-to-text conversion device 5 will be described with reference to FIG.
As shown in FIG. 3, the voice-text conversion device 5 includes a device main body 50, and the device main body 50 is realized by a computer equipped with a CPU 51, a RAM 52, a ROM 53, and an I / O 54.

音声テキスト変換装置5は、装置本体50を備えており、装置本体50は、CPU51、RAM52、ROM53、およびI/O54を備え、これらはバス56を介して互いに接続されている。I/O54には、外部装置と通信する通信I/F57が接続されている。また、バス56には補助記憶装置55が接続されている。補助記憶装置55には、音声テキスト変換プログラム55Pが記憶される。音声テキスト変換プログラム55Pは、会議端末2からの音声データをテキストデータに変換するための処理を実行するプログラムである。具体的には、音声テキスト変換装置5は、音声データを受け付けて、受け付けた音声データをテキストデータに変換する処理を実行する。すなわち、音声テキスト変換装置5のCPU51は、音声テキスト変換プログラム55Pを補助記憶装置55から読み出してRAM52に展開して処理を実行する。これにより、音声テキスト変換プログラム55Pを実行した音声テキスト変換装置5は、受け付けた音声データをテキストデータに変換して出力する装置として動作する。なお、音声テキスト変換装置5で実現可能な音声データをテキストデータに変換して出力する機能は公知の技術であるため詳細な説明を省略する。 The voice-text conversion device 5 includes a device main body 50, which includes a CPU 51, a RAM 52, a ROM 53, and an I / O 54, which are connected to each other via a bus 56. A communication I / F 57 that communicates with an external device is connected to the I / O 54. Further, an auxiliary storage device 55 is connected to the bus 56. The voice-text conversion program 55P is stored in the auxiliary storage device 55. The voice-text conversion program 55P is a program that executes a process for converting voice data from the conference terminal 2 into text data. Specifically, the voice-text conversion device 5 receives voice data and executes a process of converting the received voice data into text data. That is, the CPU 51 of the voice text conversion device 5 reads the voice text conversion program 55P from the auxiliary storage device 55, expands it into the RAM 52, and executes the process. As a result, the voice-text conversion device 5 that executes the voice-text conversion program 55P operates as a device that converts the received voice data into text data and outputs the data. Since the function of converting voice data that can be realized by the voice-text conversion device 5 into text data and outputting it is a known technique, detailed description thereof will be omitted.

(会議端末2)
次に、図4を参照して、ビデオ会議用の端末装置の一例である会議端末2の構成を説明する。
(Conference terminal 2)
Next, with reference to FIG. 4, the configuration of the conference terminal 2 which is an example of the terminal device for video conferencing will be described.

会議端末2は、コンピュータ本体20を備えており、コンピュータ本体20は、CPU21、RAM22、ROM23、およびI/O24を備え、これらはバス26を介して互いに接続されている。また、I/O24には、外部装置と通信する通信I/F27、会議端末2を操作する出席者を撮像するカメラ28C、当該出席者の音声を集音するマイク28M、当該第1出席者が操作するマウス及びキーボードなどの操作入力部28K、ディスプレイ等の表示部29が接続されている。 The conference terminal 2 includes a computer main body 20, which includes a CPU 21, a RAM 22, a ROM 23, and an I / O 24, which are connected to each other via a bus 26. Further, the I / O 24 includes a communication I / F 27 that communicates with an external device, a camera 28C that captures an attendee who operates the conference terminal 2, a microphone 28M that collects the sound of the attendee, and the first attendee. An operation input unit 28K such as a mouse and a keyboard to be operated, and a display unit 29 such as a display are connected.

会議端末2をビデオ会議用の端末装置として機能させるための端末プログラム(図示省略)は、予めROM23に記憶されているものとする。会議端末プログラム(図示省略)は、会議端末2に補助記憶装置(図示省略)を具備させ、補助記憶装置(図示省略)に会議端末プログラム(図示省略)を記憶しておき、読み取ってもよく、外部ストレージ(図示省略)に格納して通信によって読み取るようにしてもよい。 It is assumed that the terminal program (not shown) for making the conference terminal 2 function as a terminal device for video conferencing is stored in the ROM 23 in advance. The conference terminal program (not shown) may be read by equipping the conference terminal 2 with an auxiliary storage device (not shown) and storing the conference terminal program (not shown) in the auxiliary storage device (not shown). It may be stored in an external storage (not shown) and read by communication.

会議端末2Aから会議端末2Dの各々は略同様の構成であるため、個別の説明を省略する。
なお、会議端末2は、内部でデータ処理を行う電子機器に組み込んで、組み込まれた電子機器を会議端末2として機能させてもよい。例えば、会議端末2は、パーソナル・コンピュータ(PC)等の独立したコンピュータに端末プログラム(図示省略)を導入して会議端末2として機能させてもよい。また、PCに代えて、PDA(Personal Digital Assistant)や携帯電話機等の携帯機器に適用してもよい。
Since each of the conference terminal 2A to the conference terminal 2D has substantially the same configuration, individual description thereof will be omitted.
The conference terminal 2 may be incorporated into an electronic device that internally performs data processing, and the incorporated electronic device may function as the conference terminal 2. For example, the conference terminal 2 may function as the conference terminal 2 by introducing a terminal program (not shown) into an independent computer such as a personal computer (PC). Further, instead of the PC, it may be applied to a portable device such as a PDA (Personal Digital Assistant) or a mobile phone.

情報処理プログラム45Pは、本開示の技術の情報処理プログラムの一例である。また、情報処理プログラム45Pが実行されるビデオ会議サーバ4は、開示の技術の情報処理装置の一例である。また、音声データ、チャットデータ、およびテキストデータは本開示の送信情報の一例である。 The information processing program 45P is an example of an information processing program of the technique of the present disclosure. Further, the video conference server 4 on which the information processing program 45P is executed is an example of an information processing device of the disclosed technology. In addition, voice data, chat data, and text data are examples of transmission information of the present disclosure.

(ビデオ会議サーバ4)
次に、ビデオ会議サーバ4の機能について説明する。
(Video conferencing server 4)
Next, the function of the video conference server 4 will be described.

ところで、複数の出席者が出席する会議の議事録には、複数の出席者の各々の発言が記録されることが好ましい。しかし、同時又は同時に近い時間に複数の出席者により複数の発言が行われた場合、会議における発言を録音した録音データを用いて議事録用にテキスト変換したのみでは、複数の発言の各々を忠実に記録することが困難な場合がある。 By the way, it is preferable that the minutes of a meeting attended by a plurality of attendees record the remarks of each of the plurality of attendees. However, when multiple remarks are made by multiple attendees at the same time or at the same time, each of the multiple remarks is faithful only by converting the text for the minutes using the recorded data of the remarks at the meeting. It may be difficult to record in.

この事実を鑑み、本実施形態では、会議中に行われた複数の出席者による発言の各々を忠実に議事録への追記を可能とする。 In view of this fact, in the present embodiment, it is possible to faithfully add each of the statements made by the plurality of attendees during the meeting to the minutes.

また、複数の出席者が出席する会議では、例えば、会議中に、会議出席者の全員より少ない一部の出席者の間(例えば2者間)で質問や確認等の問い合わせをしたり、指示等の依頼をしたりする情報のやり取り(情報の授受)が行われる場合がある。このような一部の出席者の間で行われた情報のやり取り(情報の授受)も、議事録に記録されることが好ましい。ところが、会議システムにおける発言は、参加者全員に公開されることが一般的であり、一部の出席者の間でやり取りが行われた情報として議事録への記録は困難であった。 In a meeting attended by a plurality of attendees, for example, during the meeting, inquiries such as questions and confirmations may be made or instructed among some attendees (for example, between two parties), which is less than all the attendees of the meeting. Information may be exchanged (information exchange) to request such things. It is preferable that the exchange of information (transfer of information) between some of the attendees is also recorded in the minutes. However, the remarks in the conference system are generally open to all participants, and it is difficult to record them in the minutes as information exchanged among some attendees.

この事実を鑑み、本実施形態では、会議中に一部の出席者の間でやり取りされた情報についても議事録への追記を可能とする。 In view of this fact, in the present embodiment, it is possible to add information exchanged between some attendees during the meeting to the minutes.

一方、会議中に、会議出席者の全員より少ない一部の出席者の間で行われる情報のやり取りでは、その情報のやり取りを行う当事者が、当事者外の他の出席者に公開されることを望まない、例えば意図的に秘匿を希望する場合もある。 On the other hand, in the exchange of information between some attendees, which is less than all the attendees of the meeting, during the meeting, the party exchanging the information is open to other attendees outside the party. You may not want it, for example, you may intentionally want it to be concealed.

そこで、本実施形態では、会議中に会議出席者の全員より少ない一部の出席者の間における情報のやり取りについて、当事者が希望する意図を反映させつつ議事録への追記を可能とする。 Therefore, in the present embodiment, it is possible to add information to the minutes while reflecting the intentions desired by the parties regarding the exchange of information between some attendees, which is less than all the attendees of the meeting, during the meeting.

なお、以下の説明を簡単にするため、本実施形態では、出席者が操作する会議端末2によって、音声による会議への発言、および複数の出席者の間でチャットを行うことを可能とする場合を説明する。ここで、チャットとは、複数の会議端末2の間で、リアルタイムでメッセージ(例えば、テキスト情報)をやり取りすることをいう。 In addition, in order to simplify the following explanation, in the present embodiment, when it is possible to speak to the conference by voice and to chat among a plurality of attendees by the conference terminal 2 operated by the attendees. Will be explained. Here, chat means exchanging a message (for example, text information) in real time between a plurality of conference terminals 2.

また、本実施形態では、会議端末2を用い、音声によって会議への発言が行われ、また、チャットによって複数の出席者のうちの一部の出席者の間で情報のやり取りを行う場合を説明する。この場合、音声による会議への発言は、出席者全員に対して行われる発言とし、チャットによる一部の出席者への情報のやり取り(送信)は、出席者全員又は送信先の出席者に対して行われるチャットとする。 Further, in the present embodiment, a case where the conference terminal 2 is used to speak to the conference by voice and information is exchanged between some of the attendees among a plurality of attendees by chat will be described. do. In this case, the voice statement to the meeting shall be a statement made to all attendees, and the exchange (transmission) of information to some attendees by chat shall be made to all attendees or the attendees at the destination. The chat will be held.

図5に、本実施形態におけるビデオ会議サーバ4の機能構成の一例を示す。
図5に示すように、ビデオ会議サーバ4は、議事録生成部400、および議事録記録部420として機能する機能部を備えている。これら議事録生成部400、および議事録記録部420は、出席者各々による発言、および一部の出席者の間での情報のやり取りを議事録メモとして議事録への記録を可能とする。
FIG. 5 shows an example of the functional configuration of the video conferencing server 4 in the present embodiment.
As shown in FIG. 5, the video conferencing server 4 includes a minutes generation unit 400 and a functional unit that functions as the minutes recording unit 420. The minutes generation unit 400 and the minutes recording unit 420 make it possible to record the remarks made by each attendee and the exchange of information among some attendees as minutes memos in the minutes.

議事録生成部400、および議事録記録部420の各機能部は、複数の会議端末2毎に、議事録メモ生成部400A〜400D、および議事録メモ記録部420A〜420Dを備えている。 Each functional unit of the minutes generation unit 400 and the minutes recording unit 420 includes minutes memo generation units 400A to 400D and minutes memo recording units 420A to 420D for each of the plurality of conference terminals 2.

議事録メモ生成部400A、および議事録メモ記録部420Aは、会議端末2Aにより入力された出席者Aの発言、および出席者Aが他の出席者への情報のやり取りを議事録メモとして議事録45Gへ記録する。 The minutes memo generation unit 400A and the minutes memo recording unit 420A record the remarks of attendee A input by the conference terminal 2A and the exchange of information by attendee A with other attendees as minutes memos. Record to 45G.

議事録メモ生成部400Aは、指示取得部402と、音声取得部404と、チャット取得部406と、資格判定部408と、音声・テキスト変換部410と、モード確認部412とを備えている。 The minutes memo generation unit 400A includes an instruction acquisition unit 402, a voice acquisition unit 404, a chat acquisition unit 406, a qualification determination unit 408, a voice / text conversion unit 410, and a mode confirmation unit 412.

指示取得部402は、会議端末2Aからのチャットデータに対する送信先の出席者およびチャットデータを秘匿とするか否かの指示を示す指示データを取得し、取得した指示データをモード確認部412へ出力する機能部である。会議端末2Aからの指示データには、送信先の出席者を示す情報、例えば、出席者を示すID(図6では、ID−AからID−Dとして示している。)が含まれる。すなわち、指示取得部402は、会議端末2AからのIDを取得することで、送信先の出席者の指示を示す情報を取得する。また、会議端末2Aからの指示データには、チャットデータを秘匿とするか否かの指示を示す情報が含まれる。すなわち、指示取得部402は、会議端末2Aからの秘匿とするか否かの指示を示す情報を取得することで、チャットデータを秘匿とするか否かの指示を取得する。なお、指示取得部402は、指示データを取得した年月日時刻を示す時刻データを取得し、指示データに対応付ける機能を有する。これによって、指示データを時系列に把握することが可能となる。 The instruction acquisition unit 402 acquires instruction data indicating the attendees at the transmission destination for the chat data from the conference terminal 2A and an instruction as to whether or not to keep the chat data confidential, and outputs the acquired instruction data to the mode confirmation unit 412. It is a functional part to do. The instruction data from the conference terminal 2A includes information indicating attendees at the transmission destination, for example, IDs indicating attendees (in FIG. 6, they are indicated as ID-A to ID-D). That is, the instruction acquisition unit 402 acquires the information indicating the instruction of the attendee at the transmission destination by acquiring the ID from the conference terminal 2A. Further, the instruction data from the conference terminal 2A includes information indicating an instruction as to whether or not to keep the chat data confidential. That is, the instruction acquisition unit 402 acquires an instruction as to whether or not to keep the chat data confidential by acquiring information indicating whether or not to keep the chat data confidential from the conference terminal 2A. The instruction acquisition unit 402 has a function of acquiring time data indicating the date and time when the instruction data was acquired and associating the instruction data with the instruction data. This makes it possible to grasp the instruction data in chronological order.

なお、出席者を示すIDは、本開示の識別情報および送信先情報の一例である。また、会議端末2Aからの指示データに含まれる送信先の出席者を示す情報、例えば、出席者を示すIDは、本開示の送信先情報の一例である。指示データにより示されるチャットデータに対する送信先の出席者およびチャットデータを秘匿とするか否かの指示を示す情報は、本開示の秘匿識別情報の一例である。 The ID indicating the attendee is an example of the identification information and the destination information of the present disclosure. Further, the information indicating the attendees of the destination included in the instruction data from the conference terminal 2A, for example, the ID indicating the attendees is an example of the destination information of the present disclosure. The attendees at the transmission destination for the chat data indicated by the instruction data and the information indicating the instruction as to whether or not to keep the chat data confidential are an example of the confidential identification information of the present disclosure.

また、指示取得部402、音声取得部404、およびチャット取得部406は、本開示の取得部の一例である。議事録生成部400および議事録メモ生成部400Aは、本開示の生成部の一例である。議事録記録部420および議事録メモ記録部420Aは、本開示の制御部の一例である。 Further, the instruction acquisition unit 402, the voice acquisition unit 404, and the chat acquisition unit 406 are examples of the acquisition units of the present disclosure. The minutes generation unit 400 and the minutes memo generation unit 400A are examples of the generation unit of the present disclosure. The minutes recording unit 420 and the minutes memo recording unit 420A are examples of the control unit of the present disclosure.

音声取得部404は、会議端末2Aから送信された音声データを取得し、取得した音声データを資格判定部408へ出力する機能部である。なお、音声取得部404は、音声データを取得した年月日時刻を示す時刻データを取得し、音声データに対応付ける機能を有する。これによって、音声データを時系列に把握することが可能となる。 The voice acquisition unit 404 is a functional unit that acquires voice data transmitted from the conference terminal 2A and outputs the acquired voice data to the qualification determination unit 408. The voice acquisition unit 404 has a function of acquiring time data indicating the date and time when the voice data was acquired and associating the voice data with the voice data. This makes it possible to grasp the voice data in chronological order.

チャット取得部406は、会議端末2Aから送信されたチャットデータを取得し、取得したチャットデータをモード確認部412へ出力する機能部である。なお、チャット取得部406は、チャットデータを取得した年月日時刻を示す時刻データを取得し、チャットデータに対応付ける機能を有する。これによって、チャットデータを時系列に把握することが可能となる。 The chat acquisition unit 406 is a functional unit that acquires the chat data transmitted from the conference terminal 2A and outputs the acquired chat data to the mode confirmation unit 412. The chat acquisition unit 406 has a function of acquiring time data indicating the date and time when the chat data was acquired and associating the chat data with the chat data. This makes it possible to grasp the chat data in chronological order.

資格判定部408は、音声取得部404で取得された音声データについて発言権の有無を判定する機能部である。資格判定部408は、発言権の有無が記録された補助記憶装置45のデータ45Dに記憶されたテーブル45T(図5及び図6)を用いて判定する。すなわち、資格判定部408は、テーブル45T(図5及び図6)に記録された出席者の発言権が有の場合に、音声データを音声・テキスト変換部410へ出力する。一方、テーブル45T(図5及び図6)に記録された出席者の発言権が無の場合には、資格判定部408は、音声データを音声・テキスト変換部410へ出力することなく、例えばノイズとして破棄する。なお、現在、他の出席者による発言が行われている場合には、出席者Aによる発言を待機させるようにしてもよい。 The qualification determination unit 408 is a function unit that determines whether or not there is a right to speak with respect to the voice data acquired by the voice acquisition unit 404. The qualification determination unit 408 determines using the table 45T (FIGS. 5 and 6) stored in the data 45D of the auxiliary storage device 45 in which the presence or absence of the right to speak is recorded. That is, the qualification determination unit 408 outputs voice data to the voice / text conversion unit 410 when the attendees have the right to speak recorded in the table 45T (FIGS. 5 and 6). On the other hand, when the attendees have no voice recorded in the table 45T (FIGS. 5 and 6), the qualification determination unit 408 does not output the voice data to the voice / text conversion unit 410, for example, noise. Discard as. If other attendees are currently speaking, the attendee A may be made to stand by.

音声・テキスト変換部410は、資格判定部408を介して入力された音声データをテキスト変換して議事録メモ記録部420Aへ出力する機能部である。なお、本実施形態では、音声・テキスト変換部410は、入力された音声データを、音声テキスト変換装置5へ送信し、その応答としてテキスト変換されたテキストデータを取得する。 The voice / text conversion unit 410 is a functional unit that converts voice data input via the qualification determination unit 408 into text and outputs it to the minutes memo recording unit 420A. In the present embodiment, the voice / text conversion unit 410 transmits the input voice data to the voice / text conversion device 5, and acquires the text-converted text data as a response.

音声・テキスト変換部410は、テキスト変換された音声テキストデータに、音声データが出席者全員に対する発言であることを示す「発言」および「全員」を示す情報を付与して出力する。具体的には、音声・テキスト変換部410は、議事録に記録する情報の「媒体」、「モード」、および「送信先」の各々による属性情報として、「音声」、「発言」、および「全員」の各々を示す属性情報を音声テキストデータに付与した議事録メモデータを出力する。 The voice / text conversion unit 410 adds "speech" indicating that the voice data is a remark to all the attendees and information indicating "all" to the text-converted voice text data and outputs the data. Specifically, the voice / text conversion unit 410 sets "voice", "speech", and "speech" as attribute information according to each of the "medium", "mode", and "destination" of the information to be recorded in the minutes. Outputs the minutes memo data in which the attribute information indicating each of "everyone" is added to the voice text data.

モード確認部412は、指示取得部402で取得された指示データを用いて、チャット取得部406で取得されたチャットデータに対するモードを確認して、確認結果のモードを示す情報を、チャットデータに付与して議事録メモ記録部420Aへ出力する機能部である。モード確認部412で確認するモードには、出席者全員への「発言」のチャットデータであること、および指示した出席者との間で「秘匿」のチャットデータであること、の何れであるのかの確認モードが挙げられる。モード確認部412は、指示データが出席者全員への「発言」のチャットデータであることを示す場合、モードを「発言」とし、送信先を「全員」とする。また、モード確認部412は、指示データが出席者との間で「秘匿」のチャットデータであることを示す場合、モードを「秘匿」とし、送信先を指示データで指示された「出席者」とする。具体的には、モード確認部412は、「媒体」、「モード」、および「送信先」の各々による属性情報として、「チャット」、「発言」又は「秘匿」、および、「全員」又は指示データで指示された「出席者」の各々を示す属性情報をチャットデータに付与した議事録メモデータを出力する。 The mode confirmation unit 412 confirms the mode for the chat data acquired by the chat acquisition unit 406 using the instruction data acquired by the instruction acquisition unit 402, and adds information indicating the mode of the confirmation result to the chat data. It is a functional unit that outputs to the minutes memo recording unit 420A. Whether the mode to be confirmed by the mode confirmation unit 412 is the chat data of "speaking" to all the attendees or the chat data of "confidential" with the instructed attendees. Confirmation mode can be mentioned. When the mode confirmation unit 412 indicates that the instruction data is chat data of "speaking" to all the attendees, the mode is set to "speaking" and the destination is set to "all". Further, when the mode confirmation unit 412 indicates that the instruction data is "confidential" chat data with the attendees, the mode is set to "confidential" and the destination is the "attendee" instructed by the instruction data. And. Specifically, the mode confirmation unit 412 indicates "chat", "speech" or "confidentiality", and "everyone" or an instruction as attribute information by each of "medium", "mode", and "destination". Outputs the minutes memo data in which the attribute information indicating each of the "attendees" indicated by the data is added to the chat data.

議事録メモ記録部420Aは、議事録メモ生成部400Aで生成された議事録メモデータを、会議の議事録45Gへ追記する機能部である。すなわち、会議端末2Aにより入力された出席者Aの発言、および出席者Aが他の出席者への情報のやり取りを議事録メモとして議事録45Gへ記録する。 The minutes memo recording unit 420A is a functional unit that adds the minutes memo data generated by the minutes memo generation unit 400A to the minutes 45G of the meeting. That is, the remarks of the attendee A input by the conference terminal 2A and the exchange of information by the attendee A with other attendees are recorded in the minutes 45G as the minutes memo.

従って、出席者Aの音声データは、音声・テキスト変換部410でテキストデータに変換され、議事録メモ記録部420Aによって議事録45Gに記録(追記)される。なお、テキストデータには、「媒体」=「音声」/「モード」=「発言」又は「秘話」/「送信先」=「全員」又は「出席者」による属性情報が付加される。 Therefore, the voice data of the attendee A is converted into text data by the voice / text conversion unit 410, and recorded (added) in the minutes 45G by the minutes memo recording unit 420A. Attribute information by "medium" = "voice" / "mode" = "speech" or "secret story" / "destination" = "everyone" or "attendee" is added to the text data.

出席者Aのチャットデータは、「媒体」=「チャット」/「モード」=「発言」又は「秘話」/「送信先」=「全員」又は「出席者」による属性情報が付加され、議事録メモ記録部420Aによって議事録45Gに記録(追記)される。 The chat data of attendee A is added with attribute information by "medium" = "chat" / "mode" = "speech" or "secret story" / "destination" = "everyone" or "attendee", and the minutes. It is recorded (added) in the minutes 45G by the memo recording unit 420A.

議事録メモ生成部400Bから400D、および議事録メモ記録部420Bから420Dの各々は、議事録メモ生成部400A、および議事録メモ記録部420Aと同様の構成のため、詳細な説明を省略する。 Since each of the minutes memo generation units 400B to 400D and the minutes memo recording units 420B to 420D has the same configuration as the minutes memo generation unit 400A and the minutes memo recording unit 420A, detailed description thereof will be omitted.

以上の構成により、出席者Aから出席者Dの各々の音声データは、文字情報に変換されたテキストデータに属性情報が付加されて、議事録45Gに記録(追記)される。また、出席者Aから出席者Dの各々のチャットデータも、チャットデータに属性情報が付加されて、議事録45Gに記録(追記)される。 With the above configuration, the voice data of each of the attendees A to D is recorded (added) in the minutes 45G by adding the attribute information to the text data converted into the character information. In addition, the chat data of each of the attendees A to D is also recorded (added) in the minutes 45G by adding the attribute information to the chat data.

このように、ビデオ会議サーバ4において出席者各々の音声データをテキストに変換することにより、会議端末2の各々の音声を個別にテキストに変換でき、変換精度を向上することが可能となる。すなわち、会議中に行われた複数の出席者による発言の各々を忠実に議事録への記録が可能となる。 In this way, by converting the voice data of each attendee into text in the video conference server 4, each voice of the conference terminal 2 can be individually converted into text, and the conversion accuracy can be improved. That is, it is possible to faithfully record each of the statements made by a plurality of attendees during the meeting in the minutes.

また、会議中に一部の出席者の間でやり取りされた情報についても議事録への記録が可能となる。さらに、会議中に行われる一部の出席者の間における情報のやり取りについて、当事者が希望する意図を反映、例えば情報のやり取りを秘匿した状態(モード)であることを表して議事録への記録が可能となる。 In addition, information exchanged between some attendees during the meeting can also be recorded in the minutes. Furthermore, regarding the exchange of information between some attendees during the meeting, the intention of the parties is reflected, for example, the exchange of information is recorded in the minutes of the meeting in a concealed state (mode). Is possible.

次に、本開示の情報処理方法としてビデオ会議サーバ4が実行する情報処理のうちの議事録記録処理を説明する。 Next, as the information processing method of the present disclosure, the minutes recording process of the information processing executed by the video conference server 4 will be described.

図7に、ビデオ会議サーバ4で実行される議事録記録処理の流れの一例を示す。図7は、会議端末2において出席者の音声に関する議事録が記録される場合の議事録記録処理の流れの一例が示されている。 FIG. 7 shows an example of the flow of the minutes recording process executed by the video conference server 4. FIG. 7 shows an example of the flow of the minutes recording process when the minutes related to the voice of the attendees are recorded on the conference terminal 2.

ビデオ会議サーバ4では、会議端末2から出力された出席者の音声データを受け付けると、図7に示す処理ルーチンをCPU41が実行する。 When the video conferencing server 4 receives the audio data of the attendees output from the conferencing terminal 2, the CPU 41 executes the processing routine shown in FIG. 7.

CPU41は、ステップS100で、会議端末2から出力された出席者の音声データを取得する。このステップS100の処理は、図5に示す音声取得部404(議事録メモ生成部400Aから400Dの何れか)の機能に対応する。次に、CPU41は、ステップS110で、会議端末2の出席者が発言権を有することを確認して、確認された当該会議端末2からステップS100で取得した音声データを発言者の音声データとして合成するかの判定を行う(すなわち、合成判定を行う)。ステップS110では、発言権が有の場合には、ステップS120へ処理を移行し、発言権が無の場合には、ステップS100へ処理を戻す。ステップS110の処理は、図5に示す資格判定部408(議事録メモ生成部400Aから400Dの何れか)の機能に対応する。次に、CPU41は、ステップS120で、ステップS110で合成が行なわれる音声データについて、音声テキスト変換を行う。ステップS120の処理は、図5に示す音声・テキスト変換部410(議事録メモ生成部400Aから400Dの何れか)の機能に対応する。次に、CPU41は、ステップS130で、議事録を記録して本処理ルーチンを終了する。ステップS130の処理は、議事録記録部420(議事録メモ記録部420Aから420Dの何れか)の機能に対応する。 In step S100, the CPU 41 acquires the audio data of the attendees output from the conference terminal 2. The process of step S100 corresponds to the function of the voice acquisition unit 404 (any of the minutes memo generation units 400A to 400D) shown in FIG. Next, the CPU 41 confirms in step S110 that the attendees of the conference terminal 2 have the right to speak, and synthesizes the confirmed voice data acquired from the conference terminal 2 in step S100 as the voice data of the speaker. Judgment of whether to do (that is, perform a synthesis judgment). In step S110, if there is a right to speak, the process shifts to step S120, and if there is no right to speak, the process returns to step S100. The process of step S110 corresponds to the function of the qualification determination unit 408 (any of the minutes memo generation units 400A to 400D) shown in FIG. Next, in step S120, the CPU 41 performs voice-to-text conversion on the voice data to be synthesized in step S110. The process of step S120 corresponds to the function of the voice / text conversion unit 410 (any of the minutes memo generation units 400A to 400D) shown in FIG. Next, in step S130, the CPU 41 records the minutes and ends the processing routine. The process of step S130 corresponds to the function of the minutes recording unit 420 (any of the minutes memo recording units 420A to 420D).

図8に、会議端末2において出席者によるチャットに関する議事録が記録される場合の議事録記録処理の流れの一例を示す。 FIG. 8 shows an example of the flow of the minutes recording process when the minutes related to the chat by the attendees are recorded on the conference terminal 2.

ビデオ会議サーバ4では、会議端末2からの出席者によるチャットデータを受け付けると、図8に示す処理ルーチンをCPU41が実行する。 When the video conferencing server 4 receives the chat data from the attendees from the conferencing terminal 2, the CPU 41 executes the processing routine shown in FIG.

CPU41は、ステップS200で、会議端末2から出力された出席者によるチャットデータを取得する。このステップS200の処理は、図5に示すチャット取得部406(議事録メモ生成部400Aから400Dの何れか)の機能に対応する。次に、CPU41は、ステップS210で、指示取得部402で取得された会議端末2からの指示データを指示取得部402から取得して、チャットデータが秘匿を示すモードか否かのモード判定を行う。ステップS210では、会議端末2からの指示データがチャットデータの秘匿を示す場合は肯定され、ステップS230へ処理を移行する。一方、会議端末2からの指示データがチャットデータの発言を示す場合は否定され、ステップS220へ処理を移行する。ステップS210の処理は、図5に示すモード確認部412(議事録メモ生成部400Aから400Dの何れか)の機能に対応する。CPU41は、ステップS220で、チャットデータを発言データ(「チャット」、「秘匿」、および指示データで指示された「出席者」を含む属性情報が付与されたデータ)とする議事録メモを生成し、ステップS240へ処理を移行する。また、CPU41は、ステップS230で、チャットデータを秘匿データ(「チャット」、「発言」、および「全員」を含む属性情報が付与されたデータ)とする議事録メモを生成し、ステップS240へ処理を移行する。ステップS210からステップS230の処理は、図5に示すモード確認部412(議事録メモ生成部400Aから400Dの何れか)の機能に対応する。次に、CPU41は、ステップS240で、ステップS220又はステップS230で生成された議事録メモを議事録に追記することで、議事録を記録する。ステップS240の処理は、図5に示す議事録記録部420(議事録メモ記録部420Aから420Dの何れか)の機能に対応する。 In step S200, the CPU 41 acquires the chat data by the attendees output from the conference terminal 2. The process of step S200 corresponds to the function of the chat acquisition unit 406 (any of the minutes memo generation units 400A to 400D) shown in FIG. Next, in step S210, the CPU 41 acquires the instruction data from the conference terminal 2 acquired by the instruction acquisition unit 402 from the instruction acquisition unit 402, and determines whether or not the chat data is in a mode indicating confidentiality. .. In step S210, if the instruction data from the conference terminal 2 indicates the confidentiality of the chat data, it is affirmed, and the process shifts to step S230. On the other hand, if the instruction data from the conference terminal 2 indicates the remark of the chat data, it is denied, and the process proceeds to step S220. The process of step S210 corresponds to the function of the mode confirmation unit 412 (any of the minutes memo generation units 400A to 400D) shown in FIG. In step S220, the CPU 41 generates a minutes memo in which the chat data is used as speech data (data to which attribute information including "chat", "confidential", and "attendee" instructed by the instruction data is added). , The process shifts to step S240. Further, in step S230, the CPU 41 generates a minutes memo in which the chat data is concealed data (data to which attribute information including "chat", "speech", and "everyone" is added), and processes the chat data in step S240. To migrate. The processing of steps S210 to S230 corresponds to the function of the mode confirmation unit 412 (any of the minutes memo generation units 400A to 400D) shown in FIG. Next, in step S240, the CPU 41 records the minutes by adding the minutes memo generated in step S220 or step S230 to the minutes. The process of step S240 corresponds to the function of the minutes recording unit 420 (any of the minutes memo recording units 420A to 420D) shown in FIG.

図9に、会議端末2からの出席者による音声データおよびチャットデータを記録した議事録の一例を示す。 FIG. 9 shows an example of minutes in which voice data and chat data by attendees from the conference terminal 2 are recorded.

図9には、出席者Aから出席者Dの各々による音声データおよびチャットデータについて、議事録メモの全てを時系列に配列した議事録の一例が示されている。例えば、出席者Aにより10:00:00に行われた発言に関する議事録メモ70は、発言時刻をトリガとする「10:00:00」の時刻データと、「会議の準備が整いました」のテキストデータと、属性情報とからなる議事録メモが、会議の時間帯「10:00:00〜10:14:59」に記録されている。この議事録メモの属性情報には、「媒体」=「音声」/「モード」=「発言」/「送信先」=「全員」を示す情報が格納されている。 FIG. 9 shows an example of the minutes in which all the minutes memos are arranged in chronological order for the voice data and chat data by each of the attendees A to D. For example, the minutes memo 70 regarding the remark made by attendee A at 10:00 is the time data of "10:00" triggered by the remark time and "the meeting is ready". The minutes memo consisting of the text data of the above and the attribute information is recorded in the time zone of the meeting "10: 00: 00-10: 14: 59". In the attribute information of the minutes memo, information indicating "medium" = "voice" / "mode" = "speech" / "destination" = "everyone" is stored.

また、図9に示す例では、出席者Aからの指示で議事録メモを秘匿とする議事録メモを含む時間帯の領域を、点線72で囲い示している。例えば、出席者Aにより10:12:30に出席者Cへ向けて発言された議事録メモ71は、発言時刻をトリガとする「10:12:30」の時刻データと、「現在の課題は課題2です」のテキストデータと、属性情報とからなる議事録メモ71が、時間帯「10:00:00〜10:14:59」に記録されている。この議事録メモ71の属性情報には、「媒体」=「チャット」/「モード」=「秘話」/「送信先」=「C」を示す情報が格納されている。 Further, in the example shown in FIG. 9, the area of the time zone including the minutes memo in which the minutes memo is kept secret by the instruction from the attendee A is surrounded by the dotted line 72. For example, the minutes memo 71, which was spoken by attendee A to attendee C at 10:12:30, includes time data of "10:12:30" triggered by the time of speech and "current task is The minutes memo 71 consisting of the text data of "Issue 2" and the attribute information is recorded in the time zone "10: 00: 00-10: 14: 59". In the attribute information of the minutes memo 71, information indicating "medium" = "chat" / "mode" = "secret story" / "destination" = "C" is stored.

図10に、図9に示す議事録を、代表的なアイコンで議事録メモを表した場合の一例を示す。 FIG. 10 shows an example of the case where the minutes shown in FIG. 9 are represented by the minutes memo with a typical icon.

すなわち、図10に示す例では、出席者毎の音声データおよびチャットデータについて、議事録メモの全てを時系列に発言または秘匿の発言を表示可能な形式で表した議事録の一例が示されている。例えば、図9に示した議事録メモ70は、「発」記号を囲ったアイコン700として、時刻「10:00:00」の位置に配置されている。このアイコン700には、「製品にKという問題がある。」のテキストデータが対応づけられている。また、テキストデータの属性情報として、「媒体」=「音声」/「モード」=「発言」/「送信先」=「全員」を示す情報も対応付けられている。 That is, in the example shown in FIG. 10, for the voice data and chat data for each attendee, an example of the minutes in which all the minutes memos are expressed in a time-series manner or a secret statement can be displayed is shown. There is. For example, the minutes memo 70 shown in FIG. 9 is arranged at the time “10:00:00” as an icon 700 surrounding the “departure” symbol. The text data of "There is a problem of K in the product" is associated with this icon 700. Further, as the attribute information of the text data, information indicating "medium" = "voice" / "mode" = "speech" / "destination" = "everyone" is also associated.

また、図10に示す例では、図9に示した議事録メモ71は、「秘」記号を囲ったアイコン710として、時刻「10:12:30」の位置に配置されている。このアイコン710には、属性情報を簡略記載したアイコン712(図10に示す例では点線で囲ったアイコン)が対応づけられている。図10では、アイコン712に簡略記載した属性情報として送信先が格納されている。これらのアイコン710と712とから、出席者Aが出席者Cへ向けて秘匿のメッセージ(秘話)を送信したことを直感的に把握することが可能となる。 Further, in the example shown in FIG. 10, the minutes memo 71 shown in FIG. 9 is arranged at the time “10:12:30” as an icon 710 surrounding the “secret” symbol. The icon 710 is associated with an icon 712 (an icon surrounded by a dotted line in the example shown in FIG. 10) in which attribute information is briefly described. In FIG. 10, the destination is stored as the attribute information briefly described by the icon 712. From these icons 710 and 712, it is possible to intuitively grasp that the attendee A has sent a secret message (secret story) to the attendee C.

次に、ビデオ会議サーバ4が実行する情報処理のうちの議事録提供処理を説明する。 Next, the minutes provision process of the information processing executed by the video conference server 4 will be described.

図11に、ビデオ会議サーバ4で実行される議事録提供処理の流れの一例を示す。 FIG. 11 shows an example of the flow of the minutes providing process executed by the video conference server 4.

ビデオ会議サーバ4では、会議端末2からのデータを受け付けると、図11に示す処理ルーチンをCPU41が実行する。 When the video conferencing server 4 receives the data from the conferencing terminal 2, the CPU 41 executes the processing routine shown in FIG.

CPU41は、ステップS300で、会議端末2からのデータが議事録の提供を要求する要求データであるか否かを判断し、受け付けたデータが要求データでない場合、否定判断し、本処理ルーチンを終了する。一方、ステップS300で肯定判断の場合は、ステップS310へ処理を移行する。ステップS310では、CPU41は、要求データに含まれる会議端末2を示す情報又は出席者を示す情報(ID)を取得し、議事録の提供を要求した出席者を特定する。ここでは、出席者Aから出席者Dの何れかの出席者が特定される。次に、CPU41は、ステップS320で、ステップS310において特定された出席者、すなわち、議事録の提供を要求した出席者に対する提示用の議事録を生成する。そして、次のステップS330で、ステップS320において生成された提示用の議事録を送信して本処理ルーチンを終了する。 In step S300, the CPU 41 determines whether or not the data from the conference terminal 2 is the request data for requesting the provision of minutes, and if the received data is not the request data, makes a negative determination and ends this processing routine. do. On the other hand, if a positive judgment is made in step S300, the process proceeds to step S310. In step S310, the CPU 41 acquires the information indicating the conference terminal 2 or the information (ID) indicating the attendees included in the request data, and identifies the attendees who requested the provision of the minutes. Here, any attendee from attendee A to attendee D is identified. Next, in step S320, the CPU 41 generates minutes for presentation to the attendees specified in step S310, that is, the attendees who requested the provision of minutes. Then, in the next step S330, the minutes for presentation generated in step S320 are transmitted, and the present processing routine is terminated.

例えば、議事録の提供を要求した出席者が出席者Aである場合、出席者Aについて秘匿のメッセージ(秘話)が送受信された議事録メモを表示可能に議事録を生成し、出席者Aの会議端末2Aへ送信する。この場合、図9又は図10に示す議事録が送信される。 For example, if the attendee who requested the provision of minutes is attendee A, the minutes are generated so that the minutes memo to which a confidential message (secret story) is sent / received about attendee A can be displayed, and the minutes of attendee A can be displayed. Send to the conference terminal 2A. In this case, the minutes shown in FIG. 9 or 10 are transmitted.

なお、図10に示す代表的なアイコンで議事録メモを表した議事録を送信する場合、代表的なアイコンに対応付けた議事録メモの詳細データを表示可能にアイコンに連携させてもよい。 When the minutes representing the minutes memo with the representative icon shown in FIG. 10 are transmitted, the detailed data of the minutes memo associated with the representative icon may be linked to the icon so as to be displayed.

図12に、代表的なアイコンに対応付けた議事録メモの詳細データを表示可能にアイコンに連携させた議事録の一例を示す。 FIG. 12 shows an example of the minutes linked to the icon so that the detailed data of the minutes memo associated with the typical icon can be displayed.

例えば、出席者Aによる発言を示すアイコン700には、議事録メモのデータが対応づけられている。そこで、ビデオ会議サーバ4は、会議端末2Aによって、このアイコン700が指示された場合に、図12に示すように、アイコン700の詳細データとして議事録メモ70の詳細データが表示されるように会議端末2Aで表示可能なデータ700Aを含めて議事録を提供する。これによって、代表的なアイコンによる簡略な表示による議事録から、議事録メモの詳細データを確認することを可能とする議事録を提供することが可能となる。 For example, the minutes memo data is associated with the icon 700 indicating the remark by the attendee A. Therefore, the video conference server 4 convenes so that when the icon 700 is instructed by the conference terminal 2A, the detailed data of the minutes memo 70 is displayed as the detailed data of the icon 700 as shown in FIG. The minutes are provided including the data 700A that can be displayed on the terminal 2A. This makes it possible to provide the minutes that enable the detailed data of the minutes memo to be confirmed from the minutes that are simply displayed by a typical icon.

また、アイコン710および712は(図10)、出席者Aが出席者Cへ向けて秘匿のメッセージ(秘話)を送信したことを示している。これらのアイコン710および712が指示された場合、図12に示すように、秘匿のメッセージ(秘話)であることを示す図形(図12に示す例では斜線背景の図形)が表示されるように会議端末2Aで表示可能なデータ710Aを含めて議事録を提供することができる。このようにすることで、出席者Aは、秘匿のメッセージ(秘話)であること明確に把握することが可能となる。 In addition, icons 710 and 712 (FIG. 10) indicate that attendee A has sent a confidential message (secret story) to attendee C. When these icons 710 and 712 are instructed, as shown in FIG. 12, a meeting is displayed so that a figure (a figure with a diagonal background in the example shown in FIG. 12) indicating that the message is a secret message (secret story) is displayed. The minutes can be provided including the data 710A that can be displayed on the terminal 2A. By doing so, the attendee A can clearly grasp that it is a secret message (secret story).

一方、議事録の提供を要求した出席者が出席者Bである場合、出席者Aについて秘匿のメッセージ(秘話)が送受信された議事録メモは非表示とすることが好ましい。そこで、ビデオ会議サーバ4は、出席者Bが関与しない議事録メモを非表示とした議事録を生成し、出席者Bの会議端末2Bへ送信する。この場合、出席者Bが関与しない議事録メモを非表示とする方法には、議事録が表示されないように議事録メモを削除した議事録を生成する非表示モードと、他の予め定めた図形を埋め込む他図形表示モードが挙げられる。 On the other hand, when the attendee who requested the provision of the minutes is attendee B, it is preferable to hide the minutes memo to which a confidential message (secret story) is sent / received about attendee A. Therefore, the video conference server 4 generates the minutes in which the minutes memo in which the attendee B is not involved is hidden, and transmits the minutes to the conference terminal 2B of the attendee B. In this case, the method of hiding the minutes memo that attendee B is not involved in is a non-display mode that generates the minutes with the minutes memo deleted so that the minutes are not displayed, and other predetermined figures. There are other graphic display modes for embedding.

図13に、他の予め定めた図形を埋め込む他図形表示モードにより出席者Bが関与しない議事録メモを非表示とした議事録の一例を示す。 FIG. 13 shows an example of the minutes in which the minutes memo in which the attendee B is not involved is hidden by the other figure display mode in which another predetermined figure is embedded.

図13に示す例では、アイコン710および712に代えて、「?」記号を点線で囲ったアイコン714の一例が示されている。なお、非表示モードとするには、アイコン714が表示されないように削除すればよい。アイコン714を表示させることによって、出席者Bは、会議中に何らかのやり取りがおこなわれたことを確認することが可能となる。 In the example shown in FIG. 13, instead of the icons 710 and 712, an example of the icon 714 in which the “?” Symbol is surrounded by a dotted line is shown. In order to set the non-display mode, the icon 714 may be deleted so as not to be displayed. By displaying the icon 714, the attendee B can confirm that some kind of interaction has occurred during the meeting.

図13に示す例において、アイコン714が会議端末2Bで指示された場合、図14に示すように、議事録メモを表示させずに、秘匿のメッセージ(秘話)であることを示す図形(図14に示す例では斜線背景の図形)が表示されるように議事録を提供することができる。このようにすることで、出席者Bは、少なくとも会議中に何らかのやり取りがおこなわれたことを確認することが可能となる。 In the example shown in FIG. 13, when the icon 714 is instructed by the conference terminal 2B, as shown in FIG. 14, a figure (FIG. 14) indicating that the icon 714 is a secret message (secret story) without displaying the minutes memo. In the example shown in, the minutes can be provided so that the diagonal background figure) is displayed. By doing so, attendee B can at least confirm that some kind of interaction has occurred during the meeting.

また、図9に示す議事録に対応する議事録を生成する場合、図15に示すように、点線72内に表示するデータを削除すること(図15に示す例では、斜線図形の挿入により削除している)を行えばよい。 Further, when generating the minutes corresponding to the minutes shown in FIG. 9, the data displayed in the dotted line 72 is deleted as shown in FIG. 15 (in the example shown in FIG. 15, the minutes are deleted by inserting the diagonal line figure. Do).

以上説明したように、本実施形態の情報処理システム1における情報処理装置として機能するビデオ会議サーバ4によれば、出席者各々の音声データをテキストに変換することにより、会議端末2の各々の音声を個別にテキストに変換でき、変換精度を向上することができる。すなわち、会議中に行われた複数の出席者による発言の各々を忠実に議事録に記録することができる。 As described above, according to the video conferencing server 4 that functions as an information processing device in the information processing system 1 of the present embodiment, the audio data of each attendee is converted into text, and the audio of each of the conference terminals 2 is converted. Can be individually converted to text, and conversion accuracy can be improved. That is, each of the statements made by a plurality of attendees during the meeting can be faithfully recorded in the minutes.

また、本実施形態のビデオ会議サーバ4によれば、会議中に一部の出席者の間でやり取りされた情報についても議事録に記録することができる。さらに、会議中に行われる一部の出席者の間における情報のやり取りについて、当事者が希望する意図を反映、例えば情報のやり取りを秘匿した状態(モード)であることを表して議事録に記録することができる。 Further, according to the video conferencing server 4 of the present embodiment, information exchanged between some attendees during the conference can also be recorded in the minutes. In addition, regarding the exchange of information between some attendees during the meeting, the minutes should be recorded to reflect the intentions of the parties, for example, to indicate that the exchange of information is concealed (mode). be able to.

なお、本実施形態では、会議端末2Aから2Dの各々について音声データをテキストデータに変換して議事録に追加して記憶する場合を説明したが、本開示の技術は、音声データを変換したテキストデータを議事録などのファイルに記録することに限定されない。例えば、図16に示すように、変換したテキストデータをリアルタイムに映像合成して会議端末へ提供するようにしてもよい。 In the present embodiment, the case where the voice data is converted into text data for each of the conference terminals 2A to 2D and added to the minutes and stored is described, but the technique of the present disclosure is a text in which the voice data is converted. The data is not limited to being recorded in a file such as minutes. For example, as shown in FIG. 16, the converted text data may be video-synthesized in real time and provided to the conference terminal.

また、本実施形態における会議端末2Aから2Dの各々は、会議に参加可能な端末であればよく、離れた拠点に設置された会議端末でもよいことは勿論である。 Further, each of the conference terminals 2A to 2D in the present embodiment may be any terminal capable of participating in the conference, and of course, it may be a conference terminal installed at a distant base.

[第2実施形態] [Second Embodiment]

第1実施形態では、会議中に行われる一部の出席者の間における情報のやり取りについて、チャットデータを用いて当事者が希望する意図を反映、例えば情報のやり取りを秘匿した状態(モード)であることを表して議事録に記録する場合を説明した。第2実施形態は、音声について当事者が希望する意図を反映して議事録に記録するものである。なお、第2実施形態は、第1実施形態と同様の構成であるため、同一部分には同一符号を付して詳細な説明を省略する。 In the first embodiment, regarding the exchange of information between some attendees during the meeting, chat data is used to reflect the intention desired by the parties, for example, the exchange of information is concealed (mode). I explained the case of recording in the minutes to show that. The second embodiment records the audio in the minutes, reflecting the intentions of the parties. Since the second embodiment has the same configuration as the first embodiment, the same parts are designated by the same reference numerals and detailed description thereof will be omitted.

図17に、本実施形態におけるビデオ会議サーバ4の機能構成の一例を示す。
図17に示すビデオ会議サーバ4の機能構成と、図5に示すビデオ会議サーバ4の機能構成との相違点は、主として音声取得部404からの音声データに対して秘匿した状態(モード)であることを表して議事録に記録する点にある。具体的には、チャット取得部406からのチャットデータが入力されるモード確認部412に代えて、音声取得部404からの音声データが入力されるモード確認部413を備えている。
FIG. 17 shows an example of the functional configuration of the video conferencing server 4 in the present embodiment.
The difference between the functional configuration of the video conferencing server 4 shown in FIG. 17 and the functional configuration of the video conferencing server 4 shown in FIG. 5 is mainly a state (mode) in which the audio data from the audio acquisition unit 404 is concealed. The point is to show that and record it in the minutes. Specifically, instead of the mode confirmation unit 412 in which the chat data from the chat acquisition unit 406 is input, the mode confirmation unit 413 in which the voice data from the voice acquisition unit 404 is input is provided.

ここで、チャット取得部406は、チャットデータ(チャットデータ)を扱う処理部であるので、モード確認部413は、さらに、音声・テキスト変換部414を有する。この音声・テキスト変換部414は、資格判定部408を介して入力された音声データをテキスト変換して議事録メモ記録部420Aへ出力する機能部である。但し、この音声・テキスト変換部414は、音声・テキスト変換部410と異なり、テキスト変換された音声テキストデータに、音声データが出席者全員に対する発言であることを示す「発言」および「全員」を示す情報を付与して出力する機能について、備えていない。 Here, since the chat acquisition unit 406 is a processing unit that handles chat data (chat data), the mode confirmation unit 413 further includes a voice / text conversion unit 414. The voice / text conversion unit 414 is a functional unit that converts voice data input via the qualification determination unit 408 into text and outputs it to the minutes memo recording unit 420A. However, unlike the voice / text conversion unit 410, the voice / text conversion unit 414 adds "speech" and "everyone" indicating that the voice data is a remark to all the attendees in the text-converted voice text data. It does not have a function to add the indicated information and output it.

本実施形態では、音声取得部404で取得された音声データは、モード確認部413を介してビデオ会議サーバ4の資格判定部408に入力される。 In the present embodiment, the audio data acquired by the audio acquisition unit 404 is input to the qualification determination unit 408 of the video conferencing server 4 via the mode confirmation unit 413.

議事録生成部400、および議事録記録部420の各機能部は、複数の会議端末2毎に、議事録メモ生成部400A〜400D、および議事録メモ記録部420A〜420Dを備えている。 Each functional unit of the minutes generation unit 400 and the minutes recording unit 420 includes minutes memo generation units 400A to 400D and minutes memo recording units 420A to 420D for each of the plurality of conference terminals 2.

議事録メモ生成部400A、および議事録メモ記録部420Aは、会議端末2Aにより入力された出席者Aの発言、および出席者Aが他の出席者への情報のやり取りを議事録メモとして議事録45Gへ記録する。 The minutes memo generation unit 400A and the minutes memo recording unit 420A record the remarks of attendee A input by the conference terminal 2A and the exchange of information by attendee A with other attendees as minutes memos. Record to 45G.

議事録メモ生成部400Aは、指示取得部402と、音声取得部404と、資格判定部408と、音声・テキスト変換部410と、モード確認部413とを備えている。 The minutes memo generation unit 400A includes an instruction acquisition unit 402, a voice acquisition unit 404, a qualification determination unit 408, a voice / text conversion unit 410, and a mode confirmation unit 413.

指示取得部402は、会議端末2Aからの音声データに対する送信先の出席者および音声データを秘匿とするか否かの指示を示す指示データを取得し、取得した指示データをモード確認部413へ出力する。 The instruction acquisition unit 402 acquires instruction data indicating the attendees at the transmission destination for the voice data from the conference terminal 2A and an instruction as to whether or not to keep the voice data confidential, and outputs the acquired instruction data to the mode confirmation unit 413. do.

音声取得部404は、会議端末2Aから送信された音声データを取得し、取得した音声データをモード確認部413へ出力する。 The voice acquisition unit 404 acquires the voice data transmitted from the conference terminal 2A, and outputs the acquired voice data to the mode confirmation unit 413.

モード確認部413は、指示取得部402で取得された指示データを用いて、音声取得部404で取得された音声データに対するモードを確認して、確認結果のモードを示す情報を、音声データに付与して議事録メモ記録部420Aへ出力する機能と、音声データを資格判定部408へ出力する機能を有する機能部である。 The mode confirmation unit 413 confirms the mode for the voice data acquired by the voice acquisition unit 404 using the instruction data acquired by the instruction acquisition unit 402, and adds information indicating the mode of the confirmation result to the voice data. This is a functional unit having a function of outputting the minutes memo recording unit 420A and a function of outputting voice data to the qualification determination unit 408.

具体的には、モード確認部413は、指示取得部402からの指示データが音声データを秘匿とすることを示す情報を含む場合、属性情報を、音声データに付与して議事録メモ記録部420Aへ出力する。この場合、「媒体」、「モード」、および「送信先」の各々による属性情報として、「音声」、「秘話」、および例えば「出席者C」の各々を示す属性情報を音声テキストデータに付与した議事録メモデータが出力される。一方、指示データが音声データを秘匿とすることを示す情報を含まない場合、モード確認部413は、音声データを資格判定部408へ出力する。 Specifically, when the mode confirmation unit 413 includes information indicating that the instruction data from the instruction acquisition unit 402 keeps the voice data confidential, the mode confirmation unit 413 adds attribute information to the voice data and adds the minutes memo recording unit 420A. Output to. In this case, attribute information indicating each of "voice", "secret story", and, for example, "attendee C" is added to the voice text data as attribute information by each of "medium", "mode", and "destination". The minutes memo data is output. On the other hand, when the instruction data does not include information indicating that the voice data is kept secret, the mode confirmation unit 413 outputs the voice data to the qualification determination unit 408.

議事録メモ生成部400Bから400D、および議事録メモ記録部420Bから420Dの各々は、議事録メモ生成部400A、および議事録メモ記録部420Aと同様の構成のため、詳細な説明を省略する。 Since each of the minutes memo generation units 400B to 400D and the minutes memo recording units 420B to 420D has the same configuration as the minutes memo generation unit 400A and the minutes memo recording unit 420A, detailed description thereof will be omitted.

以上の構成により、出席者Aから出席者Dの各々の音声データは、当事者が希望する意図を反映して議事録45Gに記録(追記)される(図18も参照)。 With the above configuration, the audio data of each of the attendees A to D is recorded (added) in the minutes 45G, reflecting the intention desired by the parties (see also FIG. 18).

図18に、本実施形態に係り、図9に示す議事録と同様の代表的なアイコンで議事録メモを表した場合の一例を示す。図18に示すように、音声データについても情報のやり取りを秘匿した状態(モード)であることを表して議事録に記録することができる。 FIG. 18 shows an example of the case where the minutes memo is represented by the same typical icon as the minutes shown in FIG. 9 according to the present embodiment. As shown in FIG. 18, it is possible to record the voice data in the minutes as well, indicating that the exchange of information is concealed (mode).

このように、本実施形態によれば、ビデオ会議サーバ4において出席者各々の音声データがテキストに変換された音声テキストデータに対して、当事者が希望する意図を反映して議事録45Gへの記録が可能となる。具体的には、会議中に行われる一部の出席者の間における音声によってやり取りされた音声データについて、当事者が希望する意図を反映、例えば情報のやり取りを秘匿した状態(モード)であることを表して議事録への記録が可能となる。 As described above, according to the present embodiment, the voice text data in which the voice data of each attendee is converted into text in the video conference server 4 is recorded in the minutes 45G by reflecting the intention desired by the parties. Is possible. Specifically, regarding the voice data exchanged by voice between some attendees during the meeting, it reflects the intention desired by the parties, for example, the state (mode) in which the exchange of information is concealed. It can be displayed and recorded in the minutes.

[その他の形態] [Other forms]

なお、上記では、本開示の技術を特定の実施形態について詳細に説明したが、本開示の技術は係る実施形態に限定されるものではなく、本開示の技術の範囲内にて他の種々の実施形態をとることが可能である。 In the above, the technique of the present disclosure has been described in detail for a specific embodiment, but the technique of the present disclosure is not limited to such an embodiment, and various other techniques are within the scope of the technique of the present disclosure. It is possible to take embodiments.

また、上記実施の形態では、補助記憶装置に記憶したプログラムを実行することにより行われる処理を説明したが、プログラムの処理をハードウエアで実現してもよい。 Further, in the above-described embodiment, the processing performed by executing the program stored in the auxiliary storage device has been described, but the processing of the program may be realized by hardware.

さらに、上記実施形態における処理は、プログラムとして光ディスク等の記憶媒体等に記憶して流通するようにしてもよい。 Further, the processing in the above embodiment may be stored as a program in a storage medium such as an optical disk and distributed.

上記実施形態において、プロセッサとは広義的なプロセッサを指し、汎用的なプロセッサ(例えばCPU: Central Processing Unit、等)や、専用のプロセッサ(例えばGPU:Graphics Processing Unit、ASIC: Application Specific Integrated Circuit、FPGA: Field Programmable Gate Array、プログラマブル論理デバイス、等)を含むものである。
また上記実施形態におけるプロセッサの動作は、1つのプロセッサによって成すのみでなく、物理的に離れた位置に存在する複数のプロセッサが協働して成すものであってもよい。また、プロセッサの各動作の順序は上記各実施形態において記載した順序のみに限定されるものではなく、適宜変更してもよい。
In the above embodiment, the processor refers to a processor in a broad sense, and is a general-purpose processor (for example, CPU: Central Processing Unit, etc.) or a dedicated processor (for example, GPU: Graphics Processing Unit, ASIC: Application Specific Integrated Circuit, FPGA). : Field Programmable Gate Array, programmable logic device, etc.).
Further, the operation of the processor in the above embodiment is not limited to one processor, but may be performed by a plurality of processors existing at physically separated positions in cooperation with each other. Further, the order of each operation of the processor is not limited to the order described in each of the above embodiments, and may be changed as appropriate.

1 情報処理システム
2 会議端末
(2A、2B、2C、2D)
4 ビデオ会議サーバ
5 音声テキスト変換装置
6 ネットワーク
20 コンピュータ本体
26 バス
28C カメラ
28K 操作入力部
28M マイク
29 表示部
40 コンピュータ本体
45 補助記憶装置
45D データ
45G 議事録
45M 会議システムプログラム
45P 情報処理プログラム
45T テーブル
46 バス

1 Information processing system 2 Conference terminal (2A, 2B, 2C, 2D)
4 Video conference server 5 Voice-to-text converter 6 Network 20 Computer body 26 Bus 28C Camera 28K Operation input unit 28M Microphone 29 Display unit 40 Computer body 45 Auxiliary storage device 45D Data 45G Minutes 45M Conference system program 45P Information processing program 45T Table 46 bus

Claims (8)

各々他の会議端末と情報を授受する複数の会議端末のうちの第1の会議端末から送信された送信情報、前記第1の会議端末を操作する第1の会議参加者を示す識別情報、および、当該第1の会議参加者が前記送信情報の送信先を示す1以上の第2の会議端末を操作する第2の会議参加者を示す送信先情報を取得する取得部と、
取得された前記送信情報、前記識別情報および前記送信先情報を、前記第1の会議参加者の発言情報とした議事録情報を生成する生成部と、
前記議事録情報が生成される度に当該生成された議事録情報を、記憶部に記憶する制御を行う制御部と、
を有する情報処理装置。
Transmission information transmitted from a first conference terminal among a plurality of conference terminals that exchange information with other conference terminals, identification information indicating a first conference participant who operates the first conference terminal, and , An acquisition unit that acquires destination information indicating a second conference participant in which the first conference participant operates one or more second conference terminals indicating a destination of the transmission information.
A generation unit that generates minutes information using the acquired transmission information, identification information, and destination information as remark information of the first conference participant.
A control unit that controls storage of the generated minutes information in the storage unit each time the minutes information is generated.
Information processing device with.
前記送信情報は、前記第1の会議端末に入力された音情報、および文字情報の少なくとも一方を含む
請求項1に記載の情報処理装置。
The information processing device according to claim 1, wherein the transmission information includes at least one of sound information and character information input to the first conference terminal.
前記取得部は、前記第1の会議端末から、前記第1の会議参加者が前記送信情報の前記送信先とした前記第2の会議端末にのみ送信される送信情報であることを示す秘匿識別情報を取得し、
前記生成部は、前記第1の会議参加者の発言情報として、前記送信情報、前記識別情報、前記秘匿識別情報、および前記送信先情報を含む情報を前記議事録情報として生成する
請求項1又は請求項2に記載の情報処理装置。
The acquisition unit is a secret identification indicating that the transmission information is transmitted from the first conference terminal only to the second conference terminal to which the first conference participant is the transmission destination of the transmission information. Get information,
The generation unit generates information including the transmission information, the identification information, the secret identification information, and the destination information as the minutes information as the remark information of the first conference participant, claim 1 or The information processing apparatus according to claim 2.
前記制御部は、
前記複数の会議端末の何れかの会議端末から前記記憶部に記憶された前記議事録情報を出力する指示を受け付け、
前記指示を受け付けた会議端末が、前記第1の会議端末および前記第2の会議端末に含まれる場合、前記議事録情報を、前記何れかの会議端末で表示可能な情報として出力する制御を行い、
前記指示を受け付けた会議端末が、前記第1の会議端末および前記第2の会議端末に含まれない場合、前記議事録情報を、前記何れかの会議端末で表示可能な情報と異なる予め定めた情報を出力する制御を行う、
請求項3に記載の情報処理装置。
The control unit
Receives an instruction to output the minutes information stored in the storage unit from any of the conference terminals of the plurality of conference terminals.
When the conference terminal that has received the instruction is included in the first conference terminal and the second conference terminal, the minutes information is controlled to be output as information that can be displayed by any of the conference terminals. ,
When the conference terminal that has received the instruction is not included in the first conference terminal and the second conference terminal, the minutes information is predetermined different from the information that can be displayed by any of the conference terminals. Controls the output of information,
The information processing device according to claim 3.
前記制御部は、
前記複数の会議端末の何れかの会議端末から前記記憶部に記憶された前記議事録情報を出力する指示を受け付け、
前記指示を受け付けた会議端末が、前記第1の会議端末および前記第2の会議端末に含まれる場合、前記議事録情報を、前記何れかの会議端末で表示可能な情報として出力する制御を行い、
前記指示を受け付けた会議端末が、前記第1の会議端末および前記第2の会議端末に含まれない場合、前記議事録情報を、前記何れかの会議端末で表示不可能な情報として出力する制御を行う、
請求項3に記載の情報処理装置。
The control unit
Receives an instruction to output the minutes information stored in the storage unit from any of the conference terminals of the plurality of conference terminals.
When the conference terminal that has received the instruction is included in the first conference terminal and the second conference terminal, the minutes information is controlled to be output as information that can be displayed by any of the conference terminals. ,
Control to output the minutes information as information that cannot be displayed by any of the conference terminals when the conference terminal that has received the instruction is not included in the first conference terminal and the second conference terminal. I do,
The information processing device according to claim 3.
複数の会議端末と、
請求項1から請求項5の何れか1項に記載の情報処理装置と、
を備えた情報処理システム。
With multiple conference terminals
The information processing device according to any one of claims 1 to 5.
Information processing system equipped with.
情報処理装置における情報処理方法であって、
前記情報処理装置は、
各々他の会議端末と情報を授受する複数の会議端末のうちの第1の会議端末から送信された送信情報、前記第1の会議端末を操作する第1の会議参加者を示す識別情報、および、当該第1の会議参加者が前記送信情報の送信先を示す1以上の第2の会議端末を操作する第2の会議参加者を示す送信先情報を取得する取得ステップと、
取得された前記送信情報、前記識別情報および前記送信先情報を、前記第1の会議参加者の発言情報とした議事録情報を生成する生成ステップと、
前記議事録情報が生成される度に当該生成された議事録情報を、記憶部に記憶する制御を行う制御ステップと、
を有する情報処理方法。
It is an information processing method in an information processing device.
The information processing device
Transmission information transmitted from a first conference terminal among a plurality of conference terminals that exchange information with other conference terminals, identification information indicating a first conference participant who operates the first conference terminal, and , An acquisition step of acquiring destination information indicating a second conference participant in which the first conference participant operates one or more second conference terminals indicating a destination of the transmission information.
A generation step of generating minutes information using the acquired transmission information, identification information, and destination information as remark information of the first conference participant, and
A control step that controls storage of the generated minutes information in the storage unit each time the minutes information is generated, and
Information processing method having.
コンピュータを、
各々他の会議端末と情報を授受する複数の会議端末のうちの第1の会議端末から送信された送信情報、前記第1の会議端末を操作する第1の会議参加者を示す識別情報、および、当該第1の会議参加者が前記送信情報の送信先を示す1以上の第2の会議端末を操作する第2の会議参加者を示す送信先情報を取得する取得部、
取得された前記送信情報、前記識別情報および前記送信先情報を、前記第1の会議参加者の発言情報とした議事録情報を生成する生成部、
前記議事録情報が生成される度に当該生成された議事録情報を、記憶部に記憶する制御を行う制御部、
として機能させるための情報処理プログラム。
Computer,
Transmission information transmitted from a first conference terminal among a plurality of conference terminals that exchange information with other conference terminals, identification information indicating a first conference participant who operates the first conference terminal, and An acquisition unit that acquires destination information indicating a second conference participant in which the first conference participant operates one or more second conference terminals indicating the destination of the transmission information.
A generation unit that generates minutes information using the acquired transmission information, identification information, and destination information as remark information of the first conference participant.
A control unit that controls storage of the generated minutes information in the storage unit each time the minutes information is generated.
An information processing program to function as.
JP2020032200A 2020-02-27 2020-02-27 Information processing device, information processing system, information processing method, and information processing program Pending JP2021136606A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020032200A JP2021136606A (en) 2020-02-27 2020-02-27 Information processing device, information processing system, information processing method, and information processing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020032200A JP2021136606A (en) 2020-02-27 2020-02-27 Information processing device, information processing system, information processing method, and information processing program

Publications (1)

Publication Number Publication Date
JP2021136606A true JP2021136606A (en) 2021-09-13

Family

ID=77661771

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020032200A Pending JP2021136606A (en) 2020-02-27 2020-02-27 Information processing device, information processing system, information processing method, and information processing program

Country Status (1)

Country Link
JP (1) JP2021136606A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023157963A1 (en) * 2022-02-21 2023-08-24 ピクシーダストテクノロジーズ株式会社 Information processing apparatus, information processing method, and program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023157963A1 (en) * 2022-02-21 2023-08-24 ピクシーダストテクノロジーズ株式会社 Information processing apparatus, information processing method, and program
JP7399413B1 (en) 2022-02-21 2023-12-18 ピクシーダストテクノロジーズ株式会社 Information processing device, information processing method, and program

Similar Documents

Publication Publication Date Title
TWI536365B (en) Voice print identification
TWI220037B (en) Integrated calendar and phonemail system
JP4787328B2 (en) Method and apparatus for capturing audio during a conference call
US11782674B2 (en) Centrally controlling communication at a venue
JP2004287201A (en) Device and method for preparing conference minutes, and computer program
JP2024026295A (en) Privacy-friendly conference room transcription from audio-visual streams
JP2004350134A (en) Meeting outline grasp support method in multi-point electronic conference system, server for multi-point electronic conference system, meeting outline grasp support program, and recording medium with the program recorded thereon
KR20220109373A (en) Method for providing speech video
JP2021136606A (en) Information processing device, information processing system, information processing method, and information processing program
JP2006229903A (en) Conference supporting system, method and computer program
JP6364775B2 (en) Electronic conference system and program thereof
JP7205844B1 (en) Report recording method, report recording program and report recording system
JP2023072720A (en) Conference server and conference server control method
JP7282111B2 (en) METHOD, SYSTEM, AND COMPUTER-READABLE RECORDING MEDIUM FOR RECORDING INTERACTION IN INTERCONNECT WITH IMAGE COMMUNICATION SERVICE
US20240046540A1 (en) Speech image providing method and computing device for performing the same
US20230005202A1 (en) Speech image providing method and computing device for performing the same
JP2023114250A (en) Conference server and conference system
JP2004080486A (en) Minutes creating system, minutes data creating method, minutes data creating program
Patil et al. MuteTrans: A communication medium for deaf
JP2024043297A (en) Electronic conference support method, program and electronic conference support system
JP2017038304A (en) Information processing unit, information processing system, program, and recording medium
JP2023119328A (en) Information processing method, program, information processing device, and information processing system
JP2022179354A (en) Information processing apparatus and program
JP2022182019A (en) Conference system, conference method, and conference program
JP2005222431A (en) Cooperative work system