JP2019153099A - Conference assisting system, and conference assisting program - Google Patents

Conference assisting system, and conference assisting program Download PDF

Info

Publication number
JP2019153099A
JP2019153099A JP2018038145A JP2018038145A JP2019153099A JP 2019153099 A JP2019153099 A JP 2019153099A JP 2018038145 A JP2018038145 A JP 2018038145A JP 2018038145 A JP2018038145 A JP 2018038145A JP 2019153099 A JP2019153099 A JP 2019153099A
Authority
JP
Japan
Prior art keywords
conference
support system
history data
meeting
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018038145A
Other languages
Japanese (ja)
Inventor
佳実 中山
Yoshimi Nakayama
佳実 中山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Inc
Original Assignee
Konica Minolta Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Inc filed Critical Konica Minolta Inc
Priority to JP2018038145A priority Critical patent/JP2019153099A/en
Priority to CN201910147884.6A priority patent/CN110232553A/en
Publication of JP2019153099A publication Critical patent/JP2019153099A/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/451Execution arrangements for user interfaces
    • G06F9/453Help systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Operations Research (AREA)
  • Acoustics & Sound (AREA)
  • Data Mining & Analysis (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Telephonic Communication Services (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

To collect and store data with high quality that is appropriate for analyzing post a conference without impacting real-time processing during the conference, concerning a communication conference held over communications amongst a plurality of locations.SOLUTION: A conference assisting system (30) embedded in an edge server 20 and the like comprises: tagging means for attaching a tag including identification information for identifying the location of a source to information history data in at least one format (audio and the like); adoption means for adopting the location of an information source to be integrated for each data having a different source to which the tag is attached by the tagging means; and integration means for chronologically integrating the saved data of the information source adopted by the adoption means, creating integrated history data in one format therefrom, and saving thereof. Fundamentally, the location of the information source is deemed as the location of the source.SELECTED DRAWING: Figure 1

Description

本発明は、会議支援システム及び会議支援プログラムに関する。   The present invention relates to a conference support system and a conference support program.

映像、音声等を送受信する通信会議システムで音声をテキスト化して表示するシステムは会議の内容を理解するのに役立っている。聞き取りにくい音声の補助やコミュニケーションミスを防ぐため内容理解を目的として使用されている。特に海外と会議を行う時は語学力不足を補う点でも効果がある。昨今はリモートワークなども増えて、国内の会議室と会議室で行っていた会議範囲からWeb会議など会議の形態が増え、スマートフォンやタブレットなどの通信端末も選択肢が増えたため、通信会議システムは安定したネットワークの下だけでなく、あらゆる環境、あらゆるデバイスと繋いで行われることになってきた。
また、AIなどの発展により会議の情報を一括して保存し、分析を行い、次回以降の会議に役立てるような会議支援システムも現実的になり、会議自体の生産性の向上を目指す取り組みが進んでいる。
特許文献1には、会議内容に関して処理を受領、抽出、解析を行い、会議のメタデータを作成し、レポートに含めることが記載されている。
A system that displays audio as text in a communication conference system that transmits and receives video, audio, and the like is useful for understanding the contents of the conference. It is used for the purpose of understanding the contents in order to prevent difficult to hear voice assistance and communication errors. It is also effective in making up for lack of language skills, especially when holding meetings overseas. Recently, the number of remote work has increased, the number of conferences such as web conferences has increased from the conference range that was held in domestic conference rooms and conference rooms, and the choice of communication terminals such as smartphones and tablets has increased. It is supposed to be performed not only under the network, but also connected to any environment and any device.
In addition, with the development of AI and other means, conference support systems that store and analyze conference information in a lump and analyze it and make it useful for subsequent conferences become realistic, and efforts to improve the productivity of conferences themselves are progressing. It is out.
Japanese Patent Laid-Open No. 2004-151858 describes that processing is received, extracted and analyzed with respect to the content of a conference, and metadata of the conference is created and included in the report.

特開2017−91536号公報JP 2017-91536 A

こういった通信会議技術の背景の中で、会議として実現しなければいけない点が2点ある。
1点目は会議の場での会議がスムーズに進行する事である。映像、音声、文字など途切れずに会議が成立する事が望まれる。音声はネットワーク環境によって質の変化が大きくなり聞き手側では劣化してしまうこともあり話者がいる場所でテキスト化することが求められるが、一方で処理能力の低い端末を利用したテキスト変換などの処理を多く行うと端末側の負荷が大きくなり会議自体のリアルタイム性が失われてしまう場合もあり、最適な場所で処理を実施する必要がある。
2点目としては、会議後の分析の事を考えると、分析に使用するデータの質が高いことが望まれる。聞き取りづらい音声やそのデータを用いたテキスト化した文書を使用しても良い分析はできない。
リアルタイム性を重視するとデータの質が低下し、分析に利用できないし、最適なデータを取ろうとすると会議のリアルタイム性が確保できないというどちらかを優先させるとどちらかが成り立たない問題がある。
There are two points that must be realized as a conference in the background of such communication conference technology.
The first point is that the meeting at the meeting proceeds smoothly. It is desirable that the conference be established without interruptions such as video, audio and text. The quality of speech is greatly affected by the network environment and may deteriorate on the listener side, so it is required to convert it to text where there is a speaker. If a large amount of processing is performed, the load on the terminal side increases, and the real-time property of the conference itself may be lost.
Second, considering the post-conference analysis, it is desirable that the quality of the data used for the analysis is high. Good analysis is not possible even if it is difficult to hear speech or text documents using the data.
If emphasis is placed on real-time performance, the quality of the data will be degraded, making it impossible to use for analysis, and if trying to obtain optimal data, the real-time performance of the conference cannot be ensured.

特許文献1には、解析を目的として処理を段階的に行い、特にリアルタイム処理と後処理という考え方で処理を分けている点が見受けられるが、処理に求められる優先事項が異なるためデータの扱い方に課題がある。リアルタイム処理はリアルタイム性を確保する必要があるが、後処理は、分析結果の精度を高めるため、より高品質なデータを元にした分析が必要であるため、どちらかを優先させるとどちらかの処理精度が下がってしまうことになる。   In Patent Document 1, processing is performed step by step for the purpose of analysis, and in particular, it can be seen that processing is divided according to the concept of real-time processing and post-processing. There is a problem. Real-time processing needs to ensure real-time performance, but post-processing requires analysis based on higher-quality data in order to improve the accuracy of analysis results. Processing accuracy will be reduced.

本発明は以上の従来技術における問題に鑑みてなされたものであって、複数の拠点間で通信を介して行う通信会議において、会議時のリアルタイム処理に影響を与えずに、会議後の分析に適した高品質なデータを収集、保存し、ひいては会議内容の分析精度を向上することを課題とする。   The present invention has been made in view of the problems in the prior art described above, and in a communication conference conducted via communication between a plurality of bases, it is possible to perform analysis after the conference without affecting real-time processing at the time of the conference. The task is to collect and store suitable high-quality data and to improve the analysis accuracy of the content of the meeting.

以上の課題を解決するための請求項1記載の発明は、複数の拠点間で情報を通信して行う通信会議を支援する会議支援システムであって、
少なくとも一つの形態の前記情報の履歴データに対し、発信元の拠点を識別する識別情報を含むタグを付加するタグ付手段と、
前記タグ付手段によりタグが付加された発信元が異なるデータ毎に、統合する情報源の拠点を採択する採択手段と、
前記採択手段により採択された情報源の保存データを時系列に統合して前記一つの形態の統合履歴データを作成し保存する統合手段と、を備える会議支援システムである。
The invention according to claim 1 for solving the above-described problem is a conference support system for supporting a communication conference performed by communicating information between a plurality of bases.
Tagging means for adding a tag including identification information for identifying a source site to the history data of the information in at least one form;
Adopting means for adopting the base of the information source to be integrated for each data with a different source from which the tag is added by the tagging means;
A meeting support system comprising: integration means for creating and storing the integrated history data of the one form by integrating the storage data of the information source adopted by the adoption means in time series.

請求項2記載の発明は、前記複数の拠点から履歴データを収集するサーバーを有し、当該サーバーに前記タグ付手段、前記採択手段及び統合手段が実装される請求項1に記載の会議支援システムである。   The invention according to claim 2 has a server that collects history data from the plurality of bases, and the meeting support system according to claim 1, wherein the tagging unit, the selection unit, and the integration unit are mounted on the server. It is.

請求項3記載の発明は、前記サーバーはいずれかの拠点に備わるエッジサーバーであって、前記統合履歴データに基づく会議内容の分析手段を備える請求項2に記載の会議支援システムである。   A third aspect of the present invention is the conference support system according to the second aspect, wherein the server is an edge server provided at any of the bases, and includes a meeting content analysis unit based on the integrated history data.

請求項4記載の発明は、前記タグ付手段が対象とする履歴データの一次保存先は、前記サーバー又は他の記憶装置であって、他の記憶装置の場合は、当該他の記憶装置から前記サーバーが当該他の記憶装置に記憶されている履歴データを収集する請求項2又は請求項3に記載の会議支援システムである。   According to a fourth aspect of the present invention, the primary storage destination of the historical data targeted by the tagging means is the server or another storage device, and in the case of another storage device, from the other storage device 4. The conference support system according to claim 2, wherein the server collects history data stored in the other storage device.

請求項5記載の発明は、前記情報を第1の形態から第2の形態の変換する変換手段を備え、
前記タグ付手段は、前記第1の形態及び/又は前記第2の形態の履歴データに対しタグを付加し、前記統合手段は、前記第1の形態及び/又は前記第2の形態の統合履歴データを作成し保存する請求項1から請求項4のうちいずれか一に記載の会議支援システムである。
The invention according to claim 5 comprises conversion means for converting the information from the first form to the second form,
The tagging means adds a tag to the history data of the first form and / or the second form, and the integrating means is the integrated history of the first form and / or the second form. The conference support system according to claim 1, wherein data is created and stored.

請求項6記載の発明は、前記第1の形態が音声で、前記第2の形態がテキストである請求項5に記載の会議支援システムである。   The invention described in claim 6 is the conference support system according to claim 5, wherein the first form is voice and the second form is text.

請求項7記載の発明は、前記タグ付手段は、前記第2の形態であるテキストに変換する際に当該テキストに発言単位で前記タグを付加する請求項5に記載の会議支援システムである。   The invention according to claim 7 is the conference support system according to claim 5, wherein the tagging unit adds the tag to the text in units of speech when converting the text to the second form.

請求項8記載の発明は、前記第1の形態である音声を前記第2の形態であるテキストに変換する前記変換手段は、当該音声の収集元である話者側拠点に備わる装置、他の聞き手側拠点に備わる装置のうち、装置の処理能力、通信状態を鑑み、変換精度の最適な拠点の装置のものを適用する請求項6又は請求項7に記載の会議支援システムである。   According to an eighth aspect of the present invention, the conversion means for converting the voice that is the first form into the text that is the second form is an apparatus provided at a speaker-side base from which the voice is collected, The conference support system according to claim 6 or 7, wherein, among the devices provided in the listener side base, in consideration of the processing capability and communication state of the device, the device of the base device having the optimum conversion accuracy is applied.

請求項9記載の発明は、前記タグ付手段の実装装置に前記変換手段も実装され、同装置に音声履歴データを収集した後これをテキスト変換する請求項6又は請求項7に記載の会議支援システムである。   The invention according to claim 9 is the meeting support according to claim 6 or 7, wherein the conversion means is also mounted in the mounting device of the tagging means, and voice history data is collected in the device and then converted into text. System.

請求項10記載の発明は、前記第1の形態は音声、画像、映像又はテキストである請求項5に記載の会議支援システムである。   A tenth aspect of the present invention is the conference support system according to the fifth aspect, wherein the first form is audio, image, video or text.

請求項11記載の発明は、前記第2の形態はテキストの全文、翻訳若しくはそれらの抜粋、音声、画像又は映像である請求項5に記載の会議支援システムである。   The invention according to claim 11 is the conference support system according to claim 5, wherein the second form is a full text of a text, a translation or an excerpt thereof, a voice, an image or a video.

請求項12記載の発明は、前記タグ付手段が対象とする履歴データを、会議中又は会議後において部分的に逐次又はまとめて一時に収集する請求項1から請求項11のうちいずれか一に記載の会議支援システムである。   The invention according to claim 12 is the invention according to any one of claims 1 to 11, wherein the history data targeted by the tagging means is collected at one time partially or sequentially during the meeting or after the meeting. The conference support system described.

請求項13記載の発明は、前記収集のタイミングは、予め決められたタイミング又は環境により判断されるタイミングとされる請求項12に記載の会議支援システムである。   A thirteenth aspect of the present invention is the conference support system according to the twelfth aspect, wherein the collection timing is a predetermined timing or a timing determined by the environment.

請求項14記載の発明は、前記情報源の拠点を前記発信元の拠点とする請求項1から請求項13のうちいずれか一に記載の会議支援システムである。   The invention according to claim 14 is the conference support system according to any one of claims 1 to 13, wherein the base of the information source is the base of the transmission source.

請求項15記載の発明は、前記タグ付手段が対象とする履歴データの形態が音声とされ、前記タグ付手段は各発言音声の入力マイクの識別により前記発信元の拠点を識別して前記タグを付加する請求項1から請求項14のうちいずれか一に記載の会議支援システムである。   According to the fifteenth aspect of the present invention, the history data targeted by the tagging unit is a voice, and the tagging unit identifies the base of the transmission source by identifying the input microphone of each speech voice, and the tag The conference support system according to any one of claims 1 to 14, to which is added.

請求項16記載の発明は、前記統合手段による統合を、会議中又は会議後において部分的に逐次又はまとめて一時に実行する請求項1から請求項15のうちいずれか一に記載の会議支援システムである。   A sixteenth aspect of the present invention provides the conference support system according to any one of the first to fifteenth aspects, wherein the integration by the integration means is executed partially or collectively at a time during or after the conference. It is.

請求項17記載の発明は、前記統合のタイミングは、予め決められたタイミング又は環境により判断されるタイミングとされる請求項16に記載の会議支援システムである。   The invention according to claim 17 is the conference support system according to claim 16, wherein the integration timing is a predetermined timing or a timing determined by an environment.

請求項18記載の発明は、前記タグ付手段は、少なくとも一つの拠点から収取した履歴データに対し、前記タグを付加する請求項1から請求項17のうちいずれか一に記載の会議支援システムである。   The invention according to claim 18 is the conference support system according to any one of claims 1 to 17, wherein the tagging unit adds the tag to history data collected from at least one site. It is.

請求項19記載の発明は、請求項1から請求項18のうちいずれか一に記載の会議支援システムとしてコンピューターを機能させるための会議支援プログラムである。   The invention described in claim 19 is a conference support program for causing a computer to function as the conference support system according to any one of claims 1 to 18.

本発明によれば、複数の拠点間で通信を介して行う通信会議において、会議時のリアルタイム処理に影響を与えずに、会議後の分析に適した高品質なデータを収集、保存し、ひいては会議内容の分析精度を向上することができる。   According to the present invention, high-quality data suitable for post-conference analysis is collected and stored without affecting real-time processing at the time of communication in a communication conference performed via communication between a plurality of bases. The analysis accuracy of the meeting contents can be improved.

本発明の一実施形態に係る会議支援システムが支援するTV会議システムの概要を示す模式図である。It is a schematic diagram which shows the outline | summary of the video conference system which the conference assistance system which concerns on one Embodiment of this invention supports. 本発明の一実施形態に係る会議支援システムの主要部を示す機能ブロック図である。It is a functional block diagram which shows the principal part of the meeting assistance system which concerns on one Embodiment of this invention. 本発明の一実施形態に係る会議支援システムによる会議開始から会議ログ収集までの処理を示すフローチャートである。It is a flowchart which shows the process from the meeting start by the meeting assistance system which concerns on one Embodiment of this invention to meeting log collection. 本発明の一実施形態に係る会議支援システムによるタグ付けから統合履歴データ作成までの処理を示すフローチャートである。It is a flowchart which shows the process from tagging by the meeting assistance system which concerns on one Embodiment of this invention to integrated historical data preparation. 本発明の一実施形態に係る会議支援システムによって統合される各拠点の履歴データ(ログ)と、統合履歴データの模式図である。It is a schematic diagram of history data (log) of each base integrated by the conference support system according to an embodiment of the present invention, and integrated history data.

以下に本発明の一実施形態につき図面を参照して説明する。以下は本発明の一実施形態であって本発明を限定するものではない。   An embodiment of the present invention will be described below with reference to the drawings. The following is one embodiment of the present invention and does not limit the present invention.

図1に示すように拠点Aの会議室で2名、拠点Bの会議室で3名、拠点Cの社外のオープンスペースで1名の会議を想定する。拠点Aがホストとなり、拠点A,Bは会議室にあるTV会議システムから社内ネットワークを介してTV会議に繋げている。拠点Cはスマートフォンで公衆回線を利用して会議システムに繋ぎ会議に参加している。拠点Aの通信端末11、拠点Bの通信端末12、及び拠点Cの通信端末13は、それぞれ映像表示装置、スピーカー、カメラ、マイク、キーボード、マウス等の情報の出入力装置を備える。通信端末11、通信端末12、通信端末13のそれぞれは、情報(映像、音声、キー入力のテキスト、画像ファイル、文書ファイル等)を入力し、他の端末に送信し、他の端末はそれを出力する。これにより、複数の拠点A,B,C間で情報を通信して行う通信会議が実施される。   As shown in FIG. 1, a meeting of two people in the meeting room of the base A, three persons in the meeting room of the base B, and one person in an open space outside the base C is assumed. The site A is a host, and the sites A and B are connected to the TV conference from the TV conference system in the conference room via the in-house network. The base C uses a public line with a smartphone to connect to the conference system and participates in the conference. The communication terminal 11 at the base A, the communication terminal 12 at the base B, and the communication terminal 13 at the base C are each provided with information input / output devices such as a video display device, a speaker, a camera, a microphone, a keyboard, and a mouse. Each of the communication terminal 11, the communication terminal 12, and the communication terminal 13 inputs information (video, audio, key input text, image file, document file, etc.) and transmits it to other terminals. Output. Thereby, a communication conference is performed by communicating information between the plurality of bases A, B, and C.

拠点Aに(エッジ)サーバー20があり、サーバー20にホスト用会議支援システム30が組み込まれている(会議支援プログラムがインストールされている)。図2に示すように会議支援システム30は会議支援処理部40と会議分析処理部50から成り立ち、会議支援処理部40には、会議の音声をテキスト化する音声テキスト変換部(変換手段)41と、会議の状態を取得し、どの拠点でテキスト変換を実行するか判断する処理判断部42と、各拠点の会議ログをサーバー20に集める会議ログ収集部43とが含まれる。
また、会議分析処理部50は、収集した会議ログを一つに統合する会議ログ統合部(タグ付手段、採択手段、統合手段)51と、会議後に会議ログから会議を分析する会議ログ分析部(分析手段)52とからなる。
クライアント用会議支援システムは、ホストからの命令を受けて会議支援を実施するシステムで、会議ログの収集を行い、場合によって音声テキスト変換を行う事が出来、事前に会議を行う端末12,13にアプリケーションがインストールされて機能する。
There is an (edge) server 20 at the site A, and the host conference support system 30 is incorporated in the server 20 (a conference support program is installed). As shown in FIG. 2, the conference support system 30 includes a conference support processing unit 40 and a conference analysis processing unit 50. The conference support processing unit 40 includes an audio text conversion unit (conversion unit) 41 that converts the audio of the conference into text. In addition, a process determination unit 42 that acquires the state of the conference and determines at which base the text conversion is executed, and a conference log collection unit 43 that collects the conference log of each base in the server 20 are included.
In addition, the conference analysis processing unit 50 includes a conference log integration unit (tagging unit, selection unit, integration unit) 51 that integrates collected conference logs into one, and a conference log analysis unit that analyzes a conference from the conference log after the conference (Analysis means) 52.
The conference support system for clients is a system that receives a command from the host and supports the conference. The conference support system collects conference logs and can convert voice texts depending on the case. The application is installed and working.

図3、図4に処理のフローチャートを示す。
会議開始時に各拠点は会議ログの取得(履歴データの蓄積)を開始し(S1)、会議支援処理部40の処理判断部42は各拠点会議の状態(ネットワークのスピード、拠点の処理装置の能力)を確認する(S2)。
TV会議システムを利用している場合は音声テキスト変換処理をその拠点内で行って(例えば拠点BについてS3→S4の場合に相当)、音声とほぼ同時にテキストを各地に配信する。
PCやタブレット、スマートフォンから繋いでいる場合はネットワーク状況についてWi−Fi環境か3G,4G通信かのネットワーク状況とその時の通信速度を確認し、また、装置の処理能力を確認し、タイムラグが発生しないように拠点Aと拠点Cのどちらで処理を行うかを判断する(S3)。また、処理負荷を減らすために拠点Cは自らテキスト変換処理を拒否し、相手側(拠点A)に託すこともできる(S3→S5)。すなわち、第1の形態である音声を第2の形態であるテキストに変換する変換手段は、当該音声の収集元である話者側拠点(C)に備わる装置、他の聞き手側拠点(A,B)に備わる装置のうち、装置の処理能力、通信状態を鑑み、変換精度の最適な拠点の装置のものを適用する。
3 and 4 show flowcharts of the processing.
At the start of the conference, each site starts to acquire the conference log (accumulation of history data) (S1), and the process determination unit 42 of the conference support processing unit 40 determines the status of each site conference (network speed, capability of the processing device at the site). ) Is confirmed (S2).
When the TV conference system is used, the voice text conversion process is performed in the base (for example, equivalent to the case of S3 → S4 for the base B), and the text is distributed to various places almost simultaneously with the voice.
When connected from a PC, tablet, or smartphone, check the network status of the Wi-Fi environment or 3G or 4G communication and the communication speed at that time, check the processing capability of the device, and there will be no time lag Thus, it is determined whether the processing is performed at the base A or the base C (S3). Further, in order to reduce the processing load, the site C can reject the text conversion process by itself and entrust it to the other party (site A) (S3 → S5). That is, the conversion means for converting the voice of the first form into the text of the second form is a device provided at the speaker side base (C) from which the voice is collected, and other listener side bases (A, Among the devices provided in B), the device at the base with the optimum conversion accuracy is applied in view of the processing capability and communication state of the device.

ここでは、会議ログは会議中の音声とこのテキスト情報を含む例、すなわち、第1の形態としての音声の履歴データと第2の形態としてのテキストの履歴データを含む例で説明するが、会議ログはこれに限らず、会議の映像、画像、議事録、それらを翻訳や編集したものも該当する。第1の形態の情報としては少なくとも音声、画像、映像又はテキストが該当する。第2の形態の情報としては少なくともテキストの全文、翻訳若しくはそれらの抜粋(要約)、音声、画像又は映像が該当する。   Here, the conference log will be described with an example including the audio during the conference and the text information, that is, an example including the audio history data as the first form and the text history data as the second form. Logs are not limited to this, but also include conference videos, images, minutes, and translations and edits thereof. The information in the first form corresponds to at least sound, image, video or text. The information in the second form corresponds to at least the whole text of the text, translation or an excerpt (summary) thereof, sound, image or video.

会議終了後(S6でYES)、会議ログ収集部43はそれぞれの拠点で保存しておいた会議ログ(履歴データ)を拠点Aのサーバー20に収集する(S7)。拠点Cからの収集は拠点CがWi−Fi環境にある時に実行する。環境によって、会議中に同時に収集しても良いし、拠点ごとに収集タイミングを変えて構わない。タグ付手段が対象とする履歴データを、会議中又は会議後において部分的に逐次又はまとめて一時に収集すればよい。その収集のタイミングは、予め決められたタイミングでもよいし、その都度環境により判断されるタイミングとしてもよい。   After the conference ends (YES in S6), the conference log collection unit 43 collects the conference log (history data) stored at each site on the server 20 at the site A (S7). The collection from the base C is executed when the base C is in the Wi-Fi environment. Depending on the environment, it may be collected simultaneously during the meeting, or the collection timing may be changed for each site. The historical data targeted by the tagging means may be collected at a time during the meeting or after the meeting partially sequentially or collectively. The collection timing may be a predetermined timing, or may be a timing determined by the environment each time.

図5をも参照する。
全ての拠点の履歴データが揃ったときに会議ログ統合部51は統合作業を実施する。会議ログ統合部51のタグ付手段は、まず拠点Aの音声履歴データ100に対し、各発言音声に話者の拠点タグ(発信元の拠点を識別する識別情報を含むタグ)Tをつけていく(S8)。タグTのつけ方として、どの拠点からの発言かを残しているテキストデータを参考にしても良い、すなわち、第2の形態であるテキストに変換する際に当該テキストに発言単位でタグを付加しておいて、これを利用してもよい。
また、音声の録音時に端末マイクからの音声か会議相手からの音声かを区別して保存する方法でも良い。すなわち、タグ付手段が対象とする履歴データの形態が音声とされ、タグ付手段は各発言音声の入力マイクの識別により発信元の拠点を識別してタグを付加する方法である。
Reference is also made to FIG.
When the history data of all the bases is prepared, the conference log integration unit 51 performs the integration work. The tagging means of the conference log integration unit 51 first attaches a speaker base tag (a tag including identification information for identifying the base of the transmission source) T to each utterance voice with respect to the voice history data 100 of the base A. (S8). You can refer to the text data that keeps the utterance from the base as a way to attach the tag T. That is, when converting the text to the second form, add the tag to the text in the utterance unit. You may use this.
Further, it may be a method of distinguishing and storing the sound from the terminal microphone or the sound from the conference partner when recording the sound. That is, the form of the history data targeted by the tagging means is a voice, and the tagging means is a method of identifying a source site by adding an input microphone for each speech and adding a tag.

ここでは、会議ログ統合部51の採択手段は、タグ付手段によりタグが付加された発信元が異なるデータ毎に、統合する情報源の拠点を発信元の拠点とする採択を行う。
会議ログ統合部51の統合手段は、拠点Aで蓄積作成された音声履歴データ100の内、拠点BのタグT(B)がついた部分102,105,108を拠点Bの音声履歴データ201,202,203と置き換える。また会議ログ統合部51の統合手段は、拠点CのタグT(C)がついた部分103,106を拠点Cの音声履歴データ301,302と置き換え、拠点AのタグT(A)がついた部分をそのまま残し、全ての音声が話者の拠点で取得したデータになるように置き換えて(S9−S11)、1ファイル(統合履歴データ400)に統合する(S12)。会議ログ分析部52は、統合したファイル400を使用し、必要な時に分析を実施する。
Here, the adoption means of the conference log integration unit 51 adopts the information source base to be integrated as the base of the transmission source for each data with different transmission sources to which the tag is added by the tagging means.
The integration means of the conference log integration unit 51 uses the portions 102, 105, and 108 with the tag T (B) of the base B in the voice history data 100 accumulated and created at the base A as the voice history data 201 of the base B. Replace with 202 and 203. Further, the integration means of the conference log integration unit 51 replaces the portions 103 and 106 with the tag T (C) of the site C with the audio history data 301 and 302 of the site C, and attaches the tag T (A) of the site A. The part is left as it is, and all voices are replaced with data acquired at the speaker's base (S9-S11) and integrated into one file (integrated history data 400) (S12). The conference log analysis unit 52 uses the integrated file 400 and performs analysis when necessary.

以上の統合作業も、会議中又は会議後において部分的に逐次又はまとめて一時に実行すればよく、統合のタイミングは、予め決められたタイミングでもよいし、その都度環境により判断されるタイミングとしてもよい。   The integration work described above may be executed partially or sequentially at the same time during or after the meeting, and the integration timing may be a predetermined timing or may be determined by the environment each time. Good.

音声はそれぞれの拠点で取得したものに置き換える例(すなわち、情報源=発信元とする場合)を説明したが、取得したログ(履歴データ)のうち状態の良い物を使用する方法も可能である。
全ての拠点でそれぞれログ(履歴データ)を取得して統合する例を説明したが、ゲスト参加で同じシステムを有していない社外のお客様との会議の場合は全ての拠点からの会議ログを集めることは行わず、その場合はホストの拠点のログを使用しても良いし、取得した音声の中で一番状態の良い物を判断しても良い(拠点Cがタグ付けされたデータを拠点Aから収集する場合など)。また、同じ拠点内の別の方法で取得した音声、画像、テキストデータを収集、統合しても良い。
統合時にタグ付けの参考となるテキストの質が悪いと判断された時は再度質の良い音声情報を用いてテキスト化をし直しても良い。その場合、本実施形態ではタグ付手段の実装装置であるサーバー20に変換手段(41)も実装されているので、同装置20に音声履歴データを収集した後これを変換手段(41)がテキスト変換する。
The example in which the voice is replaced with the one acquired at each base (that is, the case where the information source is the transmission source) has been described, but a method of using the acquired log (history data) in a good state is also possible. .
An example of collecting and integrating logs (history data) at all sites has been explained. However, in the case of a conference with an outside customer who does not have the same system due to guest participation, collect the conference logs from all sites In that case, the log of the host site may be used, or the best state of the acquired voice may be judged (the data tagged with site C is used as the site). For example, when collecting from A). In addition, voice, image, and text data acquired by another method in the same base may be collected and integrated.
When it is determined that the quality of text used as a reference for tagging at the time of integration is poor, the text may be re-textured using high-quality audio information. In this case, in this embodiment, the conversion means (41) is also mounted on the server 20, which is a mounting apparatus of the tagging means. Therefore, after the voice history data is collected in the apparatus 20, the conversion means (41) Convert.

ここまで音声履歴データを収集、統合する例を示したが、画像や映像、テキストデータの収集、統合を実施しても良い。音声の統合履歴データとテキストの統合履歴データとをセットで作成、保存してもよい。
テキスト化したデータは会議の全体を含む必要はなく、冒頭の余談や翻訳前か後の言葉、重複する説明は省くこともできる。
別例として、海外拠点との打ち合わせの場合などTV会議を使用していても設備やネットワークの状態が悪い場合はTV会議システムでもテキスト変換は処理判断部42に判断させて処理場所を決定する。
会議の形態は全てWeb会議でも良い。また、TV会議の例を使って流れを説明したが、音声のみの通信会議でも良い。
Although an example of collecting and integrating audio history data has been shown so far, it is also possible to collect and integrate images, videos, and text data. Audio integrated history data and text integrated history data may be created and stored as a set.
The text data does not need to include the entire meeting, and you can omit the digression at the beginning, the words before or after translation, and duplicate explanations.
As another example, even if a TV conference is used, such as in a meeting with an overseas base, if the equipment or network condition is poor, the text conversion is determined by the processing determination unit 42 in the TV conference system and the processing location is determined.
The form of the meeting may be a web meeting. Moreover, although the flow was demonstrated using the example of a video conference, the communication conference only of an audio | voice may be sufficient.

11 通信端末
12 通信端末
13 通信端末
20 サーバー
30 会議支援システム
100 音声履歴データ
200 音声履歴データ
300 音声履歴データ
400 統合履歴データ
A,B,C 拠点
T タグ
11 Communication terminal 12 Communication terminal 13 Communication terminal 20 Server 30 Conference support system 100 Audio history data 200 Audio history data 300 Audio history data 400 Integrated history data A, B, C Base T Tag

Claims (19)

複数の拠点間で情報を通信して行う通信会議を支援する会議支援システムであって、
少なくとも一つの形態の前記情報の履歴データに対し、発信元の拠点を識別する識別情報を含むタグを付加するタグ付手段と、
前記タグ付手段によりタグが付加された発信元が異なるデータ毎に、統合する情報源の拠点を採択する採択手段と、
前記採択手段により採択された情報源の保存データを時系列に統合して前記一つの形態の統合履歴データを作成し保存する統合手段と、を備える会議支援システム。
A conference support system for supporting a communication conference in which information is communicated between a plurality of bases,
Tagging means for adding a tag including identification information for identifying a source site to the history data of the information in at least one form;
Adopting means for adopting the base of the information source to be integrated for each data with a different source from which the tag is added by the tagging means;
A meeting support system comprising: integration means for creating and storing the integrated history data of the one form by integrating the storage data of the information source adopted by the adoption means in time series.
前記複数の拠点から履歴データを収集するサーバーを有し、当該サーバーに前記タグ付手段、前記採択手段及び統合手段が実装される請求項1に記載の会議支援システム。 The conference support system according to claim 1, further comprising a server that collects history data from the plurality of bases, wherein the tagging unit, the selection unit, and the integration unit are mounted on the server. 前記サーバーはいずれかの拠点に備わるエッジサーバーであって、前記統合履歴データに基づく会議内容の分析手段を備える請求項2に記載の会議支援システム。 The conference support system according to claim 2, wherein the server is an edge server provided at any of the bases, and includes a meeting content analysis unit based on the integrated history data. 前記タグ付手段が対象とする履歴データの一次保存先は、前記サーバー又は他の記憶装置であって、他の記憶装置の場合は、当該他の記憶装置から前記サーバーが当該他の記憶装置に記憶されている履歴データを収集する請求項2又は請求項3に記載の会議支援システム。 The primary storage destination of the historical data targeted by the tagging means is the server or other storage device, and in the case of another storage device, the server is transferred from the other storage device to the other storage device. The conference support system according to claim 2 or 3, wherein the stored history data is collected. 前記情報を第1の形態から第2の形態の変換する変換手段を備え、
前記タグ付手段は、前記第1の形態及び/又は前記第2の形態の履歴データに対しタグを付加し、前記統合手段は、前記第1の形態及び/又は前記第2の形態の統合履歴データを作成し保存する請求項1から請求項4のうちいずれか一に記載の会議支援システム。
Conversion means for converting the information from the first form to the second form,
The tagging means adds a tag to the history data of the first form and / or the second form, and the integrating means is the integrated history of the first form and / or the second form. The conference support system according to claim 1, wherein data is created and stored.
前記第1の形態が音声で、前記第2の形態がテキストである請求項5に記載の会議支援システム。 The conference support system according to claim 5, wherein the first form is voice and the second form is text. 前記タグ付手段は、前記第2の形態であるテキストに変換する際に当該テキストに発言単位で前記タグを付加する請求項5に記載の会議支援システム。 The conference support system according to claim 5, wherein the tagging unit adds the tag to the text in units of speech when converting the text to the second form. 前記第1の形態である音声を前記第2の形態であるテキストに変換する前記変換手段は、当該音声の収集元である話者側拠点に備わる装置、他の聞き手側拠点に備わる装置のうち、装置の処理能力、通信状態を鑑み、変換精度の最適な拠点の装置のものを適用する請求項6又は請求項7に記載の会議支援システム。 The conversion means for converting the voice of the first form into the text of the second form is an apparatus provided at a speaker side base from which the voice is collected, or an apparatus provided at another listener side base. The conference support system according to claim 6 or 7, wherein the apparatus of the base at the optimum conversion accuracy is applied in view of the processing capability and communication state of the apparatus. 前記タグ付手段の実装装置に前記変換手段も実装され、同装置に音声履歴データを収集した後これをテキスト変換する請求項6又は請求項7に記載の会議支援システム。 The conference support system according to claim 6 or 7, wherein the conversion means is also mounted on the mounting device of the tagging means, and voice history data is collected in the device and then converted into text. 前記第1の形態は音声、画像、映像又はテキストである請求項5に記載の会議支援システム。 The conference support system according to claim 5, wherein the first form is audio, image, video, or text. 前記第2の形態はテキストの全文、翻訳若しくはそれらの抜粋、音声、画像又は映像である請求項5に記載の会議支援システム。 The conference support system according to claim 5, wherein the second form is a full text of a text, a translation or an excerpt thereof, a voice, an image, or a video. 前記タグ付手段が対象とする履歴データを、会議中又は会議後において部分的に逐次又はまとめて一時に収集する請求項1から請求項11のうちいずれか一に記載の会議支援システム。 The meeting support system according to any one of claims 1 to 11, wherein the history data targeted by the tagging unit is collected at one time during a meeting or after the meeting, partially sequentially or collectively. 前記収集のタイミングは、予め決められたタイミング又は環境により判断されるタイミングとされる請求項12に記載の会議支援システム。 The meeting support system according to claim 12, wherein the collection timing is a predetermined timing or a timing determined by an environment. 前記情報源の拠点を前記発信元の拠点とする請求項1から請求項13のうちいずれか一に記載の会議支援システム。 The conference support system according to claim 1, wherein the base of the information source is the base of the transmission source. 前記タグ付手段が対象とする履歴データの形態が音声とされ、前記タグ付手段は各発言音声の入力マイクの識別により前記発信元の拠点を識別して前記タグを付加する請求項1から請求項14のうちいずれか一に記載の会議支援システム。 The form of the history data targeted by the tagging unit is a voice, and the tagging unit identifies the source site by adding an input microphone for each speech and adds the tag. Item 15. The meeting support system according to any one of Items 14 to 14. 前記統合手段による統合を、会議中又は会議後において部分的に逐次又はまとめて一時に実行する請求項1から請求項15のうちいずれか一に記載の会議支援システム。 The meeting support system according to any one of claims 1 to 15, wherein the integration by the integration unit is executed partly sequentially or collectively at a time during or after the meeting. 前記統合のタイミングは、予め決められたタイミング又は環境により判断されるタイミングとされる請求項16に記載の会議支援システム。 The conference support system according to claim 16, wherein the integration timing is a predetermined timing or a timing determined by an environment. 前記タグ付手段は、少なくとも一つの拠点から収取した履歴データに対し、前記タグを付加する請求項1から請求項17のうちいずれか一に記載の会議支援システム。 The meeting support system according to any one of claims 1 to 17, wherein the tagging unit adds the tag to history data collected from at least one site. 請求項1から請求項18のうちいずれか一に記載の会議支援システムとしてコンピューターを機能させるための会議支援プログラム。 A conference support program for causing a computer to function as the conference support system according to any one of claims 1 to 18.
JP2018038145A 2018-03-05 2018-03-05 Conference assisting system, and conference assisting program Pending JP2019153099A (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2018038145A JP2019153099A (en) 2018-03-05 2018-03-05 Conference assisting system, and conference assisting program
CN201910147884.6A CN110232553A (en) 2018-03-05 2019-02-28 Meeting support system and computer-readable recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018038145A JP2019153099A (en) 2018-03-05 2018-03-05 Conference assisting system, and conference assisting program

Publications (1)

Publication Number Publication Date
JP2019153099A true JP2019153099A (en) 2019-09-12

Family

ID=67860426

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018038145A Pending JP2019153099A (en) 2018-03-05 2018-03-05 Conference assisting system, and conference assisting program

Country Status (2)

Country Link
JP (1) JP2019153099A (en)
CN (1) CN110232553A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022050309A (en) * 2020-10-22 2022-03-30 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド Information processing method, device, system, electronic device, storage medium, and computer program
CN115102930A (en) * 2022-06-28 2022-09-23 海南乾唐视联信息技术有限公司 Conference map generation method and device, electronic equipment and readable storage medium
CN116524910A (en) * 2023-06-25 2023-08-01 安徽声讯信息技术有限公司 Manuscript prefabrication method and system based on microphone

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113434663A (en) * 2021-06-30 2021-09-24 平安科技(深圳)有限公司 Conference summary generation method based on edge calculation and related equipment

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010238050A (en) * 2009-03-31 2010-10-21 Nec Corp Browsing system and method, and program
JP2010277613A (en) * 2010-09-14 2010-12-09 Future Vision:Kk Method for recording and reproducing conference content
JP2017167318A (en) * 2016-03-16 2017-09-21 株式会社アドバンスト・メディア Minute generation device and minute generation program

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104427292A (en) * 2013-08-22 2015-03-18 中兴通讯股份有限公司 Method and device for extracting a conference summary
JP6327848B2 (en) * 2013-12-20 2018-05-23 株式会社東芝 Communication support apparatus, communication support method and program
JP6242773B2 (en) * 2014-09-16 2017-12-06 株式会社東芝 Conference information storage device, method and program
CN105632498A (en) * 2014-10-31 2016-06-01 株式会社东芝 Method, device and system for generating conference record
JP6601036B2 (en) * 2015-07-24 2019-11-06 富士通株式会社 Meeting support method, meeting support apparatus, and meeting support program
CN106782545B (en) * 2016-12-16 2019-07-16 广州视源电子科技股份有限公司 A kind of system and method that audio, video data is converted to writing record

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010238050A (en) * 2009-03-31 2010-10-21 Nec Corp Browsing system and method, and program
JP2010277613A (en) * 2010-09-14 2010-12-09 Future Vision:Kk Method for recording and reproducing conference content
JP2017167318A (en) * 2016-03-16 2017-09-21 株式会社アドバンスト・メディア Minute generation device and minute generation program

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022050309A (en) * 2020-10-22 2022-03-30 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド Information processing method, device, system, electronic device, storage medium, and computer program
JP7331044B2 (en) 2020-10-22 2023-08-22 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド Information processing method, device, system, electronic device, storage medium and computer program
CN115102930A (en) * 2022-06-28 2022-09-23 海南乾唐视联信息技术有限公司 Conference map generation method and device, electronic equipment and readable storage medium
CN116524910A (en) * 2023-06-25 2023-08-01 安徽声讯信息技术有限公司 Manuscript prefabrication method and system based on microphone
CN116524910B (en) * 2023-06-25 2023-09-08 安徽声讯信息技术有限公司 Manuscript prefabrication method and system based on microphone

Also Published As

Publication number Publication date
CN110232553A (en) 2019-09-13

Similar Documents

Publication Publication Date Title
CN101689365B (en) Method of controlling a video conference
JP2019153099A (en) Conference assisting system, and conference assisting program
US9063935B2 (en) System and method for synchronously generating an index to a media stream
Mostefa et al. The CHIL audiovisual corpus for lecture and meeting analysis inside smart rooms
US8630854B2 (en) System and method for generating videoconference transcriptions
US9247205B2 (en) System and method for editing recorded videoconference data
US8791977B2 (en) Method and system for presenting metadata during a videoconference
US20040064322A1 (en) Automatic consolidation of voice enabled multi-user meeting minutes
JP4787328B2 (en) Method and apparatus for capturing audio during a conference call
WO2020124725A1 (en) Audio and video pushing method and audio and video stream pushing client based on webrtc protocol
CN104639777A (en) Conference control method, conference control device and conference system
JP2011087005A (en) Telephone call voice summary generation system, method therefor, and telephone call voice summary generation program
US20120259924A1 (en) Method and apparatus for providing summary information in a live media session
WO2016127691A1 (en) Method and apparatus for broadcasting dynamic information in multimedia conference
JP2007180828A5 (en)
KR20130063542A (en) System and method for providing conference information
EP2924985A1 (en) Low-bit-rate video conference system and method, sending end device, and receiving end device
JP2012160793A (en) Video conference system and apparatus for video conference, and program
CN114514577A (en) Method and system for generating and transmitting a text recording of a verbal communication
JP2013198066A (en) Server, control method and control program for server, information processing system, information processing method, portable terminal, control method and control program for portable terminal
CN113098937A (en) Method and device for monitoring conference service application system
CN111583932A (en) Sound separation method, device and equipment based on human voice model
TWM574267U (en) Live broadcast system of synchronous and automatic translation of real-time voice and subtitle
US20200184973A1 (en) Transcription of communications
CN113689855A (en) Conference record generation system, method, device and storage medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201223

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211124

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20211124

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20220524