JP2018059961A - Language processing system, language processing device, language processing program and language processing method - Google Patents

Language processing system, language processing device, language processing program and language processing method Download PDF

Info

Publication number
JP2018059961A
JP2018059961A JP2016195087A JP2016195087A JP2018059961A JP 2018059961 A JP2018059961 A JP 2018059961A JP 2016195087 A JP2016195087 A JP 2016195087A JP 2016195087 A JP2016195087 A JP 2016195087A JP 2018059961 A JP2018059961 A JP 2018059961A
Authority
JP
Japan
Prior art keywords
conference
language processing
user information
user
conversion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016195087A
Other languages
Japanese (ja)
Other versions
JP6772734B2 (en
Inventor
宗毅 諸山
Munetake Moroyama
宗毅 諸山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2016195087A priority Critical patent/JP6772734B2/en
Publication of JP2018059961A publication Critical patent/JP2018059961A/en
Application granted granted Critical
Publication of JP6772734B2 publication Critical patent/JP6772734B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

PROBLEM TO BE SOLVED: To improve accuracy of conversion from voice to texts.SOLUTION: A language processing system realized by a plurality of devices comprises: a storage unit for storing audio data, and user information on a user of a terminal apparatus collecting the audio data in association with one another; a user information database, in which a group to which the user of the terminal apparatus belongs is associated with the user information on the user belonging the group; a dictionary database of each group; a conversion request unit for performing a conversion request to text data based on the audio data; a dictionary specifying unit for specifying the dictionary database used in the conversion, with reference to the user information database, from the user information made to be associated with the audio data, when receiving the conversion request; and a conversion processing unit for converting the audio data to the text data, with reference to the specified dictionary database.SELECTED DRAWING: Figure 1

Description

本発明は、言語処理システム、言語処理装置、言語処理プログラム及び言語処理方法に関する。   The present invention relates to a language processing system, a language processing apparatus, a language processing program, and a language processing method.

従来から、音声データを分析してテキストデータに変換する技術が知られている。この技術では、例えば、音声認識結果の候補群となる複数のテキスト配列を記述した辞書を参照し、音声に対応したテキストを確定させる手法が知られている。   Conventionally, a technique for analyzing voice data and converting it into text data is known. In this technique, for example, a method is known in which a text corresponding to speech is determined by referring to a dictionary describing a plurality of text arrays that are candidates for speech recognition results.

しかしながら、従来の技術では、例えば、特定の業界や団体において用いられる略語や専門用語等を多く含む音声については、略語や専門用語等を適切なテキストに変換することが困難な場合があり、変換の精度が低下する可能性がある。   However, with conventional technology, for example, for speech that contains many abbreviations and technical terms used in specific industries and organizations, it may be difficult to convert abbreviations and technical terms into appropriate text. Accuracy may be reduced.

開示の技術は、音声からテキストへ変換する際の精度を向上させることを目的としている。   The disclosed technology aims to improve accuracy when converting speech to text.

開示の技術は、複数の装置によって実現される言語処理システムであって、
音声データと、前記音声データを収集する端末装置の利用者のユーザ情報とを対応付けて記憶する記憶部と、端末装置の利用者が所属するグループと、前記グループに所属する利用者のユーザ情報とを対応付けたユーザ情報データベースと、前記グループ毎の辞書データベースと、前記音声データに基づくテキストデータへの変換要求を行う変換要求部と、前記変換要求を受けて、前記音声データと対応付けられたユーザ情報から、前記ユーザ情報データベースを参照して変換に用いる辞書データベースを特定する辞書特定部と、特定された辞書データベースを参照して、前記音声データをテキストデータへ変換する変換処理部と、を有する。
The disclosed technology is a language processing system realized by a plurality of devices,
Storage unit that stores voice data and user information of a user of a terminal device that collects the voice data in association with each other, a group to which a user of the terminal device belongs, and user information of a user who belongs to the group Are associated with the voice data upon receipt of the conversion request, a user information database that associates with each other, a dictionary database for each group, a conversion request unit that performs a conversion request to text data based on the voice data, A dictionary specifying unit for specifying a dictionary database used for conversion with reference to the user information database, a conversion processing unit for converting the voice data into text data with reference to the specified dictionary database, Have

音声からテキストへ変換する際の精度を向上させることができる。   The accuracy when converting from speech to text can be improved.

言語処理システムの概要を説明する図である。It is a figure explaining the outline | summary of a language processing system. 言語処理装置のハードウェア構成の一例を示す図である。It is a figure which shows an example of the hardware constitutions of a language processing apparatus. 電子黒板のハードウェア構成の一例を示す図である。It is a figure which shows an example of the hardware constitutions of an electronic blackboard. 端末装置のハードウェア構成の一例を示す図である。It is a figure which shows an example of the hardware constitutions of a terminal device. 第一の実施形態の言語処理システムの有する各装置の機能を説明する図である。It is a figure explaining the function of each apparatus which the language processing system of 1st embodiment has. 第一の実施形態の会議支援サーバの会議管理情報データベースの一例を示す図である。It is a figure which shows an example of the meeting management information database of the meeting assistance server of 1st embodiment. 第一の実施形態の会議情報データベースの一例を示す図である。It is a figure which shows an example of the meeting information database of 1st embodiment. 第一の実施形態の端末情報データベースの一例を示す図である。It is a figure which shows an example of the terminal information database of 1st embodiment. 第一の実施形態の企業A用辞書データベースの一例を示す図である。It is a figure which shows an example of the dictionary database for companies A of 1st embodiment. 会議情報の収集の仕方を説明する図である。It is a figure explaining how to collect meeting information. 第一の実施形態の音声変換部の機能を説明する図である。It is a figure explaining the function of the audio | voice conversion part of 1st embodiment. 第一の実施形態の言語処理装置の動作を説明するフローチャートである。It is a flowchart explaining operation | movement of the language processing apparatus of 1st embodiment. 第二の実施形態の音声変換部の機能を説明する図である。It is a figure explaining the function of the audio | voice conversion part of 2nd embodiment. 第二の実施形態の音声変換部の処理を説明するフローチャートである。It is a flowchart explaining the process of the audio | voice conversion part of 2nd embodiment.

(第一の実施形態)
以下に図面を参照して第一の実施形態について説明する。図1は、言語処理システムの概要を説明する図である。
(First embodiment)
The first embodiment will be described below with reference to the drawings. FIG. 1 is a diagram illustrating an outline of a language processing system.

本実施形態の言語処理システム100は、会議支援サービスを提供する企業により機能が実装された会議支援サーバ200と、言語処理サービスを提供する企業により機能が実装された言語処理装置300とを有する。   The language processing system 100 according to the present embodiment includes a conference support server 200 in which a function is implemented by a company that provides a conference support service, and a language processing apparatus 300 in which a function is implemented by a company that provides a language processing service.

本実施形態の言語処理システム100において、言語処理装置300は、会議支援サーバ200から、会議情報に含まれる音声データの変換要求を受け付けると、会議支援サーバ200から音声データを取得し、テキストデータに変換する。   In the language processing system 100 of the present embodiment, when the language processing apparatus 300 receives a conversion request for audio data included in the conference information from the conference support server 200, the language processing device 300 acquires the audio data from the conference support server 200 and converts it into text data. Convert.

このとき、本実施形態の言語処理装置300は、変換要求を受けた音声データを含む会議情報から特定される団体と対応する辞書データベースを参照し、音声データからテキストデータへの変換を行うことで、音声からテキストへの変換の精度を向上させる。   At this time, the language processing apparatus 300 according to the present embodiment refers to a dictionary database corresponding to the group specified from the conference information including the audio data that has received the conversion request, and performs conversion from the audio data to the text data. Improve the accuracy of voice to text conversion.

図1では、会議支援サーバ200は、例えば、企業Aのオフィスで行われた会議の会議情報と、企業Bのオフィスで行われた会議情報と、企業Cのオフィスで行われた会議の会議情報と、を蓄積する。本実施形態の会議情報は、会議を識別する会議IDと、会議の参加者毎の音声データと、後述する電子黒板に描画された文字や画像の描画データとが対応付けられた情報である。会議情報の詳細は後述する。   In FIG. 1, the conference support server 200, for example, conference information held at the office of the company A, conference information held at the office of the company B, and conference information held at the office of the company C. And accumulate. The conference information of the present embodiment is information in which a conference ID for identifying a conference, audio data for each participant of the conference, and character and image drawing data drawn on an electronic blackboard described later are associated with each other. Details of the conference information will be described later.

企業Aのオフィスでの会議は、例えば、電子黒板400Aと、会議の参加者であるユーザAの端末装置500−1、ユーザBの端末装置500−2、ユーザCの端末装置500−3、ユーザDの端末装置500−4と、を用いて行われる。   The conference at the office of company A is, for example, an electronic blackboard 400A, a terminal device 500-1 of user A who is a participant in the conference, a terminal device 500-2 of user B, a terminal device 500-3 of user C, a user D terminal device 500-4.

電子黒板400Aは、ディスプレイに対して手書き入力を行うことが可能であり、入力された文字や画像を描画データとして記憶する。この会議では、例えば会議の進行役であるユーザXが、電子黒板400Aを用いて会議の進行に応じた事項を電子黒板400Aに記述する。   The electronic blackboard 400A can perform handwritten input on the display, and stores input characters and images as drawing data. In this conference, for example, the user X who is the facilitator of the conference describes the matter according to the progress of the conference on the electronic blackboard 400A using the electronic blackboard 400A.

電子黒板400Aは、記述された内容を示す描画データを、電子黒板400Aを識別する端末ID及び会議IDと対応付けて、会議情報の一部として会議支援サーバ200へ送信する。   The electronic blackboard 400A transmits drawing data indicating the described contents to the conference support server 200 as a part of the conference information in association with the terminal ID and conference ID for identifying the electronic blackboard 400A.

また、端末装置500−1、500−2、500−3、500−4のそれぞれは、音声入力装置であるマイクを有している。各端末装置500は、マイクから入力された音声データを記憶し、各端末装置を識別する端末IDと対応付けて、会議情報の一部として会議支援サーバ200へ送信する。言い換えれば、本実施形態において、各端末装置500は、各端末装置500を利用する参加者毎の音声データを端末ID及び会議IDと対応付けて会議支援サーバ200へ送信する。   Each of the terminal devices 500-1, 500-2, 500-3, and 500-4 has a microphone that is a voice input device. Each terminal device 500 stores audio data input from a microphone, and transmits the data to the conference support server 200 as a part of conference information in association with a terminal ID that identifies each terminal device. In other words, in this embodiment, each terminal device 500 transmits audio data for each participant who uses each terminal device 500 to the conference support server 200 in association with the terminal ID and the conference ID.

本実施形態では、このようにして、1つの会議における会議情報が会議IDと対応付けられた会議支援サーバ200に蓄積される。   In the present embodiment, the conference information for one conference is thus stored in the conference support server 200 associated with the conference ID.

本実施形態では、例えば企業Bや企業Cのオフィスにおいても、同様の環境で会議が行われる。例えば、企業Bでは、電子黒板400Bと、複数の端末装置500と、を用いて行われた会議の会議情報が会議支援サーバ200へ送信される。また、企業Cでは、電子黒板400Cと、複数の端末装置500と、を用いて行われた会議の会議情報が会議支援サーバ200へ送信される。   In the present embodiment, for example, in the offices of company B and company C, a meeting is performed in the same environment. For example, in the company B, conference information of a conference held using the electronic blackboard 400B and the plurality of terminal devices 500 is transmitted to the conference support server 200. Further, in the company C, conference information of a conference held using the electronic blackboard 400 </ b> C and the plurality of terminal devices 500 is transmitted to the conference support server 200.

尚、端末装置500−1、500−2、500−3、500−4のそれぞれを区別しない場合には、端末装置500と呼ぶ。   In addition, when not distinguishing each of terminal device 500-1, 500-2, 500-3, 500-4, it calls the terminal device 500.

本実施形態の会議支援サーバ200は、例えば企業Aのオフィスにおいて、電子黒板400Aから、音声データからテキストデータへの変換の要求を受け付けると、言語処理装置300に対し、音声データとテキストデータへの変換要求とを送信する。尚、このとき、音声データは端末IDが対応付けられた状態で言語処理装置300へ送信される。   For example, in the office of company A, the conference support server 200 according to the present embodiment receives a request for conversion from voice data to text data from the electronic blackboard 400A, and sends the voice data and text data to the language processing device 300. Send conversion request. At this time, the audio data is transmitted to the language processing apparatus 300 in a state in which the terminal ID is associated.

本実施形態の言語処理装置300は、端末情報データベース310、企業A用辞書データベース320、企業B用辞書データベース330、企業C用辞書データベース340を有する。   The language processing apparatus 300 according to this embodiment includes a terminal information database 310, a company A dictionary database 320, a company B dictionary database 330, and a company C dictionary database 340.

端末情報データベース310は、端末装置500の端末IDと、端末装置500の所有者あるいは利用者が所属する団体(企業など)を特定する団体名などの団体識別情報とを対応付けている。   The terminal information database 310 associates the terminal ID of the terminal device 500 with organization identification information such as an organization name that identifies an organization (such as a company) to which the owner or user of the terminal device 500 belongs.

企業A用辞書データベース320は、企業Aのために用意された辞書データベースであり、企業Aで使用される専門用語や業界用語、社内用語、略語等、企業Aに関係する会話が行われた場合の翻訳精度を上げるための用語の辞書が格納されている。同様に、企業B用辞書データベース330、企業C用辞書データベース340は、それぞれ企業B、企業Cのために用意された辞書データベースである。   The company A dictionary database 320 is a dictionary database prepared for the company A, and conversations related to the company A such as technical terms, industry terms, company terms, abbreviations, etc. used in the company A are performed. A dictionary of terms to improve the translation accuracy of is stored. Similarly, the company B dictionary database 330 and the company C dictionary database 340 are dictionary databases prepared for the company B and the company C, respectively.

このような辞書データベースは、例えば、言語処理装置を所有し言語処理サービスを提供する提供企業とこれを利用する企業とが契約を結び、提供企業が契約した企業から情報を収集し、分析することで登録されていく、といった運用が考えられる。なお、データベースは、企業などの団体単位で用意されるものに限られない。例えば、医療・教育・建築などといった業界単位で用意される辞書データベースを有していてもよい。契約した企業に言語処理サービスを提供する際には、その企業専用の辞書データベースの他に、その企業が事業展開している業界に対応した辞書データベースを併用して音声翻訳処理を行うようにしてもよい。各データベースの詳細は後述する。   Such a dictionary database, for example, collects and analyzes information from a company that has a contract with a provider that owns a language processing device and provides a language processing service and a company that uses the language processing service. It can be considered that it is registered with The database is not limited to one prepared for each group such as a company. For example, you may have a dictionary database prepared by industry units, such as medical care, education, and construction. When providing language processing services to a contracted company, in addition to a dictionary database dedicated to that company, a dictionary database corresponding to the industry in which the company operates is also used for speech translation processing. Also good. Details of each database will be described later.

言語処理装置300は、会議支援サーバ200から、音声データの変換要求を受信すると、音声データと対応付けられた端末IDと、端末情報データベース310と、から、端末IDと対応する団体を特定する。そして、言語処理装置300は、記憶されている複数の辞書データベースの中から、特定した団体に対して適用する辞書データベースを決定し、決定された辞書データベースを参照して音声データをテキストデータへ変換し、変換結果のテキストデータを会議支援サーバ200へ送信する。   When the language processing apparatus 300 receives a voice data conversion request from the conference support server 200, the language processing apparatus 300 specifies a group corresponding to the terminal ID from the terminal ID associated with the voice data and the terminal information database 310. Then, the language processing apparatus 300 determines a dictionary database to be applied to the specified organization from a plurality of stored dictionary databases, and converts the speech data into text data with reference to the determined dictionary database. Then, the conversion result text data is transmitted to the conference support server 200.

例えば、会議支援サーバ200は、ユーザAが所持する端末装置500−1の端末IDと対応付けられた音声データの変換要求を受け付けたとする。   For example, it is assumed that the conference support server 200 has received a voice data conversion request associated with the terminal ID of the terminal device 500-1 possessed by the user A.

この場合、会議支援サーバ200は、変換要求と共に、端末装置500−1の端末IDが対応付けられた音声データを言語処理装置300へ送信する。   In this case, the conference support server 200 transmits voice data associated with the terminal ID of the terminal device 500-1 to the language processing device 300 together with the conversion request.

言語処理装置300は、これを受けて、端末情報データベース310を参照し、端末装置500−1の端末IDと対応する団体である企業Aを特定する。次に、言語処理装置300は、企業Aの団体識別情報に対して適用する辞書データベースとして、企業Aと対応する企業A用辞書データベース320を参照して、音声データをテキストデータへ変換する。   In response to this, the language processing device 300 refers to the terminal information database 310 and identifies the company A that is an organization corresponding to the terminal ID of the terminal device 500-1. Next, the language processing apparatus 300 refers to the company A dictionary database 320 corresponding to the company A as a dictionary database to be applied to the group identification information of the company A, and converts the speech data into text data.

したがって、本実施形態によれば、例えば、端末装置500−1の端末IDと対応付けられた音声データに、企業Aで用いられる社内用語や略語が多く含まれている場合でも、音声データを適切なテキストデータへ変換することができる。よって、本実施形態によれば、変換の精度を向上させることができる。   Therefore, according to the present embodiment, for example, even when the voice data associated with the terminal ID of the terminal device 500-1 includes a lot of internal terms and abbreviations used in the company A, the voice data is appropriately selected. Can be converted into text data. Therefore, according to the present embodiment, the conversion accuracy can be improved.

尚、図1では、各企業において開催される会議に用いられる端末装置500を4台としているが、これに限定されない。会議に用いられる端末装置500の台数は任意であって良い。また、図1では、会議支援サーバ200により会議情報が管理される企業を3つの企業としているが、これに限定されない。会議支援サーバ200により会議情報が管理される企業の数は、任意であって良い。   In FIG. 1, four terminal devices 500 are used for a conference held in each company, but the present invention is not limited to this. The number of terminal devices 500 used for the conference may be arbitrary. In FIG. 1, the companies whose conference information is managed by the conference support server 200 are three companies, but the present invention is not limited to this. The number of companies whose conference information is managed by the conference support server 200 may be arbitrary.

さらに、図1では、会議を行う団体の一例を企業としているが、これに限定されない。会議を行う団体は、教員機関であっても良いし、学生のグループ等であっても良い。つまり、団体とは、複数人のグループであれば良く、会議とは、複数人で議論をすることであれば良い。   Furthermore, although FIG. 1 shows an example of an organization that conducts a meeting, the present invention is not limited to this. The organization that holds the meeting may be a teacher institution or a group of students. That is, the group may be a group of a plurality of people, and the meeting may be a discussion by a plurality of people.

また、会議支援サーバ200機能と言語処理装置300とは別々の装置でなくてもよく、会議支援サーバ200が有する機能と、言語処理装置300が有する機能とを、一台の情報処理装置により実現してもよい。あるいは、一の企業が有するシステムとして、会議支援サービス及び言語処理サービスを提供する一台以上の情報処理装置により実現してもよい。従って、本実施形態では、各団体の電子黒板400と、端末装置500と、会議支援サーバ200と、により、会議支援システムを構成しても良い。さらに、各団体における会議では、電子黒板400の代わりに、一般的に端末装置500が用いられても良い。つまり、会議支援システムは、端末装置500と、会議支援サーバ200と、により形成されても良い。さらに、端末装置500を音声入力装置としても良い。   Further, the conference support server 200 function and the language processing device 300 do not have to be separate devices, and the function of the conference support server 200 and the function of the language processing device 300 are realized by a single information processing device. May be. Alternatively, a system possessed by one company may be realized by one or more information processing apparatuses that provide a conference support service and a language processing service. Therefore, in the present embodiment, a conference support system may be configured by the electronic blackboard 400 of each group, the terminal device 500, and the conference support server 200. Further, the terminal device 500 may generally be used in place of the electronic blackboard 400 in a meeting in each organization. That is, the conference support system may be formed by the terminal device 500 and the conference support server 200. Further, the terminal device 500 may be a voice input device.

さらに、端末装置500を音声入力装置としても良い。少なくとも、端末装置500は録音機能を有していればよく、例えば、時計型やメガネ型の装置であってもよい。但し、端末装置500自体に言語処理システム100とネットワークを介して通信する機能が無い場合には、会議室で利用される各端末装置500により録音された音声データを取得して言語処理システム100に送信する、ハブとなる中継装置が必要になる。つまり、端末装置500は、録音した音声データが入力される音声入力装置と、言語処理システム100にネットワークを介して音声データを送信する音声出力装置と、を有するが、音声入力装置と音声出力装置は、音声データの送受ができるように構成されていれば、一つのデバイスで構成されていても複数のデバイスで構成されていてもよい。   Further, the terminal device 500 may be a voice input device. The terminal device 500 only needs to have a recording function, and may be, for example, a watch-type or glasses-type device. However, if the terminal device 500 itself does not have a function of communicating with the language processing system 100 via the network, the voice data recorded by each terminal device 500 used in the conference room is acquired and stored in the language processing system 100. A relay device that becomes a hub for transmission is required. That is, the terminal device 500 includes a voice input device to which recorded voice data is input and a voice output device that transmits the voice data to the language processing system 100 via the network. As long as it is configured to be able to send and receive audio data, it may be composed of one device or a plurality of devices.

以下に、本実施形態の言語処理システム100の有する各装置について説明する。図2は、言語処理装置のハードウェア構成の一例を示す図である。   Below, each apparatus which the language processing system 100 of this embodiment has is demonstrated. FIG. 2 is a diagram illustrating an example of a hardware configuration of the language processing apparatus.

本実施形態の言語処理装置300は、一般の情報処理装置であり、それぞれバスBで相互に接続されている入力装置31、出力装置32、ドライブ装置33、補助記憶装置34、メモリ装置35、演算処理装置36及びインターフェース装置37を有する。   The language processing apparatus 300 according to the present embodiment is a general information processing apparatus. The input device 31, the output device 32, the drive device 33, the auxiliary storage device 34, the memory device 35, and the arithmetic unit connected to each other via the bus B A processing device 36 and an interface device 37 are included.

入力装置31は、例えばマウスやキーボードであり、各種の情報を入力するために用いられる。出力装置32は、例えばディスプレイ等であり、各種信号の表示(出力)に用いられる。インターフェース装置37は、モデム,LANカード等を含み、ネットワークに接続する為に用いられる。   The input device 31 is a mouse or a keyboard, for example, and is used for inputting various information. The output device 32 is, for example, a display and is used for displaying (outputting) various signals. The interface device 37 includes a modem, a LAN card, and the like, and is used for connecting to a network.

言語処理プログラムは、言語処理装置300を制御する各種プログラムの少なくとも一部である。言語処理プログラムは例えば記録媒体38の配布やネットワークからのダウンロードなどによって提供される。言語処理プログラムを記録した記録媒体38は、CD−ROM、フレキシブルディスク、光磁気ディスク等の様に情報を光学的,電気的或いは磁気的に記録する記録媒体、ROM、フラッシュメモリ等の様に情報を電気的に記録する半導体メモリ等、様々なタイプの記録媒体を用いることができる。   The language processing program is at least a part of various programs that control the language processing apparatus 300. The language processing program is provided by, for example, distribution of the recording medium 38 or downloading from a network. The recording medium 38 on which the language processing program is recorded is information such as a CD-ROM, a flexible disk, a magneto-optical disk, etc., a recording medium for recording information optically, electrically or magnetically, a ROM, a flash memory, etc. Various types of recording media, such as a semiconductor memory that electrically records data, can be used.

また、言語処理プログラムを記録した記録媒体38がドライブ装置33にセットされると、言語処理プログラムは記録媒体38からドライブ装置33を介して補助記憶装置34にインストールされる。ネットワークからダウンロードされた通信プログラムは、インターフェース装置37を介して補助記憶装置34にインストールされる。   When the recording medium 38 on which the language processing program is recorded is set in the drive device 33, the language processing program is installed from the recording medium 38 to the auxiliary storage device 34 via the drive device 33. The communication program downloaded from the network is installed in the auxiliary storage device 34 via the interface device 37.

補助記憶装置34は、インストールされた言語処理プログラムを格納すると共に、必要なファイル、データ等を格納する。メモリ装置35は、コンピュータの起動時に補助記憶装置34から言語処理プログラムを読み出して格納する。そして、演算処理装置36はメモリ装置35に格納された各プログラムに従って、後述するような各種処理を実現している。   The auxiliary storage device 34 stores the installed language processing program and also stores necessary files, data, and the like. The memory device 35 reads and stores the language processing program from the auxiliary storage device 34 when the computer is started. The arithmetic processing unit 36 implements various processes as will be described later in accordance with each program stored in the memory device 35.

本実施形態の会議支援サーバ200は、一般のコンピュータであり、そのハードウェア構成は、言語処理装置300と同様であるから、説明を省略する。   The conference support server 200 of this embodiment is a general computer, and the hardware configuration thereof is the same as that of the language processing device 300, and thus the description thereof is omitted.

次に、図3を参照して、本実施形態の電子黒板400のハードウェア構成を説明する。図3は、電子黒板のハードウェア構成の一例を示す図である。   Next, a hardware configuration of the electronic blackboard 400 according to the present embodiment will be described with reference to FIG. FIG. 3 is a diagram illustrating an example of a hardware configuration of the electronic blackboard.

本実施形態に係る電子黒板400は、入力装置41と、表示装置42と、外部I/F43と、通信I/F44と、ROM45(Read Only Memory)とを有する。また、本実施形態に係る電子黒板400は、RAM(Random Access Memory)46と、CPU(Central Processing Unit)47と、HDD(Hard Disk Drive)48と、集音装置49とを有する。これらの各ハードウェアは、それぞれがバスB1で接続されている。   The electronic blackboard 400 according to the present embodiment includes an input device 41, a display device 42, an external I / F 43, a communication I / F 44, and a ROM 45 (Read Only Memory). The electronic blackboard 400 according to the present embodiment includes a RAM (Random Access Memory) 46, a CPU (Central Processing Unit) 47, an HDD (Hard Disk Drive) 48, and a sound collecting device 49. Each of these hardware is connected by the bus B1.

入力装置41は、タッチパネル等であり、ユーザによる各種操作(例えば、音声テキスト変換(日本語)や音声テキスト変換(英語)等の機能の選択操作)を入力するのに用いられる。表示装置42は、ディスプレイ等であり、各種情報(例えば、音声テキスト変換(日本語)による変換結果を示すテキスト等)を表示する。   The input device 41 is a touch panel or the like, and is used to input various operations by the user (for example, a selection operation of functions such as speech text conversion (Japanese) and speech text conversion (English)). The display device 42 is a display or the like, and displays various types of information (for example, text indicating a conversion result by voice text conversion (Japanese)).

外部I/F43は、外部装置とのインターフェースである。外部装置には、記録媒体43a等がある。これにより、電子黒板400は、外部I/F43を介して、記録媒体43a等の読み取りや書き込みを行うことができる。なお、記録媒体43aには、例えば、USBメモリやCD、DVD、SDメモリカード等がある。   The external I / F 43 is an interface with an external device. The external device includes a recording medium 43a. Accordingly, the electronic blackboard 400 can read and write the recording medium 43a and the like via the external I / F 43. Examples of the recording medium 43a include a USB memory, a CD, a DVD, and an SD memory card.

通信I/F44は、電子黒板400をネットワークN1等に接続するためのインターフェースである。これにより、電子黒板400は、通信I/F44を介して、他の装置(と通信を行うことができる。   The communication I / F 44 is an interface for connecting the electronic blackboard 400 to the network N1 or the like. Thereby, the electronic blackboard 400 can communicate with another device (via the communication I / F 44).

HDD48は、プログラムやデータを格納している不揮発性の記憶装置である。HDD48に格納されるプログラムやデータには、電子黒板400全体を制御する基本ソフトウェアであるOS(Operating System)、OS上において各種機能を提供するアプリケーションプログラム等がある。   The HDD 48 is a non-volatile storage device that stores programs and data. The programs and data stored in the HDD 48 include an OS (Operating System) that is basic software for controlling the entire electronic blackboard 400, and application programs that provide various functions on the OS.

また、HDD48は、格納しているプログラムやデータを所定のファイルシステム及び/又はDB(データベース)により管理している。なお、電子黒板400は、HDD48に代えて、記憶媒体としてフラッシュメモリを用いるドライブ装置(例えばソリッドステートドライブ:SSD)を有していても良い。   The HDD 48 manages stored programs and data by a predetermined file system and / or DB (database). The electronic blackboard 400 may include a drive device (for example, a solid state drive: SSD) that uses a flash memory as a storage medium instead of the HDD 48.

ROM45は、電源を切ってもプログラムやデータを保持することができる不揮発性の半導体メモリである。ROM45には、電子黒板400の起動時に実行されるBIOS(Basic Input/Output System)、OS設定、及びネットワーク設定等のプログラムやデータが格納されている。RAM46は、プログラムやデータを一時保持する揮発性の半導体メモリである。   The ROM 45 is a non-volatile semiconductor memory that can retain programs and data even when the power is turned off. The ROM 45 stores programs and data such as BIOS (Basic Input / Output System), OS settings, and network settings that are executed when the electronic blackboard 400 is activated. The RAM 46 is a volatile semiconductor memory that temporarily stores programs and data.

CPU47は、ROM45やHDD48等の記憶装置からプログラムやデータをRAM46上に読み出し、処理を実行することで、電子黒板400全体の制御や機能を実現する演算装置である。   The CPU 47 is an arithmetic unit that realizes control and functions of the entire electronic blackboard 400 by reading a program and data from a storage device such as the ROM 45 and the HDD 48 onto the RAM 46 and executing processing.

集音装置49は、例えばマイクロフォン(マイク)等であり、電子黒板400の周囲の音を集音する。   The sound collecting device 49 is, for example, a microphone (microphone) or the like, and collects sounds around the electronic blackboard 400.

本実施形態に係る電子黒板400は、図3に示すハードウェア構成を有することにより、後述するような各種処理を実現できる。   The electronic blackboard 400 according to the present embodiment can implement various processes as described below by having the hardware configuration shown in FIG.

次に、図4を参照して本実施形態の端末装置500のハードウェア構成について説明する。図4は、端末装置のハードウェア構成の一例を示す図である。   Next, the hardware configuration of the terminal device 500 of this embodiment will be described with reference to FIG. FIG. 4 is a diagram illustrating an example of a hardware configuration of the terminal device.

本実施形態の端末装置500は、一般の情報処理装置であり、それぞれバスB2で相互に接続されている入力装置51、出力装置52、ドライブ装置53、補助記憶装置54、メモリ装置55、演算処理装置56、インターフェース装置57及び集音装置58を有する。   The terminal device 500 according to the present embodiment is a general information processing device, and is an input device 51, an output device 52, a drive device 53, an auxiliary storage device 54, a memory device 55, and arithmetic processing, which are connected to each other via a bus B2. A device 56, an interface device 57, and a sound collecting device 58 are included.

入力装置51は、例えばマウスやキーボードであり、各種の情報を入力するために用いられる。出力装置52は、例えばディスプレイ等であり、各種信号の表示(出力)に用いられる。インターフェース装置57は、モデム,LANカード等を含み、ネットワークに接続する為に用いられる。   The input device 51 is a mouse or a keyboard, for example, and is used for inputting various information. The output device 52 is, for example, a display and is used for displaying (outputting) various signals. The interface device 57 includes a modem, a LAN card, and the like, and is used for connecting to a network.

集音装置58は、例えばマイクロフォン(マイク)等であり、端末装置500の周囲の音を集音する。   The sound collecting device 58 is, for example, a microphone (microphone) or the like, and collects sounds around the terminal device 500.

情報処理プログラムは、端末装置500を制御する各種プログラムの少なくとも一部である。情報処理プログラムは例えば記録媒体59の配布やネットワークからのダウンロードなどによって提供される。情報処理プログラムを記録した記録媒体59は、CD−ROM、フレキシブルディスク、光磁気ディスク等の様に情報を光学的,電気的或いは磁気的に記録する記録媒体、ROM、フラッシュメモリ等の様に情報を電気的に記録する半導体メモリ等、様々なタイプの記録媒体を用いることができる。   The information processing program is at least a part of various programs that control the terminal device 500. The information processing program is provided, for example, by distributing the recording medium 59 or downloading from a network. The recording medium 59 on which the information processing program is recorded is a recording medium such as a CD-ROM, a flexible disk, a magneto-optical disk, etc., which records information optically, electrically or magnetically, a ROM, a flash memory, etc. Various types of recording media, such as a semiconductor memory that electrically records data, can be used.

また、情報処理プログラムを記録した記録媒体59がドライブ装置53にセットされると、情報処理プログラムは記録媒体59からドライブ装置53を介して補助記憶装置54にインストールされる。ネットワークからダウンロードされた通信プログラムは、インターフェース装置57を介して補助記憶装置54にインストールされる。   When the recording medium 59 on which the information processing program is recorded is set in the drive device 53, the information processing program is installed from the recording medium 59 to the auxiliary storage device 54 via the drive device 53. The communication program downloaded from the network is installed in the auxiliary storage device 54 via the interface device 57.

補助記憶装置54は、インストールされた情報処理プログラムを格納すると共に、必要なファイル、データ等を格納する。メモリ装置55は、コンピュータの起動時に補助記憶装置54から言語処理プログラムを読み出して格納する。   The auxiliary storage device 54 stores the installed information processing program and stores necessary files, data, and the like. The memory device 55 reads and stores the language processing program from the auxiliary storage device 54 when the computer is activated.

そして、演算処理装置56はメモリ装置55に格納された各プログラムに従って、後述するような各種処理を実現している。   The arithmetic processing unit 56 implements various processes as will be described later in accordance with each program stored in the memory device 55.

次に、図5を参照して、言語処理システム100の有する各装置の機能について説明する。図5は、第一の実施形態の言語処理システムの有する各装置の機能を説明する図である。はじめに、会議支援サーバ200の機能について説明する。   Next, with reference to FIG. 5, the function of each device included in the language processing system 100 will be described. FIG. 5 is a diagram for explaining the functions of the devices included in the language processing system according to the first embodiment. First, the function of the conference support server 200 will be described.

本実施形態の会議支援サーバ200は、会議管理情報データベース210、会議情報データベース220、会議登録部230、会議管理部240、会議情報収集部250、変換要求部260を有する。   The conference support server 200 of this embodiment includes a conference management information database 210, a conference information database 220, a conference registration unit 230, a conference management unit 240, a conference information collection unit 250, and a conversion request unit 260.

会議管理情報データベース210は、ユーザにより開催される会議を管理するための会議管理情報が格納される。会議情報データベース220は、団体毎の会議情報が格納される。各データベースの詳細は後述する。   The conference management information database 210 stores conference management information for managing conferences held by users. The conference information database 220 stores conference information for each group. Details of each database will be described later.

会議登録部230は、開催される会議に応じた新規登録の要求をユーザから受け付けると、新たに会議IDを発行し、その会議を管理する会議管理情報を、会議管理情報データベース210へ登録する。   When the conference registration unit 230 receives a request for new registration corresponding to the conference to be held from the user, the conference registration unit 230 issues a new conference ID and registers conference management information for managing the conference in the conference management information database 210.

会議管理部240は、開催される会議及び開催される会議を管理する。具体的には、会議管理部240は、例えば会議管理情報データベース210に会議管理情報が格納されている会議の開催要求に合わせて、会議情報収集部250に会議情報の収集を開始させたりする。   The meeting management unit 240 manages a meeting to be held and a meeting to be held. Specifically, the conference management unit 240 causes the conference information collection unit 250 to start collecting conference information in accordance with, for example, a conference holding request whose conference management information is stored in the conference management information database 210.

会議情報収集部250は、会議に参加する装置(電子黒板400や端末装置500など)により入力された会議情報を収集する。会議情報の収集の詳細は後述する。   The conference information collection unit 250 collects conference information input by devices that participate in the conference (such as the electronic blackboard 400 and the terminal device 500). Details of the collection of conference information will be described later.

変換要求部260は、言語処理装置300に対して、会議情報に含まれる音声データのテキストデータへの変換要求を行う。   The conversion request unit 260 requests the language processing device 300 to convert voice data included in the conference information into text data.

本実施形態の変換要求部260は、例えば電子黒板400や端末装置500から、会議支援サーバ200に対して、音声データの変換要求を受け付けたとき、変換要求を行った装置の端末IDと対応付けられた音声データと、変換要求とを言語処理装置300へ送信しても良い。   When the conversion request unit 260 of the present embodiment receives a voice data conversion request from the electronic blackboard 400 or the terminal device 500 to the conference support server 200, for example, the conversion request unit 260 is associated with the terminal ID of the device that has made the conversion request. The received voice data and the conversion request may be transmitted to the language processing device 300.

また、本実施形態の変換要求部260は、例えば会議情報収集部250が会議情報として音声データを取得すると、取得した音声データ及び取得元の装置を識別する端末IDを変換要求と共に言語処理装置300へ送信しても良い。   In addition, for example, when the conference information collection unit 250 acquires audio data as conference information, the conversion request unit 260 of the present embodiment converts the acquired audio data and a terminal ID that identifies the acquisition source device together with the conversion request into the language processing device 300. You may send to.

次に、言語処理装置300について説明する。   Next, the language processing apparatus 300 will be described.

本実施形態の言語処理装置300は、端末情報データベース310、企業A用辞書データベース320、企業B用辞書データベース330、企業C用辞書データベース340、音声変換部350を有する。   The language processing apparatus 300 according to the present embodiment includes a terminal information database 310, a company A dictionary database 320, a company B dictionary database 330, a company C dictionary database 340, and a voice conversion unit 350.

本実施形態の端末情報データベース310は、A社端末リスト311、B社端末リスト312、C社端末リスト313を有する。   The terminal information database 310 of this embodiment includes an A company terminal list 311, a B company terminal list 312, and a C company terminal list 313.

これらの各端末リストは、団体を識別する団体識別情報と、端末IDとを対応付けている。言い換えれば、本実施形態の各端末リストは、ある団体について、その団体に所属する利用者により利用される端末装置500のリストである。ある端末IDで識別される端末装置500は、その端末IDに対応づく団体識別情報の団体に所属する利用者によって利用されるような利用形態を想定している。例えば、企業が従業員に端末装置500を支給し、従業員が支給された端末装置500を利用して業務を行う場合に、企業が支給する端末装置500の端末IDをその企業の端末リストに登録する。つまり、端末装置500の端末IDは、その端末装置500を利用して会議に参加する利用者が所属する団体を特定するためのユーザ情報とも言える。従って、端末装置500を使用しながら会議に参加する利用者の所属する団体を特定する情報として、当該端末装置500が入力できる情報であれば、端末ID以外の情報を用いても構わない。例えば、言語処理装置において端末IDに代えてユーザを識別するユーザIDが登録されても構わない。   Each of these terminal lists associates group identification information for identifying a group with a terminal ID. In other words, each terminal list of the present embodiment is a list of terminal devices 500 that are used by a user who belongs to a group for a certain group. The terminal device 500 identified by a certain terminal ID is assumed to be used by a user who belongs to a group of group identification information corresponding to the terminal ID. For example, when a company provides a terminal device 500 to an employee and uses the terminal device 500 provided by the employee to perform a business, the terminal ID of the terminal device 500 provided by the company is included in the terminal list of the company. sign up. That is, it can be said that the terminal ID of the terminal device 500 is user information for specifying the organization to which the user who participates in the conference using the terminal device 500 belongs. Therefore, information other than the terminal ID may be used as information that can be input by the terminal device 500 as information that identifies the organization to which the user who participates in the conference belongs while using the terminal device 500. For example, a user ID for identifying the user may be registered instead of the terminal ID in the language processing apparatus.

さらに、本実施形態の各端末リストは、端末IDに対して、団体名以外にも、端末IDで識別される端末装置500の利用者の名称や所属部署等が対応付けられていても良い。各端末リストの詳細は後述する。   Furthermore, in each terminal list of the present embodiment, in addition to the organization name, the name of the user of the terminal device 500 identified by the terminal ID, the department to which the terminal list is associated, and the like may be associated with the terminal ID. Details of each terminal list will be described later.

本実施形態の言語処理装置300は、例えば人工知能を有している。本実施形態の音声変換部350は、各辞書データベースを参照し、音声データをテキスト(文字)データへ変換(翻訳)する。本実施形態の音声変換部350は、音声データからテキストデータへの変換を行う度に、入力と出力の関係を学習し、変換の精度を高めて行く機能を有しているものとした。   The language processing apparatus 300 of this embodiment has, for example, artificial intelligence. The voice conversion unit 350 of the present embodiment refers to each dictionary database and converts (translates) the voice data into text (character) data. The speech conversion unit 350 of this embodiment has a function of learning the relationship between input and output each time conversion from speech data to text data and increasing the accuracy of the conversion.

本実施形態の音声変換部350の処理の詳細は後述する。   Details of the processing of the voice conversion unit 350 of this embodiment will be described later.

次に、本実施形態の電子黒板400と端末装置500について説明する。本実施形態の電子黒板400は、会議支援処理部410、表示制御部420、制御部430、操作制御部440、音声データ取得部450を有する。   Next, the electronic blackboard 400 and the terminal device 500 of this embodiment will be described. The electronic blackboard 400 according to the present embodiment includes a conference support processing unit 410, a display control unit 420, a control unit 430, an operation control unit 440, and an audio data acquisition unit 450.

会議支援処理部410は、会議を支援するための各種の処理を行う。具体的には、例えば、会議支援サーバ200にアクセスし、会議管理情報DBに登録されている会議リストを取得し、取得した会議リストからいずれの会議に参加するかをユーザに指定させるための入力画面を表示制御部420に表示させる。また、会議支援処理部410は、電子黒板400の画面に対して手入力された内容の画像データを会議支援サーバ200へ送信したりする。   The conference support processing unit 410 performs various processes for supporting the conference. Specifically, for example, an input for accessing the conference support server 200, acquiring a conference list registered in the conference management information DB, and allowing the user to specify which conference to participate in from the acquired conference list. The screen is displayed on the display control unit 420. In addition, the conference support processing unit 410 transmits image data having contents manually input to the screen of the electronic blackboard 400 to the conference support server 200.

表示制御部420は、電子黒板400における画面表示を制御する。制御部430は、電子黒板400の全体的な動作を制御する。操作制御部440は、電子黒板400の有する操作部材に対する操作を受け付ける。音声データ取得部450は、電子黒板400に備え付けられた集音装置49が収集する音声データを取得し、保持する。   The display control unit 420 controls screen display on the electronic blackboard 400. The control unit 430 controls the overall operation of the electronic blackboard 400. The operation control unit 440 receives an operation on an operation member included in the electronic blackboard 400. The voice data acquisition unit 450 acquires and holds voice data collected by the sound collecting device 49 provided in the electronic blackboard 400.

本実施形態の端末装置500は、表示制御部510と、操作制御部520、音声データ取得部530とを有する。表示制御部510は、端末装置500の表示部における表示を制御する。操作制御部520は、端末装置500に対して行われた操作と対応する処理を行う。音声データ取得部530は、端末装置500が有する集音装置58が収集した音声データを取得し、保持する。   The terminal device 500 of this embodiment includes a display control unit 510, an operation control unit 520, and an audio data acquisition unit 530. The display control unit 510 controls display on the display unit of the terminal device 500. The operation control unit 520 performs processing corresponding to the operation performed on the terminal device 500. The audio data acquisition unit 530 acquires and holds the audio data collected by the sound collection device 58 included in the terminal device 500.

次に、本実施形態の会議支援サーバ200と、言語処理装置300と、が有する各データベースについて説明する。   Next, each database included in the conference support server 200 and the language processing apparatus 300 according to the present embodiment will be described.

図6は、第一の実施形態の会議支援サーバの会議管理情報データベースの一例を示す図である。   FIG. 6 is a diagram illustrating an example of a conference management information database of the conference support server according to the first embodiment.

本実施形態の会議管理情報データベース210は、情報の項目として、会議IDを入力する項目と、その会議IDの会議に参加した電子黒板400や端末装置500の端末IDを入力する項目とを有し、これらは対応付けられている。以下の説明では、会議管理情報データベース210において、項目「会議ID」の値と、項目「端末ID」の値とを含む情報を、会議管理情報と呼ぶ。   The conference management information database 210 of this embodiment has, as information items, an item for inputting a conference ID, and an item for inputting the terminal ID of the electronic blackboard 400 or the terminal device 500 that participated in the conference with the conference ID. These are associated with each other. In the following description, information including the value of the item “conference ID” and the value of the item “terminal ID” in the conference management information database 210 will be referred to as conference management information.

項目「会議ID」の値は、ユーザからの登録要求に応じて登録された会議を識別するための識別子を示す。項目「会議ID」の値は、例えば会議の進行役となる参加者の端末装置500により、会議が開催されるより前に入力されて良い。   The value of the item “conference ID” indicates an identifier for identifying a conference registered in response to a registration request from the user. The value of the item “conference ID” may be input before the conference is held by the terminal device 500 of the participant who becomes the facilitator of the conference, for example.

項目「端末ID」の値は、項目「会議ID」の値により特定される会議に参加している参加者が利用している端末装置500の端末IDを示す。端末IDは、端末装置500からインターネット等を利用して会議支援サーバ200にアクセスし、登録された会議のうち未だ開催されていない会議の会議リストから、ユーザが参加する会議を選択して参加を指示する操作をすることで会議支援サーバ200により登録される。より詳細には、ユーザによる参加の指示操作に応じて端末装置500が端末IDと共に会議の参加要求を会議支援サーバ200に送信し、会議支援サーバ200の会議登録部230が、会議管理情報データベース210に、選択された会議の会議IDに対応付けて参加要求と共に送信された端末IDを登録する。   The value of the item “terminal ID” indicates the terminal ID of the terminal device 500 used by the participant who is participating in the conference specified by the value of the item “conference ID”. The terminal ID accesses the conference support server 200 using the Internet or the like from the terminal device 500, selects a conference in which the user participates from a conference list of conferences that have not been held among registered conferences, and participates in the conference. It is registered by the conference support server 200 by performing an instruction operation. More specifically, the terminal device 500 transmits a conference participation request together with the terminal ID to the conference support server 200 in response to an instruction operation for participation by the user, and the conference registration unit 230 of the conference support server 200 performs the conference management information database 210. The terminal ID transmitted together with the participation request is registered in association with the conference ID of the selected conference.

図6の例では、会議ID「001」の会議には、端末ID「A01」、「A02」、「A03」、「A04」の端末装置500の利用者が参加していることがわかる。つまり、本実施形態では、端末IDは、端末装置500を使用しながら会議に参加している利用者を特定する情報となる。   In the example of FIG. 6, it can be seen that the user of the terminal device 500 with the terminal IDs “A01”, “A02”, “A03”, and “A04” participates in the conference with the conference ID “001”. That is, in the present embodiment, the terminal ID is information that identifies the user who is participating in the conference while using the terminal device 500.

図7は、第一の実施形態の会議情報データベースの一例を示す図である。本実施形態の会議情報データベース220は、情報の項目として、会議ID、端末ID、音声データ、描画データ、テキストデータ、日時を含み、項目「会議ID」と、その他の項目とが対応付けられている。以下の説明では、会議情報データベースにおいて、項目「会議ID」の値と、その他の項目の値とを含む情報を会議情報と呼ぶ。   FIG. 7 is a diagram illustrating an example of the conference information database according to the first embodiment. The conference information database 220 of this embodiment includes a conference ID, terminal ID, audio data, drawing data, text data, and date / time as information items, and the item “conference ID” is associated with other items. Yes. In the following description, in the conference information database, information including the value of the item “conference ID” and the values of other items is referred to as conference information.

項目「音声データ」の値は、項目「端末ID」の値が特定する端末装置500の集音装置58等により取得された音声データを示す。項目「描画データ」の値は、例えば、ユーザの入力操作に応じて操作制御部440が表示画面に対し描画処理を行ったタイミングで電子黒板400から送信された、電子黒板400に描画された内容を記憶した画像データを示す。なお、描画データ(画像データ)は、項目「音声データ」の値である音声データが取得したタイミングにおいて記憶してもよい。   The value of the item “voice data” indicates the voice data acquired by the sound collection device 58 of the terminal device 500 specified by the value of the item “terminal ID”. The value of the item “drawing data” is, for example, the content drawn on the electronic blackboard 400 transmitted from the electronic blackboard 400 at the timing when the operation control unit 440 performs the drawing process on the display screen in accordance with the input operation of the user. The image data which memorize | stored is shown. Note that the drawing data (image data) may be stored at the timing when the audio data which is the value of the item “audio data” is acquired.

項目「テキストデータ」の値は、項目「音声データ」の値である音声データと対応するテキストデータである。項目「テキストデータ」の値は、音声データを言語処理装置300に送信し、変換結果として言語処理装置300から受信したテキストデータを示す。   The value of the item “text data” is text data corresponding to the voice data that is the value of the item “voice data”. The value of the item “text data” indicates the text data transmitted from the language processing device 300 as a conversion result by transmitting voice data to the language processing device 300.

項目「日時」の値は、項目「音声データ」の値である音声データを取得した日付と時刻を示す。具体的には、項目「日時」の値は、端末装置500から音声データを受信した日付と時刻を示しても良い。   The value of the item “date and time” indicates the date and time when the audio data that is the value of the item “audio data” is acquired. Specifically, the value of the item “date and time” may indicate the date and time when the audio data is received from the terminal device 500.

尚、図7の例では、会議情報に、音声データの変換結果であるテキストデータが含まれるものとしたが、これに限定されない。会議情報には、テキストデータは含まれなくても良い。その場合、音声データの変換結果であるテキストデータは、会議情報データベース220以外の記憶領域に格納されていても良い。   In the example of FIG. 7, it is assumed that the conference information includes text data that is a result of converting the audio data, but the present invention is not limited to this. The meeting information may not include text data. In that case, the text data that is the conversion result of the voice data may be stored in a storage area other than the conference information database 220.

図7の例では、会議ID「001」の会議において、2016/9/20の16:50に、端末ID「A01」の端末装置500から、音声データ「A01.mpg」を受信し、電子黒板400から画面データA01.jpgを受信したことがわかる。   In the example of FIG. 7, in the meeting with the meeting ID “001”, the audio data “A01.mpg” is received from the terminal device 500 with the terminal ID “A01” at 16:50 on 2016/9/20, and the electronic blackboard 400 to screen data A01. It can be seen that jpg has been received.

この会議情報によれば、会議ID「001」の会議において、2016/9/20の16:50に、端末ID「A01」の端末装置500の利用者が発言した内容と、そのとき電子黒板400に描画されていた画像と、がわかる。   According to this conference information, in the conference with the conference ID “001”, the content of the user of the terminal device 500 with the terminal ID “A01” at 16:50 on 2016/9/20 and the electronic blackboard 400 at that time You can see the image that was drawn on.

次に、図8を参照して、本実施形態の言語処理装置300の有する端末情報データベース310について説明する。   Next, the terminal information database 310 included in the language processing apparatus 300 according to the present embodiment will be described with reference to FIG.

図8は、第一の実施形態の端末情報データベースの一例を示す図である。   FIG. 8 is a diagram illustrating an example of the terminal information database according to the first embodiment.

本実施形態の端末情報データベース310は、団体毎、つまり、各団体識別情報に端末IDが対応付けられた端末IDリストを有する。   The terminal information database 310 of this embodiment has a terminal ID list in which a terminal ID is associated with each group, that is, each group identification information.

本実施形態では、A社端末リスト311、B社端末リスト312、C社端末リスト313を有する。   In the present embodiment, a company A terminal list 311, a company B terminal list 312, and a company C terminal list 313 are provided.

A社端末リスト311は、団体名「A」と、企業Aに所属する利用者が利用している端末装置500の端末IDとが対応付けられている。B社端末リスト312は、団体名「B」と、企業Bに所属する利用者が利用している端末装置500の端末IDとが対応付けられている。C社端末リスト313は、団体名「C」と、企業Cに所属する利用者が利用している端末装置500の端末IDとが対応付けられている。   In the company A terminal list 311, the organization name “A” is associated with the terminal ID of the terminal device 500 used by the user belonging to the company A. In the B company terminal list 312, the organization name “B” is associated with the terminal ID of the terminal device 500 used by the user belonging to the company B. In the company C terminal list 313, the organization name “C” is associated with the terminal ID of the terminal device 500 used by the user belonging to the company C.

本実施形態の端末情報データベース310の有する各端末リストは、予め言語処理システム100の管理者が言語処理装置300に格納しておいても良い。   Each terminal list included in the terminal information database 310 of this embodiment may be stored in the language processing apparatus 300 by the administrator of the language processing system 100 in advance.

また、本実施形態では、例えば、各端末装置500の利用者が会議に参加する際に、利用者のユーザ情報として、利用者が所属する団体名を端末装置500に対して入力しても良い。この場合、端末装置500は、入力された団体名と、自機の端末IDとを会議支援サーバ200へ送信しても良い。会議支援サーバ200は、この団体名と端末IDとを対応付けて言語処理装置300へ送信し、言語処理装置300は、団体名に対応付いた端末リストに受信した端末IDを追加するようにしても良い。   In the present embodiment, for example, when the user of each terminal device 500 participates in the conference, the name of the organization to which the user belongs may be input to the terminal device 500 as the user information of the user. . In this case, the terminal device 500 may transmit the input organization name and its own terminal ID to the conference support server 200. The meeting support server 200 associates the group name with the terminal ID and transmits the association name and the terminal ID to the language processing device 300, and the language processing device 300 adds the received terminal ID to the terminal list associated with the group name. Also good.

次に、本実施形態の各辞書データベースについて説明する。以下では、各辞書データベースの一例として、企業A用辞書データベース320について説明する。   Next, each dictionary database of this embodiment will be described. Hereinafter, the company A dictionary database 320 will be described as an example of each dictionary database.

図9は、第一の実施形態の企業A用辞書データベースの一例を示す図である。   FIG. 9 is a diagram illustrating an example of the company A dictionary database according to the first embodiment.

図9に示す企業A用辞書データベース320では、企業A内の略語の音声と、文字列とが対応付けられている。   In the company A dictionary database 320 shown in FIG. 9, the abbreviation sound in the company A is associated with a character string.

図9の例では、例えば企業A内において、「いほ」という単語は、「意見書と補正書」であることがわかる。また、図9の例では、例えば企業A内において、「きょり」という単語は、「拒絶理由通知書」であることがわかる。これにより、音声データをテキストデータに変換したときに「いほ」という単語が得られた場合には、この「いほ」を「意見書と補正書」と訳したテキストデータに書き換えることができる。   In the example of FIG. 9, for example, in the company A, it can be seen that the word “Iho” is “an opinion document and a correction document”. In the example of FIG. 9, for example, in the company A, it can be seen that the word “Kyori” is “notification of reason for rejection”. As a result, when the word “Iho” is obtained when the voice data is converted to text data, this “Iho” can be rewritten into text data translated as “an opinion and amendment”. .

なお、辞書データベース320に登録される情報は、上記のような略語と訳語の対応関係を示す情報だけに限らない。例えば、その団体で頻繁に使用され得る単語が企業用語(社内用語)として登録される。例えば、社名である「リコー」を「利口」と訳されることを避けるため、リコーという社名の企業であれば、「リコー」という単語を登録しておくことで、翻訳の精度を上げることができる。   The information registered in the dictionary database 320 is not limited to information indicating the correspondence between abbreviations and translated words as described above. For example, words that can be frequently used in the organization are registered as company terms (in-house terms). For example, in order to avoid the company name “Ricoh” being translated as “smart”, if the company name is Ricoh, registering the word “Ricoh” can improve translation accuracy. it can.

本実施形態において、企業B用辞書データベース330や企業C用辞書データベース340も、図9に示した企業A用辞書データベース320と同様の観点で形成されている。   In this embodiment, the company B dictionary database 330 and the company C dictionary database 340 are also formed from the same viewpoint as the company A dictionary database 320 shown in FIG.

次に、図10を参照して本実施形態の会議支援サーバ200の会議情報収集部250による会議情報の収集について説明する。図10は、会議情報の収集の仕方を説明する図である。   Next, the collection of conference information by the conference information collection unit 250 of the conference support server 200 of this embodiment will be described with reference to FIG. FIG. 10 is a diagram for explaining how to collect conference information.

図10では、参加者A、B、C、D、Xが会議に参加しており、参加者Aは端末ID「A01」の端末装置500A−1を利用し、参加者Bは端末ID「A02」の端末装置500A−2を利用し、参加者Cは端末ID「B01」の端末装置500B−1を利用し、参加者Dは端末ID「B02」の端末装置500B−2を利用している。また、図10の例では、参加者Xが会議の進行役を担っており、電子黒板400を利用している。   In FIG. 10, participants A, B, C, D, and X are participating in the conference. Participant A uses terminal device 500A-1 with terminal ID “A01”, and participant B uses terminal ID “A02”. ", The participant C uses the terminal device 500B-1 with the terminal ID" B01 ", and the participant D uses the terminal device 500B-2 with the terminal ID" B02 ". . Further, in the example of FIG. 10, the participant X plays the facilitator of the conference and uses the electronic blackboard 400.

ここで、本実施形態では、会議を開始する際に、各参加者は、各参加者が利用する装置において、自身がこれから参加する予定の会議の会議IDと、自身の所属する団体名を含むユーザ情報を入力しても良い。   Here, in this embodiment, when starting a conference, each participant includes the conference ID of the conference that he / she intends to participate in and the name of the organization to which he / she belongs in the apparatus used by each participant. User information may be input.

また、本実施形態では、各参加者が利用する装置の端末IDが、各参加者のユーザIDと同義の情報として扱われていても良い。この場合には、各参加者は、会議に参加する前に、各参加者が利用する装置において、参加する予定の会議の会議IDと、所属する団体名と、自身の利用する装置の端末IDとを入力しても良い。このとき、団体名と端末IDは、装置の利用者のユーザ情報として入力されても良い。   In the present embodiment, the terminal ID of the device used by each participant may be handled as information having the same meaning as the user ID of each participant. In this case, before each participant participates in the conference, the conference ID of the conference to be joined, the name of the organization to which he / she belongs, and the terminal ID of the device used by the participant are used. May be entered. At this time, the organization name and the terminal ID may be input as user information of the user of the device.

各参加者が利用する装置は、入力された会議ID、団体名等を会議支援サーバ200へ送信する。会議支援サーバ200は、各装置から送信された情報に基づき、会議IDと、各参加者が利用する装置の端末IDとを対応付けた会議管理情報を生成し、会議管理情報データベース210に格納する。   The device used by each participant transmits the input conference ID, group name, etc. to the conference support server 200. The conference support server 200 generates conference management information in which the conference ID is associated with the terminal ID of the device used by each participant based on the information transmitted from each device, and stores the conference management information in the conference management information database 210. .

本実施形態では、この手順により、会議支援サーバ200において、各参加者の音声データ等を含む会議情報を収集する準備が完了したことになる。   In this embodiment, this procedure completes preparation for collecting conference information including audio data of each participant in the conference support server 200.

本実施形態では、音声データは、会議の各参加者が利用している端末装置500の端末IDと対応付けられて会議支援サーバ200に送信される。   In the present embodiment, the audio data is transmitted to the conference support server 200 in association with the terminal ID of the terminal device 500 used by each participant in the conference.

例えば、端末装置500A−1を利用している参加者Aの発話は、端末装置500A−1の集音装置58によって音声データとして収集され、端末装置500A−1の端末IDと対応付けられて会議支援サーバ200に送信される。   For example, the speech of the participant A who uses the terminal device 500A-1 is collected as voice data by the sound collecting device 58 of the terminal device 500A-1, and is associated with the terminal ID of the terminal device 500A-1. It is transmitted to the support server 200.

また、例えば、端末装置500B−1を利用している参加者Cの発話は、端末装置500B−1の集音装置58によって音声データとして収集され、端末装置500B−1の端末IDと対応付けられて会議支援サーバ200に送信される。言い換えれば、端末装置500B−1の集音装置58によって収集された音声データは、端末装置500B−1の利用者のユーザ情報と対応付けられて会議支援サーバ200へ送信される。   Further, for example, the speech of the participant C who uses the terminal device 500B-1 is collected as voice data by the sound collecting device 58 of the terminal device 500B-1, and is associated with the terminal ID of the terminal device 500B-1. To the conference support server 200. In other words, the audio data collected by the sound collection device 58 of the terminal device 500B-1 is transmitted to the conference support server 200 in association with the user information of the user of the terminal device 500B-1.

また、本実施形態では、会議の進行役を担っている参加者が電子黒板400の利用者となる。図10の例では、電子黒板400の端末IDは、「05」であり、電子黒板400の利用者は、ユーザXである。よって、ユーザXの発話は、電子黒板400の集音装置49によって、音声データとして収集され、端末ID「05」と対応付けられて会議支援サーバ200へ送信される。言い換えれば、電子黒板400の集音装置49によって収集された音声データは、電子黒板400の利用者のユーザ情報と対応付けられて会議支援サーバ200へ送信される。   In the present embodiment, the participant who plays the facilitator of the conference becomes the user of the electronic blackboard 400. In the example of FIG. 10, the terminal ID of the electronic blackboard 400 is “05”, and the user of the electronic blackboard 400 is the user X. Therefore, the utterances of the user X are collected as voice data by the sound collecting device 49 of the electronic blackboard 400 and transmitted to the conference support server 200 in association with the terminal ID “05”. In other words, the audio data collected by the sound collecting device 49 of the electronic blackboard 400 is transmitted to the conference support server 200 in association with the user information of the user of the electronic blackboard 400.

また、電子黒板400では、電子黒板400の有するユーザX等によってディスプレイに手書き入力された文字や画像を、描画データとして記憶し、電子黒板400の端末IDと対応付けて会議支援サーバ200へ送信する。   In the electronic blackboard 400, characters and images handwritten on the display by the user X or the like of the electronic blackboard 400 are stored as drawing data and transmitted to the conference support server 200 in association with the terminal ID of the electronic blackboard 400. .

会議支援サーバ200では、端末装置500や電子黒板400から送信される音声データや、電子黒板400から送信される描画データに、各データと対応付いた端末IDと子も付いた会議IDを付与し、会議情報として会議情報データベース220へ格納する。   The conference support server 200 assigns a conference ID with a terminal ID and a child associated with each data to voice data transmitted from the terminal device 500 and the electronic blackboard 400 and drawing data transmitted from the electronic blackboard 400. Then, it is stored in the conference information database 220 as conference information.

本実施形態では、以上のようにして、会議情報を収集する。   In the present embodiment, meeting information is collected as described above.

次に、図11を参照して本実施形態の言語処理装置300の音声変換部350の機能について説明する。図11は、第一の実施形態の音声変換部の機能を説明する図である。   Next, the function of the voice conversion unit 350 of the language processing apparatus 300 according to the present embodiment will be described with reference to FIG. FIG. 11 is a diagram illustrating the function of the voice conversion unit according to the first embodiment.

本実施形態の音声変換部350は、要求受付部351、音声データ取得部352、辞書特定部353、変換処理部354、出力部355を有する。   The voice conversion unit 350 of the present embodiment includes a request reception unit 351, a voice data acquisition unit 352, a dictionary specification unit 353, a conversion processing unit 354, and an output unit 355.

要求受付部351は、会議支援サーバ200から、音声データの変換要求を受け付ける。このとき、要求受付部351は、変換要求と共に、変換対象の音声データと端末ID及び会議IDを会議支援サーバ200から取得する。   The request receiving unit 351 receives a voice data conversion request from the conference support server 200. At this time, the request reception unit 351 acquires the conversion target voice data, the terminal ID, and the conference ID from the conference support server 200 together with the conversion request.

音声データ取得部352は、変換要求を受け付けると、変換対象となる音声データと、音声データと対応付けられた端末ID及び会議IDとを取得する。   When receiving the conversion request, the audio data acquisition unit 352 acquires the audio data to be converted and the terminal ID and conference ID associated with the audio data.

辞書特定部353は、音声データ取得部352により、音声データと共に取得された端末IDに基づき、参照する辞書データベースを特定する。具体的には、辞書特定部353は、端末情報データベース310を参照し、取得する端末IDが含まれる端末リストを特定する。そして、辞書特定部353は、特定した端末リストにより示される団体名から、参照する辞書データベースを特定する。   The dictionary specifying unit 353 specifies a dictionary database to be referred to based on the terminal ID acquired together with the sound data by the sound data acquiring unit 352. Specifically, the dictionary specifying unit 353 refers to the terminal information database 310 and specifies a terminal list including the terminal ID to be acquired. And the dictionary specific | specification part 353 specifies the dictionary database to refer from the group name shown by the specified terminal list.

変換処理部354は、辞書特定部353により特定された辞書データベースを参照して、音声データ取得部352が取得した音声データをテキストデータへ変換する。音声データをテキストデータに変換する処理は、公知の技術により行うことができる。   The conversion processing unit 354 refers to the dictionary database specified by the dictionary specifying unit 353 and converts the voice data acquired by the voice data acquiring unit 352 into text data. The process of converting voice data into text data can be performed by a known technique.

出力部355は、変換処理部354による変換の結果であるテキストデータを、会議支援サーバ200へ送信する。このとき出力部355は、テキストデータと共に、端末ID及び会議IDを会議支援サーバ200へ送信するものとした。   The output unit 355 transmits text data that is a result of the conversion by the conversion processing unit 354 to the conference support server 200. At this time, the output unit 355 transmits the terminal ID and the conference ID together with the text data to the conference support server 200.

尚、会議支援サーバ200は、言語処理装置300から変換結果のテキストデータを受信すると、受信したテキストデータと対応付けられた会議IDと端末IDから、テキストデータと対応付けられる会議情報を特定する。そして、会議支援サーバ200は、受信したテキストデータを会議情報データベース220へ格納する。   When the conference support server 200 receives the text data of the conversion result from the language processing device 300, the conference support server 200 specifies conference information associated with the text data from the conference ID and terminal ID associated with the received text data. Then, the conference support server 200 stores the received text data in the conference information database 220.

以下に、図12を参照して、本実施形態の言語処理装置300の処理について説明する。図12は、第一の実施形態の言語処理装置の動作を説明するフローチャートである。   Hereinafter, the processing of the language processing apparatus 300 according to the present embodiment will be described with reference to FIG. FIG. 12 is a flowchart for explaining the operation of the language processing apparatus according to the first embodiment.

図12では、例えば、会議ID「001」の会議において、端末ID「A01」の端末装置500A−1から取得した音声データ「A01.mpeg」の変換要求が行われたものとして説明する。   In FIG. 12, for example, it is assumed that a conversion request for the audio data “A01.mpeg” acquired from the terminal device 500A-1 with the terminal ID “A01” is made in the conference with the conference ID “001”.

本実施形態の音声変換部350は、要求受付部351により、変換要求を受け付けたか否かを判定する(ステップS1201)。ステップS1201において、変換要求を受け付けない場合、音声変換部350は、要求を受け付けるので待機する。   The voice conversion unit 350 according to the present embodiment determines whether or not the conversion request has been received by the request reception unit 351 (step S1201). In step S1201, when the conversion request is not accepted, the voice conversion unit 350 waits because the request is accepted.

ステップS1201において、変換要求を受け付けた場合、音声変換部350は、音声データ取得部352により、変換対象の音声データと、音声データと対応付いた端末ID「A01」及び会議ID「001」を取得する(ステップS1202)。   In step S1201, when a conversion request is received, the voice conversion unit 350 acquires the voice data to be converted, the terminal ID “A01” and the conference ID “001” associated with the voice data, by the voice data acquisition unit 352. (Step S1202).

続いて、音声変換部350は、辞書特定部353により、端末情報データベース310を参照し、取得した端末ID「A01」を含むA社端末リスト311を特定し、A社端末リスト311と対応する団体名「企業A」と対応する企業A用辞書データベース320を特定する(ステップS1203)。   Subsequently, the voice conversion unit 350 refers to the terminal information database 310 by the dictionary specifying unit 353, specifies the company A terminal list 311 including the acquired terminal ID “A01”, and corresponds to the company A terminal list 311. The company A dictionary database 320 corresponding to the name “company A” is specified (step S1203).

続いて、音声変換部350は、変換処理部354により、企業A用辞書データベース320を参照して、音声データ「A01.mpeg」をテキストデータに変換する。そして、音声変換部350は、出力部355により、テキストデータに、会議ID「001」と端末ID「A01」を付与し、会議支援サーバ200へ出力し(ステップS1204)、処理を終了する。   Subsequently, the voice conversion unit 350 uses the conversion processing unit 354 to refer to the company A dictionary database 320 and convert the voice data “A01.mpeg” into text data. Then, the audio conversion unit 350 assigns the conference ID “001” and the terminal ID “A01” to the text data by the output unit 355, outputs the text data to the conference support server 200 (step S1204), and ends the process.

したがって、本実施形態によれば、端末ID「A01」の端末装置500A−1から取得した音声データ「A01.mpeg」に多く含まれると推定される企業A特有の単語等も、企業A用辞書データベース320を用いることで、適切なテキストデータへ変換される可能性が高くなる。   Therefore, according to the present embodiment, words unique to company A that are presumed to be included in a large amount in the voice data “A01.mpeg” acquired from the terminal device 500A-1 with the terminal ID “A01” are also included in the company A dictionary. By using the database 320, the possibility of conversion to appropriate text data is increased.

したがって、本実施形態によれば、音声データをテキストデータに変換する際の精度を向上させることができる。   Therefore, according to the present embodiment, it is possible to improve the accuracy when converting voice data into text data.

(第二の実施形態)
以下に図面を参照して、第二の実施形態について説明する。第二の実施形態では、音声変換部の処理において、複数の辞書データベースを参照する場合を考慮した点が、第一の実施形態と相違する。よって、以下の第二の実施形態の説明では、第一の実施形態との相違点についてのみ説明し、第一の実施形態と同様の機能構成を有するものには、第一の実施形態の説明で用いた符号と同様の符号を付与し、その説明を省略する。
(Second embodiment)
The second embodiment will be described below with reference to the drawings. The second embodiment is different from the first embodiment in that a case where a plurality of dictionary databases are referred to in the processing of the voice conversion unit is considered. Therefore, in the following description of the second embodiment, only differences from the first embodiment will be described, and those having the same functional configuration as the first embodiment will be described for the first embodiment. The same reference numerals as those used in FIG.

図13は、第二の実施形態の音声変換部の機能を説明する図である。   FIG. 13 is a diagram illustrating the function of the voice conversion unit according to the second embodiment.

本実施形態の音声変換部350Aは、要求受付部351、音声データ取得部352、辞書特定部353A、変換処理部354、出力部355、会議管理情報取得部356、優先順位付与部357を有する。   The voice conversion unit 350A of the present embodiment includes a request reception unit 351, a voice data acquisition unit 352, a dictionary specification unit 353A, a conversion processing unit 354, an output unit 355, a conference management information acquisition unit 356, and a priority order assignment unit 357.

本実施形態の辞書特定部353Aは、変換要求と共に受け付けた会議IDを含む会議管理情報に含まれる端末IDそれぞれについて、対応する辞書データベースを特定する。   The dictionary specifying unit 353A of this embodiment specifies a corresponding dictionary database for each terminal ID included in the conference management information including the conference ID received together with the conversion request.

会議管理情報取得部356は、変換要求と共に受け付けた会議IDを含む会議管理情報を、会議支援サーバ200から取得する。   The conference management information acquisition unit 356 acquires conference management information including the conference ID received together with the conversion request from the conference support server 200.

優先順位付与部357は、辞書特定部353により、複数の辞書データベースが特定された場合に、各辞書データベースに対して優先順位を付与する。   The priority level assigning unit 357 gives a priority level to each dictionary database when a plurality of dictionary databases are specified by the dictionary specifying unit 353.

以下に、図14を参照して、本実施形態の音声変換部350Aの処理について説明する。図14は、第二の実施形態の音声変換部の処理を説明するフローチャートである。   Hereinafter, with reference to FIG. 14, processing of the audio conversion unit 350 </ b> A of the present embodiment will be described. FIG. 14 is a flowchart for explaining processing of the voice conversion unit of the second embodiment.

図14では、例えば、会議ID「002」の会議において、端末ID「B01」の端末装置500B−1から取得した音声データの変換要求が行われたものとして説明する。   In FIG. 14, for example, it is assumed that a conversion request for audio data acquired from the terminal device 500 </ b> B- 1 with the terminal ID “B01” is made in the conference with the meeting ID “002”.

図14のステップS1401とステップS1402の処理は、図12のステップS1201とステップS1202の処理と同様であるから、説明を省略する。   The processing in steps S1401 and S1402 in FIG. 14 is the same as the processing in steps S1201 and S1202 in FIG.

ステップ1202において、音声データと共に端末IDと会議IDとを取得すると、音声変換部350Aは、会議管理情報取得部356により、会議支援サーバ200から、会議ID「002」を含む会議管理情報を取得する(ステップS1403)。   In step 1202, when the terminal ID and the conference ID are acquired together with the audio data, the audio conversion unit 350A acquires the conference management information including the conference ID “002” from the conference support server 200 by the conference management information acquisition unit 356. (Step S1403).

続いて、音声変換部350Aは、辞書特定部353Aにより、参照する辞書データベースを特定する(ステップS1404)。   Subsequently, the voice conversion unit 350A specifies a dictionary database to be referred to by the dictionary specifying unit 353A (step S1404).

ここで、本実施形態の辞書特定部353Aによる辞書データベースの特定について説明する。   Here, the specification of the dictionary database by the dictionary specifying unit 353A of the present embodiment will be described.

本実施形態の辞書特定部353Aは、会議管理情報取得部356が取得した会議管理情報に含まれる端末IDそれぞれについて、対応する団体を特定する。   The dictionary specifying unit 353A of the present embodiment specifies a corresponding group for each terminal ID included in the conference management information acquired by the conference management information acquiring unit 356.

会議ID「002」と対応する会議管理情報に含まれる端末IDは、「A03」、「A04」、「A01」、「B01」である(図6参照)。   The terminal IDs included in the conference management information corresponding to the conference ID “002” are “A03”, “A04”, “A01”, and “B01” (see FIG. 6).

そこで、辞書特定部353Aは、各端末IDについて、それぞれが含まれる端末IDリストを特定する。端末ID「A03」、「A04」、「A01」のそれぞれは、A社端末リスト311に含まれる。また、端末ID「B01」は、B社端末リスト312に含まれる。   Therefore, dictionary specifying unit 353A specifies a terminal ID list including each terminal ID. Each of the terminal IDs “A03”, “A04”, and “A01” is included in the A company terminal list 311. The terminal ID “B01” is included in the B company terminal list 312.

よって、辞書特定部353Aは、A社端末リスト311、B社端末リスト312を特定する。そして、辞書特定部353Aは、A社端末リスト311が示す団体名「企業A」と、B社端末リスト312が示す団体名「企業B」を特定する。   Therefore, the dictionary specifying unit 353A specifies the company A terminal list 311 and the company B terminal list 312. Then, the dictionary specifying unit 353A specifies the organization name “company A” indicated by the company A terminal list 311 and the organization name “company B” indicated by the company B terminal list 312.

次に、辞書特定部353Aは、「企業A」と対応する企業A用辞書データベース320と、「企業B」と対応する企業B用辞書データベース330を特定する。   Next, the dictionary specifying unit 353A specifies the company A dictionary database 320 corresponding to “company A” and the company B dictionary database 330 corresponding to “company B”.

続いて、音声変換部350Aは、優先順位付与部357により、複数の辞書データベースが特定されたか否かを判定する(ステップS1405)。ステップS1405で、特定された辞書データベースが1つであった場合、音声変換部350Aは、後述するステップS1407へ進む。   Subsequently, the voice conversion unit 350A determines whether or not a plurality of dictionary databases have been specified by the priority order assigning unit 357 (step S1405). If there is one identified dictionary database in step S1405, the speech conversion unit 350A proceeds to step S1407 described below.

ステップS1405において、複数の辞書データベースが特定された場合、音声変換部350Aは、複数の辞書データベースに対して優先順位を付与する(ステップS1406)。   If a plurality of dictionary databases are specified in step S1405, the speech conversion unit 350A gives priority to the plurality of dictionary databases (step S1406).

以下に、本実施形態の優先順位付与部357による優先順位の付与について説明する。本実施形態では、会議管理情報に含まれる端末IDのうち、対応する端末IDの数が多い辞書データベースから順に、優先順位を付与する。   Below, the provision of the priority by the priority provision part 357 of this embodiment is demonstrated. In this embodiment, priorities are assigned in order from the dictionary database having the largest number of corresponding terminal IDs among the terminal IDs included in the conference management information.

図14の例では、取得した会議管理情報に含まれる端末IDでは、企業Aと対応する端末IDが3つあり、企業Bと対応する端末IDが1つである。   In the example of FIG. 14, the terminal ID included in the acquired conference management information includes three terminal IDs corresponding to the company A and one terminal ID corresponding to the company B.

よって、優先順位付与部357は、企業Aと対応する企業A用辞書データベース320の優先順位を最も高くし、企業Bと対応する企業B用辞書データベース330の優先順位をその次とする。   Therefore, the priority order assigning unit 357 sets the priority order of the company A dictionary database 320 corresponding to the company A to the highest priority, and sets the priority order of the company B dictionary database 330 corresponding to the company B to the next order.

続いて、音声変換部350Aは、変換処理部354により、辞書特定部353Aにより特定された辞書データベースを参照し、変換対象の音声データをテキストデータへ変換し、出力部355により変換結果のテキストデータを会議支援サーバ200へ送信する(ステップS1407)。   Subsequently, the voice conversion unit 350A refers to the dictionary database specified by the dictionary specifying unit 353A by the conversion processing unit 354, converts the voice data to be converted into text data, and outputs the text data of the conversion result by the output unit 355. Is transmitted to the conference support server 200 (step S1407).

ここで、変換処理部354による辞書データベースの参照の仕方について説明する。本実施形態の変換処理部354は、例えば複数の辞書データベースが特定されていた場合には、優先順位の高い辞書データベースから順に参照するようにしても良い。   Here, a method of referring to the dictionary database by the conversion processing unit 354 will be described. For example, when a plurality of dictionary databases are specified, the conversion processing unit 354 of the present embodiment may refer to the dictionary databases in order of priority.

図14の例では、企業A用辞書データベース320の方が、企業B用辞書データベース33よりも優先順位が高い。   In the example of FIG. 14, the company A dictionary database 320 has a higher priority than the company B dictionary database 33.

したがって、変換処理部354は、最初に企業A用辞書データベース320を参照し、音声と対応するテキスト(文字列)が存在しない場合には、企業B用辞書データベース330を参照するようにしても良い。   Therefore, the conversion processing unit 354 may first refer to the company A dictionary database 320 and refer to the company B dictionary database 330 when there is no text (character string) corresponding to the speech. .

以上のように、本実施形態によれば、1つの会議に、互いに異なる団体に所属している参加者が混在する場合には、各参加者が所属する団体と対応する辞書データベースを特定し、特定した辞書データベースを用いて音声データの変換を行う。   As described above, according to the present embodiment, when participants belonging to different organizations are mixed in one conference, the dictionary database corresponding to the organization to which each participant belongs is specified, The voice data is converted using the specified dictionary database.

例えば、企業Aに所属する参加者と、企業Bに所属する参加者が会議を行った場合には、企業A特有の用語と、企業B特有の用語とが用いられることが想定される。また、このような場合、企業Aに所属する参加者が、企業B特有の用語を用いることや、その逆の場合も想定される。   For example, when a participant who belongs to the company A and a participant who belongs to the company B have a meeting, it is assumed that terms specific to the company A and terms specific to the company B are used. Further, in such a case, it is assumed that the participant belonging to the company A uses a term specific to the company B and vice versa.

本実施形態では、このような場合を想定し、会議に参加している参加者が所属する全ての団体について、対応する辞書データベースを特定し、優先順位を付与している。   In the present embodiment, assuming such a case, the corresponding dictionary database is specified and given priority for all the organizations to which the participants participating in the conference belong.

よって、本実施形態によれば、互いに異なる団体に所属する参加者が混在する場合でも、適切な辞書データベースを参照することができ、音声データからテキストデータへの変換の精度を向上させることができる。   Therefore, according to this embodiment, even when participants belonging to different organizations are mixed, an appropriate dictionary database can be referred to, and the accuracy of conversion from voice data to text data can be improved. .

また、本実施形態では、会議管理情報に含まれる端末IDの数が多い団体から順に、対応する辞書データベースに優先順位を付与するものとしたが、これに限定されない。例えば、優先順位付与部357は、同一の会議IDを含む複数の会議情報のうち、音声データと対応付けられた端末IDの数が多い団体から順に、対応する辞書データベースに優先順位を付与しても良い。   In the present embodiment, the priority order is assigned to the corresponding dictionary database in order from the organization having the largest number of terminal IDs included in the conference management information. However, the present invention is not limited to this. For example, the priority assigning unit 357 assigns priorities to the corresponding dictionary database in order from the group having the largest number of terminal IDs associated with the voice data among a plurality of pieces of conference information including the same conference ID. Also good.

言い換えれば、会議中に、所属する参加者が発言した回数が多い団体と対応する辞書データベースから順に、優先順位を付与しても良い。優先順位を付与するとは、優先度が高いものが上位となるように順位を付与することである。   In other words, priorities may be given in order from a dictionary database corresponding to an organization with a large number of times that a participant to whom it belongs during a conference. Giving a priority order means assigning a priority order so that a higher priority order is higher.

このようにすれば、会議に参加した人数に関わりなく、参加者の発言回数が多い団体の辞書データベースが優先的に参照されることになる。言い換えれば、団体毎の参加者の人数に関わらず、発言内容と対応した辞書データベースが参照されることになり、音声データをテキストデータに変換する精度を向上させることができる。   In this way, regardless of the number of people who participated in the conference, the dictionary database of a group with a large number of utterances of participants is preferentially referred to. In other words, regardless of the number of participants in each group, the dictionary database corresponding to the content of the utterance is referred to, and the accuracy of converting voice data into text data can be improved.

また、本実施形態では、例えば、音声データの変換要求が言語処理装置300に送信される際に、変換処理部354に参照させる辞書データベースの優先順位が指定されていても良い。   In this embodiment, for example, when a voice data conversion request is transmitted to the language processing apparatus 300, the priority order of dictionary databases to be referred to by the conversion processing unit 354 may be specified.

この場合、例えば音声データの変換要求を行う端末装置500や電子黒板400の利用者が、参照させる辞書データベースの優先順位を入力しても良い。入力された優先順位を示す情報は、変換要求と共に会議支援サーバ200へ送信され、会議支援サーバ200から言語処理装置300へ送信されても良い。   In this case, for example, a user of the terminal device 500 or the electronic blackboard 400 that makes a voice data conversion request may input the priority order of the dictionary database to be referred to. The information indicating the input priority order may be transmitted to the conference support server 200 together with the conversion request, and may be transmitted from the conference support server 200 to the language processing device 300.

さらには、音声変換部350Aは、辞書特定部353Aにより複数の辞書データベースが特定された場合に、優先順位を付与しなくても良い。この場合、例えば、音声データにおける1つの用語に対して、複数の辞書データベースそれぞれにおいて対応するテキスト(文字列)が存在する際には、各辞書データベースから対応する文字列を取得し、列挙しても良い。   Furthermore, the voice conversion unit 350A does not have to assign priorities when a plurality of dictionary databases are specified by the dictionary specifying unit 353A. In this case, for example, when there is a corresponding text (character string) in each of a plurality of dictionary databases for one term in the speech data, the corresponding character strings are acquired from each dictionary database and listed. Also good.

具体的には、例えば音声データにおいて、「AA」という用語があったとする。この用語に対して、ある辞書データベースでは、「AA」と対応する文字列は「AAB」であり、他の辞書データベースでは対応する文字列は「AAC」であったとする。   Specifically, for example, it is assumed that there is a term “AA” in audio data. For this term, it is assumed that in one dictionary database, the character string corresponding to “AA” is “AAB”, and in the other dictionary database, the corresponding character string is “AAC”.

この場合、本実施形態の変換処理部354は、音声「AA」に対応する文字列として、「AAB/AAC」と表記しても良い。   In this case, the conversion processing unit 354 of the present embodiment may be expressed as “AAB / AAC” as a character string corresponding to the voice “AA”.

本発明は、具体的に開示された実施形態に限定されるものではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。   The present invention is not limited to the specifically disclosed embodiments, and various modifications and changes can be made without departing from the scope of the claims.

100 言語処理システム
200 会議支援サーバ
210 会議管理情報データベース
220 会議情報データベース
300 言語処理装置
310 端末情報データベース
320 企業A用辞書データベース
330 企業B用辞書データベース
340 企業C用辞書データベース
350 音声変換部
400 電子黒板
500 端末装置
DESCRIPTION OF SYMBOLS 100 Language processing system 200 Conference support server 210 Conference management information database 220 Conference information database 300 Language processing device 310 Terminal information database 320 Company A dictionary database 330 Company B dictionary database 340 Company C dictionary database 350 Speech conversion unit 400 Electronic blackboard 500 terminal device

特開2014−206677号公報JP, 2014-206777, A 特開2015−041373号公報Japanese Patent Laying-Open No. 2015-041373

Claims (8)

複数の装置によって実現される言語処理システムであって、
音声データと、前記音声データを収集する端末装置の利用者のユーザ情報とを対応付けて記憶する記憶部と、
端末装置の利用者が所属するグループと、前記グループに所属する利用者のユーザ情報とを対応付けたユーザ情報データベースと、
前記グループ毎の辞書データベースと、
前記音声データに基づくテキストデータへの変換要求を行う変換要求部と、
前記変換要求を受けて、前記音声データと対応付けられたユーザ情報から、前記ユーザ情報データベースを参照して変換に用いる辞書データベースを特定する辞書特定部と、
特定された辞書データベースを参照して、前記音声データをテキストデータへ変換する変換処理部と、を有する言語処理システム。
A language processing system realized by a plurality of devices,
A storage unit that stores voice data and user information of a user of the terminal device that collects the voice data in association with each other;
A user information database in which a group to which a user of a terminal device belongs and user information of a user belonging to the group are associated with each other;
A dictionary database for each group;
A conversion request unit for performing a conversion request to text data based on the voice data;
In response to the conversion request, from user information associated with the voice data, a dictionary specifying unit that specifies a dictionary database used for conversion with reference to the user information database;
A language processing system comprising: a conversion processing unit that converts the voice data into text data with reference to the specified dictionary database.
前記変換要求部は、
前記音声データを収集した端末装置の利用者のユーザ情報と、前記利用者との議論に参加した他の利用者のユーザ情報とを、前記変換要求と共に前記辞書特定部へ出力し、
前記辞書特定部は、
前記利用者のユーザ情報と、前記他の利用者のユーザ情報と、に基づき、変換に用いる辞書データベースを特定する、請求項1記載の言語処理システム。
The conversion request unit
The user information of the user of the terminal device that collected the voice data and the user information of other users who participated in the discussion with the user are output to the dictionary specifying unit together with the conversion request,
The dictionary specifying unit
The language processing system according to claim 1, wherein a dictionary database used for conversion is specified based on the user information of the user and the user information of the other user.
前記辞書特定部により、複数の辞書データベースが特定されたとき、前記利用者と前記他の利用者のそれぞれが所属するグループのうち、前記議論に参加した利用者の人数が多いグループと対応する辞書データベースから順に、前記複数の辞書データベースに対して優先順位を付与する優先順位付与部を有し、
前記変換処理部は、
前記優先順位が高い辞書データベースから順に参照して、前記音声データをテキストデータへ変換する、請求項2記載の言語処理システム。
When a plurality of dictionary databases are specified by the dictionary specifying unit, a dictionary corresponding to a group having a large number of users who participated in the discussion among groups to which the user and the other users belong. In order from the database, it has a priority level assigning unit that gives priority levels to the plurality of dictionary databases.
The conversion processing unit
The language processing system according to claim 2, wherein the speech data is converted into text data by sequentially referring to the dictionary database having the highest priority.
前記辞書データベースは、
前記グループ内で用いられる略語を示す音声と、前記略語が示す文字列とを対応付けている、請求項1乃至3の何れか一項に記載の言語処理システム。
The dictionary database is
The language processing system according to any one of claims 1 to 3, wherein a voice indicating an abbreviation used in the group is associated with a character string indicated by the abbreviation.
前記ユーザ情報は、前記音声データを収集した前記端末装置を識別する端末識別子である、請求項1乃至4の何れか一項に記載の言語処理システム。   The language processing system according to claim 1, wherein the user information is a terminal identifier that identifies the terminal device that has collected the voice data. 音声データに基づくテキストデータへの変換要求を受けて、前記音声データをテキストデータに変換する言語処理装置であって、
前記音声データを収集する端末装置の利用者が所属するグループと、前記グループに所属する利用者のユーザ情報とを対応付けたユーザ情報データベースと、
前記グループ毎の辞書データベースと、
前記変換要求を受けて、前記音声データと、前記音声データと対応付けられたユーザ情報とを取得する音声データ取得部と、
取得した前記ユーザ情報から、前記ユーザ情報データベースを参照して変換に用いる辞書データベースを特定する辞書特定部と、
特定された辞書データベースを参照して、前記音声データをテキストデータへ変換する変換処理部と、を有する言語処理装置。
In response to a request for conversion to text data based on voice data, the language processing apparatus converts the voice data into text data,
A user information database that associates a group to which a user of the terminal device that collects the voice data belongs, and user information of a user who belongs to the group;
A dictionary database for each group;
An audio data acquisition unit that receives the conversion request and acquires the audio data and user information associated with the audio data;
From the acquired user information, a dictionary specifying unit that specifies a dictionary database used for conversion with reference to the user information database;
A language processing apparatus comprising: a conversion processing unit that converts the voice data into text data with reference to the specified dictionary database.
音声データを収集する端末装置の利用者が所属するグループと、前記グループに所属する利用者のユーザ情報とを対応付けたユーザ情報データベースと、前記グループ毎の辞書データベースと、を有し、音声データに基づくテキストデータへの変換要求を受けて、前記音声データをテキストデータに変換する言語処理装置により実行される言語処理プログラムであって、
前記言語処理装置に、
前記変換要求を受けて、前記音声データと、前記音声データと対応付けられたユーザ情報とを取得する処理と、
取得した前記ユーザ情報から、前記ユーザ情報データベースを参照して変換に用いる辞書データベースを特定する処理と、
特定された辞書データベースを参照して、前記音声データをテキストデータへ変換する処理と、を実行させる言語処理プログラム。
A user information database in which a group to which a user of a terminal device that collects voice data belongs, user information of users belonging to the group, and a dictionary database for each group; voice data A language processing program that is executed by a language processing device that receives the conversion request to text data based on the voice data and converts the voice data into text data,
In the language processing device,
A process of receiving the conversion request and acquiring the audio data and user information associated with the audio data;
From the acquired user information, a process for identifying a dictionary database used for conversion with reference to the user information database;
A language processing program that executes processing for converting the voice data into text data with reference to the identified dictionary database.
端末装置の利用者が所属するグループと、前記グループに所属する利用者のユーザ情報とを対応付けたユーザ情報データベースと、前記グループ毎の辞書データベースと、を有し、複数の装置によって実現される言語処理システムによる言語処理方法であって、
音声データと、前記音声データを収集する端末装置の利用者のユーザ情報とを対応付けて記憶部に記憶する手順と、
前記音声データに基づくテキストデータへの変換要求を行う手順と、
前記変換要求を受けて、前記音声データと対応付けられたユーザ情報から、前記ユーザ情報データベースを参照して、変換に用いる辞書データベースを特定する手順と、
特定された辞書データベースを参照して、前記音声データをテキストデータへ変換する手順と、を有する言語処理方法。
It has a user information database in which a group to which a user of a terminal device belongs, user information of a user who belongs to the group, and a dictionary database for each group, and is realized by a plurality of devices. A language processing method by a language processing system,
A procedure for associating and storing audio data and user information of a user of a terminal device that collects the audio data in a storage unit;
A procedure for requesting conversion to text data based on the voice data;
In response to the conversion request, from the user information associated with the voice data, referring to the user information database, a procedure for specifying a dictionary database used for conversion;
A procedure for converting the voice data into text data with reference to the identified dictionary database.
JP2016195087A 2016-09-30 2016-09-30 Language processing system, language processing device, language processing program and language processing method Active JP6772734B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016195087A JP6772734B2 (en) 2016-09-30 2016-09-30 Language processing system, language processing device, language processing program and language processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016195087A JP6772734B2 (en) 2016-09-30 2016-09-30 Language processing system, language processing device, language processing program and language processing method

Publications (2)

Publication Number Publication Date
JP2018059961A true JP2018059961A (en) 2018-04-12
JP6772734B2 JP6772734B2 (en) 2020-10-21

Family

ID=61908859

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016195087A Active JP6772734B2 (en) 2016-09-30 2016-09-30 Language processing system, language processing device, language processing program and language processing method

Country Status (1)

Country Link
JP (1) JP6772734B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021071658A (en) * 2019-10-31 2021-05-06 株式会社リコー Server device, communication system and information processing method

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007213005A (en) * 2006-01-10 2007-08-23 Nissan Motor Co Ltd Recognition dictionary system and recognition dictionary system updating method
JP2012155272A (en) * 2011-01-28 2012-08-16 Nec Corp Speech recognition dictionary extension device, system, method and program
JP2014167517A (en) * 2013-02-28 2014-09-11 Nippon Telegraph & Telephone East Corp Conversation providing system, game providing system, conversation providing method, game providing method, and program

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007213005A (en) * 2006-01-10 2007-08-23 Nissan Motor Co Ltd Recognition dictionary system and recognition dictionary system updating method
JP2012155272A (en) * 2011-01-28 2012-08-16 Nec Corp Speech recognition dictionary extension device, system, method and program
JP2014167517A (en) * 2013-02-28 2014-09-11 Nippon Telegraph & Telephone East Corp Conversation providing system, game providing system, conversation providing method, game providing method, and program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021071658A (en) * 2019-10-31 2021-05-06 株式会社リコー Server device, communication system and information processing method
JP7463690B2 (en) 2019-10-31 2024-04-09 株式会社リコー Server device, communication system, information processing method, program and recording medium

Also Published As

Publication number Publication date
JP6772734B2 (en) 2020-10-21

Similar Documents

Publication Publication Date Title
US9858271B2 (en) System and method for translating content between devices
US20140149384A1 (en) System and Method for Generating User Profiles for Human Resources
US20210406913A1 (en) Metric-Driven User Clustering for Online Recommendations
JP5919752B2 (en) Minutes creation system, minutes creation device, minutes creation program, minutes creation terminal, and minutes creation terminal program
CN111009233A (en) Voice processing method and device, electronic equipment and storage medium
US20120271817A1 (en) Information processing apparatus, information processing method, and program
Thieberger What remains to be done—Exposing invisible collections in the other 7,000 languages and why it is a DH enterprise
CN111223487B (en) Information processing method and electronic equipment
Hall-Lew et al. The Lothian Diary Project: sociolinguistic methods during the COVID-19 lockdown
US11757949B2 (en) Event registration system, user terminal, and storage medium
KR101719926B1 (en) Transform system and method for heterogeneous data through data collection api
CN110717012A (en) Method, device, equipment and storage medium for recommending grammar
JP6772734B2 (en) Language processing system, language processing device, language processing program and language processing method
JP2019121093A (en) Information generation system, information generation method, information processing device, program, and terminal device
JP6166390B2 (en) Social network server, screen display method and program
Fume et al. Implementation of Automatic Captioning System to Enhance the Accessibility of Meetings
US11017073B2 (en) Information processing apparatus, information processing system, and method of processing information
JP6434363B2 (en) Voice input device, voice input method, and program
Million Sharing stories: The Saskatchewan aboriginal storytelling project
KR101896479B1 (en) System for inputting memo, method thereof, and recordable medium storing the method
Johansson et al. Representational work and ‘reverse order’essentialism: Digitisation of local information in Thailand and Bhabha’s Third Space
JP4865323B2 (en) Graphic information processing device
WO2019208211A1 (en) Server device
George et al. Harnessing technology to respond to the global demand for learning during the COVID-19 pandemic
Heini et al. Remote data collection in sociolinguistics: lessons from the COVID-19 pandemic

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190703

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200323

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200331

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200527

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200901

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200914

R151 Written notification of patent or utility model registration

Ref document number: 6772734

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151