JP2016102920A - 文書記録システム及び文書記録プログラム - Google Patents

文書記録システム及び文書記録プログラム Download PDF

Info

Publication number
JP2016102920A
JP2016102920A JP2014241504A JP2014241504A JP2016102920A JP 2016102920 A JP2016102920 A JP 2016102920A JP 2014241504 A JP2014241504 A JP 2014241504A JP 2014241504 A JP2014241504 A JP 2014241504A JP 2016102920 A JP2016102920 A JP 2016102920A
Authority
JP
Japan
Prior art keywords
keyword
document
text
speech
recognized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014241504A
Other languages
English (en)
Inventor
吉彦 新井
Yoshihiko Arai
吉彦 新井
上之郷 陽
Akira Kaminogo
陽 上之郷
正登 丹波
Masato Tanba
正登 丹波
友里 守谷
Yuri Moriya
友里 守谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Document Solutions Inc
Original Assignee
Kyocera Document Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Document Solutions Inc filed Critical Kyocera Document Solutions Inc
Priority to JP2014241504A priority Critical patent/JP2016102920A/ja
Publication of JP2016102920A publication Critical patent/JP2016102920A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】発話による音声から認識されるテキストを議事録等の文書として記録する際に、発話内容を属性に応じて適切に分類可能な文書記録装置を提供する。【解決手段】会議等の発話による音声を取得して認識する音声認識部13と、認識された音声から属性を示す特定のキーワードを検出するキーワード検出部15と、検出されたキーワード毎にキーワードに続く音声から認識されるテキストを関連付けて記憶する記憶処理部19とを備える。【選択図】図2

Description

本発明は、会議等での発話による音声に基づくテキストを記録する文書記録システム及び文書記録プログラムに関する。
会議においては、議事録を記録しておくこと一般的に行われるが、近年では、会議の発話による音声から認識されるテキストを議事録として記録する技術がある。
例えば、特許文献1には、会議中の一区切りの音声を音声メモとして記憶しておき、各音声メモを再生して認識されるテキストをテキストメモとして文章化することが開示されている(背景技術参照)。この技術では、テキストメモを構造化することによって会議の発話内容を要約した議事録を作成できる。
ところで、議事録においては、発話内容をポイントや結論等の属性に応じて分類することが望ましい。
しかし、特許文献1では、音声メモの記憶を操作者の指定に応じて行うため、必ずしも音声のメモが発話内容の属性毎に記憶されるとは限らず、発話内容を属性に応じて適切に分類した議事録を記録することが困難であった。
特開2008−172582号公報
本発明が解決しようとする問題点は、発話による音声から認識されるテキストを議事録等の文書として記録する際に、発話内容を属性に応じて適切に分類できないおそれがある点である。
本発明は、発話による音声を取得して認識する音声認識部と、前記認識された音声から属性を示す特定のキーワードを検出するキーワード検出部と、前記検出されたキーワード毎に前記キーワードに続く音声から認識されるテキストを関連付けて記憶する記憶処理部とを備えることを文書記録装置の最も主な特徴とする。
本発明によれば、会議等の発話による音声から認識されるテキストを、キーワード毎の属性に応じて適切に分類しつつ議事録等の文書として記録することができる。
本発明の一実施例に係る文書記録装置を含む文書記録システムの全体構成を示す概念図である。 図1の文書記録装置の詳細をマイクと共に示すブロック図である。 検出用キーワードの一例を示す図表である。 文書の作成を示す概念図である。 図1の文書記録システムによる文書記録処理を示すフローチャートである。
発話による音声から認識されるテキストを議事録等の文書として記録する際に、発話内容を属性に応じて適切に分類できるようにするという目的を、発話による音声を取得して認識し、認識された音声から属性を示す特定のキーワードを検出し、検出されたキーワード毎にキーワードに続く音声から認識されるテキストを関連付けて記憶する文書記録装置により実現した。
[文書記録システムの構成]
図1は、本発明の一実施例に係る文書記録装置を含む文書記録システムの全体構成を示す概念図、図2は、文書記録装置の詳細をマイクと共に示すブロック図である。
文書記録システム1は、図1のように、操作装置3、マイク5、文書記録装置7等を備え、発話による音声をマイク5から入力させ、入力された音声から認識されるテキストを文書記録装置7に文書として記録するものである。なお、本実施例では、会議中の発話による音声から認識されるテキストを、議事録として記録する場合について説明する。
操作装置3は、いわゆるスマートフォンのような多機能携帯電話機やパーソナルコンピューター等の情報処理装置であり、文書記録装置7にLAN等の有線又は無線ネットワークや近距離無線等によって接続されている。
操作装置3は、文書記録装置7に対し、キーボード、マウス、タッチパネル等の入力装置を介した操作入力を可能とする。本実施例では、操作装置3での操作入力により、文書記録装置7での文書記録開始等を指示することが可能となっている。
マイク5は、文書記録装置7に有線又は無線によって接続され、会議において発話による音声の入力を可能とする。入力された音声は、マイク5から文書記録装置7に送られる。マイク5は、発話による音声を通じ、文書記録装置7での文書記録開始等を指示することも可能とする。
文書記録装置7は、情報処理装置であり、図1及び図2のように、記憶部9と、制御部11とを備える。
記憶部9は、文書記録プログラムや処理に必要なデータを記憶するROM(Read Only Memory)、作業領域としてのRAM(Random Access Memory)、補助記憶装置としてのHDD(Hard Disk Drive)等を含む記憶装置である。
制御部11は、コンピューターとしての演算処理装置であり、文書記録プログラムを実行して文書記録装置7の機能を実現する。具体的には、制御部11が、音声認識部13、キーワード検出部15、キーワード管理部17、記憶処理部19、文書作成部21として機能する。
音声認識部13は、音声認識機能を実現し、発話による音声を取得して認識する。すなわち、音声認識部13は、マイク5から送られてくる音声を受け取って周知の音声認識技術により認識し、受け取った音声から文字データとしてのテキストを抽出する。
本実施例では、取得した音声を逐次認識する構成となっている。具体的には、マイク5から送られてくる音声を音声認識部13が受け取りつつ逐次認識してテキストを抽出する。従って、本実施例では、発話に対してリアルタイムでテキストが抽出される。
キーワード検出部15は、キーワード検出機能を実現し、音声認識部13によって認識された音声、つまり音声認識部13で抽出されたテキストから特定のキーワードを検出する。本実施例のキーワードの検出は、リアルタイムで、音声認識部13で抽出されたテキストから逐次行われる。キーワードの検出は、記憶部9内の検出用キーワードを参照することで実現される。
図3に検出用キーワードの一例を示す。キーワードは、会議での発話内容を属性に応じて分類可能とするもので、例えば図3のように、「テーマ」、「日時」、「会議室」、「参加者」、「発話者」、「ポイント」、「結論」、「アクションアイテム」等がある。なお、アクションアイテムは、「誰が、何時までに、何をするか」といった内容を意味するものである。
キーワード管理部17は、キーワード管理機能を実現し、検出用キーワードを管理する。キーワード管理部17は、管理者等の指示に応じて、記憶部9内に記憶されているキーワード群の中から図3等のように検出用キーワードを設定する。管理者等からの指示は、例えば、操作装置3を通じて行うことができる。
キーワード群は、デフォルトのキーワードの他に管理者等が任意に追加したキーワードを含む。任意のキーワードの追加は、例えば、操作装置3を通じた管理者等からの追加指示に応じ、指示されたキーワードをキーワード管理部17が記憶部9内に記憶する。
記憶処理部19は、記憶処理機能を実現し、キーワード検出部15で検出されたキーワード毎に、キーワードに続く音声から認識されるテキストを関連付けて記憶部9内に記憶する。本実施例のテキストの記憶としては、リアルタイムで、キーワードに続く音声から逐次認識されるテキストを逐次記憶する。
記憶されるテキストの範囲は、キーワード後の一連のテキストの抽出が終了するまでである。また、同一の会議中においては、異なるキーワードに対するテキストが記憶の際に相互に関連付けられる。
文書作成部21は、文書作成機能を実現し、記憶部9内に記憶されているテキストをキーワードに応じて分類した文書としての議事録を作成する。議事録の作成は、テキストの記憶部9への記憶に応じてリアルタイムに行う。
図4は、議事録の作成を示す概念図である。
議事録の作成においては、文書作成部21が、キーワード毎のテキスト及びテンプレートを記憶部9から取得し、図4のようにテンプレートの形式に基づいてキーワード毎のテキストを必要に応じて下線やハイライト等の修飾を加えつつレイアウトする。なお、テンプレートの形式は、操作装置3を通じた管理者等からの指示に応じて、事前に変更することが可能である。
[文書記録処理]
図5は、図1の文書記録システム1による文書記録処理を示すフローチャートである。
文書記録処理は、例えば、会議の開始時等に、操作装置3等を通じて文書記録装置7に文書の記録を指示することで開始される。なお、本実施例の文書記録処理のためには、キーワードを発話者に周知し、発話者にキーワードの後に関連する内容を発話させる。
ステップS1では、「音声の逐次取得」が実行される。すなわち、音声認識部13は、マイク5から入力される音声を逐次受け取って取得する。これにより、ステップS1が完了し、ステップS2へ移行する。
ステップS2では、「音声の逐次認識」が実行される。すなわち、音声認識部13は、ステップS1で音声を取得しつつ取得した音声を逐次認識してテキストを抽出する。こうしてステップS2が完了し、ステップS3へ移行する。
ステップS3では、「キーワード検出か?」の処理が実行される。すなわち、キーワード検出部15は、ステップS2で逐次抽出されるテキストからキーワードが検出されたか否かを判断する。具体的には、逐次抽出されるテキストに含まれる文字列が、図3の検出用キーワード中の特定のキーワードに一致するか否かを判断する。
キーワードが検出された場合は、ステップS4へ移行し(YES)、キーワードが検出されない場合は、ステップS3の処理を繰り返す(NO)。
ステップS4では、「テキストの記録開始」が実行される。すなわち、記憶処理部19は、ステップS3で検出されたキーワードに続いて逐次抽出されるテキストを、キーワードに関連付けて記憶部9内へ記憶していく。
例えば、図3の「テーマ」をキーワードとして検出した場合は、それに続くテキストが「テーマ」の内容を示すものとして関連付けられて記憶部9内に記憶されていく。その他のキーワードについても同様である。
なお、「発話者」がキーワードの場合は、それに続くテキストが発話者を特定する氏名及び特定された発話者による発話内容を示すものとして記憶部9内に記憶されていく。同時に、発話者の発話中に他のキーワードが検出されると、それに続くテキストが平行して他のキーワードの内容を示すものとして記憶部9内に記憶されていく。
こうしてステップS4が完了し、ステップS5へ移行する。
ステップS5では、「テキストの抽出が終了したか?」の処理が実行される。すなわち、記憶処理部19は、ステップS3で検出されたキーワードに続く一連のテキストの抽出が終了したか否かを判断する。
例えば、マイク5からの音声の入力が途切れた場合は、テキストの抽出も終了するため、その時点で一連のテキストの抽出が終了したと判断できる。或は、次のキーワードを検出したときに、一連のテキストの抽出が終了したと判断することも可能である。
音声の入力が途切れてテキストの抽出が終了した場合は、一度途切れた後に再度音声が入力され、途切れた前後の音声から認識されるテキストを一連とする必要が生じることもある。このため、音声の入力が途切れてテキストの抽出が終了した場合は、タイマーを起動して特定時間内にテキストの抽出が再開されなければ、一連のテキストの抽出が終了したと判断してもよい。
テキストの抽出が終了した場合は、ステップS6へ移行し(YES)、テキストの抽出が終了していない場合は、ステップS5の処理を繰り返す。
ステップS6では、「テキストの記録終了」が実行される。すなわち、記憶処理部19は、ステップS5でのテキストの抽出終了に応じ、キーワードに関連付けた一連のテキストの記憶を終了させる。これにより、文書記録処理は、ステップS3に戻って次のキーワードの検出に備え、文書記録の終了が指示されるまで繰り返される。文書記録の終了の指示は、例えば、会議の終了時等に、操作装置3等を通じて行われる。
このように、文書記録処理では、キーワード毎の一連のテキストを文書片として記憶していき、複数の文書片の記憶によって会議中の発話による議事録が記録される。
本実施例では、文書片が一つでも記憶されると、これに応じて記憶された文書片を内容とする議事録がリアルタイムに作成される。
例えば、「テーマ」のキーワードに関連付けられたテキストが文書片として記憶された場合は、図4の議事録中の「テーマ」部分にのみテキストがレイアウトされる。
そして、他の文書片が順次記憶されるに従って、対応するテキストが追加された議事録がリアルタイムに作成、更新される。
作成された議事録は、会議の参加者の情報処理端末やプロジェクター等に送られ、参加者にリアルタイムに閲覧させることができる。
[実施例の効果]
本実施例の文書記録装置7は、会議等の発話による音声を取得して認識する音声認識部13と、認識された音声から属性を示す特定のキーワードを検出するキーワード検出部15と、検出されたキーワード毎にキーワードに続く音声から認識されるテキストを関連付けて記憶する記憶処理部19とを備える。
従って、本実施例では、会議の発話による音声から認識されるテキストを、キーワード毎の属性に応じて適切に分類しつつ議事録として記録することができる。
また、本実施例の文書記録装置7は、記憶部9に記憶されているテキストをキーワードに応じて分類した議事録を作成する文書作成部21を備えるため、記憶されているキーワード毎のテキストを用いて適切な分類がなされた議事録を作成することができる。
文書作成部21は、キーワード毎のテキストが記憶されるたびに議事録を作成又は更新するので、会議の全ての発話の音声に基づくテキストを記憶する前であっても、部分的に記載された議事録を作成することができる。
特に、本実施例の文書記録装置7では、音声認識部13が取得した音声を逐次認識し、キーワード検出部15が逐次認識された音声から特定のキーワードを逐次検出し、記憶処理部19がキーワードに続いて取得された音声から逐次認識されるテキストに対してキーワードに関連付けた記憶を行う。
従って、本実施例では、リアルタイムにキーワード毎のテキストの記憶を行いつつ、既に記憶されているテキストに基づいて会議の進行に応じた部分的な議事録をリアルタイムに作成することができる。このため、本実施例では、作成された議事録を会議中の参加者等に閲覧等を通じてリアルタイムに利用させることが可能となる。
[その他]
本発明は、上述の実施例に限定されるものではなく、各種の変更が可能である。
例えば、音声認識部13は、認識している音声の発話者を周知の話者認識技術により識別してもよい。発話者の識別では、発話者を特定するか、或は発話者を特定せずに他の発話者と区別すればよい。なお、発話者を特定する場合は、事前に発話者の音声データを記憶部9内に記憶しておく必要がある。
7 文書記録装置
13 音声認識部
15 キーワード検出部
19 記憶処理部
21 文書作成部

Claims (5)

  1. 発話による音声を取得して認識する音声認識部と、
    前記認識された音声から属性を示す特定のキーワードを検出するキーワード検出部と、
    前記検出されたキーワード毎に前記キーワードに続く音声から認識されるテキストを関連付けて記憶する記憶処理部と、
    を備えることを特徴とする文書記録装置。
  2. 請求項1記載の文書記録装置であって、
    前記記憶されているテキストを前記キーワードに応じて分類した文書を作成する文書作成部を備える、
    ことを特徴とする文書記録装置。
  3. 請求項1又は2記載の文書記録装置であって、
    前記文書作成部は、前記キーワード毎のテキストが記憶されるたびに前記文書を作成又は更新する、
    ことを特徴とする文書記録装置。
  4. 請求項1〜3の何れか一項に記載の文書記録装置であって、
    前記音声認識部は、前記取得した音声を逐次認識し、
    前記キーワード検出部は、前記逐次認識された音声から前記特定のキーワードを逐次検出し、
    前記記憶処理部は、前記キーワードに続いて取得された音声から逐次認識されるテキストに対して前記記憶を行う、
    ことを特徴とする文書記録装置。
  5. 発話による音声を取得して認識する音声認識機能と、
    前記認識された音声から属性を示す特定のキーワードを検出するキーワード検出機能と、
    前記検出されたキーワードに続く音声から認識されるテキストを前記キーワードに関連付けて記憶する記憶処理機能と、
    をコンピューターに実現させることを特徴とする文書記録プログラム。
JP2014241504A 2014-11-28 2014-11-28 文書記録システム及び文書記録プログラム Pending JP2016102920A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014241504A JP2016102920A (ja) 2014-11-28 2014-11-28 文書記録システム及び文書記録プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014241504A JP2016102920A (ja) 2014-11-28 2014-11-28 文書記録システム及び文書記録プログラム

Publications (1)

Publication Number Publication Date
JP2016102920A true JP2016102920A (ja) 2016-06-02

Family

ID=56088851

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014241504A Pending JP2016102920A (ja) 2014-11-28 2014-11-28 文書記録システム及び文書記録プログラム

Country Status (1)

Country Link
JP (1) JP2016102920A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018072508A (ja) * 2016-10-27 2018-05-10 トッパン・フォームズ株式会社 音声入力装置、音声入力方法
JP2018116512A (ja) * 2017-01-19 2018-07-26 株式会社ナカヨ 重要事項抽出方法
CN112687272A (zh) * 2020-12-18 2021-04-20 北京金山云网络技术有限公司 一种会议纪要的记录方法、装置及电子设备
JP2021117430A (ja) * 2020-01-29 2021-08-10 清水建設株式会社 発言内容表示装置、発言内容表示システム、発言内容表示方法、及び発言内容表示プログラム
WO2022000829A1 (zh) * 2020-06-30 2022-01-06 深圳传音控股股份有限公司 音频数据处理方法、终端设备及计算机可读存储介质
WO2022019145A1 (ja) * 2020-07-20 2022-01-27 ソニーグループ株式会社 情報処理装置、情報処理方法及び情報処理プログラム
JP2023501283A (ja) * 2019-10-29 2023-01-18 パズル エイアイ カンパニー リミテッド キーボードマクロ機能を活用した自動音声認識器および音声認識方法
JP2023020997A (ja) * 2021-07-29 2023-02-09 株式会社ブリングアウト 報告作成支援装置及び報告作成支援方法

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018072508A (ja) * 2016-10-27 2018-05-10 トッパン・フォームズ株式会社 音声入力装置、音声入力方法
JP2018116512A (ja) * 2017-01-19 2018-07-26 株式会社ナカヨ 重要事項抽出方法
JP2023501283A (ja) * 2019-10-29 2023-01-18 パズル エイアイ カンパニー リミテッド キーボードマクロ機能を活用した自動音声認識器および音声認識方法
US11977812B2 (en) 2019-10-29 2024-05-07 Puzzle Ai Co., Ltd. Automatic speech recognizer and speech recognition method using keyboard macro function
JP2021117430A (ja) * 2020-01-29 2021-08-10 清水建設株式会社 発言内容表示装置、発言内容表示システム、発言内容表示方法、及び発言内容表示プログラム
JP7529407B2 (ja) 2020-01-29 2024-08-06 清水建設株式会社 発言内容表示装置、発言内容表示システム、発言内容表示方法、及び発言内容表示プログラム
WO2022000829A1 (zh) * 2020-06-30 2022-01-06 深圳传音控股股份有限公司 音频数据处理方法、终端设备及计算机可读存储介质
WO2022019145A1 (ja) * 2020-07-20 2022-01-27 ソニーグループ株式会社 情報処理装置、情報処理方法及び情報処理プログラム
CN112687272A (zh) * 2020-12-18 2021-04-20 北京金山云网络技术有限公司 一种会议纪要的记录方法、装置及电子设备
JP2023020997A (ja) * 2021-07-29 2023-02-09 株式会社ブリングアウト 報告作成支援装置及び報告作成支援方法
JP7290234B2 (ja) 2021-07-29 2023-06-13 株式会社ブリングアウト 報告作成支援装置及び報告作成支援方法

Similar Documents

Publication Publication Date Title
JP2016102920A (ja) 文書記録システム及び文書記録プログラム
CN106716466B (zh) 会议信息储存装置以及方法
CN107464555B (zh) 增强包含语音的音频数据的方法、计算装置和介质
US10270736B2 (en) Account adding method, terminal, server, and computer storage medium
US10127226B2 (en) Method for dialogue between a machine, such as a humanoid robot, and a human interlocutor utilizing a plurality of dialog variables and a computer program product and humanoid robot for implementing such a method
JP6076418B2 (ja) 電子装置及び漫画制作方法
CN104252464A (zh) 信息处理方法和装置
JP2013222347A (ja) 議事録生成装置及び議事録生成方法
JPWO2016163028A1 (ja) 発言提示装置、発言提示方法およびプログラム
JP2014222290A (ja) 議事録記録装置、議事録記録方法及びプログラム
KR102312993B1 (ko) 인공신경망을 이용한 대화형 메시지 구현 방법 및 그 장치
US20120185417A1 (en) Apparatus and method for generating activity history
CN109326284A (zh) 语音搜索的方法、装置和存储介质
JP6176041B2 (ja) 情報処理装置及びプログラム
JP2010109898A (ja) 撮影制御装置、撮影制御方法及びプログラム
KR102226427B1 (ko) 호칭 결정 장치, 이를 포함하는 대화 서비스 제공 시스템, 호칭 결정을 위한 단말 장치 및 호칭 결정 방법
KR20190034494A (ko) 번역 장치 및 번역 시스템
JP6644141B2 (ja) 応答装置および応答装置の制御方法、制御プログラム
JP2019036246A (ja) 情報処理装置、情報取得機器、トランスクライバーシステム、表示方法、生成方法およびプログラム
JP6304396B2 (ja) プレゼンテーション支援方法、プレゼンテーション支援プログラム及びプレゼンテーション支援装置
CN115461709A (zh) 来自环境语音的分层场境特定动作
JP7142315B2 (ja) 説明支援装置および説明支援方法
JP2012226651A (ja) 情報処理装置、情報処理方法及びプログラム
JP2021149664A (ja) 出力装置、出力方法及び出力プログラム
CN113544772A (zh) 编辑支持程序、编辑支持方法和编辑支持装置