JP2021076729A - 書き起こし支援方法及び書き起こし支援装置 - Google Patents

書き起こし支援方法及び書き起こし支援装置 Download PDF

Info

Publication number
JP2021076729A
JP2021076729A JP2019203694A JP2019203694A JP2021076729A JP 2021076729 A JP2021076729 A JP 2021076729A JP 2019203694 A JP2019203694 A JP 2019203694A JP 2019203694 A JP2019203694 A JP 2019203694A JP 2021076729 A JP2021076729 A JP 2021076729A
Authority
JP
Japan
Prior art keywords
word
text
transcription support
voice data
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019203694A
Other languages
English (en)
Other versions
JP7304269B2 (ja
Inventor
匡哲 雨貝
Masatetsu Amagai
匡哲 雨貝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2019203694A priority Critical patent/JP7304269B2/ja
Publication of JP2021076729A publication Critical patent/JP2021076729A/ja
Application granted granted Critical
Publication of JP7304269B2 publication Critical patent/JP7304269B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)

Abstract

【課題】音声認識結果の修正作業を、ユーザ視点に合わせて効率化し、当該コストを低減可能とする。【解決手段】書き起こし支援装置100において、音声認識対象となる音声データを保持する記憶装置101と、音声データに対する音声認識処理により得た単語区切りのテキストと、音声データにおける単語の再生開始時間とを対応付けて記憶装置に格納する処理、及びテキストを画面表示させた状態で、ユーザから単語単位での再生指定を受け付けた場合、当該単語から始まる音声データを記憶部から読み出して予め定めた規定回数でリピート再生する処理を実行する演算装置104を含む。【選択図】図2

Description

本発明は、書き起こし支援方法及び書き起こし支援装置に関するものであり、具体的には、音声認識結果の修正作業を、ユーザ視点に合わせて効率化し、当該コストを低減可能とする技術に関する。
複数人が互いに意見を交わす状況は、参加者の規模、属性や場面に関わらず様々に存在する。そこで交わされた各自の意見等は、対応する話題の結論やそこに至る経緯の確かな根拠として大きな意味を持ってくる。
そこで、上述のように対話を行った各自の発言を記録し、電子データとして管理するための従来技術が存在する。例えば、電話を介した通話を記録するとともに、前記通話に伴うオペレータ業務を支援する、オペレータ業務支援システムであって、音声データをステレオ形式で記憶する音声記憶部と、前記通話のオペレータの音声であるオペレータ音声をステレオの一方のチャネルに割り当て、前記オペレータの通話相手の音声であるユーザ音声をステレオの他方のチャネルに割り当てて、前記音声記憶部に記憶する録音部と、テキストデータと開始時間と終了時間とを対応付けて記憶する音声認識結果記憶部と、前記オペレータ音声を認識してテキストデータに変換すると共に、認識において区切られた文単位に開始時間と終了時間とを付加して、前記音声認識結果記憶部に記憶するオペレータ音声認識部と、前記音声認識結果記憶部に記憶されたテキストデータを文単位に表示し、前記音声記憶部に記憶された音声を再生する出力部と、前記オペレータの操作を受け付ける入力部とを備え、前記出力部は、前記入力部がテキストデータの指定を受け付けると、前記音声記憶部に記憶された音声について、前記音声認識結果記憶部に記憶された前記テキストデータに対応する開始時間と終了時間との間の音声を再生するものであるオペレータ業務支援システム(特許文献1参照)などが提案されている。
特開2009−31810号公報
上述の従来技術の如く、音声認識結果を利活用する概念は存在し、いわわゆる「音声書き起こし」のパッケージ製品も従来から提案されている。しかしながら、導入コストが小さくない一方で、ユーザに相応の煩わしさを要求するという問題が残されていた。
例えば、会議参加者それぞれに音声認識訓練用の事前発話が必要であるにもかかわらず、良好な認識精度が期待しにくいという問題があった。その場合、結局のところ音声認識結果の修正業務が膨大に発生することになる。
そこで本発明の目的は、音声認識結果の修正作業を、ユーザ視点に合わせて効率化し、当該コストを低減可能とする技術を提供することにある。
上記課題を解決する本発明の書き起こし支援方法は、情報処理装置が、音声データに対する音声認識処理により得た単語区切りのテキストと、前記音声データにおける前記単語の再生開始時間とを対応付けて記憶装置に格納する処理と、前記テキストを画面表示させた状態で、ユーザから単語単位での再生指定を受け付けた場合、当該単語から始まる音声
データを記憶装置から読み出して予め定めた規定回数でリピート再生する処理とを実行する、ことを特徴とする。
また、本発明の書き起こし支援装置は、音声認識対象となる音声データを保持する記憶装置と、前記音声データに対する音声認識処理により得た単語区切りのテキストと、前記音声データにおける前記単語の再生開始時間とを対応付けて記憶装置に格納する処理、及び前記テキストを画面表示させた状態で、ユーザから単語単位での再生指定を受け付けた場合、当該単語から始まる音声データを記憶部から読み出して予め定めた規定回数でリピート再生する処理、を実行する演算装置と、を含むことを特徴とする。
本発明によれば、音声認識結果の修正作業を、ユーザ視点に合わせて効率化し、当該コストを低減可能となる。
本実施形態の書き起こし支援装置を含むネットワーク構成図である。 本実施形態における書き起こし支援装置のハードウェア構成例を示す図である。 本実施形態における監査装置のハードウェア構成例を示す図である。 本実施形態における集音装置のハードウェア構成例を示す図である。 本実施形態の音声データDBのデータ構成例を示す図である。 本実施形態の認識結果DBのデータ構成例を示す図である。 本実施形態の修正履歴DBのデータ構成例を示す図である。 本実施形態の制御条件のデータ構成例を示す図である。 本実施形態の音声データの構成例を示す図である。 本実施形態における書き起こし支援方法のフロー例1を示す図である。 本実施形態における書き起こし支援方法のフロー例2を示す図である。 本実施形態における書き起こし支援方法のフロー例3を示す図である。 本実施形態における画面例を示す図である。 本実施形態における画面例を示す図である。 本実施形態における画面例を示す図である。 本実施形態における画面例を示す図である。 本実施形態における画面例を示す図である。
−−−ネットワーク構成−−−
以下に本発明の実施形態について図面を用いて詳細に説明する。図1は、本実施形態の書き起こし支援装置100を含むネットワーク構成図である。図1に示す書き起こし支援装置100は、音声認識結果の修正作業を、ユーザ視点に合わせて効率化し、当該コストを低減可能とするコンピュータ装置である。
本実施形態の書き起こし支援装置100は、インターネットやLAN(Local Area Network)などの適宜なネットワーク1を介して、監査装置200、集音装置300、及びユーザ端末400と通信可能に接続されている。
書き起こし支援装置100は、例えば、数多くの会議が頻繁に開催され、その議事録作成が必要とされている企業、または、そうした企業に対して議事録の書き起こし支援サービスを提供するサービス事業者、などが運用するサーバ装置を想定できる。
詳細は後述するが、この書き起こし支援装置100は、集音装置300から得た音声データ(例:会議等での各参加者の発話を集音して得たデータ)を音声認識にてテキスト化し、これに関して所定の処理を行い、監査装置200やユーザ端末400に提供することとなる。
なお、上述の音声データは、音声データDB125に格納される。また、音声データの認識結果であるテキストは、認識結果DB126に格納される。また、テキストが音声データとともに適宜な形態にてユーザ端末400に配信され、ユーザによる修正を受けた結果については修正履歴DB127に格納される。
また、監査装置200は、上述の企業に対する監査を行う監査機関が運用する情報処理装置である。この監査装置200は、書き起こし支援装置100から、例えば、経営層による重要会議や株主総会等の議事録を監査用の情報として取得することとなる。
また、集音装置300は、上述の企業内で利用されている装置であり、例えば、会議室にて所定数が配置されているものとする。
また、ユーザ端末400は、上述の企業における議事録作成業務の担当者等が操作する情報処理装置である。すなわち、ユーザ端末400は、書き起こし支援装置100から、会議の音声データの音声認識結果たるテキストについて情報を取得し、対応する音声データの適宜な再生を行いつつ、担当者らによる上述のテキストの修正を受け付ける端末となる。
−−−ハードウェア構成−−−
図2に、本実施形態の書き起こし支援装置100のハードウェア構成例を示す。本実施形態の書き起こし支援装置100のハードウェア構成は以下の如くとなる。
すなわち書き起こし支援装置100は、記憶装置101、メモリ103、演算装置104、入力装置105、出力装置106、および通信装置107を備えている。
このうち記憶装置101は、SSD(Solid State Drive)やハードディスクドライブなど適宜な不揮発性記憶素子で構成される。
また、メモリ103は、RAMなど揮発性記憶素子で構成される。
また、演算装置104は、記憶装置101に保持されるプログラム102をメモリ103に読み出すなどして実行し装置自体の統括制御を行なうとともに各種判定、演算及び制御処理を行なうCPUである。
また、通信装置105は、ネットワーク1と接続して他装置との通信処理を担うネットワークインターフェイスカードである。
なお、書き起こし支援装置100は、スタンドアロンマシンとして稼働するのであれば、ユーザ(例:上述の担当者等)からのキー入力やマウス操作を受け付ける、キーボードやマウスなどの適宜な入力装置を備えるとしてもよい。同様に、演算装置104での処理データの表示を行うディスプレイ等の適宜な出力装置を備えるとしてもよい。
また、記憶装置101内には、本実施形態の書き起こし支援装置として必要な機能を実装する為のプログラム102に加えて、音声データDB125、認識結果DB126、及び修正履歴DB127が少なくとも記憶されている。ただし、これら各データベースの詳細は後述する。
また、プログラム102は、音声データからテキストを生成する音声認識エンジン110と、上述のテキストに対応する音声データをユーザ端末400に配信し再生させる際の
制御条件111を保持しているものとする。
続いて、図3に本実施形態における監査装置200のハードウェア構成例を示す。監査装置200は、企業の監査業務を担う監査機関が運用する情報処理装置であり、対象企業での各種会議の議事録等を監査業務対象として管理、利用するものとなる。
こうした監査装置200は、記憶装置201、メモリ203、演算装置204、入力装置205、出力装置206、および通信装置207を備えている。
このうち記憶装置201は、SSD(Solid State Drive)やハードディスクドライブなど適宜な不揮発性記憶素子で構成される。
また、メモリ203は、RAMなど揮発性記憶素子で構成される。
また、演算装置204は、記憶装置101に保持されるプログラム202をメモリ203に読み出すなどして実行し装置自体の統括制御を行なうとともに各種判定、演算及び制御処理を行なうCPUである。
また、入力装置205は、ユーザ(例:上述の担当者等)からのキー入力やマウス操作を受け付ける、キーボードやマウスである。
また、出力装置206は、演算装置104での処理データの表示を行うディスプレイ等の装置である。
また、通信装置207は、ネットワーク1と接続して書き起こし支援装置100などとの通信処理を担うネットワークインターフェイスカードである。
なお、記憶装置201内には、本実施形態の監査装置として必要な機能を実装する為のプログラム202に加えて、監査情報DB225が少なくとも記憶されている。ただし、この監査情報DB225の詳細は後述する。
続いて、図4に本実施形態の集音装置300のハードウェア構成例を示す。本実施形態の集音装置300のハードウェア構成は以下の如くとなる。
すなわち集音装置300は、記憶装置301、メモリ303、演算装置304、入力装置305、出力装置306、通信装置307、及びマイク306を備えている。
このうち記憶装置301は、SSD(Solid State Drive)やハードディスクドライブなど適宜な不揮発性記憶素子で構成される。
また、メモリ303は、RAMなど揮発性記憶素子で構成される。
また、演算装置304は、記憶装置301に保持されるプログラム302をメモリ303に読み出すなどして実行し装置自体の統括制御を行なうとともに各種判定、演算及び制御処理を行なうCPUである。
また、入力装置305は、ユーザからのキー入力やマウス操作、ボタン操作などを受け付ける、キーボードやマウス、ボタンなどの適宜な装置である。
また、出力装置306は、演算装置304での処理データの表示を行うディスプレイ等の適宜な装置である。
また、通信装置307は、ネットワーク1と接続して書き起こし支援装置100など他装置との通信処理を担うネットワークインターフェイスカードである。
また、マイク308は、事業者の会議等の出席者の発言を録音するためのマイクロフォンである。マイク308で集音された音声データは、記憶装置301の音声データ325として格納されることになる。
なお、記憶装置301内には、本実施形態の集音装置300として必要な機能を実装する為のプログラム302に加えて、上述の音声データ325が少なくとも記憶されている。ただし、この音声データ325の詳細は後述する。
−−−データ構造例−−−
続いて、本実施形態の書き起こし支援装置100が用いるテーブル類について説明する。図5に、本実施形態における音声データDB125の一例を示す。
音声データDB125は、集音装置300から得た音声データを蓄積したデータベースである。そのデータ構造は、音声データの識別番号をキーとして、当該音声データを生成した集音装置300の識別情報(図中では“マイク#”)、当該集音装置300を使用した発話者の識別情報、集音日時、及び音声データファイル、といったデータから成るレコードの集合体である。
続いて、図6に本実施形態の認識結果DB126のデータ構成例を示す。本実施形態の認識結果DB126は、上述の音声データDB125に格納されている音声データについて音声認識処理を行って得たテキストを蓄積したデータベースである。
そのデータ構造は、音声データの識別情報をキーとして、集音装置300の識別情報、発話者の識別情報、時間帯毎の文字列(テキスト)、といったデータから成るレコードの集合体である。
また、図7に本実施形態の修正履歴DB127のデータ構成例を示す。本実施形態の修正履歴DB127は、上述の認識結果DB126で保持するテキストに対して、議事録作成業務の担当者らがユーザ端末400を操作し修正を行った履歴を蓄積したデータベースである。
そのデータ構造は、音声データの識別情報をキーとして、集音装置300の識別情報、発話者の識別情報、修正の版ナンバー(図中では“Rev.0”〜)、修正担当者の識別情報、修正対象のテキストと修正内容(図中では下線部分)、といったデータから成るレコードの集合体である。
また、図8に本実施形態の制御条件111のデータ構成例を示す図である。本実施形態の制御条件111は、上述の担当者らによるテキストの修正作業を受ける際、これに伴って再生する音声データの出力形態を制御する条件を規定したテーブルである。
そのデータ構造は、条件をキーとして、当該条件に対応した制御内容たる、リピート回数、再生速度、及び音量、といったデータから成るレコードの集合体である。
また、図9に本実施形態の音声データ325の構成例を示す。本実施形態の音声データ325は、集音装置300が自身で保持しているデータであり、マイク308で捉えた発話の音声データである。
そのデータ構造は、音声データの識別情報をキーとして、発話者の識別情報、集音日時、及び音声データファイル、といったデータから成るレコードの集合体である。
<フロー例:メインフロー>
以下、本実施形態における書き起こし支援方法の実際手順について図に基づき説明する。以下で説明する書き起こし支援方法に対応する各種動作は、書き起こし支援装置100がメモリ等に読み出して実行するプログラムによって実現される。そして、このプログラムは、以下に説明される各種の動作を行うためのコードから構成されている。
図10は、本実施形態における書き起こし支援方法のフロー例1を示す図である。ここで、ある企業において会議が開催され、その参加者それぞれの発言を、集音装置300が
録音して音声データ325を生成しているものとする。また、集音装置300は、その入力装置305により、当該集音装置300の使用者たる発話者の情報を受け付けて、これを音声データ325に紐付けるものとする。
そこで、書き起こし支援装置100は、集音装置300にリクエストするなどして音声データ325を取得し、これを音声データDB125に格納する(s5)。この音声データ325は、図9で例示したように、音声データの実体(ファイル)に加えて、当該音声データを一意に特定する識別情報、音声データの録音を行った集音装置300の使用者たる発話者、録音日時(録音開始から終了までの間の時間帯)、といったメタデータを含んでいるものとする。
また、書き起こし支援装置100は、s5で得た音声データを音声データDB125から抽出して、音声認識エンジン110に入力し、単語区切りのテキストを生成する(s10)。なお、ここで生成したテキストは、対応する音声データの識別情報等と対応付けて、認識結果DB126に格納される。
なお、単語区切りのテキストとは、例えば、「これはあなたの荷物ですか」という元の文章を、「これ」、「は」、「あなた」、「の」、「荷物」、「です」、「か」、という最小単位の単語で区切って構成したテキストとなる。
続いて、書き起こし支援装置100は、s10で得て認識結果DB126に格納した単語区切りのテキストに対し、その元となった音声データの録音時間帯の情報(s5で得たメタデータに含まれる)を紐付ける(s11)。ここまでの処理で、認識結果DB126における、1つの音声データに関するレコードが完成する。
続いて、書き起こし支援装置100は、例えば、ユーザ端末400から、音声認識結果たるテキストの確認要求を受信したことに応じて(或いは、s11の実行完了をもって自動的に)、当該確認要求が指定する音声データ(集音装置300の識別情報や日時の情報でもって指定されたもの)の認識結果たるテキストを、認識結果DB126から抽出し、これをユーザ端末400に配信し出力(図13の画面900参照)させる(s12)。
図13の画面900で例示する表示形態は、或る時間帯に指定の集音装置300で録音された音声データに関して得られた単語区切りのテキスト901が、発話者の情報902と紐付いた形で時系列順にチャット形式で表示されたものとなっている。
なお、書き起こし支援装置100は、こうした画面900でのテキストの表示に際し、当該テキストに含まれる単語のうち確信度が所定の基準以下のものに関して、下線903(図13参照)や特定の文字色を設定するといった強調表示を行うものとする(s13)。
この表示制御は、上述のとおり確信度をベースに行う。確信度とは、いわゆる単語の信頼度であり、音声認識結果をどれだけ信頼してよいかを示す尺度となる。その値の範囲は、0〜1である。この確信度の値が1に近いほど、その単語に似たスコアを持つ他候補が存在しなかったことを示す。一方、確信度の値が0に近いほど、その単語と同程度のスコアをもつ他候補が多く出現したことを示す。
よって、確信度の値が高いほど、その音声認識結果の一位候補の単語に近い他の候補が出現しておらず、音声認識エンジン110が「確信」をもって当該音声認識結果を出力したこととなる。確信度の値は、例えば音声認識エンジン110が生成し、これを書き起こし支援装置100が利用可能であるとする。
本実施形態では特に図示しないが、例えば、認識結果DB126の各レコードにおけるテキスト(音声認識結果)が含む各単語について、その確信度の値と、他候補の単語(音声認識エンジン110が確信度として次点以下とした各単語)のリストとが、記憶装置101にて別途管理されているものとする。そのため、書き起こし支援装置100の音声認識エンジン110は、音声認識処理に際し、確信度の算定および上述のリストの生成も行っているものとする。
続いて、書き起こし支援装置100は、図13のようにテキストを画面表示させた状態で、ユーザ端末400から、単語単位での音声データの再生指定を受け付け(s14)、これに応じて、確信度等に基づく再生制御条件を特定する(s15)。
この場合、書き起こし支援装置100は、制御条件111を参照し、s14で再生指定を受けた単語に関して適合する条件を特定することとなる。図8の制御条件111の例であれば、デフォルト、確信度<0.3、低確信度単語との共起確率>0.5、及び、再生指示>3回、といった条件のいずれかが特定される。
上述の特定の結果、特段の条件に該当しない場合には、デフォルトの条件が特定され、音声データ再生のリピート回数(例:2回)、速度(例:1倍速すなわち発話速度と同じ)、及び音量、ともに通常の値を再生制御の条件とすることになる。
一方、上述の特定の結果、指定の単語の確信度が0.3より小さい場合、音声データ再生のリピート回数をデフォルト値から1回増、速度を20%減、及び音量を15%増、とした値を再生制御の条件とすることになる。
また、上述の特定の結果、指定の単語における低確信度単語との共起確率が0.5より大きい場合、音声データ再生のリピート回数をデフォルト値から2回増、速度を30%減、及び音量を25%増、とした値を再生制御の条件とすることになる。
また、上述の特定の結果、指定の単語に関する音声データの再生指示が、直近の所定時間内で通算3回より多い場合、音声データ再生のリピート回数をデフォルト値から3回増、速度を40%減、及び音量を40%増、とした値を再生制御の条件とすることになる。
続いて、書き起こし支援装置100は、s15で特定した音声データの再生制御条件に基づいて、ユーザ端末400にて音声データ(再生指定を受けた単語を先頭とした音声データ)を再生させる(s16)。
勿論、書き起こし支援装置100が再生制御を行うケースのみならず、当該音声データとその再生制御条件の情報を書き起こし支援装置100から配信されたユーザ端末400が、自ら実行するとしてもよい。
この時、ユーザ端末400を操作しているユーザは、図13で示すごとき画面にてテキストを閲覧しつつ、s16で再生制御された音声データを聞いて、当該テキスト中で修正が必要な単語について確認、検討する。そこで、ユーザ端末400は、上述のユーザによる、修正箇所の指定を受けた場合、その指定について書き起こし支援装置100に通知することとなる。
書き起こし支援装置100は、上述の通知を受け、上述のユーザ指定の修正箇所たる単語に関して、確信度順の候補リストを生成し、これをユーザ端末400にてポップアップ表示させる(s17)。
図14の画面900では、カーソル925で修正箇所の単語926の指定がなされたことに応じて、候補リスト930がポップアップ表示された状況を示している。ここでは、修正画面920にて、テキスト921のうち「カラー」が修正箇所と指定され、その他の候補として確信度順に、「から」、「辛」、「空」、「殻」といった単語がリストアップされている。
なお、こうした候補リスト930のポップアップ表示の最中、s16で開始された音声データの再生は再生制御の条件次第で継続しており、例えば、リピート回数が残っていれば、書き起こし支援装置100は、残り再生回数の通知927をユーザ端末400に配信するとすれば好適である。
続いて、書き起こし支援装置100は、上述の候補リスト930における各候補のうちから、ユーザが選択した単語の情報を、ユーザ端末400から受け付けて、当該単語で、ユーザ指定の修正箇所(の既存単語)を置換する(s18)。つまり修正処理を行う。なお、書き起こし支援装置100は、s18の処理に伴い、修正処理の結果を修正履歴DB127に格納し、リビジョン管理を行うものとする。
上述の修正処理を経たテキストについては、図17の画面900における表示欄920にて例示する。図17の例では、オリジナルの音声認識結果を「Rev.0」として表示欄910に配置する一方、これと並列表示する形で、最初の修正結果を反映した音声認識結果を「Rev.1」として表示欄920に配置している。
続いて、書き起こし支援装置100は、修正完了の未済について問い合わせする通知を、ユーザ端末400に送信し、その返信に応じて当該テキストに関して修正が完了したか判定する(s19)。
上述の判定の結果、修正完了と判定した場合(s19:Y)、書き起こし支援装置100は、処理を終了する。一方、上述の判定の結果、修正未完と判定した場合(s19:N)、書き起こし支援装置100は、当該テキストに関して、その音声データの追加再生が必要か問い合わせする通知(図16の画面900における通知935)を、ユーザ端末400に送信し、その返信に応じて追加再生の要否を判定する(s20)。
上述の判定の結果、追加再生不要であった場合(s20:N)、書き起こし支援装置100は、処理をs14に遷移させる。一方、上述の判定の結果、追加再生要であった場合(s20:Y)、書き起こし支援装置100は、s15で特定した再生制御条件で定められた規定回数のリピート再生後、リピート回数の累積程度に応じて、対応する音声データの再生速度の低減および音量増大、の少なくともいずれかの出力制御を行うこととなる(s21)。この制御は、制御条件111における、「再生指示>3回」といった再生指示回数に基づく制御条件に応じてなされる。書き起こし支援装置100は、上述のs21の処理の後、s17に処理を遷移させ、修正完了となるまでs17〜s19を繰り返すこととなる。
<フロー例:リビジョン管理>
また図11に、本実施形態における書き起こし支援方法のフロー例2を示す。ここでは、音声認識結果たるテキストの修正バージョンを管理する処理について説明する。書き起こし支援装置100は、修正のリビジョンについて修正履歴DB127で管理し、図13〜図17で既に示したように、オリジナルの音声認識結果「Rev.0」と、例えば修正作業中のリビジョンとを並列表示する形でユーザ端末400に配信している。
つまり、書き起こし支援装置100は、ユーザによる修正操作を受け付ける際、未修正版つまりオリジナルの音声認識結果「Rev.0」と、修正操作を反映した修正版の音声認識結果(例えば、「Rev.1」)とを並列表示するデータをユーザ端末400に配信し表示させる(s25)。
書き起こし支援装置100は、この状態にて、修正版の音声認識結果に対するユーザ操作を受けて、単語修正の処理を実行し(s26)、修正履歴DB127にてリビジョン欄の値をカウントアップして該当情報をレコードとして格納する(s27、s28)。
なお、こうした修正操作を受ける際、書き起こし支援装置100は、未修正版の音声認識結果については、例えばグレイアウト表示させ、ユーザ端末400からの修正操作を受け付け不可とする表示制御を実行するものとする。
オリジナルの音声認識結果を修正不可とした形で起点にし、その修正版それぞれを修正履歴として管理することは、議事録等の監査業務に際し、修正内容の確からしさを担保し、恣意的修正の排除を確立することにつながる。
<フロー例:重複削除支援>
また図12に、本実施形態における書き起こし支援方法のフロー例3を示す。ここでは、音声認識結果たるテキストの重複が生じた場合の対処処理について説明する。
この場合、書き起こし支援装置100は、
各音声データのうち、発話開始から終了までの間に関して重複する時間帯が存在し、かつ、集音装置300の識別情報が異なっているグループを特定する(s30)。
続いて、書き起こし支援装置100は、上述のグループ中の各音声データに関して得ている音声認識結果たるテキストの各間について、当該テキストそれぞれの総単語数または総文字数をカウントする(s31)。
例えば、「これはあなたの荷物ですか」という比較元のテキストに関して言えば、総単語数は、「これ」、「は」、「あなた」、「の」、「荷物」、「です」、「か」の7、総文字数は12、となる。また、「これは荷物です」という比較先のテキストに関して言えば、総単語数は、「これ」、「は」、「荷物」、「です」の4、総文字数は7、となる。
また、書き起こし支援装置100は、s31で、比較元および比較先の各テキストについて得た総単語数のうち少ないもの(上述の例では「4」)における、当該テキストの間で一致する単語数の割合が所定の基準以上(例:0.4)となったテキストを特定する(s32)。上述の例であれば、一致する単語数は「4」、少ない総単語数は「4」であり、比較先のテキストは基準以上のテキストとして特定される。書き起こし支援装置100は、こうした処理を、例えば、ユーザ指定の音声認識結果群に関して繰り返すこととなる。
上述のs31の処理は、各テキストについて得た総文字数のうち少ないもの(上述の例では「7」)における、当該テキストの間で一致する文字数の割合が所定の基準以上となったテキストを特定するとしてもよい。
続いて、書き起こし支援装置100は、上述のs32で特定したテキストらのうち文字列が一番長いもの以外、または確信度が一番高いもの以外、を削除対象のテキストとして特定し(s33)、当該削除対象の情報をユーザ端末400に出力する(s34)。
一方、ユーザ端末400は、上述の削除対象の情報をディスプレイ等で表示し、その削除要否について担当者らによる指示を受け付けることとなる。
以上、本発明を実施するための最良の形態などについて具体的に説明したが、本発明はこれに限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能である。
こうした本実施形態によれば、例えば、従来であれば大きな負担が必要であった、会議に伴う議事録や折衝記録の作成業務を適宜に効率化し、当該業務におけるコスト削減が可能となる。すなわち、音声認識結果の修正作業を、ユーザ視点に合わせて効率化し、当該コストを低減可能となる。
本明細書の記載により、少なくとも次のことが明らかにされる。すなわち、本実施形態の書き起こし支援方法において、前記情報処理装置が、前記リピート再生に際し、ユーザ指定の修正箇所である単語が、低確信度の単語の共起率が所定基準以上の文に含まれていることに応じ、前記音声データの再生回数の増加、再生速度の低減、および音量増大、の少なくともいずれかの出力制御を行う、としてもよい。
これによれば、誤認識の懸念もある単語について効率的なユーザ確認を促すこととなり、当該ユーザによる修正作業の精度向上が期待可能となる。ひいては、音声認識結果の修正作業を、ユーザ視点に合わせてより効率化し、当該コストを低減可能となる。
また、本実施形態の書き起こし支援方法において、前記情報処理装置が、前記修正箇所のユーザ指定を受けた場合、当該修正箇所たる単語の確信度順に候補リストをポップアップ表示し、当該候補リスト中から、ユーザによる単語選択を受け付け、前記修正箇所の単語をユーザ選択の単語に更新する、としてもよい。
これによれば、修正箇所の単語について、例えば、確信度の高い候補からユーザの認識対象としやすくなり、修正作業の大幅な効率化を図ることが可能となる。また、候補のリスト表示による一覧性向上により、確信度は低くとも当該ユーザにとって正解となる単語を容易に特定しやすくなる。ひいては、音声認識結果の修正作業を、ユーザ視点に合わせてより効率化し、当該コストを低減可能となる。
また、本実施形態の書き起こし支援方法において、前記情報処理装置が、前記リピート再生に際し、前記規定回数のリピート再生の後、当該単語についてさらなるユーザ操作を受けた場合、当該操作の回数の累積程度に応じて、前記音声データの再生速度の低減および音量増大、の少なくともいずれかの出力制御を行う、としてもよい。
これによれば、分かりにくい(聞き取りにくい)単語について、ユーザが再生を繰り返す或いは音量を大きくするなどして、何とか正確に聞き取りをする状況に効率的に対応し、ユーザ操作を低減して業務効率の改善を図ることが可能となる。ひいては、音声認識結果の修正作業を、ユーザ視点に合わせてより効率化し、当該コストを低減可能となる。
また、本実施形態の書き起こし支援方法において、前記情報処理装置が、前記ユーザ操作を受け付ける際、未修正版の音声認識結果と、修正操作を反映した修正版の音声認識結果とを並列表示し、前記未修正版については修正操作を受け付け不可とする表示制御を実行する、としてもよい。
これによれば、修正操作を行うユーザにおいて、ユーザ修正を受けていない当初の音声認識結果と、ユーザ修正内容が反映された音声認識結果とを比較しつつ、当該修正操作を行うことが可能となる。このことは、議事録等の監査対象となりうる音声認識結果に関し
て、その真正性の担保や恣意的修正の排除といった点で、ユーザの修正操作に一定の歯止めをかけ、より慎重で公正な修正が行われる状況につながりうる。或いは、ユーザが誤った又は確信無く修正を行ってしまっても、オリジナルの音声認識結果に立ち返って検討を行うことなども可能となる。ひいては、音声認識結果の修正作業を、ユーザ視点に合わせてより効率化し、当該コストを低減可能となる。
また、本実施形態の書き起こし支援方法において、前記情報処理装置が、前記未修正版を起点に各修正版を修正履歴として記憶装置にて保持する、としてもよい。
これによれば、議事録等の監査対象となりうる音声認識結果に関して、その真正性の担保や恣意的修正の排除といった点で、ユーザの修正操作に一定の歯止めをかけ、より慎重で公正な修正が行われる状況につながりうる。ひいては、音声認識結果の修正作業を、ユーザ視点に合わせてより効率化し、当該コストを低減可能となる。
また、本実施形態の書き起こし支援方法において、前記情報処理装置が、前記記憶装置において、前記単語区切りのテキストの起源となった各音声データの、発話開始及び発話終了の時刻情報と、集音をしたマイクデバイスの識別情報とを保持して、前記各音声データのうち、前記発話開始から前記発話終了までの間に関して重複する時間帯が存在し、かつ、前記マイクデバイスの識別情報が異なっているグループを特定する処理、前記グループ中の各音声データに関して得ている前記テキストの各間について、当該テキストそれぞれの総単語数または総文字数における、当該テキストの間で一致する単語数または文字数の割合が所定の基準以上となったテキスト群を特定する処理、及び前記テキスト群が含むテキストのうち文字列が一番長いもの以外を削除対象として特定し、当該削除対象の情報を出力する処理、をさらに実行する、としてもよい。
これによれば、同じ発話者による1つの発言を、異なる集音装置で同時に録音してしまった状況に的確に対処し、音声認識結果の重複を効率良く解消しうることにつながる。ひいては、音声認識結果の修正作業を、ユーザ視点に合わせてより効率化し、当該コストを低減可能となる。
また、本実施形態の書き起こし支援方法において、前記情報処理装置が、前記記憶装置において、前記単語区切りのテキストの確信度の情報と、前記テキストの起源となった各音声データの、発話開始及び発話終了の時刻情報と、集音をしたマイクデバイスの識別情報とを保持して、前記各音声データのうち、前記発話開始から前記発話終了までの間に関して重複する時間帯が存在し、かつ、前記マイクデバイスの識別情報が異なっているグループを特定する処理、前記グループ中の各音声データに関して得ている前記テキストの各間について、当該テキストそれぞれの総単語数、及び当該テキストの間で一致する単語数を算定する処理、前記テキストそれぞれの総単語数のうち少ないもので、前記一致する単語数を除算し、当該除算で得た値が予め定めた基準以上となったテキスト群を特定する処理、及び前記テキスト群が含むテキストのうち確信度が一番高いもの以外を削除対象として特定し、当該削除対象の情報を出力する処理、をさらに実行する、としてもよい。
これによれば、同じ発話者による1つの発言を、異なる集音装置で同時に録音してしまった状況に的確に対処し、音声認識結果の重複を効率良く解消しうることにつながる。ひいては、音声認識結果の修正作業を、ユーザ視点に合わせてより効率化し、当該コストを低減可能となる。
また、本実施形態の書き起こし支援装置において、前記演算装置は、前記リピート再生に際し、ユーザ指定の修正箇所である単語が、低確信度の単語の共起率が所定基準以上の文に含まれていることに応じ、前記音声データの再生回数の増加、再生速度の低減、およ
び音量増大、の少なくともいずれかの出力制御を行うものである、としてもよい。
また、本実施形態の書き起こし支援装置において、前記演算装置は、前記修正箇所のユーザ指定を受けた場合、当該修正箇所たる単語の確信度順に候補リストをポップアップ表示し、当該候補リスト中から、ユーザによる単語選択を受け付け、前記修正箇所の単語をユーザ選択の単語に更新するものである、としてもよい。
また、本実施形態の書き起こし支援装置において、前記演算装置は、前記リピート再生に際し、前記規定回数のリピート再生の後、当該単語についてさらなるユーザ操作を受けた場合、当該操作の回数の累積程度に応じて、前記音声データの再生速度の低減および音量増大、の少なくともいずれかの出力制御を行うものである、としてもよい。
また、本実施形態の書き起こし支援装置において、前記演算装置は、前記ユーザ操作を受け付ける際、未修正版の音声認識結果と、修正操作を反映した修正版の音声認識結果とを並列表示し、前記未修正版については修正操作を受け付け不可とする表示制御を実行するものである、としてもよい。
また、本実施形態の書き起こし支援装置において、前記演算装置は、前記未修正版を起点に各修正版を修正履歴として記憶装置にて保持するものである、としてもよい。
また、本実施形態の書き起こし支援装置において、前記記憶装置は、前記単語区切りのテキストの起源となった各音声データの、発話開始及び発話終了の時刻情報と、集音をしたマイクデバイスの識別情報とを保持し、前記演算装置は、前記各音声データのうち、前記発話開始から前記発話終了までの間に関して重複する時間帯が存在し、かつ、前記マイクデバイスの識別情報が異なっているグループを特定する処理、前記グループ中の各音声データに関して得ている前記テキストの各間について、当該テキストそれぞれの総単語数または総文字数における、当該テキストの間で一致する単語数または文字数の割合が所定の基準以上となったテキスト群を特定する処理、及び前記テキスト群が含むテキストのうち文字列が一番長いもの以外を削除対象として特定し、当該削除対象の情報を出力する処理、をさらに実行するものである、としてもよい。
また、本実施形態の書き起こし支援装置において、前記記憶装置は、前記単語区切りのテキストの確信度の情報と、前記テキストの起源となった各音声データの、発話開始及び発話終了の時刻情報と、集音をしたマイクデバイスの識別情報とを保持し、前記演算装置は、前記各音声データのうち、前記発話開始から前記発話終了までの間に関して重複する時間帯が存在し、かつ、前記マイクデバイスの識別情報が異なっているグループを特定する処理、前記グループ中の各音声データに関して得ている前記テキストの各間について、当該テキストそれぞれの総単語数、及び当該テキストの間で一致する単語数を算定する処理、前記テキストそれぞれの総単語数のうち少ないもので、前記一致する単語数を除算し、当該除算で得た値が予め定めた基準以上となったテキスト群を特定する処理、及び前記テキスト群が含むテキストのうち確信度が一番高いもの以外を削除対象として特定し、当該削除対象の情報を出力する処理、をさらに実行するものである、としてもよい。
1 ネットワーク
10 書き起こし支援システム
100 書き起こし支援装置
101 記憶装置
102 プログラム
103 メモリ
104 演算装置
105 通信装置
110 音声認識エンジン
111 制御条件
125 音声データDB
126 認識結果DB
127 修正履歴DB
200 監査装置
201 記憶装置
202 プログラム
203 メモリ
204 演算装置
205 入力装置
206 出力装置
207 通信装置
225 監査情報DB
300 集音装置
301 記憶装置
302 プログラム
303 メモリ
304 演算装置
305 入力装置
306 出力装置
307 通信装置
308 マイク
310 録音アプリ
325 音声データ
400 ユーザ端末

Claims (16)

  1. 情報処理装置が、
    音声データに対する音声認識処理により得た単語区切りのテキストと、前記音声データにおける前記単語の再生開始時間とを対応付けて記憶装置に格納する処理と、
    前記テキストを画面表示させた状態で、ユーザから単語単位での再生指定を受け付けた場合、当該単語から始まる音声データを記憶装置から読み出して予め定めた規定回数でリピート再生する処理とを実行する、
    書き起こし支援方法。
  2. 前記情報処理装置が、
    前記リピート再生に際し、ユーザ指定の修正箇所である単語が、低確信度の単語の共起率が所定基準以上の文に含まれていることに応じ、前記音声データの再生回数の増加、再生速度の低減、および音量増大、の少なくともいずれかの出力制御を行う、
    ことを特徴とする請求項1に記載の書き起こし支援方法。
  3. 前記情報処理装置が、
    前記修正箇所のユーザ指定を受けた場合、当該修正箇所たる単語の確信度順に候補リストをポップアップ表示し、当該候補リスト中から、ユーザによる単語選択を受け付け、前記修正箇所の単語をユーザ選択の単語に更新する、
    ことを特徴とする請求項2に記載の書き起こし支援方法。
  4. 前記情報処理装置が、
    前記リピート再生に際し、前記規定回数のリピート再生の後、当該単語についてさらなるユーザ操作を受けた場合、当該操作の回数の累積程度に応じて、前記音声データの再生速度の低減および音量増大、の少なくともいずれかの出力制御を行う、
    ことを特徴とする請求項1に記載の書き起こし支援方法。
  5. 前記情報処理装置が、
    前記ユーザ操作を受け付ける際、未修正版の音声認識結果と、修正操作を反映した修正版の音声認識結果とを並列表示し、前記未修正版については修正操作を受け付け不可とする表示制御を実行する、
    ことを特徴とする請求項4に記載の書き起こし支援方法。
  6. 前記情報処理装置が、
    前記未修正版を起点に各修正版を修正履歴として記憶装置にて保持する、
    ことを特徴とする請求項5に記載の書き起こし支援方法。
  7. 前記情報処理装置が、
    前記記憶装置において、前記単語区切りのテキストの起源となった各音声データの、発話開始及び発話終了の時刻情報と、集音をしたマイクデバイスの識別情報とを保持して、
    前記各音声データのうち、前記発話開始から前記発話終了までの間に関して重複する時間帯が存在し、かつ、前記マイクデバイスの識別情報が異なっているグループを特定する処理、前記グループ中の各音声データに関して得ている前記テキストの各間について、当該テキストそれぞれの総単語数または総文字数における、当該テキストの間で一致する単語数または文字数の割合が所定の基準以上となったテキスト群を特定する処理、及び前記テキスト群が含むテキストのうち文字列が一番長いもの以外を削除対象として特定し、当該削除対象の情報を出力する処理、をさらに実行する、
    ことを特徴とする請求項1に記載の書き起こし支援方法。
  8. 前記情報処理装置が、
    前記記憶装置において、前記単語区切りのテキストの確信度の情報と、前記テキストの起源となった各音声データの、発話開始及び発話終了の時刻情報と、集音をしたマイクデバイスの識別情報とを保持して、
    前記各音声データのうち、前記発話開始から前記発話終了までの間に関して重複する時間帯が存在し、かつ、前記マイクデバイスの識別情報が異なっているグループを特定する処理、前記グループ中の各音声データに関して得ている前記テキストの各間について、当該テキストそれぞれの総単語数、及び当該テキストの間で一致する単語数を算定する処理、前記テキストそれぞれの総単語数のうち少ないもので、前記一致する単語数を除算し、当該除算で得た値が予め定めた基準以上となったテキスト群を特定する処理、及び前記テキスト群が含むテキストのうち確信度が一番高いもの以外を削除対象として特定し、当該削除対象の情報を出力する処理、をさらに実行する、
    ことを特徴とする請求項1に記載の書き起こし支援方法。
  9. 音声認識対象となる音声データを保持する記憶装置と、
    前記音声データに対する音声認識処理により得た単語区切りのテキストと、前記音声データにおける前記単語の再生開始時間とを対応付けて記憶装置に格納する処理、及び前記テキストを画面表示させた状態で、ユーザから単語単位での再生指定を受け付けた場合、当該単語から始まる音声データを記憶部から読み出して予め定めた規定回数でリピート再生する処理、を実行する演算装置と、
    を含むことを特徴とする書き起こし支援装置。
  10. 前記演算装置は、
    前記リピート再生に際し、ユーザ指定の修正箇所である単語が、低確信度の単語の共起率が所定基準以上の文に含まれていることに応じ、前記音声データの再生回数の増加、再生速度の低減、および音量増大、の少なくともいずれかの出力制御を行うものである、
    ことを特徴とする請求項9に記載の書き起こし支援装置。
  11. 前記演算装置は、
    前記修正箇所のユーザ指定を受けた場合、当該修正箇所たる単語の確信度順に候補リストをポップアップ表示し、当該候補リスト中から、ユーザによる単語選択を受け付け、前記修正箇所の単語をユーザ選択の単語に更新するものである、
    ことを特徴とする請求項10に記載の書き起こし支援装置。
  12. 前記演算装置は、
    前記リピート再生に際し、前記規定回数のリピート再生の後、当該単語についてさらなるユーザ操作を受けた場合、当該操作の回数の累積程度に応じて、前記音声データの再生速度の低減および音量増大、の少なくともいずれかの出力制御を行うものである、
    ことを特徴とする請求項9に記載の書き起こし支援装置。
  13. 前記演算装置は、
    前記ユーザ操作を受け付ける際、未修正版の音声認識結果と、修正操作を反映した修正版の音声認識結果とを並列表示し、前記未修正版については修正操作を受け付け不可とする表示制御を実行するものである、
    ことを特徴とする請求項12に記載の書き起こし支援装置。
  14. 前記演算装置は、
    前記未修正版を起点に各修正版を修正履歴として記憶装置にて保持するものである、
    ことを特徴とする請求項13に記載の書き起こし支援装置。
  15. 前記記憶装置は、
    前記単語区切りのテキストの起源となった各音声データの、発話開始及び発話終了の時刻情報と、集音をしたマイクデバイスの識別情報とを保持し、
    前記演算装置は、
    前記各音声データのうち、前記発話開始から前記発話終了までの間に関して重複する時間帯が存在し、かつ、前記マイクデバイスの識別情報が異なっているグループを特定する処理、前記グループ中の各音声データに関して得ている前記テキストの各間について、当該テキストそれぞれの総単語数または総文字数における、当該テキストの間で一致する単語数または文字数の割合が所定の基準以上となったテキスト群を特定する処理、及び前記テキスト群が含むテキストのうち文字列が一番長いもの以外を削除対象として特定し、当該削除対象の情報を出力する処理、をさらに実行するものである、
    ことを特徴とする請求項9に記載の書き起こし支援装置。
  16. 前記記憶装置は、
    前記単語区切りのテキストの確信度の情報と、前記テキストの起源となった各音声データの、発話開始及び発話終了の時刻情報と、集音をしたマイクデバイスの識別情報とを保持し、
    前記演算装置は、
    前記各音声データのうち、前記発話開始から前記発話終了までの間に関して重複する時間帯が存在し、かつ、前記マイクデバイスの識別情報が異なっているグループを特定する処理、前記グループ中の各音声データに関して得ている前記テキストの各間について、当該テキストそれぞれの総単語数、及び当該テキストの間で一致する単語数を算定する処理、前記テキストそれぞれの総単語数のうち少ないもので、前記一致する単語数を除算し、当該除算で得た値が予め定めた基準以上となったテキスト群を特定する処理、及び前記テキスト群が含むテキストのうち確信度が一番高いもの以外を削除対象として特定し、当該削除対象の情報を出力する処理、をさらに実行するものである、
    ことを特徴とする請求項9に記載の書き起こし支援装置。
JP2019203694A 2019-11-11 2019-11-11 書き起こし支援方法及び書き起こし支援装置 Active JP7304269B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019203694A JP7304269B2 (ja) 2019-11-11 2019-11-11 書き起こし支援方法及び書き起こし支援装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019203694A JP7304269B2 (ja) 2019-11-11 2019-11-11 書き起こし支援方法及び書き起こし支援装置

Publications (2)

Publication Number Publication Date
JP2021076729A true JP2021076729A (ja) 2021-05-20
JP7304269B2 JP7304269B2 (ja) 2023-07-06

Family

ID=75900029

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019203694A Active JP7304269B2 (ja) 2019-11-11 2019-11-11 書き起こし支援方法及び書き起こし支援装置

Country Status (1)

Country Link
JP (1) JP7304269B2 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001202679A (ja) * 2000-01-17 2001-07-27 Aiwa Co Ltd 音声再生装置
JP2004212799A (ja) * 2003-01-07 2004-07-29 Telecommunication Advancement Organization Of Japan 書起し支援装置
JP2005228178A (ja) * 2004-02-16 2005-08-25 Nec Corp 書き起こしテキスト作成支援システムおよびプログラム
JP2019148681A (ja) * 2018-02-27 2019-09-05 富士通株式会社 テキスト修正装置、テキスト修正方法およびテキスト修正プログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001202679A (ja) * 2000-01-17 2001-07-27 Aiwa Co Ltd 音声再生装置
JP2004212799A (ja) * 2003-01-07 2004-07-29 Telecommunication Advancement Organization Of Japan 書起し支援装置
JP2005228178A (ja) * 2004-02-16 2005-08-25 Nec Corp 書き起こしテキスト作成支援システムおよびプログラム
JP2019148681A (ja) * 2018-02-27 2019-09-05 富士通株式会社 テキスト修正装置、テキスト修正方法およびテキスト修正プログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
萩原愛子,外4名: ""番組制作支援のための音声認識を用いた書き起こしシステム"", 情報処理学会研究報告, vol. Vol.2018-SLP-124,No.5, JPN6023002522, 10 October 2018 (2018-10-10), JP, pages 1 - 6, ISSN: 0004977055 *

Also Published As

Publication number Publication date
JP7304269B2 (ja) 2023-07-06

Similar Documents

Publication Publication Date Title
US11699456B2 (en) Automated transcript generation from multi-channel audio
US7734996B2 (en) Documentation browsing method, documentation browsing apparatus, documentation browsing robot, and documentation browsing program
US8407049B2 (en) Systems and methods for conversation enhancement
US20040064322A1 (en) Automatic consolidation of voice enabled multi-user meeting minutes
JP6618992B2 (ja) 発言提示装置、発言提示方法およびプログラム
US20080208574A1 (en) Name synthesis
TWI807428B (zh) 一同管理與語音檔有關的文本轉換記錄和備忘錄的方法、系統及電腦可讀記錄介質
US20230163988A1 (en) Computer-implemented system and method for providing an artificial intelligence powered digital meeting assistant
US20090044105A1 (en) Information selecting system, method and program
US20240176957A1 (en) Systems and methods for inserting dialogue into a query response
JP2009122839A (ja) 電子会議支援システム
US20110113357A1 (en) Manipulating results of a media archive search
JP3896760B2 (ja) 対話記録編集装置、方法及び記憶媒体
US20030097253A1 (en) Device to edit a text in predefined windows
JP7304269B2 (ja) 書き起こし支援方法及び書き起こし支援装置
US11086592B1 (en) Distribution of audio recording for social networks
JP2019197210A (ja) 音声認識誤り修正支援装置およびそのプログラム
Walter-Tscharf Multi-tenant Cloud SaaS Application for a meeting to task transition via deep learning models
US20090240734A1 (en) System and methods for the creation, review and synchronization of digital media to digital audio data
KR102291113B1 (ko) 회의록 작성 장치 및 방법
JP2005025571A (ja) 業務支援装置、業務支援方法およびそのプログラム
KR20220046165A (ko) 앱과 웹의 연동을 통해 음성 파일에 대한 메모를 작성하는 방법, 시스템, 및 컴퓨터 판독가능한 기록 매체
WO2024171284A1 (ja) 情報提供装置、情報提供方法、および情報受信装置
US20230230588A1 (en) Extracting filler words and phrases from a communication session
CN109997128A (zh) 知识构建应用系统及程序

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220302

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230120

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230131

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230308

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230620

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230626

R150 Certificate of patent or registration of utility model

Ref document number: 7304269

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150