JP6830148B1 - 修正候補特定装置、修正候補特定方法及び修正候補特定プログラム - Google Patents

修正候補特定装置、修正候補特定方法及び修正候補特定プログラム Download PDF

Info

Publication number
JP6830148B1
JP6830148B1 JP2019224221A JP2019224221A JP6830148B1 JP 6830148 B1 JP6830148 B1 JP 6830148B1 JP 2019224221 A JP2019224221 A JP 2019224221A JP 2019224221 A JP2019224221 A JP 2019224221A JP 6830148 B1 JP6830148 B1 JP 6830148B1
Authority
JP
Japan
Prior art keywords
sentence
similarity
word
sentences
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019224221A
Other languages
English (en)
Other versions
JP2021092713A (ja
Inventor
智洋 細川
智洋 細川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Information Systems Corp
Original Assignee
Mitsubishi Electric Information Systems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Information Systems Corp filed Critical Mitsubishi Electric Information Systems Corp
Priority to JP2019224221A priority Critical patent/JP6830148B1/ja
Application granted granted Critical
Publication of JP6830148B1 publication Critical patent/JP6830148B1/ja
Publication of JP2021092713A publication Critical patent/JP2021092713A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】計算負荷を抑えつつ、適切に修正候補を特定可能にする。【解決手段】単語抽出部22は、複数の文章から構成されるテキストデータに含まれる単語を抽出する。類似度計算部25は、複数の文章それぞれを対象文章とし、対象文章の前と後との少なくともいずれかの文章を相手文章として、対象文章から抽出された単語と、相手文章から抽出された単語との類似度を時系列類似度として計算する。候補特定部26は、複数の文章それぞれを対象文章として、対象文章について計算された時系列類似度が第1閾値よりも低い場合に、対象文章を修正候補として特定する。【選択図】図2

Description

この発明は、複数の文章から構成されるテキストデータの修正が必要な個所を推定する技術に関する。
音声認識技術を用いて会話をテキストデータに変換することが行われている。例えば、会議室に複数の音声収集装置が設けられ、会議室での会話の音声データが収集され、テキストデータに変換される。この際、各音声収集装置が音声ミキサー装置によって1つの音声データに集約された上で、音声認識技術を用いてテキストデータに変換される。これにより、会議で話された内容がテキストデータとして保存される。
しかし、テキストデータには誤りが含まれている可能性がある。誤りとしては、音声の誤認識と、認識された音声の同音異義語への誤変換等がある。そのため、正しいテキストデータを得るためには、テキストデータを人手により確認して、正しく修正する作業を行う必要がある。
特許文献1には、第1の言語モデルにより認識されたテキストデータにおける修正候補を特定して、第2の言語モデルにより補正を行う技術が記載されている。
特許文献1では、単語の出現頻度に基づき特徴語の集合が抽出される。そして、特徴語に含まれない特異語と特徴語との類似度が計算され、類似度が低い特異語が修正候補として特定される。
特開2012−18201号公報
特許文献1に記載された技術では、テキストデータに含まれる各単語の出現頻度を計算する。そのため、計算負荷が高い。
この発明は、計算負荷を抑えつつ、適切に修正候補を特定可能にすることを目的とする。
この発明に係る修正候補特定装置は、
複数の文章から構成されるテキストデータに含まれる単語を抽出する単語抽出部と、
前記複数の文章それぞれを対象文章とし、前記対象文章の前と後との少なくともいずれかの文章を相手文章として、前記単語抽出部によって前記対象文章から抽出された単語と、前記単語抽出部によって前記相手文章から抽出された単語との類似度を時系列類似度として計算する類似度計算部と、
前記複数の文章それぞれを対象文章として、前記対象文章について前記類似度計算部によって計算された前記時系列類似度が第1閾値よりも低い場合に、前記対象文章を修正候補として特定する候補特定部と
を備える。
前記類似度計算部は、前記候補特定部によって特定された前記修正候補以外の文章を比較文章として、前記修正候補から抽出された単語と、前記比較文章それぞれから抽出された単語との間の類似度を組合せ類似度として計算し、
前記候補特定部は、比較文章から抽出されたどの単語についての前記組合せ類似度も第2閾値よりも低い場合に、前記修正候補から抽出された単語を修正対象として特定する。
前記テキストデータは、複数の音声収集装置それぞれによって収集された音声データが変換された部分テキストデータを合成することによって生成された。
前記類似度計算部は、前記修正候補を含む部分テキストデータ以外の部分テキストデータに含まれる文章を前記比較対象として、前記組合せ類似度を計算する。
前記修正候補特定装置は、さらに、
前記単語抽出部によって抽出された単語を対象単語として、前記対象単語の意味を表す表現ベクトルを生成するベクトル生成部
を備え、
前記類似度計算部は、前記ベクトル生成部によって生成された前記表現ベクトルを用いて、前記類似度を計算する。
前記類似度計算部は、一方の文章から抽出された単語についての前記表現ベクトルと、他方の文章から抽出された単語についての前記表現ベクトルとの内積を前記類似度として計算する。
この発明に係る修正候補特定方法は、
単語抽出部が、複数の文章から構成されるテキストデータに含まれる単語を抽出し、
類似度計算部が、前記複数の文章それぞれを対象文章とし、前記対象文章の前と後との少なくともいずれかの文章を相手文章として、前記対象文章から抽出された単語と、前記相手文章から抽出された単語との類似度を時系列類似度として計算し、
候補特定部が、前記複数の文章それぞれを対象文章として、前記対象文章について計算された前記時系列類似度が第1閾値よりも低い場合に、前記対象文章を修正候補として特定する。
この発明に係る修正候補特定プログラムは、
複数の文章から構成されるテキストデータに含まれる単語を抽出する単語抽出処理と、
前記複数の文章それぞれを対象文章とし、前記対象文章の前と後との少なくともいずれかの文章を相手文章として、前記単語抽出処理によって前記対象文章から抽出された単語と、前記単語抽出処理によって前記相手文章から抽出された単語との類似度を時系列類似度として計算する類似度計算処理と、
前記複数の文章それぞれを対象文章として、前記対象文章について前記類似度計算処理によって計算された前記時系列類似度が第1閾値よりも低い場合に、前記対象文章を修正候補として特定する候補特定処理と
を行う修正候補特定装置としてコンピュータを機能させる。
この発明では、複数の文章それぞれを対象文章とし、対象文章の前と後との少なくともいずれかの文章を相手文章として、時系列類似度として計算することにより、修正候補を特定する。これにより、計算負荷を抑えつつ、適切に修正候補を特定可能になる。
実施の形態1に係る音声認識システム1の構成図。 実施の形態1に係る修正候補特定装置10の構成図。 実施の形態1に係る修正候補特定装置10の動作を示すフローチャート。 実施の形態1に係る部分テキストデータ51の説明図。 Skip−Gramモデルの説明図。 実施の形態1に係る合成テキストデータ54の説明図。 実施の形態1に係る時系列類似度計算処理の説明図。 実施の形態1に係る候補特定処理の説明図。 変形例4に係る修正候補特定装置10の構成図。 実施の形態2に係る修正候補特定装置10の動作を示すフローチャート。 実施の形態2に係る組合せ類似度計算処理の説明図。
実施の形態1.
***構成の説明***
図1を参照して、実施の形態1に係る音声認識システム1の構成を説明する。
音声認識システム1は、修正候補特定装置10と、複数の音声収集装置41と、複数の音声認識装置42とを備える。
修正候補特定装置10は、音声認識されたテキストデータにおける修正候補を特定するコンピュータである。修正候補は、音声認識に誤りがある可能性があり、修正が必要と推定される箇所を示す。ここでは、音声認識の誤りは、音声の誤認識と、認識された音声の同音異義語への誤変換との少なくともいずれかである。各音声収集装置41は、音声データを収集する装置である。各音声収集装置41は、具体例としては、マイクロフォンである。各音声認識装置42は、音声認識技術により音声データをテキストデータに変換する装置である。
なお、図1では、音声収集装置41毎に音声認識装置42が設けられている。しかし、これに限らず、複数の音声収集装置41に対して1つの音声認識装置42が設けられていてもよい。
実施の形態1では、人毎に音声収集装置41が設けられており、各音声収集装置41に対応する人が話をしているとする。これは、例えば、ウェブ会議を行っており、会議の参加者がそれぞれ異なる場所にいるような場合が想定される。また、会議室において、席毎に音声収集装置41が設けられている場合が想定される。
図2を参照して、実施の形態1に係る修正候補特定装置10の構成を説明する。
修正候補特定装置10は、プロセッサ11と、メモリ12と、ストレージ13と、通信インタフェース14とのハードウェアを備える。プロセッサ11は、信号線を介して他のハードウェアと接続され、これら他のハードウェアを制御する。
プロセッサ11は、プロセッシングを行うIC(Integrated Circuit)である。プロセッサ11は、具体例としては、CPU(Central Processing Unit)、DSP(Digital Signal Processor)、GPU(Graphics Processing Unit)である。
メモリ12は、データを一時的に記憶する記憶装置である。メモリ12は、具体例としては、SRAM(Static Random Access Memory)、DRAM(Dynamic Random Access Memory)である。
ストレージ13は、データを保管する記憶装置である。ストレージ13は、具体例としては、HDD(Hard Disk Drive)である。また、ストレージ13は、SD(登録商標,Secure Digital)メモリカード、CF(CompactFlash,登録商標)、NANDフラッシュ、フレキシブルディスク、光ディスク、コンパクトディスク、ブルーレイ(登録商標)ディスク、DVD(Digital Versatile Disk)といった可搬記録媒体であってもよい。
通信インタフェース14は、外部の装置と通信するためのインタフェースである。通信インタフェース14は、具体例としては、Ethernet(登録商標)、USB(Universal Serial Bus)、HDMI(登録商標,High−Definition Multimedia Interface)のポートである。
修正候補特定装置10は、機能構成要素として、データ取得部21と、単語抽出部22と、ベクトル生成部23と、テキスト合成部24と、類似度計算部25と、候補特定部26とを備える。修正候補特定装置10の各機能構成要素の機能はソフトウェアにより実現される。
ストレージ13には、修正候補特定装置10の各機能構成要素の機能を実現するプログラムが格納されている。このプログラムは、プロセッサ11によりメモリ12に読み込まれ、プロセッサ11によって実行される。これにより、修正候補特定装置10の各機能構成要素の機能が実現される。
図2では、プロセッサ11は、1つだけ示されていた。しかし、プロセッサ11は、複数であってもよく、複数のプロセッサ11が、各機能を実現するプログラムを連携して実行してもよい。
***動作の説明***
図3から図8を参照として、実施の形態1に係る修正候補特定装置10の動作を説明する。
実施の形態1に係る修正候補特定装置10の動作手順は、実施の形態1に係る修正候補特定方法に相当する。また、実施の形態1に係る修正候補特定装置10の動作を実現するプログラムは、実施の形態1に係る修正候補特定プログラムに相当する。
(図3のステップS1:データ取得処理)
データ取得部21は、各音声収集装置41で収集された音声データが各音声認識装置42によって変換されたテキストデータである部分テキストデータ51を取得する。
具体的には、各音声収集装置41で、その音声収集装置41に割り当てられた人が発話した音声データが収集される。すると、各音声収集装置41で収集された音声が、その音声収集装置41に対応する音声認識装置42で音声データが変換され、部分テキストデータ51が生成される。データ取得部21は、各音声認識装置42で生成された部分テキストデータ51を取得する。
図4に示すように、各部分テキストデータ51は、複数の文章52を含んでいる。発話する間隔が基準時間以上空いた場合に、別の文章52として認識されて、部分テキストデータ51が生成される。各文章52には、発話が開始された時刻が設定される。
(図3のステップS2:単語抽出処理)
単語抽出部22は、ステップS1で取得された各部分テキストデータ51を対象の部分テキストデータ51として、対象の部分テキストデータ51に含まれる単語を抽出する。
具体的には、単語抽出部22は、既存の単語抽出技術を用いて、対象の部分テキストデータ51に含まれる単語を抽出する。具体例としては、単語抽出部22は、対象の部分テキストデータ51について、形態素解析を行い、名詞と動詞と形容詞といった特定の品詞を抽出することにより、対象の部分テキストデータ51に含まれる単語を抽出する。
(図3のステップS3:ベクトル生成処理)
ベクトル生成部23は、ステップS2で抽出された各単語を対象単語として、対象単語の意味を表す表現ベクトル53を生成する。
具体的には、ベクトル生成部23は、Skip−Gramモデル又はCBoW(Continuous Bag−of−Words)といった技術を用いて、対象単語についての表現ベクトル53を生成する。実施の形態1では、Skip−Gramモデルを用いる場合を例として説明する。
Skip−Gramモデルを用いて表現ベクトル53を生成する方法を説明する。
事前準備として、ベクトル生成部23は、部分テキストデータ51に含まれると予想される単語を含む多数の文章のテキストデータをSkip−Gramモデルに与える。例えば、会議の会話の音声データが変換された部分テキストデータ51が取得される場合には、過去の会議の議事録のテキストデータをSkip−Gramモデルに与えることが考えられる。
これにより、Skip−Gramモデルに与えられたテキストデータに含まれる各単語について、その単語の周辺に現れると予測される単語を表すベクトルが生成される。具体的には、図5に示すように、各単語について、その単語の周辺に他の単語が現れる確率を要素として持つベクトルが生成される。なお、図5では、各単語について、3個の要素を持つベクトルが示されている。しかし、実際には、各単語について、数百個といった多数の要素を持つベクトルが生成される。
ここで、類似した単語については、その単語の周辺に現れる単語が類似する。そのため、類似した単語については類似した要素を持つベクトルが生成される。
ベクトル生成部23は、各単語についてのベクトルをストレージ13に記憶する。なお、ベクトル生成部23は、各単語についてのベクトルを、修正候補特定装置10の外部の記憶装置に記憶してもよい。
そして、ステップS2で単語が抽出されると、ベクトル生成部23は、抽出された単語である対象単語についてのベクトルをストレージ13から検索する。ベクトル生成部23は、検索にヒットしたベクトルを、対象単語についての表現ベクトル53に設定する。これにより、対象単語についての表現ベクトル53が生成される。
(図3のステップS4:テキスト合成処理)
テキスト合成部24は、ステップS1で取得された各部分テキストデータ51を合成して合成テキストデータ54を生成する。
具体的には、テキスト合成部24は、各部分テキストデータ51に含まれる文章52を時系列に並べて合成することにより、合成テキストデータ54を生成する。具体例としては、図4に示す2人が会話した音声データが変換された2つの部分テキストデータ51を合成する。すると、図6に示すように、会話された順に文章52が並んだ合成テキストデータ54が生成される。合成テキストデータ54の各文章52には、元の部分テキストデータ51を示す元識別子55が付される。図6では、図4の左側の部分テキストデータ51については元識別子として“01”が付され、図4の右側の部分テキストデータ51については元識別子として“02”が付されている。
(図3のステップS5:時系列類似度計算処理)
類似度計算部25は、ステップS4で生成された合成テキストデータ54に含まれる複数の文章52それぞれを対象文章とし、対象文章の前と後との少なくともいずれかの文章52を相手文章として設定する。実施の形態1では、類似度計算部25は、対象文章の前と後とに文章52がある場合には、対象文章の前の文章52と後の文章52とをそれぞれ相手文章として設定する。
そして、類似度計算部25は、ステップS2で対象文章から抽出された単語と、ステップS2で相手文章から抽出された単語との類似度を時系列類似度として計算する。対象文章と相手文章との少なくともいずれかから複数の単語が抽出されている場合には、類似度計算部25は、対象文章から抽出された単語と、相手文章から抽出された単語との各組合せについて類似度を計算する。そして、類似度計算部25は、各組合せについての類似度の平均値又は中央値を時系列類似度として計算する。
図7に示すように、合成テキストデータ54における単語が抽出されたとする。図7では、下線が引かれた単語がステップS2で抽出されているとする。すると、例えば、ID001の文章52が対象文章である場合には、ID002の文章52が相手文章として設定される。また、ID002の文章52が対象文章である場合には、ID001の文章52とID003の文章52とがそれぞれ相手文章として設定される。
そして、ID001の文章52が対象文章である場合には、相手文章であるID002の文章52との時系列類似が次のように計算される。ID001の文章52からは、“A”と“お世話”とが単語として抽出されている。また、ID002の文章52からは、“B”と“お世話”とが単語として抽出されている。そこで、“A”と“B”との組合せと、“A”と“お世話”との組合せと、“お世話”と“B”との組合せと、“お世話”と“お世話”との組合せとの4つの組合せそれぞれについての類似度が計算される。そして、4つの組合せについての類似度の平均値が時系列類似度として計算される。
類似度計算部25は、対象文章から抽出された単語についてステップS3で生成された表現ベクトル53と、相手文章から抽出された単語についてステップS3で生成された表現ベクトル53とを用いて、類似度を計算する。具体的には、類似度計算部25は、対象文章から抽出された単語についての表現ベクトル53と、相手文章から抽出された単語についての表現ベクトル53との内積を類似度として計算する。
具体例として“打合せ”という単語と、“会議”という単語との類似度の計算方法を説明する。図5に示すように、“打合せ”という単語の表現ベクトル53の要素は、{0.3,0.2,0.6}である。“会議”という単語の表現ベクトル53の要素は、{0.5,0.1,0.8}である。したがって、類似度は、0.3×0.5+0.2×0.1+0.6×0.8=0.65である。
(図3のステップS6:候補特定処理)
候補特定部26は、ステップS4で生成された合成テキストデータ54に含まれる複数の文章52それぞれを対象文章として、対象文章についてステップS5で計算された時系列類似度が第1閾値よりも低いか否かを判定する。候補特定部26は、時系列類似度が第1閾値よりも低い場合に、対象文章を修正候補として特定する。候補特定部26は、対象文章の前と後とに文章52がある場合には、前の文章52との時系列類似度と、後の文章52との時系列類似度とのどちらも第1閾値よりも低い場合に、対象文章を修正候補として特定する。
図8に示すように、各文章52について時系列類似度が計算され、第1閾値が0.6である場合には、ID004の文章52が修正候補として特定される。
***実施の形態1の効果***
以上のように、実施の形態1に係る修正候補特定装置10は、時系列に文章52間の類似度を計算して、類似度が低い文章52を修正候補として特定する。これにより、合成テキストデータ54に含まれる全ての単語の出現頻度を求めることなく、修正候補となる文章52を特定可能である。その結果、計算負荷を抑えつつ、適切に修正候補を特定可能になる。
複数の人が会話をした場合には、前後いずれかの文章52と関連のある内容を話すと想定される。したがって、時系列に文章52間の類似度を計算して、類似度が低い文章52を修正候補として特定することにより、適切に修正候補を特定可能である。
実施の形態1では、人毎に音声収集装置41が設けられている。この場合には、複数の人の音声が重なって記録され難いため、音声認識の精度が高くなる。一方、他の人の発話した内容が考慮されずに文字変換されるため、同音異義語への誤変換が起こり易くなる。例えば、図8のID003の文章52と、ID004の文章52とは別の部分テキストデータ51に含まれる文章52である。そのため、ID004の文章52の生成時には、ID003の文章52に関しては考慮されずに文字変換が行われる。その結果、“雨”ではなく“飴”という誤変換が起こり易くなっている。
実施の形態1に係る修正候補特定装置10は、時系列に文章52間の類似度を計算することにより、他の部分テキストデータ51における前後の文章52との関係から修正候補が特定される。そのため、人毎に音声収集装置41が設けられているような場合に特に効果を発揮する。
***他の構成***
<変形例1>
実施の形態1では、類似度計算部25は、表現ベクトル53の内積を時系列類似度として計算した。しかし、類似度計算部25は、対象文章から抽出された単語についての表現ベクトル53と、相手文章から抽出された単語についての表現ベクトル53とコサイン類似度を時系列類似度として計算してもよい。
<変形例2>
図3のステップS3で一部の単語についてのベクトルが記憶されておらず、表現ベクトル53を生成できない可能性がある。表現ベクトル53を生成できない単語がある場合には、その単語を含む文章52を、表現ベクトル53を生成できない単語がある文章52として特定してもよい。
表現ベクトル53を生成できない単語は、誤認識された単語である可能性がある。そのため、表現ベクトル53を生成できない単語がある文章52として特定することにより、適切に修正すべき候補を特定可能である。
この際、図3のステップS6で特定された修正候補と、表現ベクトル53を生成できない単語がある文章52とを別々に提示してもよい。
<変形例3>
実施の形態1では、対象文章の前と後との少なくともいずれかの文章52を相手文章として設定した。相手文章は、対象文章の直前または直後の文章52だけでなく、複数の文章52を相手文章として設定してもよい。例えば対象文章より前にあり、対象文章と異なる元識別子55を有する文章52を相手文章としてもよい。また対象文章より後にあり、対象文章と異なる元識別子55を有する文章52を相手文章としてもよい。
<変形例4>
実施の形態1では、各機能構成要素がソフトウェアで実現された。しかし、変形例4として、各機能構成要素はハードウェアで実現されてもよい。この変形例4について、実施の形態1と異なる点を説明する。
図9を参照して、変形例4に係る修正候補特定装置10の構成を説明する。
各機能構成要素がハードウェアで実現される場合には、修正候補特定装置10は、プロセッサ11とメモリ12とストレージ13とに代えて、電子回路15を備える。電子回路15は、各機能構成要素と、メモリ12と、ストレージ13との機能とを実現する専用の回路である。
電子回路15としては、単一回路、複合回路、プログラム化したプロセッサ、並列プログラム化したプロセッサ、ロジックIC、GA(Gate Array)、ASIC(Application Specific Integrated Circuit)、FPGA(Field−Programmable Gate Array)が想定される。
各機能構成要素を1つの電子回路15で実現してもよいし、各機能構成要素を複数の電子回路15に分散させて実現してもよい。
<変形例5>
変形例5として、一部の各機能構成要素がハードウェアで実現され、他の各機能構成要素がソフトウェアで実現されてもよい。
プロセッサ11とメモリ12とストレージ13と電子回路15とを処理回路という。つまり、各機能構成要素の機能は、処理回路により実現される。
実施の形態2.
実施の形態2は、修正候補からさらに修正対象となる箇所を絞り込む点が実施の形態1と異なる。実施の形態2では、この異なる点を説明して、同一の点については説明を省略する。
***動作の説明***
図10及び図11を参照として、実施の形態2に係る修正候補特定装置10の動作を説明する。
実施の形態2に係る修正候補特定装置10の動作手順は、実施の形態2に係る修正候補特定方法に相当する。また、実施の形態2に係る修正候補特定装置10の動作を実現するプログラムは、実施の形態2に係る修正候補特定プログラムに相当する。
ステップS1からステップS6の処理は、実施の形態1と同じである。
(図10のステップS7:組合せ類似度計算処理)
類似度計算部25は、ステップS6で特定された各修正候補を対象の修正候補に設定する。類似度計算部25は、対象の修正候補以外の文章52を比較文章として、対象の修正候補から抽出された単語と、比較文章それぞれから抽出された各単語との間の類似度を組合せ類似度として計算する。対象の修正候補から複数の単語が抽出された場合には、類似度計算部25は、対象の修正候補から抽出された各単語と、比較文章それぞれから抽出された各単語との類似度を組合せ類似度として計算する。
図11に示すように、ID004の文章52が修正候補として特定されたとする。この場合には、類似度計算部25は、ID001,ID002,ID003,ID005,ID006の各文章52を比較文章として設定する。そして、ID004の文章52から抽出された“最近”と“飴”とのそれぞれの単語について、比較文章から抽出された各単語との類似度を組合せ類似度として計算する。なお、類似度計算部25は、ステップS5と同様に、修正候補から抽出された単語についての表現ベクトル53と、比較対象から抽出された単語についての表現ベクトル53とを用いて、類似度を計算する。
(図10のステップS8:修正対象特定処理)
候補特定部26は、修正候補から抽出された各単語を対象の単語に設定する。候補特定部26は、比較文章から抽出された各単語について、ステップS7で計算された対象の単語との組合せ類似度が第2閾値よりも低いか否かを判定する。候補特定部26は、比較文章から抽出された全ての単語について、対象の単語との組合せ類似度が第2閾値よりも低い場合に、修正候補から抽出された単語を修正対象として特定する。
図11の場合には、“最近”は、ID003の文章52における“明日”との類似度が第2閾値よりも高くなる。一方、“飴”は、全ての単語との類似度が第2閾値よりも低くなる。その結果、ID004の文章52における“飴”が修正対象として特定される。
***実施の形態2の効果***
以上のように、実施の形態2に係る修正候補特定装置10は、修正候補からさらに修正対象となる箇所を絞り込む。これにより、実施の形態1に比べ、修正作業に係る手間を減らすことが可能である。
例えば、直前の文章52よりも前の文章52と関連する内容の文章52が修正候補となっている場合には、修正候補に含まれる単語は、直前の文章52よりも前の文章52の単語と類似している可能性がある。実施の形態2では、修正候補の文章52に対して、他の文章52全てを比較文章として、全ての単語に対する組み合わせ類似度を計算する。
このように、実施の形態2に係る修正候補特定装置10は、修正候補の文章52に対して、文章52全体との組み合わせ類似度を計算したうえで、より確度が高い修正候補を特定することができるという効果も奏する。
***他の構成***
<変形例6>
図10のステップS8で、候補特定部26は、比較文章から抽出された全ての単語について、対象の単語との組合せ類似度が第2閾値よりも低い単語を、修正対象として特定した。候補特定部26は、比較文章から抽出された全ての単語について対象の単語との組合せ類似度を計算したとき、いずれかの単語との組合せ類似度が第2閾値より高い単語を、修正候補が除外するように動作してもよい。この場合、除外されない単語が修正候補となる。
また候補特定部26は、比較文章から抽出された全ての単語について対象の単語との組合せ類似度を計算し、対象の単語ごとに組合せ類似度の最大値を特定する。この組合せ類似度の最大値が一番低いものを修正候補として特定するように、動作してもよい。あるいは、この組合せ類似度の最大値が高い順から一定量を修正候補から除外するように、動作してもよい。
<変形例7>
実施の形態2では、類似度計算部25は、対象の修正候補以外の文章52を比較文章とした。しかし、類似度計算部25は、対象の修正候補以外の文章52のうち、対象の修正候補と異なる元識別子55が付された文章52だけを比較文章としてもよい。
これにより、対象の修正候補の元になった音声データを発話した人とは別の人が発話した音声データから生成された文章52だけが比較文章となる。人によって単語のイントネーションに癖がある場合がある。これが原因となり、同じ人が発話した音声データから生成された文章52には、同じ誤りが含まれる可能性がある。例えば、“あめ(雨)”と発話した場合に、ある人が発話すると何度も“雨”ではなく“飴”と誤認識されてしまう場合がある。
そのため、対象の修正候補の元になった音声データを発話した人の他の文章52を比較文章としてしまうと、比較文章にも同じ誤りが含まれており、適切に修正対象を特定できない可能性がある。これに対して、変形例7に係る方法であれば、適切に修正対象を特定可能になる。
以上、この発明の実施の形態及び変形例について説明した。これらの実施の形態及び変形例のうち、いくつかを組み合わせて実施してもよい。また、いずれか1つ又はいくつかを部分的に実施してもよい。なお、この発明は、以上の実施の形態及び変形例に限定されるものではなく、必要に応じて種々の変更が可能である。
10 修正候補特定装置、11 プロセッサ、12 メモリ、13 ストレージ、14 通信インタフェース、15 電子回路、21 データ取得部、22 単語抽出部、23 ベクトル生成部、24 テキスト合成部、25 類似度計算部、26 候補特定部、41 音声収集装置、42 音声認識装置、51 部分テキストデータ、52 文章、53 表現ベクトル、54 合成テキストデータ、55 元識別子。

Claims (8)

  1. 複数の文章から構成されるテキストデータに含まれる単語を抽出する単語抽出部と、
    前記複数の文章それぞれを対象文章とし、前記対象文章の前と後との少なくともいずれかの文章を相手文章として、前記単語抽出部によって前記対象文章から抽出された単語と、前記単語抽出部によって前記相手文章から抽出された単語との類似度を時系列類似度として計算する類似度計算部と、
    前記複数の文章それぞれを対象文章として、前記対象文章について前記類似度計算部によって計算された前記時系列類似度が第1閾値よりも低い場合に、前記対象文章を修正候補として特定する候補特定部と
    を備える修正候補特定装置。
  2. 前記類似度計算部は、前記候補特定部によって特定された前記修正候補以外の文章を比較文章として、前記修正候補から抽出された単語と、前記比較文章それぞれから抽出された単語との間の類似度を組合せ類似度として計算し、
    前記候補特定部は、比較文章から抽出されたどの単語についての前記組合せ類似度も第2閾値よりも低い場合に、前記修正候補から抽出された単語を修正対象として特定する
    請求項1に記載の修正候補特定装置。
  3. 前記テキストデータは、複数の音声収集装置それぞれによって収集された音声データが変換された部分テキストデータを合成することによって生成された
    請求項2に記載の修正候補特定装置。
  4. 前記類似度計算部は、前記修正候補を含む部分テキストデータ以外の部分テキストデータに含まれる文章を前記比較文章として、前記組合せ類似度を計算する
    請求項3に記載の修正候補特定装置。
  5. 前記修正候補特定装置は、さらに、
    前記単語抽出部によって抽出された単語を対象単語として、前記対象単語の意味を表す表現ベクトルを生成するベクトル生成部
    を備え、
    前記類似度計算部は、前記ベクトル生成部によって生成された前記表現ベクトルを用いて、前記類似度を計算する
    請求項1から4までのいずれか1項に記載の修正候補特定装置。
  6. 前記類似度計算部は、一方の文章から抽出された単語についての前記表現ベクトルと、他方の文章から抽出された単語についての前記表現ベクトルとの内積を前記類似度として計算する
    請求項5に記載の修正候補特定装置。
  7. 単語抽出部が、複数の文章から構成されるテキストデータに含まれる単語を抽出し、
    類似度計算部が、前記複数の文章それぞれを対象文章とし、前記対象文章の前と後との少なくともいずれかの文章を相手文章として、前記対象文章から抽出された単語と、前記相手文章から抽出された単語との類似度を時系列類似度として計算し、
    候補特定部が、前記複数の文章それぞれを対象文章として、前記対象文章について計算された前記時系列類似度が第1閾値よりも低い場合に、前記対象文章を修正候補として特定する修正候補特定方法。
  8. 複数の文章から構成されるテキストデータに含まれる単語を抽出する単語抽出処理と、
    前記複数の文章それぞれを対象文章とし、前記対象文章の前と後との少なくともいずれかの文章を相手文章として、前記単語抽出処理によって前記対象文章から抽出された単語と、前記単語抽出処理によって前記相手文章から抽出された単語との類似度を時系列類似度として計算する類似度計算処理と、
    前記複数の文章それぞれを対象文章として、前記対象文章について前記類似度計算処理によって計算された前記時系列類似度が第1閾値よりも低い場合に、前記対象文章を修正候補として特定する候補特定処理と
    を行う修正候補特定装置としてコンピュータを機能させる修正候補特定プログラム。
JP2019224221A 2019-12-12 2019-12-12 修正候補特定装置、修正候補特定方法及び修正候補特定プログラム Active JP6830148B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019224221A JP6830148B1 (ja) 2019-12-12 2019-12-12 修正候補特定装置、修正候補特定方法及び修正候補特定プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019224221A JP6830148B1 (ja) 2019-12-12 2019-12-12 修正候補特定装置、修正候補特定方法及び修正候補特定プログラム

Publications (2)

Publication Number Publication Date
JP6830148B1 true JP6830148B1 (ja) 2021-02-17
JP2021092713A JP2021092713A (ja) 2021-06-17

Family

ID=74562482

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019224221A Active JP6830148B1 (ja) 2019-12-12 2019-12-12 修正候補特定装置、修正候補特定方法及び修正候補特定プログラム

Country Status (1)

Country Link
JP (1) JP6830148B1 (ja)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009187349A (ja) * 2008-02-07 2009-08-20 Nec Corp 文章修正支援システム、文章修正支援方法、および文章修正支援用プログラム
JP2012018201A (ja) * 2010-07-06 2012-01-26 Hitachi Ltd テキスト補正方法及び認識方法
JP2019138989A (ja) * 2018-02-08 2019-08-22 キヤノン株式会社 情報処理装置、情報処理方法、及びプログラム

Also Published As

Publication number Publication date
JP2021092713A (ja) 2021-06-17

Similar Documents

Publication Publication Date Title
CN109493850B (zh) 成长型对话装置
CN108766414B (zh) 用于语音翻译的方法、装置、设备和计算机可读存储介质
EP3994683B1 (en) Multilingual neural text-to-speech synthesis
US8972260B2 (en) Speech recognition using multiple language models
US20150325240A1 (en) Method and system for speech input
CN109686383B (zh) 一种语音分析方法、装置及存储介质
JP6469252B2 (ja) アカウント追加方法、端末、サーバ、およびコンピュータ記憶媒体
KR20190082900A (ko) 음성 인식 방법, 전자 디바이스, 및 컴퓨터 저장 매체
CN110853615B (zh) 一种数据处理方法、装置及存储介质
US20150179173A1 (en) Communication support apparatus, communication support method, and computer program product
JP2006098993A (ja) 音声処理装置およびそのためのコンピュータプログラム
JP6323947B2 (ja) 音響イベント認識装置、及びプログラム
KR20180121831A (ko) 흥미 판정 장치, 흥미 판정 방법, 및 기억 매체
JP6873805B2 (ja) 対話支援システム、対話支援方法、及び対話支援プログラム
US20230070000A1 (en) Speech recognition method and apparatus, device, storage medium, and program product
CN112017633B (zh) 语音识别方法、装置、存储介质及电子设备
KR20240053639A (ko) 제한된 스펙트럼 클러스터링을 사용한 화자-턴 기반 온라인 화자 구분
CN111415128A (zh) 控制会议的方法、系统、装置、设备和介质
CN111402892A (zh) 一种基于语音识别的会议记录模板生成方法
US11893813B2 (en) Electronic device and control method therefor
JP7014142B2 (ja) キーワード抽出装置、キーワード抽出方法、およびプログラム
JP2013050605A (ja) 言語モデル切替装置およびそのプログラム
JP6830148B1 (ja) 修正候補特定装置、修正候補特定方法及び修正候補特定プログラム
CN114203180A (zh) 会议纪要的生成方法、装置、电子设备及存储介质
CN113051426A (zh) 音频信息分类方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191212

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210112

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210125

R150 Certificate of patent or registration of utility model

Ref document number: 6830148

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250