JPWO2018016140A1 - 情報処理装置、情報処理方法、およびプログラム - Google Patents
情報処理装置、情報処理方法、およびプログラム Download PDFInfo
- Publication number
- JPWO2018016140A1 JPWO2018016140A1 JP2018528405A JP2018528405A JPWO2018016140A1 JP WO2018016140 A1 JPWO2018016140 A1 JP WO2018016140A1 JP 2018528405 A JP2018528405 A JP 2018528405A JP 2018528405 A JP2018528405 A JP 2018528405A JP WO2018016140 A1 JPWO2018016140 A1 JP WO2018016140A1
- Authority
- JP
- Japan
- Prior art keywords
- character string
- string group
- unit
- grouping
- condition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 59
- 238000003672 processing method Methods 0.000 title claims abstract description 7
- PWPJGUXAGUPAHP-UHFFFAOYSA-N lufenuron Chemical compound C1=C(Cl)C(OC(F)(F)C(C(F)(F)F)F)=CC(Cl)=C1NC(=O)NC(=O)C1=C(F)C=CC=C1F PWPJGUXAGUPAHP-UHFFFAOYSA-N 0.000 title 1
- 238000012545 processing Methods 0.000 claims description 43
- 230000006870 function Effects 0.000 claims description 12
- 238000004891 communication Methods 0.000 description 32
- 238000004458 analytical method Methods 0.000 description 13
- 238000012217 deletion Methods 0.000 description 9
- 230000037430 deletion Effects 0.000 description 9
- 238000012986 modification Methods 0.000 description 8
- 230000004048 modification Effects 0.000 description 8
- 238000000034 method Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 5
- 238000012937 correction Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 230000000877 morphologic effect Effects 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 241001093575 Alma Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- User Interface Of Digital Computer (AREA)
- Machine Translation (AREA)
Abstract
Description
1.情報処理システムの構成
2.実施形態の詳細な説明
3.ハードウェア構成
4.変形例
まず、本開示の実施形態による情報処理システムの構成について、図1を参照して説明する。図1に示すように、当該情報処理システムは、サーバ10、端末20、および、通信網22を含む。
端末20は、ユーザが使用する情報処理端末である。例えば、端末20は、ユーザの発話時の音声を集音したり、文字列の入力を受け付けることが可能である。図1に示すように、端末20は、例えば、集音部200、および、操作表示部202を含む。
サーバ10は、本開示における情報処理装置の一例である。サーバ10は、自然言語処理機能を有する。例えば、サーバ10は、後述する通信網22を介して端末20から受信される音声データに対して音声認識(クラウド音声認識)を行うことが可能である。また、サーバ10は、通信網22を介して端末20から受信される文字列群や、音声認識結果から得られる文字列群に対して各種の言語処理を行うことが可能である。
通信網22は、通信網22に接続されている装置から送信される情報の有線、または無線の伝送路である。例えば、通信網22は、電話回線網、インターネット、衛星通信網などの公衆回線網や、Ethernet(登録商標)を含む各種のLAN(Local Area Network)、WAN(Wide Area Network)などを含んでもよい。また、通信網22は、IP−VPN(Internet Protocol−Virtual Private Network)などの専用回線網を含んでもよい。
以上、本実施形態による情報処理システムの構成について説明した。ところで、例えば、会議の議事録や小説など、文字数の多い文字列群が端末20に対して入力される場面も想定される。このような場合、仮にまとまり単位(例えば大きさなど)が固定的に設定されると、当該文字列群から得られるまとまり単位の表示時に文字列群全体の視認性が低くなるという問題がある。
<2−1.構成>
次に、本実施形態による構成について詳細に説明する。図4は、本実施形態によるサーバ10の構成例を示した機能ブロック図である。図4に示すように、サーバ10は、制御部100、通信部120、および、記憶部122を有する。
制御部100は、サーバ10に内蔵される、例えば、後述するCPU(Central Processing Unit)150や、後述するRAM(Random Access Memory)154などのハードウェアを用いて、サーバ10の動作を統括的に制御する。また、図4に示すように、制御部100は、音声認識部102、言語処理部104、変更部106、まとめ部108、および、表示制御部110を有する。
音声認識部102は、例えば端末20から受信される音声データに対して音声認識を行い、文字列群に変換する。また、音声認識部102は、変換後の文字列群を言語処理部104に伝達する。
言語処理部104は、本開示における取得部の一例である。言語処理部104は、音声認識部102から伝達される文字列群や、端末20から受信される文字列群を取得する。そして、言語処理部104は、取得した文字列群に対して各種の言語処理(例えば形態素解析、構文解析、および、意味解析など)を行う。例えば、言語処理部104は、まず、取得された文字列群に対して形態素解析を行う。次に、言語処理部104は、形態素解析の結果に基づいて、当該文字列群の構文解析を行う。例えば、言語処理部104は、当該文字列群に含まれる単語(英語などの場合)や文節(日本語などの場合)同士の係り受けの解析などを行う。そして、言語処理部104は、構文解析の結果に基づいて、当該文字列群の意味解析を行う。例えば、言語処理部104は、当該文字列群に含まれるモダリティの解析などを行う。
(2−1−4−1.まとまり単位の変更判定)
変更部106は、本開示における変更部の一例である。変更部106は、所定の条件に基づいて、取得された文字列群に関するまとまり単位を決定する。ここで、所定の条件は、互いに異なる複数の条件(互いに重複しない複数の条件)を含み得る。なお、所定の条件の具体例については後述する。
例えば、新たに文字列群が取得された場合、変更部106は、過去に取得済みの文字列群(以下、「変更前の文字列群」と称する)が当該複数の条件のうちいずれを満たすかに基いて、当該変更前の文字列群のまとまり単位を変更するか否かを決定する。または、この場合、変更部106は、当該変更前の文字列群に対して当該新たに取得された文字列群が追加された文字列群(以下、「変更後の文字列群」と称する)が当該複数の条件のうちいずれを満たすかに基いて、当該変更前の文字列群のまとまり単位を変更するか否かを決定する。ここで、変更前の文字列群は、本開示における第1の文字列群の一例である。また、新たに取得された文字列群は、本開示における第2の文字列群の一例である。また、変更後の文字列群は、本開示における第3の文字列群の一例である。
または、すでに取得済みの文字列群(変更前の文字列群)に対する編集情報が取得された場合には、変更部106は、当該変更前の文字列群が満たす条件と、当該編集情報に基づいて当該変更前の文字列群が変更された文字列群(つまり、変更後の文字列群)が満たす条件とを比較することにより、当該変更前の文字列群のまとまり単位を変更するか否かを決定することも可能である。ここで、編集情報は、該当の文字列群に対する所定の記号(例えば「,」、「.」、「?」など)の挿入や、該当の文字列群の一部の削除などの情報であり得る。
ここで、上述した所定の条件の具体例について説明する。例えば、当該所定の条件は、文字列群に含まれる文字の数の範囲に関する複数の条件を含み得る。例えば、当該複数の条件は、条件A1、条件A2、条件A3などを含み、そして、条件A1は「(文字列群に含まれる)文字の数が0以上100未満であること」、条件A2は「文字の数が100以上200未満であること」、かつ、条件A3は「文字の数が200以上300未満であること」などのように定められ得る。この場合、変更前の文字列群が満たす条件と変更後の文字列群が満たす条件とが異なり、かつ、変更前の文字列群に含まれる文字の数よりも、変更後の文字列群に含まれる文字の数の方が多い場合には、変更部106は、変更前の文字列群のまとまり単位を大きくする(変更する)ことを決定する。
または、当該所定の条件は、文字列群のまとまり単位の数に関する複数の条件を含み得る。例えば、当該複数の条件は、条件B1および条件B2を含み、そして、条件B1は「文字列群のまとまり単位の数(または推定数)が10未満であること」、かつ、条件B2は、「文字列群のまとまり単位の数(または推定数)が10以上であること」などのように定められ得る。この場合、変更前の文字列群が満たす条件と変更後の文字列群が満たす条件とが異なり、かつ、変更前の文字列群のまとまり単位の数よりも、変更後の文字列群のまとまり単位の数の方が多い場合には、変更部106は、変更前の文字列群のまとまり単位を大きくする(変更する)ことを決定する。
または、当該所定の条件は、文字列群に関する言語処理結果に関する複数の条件を含み得る。ここで、言語処理結果は、該当の文字列群から解析された、例えば特定の「句」(例えば名詞句など)の数、特定の「品詞」(例えば名詞など)の数、または、自立語の数(日本語などの場合)などである。例えば、当該複数の条件は、条件C1、条件C2、条件C3などを含み、そして、条件C1は「(文字列群に含まれる)名詞の数が0以上10未満であること」、条件C2は「名詞の数が10以上20未満であること」、かつ、条件C3は「名詞の数が20以上30未満であること」などのように定められ得る。この場合、変更前の文字列群が満たす条件と変更後の文字列群が満たす条件とが異なり、かつ、変更前の文字列群に含まれる名詞の数よりも、変更後の文字列群に含まれる名詞の数の方が多い場合には、変更部106は、変更前の文字列群のまとまり単位を大きくする(変更する)ことを決定する。この条件例によれば、文字列群の情報量が多いほどまとまり単位をより大きくし得る。従って、文字列群の情報量を反映させて文字列群をまとめることが可能になる。
または、所定の条件は、文字列群に対応する音素の数の範囲に関する複数の条件を含み得る。例えば、当該複数の条件は、条件D1、条件D2、条件D3などを含み、そして、条件D1は「(文字列群に対応する)音素の数が0以上80未満であること」、条件D2は「音素の数が80以上160未満であること」、かつ、条件D3は「音素の数が160以上240未満であること」などのように定められ得る。この場合、変更前の文字列群が満たす条件と変更後の文字列群が満たす条件とが異なり、かつ、変更前の文字列群に対応する音素の数よりも変更後の文字列群に対応する音素の数の方が多い場合には、変更部106は、変更前の文字列群のまとまり単位を大きくする(変更する)ことを決定する。なお、音素の数は、該当の文字列群に対応する音声認識結果から特定されてもよいし、該当の文字列群に対する言語処理結果から特定されてもよい。
または、当該所定の条件は、文字列群から解析されるモダリティに関する複数の条件を含み得る。例えば、当該複数の条件は、文字列群から解析されるモダリティの数の範囲に関する複数の条件である。一例として、当該複数の条件は、条件E1、条件E2、条件E3などを含み、そして、条件E1は「(文字列群から解析される)モダリティの数が0であること」、条件E2は「モダリティの数が1であること」、かつ、条件E3は「モダリティの数が2であること」などのように定められ得る。この場合、変更前の文字列群が満たす条件と変更後の文字列群が満たす条件とが異なり、かつ、変更前の文字列群から解析されるモダリティの数よりも、変更後の文字列群から解析されるモダリティの数の方が多い場合には、変更部106は、変更前の文字列群のまとまり単位を大きくする(変更する)ことを決定する。なお、対象のモデリティの種類は、任意の種類であってもよいし、または、特定の種類であってもよい。
または、当該所定の条件は、ユーザの編集情報の有無に関する条件を含み得る。例えば、所定の条件は、「ユーザの編集情報が取得され、かつ、当該編集情報に基づいて該当の文字列群が変更されたこと」であり得る。この場合、変更後の文字列群が当該所定の条件を満たす場合には、変更部106は、当該編集情報に応じて、変更前の文字列群のまとまり単位を変更することを決定する。なお、編集情報の内容は上記の説明と同様であり得る。
または、当該所定の条件は、上述した複数の種類の条件を含んでもよい。この場合、複数の種類の条件に関して、変更前の文字列群が満たす条件の組み合わせと、変更後の文字列群が満たす条件の組み合わせとが異なる場合には、変更部106は、変更前の文字列群のまとまり単位を変更することを決定し得る。また、当該変更前の文字列群が満たす条件の組み合わせと、当該変更後の文字列群が満たす条件の組み合わせとが同一である場合には、変更部106は、変更前の文字列群のまとまり単位を変更しないことを決定し得る。
さらに、まとまり単位を変更することを決定した場合には、変更部106は、例えば記憶部122に記憶されている、まとまり単位に関する現在の設定基準を、まとまり単位の変更内容に応じて変更する。
まとめ部108は、本開示における変更部の一例である。まとめ部108は、(変更部106による)まとまり単位の変更に関する判定結果と、記憶部122に記憶されている、まとまり単位に関する設定基準とに基いて、当該文字列群をまとめる。例えば、変更前の文字列群のまとまり単位を変更することが変更部106により決定された場合には、まとめ部108は、変更後の文字列群が当該設定基準を満たすように、変更前の文字列群のまとまり単位を変更する。
例えば、変更前の文字列群のまとまり単位を大きくすることが決定された場合には、まとめ部108は、まず、当該設定基準に基いて接合対象の複数のまとまり単位の組を一以上選択し、そして、選択した組ごとに、当該組に含まれる全てのまとまり単位を接合する。
また、変更前の文字列群のまとまり単位を小さくすることが変更部106により決定された場合には、まとめ部108は、まず、当該設定基準に基いて分割対象のまとまり単位を一以上選択し、そして、選択したまとまり単位をそれぞれ2つ以上のまとまり単位に分割する。
また、新たに文字列群が取得された場合に関しては、まとめ部108は、例えば記憶部122に記憶されている、最新の設定基準に基いて、当該新たに取得された文字列群のまとまり単位を決定する。つまり、追加後の文字列群(すなわち、変更前の文字列群、および、新たに取得された文字列群)は全て、同一の設定基準に基いてまとめられる。
表示制御部110は、端末20に対して、取得済みの文字列群を表示させる制御を行う。例えば、表示制御部110は、まとめ部108によりまとめられたまとまり単位ごとに区別して、当該文字列群を(端末20の)表示画面に表示させる。
通信部120は、例えば通信網22を介して他の装置との間で情報の送受信を行う。例えば、通信部120は、音声データや、手入力された文字列群を端末20から受信する。また、通信部120は、表示制御部110の制御に従って、取得済みの文字列群をまとまり単位ごとに区別して表示させるための制御情報を端末20へ送信する。
記憶部122は、各種のデータや各種のソフトウェアを記憶する。例えば、記憶部122は、取得済みの文字列群と、当該文字列群に関するまとまり単位とを関連付けて(一時的に)記憶する。また、図4に示すように、記憶部122は、設定基準テーブル124を記憶し得る。なお、設定基準テーブル124は、記憶部122に記憶される代わりに、サーバ10が通信可能な他の装置(図示せず)に記憶されてもよい。
以上、本実施形態による構成について説明した。次に、本実施形態の適用例について、図6〜図14を参照して説明する。なお、ここでは、ユーザが、図2に示した文字列群30の一部ずつを端末20に対して発話(音声入力)する例について説明する。
例えば、図6に示したように、まず、ユーザは、“And while she’s no longer with us,”という発話30aを端末20に対して行ったとする。この場合、端末20は、集音された音声データをサーバ10へ送信する。そして、サーバ10の音声認識部102は、受信された音声データに対して音声認識を行い、文字列群に変換する。
その後、図7に示したように、ユーザは、“I know my grandmother’s watching,”という発話30bを端末20に対して行ったとする。この場合、図6に示した例と同様に、端末20は、集音された音声データをサーバ10へ送信し、そして、サーバ10の音声認識部102は、受信された音声データに対して音声認識を行い、文字列群に変換する。そして、言語処理部104は、(音声認識部102から)新たに取得される文字列群(つまり、発話30bに対応する文字列群)に対して各種の言語処理を行う。
その後、図8に示したように、ユーザは、“along with the family that made me who I am.”という発話30cを端末20に対して行ったとする。なお、この場合、(図7に示した)過去に取得済みの文字列群50bが満たす条件と、新たに取得された文字列群(つまり発話30cに対応する文字列群)の追加後の文字列群50cが満たす条件とは同一であるものとする。従って、当該追加前の文字列群50bのまとまり単位は変更されない。また、新たに取得された文字列群は、図6に示した例と同じ設定基準を用いてまとめられる。そして、図8に示したように、これらのまとまり単位は、表示画面40に追加表示される。
その後、図9に示したように、ユーザは、“I miss them tonight.”という発話30dを端末20に対して行ったとする。なお、この場合、(図8に示した)過去に取得済みの文字列群50cが満たす条件と、新たに取得された文字列群(つまり発話30dに対応する文字列群)の追加後の文字列群50dが満たす条件とは異なるものとする。つまり、追加後の文字列群50dの量(例えば文字数やまとまり単位の推定数など)が所定の量以上になったとする。
その後、図11に示したように、ユーザは、“I know that my debt to them is beyond measure.”という発話30eを端末20に対して行ったとする。なお、この場合、(図9に示した)過去に取得済みの文字列群50dが満たす条件と、新たに取得された文字列群(つまり発話30eに対応する文字列群)の追加後の文字列群50eが満たす条件とは同一であるものとする。従って、当該追加前の文字列群50dのまとまり単位は変更されない。また、新たに取得された文字列群は、図9に示した例と同じ設定基準を用いてまとめられる。そして、図11に示したように、これらのまとまり単位は、表示画面40に追加表示される。
その後、図12に示したように、ユーザは、“To my sister Maya, my sister Alma, all my other brothers and sisters,”という発話30fを端末20に対して行ったとする。なお、この場合も、(図11に示した)過去に取得済みの文字列群50eが満たす条件と、新たに取得された文字列群(つまり発話30fに対応する文字列群)の追加後の文字列群50fが満たす条件とは同一であるものとする。従って、当該追加前の文字列群50eのまとまり単位は変更されない。また、新たに取得された文字列群は、図9に示した例と同じ設定基準を用いてまとめられる。そして、図12に示したように、これらのまとまり単位は、表示画面40に追加表示される。
その後、図13に示したように、ユーザは、“thank you so much for all the support that you’ve given me.”という発話30gを端末20に対して行ったとする。なお、この場合、(図12に示した)過去に取得済みの文字列群50fが満たす条件と、新たに取得された文字列群(つまり発話30gに対応する文字列群)の追加後の文字列群50gが満たす条件とは異なるものとする。つまり、追加後の文字列群50gの量は、まとまり単位の大きさが直近に変更された文字列群(具体的には、図9に示した文字列群50d)からさらに所定の量以上増えたとする。
以上、本実施形態の適用例について説明した。次に、本実施形態による動作について、図15および図16を参照して説明する。なお、ここでは、ユーザが端末20に対して文字列群を音声入力する場面における動作例について説明する。なお、本動作は、例えばユーザが音声入力アプリケーションを起動する度に繰り返される。
図15は、本実施形態による動作の全体的な流れを示したフローチャートである。図15に示したように、まず、例えば、端末20に対するユーザの所定の操作に基いて、端末20は音声入力アプリケーションを起動する。そして、集音部200は、集音を開始する(S101)。
次に、図16を参照して、S117における「まとまり単位の変更処理」の流れについて詳細に説明する。図16に示したように、まず、変更部106は、予め設定されている複数の条件のうち、直近のS115もしくはS107よりも前に取得済みの文字列群(つまり、変更前の文字列群)が満たす条件を特定する(S151)。
なお、本実施形態による動作は、上述した例に限定されない。例えば、図15では、音声入力によりユーザが文字列群を繰り返し入力する動作例を示しているが、かかる例に限定されない。例えばキー入力などの手入力により、ユーザが文字列群を繰り返し入力する場面にも、上述した動作例は概略同様に適用され得る。この場合、例えばS109では、端末20は、手入力された文字列群をサーバ10へ送信する。また、S111の処理は省略される。
以上説明したように、本実施形態によれば、サーバ10は、所定の条件に基づいて、例えば音声入力や手入力などに基いて取得された文字列群のまとまり単位を動的に変更する。これにより、例えば、文字列群の全体量(例えば文字数など)に応じて、まとまり単位を逐次最適化することができる。
次に、本実施形態によるサーバ10のハードウェア構成について、図17を参照して説明する。図17に示すように、サーバ10は、CPU150、ROM(Read Only Memory)152、RAM154、バス156、インターフェース158、ストレージ装置160、および通信装置162を備える。
以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示はかかる例に限定されない。本開示の属する技術の分野における通常の知識を有する者であれば、請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。
例えば、上述した実施形態では、過去に取得済みの文字列群がユーザに削除される場合でも、サーバ10は、当該文字列群のまとまり単位を動的に変更する(分割する)例について説明したが、かかる例に限定されない。例えば、過去に取得済みの文字列群がユーザに削除される場合で、かつ、特定の条件が成立する場合には、サーバ10は、当該文字列群のまとまり単位を維持してもよい。
{4−2−1.文}
また、上述した実施形態では、基本的に語(例えば言語が英語などである場合には単語、また、言語が日本語などである場合には文節)を単位として、まとまり単位が構成される例について説明したが、本開示はかかる例に限定されない。例えば、まとまり単位は、文単位で構成されてもよい。この場合、例えば、文字列群のまとまり単位を大きくすることをサーバ10が決定した場合には、サーバ10は、該当の文字列群において隣接する二文ずつを接合してもよい。
または、まとまり単位は、質問文と回答文の組を単位として構成されてもよい。例えば、質問A、(質問Aに対する)回答A、質問B、(質問Bに対する)回答B、というように、質問と回答とが交互に発話(入力)されたとする。この場合、サーバ10は、質問と当該質問に対する回答との組(例えば、質問Aおよび回答Aの組など)をまとまり単位としてもよい。なお、質問および回答はそれぞれ一文であってもよいし、複数の文であってもよい。この変形例によれば、例えば、インタビュー記事の作成時などにおいて、作成者は、質問単位で、当該質問と当該質問に対する回答との組を一括して削除したり、抽出することができるので、利便性が高い。なお、例えば、文に含まれるモダリティの解析結果、文の構文解析や意味解析の結果、または、集音された音声のイントネーションの解析結果などに基いて、質問文や回答文は特定され得る。
または、まとまり単位は、トピックを単位として構成されてもよい。例えば、複数のユーザの間で、3種類のトピック(例えば、プロジェクトA、プロジェクトB、および、プロジェクトCなど)に関する対話が行われたとする。この場合、サーバ10は、トピックごとに、当該トピックに関して複数のユーザが発話(入力)した文全てをまとまり単位としてもよい。
また、本実施形態による情報処理システムの構成は、図1に示した例に限定されない。例えば、図1では、サーバ10が一台だけ図示されているが、かかる例に限定されず、複数台のコンピュータが協同して動作することにより、上述したサーバ10の機能が実現されてもよい。また、図1では、端末20が一台だけ図示されているが、かかる例に限定されず、当該情報処理システムは、端末20を複数台含み得る。
また、本実施形態によるサーバ10の構成は、図4に示した例に限定されない。例えば、音声認識部102、言語処理部104、および、表示制御部110のうちの少なくとも一以上は、サーバ10に含まれる代わりに、例えば端末20など、サーバ10が通信可能な他の装置に含まれてもよい。
また、上述した実施形態では、本開示における情報処理装置がサーバ10である例について説明したが、本開示はかかる例に限定されない。例えば、少なくとも変更部106およびまとめ部108の機能を端末20が有する場合には、当該情報処理装置は、端末20であってもよい。この場合、例えば、端末20は、まず、集音した音声データや手入力された文字列群をサーバ10へ送信する。そして、端末20は、当該音声データに対する音声認識により得られる文字列群や、取得された文字列群に対する各種の言語処理結果をサーバ10から受信する。そして、端末20は、これらの情報に基づいて、上述した変更部106およびまとめ部108の機能を実行可能である。
また、上述した実施形態の動作における各ステップは、必ずしも記載された順序に沿って処理されなくてもよい。例えば、各ステップは、適宜順序が変更されて処理されてもよい。また、各ステップは、時系列的に処理される代わりに、一部並列的に又は個別的に処理されてもよい。また、記載されたステップのうちの一部が省略されたり、または、別のステップがさらに追加されてもよい。
(1)
第1の文字列群を取得する取得部と、
前記第1の文字列群および所定の条件に基づいて、前記第1の文字列群に関するまとまりの単位を変更する変更部と、
を備える、情報処理装置。
(2)
前記所定の条件は、互いに異なる複数の条件を含み、
前記変更部は、前記第1の文字列群が前記複数の条件のうちのいずれを満たすかに基づいて、前記第1の文字列群に関するまとまりの単位を変更する、前記(1)に記載の情報処理装置。
(3)
前記所定の条件は、互いに異なる複数の条件を含み、
前記取得部は、第2の文字列群をさらに取得し、
前記変更部は、前記第1の文字列群に前記第2の文字列群が追加された文字列群である第3の文字列群が前記複数の条件のうちのいずれを満たすかに基づいて、前記第1の文字列群に関するまとまりの単位を変更する、前記(1)または(2)に記載の情報処理装置。
(4)
前記変更部は、前記複数の条件のうち前記第1の文字列群が満たす条件と、前記複数の条件のうち前記第3の文字列群が満たす条件との比較に基づいて、前記第1の文字列群に関するまとまりの単位を変更する、前記(3)に記載の情報処理装置。
(5)
前記第1の文字列群が満たす条件と、前記第3の文字列群が満たす条件とが異なる場合には、前記変更部は、前記第1の文字列群に関するまとまりの単位を変更し、
前記第1の文字列群が満たす条件と、前記第3の文字列群が満たす条件とが同一である場合には、前記変更部は、前記第1の文字列群に関するまとまりの単位を変更しない、前記(4)に記載の情報処理装置。
(6)
新たに文字列群が取得される度に、前記第1の文字列群には、当該取得された文字列群が追加され、
前記変更部は、前記複数の条件のうち、当該追加前の前記第1の文字列群が満たす条件と、前記複数の条件のうち、当該追加後の前記第1の文字列群が満たす条件との比較に基づいて、当該追加前の前記第1の文字列群に関するまとまりの単位を変更する、前記(4)または(5)に記載の情報処理装置。
(7)
前記変更部は、さらに、前記複数の条件のうち前記第3の文字列群が満たす条件に基づいて、前記第2の文字列群に関するまとまりの単位を決定する、前記(3)〜(6)のいずれか一項に記載の情報処理装置。
(8)
前記所定の条件は、互いに異なる複数の条件を含み、
前記取得部は、前記第1の文字列群に対する編集情報をさらに取得し、
前記変更部は、前記複数の条件のうち前記第1の文字列群が満たす条件と、前記複数の条件のうち、前記編集情報に基づいて前記第1の文字列群が変更された文字列群である第4の文字列群が満たす条件との比較に基づいて、前記第1の文字列群に関するまとまりの単位を変更する、前記(1)〜(7)のいずれか一項に記載の情報処理装置。
(9)
前記変更部は、前記第3の文字列群が満たす条件に関連付けられている設定基準に基いて、前記第1の文字列群に関するまとまりの単位を変更する、前記(3)〜(7)のいずれか一項に記載の情報処理装置。
(10)
前記所定の条件は、文字列群に含まれる文字の数の範囲に関する条件を含む、前記(1)〜(9)のいずれか一項に記載の情報処理装置。
(11)
前記所定の条件は、文字列群に関するまとまりの単位の数の範囲に関する条件を含む、前記(1)〜(10)のいずれか一項に記載の情報処理装置。
(12)
前記所定の条件は、文字列群に対応する音素の数の範囲に関する条件を含む、前記(1)〜(11)のいずれか一項に記載の情報処理装置。
(13)
前記所定の条件は、文字列群の言語処理結果に関する条件を含む、前記(1)〜(12)のいずれか一項に記載の情報処理装置。
(14)
前記変更部は、複数の前記まとまりの単位を接合すること、または、一以上の前記まとまりの単位を分割することにより、前記第1の文字列群に関するまとまりの単位を変更する、前記(1)〜(13)のいずれか一項に記載の情報処理装置。
(15)
前記変更部は、前記第1の文字列群において隣接する前記まとまりの単位同士をそれぞれ接合することにより、前記第1の文字列群に関するまとまりの単位を変更する、前記(14)に記載の情報処理装置。
(16)
前記変更部は、モダリティを含む前記まとまりの単位と、モダリティを含まない一以上の前記まとまりの単位とを接合することにより、前記第1の文字列群に関するまとまりの単位を変更する、前記(14)または(15)に記載の情報処理装置。
(17)
前記変更部は、係り受けの関係にある前記まとまりの単位同士を接合することにより、前記第1の文字列群に関するまとまりの単位を変更する、前記(14)〜(16)のいずれか一項に記載の情報処理装置。
(18)
前記情報処理装置は、前記第1の文字列群を表示画面に表示させる表示制御部をさらに備え、
前記表示制御部は、前記まとまりの単位ごとに区別して前記表示画面に表示させる、前記(1)〜(17)のいずれか一項に記載の情報処理装置。
(19)
第1の文字列群を取得することと、
前記第1の文字列群および所定の条件に基づいて、前記第1の文字列群に関するまとまりの単位をプロセッサが変更することと、
を含む、情報処理方法。
(20)
コンピュータを、
第1の文字列群を取得する取得部と、
前記第1の文字列群および所定の条件に基づいて、前記第1の文字列群に関するまとまりの単位を変更する変更部、
として機能させるための、プログラム。
20 端末
22 通信網
100 制御部
102 音声認識部
104 言語処理部
106 変更部
108 まとめ部
110 表示制御部
120 通信部
122 記憶部
124 設定基準テーブル
200 集音部
202 操作表示部
Claims (20)
- 第1の文字列群を取得する取得部と、
前記第1の文字列群および所定の条件に基づいて、前記第1の文字列群に関するまとまりの単位を変更する変更部と、
を備える、情報処理装置。 - 前記所定の条件は、互いに異なる複数の条件を含み、
前記変更部は、前記第1の文字列群が前記複数の条件のうちのいずれを満たすかに基づいて、前記第1の文字列群に関するまとまりの単位を変更する、請求項1に記載の情報処理装置。 - 前記所定の条件は、互いに異なる複数の条件を含み、
前記取得部は、第2の文字列群をさらに取得し、
前記変更部は、前記第1の文字列群に前記第2の文字列群が追加された文字列群である第3の文字列群が前記複数の条件のうちのいずれを満たすかに基づいて、前記第1の文字列群に関するまとまりの単位を変更する、請求項1に記載の情報処理装置。 - 前記変更部は、前記複数の条件のうち前記第1の文字列群が満たす条件と、前記複数の条件のうち前記第3の文字列群が満たす条件との比較に基づいて、前記第1の文字列群に関するまとまりの単位を変更する、請求項3に記載の情報処理装置。
- 前記第1の文字列群が満たす条件と、前記第3の文字列群が満たす条件とが異なる場合には、前記変更部は、前記第1の文字列群に関するまとまりの単位を変更し、
前記第1の文字列群が満たす条件と、前記第3の文字列群が満たす条件とが同一である場合には、前記変更部は、前記第1の文字列群に関するまとまりの単位を変更しない、請求項4に記載の情報処理装置。 - 新たに文字列群が取得される度に、前記第1の文字列群には、当該取得された文字列群が追加され、
前記変更部は、前記複数の条件のうち、当該追加前の前記第1の文字列群が満たす条件と、前記複数の条件のうち、当該追加後の前記第1の文字列群が満たす条件との比較に基づいて、当該追加前の前記第1の文字列群に関するまとまりの単位を変更する、請求項4に記載の情報処理装置。 - 前記変更部は、さらに、前記複数の条件のうち前記第3の文字列群が満たす条件に基づいて、前記第2の文字列群に関するまとまりの単位を決定する、請求項3に記載の情報処理装置。
- 前記所定の条件は、互いに異なる複数の条件を含み、
前記取得部は、前記第1の文字列群に対する編集情報をさらに取得し、
前記変更部は、前記複数の条件のうち前記第1の文字列群が満たす条件と、前記複数の条件のうち、前記編集情報に基づいて前記第1の文字列群が変更された文字列群である第4の文字列群が満たす条件との比較に基づいて、前記第1の文字列群に関するまとまりの単位を変更する、請求項1に記載の情報処理装置。 - 前記変更部は、前記第3の文字列群が満たす条件に関連付けられている設定基準に基いて、前記第1の文字列群に関するまとまりの単位を変更する、請求項3に記載の情報処理装置。
- 前記所定の条件は、文字列群に含まれる文字の数の範囲に関する条件を含む、請求項1に記載の情報処理装置。
- 前記所定の条件は、文字列群に関するまとまりの単位の数の範囲に関する条件を含む、請求項1に記載の情報処理装置。
- 前記所定の条件は、文字列群に対応する音素の数の範囲に関する条件を含む、請求項1に記載の情報処理装置。
- 前記所定の条件は、文字列群の言語処理結果に関する条件を含む、請求項1に記載の情報処理装置。
- 前記変更部は、複数の前記まとまりの単位を接合すること、または、一以上の前記まとまりの単位を分割することにより、前記第1の文字列群に関するまとまりの単位を変更する、請求項1に記載の情報処理装置。
- 前記変更部は、前記第1の文字列群において隣接する前記まとまりの単位同士をそれぞれ接合することにより、前記第1の文字列群に関するまとまりの単位を変更する、請求項14に記載の情報処理装置。
- 前記変更部は、モダリティを含む前記まとまりの単位と、モダリティを含まない一以上の前記まとまりの単位とを接合することにより、前記第1の文字列群に関するまとまりの単位を変更する、請求項14に記載の情報処理装置。
- 前記変更部は、係り受けの関係にある前記まとまりの単位同士を接合することにより、前記第1の文字列群に関するまとまりの単位を変更する、請求項14に記載の情報処理装置。
- 前記情報処理装置は、前記第1の文字列群を表示画面に表示させる表示制御部をさらに備え、
前記表示制御部は、前記まとまりの単位ごとに区別して前記表示画面に表示させる、請求項1に記載の情報処理装置。 - 第1の文字列群を取得することと、
前記第1の文字列群および所定の条件に基づいて、前記第1の文字列群に関するまとまりの単位をプロセッサが変更することと、
を含む、情報処理方法。 - コンピュータを、
第1の文字列群を取得する取得部と、
前記第1の文字列群および所定の条件に基づいて、前記第1の文字列群に関するまとまりの単位を変更する変更部、
として機能させるための、プログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016142296 | 2016-07-20 | ||
JP2016142296 | 2016-07-20 | ||
PCT/JP2017/014928 WO2018016140A1 (ja) | 2016-07-20 | 2017-04-12 | 情報処理装置、情報処理方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2018016140A1 true JPWO2018016140A1 (ja) | 2019-05-09 |
JP7020410B2 JP7020410B2 (ja) | 2022-02-16 |
Family
ID=60992026
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018528405A Active JP7020410B2 (ja) | 2016-07-20 | 2017-04-12 | 情報処理装置、情報処理方法、およびプログラム |
Country Status (5)
Country | Link |
---|---|
US (1) | US11275897B2 (ja) |
EP (1) | EP3489840A4 (ja) |
JP (1) | JP7020410B2 (ja) |
CN (1) | CN109478201A (ja) |
WO (1) | WO2018016140A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110837642B (zh) * | 2019-11-14 | 2023-10-13 | 腾讯科技(深圳)有限公司 | 恶意程序分类方法、装置、设备及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05290030A (ja) * | 1992-04-08 | 1993-11-05 | Sharp Corp | 文書処理装置 |
JPH06214585A (ja) * | 1993-01-18 | 1994-08-05 | Toshiba Corp | 音声合成装置 |
JPH09240103A (ja) * | 1996-01-05 | 1997-09-16 | King Jim Co Ltd | 文字情報処理装置 |
JP2000516002A (ja) * | 1996-08-07 | 2000-11-28 | シー. ウォーカー、ランドル | テキスト・プロセッサ |
JP2001100784A (ja) * | 1999-09-30 | 2001-04-13 | Sony Corp | 情報処理装置および情報処理方法、並びに記録媒体 |
JP2003150298A (ja) * | 2001-11-13 | 2003-05-23 | Sony Corp | 電子ブック、書籍内容表示方法、書籍内容表示プログラム及び書籍内容表示プログラム格納媒体 |
JP2015184455A (ja) * | 2014-03-24 | 2015-10-22 | 大日本印刷株式会社 | 表示端末装置、プログラム、及び、サーバ装置 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3654611A (en) * | 1970-03-02 | 1972-04-04 | Ibm | Visual editing system incorporating controls for justifying and dejustifying displayed text |
US3654609A (en) * | 1970-03-02 | 1972-04-04 | Ibm | Proportional spacing visual editing system |
JP3299433B2 (ja) * | 1996-01-05 | 2002-07-08 | 株式会社キングジム | 文字情報処理方法及び装置 |
US6279018B1 (en) * | 1998-12-21 | 2001-08-21 | Kudrollis Software Inventions Pvt. Ltd. | Abbreviating and compacting text to cope with display space constraint in computer software |
US9710819B2 (en) * | 2003-05-05 | 2017-07-18 | Interactions Llc | Real-time transcription system utilizing divided audio chunks |
JP3945778B2 (ja) * | 2004-03-12 | 2007-07-18 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 設定装置、プログラム、記録媒体、及び設定方法 |
JP2006202231A (ja) * | 2005-01-24 | 2006-08-03 | Global Value Kk | 文字列シンボル生成装置及び文字列シンボル生成方法並びに文字列シンボル生成プログラムを格納した記憶媒体。 |
JP4181577B2 (ja) * | 2005-12-22 | 2008-11-19 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 文字列処理方法、装置、およびプログラム |
US20120237906A9 (en) * | 2006-03-15 | 2012-09-20 | Glass Andrew B | System and Method for Controlling the Presentation of Material and Operation of External Devices |
JP4791984B2 (ja) * | 2007-02-27 | 2011-10-12 | 株式会社東芝 | 入力された音声を処理する装置、方法およびプログラム |
JP5550496B2 (ja) | 2010-08-31 | 2014-07-16 | 富士フイルム株式会社 | 文書作成支援装置、文書作成支援方法、並びに文書作成支援プログラム |
CN103353824B (zh) * | 2013-06-17 | 2016-08-17 | 百度在线网络技术(北京)有限公司 | 语音输入字符串的方法、装置和终端设备 |
CA2949782C (en) * | 2014-04-25 | 2023-09-05 | Mayo Foundation For Medical Education And Research | Enhancing reading accuracy, efficiency and retention |
US10950254B2 (en) * | 2018-10-25 | 2021-03-16 | International Business Machines Corporation | Producing comprehensible subtitles and captions for an effective group viewing experience |
-
2017
- 2017-04-12 CN CN201780042974.8A patent/CN109478201A/zh active Pending
- 2017-04-12 US US16/096,370 patent/US11275897B2/en active Active
- 2017-04-12 WO PCT/JP2017/014928 patent/WO2018016140A1/ja unknown
- 2017-04-12 JP JP2018528405A patent/JP7020410B2/ja active Active
- 2017-04-12 EP EP17830660.1A patent/EP3489840A4/en not_active Withdrawn
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05290030A (ja) * | 1992-04-08 | 1993-11-05 | Sharp Corp | 文書処理装置 |
JPH06214585A (ja) * | 1993-01-18 | 1994-08-05 | Toshiba Corp | 音声合成装置 |
JPH09240103A (ja) * | 1996-01-05 | 1997-09-16 | King Jim Co Ltd | 文字情報処理装置 |
JP2000516002A (ja) * | 1996-08-07 | 2000-11-28 | シー. ウォーカー、ランドル | テキスト・プロセッサ |
JP2001100784A (ja) * | 1999-09-30 | 2001-04-13 | Sony Corp | 情報処理装置および情報処理方法、並びに記録媒体 |
JP2003150298A (ja) * | 2001-11-13 | 2003-05-23 | Sony Corp | 電子ブック、書籍内容表示方法、書籍内容表示プログラム及び書籍内容表示プログラム格納媒体 |
JP2015184455A (ja) * | 2014-03-24 | 2015-10-22 | 大日本印刷株式会社 | 表示端末装置、プログラム、及び、サーバ装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2018016140A1 (ja) | 2018-01-25 |
EP3489840A1 (en) | 2019-05-29 |
EP3489840A4 (en) | 2019-07-24 |
US11275897B2 (en) | 2022-03-15 |
JP7020410B2 (ja) | 2022-02-16 |
US20190138601A1 (en) | 2019-05-09 |
CN109478201A (zh) | 2019-03-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3504704B1 (en) | Facilitating creation and playback of user-recorded audio | |
JP5149737B2 (ja) | 自動会話システム、並びに会話シナリオ編集装置 | |
AU2014331209B2 (en) | Method for dialogue between a machine, such as a humanoid robot, and a human interlocutor; computer program product; and humanoid robot for implementing such a method | |
US20150279347A1 (en) | Text-to-Speech for Digital Literature | |
JP7242736B2 (ja) | 情報処理装置、情報処理方法、および情報処理プログラム | |
CN103236259A (zh) | 语音识别处理及反馈系统、语音回复方法 | |
US11366634B2 (en) | Memory retention system | |
TW201606750A (zh) | 使用外國字文法的語音辨識 | |
KR101597286B1 (ko) | 아바타 영상 메시지를 생성하는 장치 및 방법 | |
US9886951B2 (en) | Analysis of professional-client interactions | |
CN109710799B (zh) | 语音交互方法、介质、装置和计算设备 | |
JP7355244B2 (ja) | 情報処理装置、情報処理方法およびプログラム | |
JP5420874B2 (ja) | デジタルストーリー提供システム、デジタルストーリー提供方法、及びこの方法をコンピュータシステムに実行させるためのコンピュータプログラム | |
JP2019124952A (ja) | 情報処理装置、情報処理方法、およびプログラム | |
US20200135169A1 (en) | Audio playback device and audio playback method thereof | |
US20220101852A1 (en) | Conversation support device, conversation support system, conversation support method, and storage medium | |
JP7020410B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP6821542B2 (ja) | 複数種の対話を続けて実施可能な対話制御装置、プログラム及び方法 | |
US20220100959A1 (en) | Conversation support device, conversation support system, conversation support method, and storage medium | |
CN111819565A (zh) | 数据转换系统、数据转换方法和程序 | |
CN115499401B (zh) | 一种播放语音数据的方法、系统、计算机设备及介质 | |
CN108475503A (zh) | 用于多语言通信排序的系统和方法 | |
CN118551766A (zh) | 电子阅读数据的处理方法 | |
CN117636915A (zh) | 调整播放进度的方法、相关装置及计算机程序产品 | |
CN118762712A (zh) | 剧场音频作品的生成方法、装置、设备、介质和程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20190208 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20190214 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20190515 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20190522 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200312 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210608 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210713 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220104 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220117 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7020410 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |