JP2021002278A - Information processing apparatus, control method, and program - Google Patents

Information processing apparatus, control method, and program Download PDF

Info

Publication number
JP2021002278A
JP2021002278A JP2019116531A JP2019116531A JP2021002278A JP 2021002278 A JP2021002278 A JP 2021002278A JP 2019116531 A JP2019116531 A JP 2019116531A JP 2019116531 A JP2019116531 A JP 2019116531A JP 2021002278 A JP2021002278 A JP 2021002278A
Authority
JP
Japan
Prior art keywords
analysis
information processing
word
bubble
display
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019116531A
Other languages
Japanese (ja)
Inventor
弓冶 金
Gong-Ye Jin
弓冶 金
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Marketing Japan Inc
Canon IT Solutions Inc
Original Assignee
Canon Marketing Japan Inc
Canon IT Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Marketing Japan Inc, Canon IT Solutions Inc filed Critical Canon Marketing Japan Inc
Priority to JP2019116531A priority Critical patent/JP2021002278A/en
Publication of JP2021002278A publication Critical patent/JP2021002278A/en
Pending legal-status Critical Current

Links

Images

Abstract

To provide an arrangement for properly analyzing an object to be analyzed.SOLUTION: According to the present invention, a bubble surrounding a word acquired as a result of morphological analysis is displayed. If an operation for fusion of the bubble is carried out with use of a mouse operation, then bubbles are fused and displayed as a single bubble. Alternatively, a word forming a word displayed with the operated bubble is fused to another bubble and displayed as a single bubble, and if an operation for separating a word forming the word indicated by the bubble is carried out, then the separated word is displayed in a new bubble.SELECTED DRAWING: Figure 5

Description

本発明は、解析対象の解析方法に関する。 The present invention relates to an analysis method to be analyzed.

最近、企業では、自社のサービスや商品等に対する顧客の声を分析することで、販売促進に繋げる活動が行われている。 Recently, companies have been conducting activities that lead to sales promotion by analyzing customer feedback regarding their services and products.

顧客の声を分析するにあたり、自社の運営するサイトやSNS等のサービスに対するサービスや商品等に関しての投稿者のコメントから興味や嗜好を推測することで、販売促進に繋げている。 In analyzing customer feedback, it leads to sales promotion by inferring interests and preferences from the comments of posters regarding services and products for services such as websites and SNS operated by the company.

このような推測を行う上で、投稿者のコメントに含まれるキーワードを解析する必要があるが、一般的には、解析技法として形態素解析が用いられている。 In order to make such a guess, it is necessary to analyze the keywords included in the comments of the poster, but in general, morphological analysis is used as an analysis technique.

このような技法を用いてキーワードを抽出し、このキーワードの意味合いを、用語辞書を用いて特定することで推測を行っている(例えば、特許文献1参照)。 A keyword is extracted using such a technique, and the meaning of this keyword is inferred by specifying it using a term dictionary (see, for example, Patent Document 1).

特開2007−226568号公報JP-A-2007-226568

しかしながら、このような機械的な技法を用いた場合、コメントからキーワードを適切に抽出できないようなケースが存在する。 However, when such a mechanical technique is used, there are cases where keywords cannot be properly extracted from comments.

例えば、キャッシュバックキャンペーンだから購入した、といったコメントを解析すると、本来なら、キャッシュバック/キャンペーン/だから/購入した、といったように解析が行われるが、キーワードのとらえ方によっては、キャッシュ/バック/キャンペーン/だから/購入した、といったように解析されてしまうケースが存在する。 For example, if you analyze a comment that you purchased because it is a cashback campaign, it will be analyzed as cashback / campaign / because / purchased, but depending on how you think of keywords, cash / back / campaign / Therefore, there are cases where it is analyzed, such as / purchased.

そこで、本発明では、解析対象に関して適切な解析結果を得る仕組みを提供することを目的とする。 Therefore, an object of the present invention is to provide a mechanism for obtaining an appropriate analysis result for an analysis target.

上記目的を達成するための本発明は、所定の順に従って位置する解析対象を解析する解析手段と、前記解析手段による解析結果に基づき前記所定の順により任意の意味を示す集合をそれぞれ表示する表示手段と、前記表示手段により表示される集合に対する操作により、当該集合に含まれる部分を当該集合に隣接する他の集合に含むように移動させる操作移動手段と、を備えたことを特徴とする。 The present invention for achieving the above object is a display for displaying an analysis means for analyzing an analysis target located in a predetermined order and a set showing an arbitrary meaning in the predetermined order based on the analysis result by the analysis means. It is characterized by comprising means and an operation moving means for moving a portion included in the set so as to be included in another set adjacent to the set by operating the set displayed by the display means.

本発明は、解析対象に関して適切な解析結果を得ることができる、という効果を奏する。 The present invention has the effect that an appropriate analysis result can be obtained for the analysis target.

情報処理システムの構成の一例を示すシステム構成図である。It is a system block diagram which shows an example of the structure of an information processing system. 情報処理装置のハードウェア構成を示すブロック図である。It is a block diagram which shows the hardware configuration of an information processing apparatus. 形態素解析で利用されるコーパスのサンプルである。This is a sample corpus used in morphological analysis. 自動解析結果をテキスト情報から画面にレンダリングするフローチャートである。It is a flowchart which renders the automatic analysis result from text information on a screen. ユーザの操作種類を識別するフローチャートである。It is a flowchart which identifies the operation type of a user. ユーザの操作を識別した上に画面に反映するフローチャートである。It is a flowchart which identifies a user's operation and reflects it on a screen. 修正をかけた自動解析結果を保存する方法を示すフローチャートである。It is a flowchart which shows the method of saving the corrected automatic analysis result. 自動解析結果を文字単位で修正する画面の一例である。This is an example of a screen that corrects the automatic analysis result on a character-by-character basis. 自動解析結果を単語単位で修正する画面の一例である。This is an example of a screen that corrects the automatic analysis result word by word. 自動解析結果を特殊な操作で修正する画面の一例である。This is an example of a screen for modifying the automatic analysis result by a special operation. 自動解析結果により別の単語の候補を通知する画面の一例である。This is an example of a screen that notifies a candidate for another word based on the automatic analysis result.

以下、図面を参照して、本発明の実施形態を詳細に説明する。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.

図1は、本発明における情報処理システムの構成の一例を示すシステム構成図である。尚、各部の詳細な機能については、後述するフローチャートと合わせて説明を行う。 FIG. 1 is a system configuration diagram showing an example of the configuration of the information processing system according to the present invention. The detailed functions of each part will be described together with the flowchart described later.

情報処理装置100は、レンダリング部102、操作識別部103、操作反映部104、及びデータ登録部105を備える。 The information processing device 100 includes a rendering unit 102, an operation identification unit 103, an operation reflection unit 104, and a data registration unit 105.

形態素解析器101は、形態素解析器を示しており、解析対象とする文書に関してコーパス106に記憶されているコーパスに係る情報に基づいて形態素解析を行うことで自動解析した結果を自動解析結果DB107へ記憶する。 The morphological analyzer 101 indicates a morphological analyzer, and the result of automatic analysis by performing morphological analysis based on the information related to the corpus stored in the corpus 106 with respect to the document to be analyzed is transferred to the automatic analysis result DB 107. Remember.

レンダリング部102は、文書に対する形態素解析の自動解析結果を自動解析結果DB107より取得して、UI(ユーザインタフェース)の画面で表示することを機能している
操作識別部103は、ユーザがUIの画面に対して行う操作を識別し、ユーザの意図を判別する機能を備える。
The rendering unit 102 has a function of acquiring the automatic analysis result of the morphological analysis of the document from the automatic analysis result DB 107 and displaying it on the UI (user interface) screen. The operation identification unit 103 allows the user to display the UI screen. It has a function to identify the operation to be performed on the user and determine the intention of the user.

操作反映部104は、操作識別部103で認識したユーザの意図に従って、形態素解析の自動解析結果を修正し、UIの画面で反映することを機能している。 The operation reflection unit 104 functions to modify the automatic analysis result of the morphological analysis according to the user's intention recognized by the operation identification unit 103 and reflect it on the UI screen.

データ登録部105は、操作反映部104で修正した解析結果を元のコーパス106(正しく解析済のテキストデータ)に追加、又は自動解析結果を保存する自動解析結果DB107に追加するように機能している。 The data registration unit 105 functions to add the analysis result corrected by the operation reflection unit 104 to the original corpus 106 (correctly analyzed text data) or to the automatic analysis result DB 107 that saves the automatic analysis result. There is.

形態素解析器101は、拡張したコーパスを再び利用し、新たな形態素解析をより高精度で学習することを促すことが可能になる。 The morphological analyzer 101 can reuse the expanded corpus to encourage learning of new morphological analysis with higher accuracy.

尚、情報処理装置100と形態素解析器101、コーパス106、及び自動解析結果DB107とは別々の装置に含まれるように図示しているが、このような構成にとどまらず、全ての構成を情報処理装置100に含まる構成であっても良いし、何れの機能を情報処理装置100へ含むような構成であっても良い。 Although the information processing device 100, the morphological analyzer 101, the corpus 106, and the automatic analysis result DB 107 are shown to be included in separate devices, the information processing is not limited to such a configuration and all configurations are processed. The configuration may be included in the device 100, or any function may be included in the information processing apparatus 100.

以下、図2を用いて、本発明の実施例における情報処理装置100に適用可能なハードウェア構成について説明する。 Hereinafter, the hardware configuration applicable to the information processing apparatus 100 according to the embodiment of the present invention will be described with reference to FIG.

図2は、図1に示した情報処理装置100のハードウェア構成を示すブロック図である。 FIG. 2 is a block diagram showing a hardware configuration of the information processing apparatus 100 shown in FIG.

図2において、201はCPUで、システムバス204に接続される各デバイスやコントローラを統括的に制御する。 In FIG. 2, 201 is a CPU that comprehensively controls each device and controller connected to the system bus 204.

また、ROM202あるいは外部メモリ211には、CPU201の制御プログラムであるBIOS(Basic Input / Output System)やオペレーティングシステムプログラム(以下、OS)や、各サーバ或いは各PCの実行する機能を実現するために必要な後述する各種プログラム等が記憶されている。 Further, the ROM 202 or the external memory 211 is necessary to realize a function executed by a BIOS (Basic Input / Output System) or an operating system program (hereinafter, OS) which is a control program of the CPU 201, and each server or each PC. Various programs described later are stored.

203はRAMで、CPU201の主メモリ、ワークエリア等として機能する。CPU201は、処理の実行に際して必要なプログラム等をROM202あるいは外部メモリ211からRAM203にロードして、該ロードしたプログラムを実行することで各種動作を実現するものである。 Reference numeral 203 denotes a RAM, which functions as a main memory, a work area, and the like of the CPU 201. The CPU 201 realizes various operations by loading a program or the like necessary for executing a process from the ROM 202 or the external memory 211 into the RAM 203 and executing the loaded program.

また、205は入力コントローラで、キーボード(KB)209や不図示のマウス等のポインティングデバイス等からの入力を制御する。 Reference numeral 205 denotes an input controller, which controls input from a keyboard (KB) 209, a pointing device such as a mouse (not shown), or the like.

206はビデオコントローラで、CRTディスプレイ(CRT)210等の表示器への表示を制御する。なお、図2では、CRT210と記載しているが、表示器はCRTだけでなく、液晶ディスプレイ等の他の表示器であってもよい。これらは必要に応じて管理者が使用するものである。 Reference numeral 206 denotes a video controller, which controls the display on a display such as a CRT display (CRT) 210. Although it is described as CRT210 in FIG. 2, the display may be not only the CRT but also another display such as a liquid crystal display. These are used by the administrator as needed.

207はメモリコントローラで、ブートプログラム、各種のアプリケーション、フォントデータ、ユーザファイル、編集ファイル、各種データ等を記憶する外部記憶装置(ハードディスク(HD))や、フレキシブルディスク(FD)、或いはPCMCIAカードスロットにアダプタを介して接続されるコンパクトフラッシュ(登録商標)メモリ等の外部メモリ211へのアクセスを制御する。 The 207 is a memory controller that can be used in an external storage device (hard disk (HD)), flexible disk (FD), or PCMCIA card slot that stores boot programs, various applications, font data, user files, edit files, various data, etc. It controls access to an external memory 211 such as a compact flash (registered trademark) memory connected via an adapter.

208は通信I/Fコントローラで、ネットワークを介して外部機器と接続・通信するものであり、ネットワークでの通信制御処理を実行する。例えば、TCP/IPを用いた通信等が可能である。 Reference numeral 208 denotes a communication I / F controller, which connects and communicates with an external device via a network, and executes communication control processing on the network. For example, communication using TCP / IP is possible.

なお、CPU201は、例えばRAM203内の表示情報用領域へアウトラインフォントの展開(ラスタライズ)処理を実行することにより、CRT210上での表示を可能としている。また、CPU201は、CRT210上の不図示のマウスカーソル等でのユーザ指示を可能とする。 The CPU 201 can display the outline font on the CRT 210 by executing the outline font expansion (rasterization) process in the display information area in the RAM 203, for example. Further, the CPU 201 enables a user instruction with a mouse cursor or the like (not shown) on the CRT 210.

本発明を実現するための後述する各種プログラムは、外部メモリ211に記録されており、必要に応じてRAM203にロードされることによりCPU201によって実行されるものである。 Various programs described later for realizing the present invention are recorded in the external memory 211, and are executed by the CPU 201 by being loaded into the RAM 203 as needed.

さらに、上記プログラムの実行時に用いられる定義ファイル及び各種情報テーブル等も、外部メモリ211に格納されており、これらについての詳細な説明も後述する。 Further, a definition file and various information tables used when executing the above program are also stored in the external memory 211, and detailed description of these will be described later.

以下、図3に示す例を用いて、本実施形態における形態素解析器101で利用するコーパスについて説明する。 Hereinafter, the corpus used in the morphological analyzer 101 according to the present embodiment will be described with reference to the example shown in FIG.

図3には、形態素解析器101を学習するためのコーパスの例が示されている。第一カラムでは、「デジタル処理で統合する。」といった例文を構成する単語列を示しており、第二カラムでは、それぞれの単語に対する品詞情報(例えば、名詞、形容詞、動詞)を示している。 FIG. 3 shows an example of a corpus for learning the morphological analyzer 101. The first column shows a word string that constitutes an example sentence such as "integrate by digital processing.", And the second column shows part of speech information (for example, noun, adjective, verb) for each word.

図3のようなコーパスデータを利用し、初期形態素解析モデルの学習ができ、さらに新しい解析結果を追加することによって、新しいモデルの学習も可能である。 The initial morphological analysis model can be learned by using the corpus data as shown in FIG. 3, and a new model can be learned by adding a new analysis result.

以下、図4、図5、及び図6に示すフローチャートを用いて、ユーザの操作に従って、文書の形態素解析を行った結果を登録する処理について説明する。 Hereinafter, the process of registering the result of performing the morphological analysis of the document according to the operation of the user will be described with reference to the flowcharts shown in FIGS. 4, 5, and 6.

図4に示すフローチャートを用いて、形態素解析器101が例文を自動解析した結果をUIの画面へ反映(レンダリング)する処理について説明する。 The process of reflecting (rendering) the result of automatic analysis of the example sentence on the UI screen by the morphological analyzer 101 will be described with reference to the flowchart shown in FIG.

ステップS401では、レンダリング部102は、文書の形態素解析を自動で行った解析結果を自動解析結果DB107からテキスト形式で読み込んで、分割された単語列の情報を取得する。 In step S401, the rendering unit 102 reads the analysis result obtained by automatically performing the morphological analysis of the document from the automatic analysis result DB 107 in a text format, and acquires the information of the divided word string.

ステップS402では、レンダリング部102は、自動解析結果から、分割されたそれぞれの単語に対応する、単語の品詞情報を取得する。 In step S402, the rendering unit 102 acquires the part-speech information of the word corresponding to each of the divided words from the automatic analysis result.

ステップS403では、レンダリング部102は、分割された単語の数に応じて、単語を囲むバブルの数を決める。 In step S403, the rendering unit 102 determines the number of bubbles surrounding the words according to the number of divided words.

ステップS404では、レンダリング部102は、各単語の長さに応じて、各バブルの囲む範囲を決める。 In step S404, the rendering unit 102 determines the range surrounded by each bubble according to the length of each word.

ステップS405では、レンダリング部102は、各単語の品詞情報に応じて、各バブルの色を決める。 In step S405, the rendering unit 102 determines the color of each bubble according to the part of speech information of each word.

ステップS406では、ステップS401からステップS405までの各処理で決まったパラメータを利用し、色付きのバブルで囲んだ単語をUIの画面へレンダリングする。 In step S406, the parameters determined in each process from step S401 to step S405 are used to render the word surrounded by colored bubbles on the UI screen.

図5に示すフローチャートを用いて、バブルで囲まれた単語に関して、ユーザの操作を受け取り、修正する対象と修正する方法を認識する処理について説明する。 Using the flowchart shown in FIG. 5, a process of receiving a user's operation and recognizing a target to be modified and a method of modifying the word surrounded by bubbles will be described.

ステップS501では、操作識別部103は、ユーザがマウス操作により移動するカーソルが各バブルで囲まれている単語の下部にマウスオーバーしている状態であるかを判断し、マウスオーバーしている状態であると判断した場合は、ステップS505へ処理を進め、マウスオーバーしている状態であると判断しない場合は、ステップS502へ処理を進める。 In step S501, the operation identification unit 103 determines whether the cursor that the user moves by operating the mouse is hovering over the lower part of the word surrounded by each bubble, and in the state of hovering over. If it is determined that there is, the process proceeds to step S505, and if it is not determined that the mouse is over, the process proceeds to step S502.

ステップS502では、操作識別部103は、カーソルがある文字が表示されている位置にマウスオーバーしている状態であるかを判断し、マウスオーバーしている状態であると判断した場合は、ステップS506へ処理を進め、マウスオーバーしている状態であると判断しない場合は、ステップS503へ処理を進める。 In step S502, the operation identification unit 103 determines whether the mouse is over the position where the character with the cursor is displayed, and if it is determined that the mouse is over, the operation identification unit 103 determines that the mouse is over. If it is not determined that the mouse is over, the process proceeds to step S503.

ステップS503では、操作識別部103は、カーソルが「線を引く」動作であるかを判断し、「線を引く」動作であると判断した場合は、ステップS504へ処理を進め、「線を引く」動作であると判断しない場合は、ステップS513へ処理を進める。 In step S503, the operation identification unit 103 determines whether the cursor is in the "drawing a line" operation, and if it is determined that the cursor is in the "drawing a line" operation, proceeds to step S504 and "draws a line". If it is not determined that the operation is performed, the process proceeds to step S513.

ステップS504では、操作反映部104は、ユーザがマウスのボタンを押した位置と、マウスのボタンを離す位置から、ユーザの引いた線分を計算し、さらに、各バブル内に、二文字の中心を結ぶ線分をそれぞれ計算する。 In step S504, the operation reflection unit 104 calculates the line segment drawn by the user from the position where the user presses the mouse button and the position where the mouse button is released, and further, the center of the two characters in each bubble. Calculate each line segment connecting.

ユーザの引いた線分と交点のある二文字線分を算出することによって、該当二文字の間に分割されることを判断する。 By calculating a two-character line segment having an intersection with the line segment drawn by the user, it is determined that the line segment is divided between the two characters.

ステップS505では、操作識別部103は、操作対象がバブルに囲まれる単語全体と認識する。 In step S505, the operation identification unit 103 recognizes that the operation target is the entire word surrounded by bubbles.

ステップS506では、操作識別部103は、操作対象が該当文字単体と認識する。 In step S506, the operation identification unit 103 recognizes that the operation target is the corresponding character alone.

ステップS507では、操作識別部103は、操作対象に対して、マウスのドラッグ操作であるかを判別し、ドラッグ操作であると判定した場合は、ステップS508へ処理を進め、ドラッグ操作であると判定しない場合は、ステップS510へ処理を進める。 In step S507, the operation identification unit 103 determines whether the operation target is a mouse drag operation, and if it is determined that the mouse is a drag operation, proceeds to step S508 and determines that the operation is a drag operation. If not, the process proceeds to step S510.

ステップS508では、操作識別部103は、他のバブルに近づいてドラッグアンドドロップすることによって、接合する意図であるかを判断し、接合する意図であると判断した場合は、ステップS509へ処理を進め、接合する意図であると判断しない場合は、ステップS512へ処理を進める。 In step S508, the operation identification unit 103 determines whether the intention is to join by approaching another bubble and dragging and dropping, and if it is determined that the intention is to join, the process proceeds to step S509. If it is not determined that the intention is to join, the process proceeds to step S512.

ステップS509では、操作識別部103は、操作対象と接触したバブルとを融合すると判断する。 In step S509, the operation identification unit 103 determines that the operation target and the bubble in contact with the operation target are fused.

ステップS510では、操作識別部103は、「ダブルクリック操作」であるかを判断し、「ダブルクリック操作」であると判断した場合は、ステップS511へ処理を進め、「ダブルクリック操作」であると判断しない場合は、ステップS513へ処理を進める。 In step S510, the operation identification unit 103 determines whether it is a "double-click operation", and if it determines that it is a "double-click operation", proceeds to step S511 and determines that it is a "double-click operation". If no determination is made, the process proceeds to step S513.

ステップS511では、操作識別部103は、バブル内の単語の品詞情報を付ける操作と判断する。 In step S511, the operation identification unit 103 determines that the operation is to add the part of speech information of the word in the bubble.

ステップS512では、操作識別部103は、移動した対象バブルを元の位置に戻すと判断する。 In step S512, the operation identification unit 103 determines that the moved target bubble is returned to its original position.

図6に示すフローチャートを用いて、図5における処理においてユーザの修正したい対象と修正方法を認識した上で、その意図をUIの画面上で反映する方法について説明する。 Using the flowchart shown in FIG. 6, a method of recognizing the target to be corrected by the user and the correction method in the process of FIG. 5 and then reflecting the intention on the UI screen will be described.

ステップS601では、操作反映部104は、操作対象に対して他のバブルと融合する操作であるかを判断し、融合する操作であると判断した場合は、ステップS602へ処理を進め、融合する操作であると判断しない場合は、ステップS603へ処理を進める。 In step S601, the operation reflection unit 104 determines whether the operation target is an operation to be fused with another bubble, and if it is determined that the operation is to be fused, the process proceeds to step S602 and the fusion is performed. If it is not determined, the process proceeds to step S603.

ステップS602では、操作反映部104は、操作対象はバブルの一部であるかを判断し、一部であると判断した場合は、ステップS604へ処理を進め、一部であると判断しない場合は、ステップS605へ処理を進める。 In step S602, the operation reflection unit 104 determines whether the operation target is a part of the bubble, and if it determines that the operation target is a part, proceeds to step S604, and if it does not determine that it is a part, proceeds to the process. , Proceed to step S605.

ステップS603では、操作反映部104は、バブルをユーザの引いた線文に応じてバブルを分ける。 In step S603, the operation reflection unit 104 divides the bubbles according to the line text drawn by the user.

ステップS604では、操作反映部104は、操作対象を元のバブルから分離し、独自のバブルに構成する。 In step S604, the operation reflection unit 104 separates the operation target from the original bubble and configures it into a unique bubble.

ステップS605では、操作反映部104は、操作対象のバブルと接触したバブルと融合する。 In step S605, the operation reflection unit 104 fuses with the bubble in contact with the bubble to be operated.

図7に示すフローチャートを用いて、ユーザの指示に従って修正をかけた自動解析結果を保存する方法について説明する。 Using the flowchart shown in FIG. 7, a method of saving the automatic analysis result modified according to the user's instruction will be described.

ステップS701では、データ登録部105は、ユーザの指示に従って、自動解析結果をコーパスに登録するかを判断し、登録すると判断した場合は、ステップS702へ処理を進め、登録すると判断しない場合は、ステップS703へ処理を進める。 In step S701, the data registration unit 105 determines whether to register the automatic analysis result in the corpus according to the user's instruction, proceeds to step S702 if it determines to register, and steps if it does not determine to register. Proceed to process to S703.

ステップS702では、データ登録部105は、修正をかけた自動解析結果を正解としてコーパス106に登録する。 In step S702, the data registration unit 105 registers the corrected automatic analysis result in the corpus 106 as a correct answer.

ステップS703では、データ登録部105は、、自動解析結果を未完成な状態で自動解析結果DB107に登録する。 In step S703, the data registration unit 105 registers the automatic analysis result in the automatic analysis result DB 107 in an unfinished state.

図8では、自動解析結果をマウス操作で修正する方法の一つを表示する。例として、形態素解析の対象とする文書として「外国人参政権を論じる。」を上げ、自動解析した結果として「外国」、「人参」、「政権」、「を」、「論じる」を得たとする。 In FIG. 8, one method of correcting the automatic analysis result by operating the mouse is displayed. As an example, suppose that "discussing the right of foreigners to vote" is given as a document to be analyzed by morphological analysis, and "foreign", "carrot", "government", "o", and "discuss" are obtained as a result of automatic analysis. ..

そして、本来なら最上段に示すように、「外国」、「人」、「参政権」、「を」、「論じる」といったように自動解析結果が行われるはずであるが、誤った解析結果が得られたため、自動解析結果の修正を行う。 And, as shown in the top row, automatic analysis results should be performed such as "foreign", "people", "suffrage", "o", "discuss", but the wrong analysis result is Since it was obtained, the automatic analysis result is corrected.

まず、バブルに囲まれた単語「外国」、「人参」、「政権」、「を」、「論じる」のうち、「人参」、「政権」に誤りがあるため、ユーザはマウス操作により修正を行う。 First, among the words "foreign", "carrot", "regime", "o", and "discuss" surrounded by bubbles, there is an error in "carrot" and "regime", so the user corrects it by operating the mouse. Do.

これにより、形態素解析が行われた文に対して、読みやすい表示方法で解析結果をユーザに提示することができ、各単語の範囲に、バブル表現を利用して文字列を囲むことによって、解析した文がどの単語に分割されたことを明らかにすることが可能となる。 As a result, the analysis result can be presented to the user in an easy-to-read display method for the sentence for which the morphological analysis has been performed, and the analysis is performed by enclosing a character string in the range of each word using a bubble expression. It is possible to clarify which word the sentence was divided into.

ユーザは、文字「参」の中心部にカーソルを位置させてマウスオーバーし、マウスのポインターが「手のひら」アイコンに変更することは、「参」という文字単体が選択対象になっていることを示している。 The user moves the cursor over the center of the character "San" and changes the mouse pointer to the "Palm" icon, which indicates that the character "San" is selected. ing.

さらに、選択された対象をドラッグし、元の「人参」バブルから文字「参」が分割され、単独なバブルに構成する。 Furthermore, by dragging the selected target, the character "Ginseng" is split from the original "Ginseng" bubble to form a single bubble.

これにより、分割していない単語のバブルをマウスの簡易操作で分離することで、単語の分割を行うことができる。 As a result, words can be divided by separating bubbles of undivided words with a simple mouse operation.

そして、「参」バブルと「政権」バブルとの接触によって、「参政権」バブルに融合する。 Then, by contacting the "suffrage" bubble and the "regime" bubble, it merges into the "suffrage" bubble.

分割、または新しく構成したバブルに対して、デフォルトとして品詞情報なしとみなし、灰色のバブルで囲む。 For bubbles that are split or newly constructed, it is assumed that there is no part of speech information by default, and it is surrounded by gray bubbles.

灰色のバブルをダブルクリックすることによって、品詞情報の選択または入力することができる。 Part of speech information can be selected or entered by double-clicking on the gray bubble.

これにより、バブルの背景色が各種の品詞に対応する色に変更し、まだ指定していない単語のバブルは灰色にすることによって、同じ種類の単語の参照、未指定の単語の品詞情報付けなどの操作が便利になる。 As a result, the background color of the bubble is changed to the color corresponding to various part of speech, and the bubble of the word that has not been specified is made gray, so that the same type of word can be referred to, the part of speech information of the unspecified word, etc. The operation of is convenient.

さらに、新しい構成、分割した単語の品詞情報について、新しい単語が生成した瞬間に、可能になる品詞情報の選択肢を提示することにより、ユーザの選択忘れや一連操作による選択により、ユーザの作業を支援することができる。 Furthermore, regarding the new composition and the part-of-speech information of the divided words, by presenting the possible part-speech information options at the moment when the new word is generated, the user's work is supported by forgetting to select the user or selecting by a series of operations. can do.

次に、図9では、自動解析結果をマウス操作で修正する別の方法の一つを表示する。例として、図8で説明した文書と同様な文書に対して形態素解析を行い、同様な自動解析結果が得られたとし、この結果を修正する。 Next, FIG. 9 displays one of the other methods for correcting the automatic analysis result by operating the mouse. As an example, it is assumed that a morphological analysis is performed on a document similar to the document described in FIG. 8 and a similar automatic analysis result is obtained, and this result is corrected.

まず、単語「人参」の下部にカーソルを位置させてマウスオーバーし、マウスのポインターが「手のひら」アイコンに変更し、単語バブルの下部にアンダーバーが表示されることによって、「人参」という単語が選択対象になっていることを示している。 First, place the cursor at the bottom of the word "carrot" and mouse over it, the mouse pointer changes to a "palm" icon, and an underscore appears at the bottom of the word bubble to select the word "carrot". Indicates that it is a target.

選択対象のバブル「人参」をドラッグし、「政権」バブルとの接触することによって、「人参政権」バブルに融合する。 By dragging the bubble "Ginseng" to be selected and contacting the "Government" bubble, it merges with the "Ginseng Government" bubble.

これにより、バブルで囲まれる各単語にたいして、全体を選択し、他のバブルに融合することによって、過分割した単語を正しく容易に修正することができる。 This makes it possible to correct overdivided words correctly and easily by selecting the whole word surrounded by bubbles and fusing it with other bubbles.

図10では、自動解析結果をマウス操作で修正する別の方法の一つを表示する。例として、「外国」、「人参政権」、「を」、「論じる」として分解された単語に関して、バブル「人参政権」における、文字「人」と文字「参」の間に、マウスで線を引く動作を行った場合、該当位置から元のバブルが分割され、バブル「人」とバブル「参政権」となるように分割がなされる。 In FIG. 10, one of the other methods for correcting the automatic analysis result by operating the mouse is displayed. As an example, for words decomposed as "foreign", "ginseng government", "o", "discuss", draw a line with the mouse between the letters "person" and the letter "san" in the bubble "ginseng government". When the pulling action is performed, the original bubble is split from the corresponding position, and the bubble is split into a bubble "person" and a bubble "suffrage".

これにより、分割していない単語のバブルをマウスの簡易操作で分離することで、単語の分割を行うことができる。 As a result, words can be divided by separating bubbles of undivided words with a simple mouse operation.

尚、隣接するバブルの直近の単語間の連接コストやそれぞれの単語の生起コスト等を示すコスト情報を用いて、当該単語間のコスト情報と、隣接するバブル間で表示されている単語とは異なる単語間のコスト情報とを比較し、当該異なる単語で連接する可能性が高い場合(例えば、コスト差が所定閾値以内等)、ユーザへその旨を通知する情報を表示しても良い。 It should be noted that the cost information between the words and the word displayed between the adjacent bubbles are different from each other by using the cost information indicating the connection cost between the latest words of the adjacent bubbles and the occurrence cost of each word. When the cost information between words is compared and there is a high possibility that the different words are connected (for example, the cost difference is within a predetermined threshold), information for notifying the user may be displayed.

例えば、図11に示すように、形態素解析を行った結果、「人参」と「政権」とがそれぞれ別の単語として解析されて表示している状態で、「人参」のコスト情報と、「参政権」のコスト情報とを比較し、「参政権」としても良い場合には、その旨を通知するように表示しても良い。 For example, as shown in FIG. 11, as a result of morphological analysis, "carrot" and "administration" are analyzed and displayed as different words, and the cost information of "carrot" and "suffrage" are displayed. It may be compared with the cost information of "right", and if it may be "suffrage", it may be displayed to notify that fact.

また、本発明の実施形態では、バブルで表示しているが、このような表示方法に限らず、単語のハイライト表示や単語を囲むように矩形表示したり、単語に下線を表示するような方法でも良く、ユーザが分割された単語であることを認識できるように表示していれば良い。 Further, in the embodiment of the present invention, the word is displayed as a bubble, but the display method is not limited to such a display method, such as highlighting a word, displaying a rectangle so as to surround the word, or displaying an underline on the word. The method may be used, and it is sufficient that the word is displayed so that the user can recognize that the word is divided.

さらに、本発明の実施形態では、文書を解析対象としているが、文書に限らず、数値、画像、記号等、何かしらの順に従って位置するものを解析対象とし、解析結果に基づいて任意の意味を示すように分類して(集合を)それぞれ表示できるものであれば、どのような対象であっても良い。 Further, in the embodiment of the present invention, the document is the analysis target, but the analysis target is not limited to the document, but a numerical value, an image, a symbol, etc., which are located in some order, and an arbitrary meaning is given based on the analysis result. Any object may be used as long as it can be classified and displayed (set) as shown.

以上、本発明によれば、解析対象に関して適切な解析結果を得ることができる。 As described above, according to the present invention, an appropriate analysis result can be obtained for the analysis target.

また、本発明により、形態素解析の結果を用いて統計的な学習を行うような場合、正しく解析した結果としての正解データが必要となるが、このような学習を行うには大量の正解データが必要となる。 Further, according to the present invention, when statistical learning is performed using the results of morphological analysis, correct answer data as a result of correct analysis is required, but a large amount of correct answer data is required for such learning. You will need it.

この正解データを作成する(アノテーションする)には、主に手作業で行われることが多かったが、解析がうまく行えていない結果を修正するのも作業的な負荷がかかっていたが、本発明によりこのような作業負荷を軽減することが可能となる。 Creating (annotating) this correct answer data was often done manually, but it was also a work load to correct the results that were not analyzed well, but the present invention This makes it possible to reduce such a workload.

さらに、文を解析した結果をラティス形式で表示する、例えば、解析によって分割された各単語が一つの箱の中に、また隣り合う単語は線によって結ばれて表示される単語の箱の中の数値、及び、箱の下部の数値はそれぞれ、単語のコストと単語間の接続のコストを表し、曖昧な単語分割や、品詞付け方を複数のパスで表示するような形式により、箱をクリックすることによって正解パスを選択することができるようなシステムも考えられる。 In addition, the results of sentence analysis are displayed in lattice format, for example, each word divided by the analysis is displayed in one box, and adjacent words are connected by a line in the displayed word box. The numbers and the numbers at the bottom of the box represent the cost of the word and the cost of the connection between the words, respectively, and click the box in a format that displays ambiguous word divisions and part-of-speech in multiple paths. A system that allows you to select the correct path is also conceivable.

しかしながら、このようなシステムでは、複数の解析結果をユーザに参考として利用するのは可能だが、解析結果にない単語分割方法に対してアノテーションすることが難しくなり、さらに、ラティス構造は文の単語分割情報などを表すのは直感的ではないが、本発明であれば、アノテーション作業も容易に行うことができ、直感的に分割されている単語を容易に把握することが可能となる。 However, in such a system, although it is possible to use multiple analysis results as a reference for the user, it is difficult to annotate a word division method that is not included in the analysis results, and the lattice structure is a word division of a sentence. Although it is not intuitive to represent information or the like, according to the present invention, annotation work can be easily performed, and words that are intuitively divided can be easily grasped.

100 情報処理装置
101 形態素解析器
102 レンダリング部
103 操作識別部
104 操作反映部
105 データ登録部
106 コーパス
107 自動解析結果DB
100 Information processing device 101 Morphological analyzer 102 Rendering unit 103 Operation identification unit 104 Operation reflection unit 105 Data registration unit 106 Corpus 107 Automatic analysis result DB

Claims (10)

所定の順に従って位置する解析対象を解析する解析手段と、
前記解析手段による解析結果に基づき前記所定の順により任意の意味を示す集合をそれぞれ表示する表示手段と、
前記表示手段により表示される集合に対する操作により、当該集合に含まれる部分を当該集合に隣接する他の集合に含むように移動させる操作移動手段と、
を備えたことを特徴とする情報処理装置。
An analysis means for analyzing analysis targets located in a predetermined order,
A display means for displaying a set showing an arbitrary meaning in the predetermined order based on the analysis result by the analysis means, and a display means.
An operation moving means for moving a part included in the set so as to be included in another set adjacent to the set by an operation on the set displayed by the display means.
An information processing device characterized by being equipped with.
前記操作移動手段は、前記集合に対する操作により、当該集合を前記他の集合へ含むように移動させることを特徴とする請求項1に記載の情報処理装置。 The information processing apparatus according to claim 1, wherein the operation moving means moves the set so as to be included in the other set by operating the set. 前記操作移動手段は、前記集合の部分に対する操作により、当該集合の部分を他の集合へ含むように移動させることを特徴とする請求項1または2に記載の情報処理装置。 The information processing apparatus according to claim 1 or 2, wherein the operation moving means is moved so as to include the part of the set to another set by operating the part of the set. 前記操作移動手段は、前記集合の部分に対する操作により、当該集合の部分を新たな集合に含むように移動させることを特徴とする請求項1乃至3の何れか1項に記載の情報処理装置。 The information processing apparatus according to any one of claims 1 to 3, wherein the operation moving means is moved so as to include the part of the set in a new set by operating the part of the set. 前記解析手段は、文書を前記解析対象として解析し、
前記表示手段は、前記文書の単語を前記集合として表示し、
前記操作移動手段は、前記単語に含まれる語を隣接する単語へ移動させることを特徴とする請求項1乃至4の何れか1項に記載の情報処理装置。
The analysis means analyzes the document as the analysis target, and analyzes the document.
The display means displays the words of the document as the set.
The information processing apparatus according to any one of claims 1 to 4, wherein the operation moving means moves a word included in the word to an adjacent word.
前記表示手段は、前記文書の単語を区切って表示することを特徴とする請求項5に記載の情報処理装置。 The information processing device according to claim 5, wherein the display means separates and displays words in the document. 前記操作移動手段による移動に基づくそれぞれの集合を登録する登録手段と、
前記登録手段により登録された集合を用いて前記解析手段による解析を行うために学習を行う学習手段と、
を備えたことを特徴とする請求項1乃至6の何れか1項に記載の情報処理装置。
A registration means for registering each set based on the movement by the operation movement means, and
A learning means for learning to perform an analysis by the analysis means using a set registered by the registration means, and a learning means for performing analysis by the analysis means.
The information processing apparatus according to any one of claims 1 to 6, wherein the information processing device is provided.
前記解析手段は、前記学習手段の学習により得られる正解データに基づいて前記解析対象を解析することを特徴とする請求項7に記載の情報処理装置。 The information processing apparatus according to claim 7, wherein the analysis means analyzes the analysis target based on correct answer data obtained by learning the learning means. 情報処理装置の制御方法であって、
前記情報処理装置は、
所定の順に従って位置する解析対象を解析する解析ステップと、
前記解析ステップによる解析結果に基づき前記所定の順により任意の意味を示す集合をそれぞれ表示する表示ステップと、
前記表示ステップにより表示される集合に対する操作により、当該集合に含まれる部分を当該集合に隣接する他の集合に含むように移動させる操作移動ステップと、
を実行することを特徴とする情報処理装置。
It is a control method for information processing equipment.
The information processing device
An analysis step that analyzes the analysis target located in a predetermined order, and
A display step that displays a set showing an arbitrary meaning in the predetermined order based on the analysis result of the analysis step, and a display step.
An operation moving step of moving a part included in the set so as to be included in another set adjacent to the set by an operation on the set displayed by the display step.
An information processing device characterized by executing.
コンピュータを、
所定の順に従って位置する解析対象を解析する解析手段と、
前記解析手段による解析結果に基づき前記所定の順により任意の意味を示す集合をそれぞれ表示する表示手段と、
前記表示手段により表示される集合に対する操作により、当該集合に含まれる部分を当該集合に隣接する他の集合に含むように移動させる操作移動手段と、
して機能させるためのプログラム。
Computer,
An analysis means for analyzing analysis targets located in a predetermined order,
A display means for displaying a set showing an arbitrary meaning in the predetermined order based on the analysis result by the analysis means, and a display means.
An operation moving means for moving a part included in the set so as to be included in another set adjacent to the set by an operation on the set displayed by the display means.
A program to make it work.
JP2019116531A 2019-06-24 2019-06-24 Information processing apparatus, control method, and program Pending JP2021002278A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019116531A JP2021002278A (en) 2019-06-24 2019-06-24 Information processing apparatus, control method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019116531A JP2021002278A (en) 2019-06-24 2019-06-24 Information processing apparatus, control method, and program

Publications (1)

Publication Number Publication Date
JP2021002278A true JP2021002278A (en) 2021-01-07

Family

ID=73994008

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019116531A Pending JP2021002278A (en) 2019-06-24 2019-06-24 Information processing apparatus, control method, and program

Country Status (1)

Country Link
JP (1) JP2021002278A (en)

Similar Documents

Publication Publication Date Title
US20240078276A1 (en) Display Device Displaying a Keyword for Selecting a Next Slide During Presentation
KR102381801B1 (en) Systems and methods for guiding handwriting input
DE102016125760A1 (en) Predicting search queries through a keyboard
US20100066764A1 (en) Selective character magnification on touch screen devices
US8976118B2 (en) Method for character correction
US20220188514A1 (en) System for analyzing and prescribing content changes to achieve target readability level
KR102345002B1 (en) Patent document creating device, method, computer program, computer-readable recording medium, server and system
US10713220B2 (en) Intelligent electronic data capture for medical patient records
CN110678858B (en) Data information storage device for search
WO2020210008A1 (en) Targeted rewrites
US20180018315A1 (en) Information processing device, program, and information processing method
US9141867B1 (en) Determining word segment boundaries
US20190303437A1 (en) Status reporting with natural language processing risk assessment
US11899904B2 (en) Text input system with correction facility
US20150186363A1 (en) Search-Powered Language Usage Checks
JP2021002278A (en) Information processing apparatus, control method, and program
JP2006276912A (en) Device, method, and program for editing document
JP2019215936A (en) Automatic translation device and automatic translation program
KR101786019B1 (en) Intelligent auto-completion method and apparatus sentence
CN113656034B (en) Information processing method, information processing device, electronic equipment and storage medium
Herbig Multi-modal post-editing of machine translation
US20230025835A1 (en) Workflow generation support apparatus, workflow generation support method and workflow generation support program
Zilka et al. DISPLAYING INFORMATION RELATING TO SELECTED TEXT
Lee Enhancing the Usability of Computer Applications for People With Visual Impairments via UI Augmentation
JP6598241B2 (en) Automatic translation apparatus and automatic translation program