JP6613671B2 - Information processing device - Google Patents
Information processing device Download PDFInfo
- Publication number
- JP6613671B2 JP6613671B2 JP2015141907A JP2015141907A JP6613671B2 JP 6613671 B2 JP6613671 B2 JP 6613671B2 JP 2015141907 A JP2015141907 A JP 2015141907A JP 2015141907 A JP2015141907 A JP 2015141907A JP 6613671 B2 JP6613671 B2 JP 6613671B2
- Authority
- JP
- Japan
- Prior art keywords
- character string
- data
- morpheme
- character
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
本発明は、情報処理装置に関する。 The present invention relates to an information processing apparatus .
ディスプレイ装置等に表示される文字列の読み易さを向上させるために、文節の区切りや意味の区切り等に基づいて、文字間に句読点を挿入する技術が知られている。 In order to improve the readability of a character string displayed on a display device or the like, a technique for inserting punctuation marks between characters based on clause breaks, meaning breaks, or the like is known.
また、文字列の文字間に空白文字を挿入する技術が知られている(例えば特許文献1参照)。 In addition, a technique for inserting a blank character between characters in a character string is known (see, for example, Patent Document 1).
ここで、文字列の読み易さを考慮すると、文字間の間隔は、例えば文節の区切りや意味の区切りに応じた適切な間隔であることが好ましい。 Here, considering the readability of the character string, it is preferable that the interval between characters is an appropriate interval according to, for example, a paragraph break or a meaning break.
しかしながら、上記の従来技術のように、文字列の文字間に空白文字を挿入する場合、空白文字のサイズによっては、文字間の間隔が空きすぎて、文章が間延びしたような印象を読み手に与えてしまうことがある。 However, when a blank character is inserted between characters in a character string as in the above-described prior art, depending on the size of the blank character, there is too much space between characters, giving the reader an impression that the sentence is extended. May end up.
開示の技術は、文字列の読み易さ向上を支援することを目的とする。 It is an object of the disclosed technique to support improvement in readability of a character string.
開示の技術は、1以上の情報処理装置を含む情報処理システムであって、入力された文字列データにより示される文字列を、複数の形態素に分割して、該形態素が分類される品詞と対応付けて、複数の形態素データを生成する生成手段と、前記生成手段により生成された形態素データの品詞が所定の品詞であるか否かを判定する第1の判定手段と、前記第1の判定手段により前記形態素データの品詞が所定の品詞であると判定された場合、前記文字列において、前記形態素データの形態素の次に所定の文字が出現するか否かを判定する第2の判定手段と、前記第2の判定手段により前記形態素データの形態素の次に前記所定の文字が出現しないと判定された場合、前記文字列において、前記形態素の次に、所定のサイズの空白を示す文字を挿入する挿入手段とを有する。 The disclosed technology is an information processing system including one or more information processing apparatuses, and divides a character string indicated by input character string data into a plurality of morphemes and corresponds to the part of speech in which the morphemes are classified In addition, a generation unit that generates a plurality of morpheme data, a first determination unit that determines whether or not a part of speech of the morpheme data generated by the generation unit is a predetermined part of speech, and the first determination unit When it is determined that the part of speech of the morpheme data is a predetermined part of speech, second determination means for determining whether or not a predetermined character appears next to the morpheme of the morpheme data in the character string; When the second determination means determines that the predetermined character does not appear after the morpheme of the morpheme data, a character indicating a blank of a predetermined size is inserted next to the morpheme in the character string. And a insertion means for.
文字列の読み易さ向上を支援することができる。 It can help improve the readability of character strings.
次に、本発明の実施の形態について、詳細に説明する。 Next, embodiments of the present invention will be described in detail.
[第一の実施形態]
まず、第一の実施形態の文字処理システム1のシステム構成について、図1を参照しながら説明する。図1は、第一の実施形態の文字処理システムの一例のシステム構成を示す図である。
[First embodiment]
First, the system configuration of the
図1に示す文字処理システム1は、メールサーバ10と、クライアント端末20とを有し、インターネットや電話回線網等のネットワークNを介して通信可能に接続されている。
A
メールサーバ10は、クライアント端末20から送信されたメールを他のクライアント端末20等に送信(転送)する情報処理装置である。このとき、メールサーバ10は、クライアント端末20から送信されたメールの本文に含まれる文字列について、文節の区切りや意味の区切り等に応じて、文字間の間隔を空ける処理を行う。
The
すなわち、メールサーバ10は、クライアント端末20から送信されたメールの本文に含まれる文字列の文字間を適切に空ける処理を行うことで、当該文字列が表示された際の読み易さを向上させる。ここで、本実施形態のメールサーバ10は、文字列の意味の区切りに応じて、予め設定されたサイズ(ポイント)の空白を挿入することで、文字間の間隔を空ける処理を行うものとする。
That is, the
なお、空白のサイズ(ポイント)は、当該空白が挿入される文字列の文字のサイズ(ポイント)よりも小さい値であることが好ましい。 The blank size (point) is preferably smaller than the character size (point) of the character string into which the blank is inserted.
クライアント端末20は、ユーザが利用する端末であり、例えば、デスクトップ型PC、ノート型PC、携帯電話、スマートフォン、及びタブレット端末等の各種の電子機器である。ユーザは、クライアント端末20を操作してメールを作成し、メールサーバ10を介して、宛先として指定された他のクライアント端末20等に当該メールを送信することができる。
The
ここで、本実施形態のメールサーバ10において、空白を挿入することにより、メールの本文に含まれる文字列の文字間の間隔を空ける場合の一例について、図2を参照しながら説明する。図2は、空白挿入の一例を示す図である。
Here, an example in the case where a space is inserted between characters of a character string included in the mail body by inserting a blank in the
まず、クライアント端末20から送信されたメールの本文には、図2(a)に示すように、「私は、来月から海外旅行に行きます。」との文字列F10が含まれていたものとする。
First, as shown in FIG. 2 (a), the text of the email sent from the
このとき、本実施形態のメールサーバ10は、図2(a)に示す文字列F10の意味の区切りに応じて、図2(b)に示すように、空白2及び空白3が挿入された文字列F11を生成する。このように、本実施形態のメールサーバ10は、意味の区切りとなる位置に空白を挿入することで、表示された際に読み易い文字列F11を生成する。換言すれば、本実施形態のメールサーバ10は、意味の区切りとなる位置における文字間の間隔を空けることで、表示された際に読み易い文字列F11を生成する。
At this time, the
そして、本実施形態のメールサーバ10は、文字列F11をメールの本文に含むメールを、当該メールの宛先である他のクライアント端末20等に送信する。
Then, the
これにより、本実施形態の文字処理システム1では、メールを受信した他のクライアント端末20等においてメールが表示された際に、読み易い文字列でメールを表示することができるようになる。
Thereby, in the
次に、第一の実施形態のメールサーバ10及びクライアント端末20のハードウェア構成について、図3を参照しながら説明する。図3は、第一の実施形態のコンピュータのハードウェア構成の一例を示す図である。
Next, the hardware configuration of the
図2に示すコンピュータ300は、入力装置301、表示装置302、外部I/F303、及びRAM(Random Access Memory)304を有する。また、コンピュータ300は、ROM(Read Only Memory)305、CPU(Central Processing Unit)306、通信I/F307、及びHDD308を有する。これら各ハードウェア構成は、バスBにより相互に接続されている。
A
入力装置301は、キーボードやマウス、タッチパネル等を含み、コンピュータ300に各種信号を入力するのに用いられる。表示装置302は、ディスプレイ装置等を含み、各種の処理結果を表示する。なお、メールサーバ10は、入力装置301及び/又は表示装置302を、必要なときにバスBに接続して利用する形態であっても良い。
The
外部I/F303は、外部装置とのインタフェースである。外部装置には、例えば、CD(Compact Disk)やDVD(Digital Versatile Disk)、SDメモリカード(SD memory card)、USBメモリ(Universal Serial Bus memory)等の記録媒体がある。コンピュータ300は、外部I/F303を介して、記録媒体に格納された情報の読み取り及び/又は記録媒体に情報の書き込みを行うことができる。
The external I /
RAM304は、プログラムやデータを一時保存する揮発性の半導体メモリ(記憶装置)である。ROM305は、電源を切ってもデータを保持することができる不揮発性の半導体メモリ(記憶装置)である。CPU306は、例えばHDD308やROM305等からプログラムやデータをRAM304上に読み出して、各種処理を実行する演算装置である。
The
通信I/F307は、コンピュータ300をネットワークNに接続するためのインタフェースである。
The communication I /
HDD308は、プログラムやデータを格納している不揮発性のメモリ(記憶装置)である。HDD308に格納されるプログラムやデータには、本実施形態を実現するプログラムや、コンピュータ300の全体を制御する基本ソフトウェアであるOS(Operating System)、OS上で動作する各種アプリケーションプログラム等がある。
The
なお、コンピュータ300は、HDD308の代わりに又はHDD308と併せて、SSD(Solid State Drive)やフラッシュメモリ等の不揮発性のメモリ(記憶装置)を用いても良い。
The
本実施形態のメールサーバ10及びクライアント端末20は、図3に示すようなコンピュータ300により後述する各種処理を実現することができる。
The
次に、第一の実施形態の文字処理システム1の機能構成ついて、図4を参照しながら説明する。図4は、第一の実施形態の文字処理システムの一例の機能構成を示す図である。
Next, the functional configuration of the
図4に示すように、クライアント端末20は、メール処理部201を有する。メール処理部201は、クライアント端末20にインストールされた1以上のプログラムが、CPU306に実行させる処理により実現される。
As illustrated in FIG. 4, the
メール処理部201は、ユーザにより作成されたメールをメールサーバ10に送信する。また、メール処理部201は、メールサーバ10を介して、他のクライアント端末20等から送信されたメールを受信する。
The
図4に示すように、メールサーバ10は、文字列データ入力部101、形態素解析部102、空白処理部103、及び出力部104を有する。これら各部は、メールサーバ10にインストールされた1以上のプログラムが、CPU306に実行させる処理により実現される。
As shown in FIG. 4, the
また、メールサーバ10は、辞書DB105、解析結果テーブル106、及び出力テーブル107を有する。これらは、HDD308により実現可能である。なお、これらは、メールサーバ10とネットワークを介して接続される記憶装置等により実現されていても良い。
The
文字列データ入力部101は、文字列データを入力する。すなわち、本実施形態の文字列データ入力部101は、クライアント端末20から送信されたメールの本文に含まれる文字列の文字列データを入力する。
The character string
形態素解析部102は、辞書DB105に基づいて、文字列データ入力部101により入力された文字列データに対して形態素解析を行い、解析結果を解析結果テーブル106に格納する。すなわち、形態素解析部102は、文字列データにより示される文字列を1以上の形態素に分割して、当該形態素が分類される品詞と対応付けた形態素データを、解析結果テーブル106に格納する。これにより、文字列データにより示される文字列が、1つの単位として意味がある文字又は文字列に分割される。
The
空白処理部103は、解析結果テーブル106に基づいて、空白挿入処理を行う。すなわち、空白処理部103は、解析結果テーブル106に含まれる形態素データに基づいて、意味の区切りに応じて空白が挿入された文字列を表示させるための出力データを、出力テーブル107に格納する。ここで、空白処理部103は、形態素入力部111、形態素出力部112、形態素判定部113、及び空白挿入部114を有する。これら各部の詳細については、後述する。
The
出力部104は、出力テーブル107に格納された出力データを出力する。すなわち、出力部104は、出力テーブル107に格納された出力データにより示される文字列を、クライアント端末20から送信されたメールの本文に設定し、宛先として指定された他のクライアント端末20等に当該メールを送信する。
The
形態素入力部111は、解析結果テーブル106に格納された形態素データを入力する。形態素出力部112は、入力された形態素データにより示される文字又は文字列を、出力データとして出力テーブル107に格納する。形態素判定部113は、入力された形態素データの品詞が助詞又は助動詞であるか否かを判定する。また、形態素判定部113は、解析結果テーブル106において、入力された形態素データの次に格納されている形態素データが句点又は読点を示すものであるか否かを判定する。空白挿入部114は、形態素判定部113の判定結果に応じて、出力テーブル107に空白を示す出力データを格納する。
The
辞書DB105は、形態素解析部102による形態素解析に用いられるデータベースである。辞書DB105には、例えば、品詞が対応付けられた単語が複数格納されている。
The
解析結果テーブル106は、形態素解析部102による形態素解析の解析結果である形態素データを格納する。解析結果テーブル106の詳細については、後述する。
The analysis result table 106 stores morpheme data that is an analysis result of morpheme analysis by the
出力テーブル107は、空白処理部103による空白挿入処理の処理結果である出力データを格納する。出力テーブル107の詳細については、後述する。
The output table 107 stores output data that is the processing result of the blank insertion processing by the
次に、第一の実施形態の文字処理システム1の処理の詳細について、図5を参照しながら説明する。図5は、第一の実施形態の文字列処理の一例のフローチャートである。
Next, details of the processing of the
本実施形態では、メールの送信先に宛先を示すメールアドレスと、メールの本文に当該メールの内容を示す文字列とが指定されたメール(メールデータ)が、クライアント端末20のメール処理部201により、メールサーバ10に送信されたものとして説明する。
In this embodiment, a mail (mail data) in which a mail address indicating a destination is specified as a mail transmission destination and a character string indicating the content of the mail is specified by the
まず、メールサーバ10の文字列データ入力部101は、メールを受信すると、受信したメールの本文に指定された文字列を示す文字列データを取得して、当該文字列データを入力する(ステップS501)。
First, when receiving a mail, the character string
次に、メールサーバ10の形態素解析部102は、辞書DB105に基づいて、入力された文字列データに対して形態素解析を行い、解析結果を解析結果テーブル106に格納する(ステップS502)。
Next, the
ここで、本実施形態において、文字列データは、図2(a)に示す文字列F10、すなわち、「私は、来月から海外旅行に行きます。」を示すものとする。このとき、形態素解析部102は、辞書DB105に基づいて、文字列F10を1以上の形態素と、当該形態素の品詞とを対応付けた形態素データを生成して、図6に示すような解析結果テーブル106に格納する。図6は、解析結果テーブルの一例を示す図である。
Here, in the present embodiment, the character string data indicates the character string F10 shown in FIG. 2A, that is, “I will travel abroad from next month.” At this time, the
図6に示すように、解析結果テーブル106は、データ項目として、番号、形態素、及び品詞を有する。番号は、形態素データにより示される形態素が文字列において出現する番号である。形態素は、辞書DB105に基づいて文字列から分割された形態素である。品詞は、辞書DB105において形態素に対応付けられた品詞である。
As shown in FIG. 6, the analysis result table 106 has a number, a morpheme, and a part of speech as data items. The number is a number at which the morpheme indicated by the morpheme data appears in the character string. A morpheme is a morpheme divided from a character string based on the
例えば、番号「1」の形態素データにおいて、形態素は「私」であり、当該形態素の品詞は「名詞」である。同様に、例えば、番号「5」の形態素データにおいて、形態素は「から」であり、当該形態素の品詞は「助詞」である。 For example, in the morpheme data of the number “1”, the morpheme is “I”, and the part of speech of the morpheme is “noun”. Similarly, for example, in the morpheme data of the number “5”, the morpheme is “kara”, and the part of speech of the morpheme is “particle”.
このように、形態素解析部102は、文字列データ入力部101により入力された文字列データを、複数の形態素データに分割して、解析結果テーブル106に格納する。
As described above, the
次に、メールサーバ10の空白処理部103は、解析結果テーブル106に基づいて、空白挿入処理を行う(ステップS503)。すなわち、空白処理部103は、解析結果テーブル106に基づいて空白挿入処理を行い、文字列の意味の区切り等に応じて空白が挿入された文字列を示す出力データが格納された出力テーブル107を作成する。なお、空白挿入処理の詳細については、後述する。
Next, the
最後に、メールサーバ10の出力部104は、出力テーブル107に格納されている出力データを出力する(ステップS504)。すなわち、出力部104は、出力テーブル107に格納されている出力データを、受信したメールの本文に設定する。そして、出力部104は、当該メールを、宛先として指定されたメールアドレスにより示されるクライアント端末20等に送信する。
Finally, the
これにより、クライアント端末20から送信されたメールの本文に指定された文字列が、意味の区切り等に応じて空白が挿入された文字列に変換され、宛先として指定されたメールアドレスにより示されるクライアント端末20等に送信される。したがって、本実施形態の文字処理システム1では、メールの送信先のクライアント端末20等において、当該メールが表示された際に、読み易い文字列を表示させることができる。
As a result, the character string specified in the text of the mail transmitted from the
次に、図5のステップS503における空白挿入処理の詳細について、図7を参照しながら説明する。図7は、第一の実施形態の空白挿入処理の一例のフローチャートである。 Next, details of the blank insertion processing in step S503 in FIG. 5 will be described with reference to FIG. FIG. 7 is a flowchart of an example of blank insertion processing according to the first embodiment.
まず、形態素入力部111は、形態素データの番号を示す変数をnとして、n=1に初期化する(ステップS701)。
First, the
次に、形態素入力部111は、番号nの形態素データを解析結果テーブル106から取得する(ステップS702)。
Next, the
次に、形態素出力部112は、形態素入力部111により入力された番号nの形態素データのデータ項目「形態素」に設定された文字又は文字列を、出力データとして出力テーブル107に格納する(ステップS703)。
Next, the
例えば、番号n=1である場合、形態素出力部112は、番号n=1の形態素データの「形態素」のデータ項目に設定された文字「私」を、出力データとして出力テーブル107に格納する。同様に、例えば、番号n=4である場合、形態素出力部112は、番号n=4の形態素データの「形態素」のデータ項目に設定された文字「来月」を、出力データとして出力テーブル107に格納する。
For example, when the number n = 1, the
次に、形態素判定部113は、形態素入力部113により取得された番号nの形態素データのデータ項目「品詞」が助詞又は助動詞であるか否かを判定する(ステップS704)。
Next, the
なお、ここで、形態素の品詞が助詞又は助動詞であるか否かを判定するのは、助詞又は助動詞が、文字列において意味の区切りとなるからである。したがって、番号nの形態素データのデータ項目「品詞」が助詞又は助動詞である場合、当該形態素データに示される形態素と、番号n+1の形態素データにより示される形態素との間の位置が、空白が挿入される候補の位置となる。 Here, the reason why the morpheme part of speech is a particle or an auxiliary verb is because the particle or auxiliary verb is a semantic separator in the character string. Therefore, when the data item “part of speech” of the number n morpheme data is a particle or auxiliary verb, a blank is inserted between the morpheme indicated in the morpheme data and the morpheme indicated by the number n + 1 morpheme data. Position of the candidate.
ステップS704において、番号nの形態素データのデータ項目「品詞」が助詞又は助動詞であると判定された場合、形態素判定部113は、番号n+1の形態素データのデータ項目「品詞」が句点又は読点であるか否かを判定する(ステップS705)。
If it is determined in step S704 that the data item “part of speech” of the morpheme data of number n is a particle or auxiliary verb, the
なお、ここで、次の形態素の品詞が句点又は読点であるか否かを判定するのは、番号nの形態素データにより示される形態素が意味の区切りとなる場合であっても、句点又は読点が次に出現する場合には、空白を挿入する必要がないからである。 Here, it is determined whether or not the part of speech of the next morpheme is a punctuation mark or a punctuation mark even if the morpheme indicated by the morpheme data of number n is a semantic separator. This is because it is not necessary to insert a blank when it appears next.
換言すれば、文字列において意味の区切りとなる位置に句点又は読点が存在する場合、当該位置に空白文字を挿入すると、文字列が間延びしたような印象を読み手に与え、かえって読み易さを損なう恐れがあるからである。 In other words, if there is a punctuation mark or a punctuation mark at a position where the meaning of the character string is separated, inserting a blank character at that position gives the reader the impression that the character string is extended, which in turn impairs the readability. Because there is a fear.
ステップS705において、番号n+1の形態素データのデータ項目「品詞」が句点又は読点でないと判定された場合、空白挿入部114は、空白を示す文字を出力データとして出力テーブル107に格納する(ステップS706)。これにより、文字列において意味の区切りとなる位置に空白が挿入される。
If it is determined in step S705 that the data item “part of speech” of the number n + 1 morpheme data is not a punctuation mark or a punctuation mark, the
なお、空白を示す文字のサイズ(ポイント)は、メールサーバ10の管理者やクライアント端末20のユーザにより予め設定された値を用いれば良い。ただし、空白を示す文字のサイズは、文字データ列入力部101により入力された文字列のサイズよりも数ポイント小さいサイズであることが好ましい。
Note that the size (points) of characters indicating white space may be a value set in advance by the administrator of the
ここで、ステップS704において番号nの形態素データのデータ項目「品詞」が助詞又は助動詞でないと判定された場合、及びステップS705において番号n+1の形態素データのデータ項目「品詞」が句点又は読点であると判定された場合、ステップS706の処理は実行されない。 Here, when it is determined in step S704 that the data item “part of speech” of the number n morpheme data is not a particle or auxiliary verb, and in step S705, the data item “part of speech” of number n + 1 is a punctuation mark or a punctuation mark. If it is determined, the process of step S706 is not executed.
次に、形態素入力部111は、形態素データの番号を示す変数をnに1を加算する(ステップS707)。
Next, the
続いて、形態素入力部111は、解析結果テーブル106において番号nの形態素データが存在するか否かを判定する(ステップS708)。
Subsequently, the
ステップS708において、番号nの形態素データが存在しないと判定された場合、処理を終了させる。一方、ステップS708において、番号nの形態素データが存在すると判定された場合、ステップS702戻る。 If it is determined in step S708 that there is no morpheme data of number n, the process is terminated. On the other hand, if it is determined in step S708 that morpheme data of number n exists, the process returns to step S702.
以上の空白挿入処理により、図6に示す解析結果テーブル106から図8に示す出力テーブル107が作成される。図8は、出力テーブルの一例を示す図である。 Through the above blank insertion processing, the output table 107 shown in FIG. 8 is created from the analysis result table 106 shown in FIG. FIG. 8 is a diagram illustrating an example of the output table.
図8に示すように、出力テーブル107は、データ項目として、出力内容を有する。出力内容は、形態素出力部111又は空白挿入部114により格納された出力データの内容を示す文字又は文字列である。
As shown in FIG. 8, the output table 107 has output contents as data items. The output content is a character or a character string indicating the content of the output data stored by the
ここで、図8に示す出力テーブル107には、助詞である「から」を示す出力データの後に、空白を示す出力データが格納されている。また、同様に、助詞である「に」を示す出力データの後に、空白を示す出力データが格納されている。このように、出力テーブル107には、意味の区切りの位置に空白を示す出力データが格納されている。 Here, in the output table 107 shown in FIG. 8, output data indicating a blank is stored after the output data indicating the particle “kara”. Similarly, output data indicating a blank is stored after output data indicating the particle “NI”. In this manner, the output table 107 stores output data indicating a blank at the meaning break position.
したがって、上述したように、出力部104は、出力テーブル107に格納された出力データを、受信したメールの本文に設定することで、当該メールの本文に指定された文字列を、文字間の間隔が適切に空けられた読み易い文字列に変換することができる。
Therefore, as described above, the
なお、本実施形態では、意味の区切りの位置は、形態素が助詞又は助動詞である場合として説明したが、これに限られない。意味の区切りの位置は、例えば、名詞が連続する場合において、これらの名詞の間としても良い。具体的には、例えば、「今度旅行に行きます。」との文字列がある場合、名詞「今度」と名詞「旅行」との間を、意味の区切りの位置として、空白を挿入しても良い。 In the present embodiment, the position of the meaning break has been described as a case where the morpheme is a particle or an auxiliary verb, but is not limited thereto. For example, in the case where nouns are consecutive, the position of the separation of meaning may be between these nouns. Specifically, for example, if there is a character string “I will go on a trip next time”, even if a space is inserted between the noun “Now” and the noun “Travel” as the position of the separator of meaning, good.
また、本実施形態では、クライアント端末20がメールを送信する場合について説明したが、これに限られない。本実施形態の文字処理システム1は、クライアント端末20が、例えばIM(Instant Messenger)アプリケーションを用いてIMメッセージを送信する場合についても同様に適用され得る。
Moreover, although this embodiment demonstrated the case where the
[第二の実施形態]
次に、第二の実施形態について説明する。第二の実施形態では、クライアント端末20において文字列処理を行うものである。また、第二の実施形態では、文字列処理の処理結果を確認することができるものである。なお、以下の本実施形態の説明では、第一の実施形態との相違点について説明し、第一の実施形態と同様の機能構成を有するものには、第一の実施形態と同様の符号を付与し、その説明を省略する。
[Second Embodiment]
Next, a second embodiment will be described. In the second embodiment, character string processing is performed in the
まず、第二の実施形態の文字処理システム1の機能構成について、図9を参照しながら説明する。図9は、第二の実施形態の文字処理システムの一例の機能構成を示す図である。
First, the functional configuration of the
図9に示すように、クライアント端末20は、メール処理部201、文字列データ入力部101A、及び出力部104Aを有する。
As shown in FIG. 9, the
文字列データ入力部101Aは、メール処理部201により作成されたメールの本文に含まれる文字列の文字列データを入力する。
The character string
出力部104Aは、出力テーブル107に格納された出力データにより示される文字列を、メール処理部201により作成されたメールの本文に設定し、設定された文字列を表示装置302に出力表示させる。これにより、クライアント端末20のユーザは、意味の区切り等に応じて空白が挿入された文字列を確認することができる。
The
次に、第二の実施形態の文字処理システム1の処理の詳細について、図10を参照しながら説明する。図10は、第二の実施形態の文字列処理の一例のフローチャートである。
Next, details of the processing of the
ユーザは、クライアント端末20を操作して、例えば図11(a)に示すメール作成画面1000において、メールを作成したものとする。図11(a)に示すメール作成画面1000では、メールの送信先である宛先、メールの件名、及びメールの内容である本文が、ユーザにより指定されている。このとき、ユーザがクライアント端末20を操作して送信ボタン1001を押下すると、文字列データ入力部101Aは、メールの本文に指定された文字列F12を示す文字列データを取得して、当該文字列データを入力する(ステップS1001)。
Assume that the user operates the
メールサーバ10の出力部104Aは、出力テーブル107に格納されている出力データを出力して、例えば図11(b)に示す確認画面1100を表示させる(ステップS1002)。すなわち、出力部104Aは、出力テーブル107に格納されている出力データにより示される文字列F13を確認させる確認画面1100を表示させる。
The
図11(b)に示す確認画面1100では、メールの本文に文字列F13が設定されていることが示されている。ここで、文字列F13は、文字列F12において意味の区切りとなる位置に空白4及び空白5が挿入された文字列である。
The
なお、図11(b)に示す確認画面1100において、ユーザによりOKボタン1101が押下されると、文字列F13が本文に設定されたメール(メールデータ)が、メール処理部201により、メールサーバ10に送信される。
When the user presses the
以上のように、本実施形態の文字処理システム1では、クライアント端末20において文字列処理が行われる。しかも、本実施形態の文字処理システム1では、メールが送信される前に、空白が挿入されて読み易さを向上させた文字列をユーザが確認することができる。これにより、ユーザは、メールの受信者のクライアント端末20に表示される文字列を確認することができるようになる。
As described above, in the
なお、本実施形態の文字処理システム1では、クライアント端末20がメールを送信する場合について説明したが、これに限られない。本実施形態の文字処理システム1は、クライアント端末20が、例えばSNS(Social Networking Service)サービスやBlogサービスに文字列を含むコンテンツを投稿する場合にも同様に適用され得る。すなわち、本実施形態の文字列処理システム1は、例えば、クライアント端末20がBlogサービスに文字列を含むコンテンツを投稿する際に、上記の文字列処理を行うとともに、当該文字列処理の結果として読み易さを向上させた文字列をユーザに確認させても良い。
In the
[第三の実施形態]
次に、第三の実施形態について説明する。第三の実施形態では、音声データに基づき生成された文字列データに対して文字列処理を行うものである。なお、以下の本実施形態の説明では、第一の実施形態との相違点について説明し、第一の実施形態と同様の機能構成を有するものには、第一の実施形態と同様の符号を付与し、その説明を省略する。
[Third embodiment]
Next, a third embodiment will be described. In the third embodiment, character string processing is performed on character string data generated based on voice data. In the following description of the present embodiment, differences from the first embodiment will be described, and components having the same functional configuration as those of the first embodiment will be denoted by the same reference numerals as those of the first embodiment. The description is omitted.
まず、第三の実施形態の文字処理システム1のシステム構成について、図12を参照しながら説明する。図12は、第三の実施形態の文字処理システムの一例のシステム構成を示す図である。
First, the system configuration of the
図12に示す文字処理システム1は、端末装置30と、集音装置31とを有し、例えばUSBケーブル等のケーブル32を介して通信可能に接続されている。
The
端末装置30は、ユーザが利用する端末であり、例えば、デスクトップ型PC、ノート型PC、携帯電話、スマートフォン、及びタブレット端末等の各種の電子機器である。端末装置30は、マイク等の集音装置31から入力された音声データに基づいて文字列データを生成し、当該文字列データにより示される文字列を表示させる。端末装置30のハードウェア構成は、例えば、図3に示すコンピュータ300により実現される。
The
なお、端末装置30と集音装置31は、有線接続されている場合に限られず、例えば、無線LANやBluetooth(登録商標)等の無線接続により通信可能に接続されていても良い。
Note that the
次に、第三の実施形態の文字処理システム1の機能構成について、図13を参照しながら説明する。図13は、第三の実施形態の文字処理システムの一例の機能構成を示す図である。
Next, the functional configuration of the
図13に示すように、端末装置30は、変換部108、文字列データ入力部101B、出力部104B、及びサイズ設定部109を有する。また、空白処理部103は、空白挿入部114Aを有する。これら各部は、端末装置30にインストールされた1以上のプログラムが、CPU306に実行させる処理により実現される。
As illustrated in FIG. 13, the
また、端末装置30は、サイズ設定テーブル110を有する。サイズ設定テーブル110は、HDD308により実現可能である。
The
変換部108は、集音装置31により音声が集音されることで生成される音声データを、文字列データに変換する。
The
文字列データ入力部101Bは、変換部108により変換された文字列データを入力する。
The character string
サイズ設定部109は、サイズ設定テーブル110に格納される空白のサイズ(ポイント)を設定する。これにより、ユーザは、例えば入力装置301を介して、サイズ設定部109により、空白のサイズを所望の値に設定することができる。
The
空白挿入部114Aは、サイズ設定テーブル110に格納されたサイズの空白を示す出力データを、出力テーブル107に格納する。
The
出力部104Bは、出力テーブル107に格納された出力データにより示される文字列を、表示装置302に出力表示させる。
The
サイズ設定テーブル110は、空白挿入部114により出力データとして出力テーブル107に格納される空白のサイズ(ポイント)を管理する。すなわち、サイズ設定テーブル110は、例えば、図14に示すように、空白のサイズ(ポイント)を管理している。図14の例では、空白のサイズは「3(ポイント)」に設定されていることを示している。
The size setting table 110 manages the size of blanks (points) stored in the output table 107 as output data by the
次に、第三の実施形態の文字処理システム1の処理の詳細について、図15を参照しながら説明する。図15は、第三の実施形態の文字列処理の一例のフローチャートである。
Next, details of the processing of the
まず、端末装置30の変換部108は、集音装置31により音声が集音されることで生成される音声データを入力する(ステップS1501)。
First, the
次に、端末装置30の変換部108は、入力された音声データを文字列データに変換する(ステップS1502)。なお、変換部108は、例えば、予め記憶された音響モデル等に基づいて音声データを文字列データに変換すれば良い。
Next, the
次に、端末装置30の文字列データ入力部101Bは、変換部108により変換された文字列データを入力する(ステップS1503)。
Next, the character string
端末装置30の空白処理部103は、解析結果テーブル106に基づいて、本実施形態の空白挿入処理を行う(ステップS1504)。すなわち、端末装置30の空白処理部103は、文字列の意味の区切り等に応じて、サイズ設定テーブル110に設定されたサイズの空白文字が挿入された文字列を示す出力データが格納された出力テーブル107を作成する。なお、本実施形態の空白挿入処理の詳細については、後述する。
The
端末装置30の出力部104Bは、出力テーブル107に格納された出力データにより示される文字列を、表示装置302に出力表示させる(ステップS1505)。
The
これにより、端末装置30には、集音装置31により集音されることで生成された音声データに対応する文字列が表示装置302に表示される。しかも、このとき表示される文字列には、意味の区切り等に応じて空白が挿入される。したがって、例えば、公聴会や会議、打ち合わせ等において、発表者や発話者等が発表や発話した内容を文字列にして表示する場合に、読み易い文字列で表示させることができるようになる。
Thereby, on the
次に、図15のステップS1504における空白挿入処理の詳細について、図16を参照しながら説明する。図16は、第三の実施形態の空白挿入処理の一例のフローチャートである。 Next, details of the blank insertion processing in step S1504 of FIG. 15 will be described with reference to FIG. FIG. 16 is a flowchart of an example of blank insertion processing according to the third embodiment.
ステップS705において、番号n+1の形態素データのデータ項目「品詞」が句点又は読点でないと判定された場合、空白挿入部114Aは、サイズ設定テーブル110から空白を示す文字のサイズ(ポイント)を取得する(ステップS1601)。
If it is determined in step S705 that the data item “part of speech” of the number n + 1 morpheme data is not a punctuation mark or a punctuation mark, the
次に、空白挿入部114Aは、ステップS1601で取得したサイズの空白を示す文字を出力データとして出力テーブル107に格納する(ステップS1602)。これにより、文字列において意味の区切りとなる位置に、ユーザがサイズ設定部109により予め設定したサイズの空白が挿入される。
Next, the
以上のように、本実施形態の文字処理システム1では、音声データに基づく文字列を読み易く表示させることができる。このため、例えば、公聴会や会議、打ち合わせ等において、発表者等が発話等した内容を文字列にして表示させるような場合に、読み易い文字列で表示させることができるようになる。
As described above, in the
しかも、本実施形態の文字処理システム1では、文字列の文字間に挿入する空白の大きさをユーザが設定することができる。このため、例えば、公聴会や会議、打ち合わせ等における出席者の性質(例えば、年齢や国籍、視力等)に応じて、適切な大きさの空白をユーザが設定することができるようになる。
In addition, in the
なお、本実施形態の文字処理システム1では、文字列の文字間に空白を示す文字を挿入するものとしたが、これに限られず、例えば、背景と同色の所定の文字等を挿入しても良い。このように、文字間に挿入される文字は、空白に限られずものではなく、視認できない文字であれば良い(換言すれば、文字間の間隔を、所定の間隔空ける(広げる)ことができる文字であれば良い。)。
In the
[第四の実施形態]
次に、第四の実施形態について説明する。第四の実施形態では、外国語を日本語に翻訳することで生成された文字列データに対して文字列処理を行うものである。なお、以下の本実施形態の説明では、第一の実施形態との相違点について説明し、第一の実施形態と同様の機能構成を有するものには、第一の実施形態と同様の符号を付与し、その説明を省略する。
[Fourth embodiment]
Next, a fourth embodiment will be described. In the fourth embodiment, character string processing is performed on character string data generated by translating a foreign language into Japanese. In the following description of the present embodiment, differences from the first embodiment will be described, and components having the same functional configuration as those of the first embodiment will be denoted by the same reference numerals as those of the first embodiment. The description is omitted.
まず、第四の実施形態の文字処理システム1のシステム構成について、図17を参照しながら説明する。図17は、第四の実施形態の文字処理システムの一例のシステム構成を示す図である。
First, the system configuration of the
図17に示す文字処理システム1は、クライアント端末20と、翻訳サーバ40とを有し、ネットワークNを介して通信可能に接続されている。
A
翻訳サーバ40は、クライアント端末20から所定の言語で表された文字列を受信して、当該文字列を他の言語に翻訳する情報処理装置である。また、翻訳サーバ40は、翻訳された文字列について、文節の区切りや意味の区切り等に応じて、文字間の間隔を空ける処理を行う。翻訳サーバ40のハードウェア構成は、例えば、図3に示すコンピュータ300により実現される。
The
なお、本実施形態では、一例として、英語で表された文字列を、日本語で表された文字列に翻訳する場合について説明する。ただし、翻訳対象の言語は英語に限られず、また、翻訳後の言語も日本語に限られない。すなわち、本実施形態は、所定の言語で表された文字列を、他の所定の言語で表された文字列に翻訳する場合にも適用され得る。 In the present embodiment, as an example, a case will be described in which a character string expressed in English is translated into a character string expressed in Japanese. However, the language to be translated is not limited to English, and the translated language is not limited to Japanese. That is, this embodiment can also be applied to a case where a character string expressed in a predetermined language is translated into a character string expressed in another predetermined language.
次に、第三の実施形態の文字処理システム1の機能構成について、図18を参照しながら説明する。図18は、第四の実施形態の文字処理システムの一例の機能構成を示す図である。
Next, the functional configuration of the
図18に示すように、クライアント端末20は、翻訳要求部202を有する。翻訳要求部202は、クライアント端末20にインストールされた1以上のプログラムが、CPU306に実行させる処理により実現される。
As illustrated in FIG. 18, the
翻訳要求部202は、英語で表された文字列(翻訳対象の文字列)を翻訳サーバ40に送信して、日本語への翻訳を要求する。
The
図18に示すように、翻訳サーバ40は、翻訳部401、文字列データ入力部101C、及び出力部104Cを有する。これら各部は、翻訳サーバ40にインストールされた1以上のプログラムが、CPU306に実行させる処理により実現される。
As illustrated in FIG. 18, the
翻訳部401は、クライアント端末20から送信された翻訳対象の文字列を、日本語で表された文字列に翻訳して、当該翻訳後の文字列を示す文字列データを生成する。
The
文字列データ入力部101Cは、翻訳部401により翻訳された文字列を示す文字列データを入力する。
The character string data input unit 101C inputs character string data indicating the character string translated by the
出力部104Cは、出力テーブル107に格納された出力データにより示される文字列を、クライアント端末20に返信して、当該クライアント端末20に表示させる。これにより、クライアント端末20には、意味の区切り等に応じて空白が挿入された翻訳後の文字列が表示される。
The
次に、第四の実施形態の文字処理システム1の処理の詳細について、図19を参照しながら説明する。図19は、第四の実施形態の文字列処理の一例のフローチャートである。
Next, details of processing of the
ユーザは、クライアント端末20を操作して、例えば図20(a)に示す言語の翻訳画面2000において、翻訳対象の文字列F14を入力したものとする。このとき、ユーザがクライアント端末20を操作して翻訳ボタン2001を押下すると、翻訳要求部202は、文字列F14を示す翻訳対象の文字列データを翻訳サーバ40に送信する。本実施形態では、クライアント端末20の翻訳要求部202により、文字列F14を示す翻訳対象の文字列データが翻訳サーバ40に送信されたものとする。
It is assumed that the user operates the
翻訳サーバ40の翻訳部401は、クライアント端末20から送信された翻訳対象の文字列データを受信すると、当該翻訳対象の文字列を示す文字列データを入力する(ステップS1901)。
Upon receiving the character string data to be translated transmitted from the
次に、翻訳サーバ40の翻訳部401は、入力された翻訳対象の文字列を日本語に翻訳して、翻訳後の文字列を示す文字列データを生成する(ステップS1902)。
Next, the
次に、翻訳サーバ40の文字列データ入力部101Cは、翻訳部401により翻訳された文字列を示す文字列データを入力する(ステップS1903)。
Next, the character string data input unit 101C of the
翻訳サーバ40の出力部104Cは、出力テーブル107に格納された出力データにより示される文字列を、クライアント端末20に返信して、当該クライアント端末20に、例えば図20(b)に示す翻訳結果画面2100を表示させる(ステップS1904)。
The
図20(b)に示す翻訳結果画面2100には、言語の翻訳画面2000において指定された翻訳対象の文字列F14が翻訳された文字列F15であって、かつ、意味の区切りとなる位置に空白6及び空白7が挿入された文字列F15が表示されている。
The
これにより、本実施形態の文字処理システム1では、所定の言語で表された文字列を他の言語に翻訳した場合に、翻訳後の文字列をユーザが読み易いように文字間の間隔を適切に広げて表示させることができるようになる。
Thereby, in the
[第五の実施形態]
次に、第五の実施形態について説明する。第五の実施形態では、複数の端末間で画面を共有して面談等を行う遠隔面談において文字列処理を行うものである。以降では、遠隔面談の一例として、企業等の団体における従業員の健康管理等のために、産業医と従業員の間で遠隔面談を行う場合について説明する。なお、以下の本実施形態の説明では、第一の実施形態及び第三の実施形態との相違点について説明し、第一の実施形態及び第三の実施形態と同様の機能構成を有するものには、第一の実施形態及び第三の実施形態と同様の符号を付与し、その説明を省略する。
[Fifth embodiment]
Next, a fifth embodiment will be described. In the fifth embodiment, character string processing is performed in a remote interview in which a screen is shared between a plurality of terminals and an interview or the like is performed. Hereinafter, as an example of a remote interview, a case will be described in which a remote interview is performed between an industrial physician and an employee for the health management of the employee in a group such as a company. In the following description of the present embodiment, differences from the first embodiment and the third embodiment will be described, and the same functional configuration as the first embodiment and the third embodiment will be described. Are given the same reference numerals as in the first embodiment and the third embodiment, and the description thereof is omitted.
まず、第五の実施形態の文字処理システム1のシステム構成について、図21を参照しながら説明する。図21は、第五の実施形態の文字処理システムの一例のシステム構成を示す図である。
First, the system configuration of the
図21に示す文字処理システム1は、端末装置50と、端末装置60とを有し、ネットワークNを介して通信可能に接続されている。
A
端末装置50は、従業員の健康を管理する産業医が利用するデスクトップ型PC、ノート型PC、携帯電話、スマートフォン、及びタブレット端末等の各種の電子機器である。一方、端末装置60は、産業医と遠隔面談を行うために従業員が利用するデスクトップ型PC、ノート型PC、携帯電話、スマートフォン、及びタブレット端末等の各種の電子機器である。端末装置50及び端末装置60のハードウェア構成は、例えば、図3に示すコンピュータ300により実現される。
The
本実施形態の文字処理システム1では、端末装置50と端末装置60の間で、例えば健康診断の結果画面等を共有して表示させることで、遠隔面談が行われる。このとき、本実施形態の文字処理システム1では、端末装置50において、産業医が、従業員に対して健康上の指示等を入力した際に、当該入力された文字列に文字列処理を行って、読み易くして表示させるものである。
In the
次に、第五の実施形態の文字処理システム1の機能構成について、図22を参照しながら説明する。図22は、第五の実施形態の文字処理システムの一例の機能構成を示す図である。
Next, the functional configuration of the
図22に示すように、従業員が利用する端末装置60は、共有制御部502を有する。共有制御部502は、端末装置60にインストールされた1以上のプログラムが、CPU306に実行させる処理により実現される。
As illustrated in FIG. 22, the
共有制御部502は、端末装置50から送信された画面情報に基づく画面を、端末装置60の表示装置302に表示させる制御を行う。
The sharing
図22に示すように、産業医が利用する端末装置50は、共有制御部501、文字列データ入力部101D、及び出力部104Dを有する。これら各部は、端末装置50にインストールされた1以上のプログラムが、CPU306に実行させる処理により実現される。
As illustrated in FIG. 22, the
共有制御部501は、産業医の端末装置50の表示装置302に表示されている画面(又は画面の一部の表示領域)の画面情報を、従業員が利用する端末装置50に送信する。これにより、産業医の端末装置50と、従業員の端末装置60との間で画面共有が行われる。すなわち、本実施形態の文字処理システム1では、産業医の端末装置50の画面(又は画面の一部の表示領域)を、従業員の端末装置50と共有するものである。
The sharing
文字列データ入力部101Dは、ユーザの操作に応じて、共有されている画面における所定の表示領域に表示される文字列を示す文字列データを入力する。
The character string
出力部104Dは、出力テーブル107に格納された出力データにより示される文字列を、共有されている画面における所定の表示領域に表示させる。
The
次に、第五の実施形態の文字処理システム1の処理の詳細について、図23を参照しながら説明する。図23は、第五の実施形態の空白挿入の一例を示す図である。
Next, details of the processing of the
産業医であるユーザは、端末装置50を用いて、従業員の端末装置60と、例えば図24(a)に示す健康診断結果画面3000を共有しているものとする。図24(a)に示す健康診断結果画面3000は、従業員の過去の健康診断結果が表示されている結果表示欄3001と、産業医からの健康上の指示内容が表示される指示表示欄3002とが含まれている。
It is assumed that the user who is an industrial physician shares the health
指示表示欄3002には、健康診断結果欄3001や面談結果等に基づいて、面談中に、産業医が端末装置50の入力装置301を用いて入力することができる。
In the
ここで、図24(a)に示すように、産業医であるユーザは、指示表示欄3002に、文字列F16を入力し、空白挿入ボタン3003を押下したものとする。すると、端末装置50の共有制御部501は、文字列F16の文字列データを文字列データ入力部101Dに渡す。
Here, as shown in FIG. 24A, it is assumed that the user who is an industrial physician inputs the character string F16 in the
そして、文字列データ入力部101Dは、文字列F16により示される文字列データを入力する(ステップS2301)。すなわち、文字列データ入力部101Dは、健康診断結果画面3000において、指示表示欄3002に表示されている文字列F16を示す文字列データを入力する。
Then, the character string
端末装置50の出力部104Dは、出力テーブル107に格納された出力データにより示される文字列F17を表示させる(ステップS2302)。すなわち、出力部104Dは、図24(b)に示す健康診断結果画面3100における指示表示欄3101に文字列F17を表示させる。文字列F17は、文字列F16の意味の区切りとなる位置に空白71〜空白74が挿入された文字列である。
The
なお、図24(b)に示す健康診断結果画面3100において、産業医であるユーザが空白削除ボタン3102を押下することにより、文字列F17に含まれる空白71〜空白74が削除されて、文字列F16が表示されるようにしても良い。
In the health
以上のように、本実施形態では、例えば、産業医の端末装置50と、従業員の端末装置60との間で画面共有を行って遠隔面談を行うような場合に、共有画面に表示されている文字列を読み易い文字列で表示させることができる。しかも、このとき、産業医の端末装置50における操作(例えば、空白挿入ボタンの押下)に応じて、文字列を読み易くすることができる。
As described above, in the present embodiment, for example, when a screen is shared between the industrial physician's
なお、本実施形態の文字処理システム1では、健康診断結果を画面共有で表示させる場合について説明したが、これに限られない。例えば、産業医の端末装置50は、当該端末装置50のローカルに格納された各種ファイルの内容やWebページの内容を画面共有で表示させ、当該表示された文字列に空白を挿入して読み易くしても良い。
In addition, in the
以上、本発明の実施形態について詳述したが、本発明は斯かる特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。 Although the embodiments of the present invention have been described in detail above, the present invention is not limited to such specific embodiments, and various modifications are possible within the scope of the gist of the present invention described in the claims.・ Change is possible.
1 文字処理システム
10 メールサーバ
20 クライアント端末
101 文字列データ入力部
102 形態素解析部
103 空白処理部
104 出力部
105 辞書DB
106 解析結果テーブル
107 出力テーブル
111 形態素入力部
112 形態素出力部
113 形態素判定部
114 空白挿入部
201 メール処理部
1
106 analysis result table 107 output table 111
Claims (4)
前記生成手段により生成された形態素データの品詞が助詞又は助動詞であるか否かを判定する第1の判定手段と、
前記第1の判定手段により前記形態素データの品詞が助詞又は助動詞であると判定された場合、前記文字列において、前記形態素データの形態素の次に句点又は読点が出現するか否かを判定する第2の判定手段と、
前記第2の判定手段により前記形態素データの形態素の次に句点又は読点が出現しないと判定された場合、前記文字列において、前記形態素の次に、所定のサイズの空白を示す文字を挿入する挿入手段と
を有する情報処理装置。 A character string indicated by the entered character string data is divided into a plurality of morphemes, in association with part of speech the morpheme is classified, and generating means for generating a plurality of morphemes data,
First determination means for determining whether the part of speech of the morpheme data generated by the generation means is a particle or an auxiliary verb ;
When it is determined by the first determination means that the part of speech of the morpheme data is a particle or an auxiliary verb, it is determined whether or not a punctuation mark or a punctuation mark appears next to the morpheme of the morpheme data in the character string. Two determination means;
Insertion that inserts a character indicating a predetermined size of space after the morpheme in the character string when it is determined by the second determination means that no punctuation or punctuation mark appears after the morpheme of the morpheme data An information processing apparatus having means.
前記生成手段は、
前記変換手段により変換された文字列データにより示される文字列を、複数の形態素に分割して、該形態素が分類される品詞と対応付けて、複数の形態素データを生成する、請求項1に記載の情報処理装置。 Having conversion means for converting the input voice data into character string data;
The generating means includes
The string indicated by the character string data converted by said converting means, is divided into a plurality of morphemes, in association with part of speech the morpheme is classified and generates a plurality of morphemes data, according to claim 1 Information processing device .
前記生成手段は、
前記翻訳手段により翻訳された第2の文字列データにより表される文字列を、複数の形態素に分割して、該形態素が分類される品詞と対応付けて、複数の形態素データを生成する、請求項1又は2に記載の情報処理装置。 Translation means for translating the input first character string data representing the first language into second character string data representing the second language;
The generating means includes
The character string represented by the second character string data translated by the translating means is divided into a plurality of morphemes, and a plurality of morpheme data is generated by associating the character strings with the parts of speech into which the morphemes are classified. Item 3. The information processing apparatus according to item 1 or 2 .
前記挿入手段は、
前記文字列において、前記形態素の次に、前記設定手段により設定されたサイズの空白を示す文字を挿入する、請求項1ないし3のいずれか1項に記載の情報処理装置。 Setting means for setting a size of characters indicating the white space;
The insertion means includes
The information processing apparatus according to any one of claims 1 to 3 , wherein a character indicating a blank having a size set by the setting unit is inserted into the character string after the morpheme.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015141907A JP6613671B2 (en) | 2015-07-16 | 2015-07-16 | Information processing device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015141907A JP6613671B2 (en) | 2015-07-16 | 2015-07-16 | Information processing device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017027125A JP2017027125A (en) | 2017-02-02 |
JP6613671B2 true JP6613671B2 (en) | 2019-12-04 |
Family
ID=57945962
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015141907A Expired - Fee Related JP6613671B2 (en) | 2015-07-16 | 2015-07-16 | Information processing device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6613671B2 (en) |
-
2015
- 2015-07-16 JP JP2015141907A patent/JP6613671B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2017027125A (en) | 2017-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6544131B2 (en) | INFORMATION PROCESSING APPARATUS AND INFORMATION PROCESSING PROGRAM | |
US20180004730A1 (en) | Corpus generation device and method, human-machine interaction system | |
CN103377028A (en) | Methods and systems for speech-enabling a human-to-machine interface | |
JP2016529603A (en) | Online speech translation method and apparatus | |
JPWO2018055983A1 (en) | Translation apparatus, translation system, and evaluation server | |
WO2016203805A1 (en) | Information processing device, information processing system, information processing method, and program | |
JP5121763B2 (en) | Emotion estimation apparatus and method | |
US10540445B2 (en) | Intelligent integration of graphical elements into context for screen reader applications | |
US11403470B2 (en) | Translation device | |
US11868718B2 (en) | Technology name/service name generation device and method therefor | |
JP6179971B2 (en) | Information providing apparatus and information providing method | |
CN111414453A (en) | Structured text generation method and device, electronic equipment and computer readable storage medium | |
JP2021022211A (en) | Inquiry response support device, inquiry response support method, program and recording medium | |
KR101541170B1 (en) | Apparatus and method for summarizing text | |
CN111581462A (en) | Method for inputting information by voice and terminal equipment | |
RU2595531C2 (en) | Method and system for generating definition of word based on multiple sources | |
CN111555960A (en) | Method for generating information | |
JP2015036886A (en) | Information processing device, storage medium, and method | |
JP6613671B2 (en) | Information processing device | |
JP7027757B2 (en) | Information processing equipment and information processing programs | |
JP5722375B2 (en) | End-of-sentence expression conversion apparatus, method, and program | |
JP5103718B2 (en) | Automatic translation system and method and program thereof | |
KR102072708B1 (en) | A method and computer program for inferring genre of a text contents | |
JP7179512B2 (en) | Information processing method, information processing device, and program | |
US11165737B2 (en) | Information processing apparatus for conversion between abbreviated name and formal name |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180612 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190315 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190409 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190531 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191008 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191021 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6613671 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
LAPS | Cancellation because of no payment of annual fees |