JP6699825B2 - Diagnostic device, diagnostic device control method, and diagnostic program - Google Patents

Diagnostic device, diagnostic device control method, and diagnostic program Download PDF

Info

Publication number
JP6699825B2
JP6699825B2 JP2016036988A JP2016036988A JP6699825B2 JP 6699825 B2 JP6699825 B2 JP 6699825B2 JP 2016036988 A JP2016036988 A JP 2016036988A JP 2016036988 A JP2016036988 A JP 2016036988A JP 6699825 B2 JP6699825 B2 JP 6699825B2
Authority
JP
Japan
Prior art keywords
person
diagnostic device
unit
text data
compression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016036988A
Other languages
Japanese (ja)
Other versions
JP2017156402A (en
Inventor
英治 荒牧
英治 荒牧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nara Institute of Science and Technology NUC
Original Assignee
Nara Institute of Science and Technology NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nara Institute of Science and Technology NUC filed Critical Nara Institute of Science and Technology NUC
Priority to JP2016036988A priority Critical patent/JP6699825B2/en
Publication of JP2017156402A publication Critical patent/JP2017156402A/en
Application granted granted Critical
Publication of JP6699825B2 publication Critical patent/JP6699825B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Medical Treatment And Welfare Office Work (AREA)

Description

本発明は、言語に症状が現れる疾患を診断する診断装置等に関するものである。   The present invention relates to a diagnostic device and the like for diagnosing a disease in which symptoms appear in language.

認知症患者は、症状が進行するにつれて、使用できる単語数が減少傾向へ向かうので、認知症は言語能力と相関があることが知られている。ここで、言語能力の測定は、肉体的侵襲がないため、認知症を早期に発見する手法として注目されている。   It is known that dementia correlates with verbal ability because the number of words that can be used tends to decrease in patients with dementia as the symptoms progress. Here, the measurement of language ability has attracted attention as a method for early detection of dementia because it has no physical invasion.

また、早期に認知症を発見する手法として、長谷川式簡易知能評価スケール(HDS−R)や、Me−CDTが知られており、これらの手法を用いて認知症の疑いのある高齢者と健常高齢者との発話の傾向及び特徴を抽出する研究も報告されている(非特許文献1)。   Further, as a method for early detection of dementia, the Hasegawa-type simplified intelligence evaluation scale (HDS-R) and Me-CDT are known, and using these methods, elderly people suspected of dementia and normal A study that extracts the tendency and characteristics of speech with the elderly has also been reported (Non-Patent Document 1).

四方朱子、宮部真衣、野田泰葉、木下彩栄、荒牧英治、「軽度認知症者の音声テキストの質的検討:認知症の無侵襲迅速スクリーニングの為に」、情報処理学会研究報告 Vol.2015−UBI−47No.4 Vol.2015−ASD−2No.4、2015年7月27日Akiko Shikata, Mai Miyabe, Yasuha Noda, Aya Kinoshita, Eiji Aramaki, "A Qualitative Study of Speech Text for People with Mild Dementia: For Rapid Non-Invasive Screening of Dementia," Research Report of Information Processing Society of Japan, Vol. 2015-UBI-47 No. 4 Vol. 2015-ASD-2 No. 4, July 27, 2015

一般に言語能力は、構文能力と語彙能力との2つに大別されるが、認知症に対しては語彙能力が有用であることが知られている。語彙能力の測定手法としては、理解できる或いは使用できる語彙量を測定する手法や、認証心理学で用いられる命題数を測定する手法などが知られている。   Generally speaking, linguistic ability is roughly divided into syntactic ability and vocabulary ability, but it is known that vocabulary ability is useful for dementia. As a method of measuring vocabulary ability, a method of measuring the amount of vocabulary that can be understood or used and a method of measuring the number of propositions used in authentication psychology are known.

しかし、語彙量を測定する手法では、言語に応じて単語の単位が異なるので、単語の単位に曖昧さがあるという課題があると共に、言語に応じてアルゴリズムを変更する必要があるという課題がある。   However, in the method of measuring vocabulary, since the unit of the word differs depending on the language, there is a problem that there is ambiguity in the unit of the word, and there is a problem that the algorithm needs to be changed according to the language. ..

また、命題数を測定する手法では、専門家による人手の作業が必要となるという問題がある。なお、品詞をカウントすることで、命題数を自動解析するCPIDRと呼ばれる手法が提案されているものの、この手法は英語に対する手法であり、そのまま別の言語に適用させることは困難である。   Further, the method of measuring the number of propositions has a problem that manual work by an expert is required. Although a method called CPIDR that automatically analyzes the number of propositions by counting part-of-speech has been proposed, this method is for English, and it is difficult to apply it to another language as it is.

また、上記の非特許文献1では、公知の評価手法を利用して認知症患者と健常者との発話の特徴が抽出されているに留まり、認知症の新たな判定手法についての開示はない。   Further, in Non-Patent Document 1 described above, only a feature of speech between a dementia patient and a healthy person is extracted using a known evaluation method, and there is no disclosure about a new method for determining dementia.

本発明の目的は、言語に依存することなく簡易且つ正確に人物が言語に症状が現れる疾患の疑いを持つか否かを判定できる技術を提供することである。   An object of the present invention is to provide a technique capable of easily and accurately determining whether or not a person has a suspicion of a disease in which a symptom appears in a language without depending on the language.

本発明の一態様に係る診断装置は、言語に症状が現れる疾患を診断する診断装置であって、
前記人物の発話内容又は前記人物が書き起こした文書を示すテキストデータを取得する取得部と、
前記取得部により取得されたテキストデータを、同じ単語の繰り返し回数が多いほど圧縮率が高くなるデータ圧縮方式によって可逆圧縮する圧縮部と、
前記圧縮部により可逆圧縮されたテキストデータの圧縮率を算出する圧縮率算出部と、
前記圧縮率算出部により算出された圧縮率に基づいて、前記人物が前記疾患の疑いを持つか否かを判定する判定部とを備える。
A diagnostic device according to one aspect of the present invention is a diagnostic device for diagnosing a disease in which symptoms appear in language,
An acquisition unit that acquires text data indicating the utterance content of the person or the document transcribed by the person,
A compression unit that reversibly compresses the text data acquired by the acquisition unit by a data compression method in which the compression rate increases as the number of repetitions of the same word increases ;
A compression rate calculation section for calculating the compression rate of the text data losslessly compressed by the compression section;
And a determination unit that determines whether or not the person has a suspicion of the disease based on the compression ratio calculated by the compression ratio calculation unit.

認知症等の言語に症状が表れる疾患の疑いを持つ患者の発話内容を解析すると、同じ単語や同じフレーズを繰り返す傾向にあり、冗長性が高いことが知られている。可逆圧縮のアルゴリズムでは、冗長なフレーズを抽出し、そのフレーズに短い符号を割り付けることで元のデータが圧縮されるので、元のデータに冗長なフレーズが多く含まれるほど圧縮率が高くなる。そのため、言語に症状が現れる疾患の疑い持つ人物と疑いを持たない人物との発話内容を示すテキストデータを可逆圧縮したときの圧縮率を比較すると、言語に症状が現れる疾患の疑い持つ人物の方が疑いを持たない人物よりも高くなることを本発明者は見出した。   It is known that when analyzing the utterance content of a patient who has a suspicion of a disease in which symptoms such as dementia appear in the language, the same word or the same phrase tends to be repeated and redundancy is high. In the lossless compression algorithm, since the original data is compressed by extracting a redundant phrase and assigning a short code to the phrase, the compression rate becomes higher as the original data contains more redundant phrases. Therefore, comparing the compression ratios when lossless compression was performed on text data indicating the utterance contents of a person suspected of having a symptom in language and a person not having a suspicion, the person having a suspicion of a disease having symptom in language was compared. The present inventor has found that is higher than that of a person who has no doubt.

本態様では、人物の発話内容を示すテキストデータを可逆圧縮したときの圧縮率に基づいて、人物が言語に症状が現れる疾患の疑いを持つか否かが判定されている。そのため、言語に依存することなく、共通のアルゴリズムで人物が言語に症状が現れる疾患の疑いを持つか否かを判定できる。その結果、簡易且つ正確に言語に症状が現れる疾患を判定できる。   In this aspect, it is determined whether or not the person has a suspicion of a disease in which a symptom appears in the language, based on the compression rate when the text data indicating the utterance content of the person is losslessly compressed. Therefore, it is possible to determine whether or not a person has a suspicion of a disease in which a symptom appears in a language by a common algorithm without depending on the language. As a result, it is possible to easily and accurately determine a disease in which symptoms appear in language.

また、上記態様において、
前記人物が発話した音声を収音する収音部と、
前記収音された音声を音声認識することで、前記収音した音声を前記テキストデータに変換し、前記取得部に出力する音声認識部とを更に備えていてもよい。
In the above aspect,
A sound pickup unit that picks up the voice uttered by the person,
A voice recognition unit that converts the collected voice into the text data and outputs the voice data to the acquisition unit by recognizing the collected voice by voice may be further provided.

本態様によれば、人物が発話した音声を音声認識することでテキストデータが取得されているので、人物に過度な負担を強いることなくテキストデータを取得できる。   According to this aspect, since the text data is acquired by recognizing the voice uttered by the person, the text data can be acquired without imposing an excessive burden on the person.

また、上記態様において、
前記取得部は、前記人物の発話内容が記載された文書又は前記人物が書き起こした文書をテキスト認識することで前記テキストデータを取得してもよい。
In the above aspect,
The acquisition unit may acquire the text data by text-recognizing a document in which the utterance content of the person is described or a document transcribed by the person.

本態様によれば、人物の発話内容が記載された文書又は人物が書き起こした文書をテキスト認識することでテキストデータが取得されているので、簡易な処理でテキストデータを取得できる。   According to this aspect, since the text data is acquired by recognizing the text in which the utterance content of the person is described or the document transcribed by the person, the text data can be acquired by a simple process.

また、上記態様において、前記判定部は、前記圧縮率が所定の閾値より高い場合、前記人物は前記疾患の疑いがあると判定してもよい。   Further, in the above aspect, the determination unit may determine that the person has a suspicion of the disease when the compression rate is higher than a predetermined threshold value.

本態様によれば、圧縮率が所定の閾値より高ければ、人物は前記疾患の疑いを持つと判定されるので、簡便なアルゴリズムで言語に症状が現れる疾患を判定できる。   According to this aspect, if the compression rate is higher than the predetermined threshold value, it is determined that the person has the suspicion of the disease, and thus the disease in which the symptom appears in the language can be determined by a simple algorithm.

また、上記態様において、前記判定部は、前記圧縮率が高くなるにつれて前記疾患の度合いが高いと判定してもよい。   Further, in the above aspect, the determination unit may determine that the degree of the disease is higher as the compression rate is higher.

本態様によれば、前記疾患の有無のみならず、人物がどの程度、前記疾患の疑いを持つかを提示できる。   According to this aspect, it is possible to present not only the presence or absence of the disease but also to what extent the person has the suspicion of the disease.

また、上記態様において、前記疾患は、認知症、脳疾患、及び精神障害を含んでいてもよい。   Further, in the above aspect, the disease may include dementia, brain disease, and mental disorder.

本態様によれば、言語能力との相関が高い、認知症、脳疾患、及び精神障害を正確に判定できる。   According to this aspect, it is possible to accurately determine dementia, brain diseases, and mental disorders that have a high correlation with language ability.

本発明によれば、言語に依存することなく簡易且つ正確に人物が、言語に症状が現れる疾患の疑いを持つか否かを判定できる。   According to the present invention, it is possible to easily and accurately determine whether or not a person has a suspicion of a disease in which a symptom appears in language without depending on language.

本発明の実施の形態1に係る診断装置1の全体構成を示すブロック図である。It is a block diagram which shows the whole structure of the diagnostic device 1 which concerns on Embodiment 1 of this invention. 圧縮部による圧縮処理の一例を示す図である。It is a figure which shows an example of the compression process by a compression part. 本発明の実施の形態1に係る診断装置の処理の一例を示すフローチャートである。5 is a flowchart showing an example of processing of the diagnostic device according to the first embodiment of the present invention. 本実施の形態の実験で用いた言語指標を纏めた表である。6 is a table summarizing language indexes used in the experiment of the present embodiment. 本実施の形態における実験結果を纏めた表である。6 is a table summarizing the experimental results in the present embodiment. 本発明の実施の形態2に係る診断装置の全体構成を示すブロック図である。It is a block diagram which shows the whole structure of the diagnostic device which concerns on Embodiment 2 of this invention. 本発明の実施の形態2に係る診断装置の処理の一例を示すフローチャートである。9 is a flowchart showing an example of processing of the diagnostic device according to the second embodiment of the present invention. 本発明の実施の形態3に係る診断装置の全体構成を示す図である。It is a figure which shows the whole structure of the diagnostic device which concerns on Embodiment 3 of this invention. 本発明の実施の形態3に係る診断装置の処理の一例を示すフローチャートである。It is a flowchart which shows an example of a process of the diagnostic device which concerns on Embodiment 3 of this invention. 本発明の実施の形態4に係る診断装置の全体構成を示すブロック図である。It is a block diagram which shows the whole structure of the diagnostic device which concerns on Embodiment 4 of this invention. 本発明の実施の形態4に係る診断装置の処理の一例を示すフローチャートである。It is a flow chart which shows an example of processing of a diagnostic device concerning Embodiment 4 of the present invention.

(実施の形態1)
図1は、本発明の実施の形態1に係る診断装置1の全体構成を示すブロック図である。診断装置1は、言語に症状が現れる疾患の疑いを診断する装置である。以下の実施の形態1〜4では、言語に症状が現れる疾患として認知症を例に挙げて説明するが、これに限定されない。例えば、失語症や発達障害(アスペルガー症候群、学習障害、及び多動性障害等)に対しても、本発明は適用可能である。すなわち、本実施の形態において、言語に症状が現れる疾患とは、何らかの要因によって言語に支障をきたす疾患が該当し、認知症の他、言語に症状が現れる脳疾患や精神障害(例えば、鬱病)が含まれる。
(Embodiment 1)
1 is a block diagram showing the overall configuration of a diagnostic device 1 according to Embodiment 1 of the present invention. The diagnosis device 1 is a device for diagnosing a suspicion of a disease in which symptoms appear in language. In the following first to fourth embodiments, dementia will be described as an example of a disease in which a symptom appears in language, but the present invention is not limited to this. For example, the present invention is applicable to aphasia and developmental disorders (Asperger syndrome, learning disorder, hyperactivity disorder, etc.). That is, in the present embodiment, the disease in which language is manifested corresponds to a disease in which language is impaired due to some factor, and in addition to dementia, brain disease or mental disorder (eg, depression) in which language is manifested. Is included.

ここでは、認知症には、アルツハイマー型認知症、脳血管型認知症、レビー小体型認知症、及び前頭側頭型認知症等が含まれる。また、本実施の形態においては、認知症には、MCI(Mild Cognitive Impairment:軽度認知障害)も含まれる。   Here, the dementia includes Alzheimer's dementia, cerebrovascular dementia, Lewy body dementia, frontotemporal dementia and the like. Further, in the present embodiment, the dementia also includes MCI (Mild Cognitive Impairment).

図1において、診断装置1は、携帯端末100、音声認識サーバ200、及び診断サーバ300を備える。携帯端末100は、例えば、スマートフォン、タブレット端末といった、タッチパネル102を備える携帯可能な情報処理装置で構成されている。但し、これは一例であり、携帯端末100としては、タッチパネル102を備えていない携帯電話が採用されてもよい。   In FIG. 1, the diagnostic device 1 includes a mobile terminal 100, a voice recognition server 200, and a diagnostic server 300. The mobile terminal 100 is composed of a portable information processing device including a touch panel 102, such as a smartphone or a tablet terminal. However, this is an example, and a mobile phone that does not include the touch panel 102 may be adopted as the mobile terminal 100.

音声認識サーバ200及び診断サーバ300は、それぞれ、通信機能を備えるコンピュータで構成されている。携帯端末100、音声認識サーバ200、及び診断サーバ300はネットワークNTを介して相互に通信可能に接続されている。ネットワークNTとしては、携帯電話通信網及びインターネット通信網を含む公衆通信網が採用できる。携帯端末100、音声認識サーバ200、及び診断サーバ300は、TCP/IP等の通信プロトコルを用いて種々のデータを送受する。   The voice recognition server 200 and the diagnosis server 300 are each configured by a computer having a communication function. The mobile terminal 100, the voice recognition server 200, and the diagnosis server 300 are communicably connected to each other via the network NT. As the network NT, a public communication network including a mobile phone communication network and an internet communication network can be adopted. The mobile terminal 100, the voice recognition server 200, and the diagnostic server 300 send and receive various data using a communication protocol such as TCP/IP.

携帯端末100は、認知症の診断対象となる人物の音声を収音すると共に、診断結果を人物に提示する装置であり、収音部101、タッチパネル102、制御部103、及び通信部104を備える。   The mobile terminal 100 is a device that collects a voice of a person who is a diagnosis target of dementia and presents the diagnosis result to the person, and includes a sound collecting unit 101, a touch panel 102, a control unit 103, and a communication unit 104. .

収音部101は、例えば、人物の発話した音声を収音して音声信号に変換するマイクと、マイクによって変換された音声信号に対して所定の信号処理を行う信号処理回路等を含む。ここで、信号処理としては、音声信号に含まれるノイズを除去するといった前処理や、アナログの音声信号をデジタルの音声データに変換する処理等が含まれる。   The sound pickup unit 101 includes, for example, a microphone that picks up a voice uttered by a person and converts the voice into a voice signal, a signal processing circuit that performs predetermined signal processing on the voice signal converted by the microphone, and the like. Here, the signal processing includes preprocessing such as removing noise included in the audio signal, processing of converting an analog audio signal into digital audio data, and the like.

タッチパネル102は、制御部103の制御の下、診断サーバ300から送信された診断結果を表示したり、診断対象の人物に発話を促すメッセージを含む画面を表示したりする。   Under the control of the control unit 103, the touch panel 102 displays the diagnosis result transmitted from the diagnosis server 300 and displays a screen including a message prompting the person to be diagnosed to speak.

制御部103は、CPU、ROM、及びRAM等を備え、携帯端末100の全体制御を司る。本実施の形態では、制御部103は、収音部101から出力された音声データを通信部104を用いて音声認識サーバ200に送信する処理や、診断サーバ300から送信された診断結果をタッチパネル102に表示する処理を行う。   The control unit 103 includes a CPU, a ROM, a RAM, and the like, and controls the entire mobile terminal 100. In the present embodiment, the control unit 103 transmits the voice data output from the sound collection unit 101 to the voice recognition server 200 using the communication unit 104 and the diagnosis result transmitted from the diagnosis server 300 on the touch panel 102. Perform the processing to be displayed on.

通信部104は、携帯端末100をネットワークNTに接続するための通信装置で構成されている。本実施の形態では、通信部104は、制御部103の制御の下、音声認識サーバ200に音声データを送信すると共に、診断サーバ300から送信された診断結果を受信する。   The communication unit 104 is composed of a communication device for connecting the mobile terminal 100 to the network NT. In the present embodiment, the communication unit 104 transmits voice data to the voice recognition server 200 and receives the diagnosis result transmitted from the diagnosis server 300 under the control of the control unit 103.

音声認識サーバ200は、携帯端末100から送信された音声データをテキストデータに変換する処理を司り、音声認識部201及び通信部202を備える。音声認識部201は、携帯端末100から送信された音声データに対して音声認識処理を行い、テキストデータに変換する。ここで、音声認識処理としては、例えば、音の波形データを蓄積する音響モデルと、単語及びその並び方の情報を蓄積する言語モデルとを用いることで音声認識を行う公知の処理が採用されればよい。   The voice recognition server 200 manages a process of converting voice data transmitted from the mobile terminal 100 into text data, and includes a voice recognition unit 201 and a communication unit 202. The voice recognition unit 201 performs voice recognition processing on the voice data transmitted from the mobile terminal 100 and converts it into text data. Here, as the voice recognition process, for example, if a known process of performing voice recognition by using an acoustic model for accumulating sound waveform data and a language model for accumulating information on words and their arrangement is adopted. Good.

通信部202は、音声認識サーバ200をネットワークNTに接続する通信装置で構成され、携帯端末100から送信された音声データを受信すると共に、音声認識部201により変換されたテキストデータを診断サーバ300に送信する。   The communication unit 202 is configured by a communication device that connects the voice recognition server 200 to the network NT, receives voice data transmitted from the mobile terminal 100, and transmits the text data converted by the voice recognition unit 201 to the diagnostic server 300. Send.

診断サーバ300は、人物が認知症の疑いを持つか否かを診断する装置であり、圧縮部301、圧縮率算出部302、判定部303、及び通信部304を備える。   The diagnosis server 300 is a device that diagnoses whether a person has a suspicion of dementia, and includes a compression unit 301, a compression ratio calculation unit 302, a determination unit 303, and a communication unit 304.

圧縮部301は、音声認識サーバ200から送信されたテキストデータを可逆圧縮する。ここで、圧縮部301は、ZIP、LZH、TARGZ、CAB等の公知の可逆圧縮方式であればどのような圧縮方式を用いてもよい。   The compression unit 301 losslessly compresses the text data transmitted from the voice recognition server 200. Here, the compression unit 301 may use any compression method as long as it is a known lossless compression method such as ZIP, LZH, TRGZ, CAB.

図2は、圧縮部301による圧縮処理の一例を示す図である。一般に可逆圧縮では、辞書法と符号割当との2つの工程を経てデータが圧縮される。辞書法の工程では、処理対象となるテキストデータの冗長性を減らすために、テキストデータおいて繰り返し登場する語が符号化される。   FIG. 2 is a diagram showing an example of compression processing by the compression unit 301. Generally, in lossless compression, data is compressed through two steps of dictionary method and code assignment. In the dictionary method, words that appear repeatedly in the text data are encoded in order to reduce the redundancy of the text data to be processed.

図2に示すテキストデータTXは、認知症患者の発話した内容を書き起こしたものである。図2の例では、テキストデータTXにおいて、「あのー」、「バイクの」、「とか」といった繰り返し登場する単語に対して一意的に識別可能な符号が割り付けられている。これにより、テキストデータTXは、図2の中段に示すようなテキストデータTX1に変換される。   The text data TX shown in FIG. 2 is a transcription of the contents uttered by a dementia patient. In the example of FIG. 2, in the text data TX, a uniquely identifiable code is assigned to repeatedly appearing words such as “Ah,” “Bike,” and “Toka.” As a result, the text data TX is converted into the text data TX1 as shown in the middle part of FIG.

次に、テキストデータTX1に対して、符号割当の工程が施される。符号割当の工程では、例えば、ハフマン法が採用され、登場回数が多い単語ほど、短い符号が割り付けられる。これにより、最終的にテキストデータTX2が得られる。この例では、65文字の130バイトのテキストデータTXが最終的に43文字の86バイトのテキストデータTX2に圧縮されている。その結果、圧縮率は、86/130=66%となっている。   Next, a code allocation step is performed on the text data TX1. In the code assignment step, for example, the Huffman method is adopted, and a shorter code is assigned to a word having a higher appearance frequency. As a result, the text data TX2 is finally obtained. In this example, 65-character 130-byte text data TX is finally compressed into 43-character 86-byte text data TX2. As a result, the compression rate is 86/130=66%.

図2のテキストデータTXに示すように、認知症の疑いのある人物は、同じ単語を繰り返し使用する傾向が高いので、認知症の疑いのある人物の発話内容を示すテキストデータTXの圧縮率は、認知症の疑いのない人物の圧縮率に比べて高くなる。そのため、圧縮率から診断対象の人物が認知症の疑いを持つか否かを判断できる。   As shown in the text data TX of FIG. 2, since a person with a suspicion of dementia has a high tendency to repeatedly use the same word, the compression ratio of the text data TX indicating the utterance content of the person with a suspicion of dementia is , Higher than the compression rate for people without dementia. Therefore, it can be determined from the compression rate whether the person to be diagnosed has a suspicion of dementia.

この傾向は、辞書法及び符号割当を使用する可逆圧縮方式であれば、どのような圧縮方式においても表れるので、本実施の形態は辞書法及び符号割当からなる既存の可逆圧縮方式を適用できる。また、このような既存の可逆圧縮方式は、処理対象となるデータ内容を問わず、同じ単語の繰り返し回数が多いほど、高い圧縮率が得られる。したがって、本実施の形態は、発話者が使用する言語に応じてアルゴリズムを変更する必要もない。   This tendency appears in any compression method as long as it is a lossless compression method using the dictionary method and code assignment, and thus the present embodiment can apply the existing lossless compression method including the dictionary method and code assignment. In addition, in such an existing reversible compression method, a higher compression rate can be obtained as the number of repetitions of the same word increases, regardless of the data content to be processed. Therefore, in the present embodiment, it is not necessary to change the algorithm according to the language used by the speaker.

なお、本実施の形態で、可逆圧縮方式を採用しているのは、既存の非可逆圧縮方式は主に画像データといったテキストデータ以外のデータを対象としてアルゴリズムが構築されており、テキストデータの圧縮にはなじまないからである。   In the present embodiment, the lossless compression method is adopted because the existing lossy compression method has an algorithm constructed mainly for data other than text data such as image data. Because it does not fit in.

図1に参照を戻す。圧縮率算出部302は、圧縮部301により圧縮されたテキストデータの圧縮率を算出する。ここで、圧縮率算出部302は、圧縮前のテキストデータTXのデータ量に対する、圧縮後のテキストデータTX2のデータ量の割合を求めることで、圧縮率を算出すればよい。   Referring back to FIG. The compression rate calculation unit 302 calculates the compression rate of the text data compressed by the compression unit 301. Here, the compression rate calculation unit 302 may calculate the compression rate by obtaining the ratio of the data amount of the compressed text data TX2 to the data amount of the uncompressed text data TX.

判定部303は、圧縮率算出部302により算出された圧縮率が所定の閾値より大きければ、診断対象の人物は認知症の疑いがあると判定し、当該圧縮率が所定の閾値より大きくなければ、診断対象の人物は認知症の疑いがないと判定する。ここで、判定部303は、圧縮率が大きくなるにつれて、値が増大するように認知症の度合いを算出してもよい。例えば、判定部303は、圧縮率が閾値以下であれば、認知症の疑いがないことを示す認知症度「0」を、認知症の度合いとして算出すればよい。また、判定部303は、圧縮率が閾値よりも大きい場合は、圧縮率が増大するにつれて、認知症度「1」、認知症度「2」というように、認知症の度合いを段階的に算出してもよい。そして、判定部303は、判定結果を示すデータを診断結果として生成する。ここで、閾値としては、例えば、多数の人物に対して実験を施すことにより得られた値であって、これ以上値が増大すると認知症の疑いがあること判断できる値が採用されればよい。   If the compression rate calculated by the compression rate calculation section 302 is larger than the predetermined threshold value, the determination section 303 determines that the person to be diagnosed is suspected of having dementia, and if the compression rate is not higher than the predetermined threshold value. , It is determined that the person to be diagnosed has no suspicion of dementia. Here, the determination unit 303 may calculate the degree of dementia such that the value increases as the compression rate increases. For example, the determination unit 303 may calculate the dementia degree “0” indicating that there is no suspicion of dementia as the degree of dementia when the compression rate is equal to or less than the threshold value. Further, when the compression rate is larger than the threshold value, the determination unit 303 calculates the degree of dementia step by step, such as dementia degree “1” and dementia degree “2” as the compression rate increases. You may. Then, the determination unit 303 generates data indicating the determination result as the diagnosis result. Here, as the threshold value, for example, a value obtained by conducting an experiment on a large number of people, and a value that can be suspected of dementia when the value increases more than this may be adopted. ..

通信部304は、診断サーバ300をネットワークに接続するための通信装置で構成され、音声認識サーバ200から送信されたテキストデータを受信すると共に、判定部303により生成された診断結果を携帯端末100に送信する。これを受信した携帯端末100は、タッチパネル102に診断結果を表示する。   The communication unit 304 includes a communication device for connecting the diagnosis server 300 to the network, receives the text data transmitted from the voice recognition server 200, and transmits the diagnosis result generated by the determination unit 303 to the mobile terminal 100. Send. Upon receiving this, the mobile terminal 100 displays the diagnosis result on the touch panel 102.

なお、図1において圧縮部301〜判定部303は、例えば、CPUがプログラムを実行することで実現される。また、本実施の形態において、通信部304は、請求項の取得部に相当する。   Note that, in FIG. 1, the compression unit 301 to the determination unit 303 are realized by, for example, the CPU executing a program. Further, in the present embodiment, the communication unit 304 corresponds to the obtaining unit in the claims.

図3は、本発明の実施の形態1に係る診断装置1の処理の一例を示すフローチャートである。まず。携帯端末100は、診断対象となる人物(以下、「診断対象者」と記述する。)の音声を収音し、音声データを取得する(S101)。ここで、診断対象者は、例えば、携帯端末100のタッチパネル102に表示される、認知症の疑いを診断するための発話誘導メッセージにしたがって発話すればよい。或いは、診断対象者は、医師や看護師(以下、「医師等」と記述する。)との対話を通じて発話すればよい。   FIG. 3 is a flowchart showing an example of processing of the diagnostic device 1 according to the first embodiment of the present invention. First. The mobile terminal 100 picks up the voice of a person to be diagnosed (hereinafter referred to as “diagnosis subject”) and acquires voice data (S101). Here, the diagnosis target person may speak, for example, according to a speech guidance message for diagnosing the suspicion of dementia, which is displayed on the touch panel 102 of the mobile terminal 100. Alternatively, the person to be diagnosed may speak through a dialogue with a doctor or a nurse (hereinafter referred to as “doctor etc.”).

次に、携帯端末100は、診断対象者が発話した音声データを音声認識サーバ200に送信する(S102)。   Next, the mobile terminal 100 transmits the voice data uttered by the diagnosis target person to the voice recognition server 200 (S102).

次に、音声認識サーバ200は、音声データを受信する(S201)。次に、音声認識サーバ200は、受信した音声データを音声認識してテキストデータに変換する(S202)。次に、音声認識サーバ200は、変換したテキストデータを診断サーバ300に送信する(S203)。   Next, the voice recognition server 200 receives voice data (S201). Next, the voice recognition server 200 performs voice recognition on the received voice data and converts it into text data (S202). Next, the voice recognition server 200 transmits the converted text data to the diagnosis server 300 (S203).

次に、診断サーバ300は、音声認識サーバ200から送信されたテキストデータを受信する(S301)。次に、診断サーバ300は、受信したテキストデータを圧縮し(S302)、圧縮率を算出する(S303)。   Next, the diagnostic server 300 receives the text data transmitted from the voice recognition server 200 (S301). Next, the diagnostic server 300 compresses the received text data (S302) and calculates the compression rate (S303).

次に、診断サーバ300は、圧縮率が閾値Xより大きいか否かを判定し、大きければ(S304でYES)、診断対象者は、認知症の疑いがあると判定し(S305)、圧縮率が閾値Xよりも大きくなければ(S304でNO)、診断対象者は認知症の疑いがないと判定する(S306)。次に、診断サーバ300は、診断結果を携帯端末100に送信する(S307)。   Next, the diagnosis server 300 determines whether the compression rate is larger than the threshold value X, and if the compression rate is larger (YES in S304), the diagnosis target person determines that the dementia is suspected (S305), and the compression rate. If is not larger than the threshold value X (NO in S304), the diagnosis target person determines that there is no suspicion of dementia (S306). Next, the diagnostic server 300 transmits the diagnostic result to the mobile terminal 100 (S307).

次に、携帯端末100は、診断結果を受信し(S103)、受信した診断結果をタッチパネル102に表示する(S104)。これにより、診断対象者や医師等に認知症の診断結果が提示される。この場合、携帯端末100は、例えば、上述した認知症の度合いとその認知症の度合いの説明とを含むメッセージをタッチパネル102に表示すればよい。認知症の度合いの説明としては、例えば、認知症度が「0」であれば、「正常です。」といったメッセージが採用でき、認知症度が「1」であれば、「認知症の疑いがあります。」といったメッセージが採用でき、認知症度が「2」であれば、「認知症の疑いが高いです。」といったメッセージが採用できる。   Next, the mobile terminal 100 receives the diagnosis result (S103) and displays the received diagnosis result on the touch panel 102 (S104). As a result, the diagnosis result of dementia is presented to the person to be diagnosed, the doctor, and the like. In this case, the mobile terminal 100 may display a message including the degree of dementia and the description of the degree of dementia on the touch panel 102, for example. As an explanation of the degree of dementia, for example, if the degree of dementia is “0”, a message such as “normal” can be adopted, and if the degree of dementia is “1”, “the suspicion of dementia is suspected”. If there is a degree of dementia of "2", a message such as "I have a high suspicion of dementia" can be adopted.

次に、本実施の形態の効果を確認するために行った実験について説明する。従来より、認知症患者の言語能力を測定する指標として種々の言語指標が使用されてきた。そこで、本実験では、これらの既存の言語指標に対して、本実施の形態の言語指標、すなわち、圧縮率を用いる言語指標が、どのくらい認知症を正確に診断できるかについて比較した。この実験では、認知症の疑いがあること(AD;Alzheimer’s disease)が事前に分かっている被験者8名と、認知症の疑いがないこと(nonAD)が事前に分かっている被験者9名とに対して、実験を行った。また、この実験では、被験者に対して質問を行い、13分〜17分程度の発話をしてもらった。   Next, an experiment conducted to confirm the effect of this embodiment will be described. Conventionally, various language indexes have been used as indexes for measuring the language ability of dementia patients. Therefore, in this experiment, the existing language indexes were compared with respect to how accurately the language indexes of the present embodiment, that is, the language indexes using the compression rate, can accurately diagnose dementia. In this experiment, 8 subjects were known to have a suspicion of dementia (AD; Alzheimer's disease), and 9 subjects were known to have no suspicion of dementia (nonAD). , An experiment was conducted. In addition, in this experiment, the subject was asked a question and spoken for about 13 to 17 minutes.

図4は、本実施の形態の実験で用いた言語指標を纏めた表である。図4において、「TOKEN」〜「AWU」は言語指標として従来から用いられている指標であり、「TCR」は本実施の形態の言語指標である。   FIG. 4 is a table summarizing the language indexes used in the experiment of this embodiment. In FIG. 4, “TOKEN” to “AWU” are indexes conventionally used as language indexes, and “TCR” is a language index according to the present embodiment.

詳細には、「TOKEN」は被験者が発話した単語数を示す。「TYPE」は被験者の発話に含まれる単語の種類数を示す。「TTR」は、「TOKEN」に対する「TYPE」の割合を示す。「TTR」が低いほど同じ単語を繰り返す回数が多くなり、認知症の疑いが高くなる。   Specifically, “TOKEN” indicates the number of words spoken by the subject. “TYPE” indicates the number of types of words included in the utterance of the subject. “TTR” indicates the ratio of “TYPE” to “TOKEN”. The lower the “TTR”, the more the same word is repeated, and the higher the suspicion of dementia.

その他、詳細な説明は省くが、「TPS」(Token Per Second)は発話速度であり、「LEL」(Lexical Education Level)は語彙教育難易度であり、「ADD」(Average Dependency Distance)は平均化係り受け距離であり、「AWU」(Average Word User)は語彙平均使用者数である。   Other details are omitted, but "TPS" (Token Per Second) is a speech rate, "LEL" (Lexical Education Level) is a difficulty level of vocabulary education, and "ADD" (Average Dependency Distance) is an average. It is a dependency distance, and “AWU” (Average Word User) is the average number of vocabulary users.

「TCR」は、文章圧縮率(Text Compressibility Ratio)を示し、ここでは、使用する圧縮方式に応じて、ZIP、LZH等の添え字を付して表している。本実験では、圧縮方式として、ZIP、LZH、TARGZ、及びCABを採用したので、それぞれに対応するTCRをTCRZIP、TCRLZH、TCRTARGZ、及びTCRCABと表す。 “TCR” indicates a text compression ratio (Text Compressibility Ratio), and is represented here by subscripts such as ZIP and LZH according to the compression method used. In this experiment, since ZIP, LZH, TRGZ, and CAB were adopted as the compression method, the TCRs corresponding to them are represented as TCR ZIP , TCR LZH , TCR TRGZ , and TCR CAB .

図5は、本実施の形態における実験結果を纏めた表である。図5の表51において、左から1列目は、使用した言語指標を示し、2列目のADは認知症の疑いのある被験者を示し、3列目の「nonAD」は認知症の疑いのない健康な被験者を示す。   FIG. 5 is a table summarizing the experimental results in the present embodiment. In Table 51 of FIG. 5, the first column from the left shows the language index used, the second column AD represents a subject suspected of dementia, and the third column “nonAD” indicates suspected dementia. Not showing healthy subjects.

表51に示すように、「AD」の被験者は、「TIME」及び「TOKEN」とも「nonAD」の被験者の「13.27」及び「814」に比べ、「17.40」及び「1225」と大きい値が得られいる。また、「TTR」は「nonAD」の被験者の「0.313」に比べ、「0.249」と低く、「TOKEN」数の割りには「TYPE」数が少ないことが分かる。なお、表51において、括弧内の数値は分散を示している。   As shown in Table 51, the “AD” test subjects were “17.40” and “1225” as compared with the “13.27” and “814” test subjects of both “TIME” and “TOKEN” of “nonAD”. A large value is obtained. Moreover, "TTR" is as low as "0.249" as compared with "0.313" of the subject of "nonAD", and it can be seen that the number of "TYPE" is small relative to the number of "TOKEN". In addition, in Table 51, the numerical value in parentheses shows dispersion.

表51において、4列目のp値(p value)は、「AD」と「nonAD」との群間差が偶然生じる可能性を示す統計的指標である。例えば、p値が0.01(p=0.01)ということは、該当する結果が偶然生じることが100回に1回しか生じないことを意味する。すなわち、p値がが小さくなるほど、それだけ群間差が有意であることを意味し、本実験では「AD」と「nonAD」との被験者を正確に判別できていることを意味する。一般的にp値が0.05を下回ると、群間差は有意である解釈されている。   In Table 51, the p-value (p value) in the fourth column is a statistical index indicating the possibility that a difference between the groups “AD” and “nonAD” may occur by chance. For example, a p-value of 0.01 (p=0.01) means that the corresponding result will occur by chance only once in 100 times. That is, the smaller the p value is, the more significant the difference between the groups is, and in this experiment, the subjects “AD” and “nonAD” can be accurately discriminated. Generally, differences between groups are interpreted as significant at p-values below 0.05.

図5の表52は、被験者の内訳を纏めた表であり、1列目は「AD」の被験者を示し、2列目は「nonAD」の被験者を示している。表52において、「AD」の被験者は、男性が1名、女性が7名であり、平均年齢が「77.2歳」であり、MMSEスコアの平均値が「17.0」である。MMSEスコアとは認知症診断テストにおける被験者のスコアを示し、21を超えると「nonAD」、21以下であると「AD」と診断される。   The table 52 in FIG. 5 is a table summarizing the details of the subjects. The first column shows the subjects with “AD” and the second column shows the subjects with “nonAD”. In Table 52, the subjects of “AD” are 1 male and 7 female, the average age is “77.2 years”, and the average MMSE score is “17.0”. The MMSE score refers to the subject's score in the dementia diagnostic test. If the score exceeds 21, it is diagnosed as "nonAD", and if it is 21 or less, the diagnosis is "AD".

また、表52において、「nonAD」の被験者は、男性が4名、女性が5名であり、平均年齢が「76.6歳」であり、MMSEスコアの平均値が「25.1」であった。   In Table 52, the subjects of “nonAD” were 4 males and 5 females, the average age was “76.6 years old”, and the average MMSE score was “25.1”. It was

表51に示すように、TCRZIP、TCRLZH、TCRTARGZ、TCRCABは、それぞれ、p値が「0.054」、「0.015」、「0.060」、「0.029」であり、TCRTARGZ以外は全てp値が0.05を下回っており、「AD」と「nonAD」との被験者を正確に判別できていることが分かる。また、TCRTARGZはp値が0.05を超えているというものの、その超過量はわずかであり、ほぼ正確に「AD」と「nonAD」とを判別できていると言える。 As shown in Table 51, TCR ZIP , TCR LZH , TCR TRGZ , and TCR CAB have p values of "0.054", "0.015", "0.060", and "0.029", respectively. , TCR Targz , all p values are less than 0.05, and it can be seen that the subjects “AD” and “nonAD” can be accurately discriminated. Further, although T-CRARGZ has a p-value of more than 0.05, the excess amount is small, and it can be said that “AD” and “nonAD” can be discriminated almost accurately.

また、従来より、認知症を診断するうえで有用な言語指標として使用されていた「TTR」のp値は「0.02」であり、有意な結果を示している。しかし、TTRは、サンプルサイズに大きく依存することが知られており、サンプルサイズが小さい場合、本実験のような高いp値を得ることが困難になる。   Moreover, the p-value of “TTR” which has been conventionally used as a language index useful for diagnosing dementia is “0.02”, which shows a significant result. However, it is known that TTR largely depends on the sample size, and when the sample size is small, it becomes difficult to obtain a high p-value as in this experiment.

以上、診断装置1は、圧縮率を用いて認知症が診断されているので、言語に依存することなく正確に認知症の有無を診断することができる。また、診断装置1は、発話の言語的な意味内容に依存しない手法なので、サンプル数が少ない場合であっても、TTRのようにp値が大きくなり、診断精度が低下することもない。   As described above, since the dementia is diagnosed by using the compression rate, the diagnosis device 1 can accurately diagnose the presence or absence of dementia without depending on the language. Further, since the diagnostic device 1 is a method that does not depend on the linguistic meaning content of the utterance, even if the number of samples is small, the p-value becomes large like the TTR and the diagnostic accuracy does not deteriorate.

(実施の形態2)
実施の形態2の診断装置は、ネットワークを介することなくローカルのコンピュータで診断装置を構成したことを特徴とする。図6は、本発明の実施の形態2に係る診断装置1Aの全体構成を示すブロック図である。本実施の形態において、実施の形態1と同一構成のものには同一の符号を付し、説明を省く。
(Embodiment 2)
The diagnostic device of the second embodiment is characterized in that the diagnostic device is configured by a local computer without going through a network. FIG. 6 is a block diagram showing the overall configuration of diagnostic device 1A according to the second embodiment of the present invention. In the present embodiment, the same components as those in the first embodiment are designated by the same reference numerals and the description thereof will be omitted.

診断装置1Aは、収音部410、処理部420、及び表示部412を備える。収音部410は、例えば、診断装置1Aを構成するコンピュータに外部接続されたICレコーダ、或いは、このコンピュータが内臓するマイクで構成され、人物の音声を収音する。   The diagnostic device 1A includes a sound collection unit 410, a processing unit 420, and a display unit 412. The sound pickup unit 410 is composed of, for example, an IC recorder externally connected to a computer constituting the diagnostic device 1A, or a microphone incorporated in this computer, and picks up the voice of a person.

処理部420及び表示部412は、診断装置1Aを構成するパーソナルコンピュータ(PC)で構成されている。このPCはデスクトップ型PC或いはノートブック型PCの何れでも良い。   The processing unit 420 and the display unit 412 are configured by a personal computer (PC) included in the diagnostic device 1A. This PC may be either a desktop PC or a notebook PC.

処理部420は、取得部421、音声認識部422、圧縮部423、圧縮率算出部424、及び判定部425を備える。これらのブロックは、CPUがコンピュータを診断装置1Aとして機能させるための診断プログラムを実行することによって実現される。   The processing unit 420 includes an acquisition unit 421, a voice recognition unit 422, a compression unit 423, a compression rate calculation unit 424, and a determination unit 425. These blocks are realized by the CPU executing a diagnostic program for causing the computer to function as the diagnostic device 1A.

取得部421は、収音部410が収音した音声データを取得する。音声認識部422、圧縮部423、圧縮率算出部424、及び判定部425は、図1の音声認識部201、圧縮部301、圧縮率算出部302、及び判定部303と同一の機能を持つので、詳細な説明は省く。   The acquisition unit 421 acquires the sound data collected by the sound collection unit 410. The voice recognition unit 422, the compression unit 423, the compression rate calculation unit 424, and the determination unit 425 have the same functions as the voice recognition unit 201, the compression unit 301, the compression rate calculation unit 302, and the determination unit 303 in FIG. , Detailed explanation is omitted.

表示部412は、液晶ディスプレイや有機ELディスプレイといった表示装置で構成され、図1に示すタッチパネル102と同一内容の画面を表示する。   The display unit 412 is composed of a display device such as a liquid crystal display or an organic EL display, and displays a screen having the same contents as the touch panel 102 shown in FIG.

図7は、本発明の実施の形態2に係る診断装置1Aの処理の一例を示すフローチャートである。まず、収音部410は、診断対象者の音声を収音し、音声データを取得する(S801)。次に、音声認識部422は、取得された音声データを音声認識することでテキストデータに変換する(S802)。   FIG. 7 is a flowchart showing an example of processing of the diagnostic device 1A according to the second embodiment of the present invention. First, the sound collection unit 410 collects the voice of the person to be diagnosed and acquires voice data (S801). Next, the voice recognition unit 422 converts the acquired voice data into voice data by performing voice recognition (S802).

S803〜S807の処理は、それぞれ、図3のS302〜S306と同じである。S808では、判定部425は、診断結果を表示部412に表示させる。   The processes of S803 to S807 are the same as S302 to S306 of FIG. 3, respectively. In step S808, the determination unit 425 causes the display unit 412 to display the diagnosis result.

このように実施の形態2に係る診断装置1Aによれば、ローカルのコンピュータで構成されているので、ネットワークの通信トラフィックに依存することなく速やかに診断結果を得ることができる。   As described above, according to the diagnostic device 1A according to the second embodiment, since the diagnostic device 1A is configured by the local computer, the diagnostic result can be promptly obtained without depending on the communication traffic of the network.

(実施の形態3)
実施の形態3の診断装置は、実施の形態1の診断装置1において、収音部をICレコーダで構成したことを特徴とする。図8は、本発明の実施の形態3に係る診断装置1Bの全体構成を示す図である。本実施の形態において、実施の形態1,2と同一構成のものには同一の符号を付し、説明を省く。
(Embodiment 3)
The diagnostic device of the third embodiment is characterized in that the sound collecting unit is configured by an IC recorder in the diagnostic device 1 of the first embodiment. FIG. 8: is a figure which shows the whole structure of the diagnostic apparatus 1B which concerns on Embodiment 3 of this invention. In this embodiment, the same components as those in the first and second embodiments are designated by the same reference numerals and the description thereof will be omitted.

診断装置1Bにおいて、診断装置1との相違点は、携帯端末100に代えて、PC(パーソナルコンピュータ)920が用いられる点、収音部101に代えてICレコーダ940が用いられている点にある。   The diagnostic device 1B differs from the diagnostic device 1 in that a PC (personal computer) 920 is used in place of the mobile terminal 100, and an IC recorder 940 is used in place of the sound pickup unit 101. .

PC920は、デスクトップ型PC、或いはノートブック型PCで構成され、表示部921、通信部922、及びUSBインターフェース923を備える。   The PC 920 is a desktop PC or a notebook PC, and includes a display unit 921, a communication unit 922, and a USB interface 923.

表示部921は、液晶ディスプレイや有機ELディスプレイといった表示装置で構成され、図1に示すタッチパネル102と同一内容の画面を表示する。   The display unit 921 includes a display device such as a liquid crystal display or an organic EL display, and displays a screen having the same contents as the touch panel 102 shown in FIG.

通信部922は、PC920をネットワークNTに接続するための通信装置で構成される。USBインターフェース923は、USBメモリ930から音声データを取得する。ICレコーダ940は、図1に示す収音部101と同様、診断対象者が発話する音声を収音することで音声データを取得し、USBメモリ930に記録する。   The communication unit 922 includes a communication device for connecting the PC 920 to the network NT. The USB interface 923 acquires audio data from the USB memory 930. The IC recorder 940 acquires voice data by collecting the voice uttered by the diagnosis target person and records it in the USB memory 930, as in the sound pickup unit 101 shown in FIG. 1.

図9は、本発明の実施の形態3に係る診断装置1Bの処理の一例を示すフローチャートである。まず、S901では、PC920は、USBメモリ930からICレコーダ940が収音した診断対象者の音声データを読み出し、音声データを取得する。以後、図9においては図3と同様の処理が行われる。すなわち、図9のS902〜S904では、図3のS102〜S104と同じ処理が行われ、図9のS911〜S913では、図3のS201〜S203と同じ処理が行われ、図9の921〜S927では、図3のS301〜S307と同じ処理が行われる。   FIG. 9 is a flowchart showing an example of processing of the diagnostic device 1B according to the third embodiment of the present invention. First, in S901, the PC 920 reads the voice data of the diagnosis target person picked up by the IC recorder 940 from the USB memory 930 and acquires the voice data. Thereafter, in FIG. 9, the same processing as in FIG. 3 is performed. That is, in S902 to S904 of FIG. 9, the same processing as S102 to S104 of FIG. 3 is performed, in S911 to S913 of FIG. 9, the same processing as S201 to S203 of FIG. 3 is performed, and 921 to S927 of FIG. Then, the same processing as S301 to S307 of FIG. 3 is performed.

このように実施の形態3に係る診断装置1Bによれば、外部接続されるICレコーダ940が用いられているので、診断対象者の口元にICレコーダ940を配置することが可能となり、診断対象者の発話内容を正確に収音できる。   As described above, according to the diagnostic device 1B of the third embodiment, since the IC recorder 940 that is externally connected is used, it is possible to place the IC recorder 940 in the mouth of the person to be diagnosed, and The utterance content of can be accurately collected.

(実施の形態4)
実施の形態4に係る診断装置は、音声認識を行わずにテキストデータを用いて認知症を診断することを特徴とする。図10は、本発明の実施の形態4に係る診断装置1Cの全体構成を示すブロック図である。本実施の形態において、実施の形態1〜3と同一構成のものには同一の符号を付し、説明を省く。
(Embodiment 4)
The diagnostic device according to the fourth embodiment is characterized by diagnosing dementia using text data without performing voice recognition. FIG. 10 is a block diagram showing the overall configuration of diagnostic apparatus 1C according to Embodiment 4 of the present invention. In this embodiment, the same components as those in the first to third embodiments are designated by the same reference numerals and the description thereof will be omitted.

診断装置1Cにおいて、診断装置1Bとの相違点は、スキャナ910が新たに設けられている点、USBメモリ930、ICレコーダ940、及び音声認識サーバ200が省かれている点にある。   The diagnostic device 1C is different from the diagnostic device 1B in that a scanner 910 is newly provided, and the USB memory 930, the IC recorder 940, and the voice recognition server 200 are omitted.

スキャナ910は、診断対象者の発話内容を書き起こした文書、或いは診断対象者が書いた文書を光学的に読み取り、読み取った文書に対してテキスト認識処理を行い、テキストデータを生成し、PC920に出力する。ここで、診断対象者の発話内容を書き起こした文書としては、例えば、診断対象者が医師等との対話或いは表示部921に表示されたメッセージを通じて発話した内容を医師等が紙に書き起こした文書が採用されればよい。   The scanner 910 optically reads the document in which the utterance content of the diagnosis target person has been transcribed or the document written by the diagnosis target person, performs text recognition processing on the read document, generates text data, and causes the PC 920 to perform the text data generation. Output. Here, as the document in which the content of speech of the person to be diagnosed is transcribed, for example, the content of speech that the person to be diagnosed uttered through a dialogue with a doctor or the like or a message displayed on the display unit 921 is transcribed on a paper by the doctor or the like. Documents may be adopted.

また、診断対象者が書いた文書としては、例えば、表示部921に表示されたメッセージ或いは医師等との対話を通じて診断対象者が直接紙に書いた文書が採用されればよい。   Further, as the document written by the diagnosis target person, for example, a document directly written on the paper by the diagnosis target person through a message displayed on the display unit 921 or a dialogue with a doctor or the like may be adopted.

USBインターフェース923は、スキャナ910が生成したテキストデータを取得する。   The USB interface 923 acquires the text data generated by the scanner 910.

図11は、本発明の実施の形態4に係る診断装置1Cの処理の一例を示すフローチャートである。まず、S1101では、PC920は、スキャナ910からテキストデータを取得する。次に、通信部922は、取得したテキストデータをネットワークNTを介して診断サーバ300に送信する(S1102)。図11のS1111〜S1117の処理は、図3のS301〜S307の処理と同じであり、図11のS1103,S1104の処理は、図3のS103,S104の処理と同じである。   FIG. 11 is a flowchart showing an example of processing of the diagnostic device 1C according to the fourth embodiment of the present invention. First, in step S1101, the PC 920 acquires text data from the scanner 910. Next, the communication unit 922 transmits the acquired text data to the diagnosis server 300 via the network NT (S1102). The processing of S1111 to S1117 of FIG. 11 is the same as the processing of S301 to S307 of FIG. 3, and the processing of S1103 and S1104 of FIG. 11 is the same as the processing of S103 and S104 of FIG.

以上、実施の形態4に係る診断装置1Cでは、スキャナ910を用いてテキストデータが取得されているので、音声認識をすることなくテキストデータを取得することができ、システム全体の処理の負担を低減できる。   As described above, in the diagnostic device 1C according to the fourth embodiment, since the text data is acquired using the scanner 910, the text data can be acquired without performing voice recognition, and the processing load of the entire system is reduced. it can.

X 閾値
1,1A,1B,1C 診断装置
100 携帯端末
101,410 収音部
102 タッチパネル
103 制御部
104,202,304,922 通信部
200 音声認識サーバ
201,422 音声認識部
300 診断サーバ
301,423 圧縮部
302,424 圧縮率算出部
303 判定部
412 表示部
420 処理部
421 取得部
425 判定部
910 スキャナ
920 PC
921 表示部
923 USBインターフェース
930 USBメモリ
940 ICレコーダ
X threshold 1,1A,1B,1C diagnostic device 100 portable terminal 101,410 sound collecting unit 102 touch panel 103 control unit 104,202,304,922 communication unit 200 speech recognition server 201,422 speech recognition unit 300 diagnostic server 301,423 Compression unit 302, 424 Compression ratio calculation unit 303 Determination unit 412 Display unit 420 Processing unit 421 Acquisition unit 425 Determination unit 910 Scanner 920 PC
921 Display unit 923 USB interface 930 USB memory 940 IC recorder

Claims (8)

言語に症状が現れる疾患を診断する診断装置であって、
人物の発話内容又は前記人物が書き起こした文書を示すテキストデータを取得する取得部と、
前記取得部により取得されたテキストデータを、同じ単語の繰り返し回数が多いほど圧縮率が高くなるデータ圧縮方式によって可逆圧縮する圧縮部と、
前記圧縮部により可逆圧縮されたテキストデータの圧縮率を算出する圧縮率算出部と、
前記圧縮率算出部により算出された圧縮率に基づいて、前記人物が前記疾患の疑いを持つか否かを判定する判定部とを備える診断装置。
A diagnostic device for diagnosing a disease in which language appears
An acquisition unit that acquires text data indicating the utterance content of the person or the document transcribed by the person,
A compression unit that reversibly compresses the text data acquired by the acquisition unit by a data compression method in which the compression rate increases as the number of repetitions of the same word increases ,
A compression rate calculation section for calculating the compression rate of the text data losslessly compressed by the compression section;
A diagnostic device comprising: a determination unit that determines whether or not the person has a suspicion of the disease based on the compression ratio calculated by the compression ratio calculation unit.
前記人物が発話した音声を収音する収音部と、
前記収音された音声を音声認識することで、前記収音した音声を前記テキストデータに変換し、前記取得部に出力する音声認識部とを更に備える請求項1記載の診断装置。
A sound pickup unit that picks up the voice uttered by the person,
The diagnostic device according to claim 1, further comprising: a voice recognition unit configured to convert the collected voice into the text data and output the voice to the acquisition unit by voice-recognizing the collected voice.
前記取得部は、前記人物の発話内容が記載された文書又は前記人物が書き起こした文書をテキスト認識することで前記テキストデータを取得する請求項1又は2記載の診断装置。   3. The diagnostic apparatus according to claim 1, wherein the acquisition unit acquires the text data by recognizing a document in which the utterance content of the person is described or a document transcribed by the person as text. 前記判定部は、前記圧縮率が所定の閾値より高い場合、前記人物は前記疾患を持つと判定する請求項1〜3のいずれかに記載の診断装置。   The diagnostic device according to claim 1, wherein the determination unit determines that the person has the disease when the compression rate is higher than a predetermined threshold value. 前記判定部は、前記圧縮率が高くなるにつれて前記疾患の度合いが高いと判定する請求項1〜4のいずれかに記載の診断装置。   The diagnostic device according to claim 1, wherein the determination unit determines that the degree of the disease is higher as the compression rate is higher. 前記疾患は、認知症、脳疾患、及び精神障害を含む請求項1〜5のいずれかに記載の診断装置。   The diagnostic apparatus according to claim 1, wherein the disease includes dementia, brain disease, and mental disorder. 言語に症状が現れる疾患を診断する診断装置の制御方法であって、
前記診断装置によって、
物の発話内容又は前記人物が書き起こした文書を示すテキストデータを取得し、
前記取得したテキストデータを、同じ単語の繰り返し回数が多いほど圧縮率が高くなるデータ圧縮方式によって可逆圧縮し、
前記可逆圧縮されたテキストデータの圧縮率を算出し、
前記算出された圧縮率を所定の閾値と比較する、診断装置の制御方法。
A method for controlling a diagnostic device for diagnosing a disease in which a symptom appears in a language,
By the diagnostic device,
Get the text data indicating the speech content or document which the person has transcript of human product,
The acquired text data is losslessly compressed by a data compression method in which the compression rate increases as the number of repetitions of the same word increases ,
Calculating the compression rate of the reversibly compressed text data,
A method for controlling a diagnostic device, which compares the calculated compression rate with a predetermined threshold value .
言語に症状が現れる疾患を診断するための診断プログラムであって、
コンピュータを請求項1〜6のいずれかに記載の診断装置が備える各部として機能させる診断プログラム。
A diagnostic program for diagnosing a disease that manifests in language,
A diagnostic program that causes a computer to function as each unit included in the diagnostic device according to claim 1.
JP2016036988A 2016-02-29 2016-02-29 Diagnostic device, diagnostic device control method, and diagnostic program Active JP6699825B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016036988A JP6699825B2 (en) 2016-02-29 2016-02-29 Diagnostic device, diagnostic device control method, and diagnostic program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016036988A JP6699825B2 (en) 2016-02-29 2016-02-29 Diagnostic device, diagnostic device control method, and diagnostic program

Publications (2)

Publication Number Publication Date
JP2017156402A JP2017156402A (en) 2017-09-07
JP6699825B2 true JP6699825B2 (en) 2020-05-27

Family

ID=59808694

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016036988A Active JP6699825B2 (en) 2016-02-29 2016-02-29 Diagnostic device, diagnostic device control method, and diagnostic program

Country Status (1)

Country Link
JP (1) JP6699825B2 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6263308B1 (en) * 2017-11-09 2018-01-17 パナソニックヘルスケアホールディングス株式会社 Dementia diagnosis apparatus, dementia diagnosis method, and dementia diagnosis program
JP6667907B2 (en) * 2018-06-28 2020-03-18 株式会社アルム Dementia diagnostic device and dementia diagnostic system
CN109754822A (en) * 2019-01-22 2019-05-14 平安科技(深圳)有限公司 The method and apparatus for establishing Alzheimer's disease detection model
CN112908317B (en) * 2019-12-04 2023-04-07 中国科学院深圳先进技术研究院 Voice recognition system for cognitive impairment

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2002358524A1 (en) * 2001-12-21 2003-07-09 Janssen Pharmaceutica N.V. Stereotypy test apparatus and methods
CN102245085B (en) * 2008-10-14 2015-10-07 俄亥俄大学 The cognition utilizing eye to follow the tracks of and language assessment
WO2011129816A1 (en) * 2010-04-13 2011-10-20 Empire Technology Development Llc Semantic compression
WO2015066203A2 (en) * 2013-10-31 2015-05-07 Haruta Pau-San Computing technologies for diagnosis and therapy of language-related disorders

Also Published As

Publication number Publication date
JP2017156402A (en) 2017-09-07

Similar Documents

Publication Publication Date Title
Taguchi et al. Major depressive disorder discrimination using vocal acoustic features
JP6263308B1 (en) Dementia diagnosis apparatus, dementia diagnosis method, and dementia diagnosis program
JP6906067B2 (en) How to build a voiceprint model, devices, computer devices, programs and storage media
Rana et al. Automated screening for distress: A perspective for the future
Barsties et al. The improvement of internal consistency of the Acoustic Voice Quality Index
TWI403304B (en) Method and mobile device for awareness of linguistic ability
JP6699825B2 (en) Diagnostic device, diagnostic device control method, and diagnostic program
Benba et al. Detecting patients with Parkinson's disease using Mel frequency cepstral coefficients and support vector machines
CN111315302A (en) Cognitive function evaluation device, cognitive function evaluation system, cognitive function evaluation method, and program
JP6268628B1 (en) Cognitive function evaluation device, cognitive function evaluation system, cognitive function evaluation method and program
Wambaugh et al. Interrater reliability and concurrent validity for the Apraxia of Speech Rating Scale 3.0: Application with persons with acquired apraxia of speech and aphasia
CN111329494B (en) Depression reference data acquisition method and device
JP6667907B2 (en) Dementia diagnostic device and dementia diagnostic system
Samareh et al. Detect depression from communication: How computer vision, signal processing, and sentiment analysis join forces
CN111681779A (en) Medical diagnosis system
Borrie et al. Rhythm perception and its role in perception and learning of dysrhythmic speech
KR20080040803A (en) Method, apparatus, and system for diagnosing health status of mobile terminal users
Baird et al. An evaluation of the effect of anxiety on speech-computational prediction of anxiety from sustained vowels
Jaddoh et al. Interaction between people with dysarthria and speech recognition systems: A review
Kopf et al. Pitch strength as an outcome measure for treatment of dysphonia
CN116884648A (en) Voice interaction optimization method, device, equipment and medium based on traditional Chinese medicine inquiry
Karan et al. An investigation about the relationship between dysarthria level of speech and the neurological state of Parkinson’s patients
Yamada et al. Automatic Assessment of Loneliness in Older Adults Using Speech Analysis on Responses to Daily Life Questions
CN108766462B (en) Voice signal feature learning method based on Mel frequency spectrum first-order derivative
Akafi et al. Assessment of hypernasality for children with cleft palate based on cepstrum analysis

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160309

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181212

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191008

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191120

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200409

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200415

R150 Certificate of patent or registration of utility model

Ref document number: 6699825

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250