WO2016186362A1 - 글에 반영된 사용자의 심리 상태 정보 제공 장치 및 그 방법 - Google Patents

글에 반영된 사용자의 심리 상태 정보 제공 장치 및 그 방법 Download PDF

Info

Publication number
WO2016186362A1
WO2016186362A1 PCT/KR2016/004888 KR2016004888W WO2016186362A1 WO 2016186362 A1 WO2016186362 A1 WO 2016186362A1 KR 2016004888 W KR2016004888 W KR 2016004888W WO 2016186362 A1 WO2016186362 A1 WO 2016186362A1
Authority
WO
WIPO (PCT)
Prior art keywords
user
words
word
information
text
Prior art date
Application number
PCT/KR2016/004888
Other languages
English (en)
French (fr)
Inventor
김건오
전우영
김남희
신고은
류혜진
Original Assignee
트윈워드 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 트윈워드 주식회사 filed Critical 트윈워드 주식회사
Publication of WO2016186362A1 publication Critical patent/WO2016186362A1/ko

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/16Devices for psychotechnics; Testing reaction times ; Devices for evaluating the psychological state
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis

Definitions

  • the present invention relates to data processing techniques, and more particularly, to data analysis and management techniques.
  • a word graph is a network record of semantic relations between words. Words with relatively similar meanings are recorded at shorter distances. Words with dissimilar meanings are data stored and stored at long distances. Also known as a word map.
  • the most well-known word graphs include Wordnet, created by Princeton University's Cognitive Science Institute, and OpenCyc by the AI project Cyc.
  • Thesaurus a thesaurus, is a word graph. As such, the word graph stores the meaning distance between words in a form that can be processed by a computer, thereby enabling the computer to serve as a useful knowledge base when processing AI-related algorithms.
  • an apparatus and method for providing an information capable of automatically detecting a user's psychological state and informing the user of the psychological state by using a word graph alone and in real time are provided.
  • an information providing apparatus organizes articles written by a user in units of time, projects words included in the articles into word graphs classified by category, and analyzes distribution of the words projected in the word graph to reflect the articles. And a control unit for determining a mental state of the user, and an output unit providing the psychological state determination result of the user in association with the writing time information.
  • the word graph is a data grouped by grouping words having a semantic distance within a preset range for each key word, and the semantic distance is expressed as a physical distance based on the similarity of meanings between words.
  • Time units include years, months, days of the week, or hours.
  • the control unit may include a data extracting unit extracting text data from information generated according to a user's use of a service, classifying the extracted text data according to a writing time, and classifying the text data classified by time unit into words. And a data processor for generating word vectors and projecting the generated word vectors on a word graph, and a data analyzer for analyzing a distribution of words projected on the word graph to determine a psychological state of a user reflected in the text.
  • the data analyzer determines a personality type of a user from distribution of words in a word graph classified according to a personality type.
  • the data analyzer may determine the emotional state of the user from the distribution of words in the word graph classified according to the emotional state.
  • the data analyzer may determine the user's interest from the distribution of the words in the word graph classified according to the interest.
  • the data processor generates word vectors that are weighted to at least one of a writing time, a position of a word in a writing, and a frequency of using a word in a writing, and a peripheral word including a boundary word and a functional word at a boundary between key words.
  • the output unit provides a result of determining a mental state of a user in at least one of a trend change form over time or statistical information for each time section.
  • the controller may further provide an additional service including at least one of guide information, user customized recommendation information, and advertisement information based on a result of the psychological state determination of the user.
  • the control unit analyzes the tone of the text by using the word graph and the user's psychological state reflected in the text, and extracts the main word and further provides the result.
  • the user's psychological state may be automatically detected and notified to the user in real time, even by a writing written by the user. Accordingly, the user can know his or her mental state from the writings he has made through writing. In particular, without the involvement of specialists, such as psychological counselors, and without additional time and money investment for psychological testing, you can easily and simply know their psychological state just by writing their own.
  • the mental state of the user reflected in the text may be determined, thereby increasing the accuracy of the mental state.
  • it can be used for psychological treatment of users in the short term or long term.
  • the psychological state of the user can be known for each time interval, and the change of the psychological state of the user over time can be known.
  • the psychological state can be known using statistical information such as the psychological state and the average.
  • various additional services such as guide information, user customized recommendation information, and advertisement information may be provided based on a result of the psychological state determination of the user.
  • the tone of the text may be analyzed using the word graph and the main word may be extracted along with the psychological state of the user reflected in the text, and the result may be further provided.
  • FIG. 1 is a block diagram of an information providing system according to an embodiment of the present invention.
  • FIG. 2 is a configuration diagram of an information providing system according to another exemplary embodiment of the present disclosure.
  • FIG. 3 is a block diagram of an information providing apparatus according to an embodiment of the present invention.
  • FIG. 4 is a detailed configuration diagram of a control unit of FIG. 3 according to an embodiment of the present disclosure
  • FIG. 5 is a reference diagram showing an example of data analysis according to an embodiment of the present invention.
  • 6 to 8 are reference diagrams illustrating mental state result graphs provided in association with time information according to various embodiments of the present disclosure
  • FIG. 9 is a flowchart illustrating a method of providing information according to an embodiment of the present invention.
  • FIG. 10 is a reference diagram illustrating a part of a word graph according to an exemplary embodiment of the present invention.
  • FIG. 1 is a block diagram of an information providing system according to an exemplary embodiment.
  • an information providing system includes an information providing apparatus 1 and a user terminal 2.
  • the information providing apparatus 1 automatically analyzes the contents of a writing made by a user of the user terminal 2 to determine the psychological status of the user reflected in the writing, and the result of the determination to the user in real time. to provide.
  • the mental state of the user may be, but is not limited to, a personality type, a mental status, a concern, and the like.
  • the user's psychological state reflected in the text is analyzed and notified to the user, the user can know his / her psychological state from his / her written text through writing.
  • specialists such as a psychological counselor, and without additional time and money investment for psychological testing, you can easily and simply know their psychological state by just writing their own.
  • the article written by the user may be a post generated according to the user's use of the service.
  • the service may be a web-based service, for example, a web community service in which a user is active.
  • the web community may be Twitter, Facebook, blog, and the like.
  • the post written by the user may be a post generated through the user terminal 2.
  • it may be a writing made by executing a program executable through the user terminal 2, for example, a writing program.
  • the article which is the object for identifying the mental state of the user may be automatically extracted by the information providing apparatus 1 and may be selected by the user.
  • the target may be limited, for example, the target may be limited to a post generated through a specific program or a post generated at a specific time.
  • articles written for a specific purpose, such as for business purposes may be excluded.
  • the information providing apparatus 1 determines a mental state such as a personality type of the user according to which word the user frequently uses when writing. For example, it analyzes where words frequently used by a user in a given text are distributed in a word graph to determine the psychological state of the user reflected in the text.
  • the word graph is a data grouped by grouping words having a semantic distance within a preset range for each key word.
  • the mental state information is the personality type of the user
  • the key words are extraversion, introversion, sensing, intuition, thinking, feelinging, Judging and perceiving may be eight.
  • the word graph is composed of words having a semantic distance within a preset range for each of eight keywords.
  • the meaning distance is expressed as a physical distance based on the similarity of meanings between words, and as shown in FIG. 10, words are arranged close to or far from each other to form a word graph.
  • the information providing apparatus 1 organizes articles written by a user in units of time, and provides a mental state of the user reflected in the text in association with the time information.
  • Time units include years, months, days of the week, or hours.
  • a user's mental state may be provided for articles written by the user in a particular month.
  • the information providing apparatus 1 may provide a change in the mental state over time. For example, it provides a change in the mental state of the user at weekly intervals within a month.
  • recent mental state may be provided, or various statistical information such as an average, a maximum value, a minimum value, and a sum may be provided. Accordingly, the user can grasp his psychological change over time. Furthermore, it can be used for psychological treatment of users in the short term or long term.
  • An embodiment of providing a mental state of a user who writes in association with time information will be described later with reference to FIGS. 6 to 8.
  • the user terminal 2 is connected to the information providing apparatus 1 through a wired or wireless network.
  • the user terminal 2 may access the information providing apparatus 1 via the Internet or the like and receive information provided by the information providing apparatus 1.
  • the information providing apparatus 1 may directly provide a web page accessible by the user terminal 2 or may be connected to a separate web server to provide a web page to the user terminal 2.
  • the user terminal 2 receives the determination result from the information providing apparatus 1 and displays the received result on the display screen.
  • the user terminal 2 is a terminal possessed by a user, a personal computer (PC), a mobile phone, a smartphone, a PDA, a tablet computer, a netbook, an IPTV, a PMP, a navigation, an MP3 player, a mobile broadcast receiver. And various devices such as a digital camera.
  • the information providing apparatus 1 manages a word graph necessary for mental state determination. To this end, the information providing apparatus 1 may use a word graph stored in a separate server, and the information providing apparatus 1 may include a word graph database in which the word graph is stored.
  • the information providing apparatus 1 provides various additional services by using a psychological state determination result of a user reflected in a text.
  • guide information may be provided to a user according to a mental state determination result.
  • the user may check whether the writing is made as he intended.
  • correction information may be provided to write in a tone intended by the user. For example, if a user wants to neutralize positive or negative written text, the user automatically recommends neutral words or sentences instead of positive or negative words or sentences. Accordingly, the user can not only grasp the tone of the writing, but can also write rich content as the user intends.
  • the psychological state may be analyzed and a psychotherapy service may be provided based on the psychological state determination result of the user.
  • the psychological state analysis allows the user to identify the self and provide it in connection with short-term and long-term psychotherapy services according to psychological changes.
  • user-specific recommendation information or advertisement information may be provided according to the psychological state of the user. For example, specific products or services may be recommended based on the user's personality or emotional state.
  • the information providing apparatus 1 may be connected to an advertisement server.
  • the configuration of the system described above with reference to FIG. 1 is exemplary, and the system may further include other devices essential for operation.
  • information exchange between the user terminal 2 and the information providing apparatus 1 may be performed through a separate wired or wireless communication network, and communication for communication between the user terminal 2 and the information providing apparatus 1 may be performed.
  • a device may be further provided.
  • FIG. 2 is a configuration diagram of an information providing system according to another exemplary embodiment.
  • the system includes an information providing apparatus 1 inside the user terminal 2.
  • the information providing device 1 can use the functions of the user terminal 2.
  • the information providing apparatus 1 determines the psychological state of the user reflected in the article, and displays the psychological state determination result on the display screen of the user terminal 2.
  • the information providing apparatus 1 may use a word graph necessary for mental state determination from a database stored in a separate server. When the word graph database is stored in the information providing apparatus 1, it can be used.
  • the information providing apparatus 1 may be a separate device separate from the user terminal 2, or may be a device integrated with the user terminal 2 as shown in FIG. 2. However, the information providing apparatus 1 may include some components in the user terminal 2 as needed, and some other components may be located in a separate device separate from the user terminal 2.
  • FIG. 3 is a block diagram of an information providing apparatus according to an exemplary embodiment.
  • the configuration of the information providing apparatus 1 shown in FIG. 3 is exemplary, and the information providing apparatus 1 includes only some of the components shown in FIG. 3 and / or other components essential for its operation. It may further be provided. Hereinafter, each configuration of the information providing apparatus 1 will be described in detail with reference to FIG. 3.
  • the information providing apparatus 1 may include an input / output unit 10 and a control unit 12, and may further include a storage unit 14.
  • the input / output unit 10 receives the data and receives an input or outputs the data to another device in order for the information providing apparatus 1 to interwork with other devices. For example, when the user terminal requests the information providing apparatus 1 to provide the mental state information of the user, the user terminal receives the request data and transmits the request data to the control unit 12, and determines the psychological state of the user through the control unit 12. When the determination result is received from the control unit 12 and transmitted to the user terminal.
  • the control unit 12 is a kind of processor and controls the overall operation of the information providing apparatus 1.
  • the controller 12 analyzes and processes information to be received or transmitted through the input / output unit 10. For example, the controller 12 receives information generated according to a user's use of a service from the input / output unit 10 and extracts text data therefrom. Text data refers to a document composed of user-written articles.
  • the control unit 12 detects the mental state of the user reflected in the text by using a semantic-based vector space technique. For example, text data is divided into words to generate word vectors, and the generated word vectors are projected onto a word graph. The psychological state of the user reflected in the text is determined by analyzing the distribution of the words projected on the word graph.
  • the mental state information provided by the information providing apparatus 1 may be a personality type of the user. For example, extraversion, introversion, sensing, intuition, thinking, feelinging, judging, perceiving, etc. However, the present invention is not limited thereto.
  • the mental state information may be an emotional state of the user.
  • the information may be information indicating an emotional state such as feeling good, depressed, happy, or anxious, but is not limited thereto.
  • the mental state information may be of interest to the user. For example, relationships, family, religion, home, eating, money, leisure, work, death, It may be a success or the like, but is not limited thereto.
  • the control unit 12 organizes articles written by the user in units of writing time, and provides a psychological state of the user reflected in the writing in association with time information.
  • the user's mental state is provided for articles written within a month.
  • the recent mental state of the user may be provided for articles written recently, for example, within one week.
  • the controller 12 may provide a change in the mental state over time. For example, it provides a change in mental state at weekly intervals within a month. In this case, the user can know the change in the mental state of the past and now.
  • various statistical information such as average, maximum value, minimum value, and sum, may be provided. Statistical information allows users to better understand their mental state.
  • the control unit 12 analyzes the tone of the text together with the psychological state of the user reflected in the text, extracts the main word, and further provides the result.
  • the tone may be, for example, positive, negative or neutral.
  • the word graph is classified by grouping words having a semantic distance within a preset range for each tone, and the controller 12 analyzes how words in a given document are distributed in a word graph related to the tone, and then writes the words. I can grasp the tone.
  • the storage unit 16 stores various kinds of information for providing a service.
  • the storage unit 16 may transfer the stored information to the controller 12.
  • the storage unit 16 stores a word graph.
  • the storage unit 16 may be a storage medium including a memory, a hard disk drive (HDD), and the like, but is not limited thereto.
  • FIG. 4 is a detailed block diagram of the controller of FIG. 3 according to an exemplary embodiment.
  • the controller 12 includes a data extractor 120, a data processor 122, and a data analyzer 124.
  • the data extractor 120 extracts text data from information generated according to a user's use of a service.
  • the text data includes a website address (URL), a title, a description of the article, and the like.
  • the data processor 122 classifies the text data extracted through the data extractor 120 according to a writing time. Then, word data are generated by dividing the text data classified by time unit into words. The generated word vectors are then projected onto the word graph. An embodiment thereof will be described later with reference to FIG. 5.
  • the data processor 122 does not generate a word vector for all words in the text data, but generates only a word vector that can grasp the psychological state of the user as a word vector and removes the peripheral word. For example, a search such as a, the or a web site address (URL) of a web page is excluded as a function word.
  • the data processor 122 excludes boundary words at the boundary between the mental state of the user. For example, a word at the boundary between the personality types of the user is excluded because it cannot be assumed to be included in any particular personality type.
  • the data processor 122 assigns a weight to a specific word among meaningful words. For example, if the user wants to know the recent psychology of the user, weights are assigned to the word vectors included in the user's recent writing. Alternatively, weights may be assigned according to positions of words in a text, and weights may be assigned to word vectors corresponding to titles. As another example, a weight may be assigned according to the frequency of use of words in a text. If a specific word is frequently used, the weight may be weighted to the corresponding word vector.
  • the data analyzer 124 analyzes the distribution of the words projected on the word graph to determine the mental state of the user reflected in the text. For example, the data analyzer 124 may determine that a user has a personality type when words are intensively distributed in a word graph corresponding to a specific personality type among word graphs classified by personality type.
  • the method of analyzing the distribution of words is not limited thereto and may be variously modified depending on what the criterion is.
  • the data analyzer 124 uses different word graphs depending on what the mental state information is. For example, when the mental state information is a personality type, the data analyzer 124 determines the personality type of the user from the distribution of words in a word graph classified according to the personality type. As another example, when the mental state information is an emotional state, the data analyzer 124 determines the emotional state of the user from the distribution of words in a word graph classified according to the emotional state. As another example, when the mental state information is an interest, the data analyzer 124 determines the user's interest from the distribution of words in a word graph classified according to the interest.
  • the personality type is an outward-introvert (EI) index indicating the direction of mental energy, and a sensory-intuition indicating a function of cognition including information collection.
  • EI outward-introvert
  • SN indicators
  • TF reasonable-feeling
  • JP cognitive-awareness
  • the extraversion and introversion indicators indicate whether the direction of psychological energy and attention is directed mainly inside or outside.
  • Sensing and intuition indicators are indicators of whether the sense or intuition is used more in the way of perceiving and perceiving objects such as people or objects.
  • Thinking and feeling indicators tell you which one you prefer, thinking or feeling, when making decisions and making decisions based on the information you collect.
  • Judging and perceiving indicators are indicators of the tendency of whether judgment or recognition is the preferred method of coping with real life based on the recognition function and the judgment function.
  • each of the 16 personality types has different main and sub functions, which in turn are differentiated depending on whether the direction of mental energy is inward or outward.
  • FIG. 5 is a diagram illustrating an example of analyzing data according to an embodiment of the present invention.
  • FIG. 5 is a reference diagram illustrating an example in which a word vector is projected onto a word graph.
  • the information providing apparatus divides word vectors 510 into words of texts 1,..., Text n-1, text n 500 which are written by a user in a time period. ) And project the generated word vectors 510 to the word graph 520.
  • the information providing device analyzes the distribution of the words projected in the word graph 520 to determine the mental state of the user reflected in the text. For example, if a word frequently used by a user is intensively distributed in word graph 2 530, it is determined that the user has a mental state characteristic corresponding to a key word 2 of word graph 2 530.
  • the above-described example is not limited thereto and is only an embodiment for helping the understanding of the present invention.
  • 6 to 8 are reference diagrams illustrating mental state result graphs provided in association with time information according to various embodiments of the present disclosure.
  • FIG. 6 is a graph that scores the psychological state of the user reflected in the text over time t.
  • the user's personality type A 600 characteristic is always high regardless of the passage of time, and personality type B 610 and personality type C ( It can be seen that the characteristics of 620 are opposite to each other. For example, at time t2, the characteristics of personality type C 620 are stronger than the characteristics of personality type B 610, but at time excluding time t2, the characteristics of personality type B 610 are personality type C ( It can be seen that it is stronger than the characteristic of 620). Furthermore, it can be inferred that the user has a different type of personality type characteristic at time t2.
  • FIG. 7 is a graph illustrating a psychological state determination result of a user provided in the form of statistical information.
  • the degree to which the characteristics of the personality type D appear in the personality type D is recently (700), the user average (Your Avg.) 710, and the overall average (World Avg.) 720. It can be provided in the form. The user can know the self better by using systematic statistical information.
  • FIG. 8 is a graph that scores the mental state of a user in a time interval.
  • a score for each personality type may be displayed in a time interval, for example, Period 1 interval.
  • the mental state of the user may be displayed in a radial form, but the form is not limited thereto.
  • the display may be variously modified such as a bar, a line, a circle, an area, a dispersion, a stock, a surface, a donut, and a bubble.
  • FIG. 9 is a flowchart illustrating a method of providing information according to an embodiment of the present invention.
  • the information providing apparatus organizes articles written by a user in units of time (900). Then, the words included in the text are projected on the word graph classified by category, and the distribution of the words projected in the word graph is analyzed (910) to determine the mental state of the user reflected in the text (920). Subsequently, the psychological state determination result of the user is provided in association with the writing time information (930).
  • the word graph is a data grouped by grouping words having a semantic distance within a preset range for each key word, and the semantic distance is expressed as a physical distance based on the similarity of meanings between words. Time units include years, months, days of the week, or hours.
  • the information providing apparatus extracts text data from information generated according to a user's use of a service, and classifies the extracted text data according to a writing time. Then, the text data classified by the time unit is divided into words to generate word vectors, and the generated word vectors are projected onto the word graph.
  • the psychological state of the user may be analyzed to determine the psychological state of the user reflected in the text by analyzing the distribution of the words projected on the word graph.
  • the information providing apparatus In the article analyzing step 910, the information providing apparatus according to an embodiment generates word vectors that are weighted to at least one of a writing time, a position of a word in a writing, and a frequency of use of a word in a writing.
  • the peripheral word including the boundary word and the functional word at the boundary between the key words may be removed.
  • the information providing apparatus may determine the personality type of the user from the distribution of words in a word graph classified according to the personality type.
  • the emotional state of the user may be determined from the distribution of words in the word graph classified according to the emotional state.
  • the user's interest may be determined from the distribution of the words in the word graph classified according to the interest.
  • the information providing apparatus may provide the result of the psychological state determination of the user in at least one of a change form according to time flow or a statistical information for each time section. Can be.
  • the information providing apparatus may additionally provide an additional service including at least one of guide information, user-customized recommendation information, and advertisement information based on the psychological state determination result of the user. Furthermore, the information providing apparatus may analyze the tone of the text and extract the main word using the word graph together with the psychological state of the user reflected in the text, and further provide the result.
  • FIG. 10 is a reference diagram illustrating a part of a word graph according to an exemplary embodiment of the present invention.
  • a word graph is a semantic network between words.
  • the word graph is relatively far from the word graph or close to each other based on the meaning distance based on the meaning distance.
  • the information providing device identifies the semantic relation and semantic distance of the word graph and uses the information to determine the mental state of the user reflected in the text.
  • the word graph may be in the form of a map or graph of a massive size composed of numerous words.

Abstract

글에 반영된 사용자의 심리 상태 정보 제공 장치 및 그 방법이 개시된다. 본 발명의 일 실시 예에 따른 정보 제공 장치는, 사용자가 작성한 글들을 시간 단위로 정리하고, 글에 포함된 단어들을 카테고리 별로 분류된 워드 그래프에 투영시켜 워드 그래프 내에 투영된 단어들의 분포를 분석하여 글에 반영된 사용자의 심리 상태를 판단하는 제어부와, 사용자의 심리 상태 판단 결과를 글 작성 시간 정보와 연관 지어 제공하는 출력부를 포함한다.

Description

글에 반영된 사용자의 심리 상태 정보 제공 장치 및 그 방법
본 발명은 데이터 프로세싱 기술에 관한 것으로, 보다 상세하게는 데이터 분석 및 관리 기술에 관한 것이다.
워드 그래프(word graph)란, 단어 간의 의미 관계를 네트워크 형태로 기록한 것으로서, 상대적으로 유사한 의미의 단어일수록 가까운 거리로 기록되고, 유사하지 않은 의미를 가진 단어일수록 먼 거리에 기록되어 저장된 자료이며, 워드 맵(word map)이라고도 한다. 가장 대표적으로 알려진 워드 그래프는 프린스턴 대학의 인지 과학 연구소에서 만들어진 워드넷(Wordnet)과 인공지능 프로젝트 Cyc에 의한 OpenCyc 등이 있다. 유의어 사전인 시소러스(Thesaurus)도 일종의 워드 그래프라고 할 수 있다. 이와 같이 워드 그래프는 단어와 단어 사이의 의미 거리를 컴퓨터가 처리할 수 있는 형태로 저장함으로써 컴퓨터가 인공지능 관련 알고리즘 처리 시 유익한 지식 베이스의 역할을 수행하도록 해준다.
예를 들어, 대화 시스템에서 "음료수는 무엇으로 하시겠습니까?"라는 질문에 대하여 응답할 때, 음료수에 대하여 콜라, 사이다, 주스 등의 정보가 저장된 워드 그래프를 활용하여 응답을 출력할 수 있는 것처럼, 워드 그래프는 지식베이스의 일종으로 그 역할의 중요성이 더욱 증대되고 있는 실정이다.
일 실시 예에 따라, 워드 그래프를 이용하여, 사용자가 작성한 글만으로도 사용자의 심리 상태를 자동으로 파악하여 이를 사용자에게 실시간으로 알려줄 수 있는 정보 제공 장치 및 그 방법을 제안한다.
일 실시 예에 따른 정보 제공 장치는, 사용자가 작성한 글들을 시간 단위로 정리하고, 글에 포함된 단어들을 카테고리 별로 분류된 워드 그래프에 투영시켜 워드 그래프 내에 투영된 단어들의 분포를 분석하여 글에 반영된 사용자의 심리 상태를 판단하는 제어부와, 사용자의 심리 상태 판단 결과를 글 작성 시간 정보와 연관 지어 제공하는 출력부를 포함한다.
워드 그래프는 핵심어 별로 미리 설정된 범위 내의 의미 거리를 가진 단어들끼리를 그룹화하여 분류한 자료이고, 의미 거리는 단어들 간의 의미의 유사성에 기초하여 이를 물리적인 거리로 나타낸다. 시간 단위는 년, 달, 요일 또는 시간을 포함한다.
일 실시 예에 따른 제어부는, 사용자의 서비스 사용에 따라 생성된 정보로부터 텍스트 데이터를 추출하는 데이터 추출부와, 추출된 텍스트 데이터를 글 작성 시간에 따라 분류하고 시간 단위로 분류된 텍스트 데이터를 단어들로 구분하여 단어 벡터들을 생성하며 생성된 단어 벡터들을 워드 그래프에 투영시키는 데이터 처리부와, 워드 그래프에 투영된 단어들의 분포를 분석하여 글에 반영된 사용자의 심리 상태를 판단하는 데이터 분석부를 포함한다.
일 실시 예에 따른 데이터 분석부는 성격 타입에 따라 분류된 워드 그래프 내에서 단어들의 분포로부터 사용자의 성격 타입을 판단한다. 데이터 분석부는 정서 상태에 따라 분류된 워드 그래프 내에서 단어들의 분포로부터 사용자의 정서 상태를 판단할 수 있다. 데이터 분석부는 관심사에 따라 분류된 워드 그래프 내에서 단어들의 분포로부터 사용자의 관심사를 판단할 수 있다.
일 실시 예에 따른 데이터 처리부는 글 작성 시간, 글 내 단어의 위치, 글 내 단어의 사용 빈도 중 적어도 하나에 가중치를 부여한 단어 벡터들을 생성하고, 핵심어 간의 경계에 있는 경계어와 기능어를 포함하는 주변어는 제거한다.
일 실시 예에 따른 출력부는 사용자의 심리 상태 판단 결과를, 시간 흐름에 따른 추이 변화 형태 또는 시간 구간 별 통계 정보 형태 중 적어도 하나의 형태로 제공한다.
일 실시 예에 따른 제어부는 사용자의 심리 상태 판단 결과를 기초로 하여 가이드 정보, 사용자 맞춤형 추천 정보 및 광고 정보 중 적어도 하나를 포함하는 부가 서비스를 추가로 제공한다.
일 실시 예에 따른 제어부는 글에 반영된 사용자의 심리 상태와 함께 워드 그래프를 이용하여 글의 어조를 분석하고 주제어를 추출하여 그 결과를 추가로 제공한다.
일 실시 예에 따르면, 사용자가 작성한 글만으로도 사용자의 심리 상태를 자동으로 파악하여 이를 사용자에게 실시간으로 알려줄 수 있다. 이에 따라 사용자는 글 쓰기를 통해 자신이 작성한 글로부터 자신의 심리 상태를 알 수 있다. 특히, 심리 상담사와 같은 전문가의 개입 없이, 또한 심리 테스트 등을 위한 별도의 시간 및 비용 투자 없이도 단지 자신이 작성한 글만으로도 쉽고 간편하게 자신의 심리 상태를 알 수 있다.
또한, 핵심어 별로 의미 거리에 기반하여 분류한 워드 그래프를 이용하여 글에 반영된 사용자의 심리 상태를 판단함에 따라 심리 상태 판단에 대한 정확도를 높일 수 있다. 그리고, 단기적 또는 장기적으로 사용자의 심리 치료에도 활용 가능하다.
나아가, 사용자의 심리 상태 판단 결과를 글을 작성한 시간 정보와 연관 지어 제공함에 따라, 시간 구간 별로 사용자의 심리 상태를 알 수 있고 시간 흐름에 따른 사용자의 심리 상태의 추이 변화를 알 수 있으며, 최근의 심리 상태나 평균 등의 통계정보를 활용해 심리 상태를 알 수 있다.
또한, 사용자의 심리 상태 판단 결과를 기초로 하여 가이드 정보, 사용자 맞춤형 추천 정보, 광고 정보 등의 다양한 부가 서비스를 제공할 수 있다. 나아가, 글에 반영된 사용자의 심리 상태와 함께 워드 그래프를 이용하여 글의 어조를 분석하고 주제어를 추출하여 그 결과를 추가로 제공할 수 있다.
도 1은 본 발명의 일 실시 예에 따른 정보 제공 시스템의 구성도,
도 2는 본 발명의 다른 실시 예에 따른 정보 제공 시스템의 구성도,
도 3은 본 발명의 일 실시 예에 따른 정보 제공 장치의 구성도,
도 4는 본 발명의 일 실시 예에 따른 도 3의 제어부의 세부 구성도,
도 5는 본 발명의 일 실시 예에 따른 데이터 분석 예를 도시한 참조도,
도 6 내지 도 8은 본 발명의 다양한 실시 예에 따라 시간 정보와 연관 지어 제공되는 심리 상태 결과 그래프들을 도시한 참조도,
도 9는 본 발명의 일 실시 예에 따른 정보 제공 방법을 도시한 흐름도,
도 10은 본 발명의 일 실시 예에 따른 워드 그래프의 일부를 도시한 참조도이다.
이하에서는 첨부한 도면을 참조하여 본 발명의 실시 예들을 상세히 설명한다. 본 발명을 설명함에 있어 관련된 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이다. 또한, 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례 등에 따라 달라질 수 있다. 그러므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.
도 1은 본 발명의 일 실시 예에 따른 정보 제공 시스템의 구성도이다.
도 1을 참조하면, 정보 제공 시스템은 정보 제공 장치(1)와 사용자 단말(2)을 포함한다.
일 실시 예에 따른 정보 제공 장치(1)는 사용자 단말(2)의 사용자가 작성한 글의 내용을 자동으로 분석하여 글에 반영된 사용자의 심리 상태(psychology status)를 판단하고 판단 결과를 사용자에 실시간으로 제공한다. 사용자의 심리 상태는 사용자의 성격 타입(personality type), 정서 상태(mind status), 관심도(concerns) 등일 수 있으나, 이에 한정되지 않는다. 글에 반영된 사용자의 심리 상태를 분석하여 이를 사용자에 알려줌에 따라, 사용자는 글 쓰기를 통해 자신이 작성한 글로부터 자신의 심리 상태를 알 수 있다. 특히, 심리 상담사와 같은 전문가의 개입 없이, 또한 심리 테스트 등을 위한 별도의 시간 및 비용 투자 없이도 단지 자신이 작성한 글만으로도 쉽고 간단하게 자신의 심리 상태를 알 수 있다.
사용자가 작성한 글은 사용자의 서비스 사용에 따라 생성된 글일 수 있다. 서비스는 웹 기반 서비스일 수 있는데, 예를 들어 사용자가 활동하는 웹 커뮤니티 서비스일 수 있다. 웹 커뮤니티는 트위터, 페이스북, 블로그 등일 수 있다. 사용자가 작성한 글은 사용자 단말(2)을 통해 생성된 글일 수 있다. 예를 들어, 사용자 단말(2)을 통해 실행 가능한 프로그램, 예를 들어 글쓰기 프로그램을 실행하여 작성한 글일 수 있다. 사용자의 심리 상태 파악을 위한 대상이 되는 글은 정보 제공 장치(1)에 의해 자동으로 추출될 수 있고, 사용자에 의해 선택될 수 있다. 또한 그 대상을 한정할 수 있는데, 예를 들어 특정 프로그램을 통해 생성된 글이나 특정 시간에 생성된 글 등으로 그 대상을 한정할 수 있다. 또한, 업무용 등 특정한 목적을 가지고 작성된 글들은 그 대상에서 제외할 수도 있다.
일 실시 예에 따른 정보 제공 장치(1)는 사용자가 글 쓰기 시에 어떤 단어를 자주 사용하는가에 따라 사용자의 성격 타입과 같은 심리 상태를 판단한다. 예를 들어, 주어진 글 내에서 사용자가 자주 사용하는 단어들이 워드 그래프(word graph) 내 어디에 분포해 있는지를 분석하여 글에 반영된 사용자의 심리 상태를 판단한다. 워드 그래프는 핵심어(key word) 별로 미리 설정된 범위 내의 의미 거리를 가진 단어들끼리를 그룹화하여 분류한 자료이다. 예를 들어, 심리 상태 정보가 사용자의 성격 타입인 경우, 핵심어는 외향성(extraversion), 내향성(introversion), 감각형(sensing), 직관형(intuition), 사고형(thinking), 감정형(feeling), 판단형(judging), 인식형(perceiving) 8개일 수 있다. 이 경우, 워드 그래프는 8개의 핵심어 별로 각각 미리 설정된 범위 내의 의미 거리를 가진 단어들로 구성된다. 의미 거리는 단어들 간의 의미의 유사성에 기초하여 이를 물리적인 거리로 나타낸 것으로서, 도 10에 도시한 바와 같이, 단어들을 가깝거나 멀리 배치하여 워드 그래프를 구성하며, 단어들은 여러 단어들과 의미의 유사성을 가질 수 있다.
일 실시 예에 따른 정보 제공 장치(1)는 사용자가 작성한 글들을 시간 단위로 정리하고, 시간 정보와 연관 지어 글에 반영된 사용자의 심리 상태를 제공한다. 시간 단위는 년, 달, 요일 또는 시간을 포함한다. 예를 들어, 특정 달에 사용자가 작성한 글들을 대상으로 사용자의 심리 상태를 제공할 수 있다. 정보 제공 장치(1)는 시간 흐름에 따른 심리 상태의 추이 변화를 제공할 수 있다. 예를 들어, 한 달 내에 요일 간격으로 사용자의 심리 상태 변화를 제공한다. 나아가, 최근의 심리 상태를 제공하거나, 평균, 최대 값, 최소 값, 합계 등의 다양한 통계정보를 제공할 수도 있다. 이에 따라, 사용자는 시간에 따라 자신의 심리 변화를 파악할 수 있다. 나아가, 단기적 또는 장기적으로 사용자의 심리 치료에도 활용 가능하다. 시간 정보와 연관 지어 글을 작성한 사용자의 심리 상태를 제공하는 실시 예는 도 6 내지 도 8을 참조로 하여 후술한다.
일 실시 예에 따른 사용자 단말(2)은 유무선 네트워크를 통해 정보 제공 장치(1)와 연결된다. 사용자 단말(2)은 인터넷 등을 통해 정보 제공 장치(1)에 접속하여 정보 제공 장치(1)가 제공하는 정보를 수신할 수 있다. 이를 위해 정보 제공 장치(1)는 사용자 단말(2)이 접속 가능한 웹 페이지를 직접 제공하거나 별도의 웹 서버와 연결되어 사용자 단말(2)에 웹 페이지를 제공할 수 있다. 정보 제공 장치(1)가 사용자의 글 내용을 분석하여 사용자 심리 상태를 판단하면, 사용자 단말(2)은 정보 제공 장치(1)로부터 판단 결과를 수신하고, 수신된 결과를 디스플레이 화면에 표시한다.
사용자 단말(2)은 사용자가 소지한 단말로서, 개인용 컴퓨터(PC), 핸드폰, 스마트폰, PDA, 태블릿 컴퓨터(Tablet Computer), 넷북(Netbook), IPTV, PMP, 내비게이션, MP3 플레이어, 이동방송 수신기, 디지털 카메라 등의 각종 디바이스일 수 있다. 정보 제공 장치(1)는 심리 상태 판단에 필요한 워드 그래프를 관리한다. 이를 위해 정보 제공 장치(1)는 별도의 서버에 저장된 워드 그래프를 이용할 수 있고, 정보 제공 장치(1)가 워드 그래프가 저장된 워드 그래프 데이터베이스를 포함할 수도 있다.
일 실시 예에 따른 정보 제공 장치(1)는 글에 반영된 사용자의 심리 상태 판단 결과를 이용하여 다양한 부가 서비스를 제공한다. 예를 들어, 심리 상태 판단 결과에 따라 사용자에 가이드 정보를 제공할 수 있다. 가령, 사용자에게 글의 어조(tone)가 긍정적인지, 부정적인지 또는 중립적인지를 알려 줌에 따라, 자신의 의도대로 글이 작성되었는지를 확인할 수 있다. 나아가, 사용자가 의도하는 어조로 글쓰기가 이루어지도록 교정 정보를 제공할 수 있다. 예를 들어, 긍정적이거나 부정적으로 써진 글을 사용자가 중립적으로 교정하기를 원한다면, 긍정적이거나 부정적인 단어나 문장 대신에 중립적인 단어나 문장을 자동으로 추천한다. 이에 따라, 사용자는 글의 어조를 파악할 수 있을 뿐만 아니라, 사용자의 의도대로의 풍부한 내용의 글쓰기가 가능하다.
다른 예로, 사용자의 심리 상태 판단 결과를 기초로 하여 심리 상태를 분석해 주고 심리 치료 서비스를 제공할 수 있다. 심리 상태 분석을 통해 사용자는 자아를 파악할 수 있고, 심리 변화에 따른 단기적, 장기적 심리 치료 서비스와 연관하여 제공할 수 있다. 또 다른 예로, 사용자의 심리 상태에 따라 사용자 맞춤형 추천 정보나 광고 정보를 제공할 수 있다. 가령, 사용자의 성격이나 정서 상태에 맞추어 특정 상품이나 서비스를 추천할 수 있다. 이를 위해 정보 제공 장치(1)는 광고 서버 등과 연결될 수 있다.
도 1을 참조로 하여 전술한 시스템의 구성은 예시적인 것으로서, 시스템은 동작을 위하여 필수적인 다른 장치들을 추가로 구비할 수도 있다. 예를 들어, 사용자 단말(2)과 정보 제공 장치(1) 사이의 정보교환은 별도의 유선 또는 무선 통신망을 통하여 이루어질 수 있으며, 사용자 단말(2)과 정보 제공 장치(1)의 통신을 위한 통신 장치 등이 추가로 구비될 수 있다.
도 2는 본 발명의 다른 실시 예에 따른 정보 제공 시스템의 구성도이다.
도 2를 참조하면, 시스템은 사용자 단말(2) 내부에 정보 제공 장치(1)를 포함한다. 이 경우, 정보 제공 장치(1)는 사용자 단말(2)의 기능을 이용할 수 있다. 정보 제공 장치(1)는 사용자가 작성한 글들을 대상으로 글에 반영된 사용자의 심리 상태를 판단하고 사용자 단말(2)의 디스플레이 화면을 통해 심리 상태 판단 결과를 표시한다. 정보 제공 장치(1)는 심리 상태 판단을 위해 필요한 워드 그래프를 별도의 서버에 저장된 데이터베이스로부터 이용할 수 있다. 워드 그래프 데이터베이스가 정보 제공 장치(1)에 저장된 경우는 이를 이용할 수 있다.
도 1에 도시된 바와 같이 정보 제공 장치(1)는 사용자 단말(2)과 분리된 별도의 장치일 수 있고, 도 2에 도시된 바와 같이 사용자 단말(2)에 일체화된 장치일 수 있다. 그러나, 정보 제공 장치(1)는 필요에 따라 일부 구성 요소는 사용자 단말(2)에 포함되고, 다른 일부 구성 요소는 사용자 단말(2)과 분리된 별도의 장치에 위치할 수도 있다.
도 3은 본 발명의 일 실시 예에 따른 정보 제공 장치의 구성도이다.
도 3에 도시되어 있는 정보 제공 장치(1)의 구성은 예시적인 것으로서, 정보 제공 장치(1)는 도 3에 도시되어 있는 구성요소들의 일부만을 구비하거나 및/또는 그 동작을 위하여 필수적인 다른 구성요소들을 추가로 구비할 수도 있다. 이하, 도 3을 참조로 하여 정보 제공 장치(1)의 각 구성에 대해 상세히 후술한다.
도 3을 참조하면, 정보 제공 장치(1)는 입출력부(10) 및 제어부(12)를 포함하며, 저장부(14)를 더 포함할 수 있다.
입출력부(10)는 정보 제공 장치(1)가 다른 디바이스들과 연동하기 위하여, 데이터를 수신하여 입력을 받거나, 데이터를 출력하여 다른 디바이스에 송신한다. 예를 들어, 사용자 단말이 정보 제공 장치(1)에 사용자의 심리 상태 정보 제공을 요청하면, 요청 데이터를 입력받아 이를 제어부(12)에 전달하고, 제어부(12)를 통해 사용자의 심리 상태가 판단되면 제어부(12)로부터 판단 결과를 수신하여 이를 사용자 단말에 송신한다.
제어부(12)는 일종의 프로세서로서, 정보 제공 장치(1)의 전반적인 동작을 제어한다. 제어부(12)는 입출력부(10)를 통해 수신하거나 송신할 정보를 분석 및 가공한다. 예를 들어, 제어부(12)는 입출력부(10)로부터 사용자의 서비스 사용에 따라 생성된 정보를 수신하여 이로부터 텍스트 데이터를 추출한다. 텍스트 데이터는 사용자가 작성한 글들로 이루어진 문서를 의미한다.
일 실시 예에 따른 제어부(12)는 의미 기반 벡터 스페이스(vector space) 기법을 이용하여 글에 반영된 사용자의 심리 상태를 파악한다. 예를 들어, 텍스트 데이터를 단어들로 구분하여 단어 벡터들(word vectors)을 생성하고, 생성된 단어 벡터들을 워드 그래프에 투영시킨다. 그리고, 워드 그래프에 투영된 단어들의 분포를 분석하여 글에 반영된 사용자의 심리 상태를 판단한다.
정보 제공 장치(1)가 제공하는 심리 상태 정보는 사용자의 성격 타입일 수 있다. 예를 들어, 외향성(extraversion), 내향성(introversion), 감각형(sensing), 직관형(intuition), 사고형(thinking), 감정형(feeling), 판단형(judging), 인식형(perceiving) 등일 수 있으나, 이에 한정되지 않는다. 심리 상태 정보는 사용자의 정서 상태일 수 있다. 예를 들어, 기분 좋음, 우울함, 행복함, 불안감 등의 감정 상태를 나타내는 정보일 수 있으나, 이에 한정되지 않는다. 심리 상태 정보는 사용자의 관심사일 수 있다. 예를 들어, 대인 관계(relationships), 가족(family), 종교(religion), 가정(home), 식사(eating), 돈(money), 여가(leisure), 일(work), 죽음(death), 성공(success) 등일 수 있으나, 이에 한정되지 않는다.
일 실시 예에 따른 제어부(12)는 사용자가 작성한 글들을 글 작성 시간 단위로 정리하고, 시간 정보와 연동하여 글에 반영된 사용자의 심리 상태를 제공한다. 예를 들어, 한 달 내에 작성된 글들을 대상으로 사용자의 심리 상태를 제공한다. 특히, 최근, 예를 들어 최근 일주일 내에 작성된 글들을 대상으로 사용자의 최근의 심리 상태를 제공할 수 있다. 나아가 제어부(12)는 시간 흐름에 따른 심리 상태의 추이 변화를 제공할 수 있다. 예를 들어, 한 달 내에 요일 간격으로 심리 상태의 변화를 제공한다. 이 경우, 사용자는 예전과 지금의 심리 상태 변화를 알 수 있다. 나아가, 평균, 최대 값, 최소 값, 합계 등의 다양한 통계정보를 제공할 수 있다. 통계정보는 사용자가 자신의 심리 상태를 더 잘 파악할 수 있게 해 준다.
일 실시 예에 따른 제어부(12)는 글에 반영된 사용자의 심리 상태와 함께 글의 어조(tone)를 분석하고 주제어를 추출하여 그 결과를 추가로 제공한다. 어조는 예를 들어 긍정적, 부정적 또는 중립적 등일 수 있다. 이를 위해 워드 그래프는 어조 별로 미리 설정된 범위 내의 의미 거리를 가진 단어들끼리를 그룹화하여 분류되며, 제어부(12)는 주어진 문서 내 단어들이 어조와 관련된 워드 그래프 내에서 어떻게 분포되어 있는지를 분석하여 글의 어조를 파악할 수 있다.
저장부(16)는 서비스를 제공하기 위한 각종 정보가 저장된다. 저장부(16)는 저장된 정보들을 제어부(12)로 전달할 수 있다. 저장부(16)에는 워드 그래프가 저장된다. 저장부(16)는 메모리, 하드디스크 드라이브(HDD) 등을 포함하는 저장 매체일 수 있으나, 이에 한정되지 않는다.
도 4는 본 발명의 일 실시 예에 따른 도 3의 제어부의 세부 구성도이다.
도 3 및 도 4를 참조하면, 제어부(12)는 데이터 추출부(120), 데이터 처리부(122) 및 데이터 분석부(124)를 포함한다.
데이터 추출부(120)는 사용자의 서비스 사용에 따라 생성된 정보로부터 텍스트 데이터를 추출한다. 서비스 사용에 따라 생성된 정보가 웹 페이지인 경우 텍스트 데이터는 웹 사이트 주소(URL), 제목(title), 글 내용(description) 등을 포함한다.
데이터 처리부(122)는 데이터 추출부(120)를 통해 추출된 텍스트 데이터를 글 작성 시간에 따라 분류한다. 그리고, 시간 단위로 분류된 텍스트 데이터를 단어들로 구분하여 단어 벡터들을 생성한다. 이어서, 생성된 단어 벡터들을 워드 그래프에 투영시킨다. 이에 대한 실시 예는 도 5를 참조로 하여 후술한다.
일 실시 예에 따른 데이터 처리부(122)는 텍스트 데이터 내 모든 단어들을 대상으로 단어 벡터를 생성하는 것이 아니라, 사용자의 심리 상태를 파악할 수 있는 단어들만을 단어 벡터로 생성하고 그 주변어는 제거한다. 예를 들어, a, the와 같은 조사나 웹 페이지의 웹 사이트 주소(URL) 등은 기능어로서 제외된다. 또한 데이터 처리부(122)는 사용자의 심리 상태 간 경계에 있는 경계어들도 제외한다. 예를 들어, 사용자의 성격 타입 간의 경계에 있는 단어의 경우 어느 특정 성격 타입에 포함된다고 단정할 수 없으므로 제외된다.
일 실시 예에 따른 데이터 처리부(122)는 의미 있는 단어들 중에서 특정 단어에 가중치를 부여한다. 예를 들어, 사용자의 최근 심리를 알고 싶은 경우, 사용자가 최근에 작성한 글에 포함된 단어 벡터들에 가중치를 부여한다. 또는 글 내 단어의 위치에 따라 가중치를 부여할 수 있는데, 제목에 해당하는 단어 벡터에 가중치를 부여할 수 있다. 또 다른 예로 글 내 단어의 사용 빈도에 따라 가중치를 부여할 수 있는데, 특정 단어가 자주 사용되었다면 해당 단어 벡터에 가중치를 부여할 수 있다.
데이터 분석부(124)는 워드 그래프에 투영된 단어들의 분포를 분석하여 글에 반영된 사용자의 심리 상태를 판단한다. 예를 들어, 데이터 분석부(124)는 성격 타입 별로 분류된 워드 그래프들 중에서 특정 성격 타입에 해당하는 워드 그래프 내에 단어들이 집중적으로 분포되어 있다면 사용자가 이에 해당되는 성격 타입을 가진 것으로 판단한다. 그러나, 단어들의 분포를 분석하는 방법은 이에 한정되지 않고 그 기준이 무엇이냐에 따라 다양하게 변형 가능하다.
데이터 분석부(124)는 심리 상태 정보가 무엇인지에 따라 서로 상이한 워드 그래프를 이용한다. 예를 들어, 심리 상태 정보가 성격 타입인 경우, 데이터 분석부(124)는 성격 타입에 따라 분류된 워드 그래프 내에서 단어들의 분포로부터 사용자의 성격 타입을 판단한다. 다른 예로, 심리 상태 정보가 정서 상태인 경우, 데이터 분석부(124)는 정서 상태에 따라 분류된 워드 그래프 내에서 단어들의 분포로부터 사용자의 정서 상태를 판단한다. 또 다른 예로, 심리 상태 정보가 관심사인 경우, 데이터 분석부(124)는 관심사에 따라 분류된 워드 그래프 내에서 단어들의 분포로부터 사용자의 관심사를 판단한다.
심리 상태 판단에 대한 이해를 돕기 위해, 사용자의 성격 타입 판단 실시 예를 설명하면, 성격 타입은 정신적 에너지의 방향성을 나타내는 외향-내향(E-I) 지표, 정보 수집을 포함한 인식의 기능을 나타내는 감각-직관(S-N) 지표, 수집한 정보를 토대로 합리적으로 판단하고 결정하는 사고-감정(T-F) 지표, 인식 기능과 판단 기능이 실생활에서 드러난 생활 양식을 보여 주는 판단-인식(J-P) 지표일 수 있다. 이 8가지 선호 지표가 조합된 양식을 통해 사용자의 성격을 파악할 수 있다.
구체적으로, 외향성(extraversion)과 내향성(introversion) 지표는 심리적 에너지와 관심의 방향이 자신의 내부와 외부 중 주로 어느 쪽으로 향하느냐를 보여 주는 지표이다. 감각형(sensing)과 직관형(intuition) 지표는 사람이나 사물 등의 대상을 인식하고 지각하는 방식에서 감각과 직관 중 어느 쪽을 주로 더 사용하는지에 관한 지표이다. 사고형(thinking)과 감정형(feeling) 지표는 수집한 정보를 바탕으로 판단하고 결정을 내릴 때 사고와 감정 중 어떤 것을 더 선호하는지 알려 준다. 판단형(judging)과 인식형(perceiving) 지표는 인식 기능과 판단 기능을 바탕으로 실생활에 대처하는 방식에 있어 판단과 인식 중 어느 쪽을 주로 선호하는지에 관한 경향성을 나타내는 지표이다.
전술한 8가지 분류 기준에 따른 결과에 의해 사용자의 성격을 MBTI(Myers-Briggs Type Indicator) 또는 융의 성격 타입(Jung Personality Type)에서 사용하는 16가지 성격 유형(ISTJ, ISFJ, INFJ, INTJ. ISTP, ISFP, INFP, INTP, ESTP, ESFP, ENFP, ENTP, ESTJ, ESFJ, ENFJ, ENTJ) 중 하나로 분류할 수 있다. 이 16가지 성격 유형에서 인식 기능(S 혹은 N)과 판단 기능(T 혹은 F) 가운데 가장 선호하는 기능을 주 기능이라고 일컬으며, 주 기능을 보조하는 기능을 부 기능이라고 지칭한다. 예를 들어, 주 기능이 사고형(T)이면, 부 기능은 자연히 인식 기능(S 혹은 N) 가운데 하나가 된다. 즉, 16가지 성격 유형 각각에서 서로 다른 주 기능과 부 기능을 가지며, 이는 다시 정신적 에너지의 방향성이 내향이냐 외향이냐에 따라 분화되어 각기 다른 특성을 띠게 된다.
도 5는 본 발명의 일 실시 예에 따른 데이터 분석 예를 도시한 것으로, 세부적으로 단어 벡터가 워드 그래프에 투영되는 예를 도시한 참조도이다.
도 5를 참조하면, 정보 제공 장치는 시간 구간(period) 내 사용자가 작성한 글들(Text 1,…,Text n-1,Text n)(500)을 대상으로 단어들로 구분하여 단어 벡터들(510)을 생성하고, 생성된 단어 벡터들(510)을 워드 그래프(520)에 투영시킨다. 이때, 정보 제공 장치는 워드 그래프(520) 내에 투영된 단어들의 분포를 분석하여 글에 반영된 사용자의 심리 상태를 판단한다. 예를 들어, 사용자가 자주 사용하는 단어가 워드 그래프 2(530)에 집중적으로 분포되어 있다면, 사용자가 워드 그래프 2(530)의 핵심어(key word 2)에 해당하는 심리 상태 특성을 가진 것으로 판단한다. 그러나, 전술한 예는 본 발명의 이해를 돕기 위한 일 실시 예일 뿐 이에 한정되지는 않는다.
도 6 내지 도 8은 본 발명의 다양한 실시 예에 따라 시간 정보와 연관 지어 제공되는 심리 상태 결과 그래프들을 도시한 참조도이다.
세부적으로, 도 6은 시간(t) 흐름에 따라 글에 반영된 사용자의 심리 상태를 점수화(score)한 그래프이다.
도 6에 도시된 바와 같이 사용자의 성격 타입 결과가 추출되었다고 가정하면, 사용자는 성격 타입 A(600)의 특성은 시간의 흐름에 상관없이 항상 높게 나타나고, 성격 타입 B(610)와 성격 타입 C(620)의 특성은 서로 상반되어 나타남을 확인할 수 있다. 예를 들어, 시간 t2에서 성격 타입 C(620)의 특성이 성격 타입 B(610)의 특성보다 더 강하게 나타났으나, 시간 t2를 제외한 시간에서는 성격 타입 B(610)의 특성이 성격 타입 C(620)의 특성보다 더 강하게 나타나고 있음을 확인할 수 있다. 나아가, 시간 t2에서 사용자에게 평소와는 다른 형태의 성격 타입 특성이 나타났음을 추론할 수도 있다.
도 7은 통계 정보 형태로 제공되는 사용자의 심리 상태 판단 결과를 도시한 그래프이다.
도 7을 참조하면, 성격 타입 D를 대상으로 성격 타입 D의 특성이 나타나는 정도를 최근(recently)(700), 사용자 평균(Your Avg.)(710), 전체 평균(World Avg.)(720) 형태로 제공할 수 있다. 사용자는 체계적인 통계 정보를 이용하여 자아를 더 잘 알 수 있다.
도 8은 시간 구간에서의 사용자의 심리 상태를 점수화한 그래프이다.
도 8을 참조하면, 시간 구간, 예를 들어 Period 1 구간에서, 각 성격 타입 별 점수를 표시할 수 있다. 도 8에 도시된 바와 같이 사용자의 심리 상태를 방사형 형태로 표시할 수 있으나, 서식은 이에 한정되지 않는다. 예를 들어, 막대형, 꺾은 선형, 원형, 영역형, 분산형, 주식형, 표면형, 도넛형, 거품형 등 다양하게 변형하여 표시할 수 있다.
도 9는 본 발명의 일 실시 예에 따른 정보 제공 방법을 도시한 흐름도이다.
도 9를 참조하면, 정보 제공 장치는 사용자가 작성한 글들을 시간 단위로 정리한다(900). 그리고, 글에 포함된 단어들을 카테고리 별로 분류된 워드 그래프에 투영시켜 워드 그래프 내에 투영된 단어들의 분포를 분석(910)하여 글에 반영된 사용자의 심리 상태를 판단한다(920). 이어서, 사용자의 심리 상태 판단 결과를 글을 작성한 시간 정보와 연관 지어 제공한다(930). 워드 그래프는 핵심어 별로 미리 설정된 범위 내의 의미 거리를 가진 단어들끼리를 그룹화하여 분류한 자료이고, 의미 거리는 단어들 간의 의미의 유사성에 기초하여 이를 물리적인 거리로 나타낸다. 시간 단위는 년, 달, 요일 또는 시간을 포함한다.
글 분석 단계(910)에서, 일 실시 예에 따른 정보 제공 장치는 사용자의 서비스 사용에 따라 생성된 정보로부터 텍스트 데이터를 추출하고, 추출된 텍스트 데이터를 글 작성 시간에 따라 분류한다. 그리고, 시간 단위로 분류된 텍스트 데이터를 단어들로 구분하여 단어 벡터들을 생성하며 생성된 단어 벡터들을 워드 그래프에 투영시킨다. 이어서, 사용자의 심리 상태 판단 단계(920)에서, 워드 그래프에 투영된 단어들의 분포를 분석하여 글에 반영된 사용자의 심리 상태를 판단한다.
글 분석 단계(910)에서, 일 실시 예에 따른 정보 제공 장치는 글 작성 시간, 글 내 단어의 위치, 글 내 단어의 사용 빈도 중 적어도 하나에 가중치를 부여한 단어 벡터들을 생성한다. 그리고, 핵심어 간의 경계에 있는 경계어와 기능어를 포함하는 주변어는 제거할 수 있다.
사용자의 심리 상태 판단 단계(920)에서, 정보 제공 장치는 성격 타입에 따라 분류된 워드 그래프 내에서 단어들의 분포로부터 사용자의 성격 타입을 판단할 수 있다. 또는 정서 상태에 따라 분류된 워드 그래프 내에서 단어들의 분포로부터 사용자의 정서 상태를 판단할 수 있다. 또는 관심사에 따라 분류된 워드 그래프 내에서 단어들의 분포로부터 사용자의 관심사를 판단할 수 있다.
판단 결과를 시간 정보와 연관 지어 제공하는 단계(930)에서, 정보 제공 장치는 사용자의 심리 상태 판단 결과를, 시간 흐름에 따른 추이 변화 형태 또는 시간 구간 별 통계 정보 형태 중 적어도 하나의 형태로 제공할 수 있다.
나아가, 정보 제공 장치는 사용자의 심리 상태 판단 결과를 기초로 하여 가이드 정보, 사용자 맞춤형 추천 정보 및 광고 정보 중 적어도 하나를 포함하는 부가 서비스를 추가로 제공할 수 있다. 나아가, 정보 제공 장치는 글에 반영된 사용자의 심리 상태와 함께 워드 그래프를 이용하여 글의 어조를 분석하고 주제어를 추출하여 그 결과를 추가로 제공할 수 있다.
도 10은 본 발명의 일 실시 예에 따른 워드 그래프의 일부를 도시한 참조도이다.
도 10을 참조하면, 워드 그래프는 단어 간의 의미 네트워크로서, 의미 거리를 기반으로 의미 거리에 따라 워드 그래프에서 상대적으로 멀리 떨어져 배치되거나 서로 가까운 곳에 배치된다. 정보 제공 장치는 워드 그래프의 의미 관계 및 의미 거리를 식별하여 글에 반영된 사용자의 심리 상태를 파악하는 데 활용한다. 도 10에는 극히 일부의 워드 그래프를 도시하였지만, 워드 그래프는 수많은 단어들로 이루어진 방대한 사이즈의 지도 또는 그래프 형태일 수 있다.
이제까지 본 발명에 대하여 그 실시 예들을 중심으로 살펴보았다. 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시 예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.

Claims (11)

  1. 사용자가 작성한 글들을 시간 단위로 정리하고, 글에 포함된 단어들을 카테고리 별로 분류된 워드 그래프에 투영시켜 워드 그래프 내에 투영된 단어들의 분포를 분석하여 글에 반영된 사용자의 심리 상태를 판단하는 제어부; 및
    사용자의 심리 상태 판단 결과를 글 작성 시간 정보와 연관 지어 제공하는 출력부;
    를 포함하는 것을 특징으로 하는 정보 제공 장치.
  2. 제 1 항에 있어서, 상기 워드 그래프는
    핵심어 별로 미리 설정된 범위 내의 의미 거리를 가진 단어들끼리를 그룹화하여 분류한 자료이고,
    상기 의미 거리는 단어들 간의 의미의 유사성에 기초하여 이를 물리적인 거리로 나타내는 것을 특징으로 하는 정보 제공 장치.
  3. 제 1 항에 있어서, 상기 제어부는
    사용자의 서비스 사용에 따라 생성된 정보로부터 텍스트 데이터를 추출하는 데이터 추출부;
    추출된 텍스트 데이터를 글 작성 시간에 따라 분류하고 시간 단위로 분류된 텍스트 데이터를 단어들로 구분하여 단어 벡터들을 생성하며 생성된 단어 벡터들을 워드 그래프에 투영시키는 데이터 처리부; 및
    워드 그래프에 투영된 단어들의 분포를 분석하여 글에 반영된 사용자의 심리 상태를 판단하는 데이터 분석부;
    를 포함하는 것을 특징으로 하는 정보 제공 장치.
  4. 제 3 항에 있어서, 상기 데이터 분석부는
    성격 타입에 따라 분류된 워드 그래프 내에서 단어들의 분포로부터 사용자의 성격 타입을 판단하는 것을 특징으로 하는 정보 제공 장치.
  5. 제 3 항에 있어서, 상기 데이터 분석부는
    정서 상태에 따라 분류된 워드 그래프 내에서 단어들의 분포로부터 사용자의 정서 상태를 판단하는 것을 특징으로 하는 정보 제공 장치.
  6. 제 3 항에 있어서, 상기 데이터 분석부는
    관심사에 따라 분류된 워드 그래프 내에서 단어들의 분포로부터 사용자의 관심사를 판단하는 것을 특징으로 하는 정보 제공 장치.
  7. 제 3 항에 있어서, 상기 데이터 처리부는
    글 작성 시간, 글 내 단어의 위치, 글 내 단어의 사용 빈도 중 적어도 하나에 가중치를 부여한 단어 벡터들을 생성하고, 핵심어 간의 경계에 있는 경계어와 기능어를 포함하는 주변어는 제거하는 것을 특징으로 하는 정보 제공 장치.
  8. 제 1 항에 있어서,
    상기 시간 단위는 년, 달, 요일 또는 시간을 포함하는 것을 특징으로 하는 정보 제공 장치.
  9. 제 1 항에 있어서, 상기 출력부는
    사용자의 심리 상태 판단 결과를, 시간 흐름에 따른 추이 변화 형태 또는 시간 구간 별 통계 정보 형태 중 적어도 하나의 형태로 제공하는 것을 특징으로 하는 정보 제공 장치.
  10. 제 1 항에 있어서, 상기 제어부는
    글에 반영된 사용자의 심리 상태 판단 결과를 기초로 하여 가이드 정보, 사용자 맞춤형 추천 정보 및 광고 정보 중 적어도 하나를 포함하는 부가 서비스를 추가로 제공하는 것을 특징으로 하는 정보 제공 장치.
  11. 제 1 항에 있어서, 상기 제어부는
    글에 반영된 사용자의 심리 상태와 함께 워드 그래프를 이용하여 글의 어조를 분석하고 주제어를 추출하여 그 결과를 추가로 제공하는 것을 특징으로 하는 정보 제공 장치.
PCT/KR2016/004888 2015-05-19 2016-05-10 글에 반영된 사용자의 심리 상태 정보 제공 장치 및 그 방법 WO2016186362A1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2015-0069739 2015-05-19
KR1020150069739A KR101713258B1 (ko) 2015-05-19 2015-05-19 글에 반영된 사용자의 심리 상태 정보 제공 장치 및 그 방법

Publications (1)

Publication Number Publication Date
WO2016186362A1 true WO2016186362A1 (ko) 2016-11-24

Family

ID=57320553

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2016/004888 WO2016186362A1 (ko) 2015-05-19 2016-05-10 글에 반영된 사용자의 심리 상태 정보 제공 장치 및 그 방법

Country Status (2)

Country Link
KR (1) KR101713258B1 (ko)
WO (1) WO2016186362A1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111243710A (zh) * 2020-01-20 2020-06-05 话媒(广州)科技有限公司 一种基于交互的心理健康服务推荐方法及装置
US11049604B2 (en) 2018-09-26 2021-06-29 International Business Machines Corporation Cognitive monitoring of online user profiles to detect changes in online behavior

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101912554B1 (ko) * 2018-01-12 2018-10-26 강현숙 동화 창작 및 공유 시스템
KR102222637B1 (ko) * 2018-12-28 2021-03-03 경희대학교 산학협력단 감성 분석 장치, 이를 포함하는 대화형 에이전트 시스템, 감성 분석을 수행하기 위한 단말 장치 및 감성 분석 방법
KR102225603B1 (ko) * 2019-03-08 2021-03-08 연세대학교 산학협력단 심리 상담을 위한 감정 스코어링 장치 및 방법
KR102216768B1 (ko) * 2019-07-31 2021-02-17 주식회사 휴마트컴퍼니 심리상담 데이터를 이용한 텍스트 내 감정분석을 위한 시스템 및 방법
KR102485107B1 (ko) * 2020-01-07 2023-01-11 박가을 심리 상담 제공 시스템 및 방법
KR102215584B1 (ko) * 2020-03-23 2021-02-10 최선희 문장 분석을 통한 사용자 심리 분석 방법 및 이를 실행하는 서버
KR102590930B1 (ko) 2023-02-01 2023-10-19 박정민 사용자의 심리 상태를 결정하는 서비스 제공 장치, 시스템, 방법 및 프로그램

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002117027A (ja) * 2000-10-11 2002-04-19 Nippon Telegr & Teleph Corp <Ntt> 感情情報抽出方法および感情情報抽出プログラムの記録媒体
KR100935828B1 (ko) * 2007-10-02 2010-01-06 동국대학교 산학협력단 감정정보 추출 장치 및 방법
KR20110090354A (ko) * 2010-02-03 2011-08-10 고려대학교 산학협력단 사용자 관심 주제를 추출하는 휴대용 통신 단말기 및 그 방법
KR101286296B1 (ko) * 2012-11-29 2013-07-15 김건오 워드그래프 관리 방법 및 시스템
KR101315734B1 (ko) * 2011-12-27 2013-10-10 숭실대학교산학협력단 텍스트의 정서 단어 추출을 통한 정서 분석 장치 및 방법, 그리고 그 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 기록매체

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002117027A (ja) * 2000-10-11 2002-04-19 Nippon Telegr & Teleph Corp <Ntt> 感情情報抽出方法および感情情報抽出プログラムの記録媒体
KR100935828B1 (ko) * 2007-10-02 2010-01-06 동국대학교 산학협력단 감정정보 추출 장치 및 방법
KR20110090354A (ko) * 2010-02-03 2011-08-10 고려대학교 산학협력단 사용자 관심 주제를 추출하는 휴대용 통신 단말기 및 그 방법
KR101315734B1 (ko) * 2011-12-27 2013-10-10 숭실대학교산학협력단 텍스트의 정서 단어 추출을 통한 정서 분석 장치 및 방법, 그리고 그 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 기록매체
KR101286296B1 (ko) * 2012-11-29 2013-07-15 김건오 워드그래프 관리 방법 및 시스템

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11049604B2 (en) 2018-09-26 2021-06-29 International Business Machines Corporation Cognitive monitoring of online user profiles to detect changes in online behavior
CN111243710A (zh) * 2020-01-20 2020-06-05 话媒(广州)科技有限公司 一种基于交互的心理健康服务推荐方法及装置

Also Published As

Publication number Publication date
KR20160136054A (ko) 2016-11-29
KR101713258B1 (ko) 2017-03-09

Similar Documents

Publication Publication Date Title
WO2016186362A1 (ko) 글에 반영된 사용자의 심리 상태 정보 제공 장치 및 그 방법
Lee et al. Refugee or migrant crisis? Labels, perceived agency, and sentiment polarity in online discussions
KR102075788B1 (ko) 빅 데이터를 활용한 건강정보 콘텐츠 추천 서비스 시스템
Almond et al. Female sex offenders: An analysis of crime scene behaviors
US10002127B2 (en) Connecting people based on content and relational distance
Kalandar et al. What does the public think? Examining plastic surgery perceptions through the Twitterverse
Schuele et al. The importance of effect sizes in the interpretation of research: Primer on research: Part 3
Abdolrahmani et al. Should I trust it when I cannot see it? Credibility assessment for blind web users
Banerjee et al. Authentic versus fictitious online reviews: A textual analysis across luxury, budget, and mid-range hotels
WO2016186363A1 (ko) 성격 검사 장치 및 그 방법
Phan et al. Racial formations as data formations
Bakir et al. Introduction to Special Theme Veillance and transparency: A critical examination of mutual watching in the post-Snowden, Big Data era
WO2020111827A1 (ko) 프로필 자동생성서버 및 방법
Ricard et al. Deep learning for identification of alcohol-related content on social media (Reddit and Twitter): exploratory analysis of alcohol-related outcomes
KR20130089934A (ko) 이동 단말기의 사용자의 상황에 적합한 컨텐츠 추천 방법 및 이를 수행하는 컨텐츠 추천 시스템
Cambria et al. Bridging the gap between structured and unstructured healthcare data through semantics and sentics
JP2009211280A (ja) オンラインページ分析方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体
KR20140010679A (ko) 추천 시스템 및 추천 방법
WO2017179778A1 (ko) 빅데이터를 이용한 검색 방법 및 장치
Umari et al. Phubbing as a Result of the 4th Industrial Revolution: Is it Dangerous?
JP2015005130A (ja) 文書投稿装置、方法及びプログラム
Vus et al. The analysis of online communities as platforms for informational influences
Zilka et al. The digital literacy of students belonging to different sectors and studying on multicultural campuses
Karlsen et al. Experiences of the home-dwelling elderly in the use of telecare in home care services: A qualitative systematic review protocol
Golder et al. A chronological and geographical analysis of personal reports of COVID-19 on Twitter from the UK

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 16796689

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 16796689

Country of ref document: EP

Kind code of ref document: A1