FI122369B - Informationssystem - Google Patents

Informationssystem Download PDF

Info

Publication number
FI122369B
FI122369B FI20085421A FI20085421A FI122369B FI 122369 B FI122369 B FI 122369B FI 20085421 A FI20085421 A FI 20085421A FI 20085421 A FI20085421 A FI 20085421A FI 122369 B FI122369 B FI 122369B
Authority
FI
Finland
Prior art keywords
expression
expressions
hint
sentiment
tip
Prior art date
Application number
FI20085421A
Other languages
English (en)
Finnish (fi)
Other versions
FI20085421A (sv
FI20085421A0 (sv
Inventor
Juho Muhonen
Original Assignee
Whitevector Oy
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Whitevector Oy filed Critical Whitevector Oy
Priority to FI20085421A priority Critical patent/FI122369B/sv
Publication of FI20085421A0 publication Critical patent/FI20085421A0/sv
Publication of FI20085421A publication Critical patent/FI20085421A/sv
Application granted granted Critical
Publication of FI122369B publication Critical patent/FI122369B/sv

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/313Selection or weighting of terms for indexing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Claims (15)

1. Informationssystem som omfattar: en uttrycksavskiljare anordnad att motta en dataenhet och att av-skilja därifrän en mängd uttryck; 5 en tipsdatabas som är anordnad att spara ett eller flera tips, varvid tipset omfattar en antydning och ett antydningspolaritetsvärde, varvid antyd-ningen omfattar ett eller flera uttryck; en sentimentavskiljare anordnad att avskilja frän uttrycksmängden en kandidatuttrycksmängd som om-1 o fattar ett eller flera uttryck; jämföra kandidatuttrycksmängden med tipsdatabasens tips; i respons tili detektering av en träff mellan kandidatuttrycksmängden och tipset söka tipsets antydningspolaritetsvärde; använda antydningspolaritetsvärdet vid beräkning av ett polaritets-15 värde för en mälmängd av dataenhetens ett eller flera mäluttryck; ge sentimentposter, varvid posten omfattar mälmängden och polari-tetsvärdet som beräknats för mälmängden, kännetecknat av att tipset omfattar även en tipsspecifik antydningskontext omfattande ett eller flera uttryck; och 20 sentimentavskiljaren är anordnad att: bestämma ett omräde som omfattar kandidatuttrycksmängden och bestämda grannuttryck tili uttrycken i kandidatuttrycksmängden; jämföra uttrycken i det bestämda omrädet med tipsets antydningskontext; 25 besluta pa basis av jämförelsen om antydningspolaritetsvärdet ska användas vid beräkning av polaritetsvärdet för ett eller flera av dataenhetens il mäluttryck. o
2. Informationssystem enligt patentkrav 1, kännetecknat av o att i ^ 30 uttrycksavskiljaren är anordnad att bestämma uttryckets position i g dataenheten och att förmedla uttrycket tili sentimentavskiljaren som en term som omfattar uttrycket och en indikation om uttryckets position; sentimentavskiljaren är anordnad att använda indikationen om ut-<S tryckets position i sinä avskiljnings-, beräknings- och/eller bestämningsfunkt- ^ 35 ioner. 28
3. Informationssystem enligt patentkrav 1 eller 2, känneteck-n a t av att uttrycksavskiljaren är anordnad att bestämma uttryckets ordklass och att förmedla uttrycket till sentimentavskiljaren som en term som omfattar 5 uttrycket och en indikation om uttryckets ordklass; sentimentavskiljaren är anordnad att använda indikationen om uttryckets ordklass i sinä avskiljnings-, beräknings- och/eller bestämningsfunkt-ioner.
4. Informationssystem enligt nägot av patentkraven 1-3, kä η η βίο t e c k n a t av att antydningen och kandidatuttrycksmängden är en successiv mängd uttryck, och antydningen ytterligare omfattar ett glapphetsvärde som bestäm-mer tillätet antal oträffande uttryck mellan kandidatmängdens uttryck som träf-far ett uttryck i antydningen och kandidatmängdens nästa uttryck som träffar 15 nästa uttryck i antydningen.
5. Informationssystem enligt nägot av patentkraven 1-4, känne-t e c k n a t av att sentimentavskiljaren är anordnad att jämföra uttryck i det bestämda omradet med tipsets antydningskontext genom att använda en lik-hetsfunktion, varvid likhetsfunktionens bestämda resultat anknytertill en positiv 20 träff eller till en negativ träff.
6. Informationssystem enligt patentkrav 5, kännetecknat av att likhetsfunktionen är kosinuslikhet som erhalls frän f 1 , if Ci =0V(72 =0 /(Cl,C2)1 7¾¾¾ - oi/ie” väri C1 är antydningskontexten och C2 är kontexten bildad av uttrycken i det 25 bestämda omradet.
7. Informationssystem enligt patentkrav 5 eller 6, känneteck- c3 n a t av att i respons till resultatet av likhetsfunktionen som anknyter till en po- 0 sitiv träff är sentimentavskiljaren anordnad att bestämma ett omfäng för kandiko datsmängden, varvid omfänget omfattar en bestämd mängd uttryck som ank- x 30 nyter tili kandidatuttrycksmängden.
8. Informationssystem enligt patentkrav 7, kännetecknat av cvi att omfänget omfattar uttryck som tillhör samma sats som kandidatuttrycks- 1 man9den-
^ 9. Informationssystem enligt patentkrav 8, kännetecknat av 35 att sentimentavskiljaren är anordnad att 29 avskilja ätminstone ett mäluttryck frän omfanget; och använda avständet av maluttryckets position frän kandidatuttrycks-mängden vid beräkning av polaritetsvärdet för mäluttrycket.
10. Informationssystem enligt patentkrav 9, kännetecknat av 5 att sentimentavskiljaren är anordnad att kontrollera om omfanget innehaller ett negationsuttryck; och i respons tili detektering av ett negationsuttryck i omfanget att ju-stera maluttryckets polaritetsvärde enligt det detekterade negationsuttrycket.
11. Informationssystem enligt nägot av patentkraven 7-10, kän- 10 netecknat av att sentimentavskiljaren är anordnad att avskilja fran omfanget en tipskandidatmängd av ett eller flera uttryck.
12. Informationssystem enligt patentkrav 11,kännetecknat av att sentimentavskiljaren är anordnad att detektera frän omfanget en mängd av ett eller flera tipskontextuttryck och att anknyta tipskontextuttrycken tili tipskan- 15 didatmängden.
13. Informationssystem enligt patentkrav 12, kännetecknat av att sentimentavskiljaren är anordnad att beräkna ett polaritetsvärde för tips-kandidatmängden och att spara tipskandidatmängden, tipskontextuttrycken och polaritetsvärdet som ett tips i tipsdatabasen, varvid tipskandidatmängden 20 används som basis för tipsets antydning, tipskontextuttryckens antydningskon-text och de beräknade polaritetsvärdenas antydningspolaritet.
14. Förfarande som omfattar: ett informationssystem opereras; en dataenhet mottas och en mängd uttryck avskiljs därifran; 25 ett eller flera tips sparas, varvid tipset omfattar en antydning och ett antydningspolaritetsvärde, varvid antydningen omfattar ett eller flera uttryck; frän flera uttryck avskiljs en kandidatuttrycksmängd omfattande ett ° eller flera uttryck; ^ kandidatuttrycksmängden jämförs med tipsdatabasens tips; i cd 30 i respons tili detektering av en träff mellan kandidatuttrycksmängden x och tipset söks tipsets antydningspolaritetsvärde; cc antydningspolaritetsvärdet används vid beräkning av ett polaritets- ^ värde för en mälmängd av dataenhetens ett eller flera mäluttryck; 0 g sentimentposter ges, varvid posten omfattar malmängden och pola- o 35 ritetsvärdet som beräknats för mälmängden, kännetecknat av att 30 en tipsspecifik antydningskontext omfattande ett eller flera uttryck inkluderas i tipset; och ett omrade bestäms som omfattar en kandidatuttrycksmängd och bestämda grannuttryck tili uttrycken i kandidatuttrycksmängden; 5 uttrycken i det bestämda omradet jämförs med tipsets antydnings kontext; pä basis av jämförelsen besluts om antydningspolaritetsvärdet ska användas vid beräkning av polaritetsvärdet för ett eller flera av dataenhetens maluttryck.
15. Datorprogramprodukt, som är läsbar pä en dator och som kodar ett datorprogram innehällande instruktioner för att utföra en datorprocess för styrning av funktioner i ett informationssystem, kännetecknad av att processen omfattar: ett informationssystem opereras; 15 en dataenhet mottas och en mängd uttryck avskiljs därifrän; ett eller flera tips sparas, varvid tipset omfattar en antydning och ett antydningspolaritetsvärde, varvid antydningen omfattar ett eller flera uttryck; frän flera uttryck avskiljs en kandidatuttrycksmängd omfattande ett eller flera uttryck; 20 kandidatuttrycksmängden jämförs med tipsdatabasens tips; i respons tili detektering av en träff mellan kandidatuttrycksmängden och tipset söks tipsets antydningspolaritetsvärde; antydningspolaritetsvärdet används vid beräkning av ett polaritets-värde för en malmängd av dataenhetens ett eller flera maluttryck; 25 sentimentposter ges, varvid posten omfattar mälmängden och pola ritetsvärdet som beräknats för mälmängden, kännetecknad av att -r- en tipsspecifik antydningskontext omfattande ett eller flera uttryck ^ inkluderas i tipset; och £ ett omrade bestäms som omfattar en kandidatuttrycksmängd och ci 30 bestämda grannuttryck tili uttrycken i kandidatuttrycksmängden; C\l x uttrycken i det bestämda omrädet jämförs med tipsets antydnings- ^ kontext; pä basis av jämförelsen besluts om antydningspolaritetsvärdet ska M" g användas vid beräkning av polaritetsvärdet för ett eller flera av dataenhetens o 35 mäluttryck.
FI20085421A 2008-05-07 2008-05-07 Informationssystem FI122369B (sv)

Priority Applications (1)

Application Number Priority Date Filing Date Title
FI20085421A FI122369B (sv) 2008-05-07 2008-05-07 Informationssystem

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FI20085421 2008-05-07
FI20085421A FI122369B (sv) 2008-05-07 2008-05-07 Informationssystem

Publications (3)

Publication Number Publication Date
FI20085421A0 FI20085421A0 (sv) 2008-05-07
FI20085421A FI20085421A (sv) 2009-11-08
FI122369B true FI122369B (sv) 2011-12-30

Family

ID=39523076

Family Applications (1)

Application Number Title Priority Date Filing Date
FI20085421A FI122369B (sv) 2008-05-07 2008-05-07 Informationssystem

Country Status (1)

Country Link
FI (1) FI122369B (sv)

Also Published As

Publication number Publication date
FI20085421A (sv) 2009-11-08
FI20085421A0 (sv) 2008-05-07

Similar Documents

Publication Publication Date Title
US11514235B2 (en) Information extraction from open-ended schema-less tables
WO2015185019A1 (zh) 一种基于语义理解的表情输入方法和装置
Ek et al. Named entity recognition for short text messages
CN104573099B (zh) 题目的搜索方法及装置
Phandi et al. SemEval-2018 task 8: Semantic extraction from CybersecUrity REports using natural language processing (SecureNLP)
Jiang et al. Factoring fact-checks: Structured information extraction from fact-checking articles
JP2010181993A (ja) 絵文字を含む文章ファイルを評価する評価分析サーバ、方法及びプログラム
Murray et al. Interpretation and transformation for abstracting conversations
Oramas et al. ELMD: An automatically generated entity linking gold standard dataset in the music domain
Abdallah et al. Multi-domain evaluation framework for named entity recognition tools
González et al. Siamese hierarchical attention networks for extractive summarization
Algur et al. Sentiment analysis by identifying the speaker's polarity in Twitter data
Reshadat et al. A new open information extraction system using sentence difficulty estimation
US9639524B2 (en) Linguistic based determination of text creation date
Serigos Applying corpus and computational methods to loanword research: new approaches to Anglicisms in Spanish
Tran et al. Semi-supervised approach based on co-occurrence coefficient for named entity recognition on twitter
Chopra et al. Named entity recognition in Punjabi using hidden Markov model
CN110008314B (zh) 一种意图解析方法及装置
Dadoun et al. Sentiment Classification Techniques Applied to Swedish Tweets Investigating the Effects of translation on Sentiments from Swedish into English
Oudah et al. Person name recognition using the hybrid approach
Ezhilarasi et al. Designing the neural model for POS tag classification and prediction of words from ancient stone inscription script
Fenogenova et al. A general method applicable to the search for anglicisms in russian social network texts
FI122369B (sv) Informationssystem
García-Pablos et al. OpeNER: open tools to perform natural language processing on accommodation reviews
Lek et al. Sentix: An aspect and domain sensitive sentiment lexicon

Legal Events

Date Code Title Description
FG Patent granted

Ref document number: 122369

Country of ref document: FI

MM Patent lapsed