TR2024000874A2 - Bi̇r veri̇ görselleşti̇rme si̇stemi̇ - Google Patents

Bi̇r veri̇ görselleşti̇rme si̇stemi̇

Info

Publication number
TR2024000874A2
TR2024000874A2 TR2024/000874 TR2024000874A2 TR 2024000874 A2 TR2024000874 A2 TR 2024000874A2 TR 2024/000874 TR2024/000874 TR 2024/000874 TR 2024000874 A2 TR2024000874 A2 TR 2024000874A2
Authority
TR
Turkey
Prior art keywords
data
module
model
training
performs
Prior art date
Application number
TR2024/000874
Other languages
English (en)
Inventor
Karabacak Abdulkadi̇r
Original Assignee
İş Zekasi Yazilim Danişmanlik Hi̇zmetleri̇ Ti̇caret Anoni̇m Şi̇rketi̇
Filing date
Publication date
Application filed by İş Zekasi Yazilim Danişmanlik Hi̇zmetleri̇ Ti̇caret Anoni̇m Şi̇rketi̇ filed Critical İş Zekasi Yazilim Danişmanlik Hi̇zmetleri̇ Ti̇caret Anoni̇m Şi̇rketi̇
Publication of TR2024000874A2 publication Critical patent/TR2024000874A2/tr

Links

Abstract

Bu buluş, yazılım tabanlı raporlama aracı uygulaması şekilnde çalışan ve çalışıp veri görselleştirme alanında zaman serisi analizi yapan bir veri görselleştirme sistemi (1) ile ilgilidir. Sistem (1); özellikle Telekomünikasyon, Finans, Sigortacılık, Sağlık ve bunun gibi yoğun veri ile çalışılan tüm sektörlerde veri değişimine duyarlı olan kritik noktalar üzerinde karşılaştırma yapmak, karar almak veya herhangi bir noktada müdahale etmek gibi birçok iş yükünü ve zamandan tasarruf ettirebilme işlevselliği ile kullanılabilmektedir.

Description

TARIFNAME BIR VERI GÖRSELLESTIRME SISTEMI Teknik Alan Bu bulus, yazilim tabanli raporlama araci uygulamasi sekilnde çalisan ve çalisip veri görsellestirme alaninda zaman serisi analizi yapan bir veri görsellestirme sistemi ile Teknigin Bilinen Durumu Zaman serisi analizi, belirli bir zaman periyodu içinde toplanan verilerin incelenmesi ve anlasilmasi için kullanilan istatistiksel bir yöntemdir. Bu analiz, genellikle zaman içindeki degisimleri, düzenIiIikIeri ve egilimleri anlamak amaciyla uygulanir. Zaman serisi verileri, genellikle esit araliklarla ölçülen ölçümlerden olusur, örnegin saatlik, günlük, aylik veya yiIIik veriler üzerinde kullanicilara analiz yapma firsati sunar. Bu dogrultuda zaman serisi analizi, birçok endüstride kullanabilir ve uygulanabilir.
Teknolojinin veri görsellestirmeye dogrudan katkisi olup, özellikle son birkaç yildir bu yönde önemli gelismeler yasanmaktadir. Birçok veri görsellestirme teknigi zamanla interaktif hale gelmis, açik programlama ara yüzleri ve interaktif web tabanli görsellestirme araci kitlerinin yayginlasmasiyla üretimi kolaylasmistir. Ayrica web tabanli baglanti teknolojisi sayesinde, verilere dogrudan uIasiIarak, görseller verideki degisime es zamanli adapte ediIebiImektedir. Bu görsellestirme örneklerine, özellikle is analizlerinde, hükümetlerin açik veri sistemlerinde ve medya infografiklerinde rastlanmaktadir (Fox & HendIer, 2011, s. 706).
Mecut tekniklerde kullanilan çogu görsellestirme araci biIdirimseIdir; bu, kullanicinin çiziIecek sütunIari veya dizileri tanimlamasi gerektigi anlamina gelir. Yani, programlama dili hakkinda kullanici bilgisi ve veri kümesi hakkinda önceden bilgi sahibi olmayi gerektirir. Birçok bilim insani programlamayi ögrenmeyi, kullanmayi veya baskalarina aktarmayi hantal bulmaktadir. Ayrica zamana göre veriler üzerinde davranis egilimlerinin incelenmesi de geleneksel veri görsellestirme araçlarinda bulunmamaktadir. Geleneksel veri görsellestirme araci kullanimi esnasinda kullanicilar her bir grafigi bildirmek zorunda kalmadan veri kümelerinden birçok iliskiyi hizli bir sekilde çizmek isterler. Sisense, JMP, Biovia's Pipeline Pilot gibi ticari yazilimlar veri görsellestirme için araçlar saglar, ancak ayni zamanda lisansli yazilim gerektirir ve/veya tamamen etkilesimli grafiklere sahip degildirler. Bu nedenle, etkilesimli görsellestirmeler olusturmak için yaygin olarak erisilebilir, kullanimi ve olusturmasi kolay bir platforma ihtiyaç oldugu görülmektedir.
Teknigin bilinen durumunda numarali yer alan TR 2020/18085 numarali patent basvuru dokümaninda, veri görsellestirme islemindeki metin (text) alanlarinin ve tüm nokta bazli bilgilerin saptanip indekslenmesi ve söz konusu indeksler üzerinde anahtar kelimeler ile gerçeklestirilen arastirma sonrasi gösterge panolarindaki anormal degerlerin ve/veya durumlarin tespit edilmesini saglayan bir sistem açiklanmaktadir. Ilgili basvuru dokümanindan açiklanan sistem; iliskisel veri tabani üzerinde tanimlayici istatistiksel veri analizi ile veri kalitesi kontrolü saglayan, veri profilleme ve derin ögrenme modelini kullanarak verilerin görsellestirilmesini saglayan bir yapi sunmamaktadir.
Sonuç olarak, yukarida anlatilan ihtiyaçlari karsilayacak çözümlerin konu hakkindaki yetersizligi nedeniyle ilgili teknik alanda bir gelistirme yapilmasi gerekli kilinmistir.
Bulusun Kisa açiklamasi Bulus, mevcut durumlardan esinlenerek olusturulup yukarida belirtilen olumsuzluklari çözmeyi amaçlamaktadir.
Bu bulusun amaci, yazilim tabanli raporlama araci uygulamasi sekilnde çalisan ve çalisip veri görsellestirme alaninda zaman serisi analizi yapan bir veri görsellestirme sisteminin ortaya koyulmasidir.
Sistem; özellikle Telekomünikasyon, Finans, Sigortacilik, Saglik ve bunun gibi yogun veri ile çalisilan tüm sektörlerde veri degisimine duyarli olan kritik noktalar üzerinde karsilastirma yapmak, karar almak veya herhangi bir noktada müdahale etmek gibi birçok is yükünü ve zamandan tasarruf ettirebilme islevselligi ile kullanilabilmektedir.
Bulusun yapisal ve karakteristik özellikleri ve tüm avantajlari asagida verilen sekil ve bu sekle atiflar yapilmak suretiyle yazilan detayli açiklama sayesinde daha net olarak anlasilacaktir ve bu nedenle degerlendirmenin de bu sekil ve detayli açiklama göz önüne alinarak yapilmasi gerekmektedir.
Bulusun Anlasilmasina Yardimci Olacak Sekiller Sekil 1, bulusa konu olan sistemin sematik gösterimdir.
Parça Referanslarinin Açiklamasi 1. Sistem 2. Olusturma modülü 3. Dönüstürme modülü 4. Ayirma modülü . Egitme modüIü 6. Dogrulama modüIü 7. Test etme modülü 8. Degerlendirme modülü 9. Ayrik dalgacik dönüsüm islemleri modüIü . Sirali otoenkoder islemleri modülü 11. Uzun kisa süreli bellek islemleri modülü 12. Çapraz dogrulama modüIü 13. Hata orani ölçüm modüIü Bulusun Detayli Açiklamasi Bu detayli açiklamada, bulusa konu olan sistemin (1) tercih edilen yapilanmalari, sadece konunun daha iyi anlasilmasina yönelik olarak açiklanmaktadir.
Bu bulus, yazilim tabanli raporlama araci uygulamasi sekilnde çalisan ve çalisip veri görsellestirme alaninda zaman serisi analizi yapan bir veri görsellestirme sistemi (1) ile Sistemin (1) çalistigi yazilim tabanli uygulama; E-ticaret, finans, telekomünikasyon ve bunun gibi endüstriIerde üretilmekte olan büyük veri kümelerinin önemini daha iyi ifade edebilmek ve veriler içerisindeki gizli desenleri ortaya çikararak anlamlandirabilmek için makine ögrenimi teknikleri, derin ögrenme teknolojileri ve görsel ögelerin yardimi ile (grafikler, çizgiler, haritalar, tablolar vb.) birlikte büyük veri görsellestirmeyi hedeflemektedir. Sistem (1); kullanicilar ve karar vericilerin özellikle bilgisayar bilimlerinde geçmisi olmayanlarin, yapay zekâ destekli öngörü teknolojisi ile gelistirilecek etkilesimli-interaktif görsellestirme ile birlikte analitik verileri hizli ve etkili bir sekilde kavramasini saglamaktadir. Sistemde (1); projede farkli veri kümeleri üzerindeki degerli verilerin çikarilmasi esnasinda es zamanli olarak veri kalitesinin ortaya konulabilmesi, veri kalitesi iyilestirme önerileri yapilabilmesi ve veri profillemesi için tanimlayici istatistiksel metriklerin kolayca verilere uygulamasini saglayacak bir yapinin gelistirilmesi hedeflenmektedir.
Sistem (1), yapay zekâ teknolojilerini (makine ögrenmesi algoritmalari, derin ögrenme algoritmalari) kullanarak, farkli veri analizi görevleri gerçeklestirebilmektedir. Bu amaçla, sistemin (1) sahip oldugu yazilim kapsaminda bir ögrenme mekanizmasi bulunmaktadir.
Bu veri analiz görevlerinden bir tanesi, iliskisel veri tabanlari üzerinde yer alabilen, zaman serisi verileri üzerinde, ileriye yönelik kestirim yaparak, zaman serisi verilerinin görsellestirilmesini saglamaktir. Veri analizi görevlerinden bir digeri ise veri gruplandirmanin gerçeklestirilmesidir. Sistem (1) burada, iliskisel veri tabaninda yer alan veriler üzerinde, farkli gözetimsiz makine ögrenmesi algoritmalari kullanilarak, verilerin gruplandirilmasi ve görsellestirilmesi üzerinde çalisilmaktadir. Bu kapsamda sistem (1), veri ön isleme, öznitelik seçimi, kümeleme analizi algoritmalarinin uygulanmasi, segmentasyon sonuçlarinin kalitesinin belirlenmesi gibi islemleri gerçeklestirmektedir.
Ayrica bu islemler ile birlikte davranissal veri analitigi, kesifsel analiz (exploratory data analysis) uygulamalari, anomali tespiti algoritmalari ve uygulamalari gibi kestirimci (predictive) analiz algoritmalarinin ve uygulamalarinin gelistirilmesi de sistemin (1) kapsamindadir. Sistemde (1) gerçeklestirilen tahmine dayali istatiksel veri analizi, geçmis verilere dayali olarak gelecekteki sonuçlarin ve egilimlerin olasiligini tahmin etmek için Büyük Veri, Istatistiksel Algoritmalar ve Makine Ögrenme (ML - Machine Learning) tekniklerinden elde edilen bir veri madenciliginden yararlanmaktadir. Yani, tahmine dayali analiz, verilerdeki sorunlari ortaya çikarmaya ve firsatlari belirlemeye yardimci olabilecek kaliplari kesfetmeye yardimci olmaktadir.
Sistem (1); ileriye dönük zaman verileri üzerinde kestirim yapmak için LSTM tabanli derin ögrenme algoritmalarini kullanmaktadir. Sistemde (1) LSTM tabanli derin ögrenme teknolojisini kullanilmakta ve zaman damgali veriler üzerinde davranis/trend egilimi ögrenilebilmektedir.
Büyük miktarda veriye uygulanan veri madenciligi teknikleri, örüntüleri belirleme ve yeni bilgiler üretme yoluyla yapilan büyük veri analizidir. Sistemde (1) büyük veri analizi yöntemi kullanimi sayesinde, kullanicilar teknik bilgiye ihtiyaç duymadan veriler üzerinde çalisabilmektedir. Sistemde (1) platform gelistirmelerinde tahmine dayali istatiksel veri analizi yapilabilmesi için istatistiksel algoritmalar ve makine ögrenmesi tekniklerinden veri madenciligi kullanilmaktadir. Sistemde (1) model egitimi sonrasinda kullanicilarin veri analizi yapabilmesi adina gerekli testler yapilarak basarim orani en yüksek seviyeye getirilmektedir.
Sistemin (1) gerçeklestirdigi çalismalardan bir digeri; iliskisel veri tabani üzerinde gruplandirma yapmasidir. Bunun için sistem (1), kümeleme analizi algoritmalarini kullanmaktadir. Bu amaçla sistemde (1), iki temel kategoriden kümeleme analizi algoritmalari (k-means ve DBScan) kullanilmaktadir. Bu algoritmalarin basarili kümeleme analizi yapamama riski bir teknik zorluk içermektedir. Sistem (1), bu teknik zorlugu asmak için, kullanilan kümeleme analizi algoritmalarina alternatif Iiteratürdeki diger kümeleme analizi algoritmalarini kullanarak, veri seti üzerinde daha basarili gruplandirma yapmaya çalismaktadir. Sistemde (1) kümeleme analizi öncesi yapilan veri ön isleme çalismalari tekrar incelenerek verinin makine ögrenmesine hazir hale getirilmesi ve kalitesinin arttirilmasi saglanmaktadir. Sistemde (1) makine ögrenmesi ve derin ögrenme algoritmalari için Spark ML Kütüphanesi, Tensorflow üzerinde Keras kütüphanesi gibi açik kaynakli teknolojiler kullanilmaktadir. Bu teknolojiler üzerindeki makine ögrenmesi algoritmalarinin çalisma performansinin (çalisma zamani açisindan) istenen sonuçlari vermemesi bir teknik zorluktur. Sistem (1) bu zorlugu asmak için, kullanilan açik kaynakli teknolojilere alternatif olarak, üzerinde makine ögrenmesi ve derin ögrenme kütüphaneleri olan farkli kütüphaneleri kullanmaktadir. Bu açik kaynakli kütüphaneler sistemde (1) kullanilarak performans kisiti asilmaktadir.
Sekil 1*de sematik gösterimi sunulan sistem (1); verilerden kullanicinin talebine göre veri seti olusturup sisteme (1) dahil eden olusturma modülü (2), 0: olusturma modülünde (2) olusturulmus veri setlerini dalgacik dönüsümleri ile ön islemeye tabi tutan, gürültü azaltma teknigini kullanarak verileri istenilen formata dönüstüren ve verilerin sisteme (1) baglantisini saglayan dönüstürme modülü (3), sistem (1) kullanicilari tarafindan baglanti saglanarak veya manuel olarak sisteme (1) eklenecek oIan veri/veri setleri için ayirici görevini üstlenen, zaman degisimine göre tahminlenmesi istenen veriler üzerinde bölümleme yapilmasini saglayarak farkli veri segmentlerinin olusturulmasini saglayan, kullanicinin ihtiyacina uygun olacak formatlarda veri ayrimi yapan ayirma modülü (4), veri ayirici modülde (4) gelistirilen model sayesinde ayrimi yapilmis veriler üzerinde çalisan, her bir veri setinin ayristilarak segmentelerine ayrilmasini ve veri setleri ile ilgili ön bilginin tutulmasini, böylelikle verilerin pozisyonlandirilmasina katki saglayan “segmentasyon analizini”, veri seti içerisinde yer alan bagimli degisken ile bagimsiz degisken arasindaki dogrusal iliskiyi modellemeyi, model üzerinde hata oranini en aza indirgemek için çizgiler çizmeyi ve raporlamayi saglayan “regresyon analizini” ve veri ön isleme çalismalarinin dogrusal olmayan fonksiyonlar kullanimi ile elde edilmesini saglayan “kümeleme analizini” gerçeklestiren ve bu analizler sayesinde verilerin egitimesini saglayan egitme modülü (5), veri ayirici modülde (4) gelistirilen model sayesinde ayrimi yapilmis veriler üzerinde çalisan, veri egitimi modülünde (5) egitilen modelin ürettigi sonuçlarin dogrulanmasini gerçeklestiren, veri profiIIeme islemini gerçeklestirerek bir veri kümesini anlayan ve tanimlayan, veri kümesinde bulunan özellikleri, desenleri, eksik degerleri ve diger istatistiksel özeIIikIeri belirleyen dogrulama modülü (6), veri ayirici modülde (4) gelistirilen model sayesinde ayrimi yapilmis veriler üzerinde çalisan, veri setinin boyutunu, özelliklerini, dagiIimIarini ve temel istatistiksel biIgiIeri edilmesini saglayan test etme modülü (7), dogrulama modülünde (6), dogrulanmasi gerçeklestirilmis oIan veriler üzerinde çalisan, veri ayirici modülde (4) gelistirilen modelin egitim seti disinda bulunan veriler üzerinde ne kadar iyi performans gösterdiginin kontrollerini gerçeklestiren degerlendirme modülü (8), egitme modülü (5), dogrulama modülü (6), test etme modülü (7) ve degerlendirme modülünde (8) egitimi, dogrulanmasi, testi ve degerlendirmesi gerçeklestirilmis veriler üzerinde ayrik dalgacik dönüsümü (DWT - Discrete WaveIet Transform) islemini gerçeklestiren, sinyal isleme, görüntü isleme veya veri sikistirma matematiksel islemlerini yaprak verileri kullanima uygun formatlara dönüstüren, verileri ölçek bakimindan anaIize tabi tutan, sisteme (1) girdi olarak kullanilan veriler arasindaki farkIiIar için yüksek ve düsük frekans ayriminin yapilmasini ve sistem (1) performans ölçütü için ayarlamalarin yapilmasini saglayan, ayrik dalgacik dönüsümünün ölçekleme ve dalgacik fonksiyonundan faydalanarak veriler arasindaki ayrisimi net sekilde ortaya koyan ayrik dalgacik dönüsüm islemleri modülü (9), ayrik dalgacik dönüsüm islemleri modülünde (9) dalgacik dönüsüm islemleri gerçeklestirilmis veriler üzerinde çalisan, yapay sinir aglari otokodlayici türevi olan yigilmis otomatik kodlayicilari (SA - Stacked Autoencoders) kullanan ve bu sayede zaman serisi analizi yöntemi ile verilerin beIirIi periyodlarda incelenebilmesini saglayan sirali otoenkoder islemleri modülü (10), sirali otoenkoder islemleri modülünde (10) derin ögrenime sunulmus veriler üzerinde çalisan, uzun kisa süreli bellek (LSTM - Long-Short Term Memory) algirtmasini ve LSTM algoritma bilesenlerinden tekrarlayan hafizayi kullanan, bu sayede uzun kisa süreli bellek mekanizmasini isleten ve zaman içerisinde degisen verilerin ögrenilmesini saglayan, girdi verisi ile çikti verisi arasindaki farki hesaplayan ve kullanici raporlarinda bu farka yer veren, bu sayede karar destek özelligi ile kullaniciya kolaylik saglayarak kullanicinin girdi verisi ile çikti verisi arasindaki degisimi görmesini saglayan uzun kisa süreli bellek islemleri modülü (11), saglayan egitme modülü (5), dogrulama modülü (6), test etme modülü (7), degerlendirme modülü (8), ayrik dalgacik dönüsüm islemleri modülü (9) ve uzun kisa süreli bellek islemleri modülünden (11) sonuç verilerini alan, modelin performansini degerlendirmek ve genelleme yetenegini kontrol etmek için kullanilan, egitimi, dogrulanmasi, test edilmesi tamamlanmis tüm veriler için geriye yönelik çapraz dogrulama testlerini gerçeklestiren ve bu testleri kullaniciya sunarak kullanicinin model egitimlerinin yeniden test edilip edilmemesine yönelik karar vermesini saglayan çapraz dogrulama modülü (12), çapraz dogrulama modülünden (12) gerçek degerleri ve tahmin yapilan degerleri alan, bu degerler arasindaki farklari degerlendirerek hata orani öIçümIemesini yapan hata orani ölçüm modülü (13) ve çapraz dogrulama modülü (12) ve hata orani ölçüm modülünden (13) iletilen veriler üzerinde zaman serisi analizini gerçeklestiren, zaman serisi analizi sayesinde sisteme (1) aktarilan veri setlerinin grafiksel olarak incelenebilmesine olanak saglayan, kullaniciya gösterdigi grafiksel analiz vasitasiyla verideki degisimleri, egilimleri ve belirli periyodlar arasindaki varyasyonlari kullanicinin tercihine sunan veri görsellestirme modülü (14) içermektedir.
Sistemde (1) sirasiyla; ..o veri tabani baglantisinin kurulmasi, 0: veri ön islemenin yapilmasi, 0: dönüstürülmüs veri setlerinin hazirlanmasi, 0: veri ayirma islemlerinin yapilmasi, 0: veri egitimin yapilmasi, 0: verilerin dogrulanmasi, 0: verilerin test edilmesi, 0: dalgacik dönüsüm islemlerinin gerçeklestirilmesi, 0: sirali otoenkoder dönüsümlerinin gerçeklestirilmesi, 0: uzun kisa süreli bellek dönüsüm islemlerinin gerçeklestirilmesi, v geriye yönelik çapraz dogrulama testlerinin gerçeklestirilmesi, ..o hata oraninin hesaplanmasi, 0: gerçek degerlerin gösterilmesi ve 0: tahmin edilen degerlerin gösterilmesi islem adimlari gerçeklestirilmektedir.
Sistem (1) veri görsellestirme araci olarak kullanilmaktadir. Bu araç üzerinde zaman serisi analizi yöntemi kullanilmaktadir. Bu sayede verilerin bir sonraki adimi tahmin edilerek öngörü saglayici destek fikirleri verilmektedir. Sistemin (1) bir zaman serisi analizi kullanarak sonraki adimi tahminlemeye yönelik çalismalari üç asamada gerçeklesmektedir. Ilk adim olarak; verilerin ön isleme tekniklerinden gürültü azaltma teknigiyle istenilen formata dönüstürülmesi ve sisteme (1) baglantisi saglanir. Bu asamada dalgacik dönüsümleri ile veriler ön islemeye tabii tutulur. Ikinci adim olarak; yigilmis otoenkoder kullanimi ile birden fazla otomatik kullanici kullanilmasi düsünülerek sistemin (1) otomatik kodlayicilar ile desteklenmesi ve sonraki verilerin tahmin edilip gösterilmesi saglanmaktadir. Üçüncü adim olarak; LSTM algoritmasin ve algoritma bilesenlerinden tekrarlayan hafizanin kullanilmaktadir. Bunun sonucunda uzun kisa süreli bellek mekanizmasi isletilmekte ve verilerin gösterilmesi ile zamansal olarak belirli periyodlar sürecinde trend egilimi hesaplanmaktadir.
Olusturma modülü (2) veri tabani baglantilarini yapmakta ve veri setini sisteme (1) dahil etmektedir. Olusturma modülü (2); veri tabani baglantisinin yapilmasi kapsaminda bir veri tabani ile iletisim kurulabilmesi için gerekli olan islemleri gerçeklestirmektedir.
Olusturma modülü (2); veri tabani baglantisi üzerinden veri seçimlerini yapmakta ve bu seçimleri kullanicinin ihtiyaç ve özelliklerine göre gerçeklestirmektedir. Olusturma modülü (2); MySQL, PostreSQL, MongoDB, SQLite ve MSSQL gibi farkli veri tabani sunuculari ile baglanti kuracak sekilde veri tabani baglantilarina sahiptir. Olusturma modülü (2); veri tabani ve veri seti seçilmesi islemlerinin ardindan baglanti dizisi olusturma islemlerini kullanicilarin SOL dili bilmesine gerek olmadan yapmaktadir.
Olusturma modülü (2); kullanicinin önergeleri takip ederek veri tabani türü, sunucu adresi, kullanici adresi ve diger parametreleri girerek baglanti kurmasini saglamaktadir.
Dönüstürme modülü (3); olusturma modülü (2) vasitasiyla olusturulan veri setleri üzerinde dönüstürme islemlerini yapmaktadir. Dönüstürme modülü (3); verilerin baslangiç halinden kullanicinin ihtiyacina uygun istedigi formata veya yapilara dönüstürmektedir. Dönüstürme modülü (3); bu dönüsüm sayesinde veri setinin dahil edilecegi algoritma içerisinde daha iyi analiz edilmesini ve uygun hale getirilmesini saglamaktadir. Ayrica yine veri seti içerisinde eksik veya hatali görülen verilerin düzeltilmesi, normalizasyon ve standartlastirma islemleri dönüstürme modülünde (3) gerçeklestirilmektedir. Dönüstürme modülünde (3) olusturulan sonuç verileri veri dönüsümü islemlerinin uygulandigi ve genellikle ön isleme sonrasinda nihai olarak ortaya çikan veri kümesidir. Dönüstürme modülü (3); dönüsümü yapilmis sonuç verilerini, islenmis olarak sonraki adimlarda uygulanan veri egitimi ve veri testine Ayirma modülü (4); sistem (1) kullanicilari tarafindan baglanti saglanarak veya manuel olarak sisteme (1) eklenecek olan veri/veri setleri için ayirici görevini üstlenmektedir.
Ayirma modülü (4); zaman degisimine göre tahminlenmesi istenen veriler üzerinde bölümleme yapilmasini saglayarak farkli veri segmentlerinin olusturulmasini gerçeklestirmektedir. Ayirma modülü (4); bölümledigi veriler için egitim, test ve dogrulama asamalari yapilmaktadir. Bu nedenle ayirma modülü (4); bu veriler için model gelistirilmesi çalismalarini gerçeklestirmektedir. Ayirma modülü (4); yaptigi çalismalar neticesinde kullaniciya uygun olacak formatlarda veri ayriminin yapilabilmesini ve verilerin ihtiyaca yönelik olarak ayrilarak algoritmaya dahil edilebilmesini saglamaktadir.
Egitme modülü (5); zaman serisi analizi yapan modelin egitimini gerçeklestirmektedir.
Egitme modülü (5); ilk olarak modelin egitimine katilacak olan verileri seçmektedir.
Egitme modülünün (5); seçtigi veriler özellikle kullanicinin üzerinde çalismak ve analiz yapabilmek istedigi verilerdir. Egitme modülü (5); egitim sürecinde veri bölümlenmesini gerçeklestirir. Egitme modülü (5); islenecek olan egitim verileri haricinde dogrulama ve test verilerini olusturur. Egitme modülü (5); egitime dahil edilen veriler üzerinde regresyon, segmentasyon ve kümeleme analizi yöntemlerini uygular. Egitme modülü (5); bu üç yöntemi veriler üzerinde ayristirma problemleri için kullanir. Egitme modülü (5); egitim verileri için hiperparemetre ayarlamalarini yapar. Egitim sonrasinda modelin dogrulanmasi ve test edilmesi için sonraki adimlara geçilir ve model dagitilir.
Dogrulama modülü (6); modelin egitim sirasinda performansinin degerlendirilmesi amaciyla bölümlenen veri setini islemektedir. Dogrulama modülü (6) egitme modülünde (5) egitilen modelin ürettigi sonuçlarin dogrulanmasini yapmaktadir. Dogrulama modülü (6); kullanicidan alinan parametre degerleri ile dogrulama setini olusturur. Dogrulama modülünün (6) olusturdugu dogrulama seti, modelin gördügü ancak egitimde kullanilmayan verilerden olusur. Dogrulama modülü (6); modelin dogrulama seti üzerindeki performansini takip eder. Dogrulama modülü (6); degerlendirme yapilan model için sorunlar varsa rapor hazirlar ve yeniden egitim asamasi ve hata orani ölçümü için geri bildirim olusturur. Dogrulama modülü (6); sorunlarin tespit edilmesi ve degerlendirilmesi için performans ölçütlerini belirler. Dogrulama modülü (6); performans ölçütlerini dogruluk ve hassasiyet fonksiyonlarina ek olarak geri çagirma skoru üzerinden hesaplamaya dahil eder.
Test etme modülü (7); veri setinin boyutunu, özelliklerini, dagilimlarini ve temel istatistiksel bilgilerinin elde edilmesini saglamaktadir. Test etme modülü (7); egitim ve dogrulama asamalarini geçen verilerin anormal ve aykiri degerlerini tespit etmekte, eksik degerlerin isteniliyorsa doldurularak modele aktarilmasini saglamakta ve veri setinde bulunan degiskenlerin dagilimlarini ve bazi istatistiksel testlerin uygulanmasini gerçeklestirmektedir. Test etme modülü (7); veri setinde bulunan degiskenler arasindaki iliskileri belirler. Test etme modülü (7); veri üzerinde istatistiksel testler de uygular.
Degerlendirme modülü (8); modelin egitim seti disinda bulunan veriler üzerinde ne kadar iyi performans gösterdiginin kontrollerinin yapilmasini saglamaktadir. Degerlendirme modülü (8); degerlendirme sürecinde yeniden performans metriklerini belirler.
Degerlendirme modülünün (8) belirledigi performans metrikleri dogruluk ve hassasiyet fonksiyonu ile birlikte geri çagirma yöntemidir. Degerlendirme modülü (8); model üzerinde kosturulan verilerin siniflandirilmasi problemlerini ele alir. Degerlendirme modülü (8); siniflarin dogrulugunu ögrenebilmek için karmasiklik matrisinden faydalanir.
Degerlendirme modülü (8); yanlis siniflandirilmis ve kategorize edilmis verileri raporlar.
Degerlendirme modülü (8); modelin performansini arttirilmasina kati saglar.
Degerlendirme asamasini geçen veriler zaman serisi analizi için sonraki asamaya aktarili r.
Ayrik dalgacik dönüsüm islemleri modülü (9); sistem (1) içerisine alinacak olan verileri daha küçük veri parçaciklarina veya veri kümelerine bölebilmek için kullanilmaktadir.
Ayrik dalgacik dönüsüm islemleri modülü (9); verilerin kullanima uygun formatlara dönüstürülebilmesi için sinyal isleme, görüntü isleme veya veri sikistirma matematiksel islemlerinin yapilmasini saglayarak verilerin ölçek bakimindan analize tabi tutulmasini saglamaktadir. Ayrica ayrik dalgacik dönüsüm islemleri modülü (9); sisteme (1) girdi olarak saglanacak veriler arasindaki farklilar için yüksek ve düsük frekans ayriminin yapilmasini ve performans ölçütü için ayrik dalgacik dönüsümü islemi üzerinden ayarlamalarin yapilmasini saglamaktadir. Ayrik dalgacik dönüsüm islemleri modülü (9); özellikle veriler arasindaki ayrisimi net sekilde ortaya koyabilmek için ölçekleme fonksiyonu olarak kullanilan ayrik dalgacik dönüsümnün ölçekleme ve dalgacik fonksiyonundan faydalanmaktadir.
Sistemde (1) veri görsellestirme araci üzerinde zaman serisi analizi yöntemi ile verilerin belirli periyodlarda incelenebilmesi ana hedeftir. Bu bakimdan sisteme (1) katki saglayan ve önerilen model içerisinde faydalanilan bir diger bilesen sirali otoenkoder islemleri modülü (10) kullanilmistir. Sirali otoenkoder islemleri modülü (10); yapay sinir aglari otokodlayici türevindedir. Sirali otoenkoder islemleri modülü (10); sunulan model çalismasi içerisinde derin ögrenme yöntemi olarak katki saglamaktadir. Sirali otoenkoder islemleri modülü (10); özellikle kullanicilarin sisteme (1) entegre edecekleri veri/veri setleri üzerinden girdi verilerinin temsilini arka planda tutmak kaydiyla özellik vektörleri hakkinda bilgi edinmelerini saglamaktadir. Sirali otoenkoder islemleri modülü (10); modelin egitim sürecinde bu olusturulan vektör özellikleri kullanilarak orijinal verinin tahmin edilmesi ve öngörülebilmesi için yeniden olusturulmasini saglamaktadir. Bu sayede sirali otoenkoder islemleri modülü (10); sistem (1) içerisinde egitime alinacak olan veriler üzerinde hiyerarsik düzeni saglamakta ve karmasik yapilarin çözümünü kolaylastirmaktadir. Sirali otoenkoder islemleri modülü (10); giris verisi ve çikis verisi arasinda bu veri özellik çikarimlarini ve dönüsüm islemlerini tamamlamaktadir. Sirali otoenkoder islemleri modülü (10); özellikle parçadan bütüne dogru bir isleyis ile veri bölümlenmesi, veri boyunun indirgenmesi, veri hatalarinin azaltilmasi gibi girdi verisi ile çikti verisi arasindaki islemleri gerçeklestirir.
Uzun kisa süreli bellek islemleri modülü (11); görsellestirilmesi düsünülen ve zaman bilgisi içeren veriler için zaman serisi tahminlerinin yapilmasi için kullanilmaktadir. Uzun kisa süreli bellek islemleri modülü (11); zaman serisi modelleri için gözetimsiz makine ögrenimi algoritmalarinin gelistirilmesini ve böylelikle dogru zaman serisi modellerinin tahmin edilebilmesini saglamaktadir. Uzun kisa süreli bellek islemleri modülü (11) tabanli algoritma sonuçlarinin iyilestirilmesi için de Genetik Algoritmalar (GA - Genetic Algorithms) kullanilmistir. Yöntem fark etmeksizin sayisal zaman serisi verileri isleyen ileri analitik uygulamalarin islem süreçlerindeki öne çikan konular; önisleme adiminda gürültü giderme, öznitelik mühendisligi adiminda öznitelik seçme ve çikartma ve tahminleyici model olusturma olmustur. Çalisma alaninin derinligi ve yaklasimlarin çesitliligi sebebiyle tüm adimlar, seçilen veya uygulanan yöntemler yönünden gelistirilmeye açiktir. Bazi yapay sinir aglari geri yayilim seklinde ögrenme yapisi gelistirmektedir. Çok parametre içeren veriler üzerinde ise en dogru kümeleme analizi yöntemleri ile veri ön isleme çalismalarinin dogrusal olmayan fonksiyonlar kullanimi ile elde edilmesi gerekmektedir . Veriye dayali özellikler ve zamansal kestirim tahminlemeleri zaman verileri araciligiyla elde edilir. Zaman serisi verileri üzerinde tahminler yapilirken özellikle finansal veriler üzerinde kullanilmalari durumunda bulanik modeller, otoregresif bütünlesmis hareketli ortalama (ARIMA) kullanilmasi önerilmektedir .
Sistemde (1) zaman serisi verileri analizi ve tahmininde regresyon tabanli (lineer regresyon ve türevleri) kestirim yöntemleri, derin ögrenme tabanli (LSTM (11) ve türevleri) kestirim yöntemleri, istatistiksel analiz modeli (ARIMA, SARIMA vb.) tabanli kestirim yöntemleri kullanilmis ve model üzerinde uygulanmistir.
Sistemde (1) Web arayüzü üzerinde bulunan fonksiyonalite saglayacak teknolojiler Python, React.js, typescript, html, css kullanimi ile tamamlanmistir. Bu sayede gerekli kullanici arayüzleri, konfigürasyonlar, rol ve kimlik yönetimi gibi arayüz gereklilikleri saglanmaktadir. Yazilim mimarisi olarak, servis tabanli mimari seçilmesi, yazilimin modüler, genisleyebilir, tekrar kullanilabilir ve bakimi kolay yapilabilir olmasini da saglamaktadir. Bu kapsamda mikroservis mimarisinde, RESTfuI tabanli servisler kullanilmistir.
Sistemde (1); makine ögrenimi saglayacak algoritmalarin gelistirilmesinde, istatistiksel veri analizi, kümeleme algoritmalari, regresyon analizi yöntemleri uygulanmistir.
Denetimsiz olarak uygulanacak olan kümeleme algoritmalari ile verilerin profillerinin ve segmentlerin olusturulmasi saglanmistir. Lineer regresyon yöntemi ile veriler arasindaki iliskiler modellenmis ve algoritma en dogru elde edilen öznitelik ve bilgilerden beslenmistir. Çapraz dogrulama modülü (12); modelin performansini degerlendirmek ve genelleme yetenegini kontrol etmek için geriye yönelik çapraz dogrulama islemini gerçeklestirmektedir. Çapraz dogrulama modülü (12); veri setini farkli parçalara böler ve modelin farkli alt kümeler üzerinde test edilmesini saglar. Çapraz dogrulama modülü (12); çapraz dogrulama sonuçlarini inceleyerek, modelin belirli bir veri setine asiri uyarlanma (overfitting) veya yetersiz uyum (underfitting) gösterip göstermedigini inceler. Çapraz dogrulama modülü (12); raporlama yaparak çapraz dogrulama iterasyonlarini tamamladiktan sonra, elde edilen performans ölçütlerinin ortalamasini ve standart sapmasini hesaplar. Çapraz dogrulama modülü (12); raporlarin sonucuna göre egitimlerin yeniden test edilmesi kararini kullanicya birakir.
Hata orani ölçüm modülü (13); bir siniflandirma modelinin yanlis siniflandirma yaptigi orani hesaplamaktadir. Hata orani ölçüm modülü (13); hata oranini hesaplamak için, gerçek degerlerle tahmin edilen degerler arasindaki farklari degerlendiren bir ölçüm yapar. Hata orani ölçüm modülü (13); hata ölçüm metrikleri olarak RMSE (Root Mean Square Error) ve MAPElyi (Mean Absolute Percentage Error) kullanmaktadir.
Veri görsellestirme modülü (14); verilerin görsellestirilmesi sonucunda simülasyonun elde edilmesini saglamaktadir. Veri görsellestirme modülü (14); zaman serisi analizi sonucunda sisteme (1) entegre edilen verilerin yapilan parametre ayarlari sonrasinda gerçeklesmesi beklenen sürecin veya olayin zaman içerisindeki degisimlerini modelleyen ve gelecekteki durumlari hakkinda kullaniciya fikir saglayan simülasyonu olusturmaktadir. Veri görsellestirme modülü (14); simülasyon çalismasi için grafik çizgilerden faydalanmakta ve verilerin görsellestirilmesini saglamaktadir. Önerilen sistem (1); Telekomünikasyon, E-ticaret, finans, saglik, sigortacilik ve bunun gibi endüstrilerde üretilmekte olan veri kümelerinin önemini daha iyi ifade edebilmek ve veriler içerisindeki gizli desenleri ortaya çikararak anlamlandirabilmek için makine ögrenimi ve derin ögrenme teknikleri kullanilarak, görsel ögelerin yardimi ile (grafikler, çizgiler, haritalar, tablolar vb.) bir veri görsellestirme yaziliminin tasarlanmasi ve gelistirilmesini gerçeklestirmektedir. Ayrica sistem (1); özellikle bilgisayar bilimlerinde geçmisi olmayan kullanicilar ve karar vericilerin, yapay zeka destekli öngörü yaklasimlariyla ve etkilesimli-interaktif görsellestirme ile, analitik verileri hizli ve etkili bir sekilde kavramasini saglayabilmektedir. Bulusta; farkli veri kümeleri üzerindeki degerli bilgilerin çikarilmasi esnasinda es zamanli olarak veri kalitesinin ortaya konulabilmesi, veri kalitesi iyilestirme önerileri yapabilmesi ve veri profillemesi için bir sistemin (1) gelistirilmesi planlanmistir. Sistemde (1); üretilen büyük miktarda verinin görsellestirilmesi ve görsellestirme süreçlerinde dönemsel olarak veri içindeki veri gruplarinin tespiti ile öngörü saglayici karar mekanizmasi önerilmistir. Sistemde (1); verilerin dagiliminin ne oldugunu dinamik olarak tespit edebilen, kullanicilarin verilerini tek tek farkli veri analizi yöntemlerini kullanarak deneyen ve kullanicinin zaman kaybetmesini önleyen, en dogru veri analizi yöntemini onlar için seçen, tanimlayici ve kesifsel istatistiksel veri analizinde kullanilan hesaplamalari yapabilen, zaman serisi verileri üzerinde tahminler yapabilen ve veri kalitesini iyilestirme önerileri yapabilen, bir veri görsellestirme yazilimi tasarlanmistir. Bu yazilim; zaman serisi verilerinin bir bütün halinde, gelistirilecek tekrarli yapay sinir aglari modülüne girdi olarak verilip, zaman serisi modelleri elde edilmesini, elde edinen yapay zeka modelleri sayesinde bir zaman serisi tahmin araci özelligi gelistirilmesini ve bu özelligin önerilen veri görsellestirme aracina entegrasyonunu içermektedir.

Claims (2)

  1. STEMLER 1. Yazilim tabanli raporlama araci uygulamasi sekilnde çalisan ve çalisip veri görseIIestirme alaninda zaman serisi analizi yapan bir veri görseIIestirme sistemi (1) olup, özelligi; farkli veri tabani sunuculari ile baglanti kurarak ham verileri alan ve bu ham verilerden kullanicinin talebine göre veri seti olusturup sisteme (1) dahil eden olusturma modülü (2), olusturma modülünde (2) olusturulmus veri setIerini dalgacik dönüsümleri ile ön islemeye tabi tutan, gürültü azaltma teknigini kullanarak verileri istenilen formata dönüstüren ve verilerin sisteme (1) baglantisini saglayan dönüstürme modülü (3), sistem (1) kullanicilari tarafindan baglanti saglanarak veya manuel olarak sisteme (1) eklenecek olan veri/veri setIeri için ayirici görevini üstlenen, zaman degisimine göre tahminlenmesi istenen veriler üzerinde bölümleme yapilmasini saglayarak farkli veri segmentIerinin olusturulmasini saglayan, kullanicinin ihtiyacina uygun olacak formatlarda veri ayrimi yapan ayirma veri ayirici modüIde (4) gelistirilen model sayesinde ayrimi yapilmis veriler üzerinde çalisan, her bir veri setinin ayristilarak segmenteIerine ayrilmasini ve veri setIeri ile ilgili ön bilginin tutulmasini, böerIikIe verilerin pozisyonlandirilmasina katki saglayan “segmentasyon analizini”, veri seti içerisinde yer alan bagimli degisken iIe bagimsiz degisken arasindaki dogrusal iliskiyi modellemeyi, model üzerinde hata oranini en aza indirgemek için çizgiler çizmeyi ve raporlamayi saglayan “regresyon analizini” ve veri ön isleme çalismalarinin dogrusal olmayan fonksiyonlar kullanimi ile elde edilmesini saglayan “kümeleme analizini” gerçeklestiren ve bu analizler sayesinde verilerin egitimesini saglayan egitme modülü (5), veri ayirici modüIde (4) gelistirilen model sayesinde ayrimi yapilmis veriler üzerinde çalisan, veri egitimi modülünde (5) egitiIen modelin ürettigi sonuçlarin dogrulanmasini gerçeklestiren, veri profiIIeme islemini gerçeklestirerek bir veri kümesini anlayan ve tanimlayan, veri kümesinde bulunan özeIIikIeri, desenleri, eksik degerleri ve diger istatistiksel özeIIikIeri beIirIeyen dogrulama modülü (6), veri ayirici modülde (4) gelistirilen model sayesinde ayrimi yapilmis veriler üzerinde çalisan, veri setinin boyutunu, özelliklerini, dagilimlarini ve temel istatistiksel bilgileri edilmesini saglayan test etme modülü (7), dogrulama modülünde (6), dogrulanmasi gerçeklestirilmis olan veriler üzerinde çalisan, veri ayirici modülde (4) gelistirilen modelin egitim seti disinda bulunan veriler üzerinde ne kadar iyi performans gösterdiginin kontrollerini gerçeklestiren degerlendirme modülü (8), egitme modülü (5), dogrulama modülü (6), test etme modülü (7) ve degerlendirme modülünde (8) egitimi, dogrulanmasi, testi ve degerlendirmesi gerçeklestirilmis veriler üzerinde ayrik dalgacik dönüsümü (DWT - Discrete Wavelet Transform) islemini gerçeklestiren, sinyal isleme, görüntü isleme veya veri sikistirma matematiksel islemlerini yaprak verileri kullanima uygun formatlara dönüstüren, verileri ölçek bakimindan analize tabi tutan, sisteme (1) girdi olarak kullanilan veriler arasindaki farklilar için yüksek ve düsük frekans ayriminin yapilmasini ve sistem (1) performans ölçütü için ayarlamalarin yapilmasini saglayan, ayrik dalgacik dönüsümünün ölçekleme ve dalgacik fonksiyonundan faydalanarak veriler arasindaki ayrisimi net sekilde ortaya koyan ayrik dalgacik dönüsüm islemleri modülü (9), ayrik dalgacik dönüsüm islemleri modülünde (9) dalgacik dönüsüm islemleri gerçeklestirilmis veriler üzerinde çalisan, yapay sinir aglari otokodlayici türevi olan yigilmis otomatik kodlayicilari (SA - Stacked Autoencoders) kullanan ve bu sayede zaman serisi analizi yöntemi ile verilerin belirli periyodlarda incelenebilmesini saglayan sirali otoenkoder islemleri modülü (10), sirali otoenkoder islemleri modülünde (10) derin ögrenime sunulmus veriler üzerinde çalisan, uzun kisa süreli bellek (LSTM - Long-Short Term Memory) algirtmasini ve LSTM algoritma bilesenlerinden tekrarlayan hafizayi kullanan, bu sayede uzun kisa süreli bellek mekanizmasini isleten ve zaman içerisinde degisen verilerin ögrenilmesini saglayan, girdi verisi ile çikti verisi arasindaki farki hesaplayan ve kullanici raporlarinda bu farka yer veren, bu sayede karar destek özelligi ile kullaniciya kolaylik saglayarak kullanicinin girdi verisi ile çikti verisi arasindaki degisimi görmesini saglayan uzun kisa süreli bellek islemleri modülü (11), saglayan egitme modülü (5), dogrulama modülü (6), test etme modülü (7), degerlendirme modülü (8), ayrik dalgacik dönüsüm islemleri modülü (9) ve uzun kisa süreli bellek islemleri modülünden (11) sonuç verilerini alan, modelin performansini degerlendirmek ve genelleme yetenegini kontrol etmek için kullanilan, egitimi, dogrulanmasi, test edilmesi tamamlanmis tüm veriler için geriye yönelik çapraz dogrulama testlerini gerçeklestiren ve bu testleri kullaniciya sunarak kullanicinin model egitimlerinin yeniden test edilip edilmemesine yönelik karar vermesini saglayan çapraz dogrulama çapraz dogrulama modülünden (12) gerçek degerleri ve tahmin yapilan degerleri alan, bu degerler arasindaki farklari degerlendirerek hata orani ölçümlemesini yapan hata orani ölçüm modülü (13) ve çapraz dogrulama modülü (12) ve hata orani ölçüm modülünden (13) iletilen veriler üzerinde zaman serisi analizini gerçeklestiren, zaman serisi analizi sayesinde sisteme (1) aktarilan veri setlerinin grafiksel olarak incelenebilmesine olanak saglayan, kullaniciya gösterdigi grafiksel analiz vasitasiyla verideki degisimleri, egilimleri ve belirli periyodlar arasindaki varyasyonlari kullanicinin tercihine sunan veri görsellestirme modülü (14) içermesidir.
  2. 2. Istem 1,e uygun bahsedilen sistem (1) olup, özelligi; veri tabani baglantilarini yapan ve veri setini sisteme (1) dahil eden, veri tabani baglantisinin yapilmasi kapsaminda bir veri tabani ile iletisim kurulabilmesi için gerekli olan islemleri gerçeklestiren, veri tabani baglantisi üzerinden veri seçimlerini yapan ve bu seçimleri kullanicinin ihtiyaç ve özelliklerine göre gerçeklestiren, MySQL, PostreSQL, MongoDB, SQLite ve MSSQL gibi farkli veri tabani sunuculari ile baglanti kuracak sekilde veri tabani baglantilarina sahip olan, veri tabani ve veri seti seçilmesi islemlerinin ardindan baglanti dizisi olusturma islemlerini kullanicilarin SQL dili bilmesine gerek olmadan yapan kullanicinin önergeleri takip ederek veri tabani türü, sunucu adresi, kullanici adresi ve diger parametreleri girerek baglanti kurmasini saglayan olusturma modülü (2) içermesidir. Istem 1,e uygun bahsedilen sistem (1) olup, özelligi; olusturma modülü (2) vasitasiyla olusturulan veri setleri üzerinde dönüstürme islemlerini yapan, verilerin baslangiç halinden kullanicinin ihtiyacina uygun istedigi formata veya yapilara dönüstüren, bu dönüsüm sayesinde veri setinin dahil edilecegi algoritma içerisinde daha iyi analiz edilmesini ve uygun hale getirilmesini saglayan, ayrica yine veri seti içerisinde eksik veya hatali görülen verilerin düzeltilmesi, normalizasyon ve standartlastirma islemlerini gerçeklestiren, veri dönüsümü islemlerinin uygulandigi ve genellikle ön isleme sonrasinda nihai olarak ortaya çikan veri kümesi seklinde sonuç verilerini olusturulan yapilmis sonuç verilerini, islenmis olarak sonraki adimlarda uygulanan veri egitimi ve veri testine gönderen dönüstürme modülü (3) içermesidir. Istem 1,e uygun bahsedilen sistem (1) olup, özelligi; sistem (1) kullanicilari tarafindan baglanti saglanarak veya manuel olarak sisteme (1) eklenecek olan veri/veri setleri için ayirici görevini üstlenen, zaman degisimine göre tahminlenmesi istenen veriler üzerinde bölümleme yapilmasini saglayarak farkli veri segmentlerinin olusturulmasini gerçeklestiren, bölümledigi veriler için egitim, test ve dogrulama asamalarinin yapilmasini saglayan, bu veriler için model gelistirilmesi çalismalarini gerçeklestiren ve yaptigi çalismalar neticesinde kullaniciya uygun olacak formatlarda veri ayriminin yapilabilmesini ve verilerin ihtiyaca yönelik olarak ayrilarak algoritmaya dahil edilebilmesini saglayan Istem 1,e uygun bahsedilen sistem (1) olup, özelligi; zaman serisi analizi yapan modelin egitimini gerçeklestiren, ilk olarak modelin egitimine katilacak olan verileri seçen, özellikle kullanicinin üzerinde çalismak ve analiz yapabilmek istedigi verileri egitim sürecinde veri bölümlenmesini gerçeklestiren, islenecek olan egitim verileri haricinde dogrulama ve test verilerini olusturan, egitime dahil edilen veriler üzerinde regresyon, segmentasyon ve kümeleme analizi yöntemlerini uygulayan, bu üç yöntemi veriler üzerinde ayristirma problemleri için kullanan ve egitim verileri için hiperparemetre ayarlamalarini yapan 6. Istem 1,e uygun bahsedilen sistem (1) olup, özelligi; modelin egitim sirasinda performansinin degerlendirilmesi amaciyla bölümlenen veri setini isleyen, egitme modülünde (5) egitilen modelin ürettigi sonuçlarin dogrulanmasini kullanicidan alinan parametre degerleri ile dogrulama setini olusturan, modelin gördügü ancak egitimde kullanilmayan verilerden olusan dogrulama setini olusturan, modelin dogrulama seti üzerindeki performansini takip eden, degerlendirme yapilan model için sorunlar varsa rapor hazirlaryan ve yeniden egitim asamasi ve hata orani ölçümü için geri bildirim olusturan, sorunlarin tespit edilmesi ve degerlendirilmesi için performans ölçütlerini belirleyen ve performans ölçütlerini dogruluk ve hassasiyet fonksiyonlarina ek olarak geri çagirma skoru üzerinden hesaplamaya dahil eden dogrulama modülü (6) içermesidir. 7. Istem 1,e uygun bahsedilen sistem (1) olup, özelligi; veri setinin boyutunu, özelliklerini, dagilimlarini ve temel istatistiksel bilgilerinin elde edilmesini saglayan, egitim ve dogrulama asamalarini geçen verilerin anormal ve aykiri degerlerini tespit eden, eksik degerlerin isteniliyorsa doldurularak modele aktarilmasini saglayan ve veri setinde bulunan degiskenlerin dagilimlarini ve bazi istatistiksel testlerin uygulanmasini gerçeklestiren, veri setinde bulunan degiskenler arasindaki iliskileri belirleyen ve veri üzerinde istatistiksel testler de uygulayan test etme modülü (7) içermesidir. 8. Istem 1,e uygun bahsedilen sistem (1) olup, özelligi; modelin egitim seti disinda bulunan veriler üzerinde ne kadar iyi performans gösterdiginin kontrollerinin yapilmasini saglayan, degerlendirme sürecinde yeniden performans metriklerini belirleyen, belirledigi performans metrikleri dogruluk ve hassasiyet fonksiyonu ile birlikte geri çagirma yöntemi seklinde performans metriklerini belirleyen, model üzerinde kosturulan verilerin siniflandirilmasi problemlerini ele alan, siniflarin dogrulugunu ögrenebilmek için karmasiklik matrisinden faydalanan, yanlis siniflandirilmis ve kategorize edilmis verileri raporlayan ve modelin performansini arttirilmasina kati saglayan degerlendirme modülü (8) içermesidir. 9. Istem 1,e uygun bahsedilen sistem (1) olup, özelligi; sistem (1) içerisine alinacak olan verileri daha küçük veri parçaciklarina veya veri kümelerine bölebilmek için kullanilan, verilerin kullanima uygun formatlara dönüstürülebilmesi için sinyal isleme, görüntü isleme veya veri sikistirma matematiksel islemlerinin yapilmasini saglayarak verilerin ölçek bakimindan analize tabi tutulmasini saglayan, sisteme (1) girdi olarak saglanacak veriler arasindaki farklilar için yüksek ve düsük frekans ayriminin yapilmasini ve performans ölçütü için ayrik dalgacik dönüsümü islemi üzerinden ayarlamalarin yapilmasini saglayan özellikle veriler arasindaki ayrisimi net sekilde ortaya koyabilmek için ölçekleme fonksiyonu olarak kullanilan ayrik dalgacik dönüsümnün ölçekleme ve dalgacik fonksiyonundan faydalanan ayrik dalgacik dönüsüm islemleri modülü (9) içermesidir. 10. Istem 1,e uygun bahsedilen sistem (1) olup, özelligi; 15 .to yapay sinir aglari otokodlayici türevinde olan, sunulan model çalismasi içerisinde derin ögrenme yöntemi olarak katki saglamayan, özellikle kullanicilarin sisteme (1) entegre edecekleri veri/veri setleri üzerinden girdi verilerinin temsilini arka planda tutmak kaydiyla özellik vektörleri hakkinda bilgi edinmelerini saglayan, modelin egitim sürecinde olusturulan vektör özellikleri kullanilarak orijinal verinin tahmin edilmesi ve öngörülebilmesi için yeniden olusturulmasini saglayan, sistem (1) içerisinde egitime alinacak olan veriler üzerinde hiyerarsik düzeni saglayan ve karmasik yapilarin çözümünü kolaylastiran, giris verisi ve çikis verisi arasinda bu veri özellik çikarimlarini ve dönüsüm islemlerini tamamlayan ve özellikle parçadan bütüne dogru bir isleyis ile veri bölümlenmesi, veri boyunun indirgenmesi, veri hatalarinin azaltilmasi gibi girdi verisi ile çikti verisi arasindaki islemleri gerçeklestiren sirali otoenkoder islemleri modülü (10) içermesidir. 11. Istem 1,e uygun bahsedilen sistem (1) olup, özelligi; 20 '1' görsellestirilmesi düsünülen ve zaman bilgisi içeren veriler için zaman serisi tahminlerinin yapilmasi için kullanilan, zaman serisi modelleri için gözetimsiz makine ögrenimi algoritmalarinin gelistirilmesini ve böylelikle dogru zaman serisi modellerinin tahmin edilebilmesini saglayan ve sahip oldugu algoritma sonuçlarinin iyilestirilmesi için Genetik Algoritmalari (GA - Genetic Algorithms) kullanan uzun kisa süreli bellek islemleri modülü (11) içermesidir. 12. Istem 1,e uygun bahsedilen sistem (1) olup, özelligi; modelin performansini degerlendirmek ve genelleme yetenegini kontrol etmek için geriye yönelik çapraz dogrulama islemini gerçeklestiren, veri setini farkli parçalara bölen ve modelin farkli alt kümeler üzerinde test edilmesini saglayan, çapraz dogrulama sonuçlarini inceleyerek, modelin belirli bir veri setine asiri uyarlanma (overfitting) veya yetersiz uyum (underfitting) gösterip göstermedigini inceleyen, raporlama yaparak çapraz dogrulama iterasyonlarini tamamladiktan sonra, elde edilen performans ölçütlerinin ortalamasini ve standart sapmasini hesaplayan ve raporlarin sonucuna göre egitimlerin yeniden test edilmesi kararini kullanicya birakan çapraz dogrulama modülü (12); içermesidir. 13. Istem 1,e uygun bahsedilen sistem (1) olup, özelligi; bir siniflandirma modelinin yanlis siniflandirma yaptigi orani hesaplayan, hata oranini hesaplamak için, gerçek degerlerle tahmin edilen degerler arasindaki farklari degerlendiren bir ölçüm yapan ve hata ölçüm metrikleri olarak RMSE (Root Mean Square Error) ve MAPElyi (Mean Absolute Percentage Error) kullanan hata orani ölçüm modülü (13) içermesidir. 14. Istem 1,e uygun bahsedilen sistem (1) olup, özelligi; 20 '1' verilerin görsellestirilmesi sonucunda simülasyonun elde edilmesini saglayan, zaman serisi analizi sonucunda sisteme (1) entegre edilen verilerin yapilan parametre ayarlari sonrasinda gerçeklesmesi beklenen sürecin veya olayin zaman içerisindeki degisimlerini modelleyen ve gelecekteki durumlari hakkinda kullaniciya fikir saglayan simülasyonu olusturan ve simülasyon çalismasi için grafik çizgilerden faydalanan ve verilerin görsellestirilmesini saglayan veri görsellestirme modülü (14) içermesidir.
TR2024/000874 2024-01-24 Bi̇r veri̇ görselleşti̇rme si̇stemi̇ TR2024000874A2 (tr)

Publications (1)

Publication Number Publication Date
TR2024000874A2 true TR2024000874A2 (tr) 2024-04-22

Family

ID=

Similar Documents

Publication Publication Date Title
Saelens et al. A comparison of single-cell trajectory inference methods
Qian et al. A review on autoencoder based representation learning for fault detection and diagnosis in industrial processes
US20220027762A1 (en) Predictive maintenance model design system
Zhai et al. Enabling predictive maintenance integrated production scheduling by operation-specific health prognostics with generative deep learning
CN114139589A (zh) 故障诊断方法、装置、设备与计算机可读存储介质
Zhou et al. Aero-engine prognosis strategy based on multi-scale feature fusion and multi-task parallel learning
CN116416884A (zh) 一种显示器模组的测试装置及其测试方法
Hajgató et al. PredMaX: Predictive maintenance with explainable deep convolutional autoencoders
Qi et al. Application of EMD combined with deep learning and knowledge graph in bearing fault
CN111160393A (zh) 一种基于数据驱动的运载火箭健康评估模型模块化建模方法
CN117216419B (zh) 基于ai技术的数据分析方法
Martins et al. Prediction maintenance based on vibration analysis and deep learning–A case study of a drying press supported on a hidden Markov model
Bect et al. Identification of abnormal events by data monitoring: Application to complex systems
Burt et al. Moderation and mediation in behavioural accounting research
Bond et al. A hybrid learning approach to prognostics and health management applied to military ground vehicles using time-series and maintenance event data
TR2024000874A2 (tr) Bi̇r veri̇ görselleşti̇rme si̇stemi̇
CN116307765A (zh) 一种人工智能政务数据评审方法及系统
Longo Explainable Artificial Intelligence: First World Conference, xAI 2023, Lisbon, Portugal, July 26–28, 2023, Proceedings, Part II
Yeon et al. Visual imputation analytics for missing time-series data in bayesian network
Amirian et al. Data science and analytics
CN116186507A (zh) 一种特征子集的选取方法、装置及存储介质
Leegwater et al. From data to a validated score-based LR system: a practitioner’s guide
Bect et al. Diagnostic and decision support systems by identification of abnormal events: Application to helicopters
US20220188647A1 (en) Model learning apparatus, data analysis apparatus, model learning method and program
Suresh et al. Predicting the e-learners learning style by using support vector regression technique