TR2024000874A2 - Bi̇r veri̇ görselleşti̇rme si̇stemi̇ - Google Patents
Bi̇r veri̇ görselleşti̇rme si̇stemi̇Info
- Publication number
- TR2024000874A2 TR2024000874A2 TR2024/000874 TR2024000874A2 TR 2024000874 A2 TR2024000874 A2 TR 2024000874A2 TR 2024/000874 TR2024/000874 TR 2024/000874 TR 2024000874 A2 TR2024000874 A2 TR 2024000874A2
- Authority
- TR
- Turkey
- Prior art keywords
- data
- module
- model
- training
- performs
- Prior art date
Links
- 238000013079 data visualisation Methods 0.000 title claims abstract description 26
- 238000012731 temporal analysis Methods 0.000 claims abstract description 19
- 238000000700 time series analysis Methods 0.000 claims abstract description 19
- 230000008859 change Effects 0.000 claims abstract description 8
- 238000000034 method Methods 0.000 claims description 62
- 238000012549 training Methods 0.000 claims description 57
- 238000004422 calculation algorithm Methods 0.000 claims description 37
- 230000008569 process Effects 0.000 claims description 29
- 238000012360 testing method Methods 0.000 claims description 29
- 238000002790 cross-validation Methods 0.000 claims description 21
- 238000011156 evaluation Methods 0.000 claims description 21
- 238000004458 analytical method Methods 0.000 claims description 19
- 238000012795 verification Methods 0.000 claims description 19
- 238000005259 measurement Methods 0.000 claims description 16
- 238000012800 visualization Methods 0.000 claims description 15
- 238000000926 separation method Methods 0.000 claims description 14
- 238000006243 chemical reaction Methods 0.000 claims description 13
- 238000011161 development Methods 0.000 claims description 13
- 230000018109 developmental process Effects 0.000 claims description 13
- 230000015654 memory Effects 0.000 claims description 13
- 230000006870 function Effects 0.000 claims description 12
- 238000013135 deep learning Methods 0.000 claims description 11
- 238000010801 machine learning Methods 0.000 claims description 11
- 238000007781 pre-processing Methods 0.000 claims description 10
- 238000010200 validation analysis Methods 0.000 claims description 10
- 238000012545 processing Methods 0.000 claims description 9
- 230000009466 transformation Effects 0.000 claims description 8
- 238000007621 cluster analysis Methods 0.000 claims description 7
- 238000009826 distribution Methods 0.000 claims description 7
- 230000011218 segmentation Effects 0.000 claims description 7
- 238000013528 artificial neural network Methods 0.000 claims description 6
- 238000004088 simulation Methods 0.000 claims description 6
- 238000000638 solvent extraction Methods 0.000 claims description 6
- 230000007246 mechanism Effects 0.000 claims description 5
- 238000013144 data compression Methods 0.000 claims description 4
- 230000002068 genetic effect Effects 0.000 claims description 4
- 238000000528 statistical test Methods 0.000 claims description 4
- 239000013598 vector Substances 0.000 claims description 4
- 230000002159 abnormal effect Effects 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 230000009467 reduction Effects 0.000 claims description 3
- 238000000611 regression analysis Methods 0.000 claims description 3
- 238000013145 classification model Methods 0.000 claims description 2
- 238000012937 correction Methods 0.000 claims description 2
- 230000001419 dependent effect Effects 0.000 claims description 2
- 238000012854 evaluation process Methods 0.000 claims description 2
- 239000011159 matrix material Substances 0.000 claims description 2
- 238000010606 normalization Methods 0.000 claims description 2
- 239000002245 particle Substances 0.000 claims description 2
- 238000005192 partition Methods 0.000 claims description 2
- 238000013102 re-test Methods 0.000 claims description 2
- 230000035945 sensitivity Effects 0.000 claims 2
- 238000004891 communication Methods 0.000 claims 1
- 238000013501 data transformation Methods 0.000 claims 1
- 230000003252 repetitive effect Effects 0.000 claims 1
- 238000000844 transformation Methods 0.000 claims 1
- 230000036541 health Effects 0.000 abstract description 3
- 238000007405 data analysis Methods 0.000 description 13
- 238000005516 engineering process Methods 0.000 description 10
- 230000002452 interceptive effect Effects 0.000 description 6
- 230000006403 short-term memory Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 3
- 238000007418 data mining Methods 0.000 description 3
- 230000000306 recurrent effect Effects 0.000 description 3
- 238000009877 rendering Methods 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 238000012896 Statistical algorithm Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000003542 behavioural effect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000012886 linear function Methods 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 241000728173 Sarima Species 0.000 description 1
- 230000000454 anti-cipatory effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013142 basic testing Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000012517 data analytics Methods 0.000 description 1
- 238000013524 data verification Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000011985 exploratory data analysis Methods 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Abstract
Bu buluş, yazılım tabanlı raporlama aracı uygulaması şekilnde çalışan ve çalışıp veri görselleştirme alanında zaman serisi analizi yapan bir veri görselleştirme sistemi (1) ile ilgilidir. Sistem (1); özellikle Telekomünikasyon, Finans, Sigortacılık, Sağlık ve bunun gibi yoğun veri ile çalışılan tüm sektörlerde veri değişimine duyarlı olan kritik noktalar üzerinde karşılaştırma yapmak, karar almak veya herhangi bir noktada müdahale etmek gibi birçok iş yükünü ve zamandan tasarruf ettirebilme işlevselliği ile kullanılabilmektedir.
Description
TARIFNAME
BIR VERI GÖRSELLESTIRME SISTEMI
Teknik Alan
Bu bulus, yazilim tabanli raporlama araci uygulamasi sekilnde çalisan ve çalisip veri
görsellestirme alaninda zaman serisi analizi yapan bir veri görsellestirme sistemi ile
Teknigin Bilinen Durumu
Zaman serisi analizi, belirli bir zaman periyodu içinde toplanan verilerin incelenmesi ve
anlasilmasi için kullanilan istatistiksel bir yöntemdir. Bu analiz, genellikle zaman içindeki
degisimleri, düzenIiIikIeri ve egilimleri anlamak amaciyla uygulanir. Zaman serisi verileri,
genellikle esit araliklarla ölçülen ölçümlerden olusur, örnegin saatlik, günlük, aylik veya
yiIIik veriler üzerinde kullanicilara analiz yapma firsati sunar. Bu dogrultuda zaman serisi
analizi, birçok endüstride kullanabilir ve uygulanabilir.
Teknolojinin veri görsellestirmeye dogrudan katkisi olup, özellikle son birkaç yildir bu
yönde önemli gelismeler yasanmaktadir. Birçok veri görsellestirme teknigi zamanla
interaktif hale gelmis, açik programlama ara yüzleri ve interaktif web tabanli
görsellestirme araci kitlerinin yayginlasmasiyla üretimi kolaylasmistir. Ayrica web tabanli
baglanti teknolojisi sayesinde, verilere dogrudan uIasiIarak, görseller verideki degisime
es zamanli adapte ediIebiImektedir. Bu görsellestirme örneklerine, özellikle is
analizlerinde, hükümetlerin açik veri sistemlerinde ve medya infografiklerinde
rastlanmaktadir (Fox & HendIer, 2011, s. 706).
Mecut tekniklerde kullanilan çogu görsellestirme araci biIdirimseIdir; bu, kullanicinin
çiziIecek sütunIari veya dizileri tanimlamasi gerektigi anlamina gelir. Yani, programlama
dili hakkinda kullanici bilgisi ve veri kümesi hakkinda önceden bilgi sahibi olmayi
gerektirir. Birçok bilim insani programlamayi ögrenmeyi, kullanmayi veya baskalarina
aktarmayi hantal bulmaktadir. Ayrica zamana göre veriler üzerinde davranis egilimlerinin
incelenmesi de geleneksel veri görsellestirme araçlarinda bulunmamaktadir. Geleneksel
veri görsellestirme araci kullanimi esnasinda kullanicilar her bir grafigi bildirmek zorunda
kalmadan veri kümelerinden birçok iliskiyi hizli bir sekilde çizmek isterler. Sisense, JMP,
Biovia's Pipeline Pilot gibi ticari yazilimlar veri görsellestirme için araçlar saglar, ancak
ayni zamanda lisansli yazilim gerektirir ve/veya tamamen etkilesimli grafiklere sahip
degildirler. Bu nedenle, etkilesimli görsellestirmeler olusturmak için yaygin olarak
erisilebilir, kullanimi ve olusturmasi kolay bir platforma ihtiyaç oldugu görülmektedir.
Teknigin bilinen durumunda numarali yer alan TR 2020/18085 numarali patent basvuru
dokümaninda, veri görsellestirme islemindeki metin (text) alanlarinin ve tüm nokta bazli
bilgilerin saptanip indekslenmesi ve söz konusu indeksler üzerinde anahtar kelimeler ile
gerçeklestirilen arastirma sonrasi gösterge panolarindaki anormal degerlerin ve/veya
durumlarin tespit edilmesini saglayan bir sistem açiklanmaktadir. Ilgili basvuru
dokümanindan açiklanan sistem; iliskisel veri tabani üzerinde tanimlayici istatistiksel veri
analizi ile veri kalitesi kontrolü saglayan, veri profilleme ve derin ögrenme modelini
kullanarak verilerin görsellestirilmesini saglayan bir yapi sunmamaktadir.
Sonuç olarak, yukarida anlatilan ihtiyaçlari karsilayacak çözümlerin konu hakkindaki
yetersizligi nedeniyle ilgili teknik alanda bir gelistirme yapilmasi gerekli kilinmistir.
Bulusun Kisa açiklamasi
Bulus, mevcut durumlardan esinlenerek olusturulup yukarida belirtilen olumsuzluklari
çözmeyi amaçlamaktadir.
Bu bulusun amaci, yazilim tabanli raporlama araci uygulamasi sekilnde çalisan ve
çalisip veri görsellestirme alaninda zaman serisi analizi yapan bir veri görsellestirme
sisteminin ortaya koyulmasidir.
Sistem; özellikle Telekomünikasyon, Finans, Sigortacilik, Saglik ve bunun gibi yogun veri
ile çalisilan tüm sektörlerde veri degisimine duyarli olan kritik noktalar üzerinde
karsilastirma yapmak, karar almak veya herhangi bir noktada müdahale etmek gibi
birçok is yükünü ve zamandan tasarruf ettirebilme islevselligi ile kullanilabilmektedir.
Bulusun yapisal ve karakteristik özellikleri ve tüm avantajlari asagida verilen sekil ve bu
sekle atiflar yapilmak suretiyle yazilan detayli açiklama sayesinde daha net olarak
anlasilacaktir ve bu nedenle degerlendirmenin de bu sekil ve detayli açiklama göz önüne
alinarak yapilmasi gerekmektedir.
Bulusun Anlasilmasina Yardimci Olacak Sekiller
Sekil 1, bulusa konu olan sistemin sematik gösterimdir.
Parça Referanslarinin Açiklamasi
1. Sistem
2. Olusturma modülü
3. Dönüstürme modülü
4. Ayirma modülü
. Egitme modüIü
6. Dogrulama modüIü
7. Test etme modülü
8. Degerlendirme modülü
9. Ayrik dalgacik dönüsüm islemleri modüIü
. Sirali otoenkoder islemleri modülü
11. Uzun kisa süreli bellek islemleri modülü
12. Çapraz dogrulama modüIü
13. Hata orani ölçüm modüIü
Bulusun Detayli Açiklamasi
Bu detayli açiklamada, bulusa konu olan sistemin (1) tercih edilen yapilanmalari, sadece
konunun daha iyi anlasilmasina yönelik olarak açiklanmaktadir.
Bu bulus, yazilim tabanli raporlama araci uygulamasi sekilnde çalisan ve çalisip veri
görsellestirme alaninda zaman serisi analizi yapan bir veri görsellestirme sistemi (1) ile
Sistemin (1) çalistigi yazilim tabanli uygulama; E-ticaret, finans, telekomünikasyon ve
bunun gibi endüstriIerde üretilmekte olan büyük veri kümelerinin önemini daha iyi ifade
edebilmek ve veriler içerisindeki gizli desenleri ortaya çikararak anlamlandirabilmek için
makine ögrenimi teknikleri, derin ögrenme teknolojileri ve görsel ögelerin yardimi ile
(grafikler, çizgiler, haritalar, tablolar vb.) birlikte büyük veri görsellestirmeyi
hedeflemektedir. Sistem (1); kullanicilar ve karar vericilerin özellikle bilgisayar
bilimlerinde geçmisi olmayanlarin, yapay zekâ destekli öngörü teknolojisi ile gelistirilecek
etkilesimli-interaktif görsellestirme ile birlikte analitik verileri hizli ve etkili bir sekilde
kavramasini saglamaktadir. Sistemde (1); projede farkli veri kümeleri üzerindeki degerli
verilerin çikarilmasi esnasinda es zamanli olarak veri kalitesinin ortaya konulabilmesi,
veri kalitesi iyilestirme önerileri yapilabilmesi ve veri profillemesi için tanimlayici
istatistiksel metriklerin kolayca verilere uygulamasini saglayacak bir yapinin gelistirilmesi
hedeflenmektedir.
Sistem (1), yapay zekâ teknolojilerini (makine ögrenmesi algoritmalari, derin ögrenme
algoritmalari) kullanarak, farkli veri analizi görevleri gerçeklestirebilmektedir. Bu amaçla,
sistemin (1) sahip oldugu yazilim kapsaminda bir ögrenme mekanizmasi bulunmaktadir.
Bu veri analiz görevlerinden bir tanesi, iliskisel veri tabanlari üzerinde yer alabilen,
zaman serisi verileri üzerinde, ileriye yönelik kestirim yaparak, zaman serisi verilerinin
görsellestirilmesini saglamaktir. Veri analizi görevlerinden bir digeri ise veri
gruplandirmanin gerçeklestirilmesidir. Sistem (1) burada, iliskisel veri tabaninda yer alan
veriler üzerinde, farkli gözetimsiz makine ögrenmesi algoritmalari kullanilarak, verilerin
gruplandirilmasi ve görsellestirilmesi üzerinde çalisilmaktadir. Bu kapsamda sistem (1),
veri ön isleme, öznitelik seçimi, kümeleme analizi algoritmalarinin uygulanmasi,
segmentasyon sonuçlarinin kalitesinin belirlenmesi gibi islemleri gerçeklestirmektedir.
Ayrica bu islemler ile birlikte davranissal veri analitigi, kesifsel analiz (exploratory data
analysis) uygulamalari, anomali tespiti algoritmalari ve uygulamalari gibi kestirimci
(predictive) analiz algoritmalarinin ve uygulamalarinin gelistirilmesi de sistemin (1)
kapsamindadir. Sistemde (1) gerçeklestirilen tahmine dayali istatiksel veri analizi,
geçmis verilere dayali olarak gelecekteki sonuçlarin ve egilimlerin olasiligini tahmin
etmek için Büyük Veri, Istatistiksel Algoritmalar ve Makine Ögrenme (ML - Machine
Learning) tekniklerinden elde edilen bir veri madenciliginden yararlanmaktadir. Yani,
tahmine dayali analiz, verilerdeki sorunlari ortaya çikarmaya ve firsatlari belirlemeye
yardimci olabilecek kaliplari kesfetmeye yardimci olmaktadir.
Sistem (1); ileriye dönük zaman verileri üzerinde kestirim yapmak için LSTM tabanli derin
ögrenme algoritmalarini kullanmaktadir. Sistemde (1) LSTM tabanli derin ögrenme
teknolojisini kullanilmakta ve zaman damgali veriler üzerinde davranis/trend egilimi
ögrenilebilmektedir.
Büyük miktarda veriye uygulanan veri madenciligi teknikleri, örüntüleri belirleme ve yeni
bilgiler üretme yoluyla yapilan büyük veri analizidir. Sistemde (1) büyük veri analizi
yöntemi kullanimi sayesinde, kullanicilar teknik bilgiye ihtiyaç duymadan veriler üzerinde
çalisabilmektedir. Sistemde (1) platform gelistirmelerinde tahmine dayali istatiksel veri
analizi yapilabilmesi için istatistiksel algoritmalar ve makine ögrenmesi tekniklerinden
veri madenciligi kullanilmaktadir. Sistemde (1) model egitimi sonrasinda kullanicilarin
veri analizi yapabilmesi adina gerekli testler yapilarak basarim orani en yüksek seviyeye
getirilmektedir.
Sistemin (1) gerçeklestirdigi çalismalardan bir digeri; iliskisel veri tabani üzerinde
gruplandirma yapmasidir. Bunun için sistem (1), kümeleme analizi algoritmalarini
kullanmaktadir. Bu amaçla sistemde (1), iki temel kategoriden kümeleme analizi
algoritmalari (k-means ve DBScan) kullanilmaktadir. Bu algoritmalarin basarili
kümeleme analizi yapamama riski bir teknik zorluk içermektedir. Sistem (1), bu teknik
zorlugu asmak için, kullanilan kümeleme analizi algoritmalarina alternatif Iiteratürdeki
diger kümeleme analizi algoritmalarini kullanarak, veri seti üzerinde daha basarili
gruplandirma yapmaya çalismaktadir. Sistemde (1) kümeleme analizi öncesi yapilan veri
ön isleme çalismalari tekrar incelenerek verinin makine ögrenmesine hazir hale
getirilmesi ve kalitesinin arttirilmasi saglanmaktadir. Sistemde (1) makine ögrenmesi ve
derin ögrenme algoritmalari için Spark ML Kütüphanesi, Tensorflow üzerinde Keras
kütüphanesi gibi açik kaynakli teknolojiler kullanilmaktadir. Bu teknolojiler üzerindeki
makine ögrenmesi algoritmalarinin çalisma performansinin (çalisma zamani açisindan)
istenen sonuçlari vermemesi bir teknik zorluktur. Sistem (1) bu zorlugu asmak için,
kullanilan açik kaynakli teknolojilere alternatif olarak, üzerinde makine ögrenmesi ve
derin ögrenme kütüphaneleri olan farkli kütüphaneleri kullanmaktadir. Bu açik kaynakli
kütüphaneler sistemde (1) kullanilarak performans kisiti asilmaktadir.
Sekil 1*de sematik gösterimi sunulan sistem (1);
verilerden kullanicinin talebine göre veri seti olusturup sisteme (1) dahil eden
olusturma modülü (2),
0: olusturma modülünde (2) olusturulmus veri setlerini dalgacik dönüsümleri ile ön
islemeye tabi tutan, gürültü azaltma teknigini kullanarak verileri istenilen formata
dönüstüren ve verilerin sisteme (1) baglantisini saglayan dönüstürme modülü (3),
sistem (1) kullanicilari tarafindan baglanti saglanarak veya manuel olarak
sisteme (1) eklenecek oIan veri/veri setleri için ayirici görevini üstlenen, zaman
degisimine göre tahminlenmesi istenen veriler üzerinde bölümleme yapilmasini
saglayarak farkli veri segmentlerinin olusturulmasini saglayan, kullanicinin
ihtiyacina uygun olacak formatlarda veri ayrimi yapan ayirma modülü (4),
veri ayirici modülde (4) gelistirilen model sayesinde ayrimi yapilmis veriler
üzerinde çalisan, her bir veri setinin ayristilarak segmentelerine ayrilmasini ve
veri setleri ile ilgili ön bilginin tutulmasini, böylelikle verilerin
pozisyonlandirilmasina katki saglayan “segmentasyon analizini”, veri seti
içerisinde yer alan bagimli degisken ile bagimsiz degisken arasindaki dogrusal
iliskiyi modellemeyi, model üzerinde hata oranini en aza indirgemek için çizgiler
çizmeyi ve raporlamayi saglayan “regresyon analizini” ve veri ön isleme
çalismalarinin dogrusal olmayan fonksiyonlar kullanimi ile elde edilmesini
saglayan “kümeleme analizini” gerçeklestiren ve bu analizler sayesinde verilerin
egitimesini saglayan egitme modülü (5),
veri ayirici modülde (4) gelistirilen model sayesinde ayrimi yapilmis veriler
üzerinde çalisan, veri egitimi modülünde (5) egitilen modelin ürettigi sonuçlarin
dogrulanmasini gerçeklestiren, veri profiIIeme islemini gerçeklestirerek bir veri
kümesini anlayan ve tanimlayan, veri kümesinde bulunan özellikleri, desenleri,
eksik degerleri ve diger istatistiksel özeIIikIeri belirleyen dogrulama modülü (6),
veri ayirici modülde (4) gelistirilen model sayesinde ayrimi yapilmis veriler
üzerinde çalisan, veri setinin boyutunu, özelliklerini, dagiIimIarini ve temel
istatistiksel biIgiIeri edilmesini saglayan test etme modülü (7),
dogrulama modülünde (6), dogrulanmasi gerçeklestirilmis oIan veriler üzerinde
çalisan, veri ayirici modülde (4) gelistirilen modelin egitim seti disinda bulunan
veriler üzerinde ne kadar iyi performans gösterdiginin kontrollerini gerçeklestiren
degerlendirme modülü (8),
egitme modülü (5), dogrulama modülü (6), test etme modülü (7) ve degerlendirme
modülünde (8) egitimi, dogrulanmasi, testi ve degerlendirmesi gerçeklestirilmis
veriler üzerinde ayrik dalgacik dönüsümü (DWT - Discrete WaveIet Transform)
islemini gerçeklestiren, sinyal isleme, görüntü isleme veya veri sikistirma
matematiksel islemlerini yaprak verileri kullanima uygun formatlara dönüstüren,
verileri ölçek bakimindan anaIize tabi tutan, sisteme (1) girdi olarak kullanilan
veriler arasindaki farkIiIar için yüksek ve düsük frekans ayriminin yapilmasini ve
sistem (1) performans ölçütü için ayarlamalarin yapilmasini saglayan, ayrik
dalgacik dönüsümünün ölçekleme ve dalgacik fonksiyonundan faydalanarak
veriler arasindaki ayrisimi net sekilde ortaya koyan ayrik dalgacik dönüsüm
islemleri modülü (9),
ayrik dalgacik dönüsüm islemleri modülünde (9) dalgacik dönüsüm islemleri
gerçeklestirilmis veriler üzerinde çalisan, yapay sinir aglari otokodlayici türevi
olan yigilmis otomatik kodlayicilari (SA - Stacked Autoencoders) kullanan ve bu
sayede zaman serisi analizi yöntemi ile verilerin beIirIi periyodlarda
incelenebilmesini saglayan sirali otoenkoder islemleri modülü (10),
sirali otoenkoder islemleri modülünde (10) derin ögrenime sunulmus veriler
üzerinde çalisan, uzun kisa süreli bellek (LSTM - Long-Short Term Memory)
algirtmasini ve LSTM algoritma bilesenlerinden tekrarlayan hafizayi kullanan, bu
sayede uzun kisa süreli bellek mekanizmasini isleten ve zaman içerisinde
degisen verilerin ögrenilmesini saglayan, girdi verisi ile çikti verisi arasindaki farki
hesaplayan ve kullanici raporlarinda bu farka yer veren, bu sayede karar destek
özelligi ile kullaniciya kolaylik saglayarak kullanicinin girdi verisi ile çikti verisi
arasindaki degisimi görmesini saglayan uzun kisa süreli bellek islemleri modülü
(11),
saglayan egitme modülü (5), dogrulama modülü (6), test etme modülü (7),
degerlendirme modülü (8), ayrik dalgacik dönüsüm islemleri modülü (9) ve uzun
kisa süreli bellek islemleri modülünden (11) sonuç verilerini alan, modelin
performansini degerlendirmek ve genelleme yetenegini kontrol etmek için
kullanilan, egitimi, dogrulanmasi, test edilmesi tamamlanmis tüm veriler için
geriye yönelik çapraz dogrulama testlerini gerçeklestiren ve bu testleri kullaniciya
sunarak kullanicinin model egitimlerinin yeniden test edilip edilmemesine yönelik
karar vermesini saglayan çapraz dogrulama modülü (12),
çapraz dogrulama modülünden (12) gerçek degerleri ve tahmin yapilan degerleri
alan, bu degerler arasindaki farklari degerlendirerek hata orani öIçümIemesini
yapan hata orani ölçüm modülü (13) ve
çapraz dogrulama modülü (12) ve hata orani ölçüm modülünden (13) iletilen
veriler üzerinde zaman serisi analizini gerçeklestiren, zaman serisi analizi
sayesinde sisteme (1) aktarilan veri setlerinin grafiksel olarak incelenebilmesine
olanak saglayan, kullaniciya gösterdigi grafiksel analiz vasitasiyla verideki
degisimleri, egilimleri ve belirli periyodlar arasindaki varyasyonlari kullanicinin
tercihine sunan veri görsellestirme modülü (14)
içermektedir.
Sistemde (1) sirasiyla;
..o veri tabani baglantisinin kurulmasi,
0: veri ön islemenin yapilmasi,
0: dönüstürülmüs veri setlerinin hazirlanmasi,
0: veri ayirma islemlerinin yapilmasi,
0: veri egitimin yapilmasi,
0: verilerin dogrulanmasi,
0: verilerin test edilmesi,
0: dalgacik dönüsüm islemlerinin gerçeklestirilmesi,
0: sirali otoenkoder dönüsümlerinin gerçeklestirilmesi,
0: uzun kisa süreli bellek dönüsüm islemlerinin gerçeklestirilmesi,
v geriye yönelik çapraz dogrulama testlerinin gerçeklestirilmesi,
..o hata oraninin hesaplanmasi,
0: gerçek degerlerin gösterilmesi ve
0: tahmin edilen degerlerin gösterilmesi
islem adimlari gerçeklestirilmektedir.
Sistem (1) veri görsellestirme araci olarak kullanilmaktadir. Bu araç üzerinde zaman
serisi analizi yöntemi kullanilmaktadir. Bu sayede verilerin bir sonraki adimi tahmin
edilerek öngörü saglayici destek fikirleri verilmektedir. Sistemin (1) bir zaman serisi
analizi kullanarak sonraki adimi tahminlemeye yönelik çalismalari üç asamada
gerçeklesmektedir. Ilk adim olarak; verilerin ön isleme tekniklerinden gürültü azaltma
teknigiyle istenilen formata dönüstürülmesi ve sisteme (1) baglantisi saglanir. Bu
asamada dalgacik dönüsümleri ile veriler ön islemeye tabii tutulur. Ikinci adim olarak;
yigilmis otoenkoder kullanimi ile birden fazla otomatik kullanici kullanilmasi düsünülerek
sistemin (1) otomatik kodlayicilar ile desteklenmesi ve sonraki verilerin tahmin edilip
gösterilmesi saglanmaktadir. Üçüncü adim olarak; LSTM algoritmasin ve algoritma
bilesenlerinden tekrarlayan hafizanin kullanilmaktadir. Bunun sonucunda uzun kisa
süreli bellek mekanizmasi isletilmekte ve verilerin gösterilmesi ile zamansal olarak belirli
periyodlar sürecinde trend egilimi hesaplanmaktadir.
Olusturma modülü (2) veri tabani baglantilarini yapmakta ve veri setini sisteme (1) dahil
etmektedir. Olusturma modülü (2); veri tabani baglantisinin yapilmasi kapsaminda bir
veri tabani ile iletisim kurulabilmesi için gerekli olan islemleri gerçeklestirmektedir.
Olusturma modülü (2); veri tabani baglantisi üzerinden veri seçimlerini yapmakta ve bu
seçimleri kullanicinin ihtiyaç ve özelliklerine göre gerçeklestirmektedir. Olusturma
modülü (2); MySQL, PostreSQL, MongoDB, SQLite ve MSSQL gibi farkli veri tabani
sunuculari ile baglanti kuracak sekilde veri tabani baglantilarina sahiptir. Olusturma
modülü (2); veri tabani ve veri seti seçilmesi islemlerinin ardindan baglanti dizisi
olusturma islemlerini kullanicilarin SOL dili bilmesine gerek olmadan yapmaktadir.
Olusturma modülü (2); kullanicinin önergeleri takip ederek veri tabani türü, sunucu
adresi, kullanici adresi ve diger parametreleri girerek baglanti kurmasini saglamaktadir.
Dönüstürme modülü (3); olusturma modülü (2) vasitasiyla olusturulan veri setleri
üzerinde dönüstürme islemlerini yapmaktadir. Dönüstürme modülü (3); verilerin
baslangiç halinden kullanicinin ihtiyacina uygun istedigi formata veya yapilara
dönüstürmektedir. Dönüstürme modülü (3); bu dönüsüm sayesinde veri setinin dahil
edilecegi algoritma içerisinde daha iyi analiz edilmesini ve uygun hale getirilmesini
saglamaktadir. Ayrica yine veri seti içerisinde eksik veya hatali görülen verilerin
düzeltilmesi, normalizasyon ve standartlastirma islemleri dönüstürme modülünde (3)
gerçeklestirilmektedir. Dönüstürme modülünde (3) olusturulan sonuç verileri veri
dönüsümü islemlerinin uygulandigi ve genellikle ön isleme sonrasinda nihai olarak
ortaya çikan veri kümesidir. Dönüstürme modülü (3); dönüsümü yapilmis sonuç
verilerini, islenmis olarak sonraki adimlarda uygulanan veri egitimi ve veri testine
Ayirma modülü (4); sistem (1) kullanicilari tarafindan baglanti saglanarak veya manuel
olarak sisteme (1) eklenecek olan veri/veri setleri için ayirici görevini üstlenmektedir.
Ayirma modülü (4); zaman degisimine göre tahminlenmesi istenen veriler üzerinde
bölümleme yapilmasini saglayarak farkli veri segmentlerinin olusturulmasini
gerçeklestirmektedir. Ayirma modülü (4); bölümledigi veriler için egitim, test ve
dogrulama asamalari yapilmaktadir. Bu nedenle ayirma modülü (4); bu veriler için model
gelistirilmesi çalismalarini gerçeklestirmektedir. Ayirma modülü (4); yaptigi çalismalar
neticesinde kullaniciya uygun olacak formatlarda veri ayriminin yapilabilmesini ve
verilerin ihtiyaca yönelik olarak ayrilarak algoritmaya dahil edilebilmesini saglamaktadir.
Egitme modülü (5); zaman serisi analizi yapan modelin egitimini gerçeklestirmektedir.
Egitme modülü (5); ilk olarak modelin egitimine katilacak olan verileri seçmektedir.
Egitme modülünün (5); seçtigi veriler özellikle kullanicinin üzerinde çalismak ve analiz
yapabilmek istedigi verilerdir. Egitme modülü (5); egitim sürecinde veri bölümlenmesini
gerçeklestirir. Egitme modülü (5); islenecek olan egitim verileri haricinde dogrulama ve
test verilerini olusturur. Egitme modülü (5); egitime dahil edilen veriler üzerinde
regresyon, segmentasyon ve kümeleme analizi yöntemlerini uygular. Egitme modülü (5);
bu üç yöntemi veriler üzerinde ayristirma problemleri için kullanir. Egitme modülü (5);
egitim verileri için hiperparemetre ayarlamalarini yapar. Egitim sonrasinda modelin
dogrulanmasi ve test edilmesi için sonraki adimlara geçilir ve model dagitilir.
Dogrulama modülü (6); modelin egitim sirasinda performansinin degerlendirilmesi
amaciyla bölümlenen veri setini islemektedir. Dogrulama modülü (6) egitme modülünde
(5) egitilen modelin ürettigi sonuçlarin dogrulanmasini yapmaktadir. Dogrulama modülü
(6); kullanicidan alinan parametre degerleri ile dogrulama setini olusturur. Dogrulama
modülünün (6) olusturdugu dogrulama seti, modelin gördügü ancak egitimde
kullanilmayan verilerden olusur. Dogrulama modülü (6); modelin dogrulama seti
üzerindeki performansini takip eder. Dogrulama modülü (6); degerlendirme yapilan
model için sorunlar varsa rapor hazirlar ve yeniden egitim asamasi ve hata orani ölçümü
için geri bildirim olusturur. Dogrulama modülü (6); sorunlarin tespit edilmesi ve
degerlendirilmesi için performans ölçütlerini belirler. Dogrulama modülü (6); performans
ölçütlerini dogruluk ve hassasiyet fonksiyonlarina ek olarak geri çagirma skoru üzerinden
hesaplamaya dahil eder.
Test etme modülü (7); veri setinin boyutunu, özelliklerini, dagilimlarini ve temel
istatistiksel bilgilerinin elde edilmesini saglamaktadir. Test etme modülü (7); egitim ve
dogrulama asamalarini geçen verilerin anormal ve aykiri degerlerini tespit etmekte, eksik
degerlerin isteniliyorsa doldurularak modele aktarilmasini saglamakta ve veri setinde
bulunan degiskenlerin dagilimlarini ve bazi istatistiksel testlerin uygulanmasini
gerçeklestirmektedir. Test etme modülü (7); veri setinde bulunan degiskenler arasindaki
iliskileri belirler. Test etme modülü (7); veri üzerinde istatistiksel testler de uygular.
Degerlendirme modülü (8); modelin egitim seti disinda bulunan veriler üzerinde ne kadar
iyi performans gösterdiginin kontrollerinin yapilmasini saglamaktadir. Degerlendirme
modülü (8); degerlendirme sürecinde yeniden performans metriklerini belirler.
Degerlendirme modülünün (8) belirledigi performans metrikleri dogruluk ve hassasiyet
fonksiyonu ile birlikte geri çagirma yöntemidir. Degerlendirme modülü (8); model
üzerinde kosturulan verilerin siniflandirilmasi problemlerini ele alir. Degerlendirme
modülü (8); siniflarin dogrulugunu ögrenebilmek için karmasiklik matrisinden faydalanir.
Degerlendirme modülü (8); yanlis siniflandirilmis ve kategorize edilmis verileri raporlar.
Degerlendirme modülü (8); modelin performansini arttirilmasina kati saglar.
Degerlendirme asamasini geçen veriler zaman serisi analizi için sonraki asamaya
aktarili r.
Ayrik dalgacik dönüsüm islemleri modülü (9); sistem (1) içerisine alinacak olan verileri
daha küçük veri parçaciklarina veya veri kümelerine bölebilmek için kullanilmaktadir.
Ayrik dalgacik dönüsüm islemleri modülü (9); verilerin kullanima uygun formatlara
dönüstürülebilmesi için sinyal isleme, görüntü isleme veya veri sikistirma matematiksel
islemlerinin yapilmasini saglayarak verilerin ölçek bakimindan analize tabi tutulmasini
saglamaktadir. Ayrica ayrik dalgacik dönüsüm islemleri modülü (9); sisteme (1) girdi
olarak saglanacak veriler arasindaki farklilar için yüksek ve düsük frekans ayriminin
yapilmasini ve performans ölçütü için ayrik dalgacik dönüsümü islemi üzerinden
ayarlamalarin yapilmasini saglamaktadir. Ayrik dalgacik dönüsüm islemleri modülü (9);
özellikle veriler arasindaki ayrisimi net sekilde ortaya koyabilmek için ölçekleme
fonksiyonu olarak kullanilan ayrik dalgacik dönüsümnün ölçekleme ve dalgacik
fonksiyonundan faydalanmaktadir.
Sistemde (1) veri görsellestirme araci üzerinde zaman serisi analizi yöntemi ile verilerin
belirli periyodlarda incelenebilmesi ana hedeftir. Bu bakimdan sisteme (1) katki saglayan
ve önerilen model içerisinde faydalanilan bir diger bilesen sirali otoenkoder islemleri
modülü (10) kullanilmistir. Sirali otoenkoder islemleri modülü (10); yapay sinir aglari
otokodlayici türevindedir. Sirali otoenkoder islemleri modülü (10); sunulan model
çalismasi içerisinde derin ögrenme yöntemi olarak katki saglamaktadir. Sirali
otoenkoder islemleri modülü (10); özellikle kullanicilarin sisteme (1) entegre edecekleri
veri/veri setleri üzerinden girdi verilerinin temsilini arka planda tutmak kaydiyla özellik
vektörleri hakkinda bilgi edinmelerini saglamaktadir. Sirali otoenkoder islemleri modülü
(10); modelin egitim sürecinde bu olusturulan vektör özellikleri kullanilarak orijinal verinin
tahmin edilmesi ve öngörülebilmesi için yeniden olusturulmasini saglamaktadir. Bu
sayede sirali otoenkoder islemleri modülü (10); sistem (1) içerisinde egitime alinacak
olan veriler üzerinde hiyerarsik düzeni saglamakta ve karmasik yapilarin çözümünü
kolaylastirmaktadir. Sirali otoenkoder islemleri modülü (10); giris verisi ve çikis verisi
arasinda bu veri özellik çikarimlarini ve dönüsüm islemlerini tamamlamaktadir. Sirali
otoenkoder islemleri modülü (10); özellikle parçadan bütüne dogru bir isleyis ile veri
bölümlenmesi, veri boyunun indirgenmesi, veri hatalarinin azaltilmasi gibi girdi verisi ile
çikti verisi arasindaki islemleri gerçeklestirir.
Uzun kisa süreli bellek islemleri modülü (11); görsellestirilmesi düsünülen ve zaman
bilgisi içeren veriler için zaman serisi tahminlerinin yapilmasi için kullanilmaktadir. Uzun
kisa süreli bellek islemleri modülü (11); zaman serisi modelleri için gözetimsiz makine
ögrenimi algoritmalarinin gelistirilmesini ve böylelikle dogru zaman serisi modellerinin
tahmin edilebilmesini saglamaktadir. Uzun kisa süreli bellek islemleri modülü (11) tabanli
algoritma sonuçlarinin iyilestirilmesi için de Genetik Algoritmalar (GA - Genetic
Algorithms) kullanilmistir. Yöntem fark etmeksizin sayisal zaman serisi verileri isleyen
ileri analitik uygulamalarin islem süreçlerindeki öne çikan konular; önisleme adiminda
gürültü giderme, öznitelik mühendisligi adiminda öznitelik seçme ve çikartma ve
tahminleyici model olusturma olmustur. Çalisma alaninin derinligi ve yaklasimlarin
çesitliligi sebebiyle tüm adimlar, seçilen veya uygulanan yöntemler yönünden
gelistirilmeye açiktir. Bazi yapay sinir aglari geri yayilim seklinde ögrenme yapisi
gelistirmektedir. Çok parametre içeren veriler üzerinde ise en dogru kümeleme analizi
yöntemleri ile veri ön isleme çalismalarinin dogrusal olmayan fonksiyonlar kullanimi ile
elde edilmesi gerekmektedir . Veriye dayali özellikler ve zamansal kestirim
tahminlemeleri zaman verileri araciligiyla elde edilir. Zaman serisi verileri üzerinde
tahminler yapilirken özellikle finansal veriler üzerinde kullanilmalari durumunda bulanik
modeller, otoregresif bütünlesmis hareketli ortalama (ARIMA) kullanilmasi
önerilmektedir .
Sistemde (1) zaman serisi verileri analizi ve tahmininde regresyon tabanli (lineer
regresyon ve türevleri) kestirim yöntemleri, derin ögrenme tabanli (LSTM (11) ve
türevleri) kestirim yöntemleri, istatistiksel analiz modeli (ARIMA, SARIMA vb.) tabanli
kestirim yöntemleri kullanilmis ve model üzerinde uygulanmistir.
Sistemde (1) Web arayüzü üzerinde bulunan fonksiyonalite saglayacak teknolojiler
Python, React.js, typescript, html, css kullanimi ile tamamlanmistir. Bu sayede gerekli
kullanici arayüzleri, konfigürasyonlar, rol ve kimlik yönetimi gibi arayüz gereklilikleri
saglanmaktadir. Yazilim mimarisi olarak, servis tabanli mimari seçilmesi, yazilimin
modüler, genisleyebilir, tekrar kullanilabilir ve bakimi kolay yapilabilir olmasini da
saglamaktadir. Bu kapsamda mikroservis mimarisinde, RESTfuI tabanli servisler
kullanilmistir.
Sistemde (1); makine ögrenimi saglayacak algoritmalarin gelistirilmesinde, istatistiksel
veri analizi, kümeleme algoritmalari, regresyon analizi yöntemleri uygulanmistir.
Denetimsiz olarak uygulanacak olan kümeleme algoritmalari ile verilerin profillerinin ve
segmentlerin olusturulmasi saglanmistir. Lineer regresyon yöntemi ile veriler arasindaki
iliskiler modellenmis ve algoritma en dogru elde edilen öznitelik ve bilgilerden
beslenmistir.
Çapraz dogrulama modülü (12); modelin performansini degerlendirmek ve genelleme
yetenegini kontrol etmek için geriye yönelik çapraz dogrulama islemini
gerçeklestirmektedir. Çapraz dogrulama modülü (12); veri setini farkli parçalara böler ve
modelin farkli alt kümeler üzerinde test edilmesini saglar. Çapraz dogrulama modülü
(12); çapraz dogrulama sonuçlarini inceleyerek, modelin belirli bir veri setine asiri
uyarlanma (overfitting) veya yetersiz uyum (underfitting) gösterip göstermedigini inceler.
Çapraz dogrulama modülü (12); raporlama yaparak çapraz dogrulama iterasyonlarini
tamamladiktan sonra, elde edilen performans ölçütlerinin ortalamasini ve standart
sapmasini hesaplar. Çapraz dogrulama modülü (12); raporlarin sonucuna göre
egitimlerin yeniden test edilmesi kararini kullanicya birakir.
Hata orani ölçüm modülü (13); bir siniflandirma modelinin yanlis siniflandirma yaptigi
orani hesaplamaktadir. Hata orani ölçüm modülü (13); hata oranini hesaplamak için,
gerçek degerlerle tahmin edilen degerler arasindaki farklari degerlendiren bir ölçüm
yapar. Hata orani ölçüm modülü (13); hata ölçüm metrikleri olarak RMSE (Root Mean
Square Error) ve MAPElyi (Mean Absolute Percentage Error) kullanmaktadir.
Veri görsellestirme modülü (14); verilerin görsellestirilmesi sonucunda simülasyonun
elde edilmesini saglamaktadir. Veri görsellestirme modülü (14); zaman serisi analizi
sonucunda sisteme (1) entegre edilen verilerin yapilan parametre ayarlari sonrasinda
gerçeklesmesi beklenen sürecin veya olayin zaman içerisindeki degisimlerini
modelleyen ve gelecekteki durumlari hakkinda kullaniciya fikir saglayan simülasyonu
olusturmaktadir. Veri görsellestirme modülü (14); simülasyon çalismasi için grafik
çizgilerden faydalanmakta ve verilerin görsellestirilmesini saglamaktadir.
Önerilen sistem (1); Telekomünikasyon, E-ticaret, finans, saglik, sigortacilik ve bunun
gibi endüstrilerde üretilmekte olan veri kümelerinin önemini daha iyi ifade edebilmek ve
veriler içerisindeki gizli desenleri ortaya çikararak anlamlandirabilmek için makine
ögrenimi ve derin ögrenme teknikleri kullanilarak, görsel ögelerin yardimi ile (grafikler,
çizgiler, haritalar, tablolar vb.) bir veri görsellestirme yaziliminin tasarlanmasi ve
gelistirilmesini gerçeklestirmektedir. Ayrica sistem (1); özellikle bilgisayar bilimlerinde
geçmisi olmayan kullanicilar ve karar vericilerin, yapay zeka destekli öngörü
yaklasimlariyla ve etkilesimli-interaktif görsellestirme ile, analitik verileri hizli ve etkili bir
sekilde kavramasini saglayabilmektedir. Bulusta; farkli veri kümeleri üzerindeki degerli
bilgilerin çikarilmasi esnasinda es zamanli olarak veri kalitesinin ortaya konulabilmesi,
veri kalitesi iyilestirme önerileri yapabilmesi ve veri profillemesi için bir sistemin (1)
gelistirilmesi planlanmistir. Sistemde (1); üretilen büyük miktarda verinin
görsellestirilmesi ve görsellestirme süreçlerinde dönemsel olarak veri içindeki veri
gruplarinin tespiti ile öngörü saglayici karar mekanizmasi önerilmistir. Sistemde (1);
verilerin dagiliminin ne oldugunu dinamik olarak tespit edebilen, kullanicilarin verilerini
tek tek farkli veri analizi yöntemlerini kullanarak deneyen ve kullanicinin zaman
kaybetmesini önleyen, en dogru veri analizi yöntemini onlar için seçen, tanimlayici ve
kesifsel istatistiksel veri analizinde kullanilan hesaplamalari yapabilen, zaman serisi
verileri üzerinde tahminler yapabilen ve veri kalitesini iyilestirme önerileri yapabilen, bir
veri görsellestirme yazilimi tasarlanmistir. Bu yazilim; zaman serisi verilerinin bir bütün
halinde, gelistirilecek tekrarli yapay sinir aglari modülüne girdi olarak verilip, zaman serisi
modelleri elde edilmesini, elde edinen yapay zeka modelleri sayesinde bir zaman serisi
tahmin araci özelligi gelistirilmesini ve bu özelligin önerilen veri görsellestirme aracina
entegrasyonunu içermektedir.
Claims (2)
- STEMLER 1. Yazilim tabanli raporlama araci uygulamasi sekilnde çalisan ve çalisip veri görseIIestirme alaninda zaman serisi analizi yapan bir veri görseIIestirme sistemi (1) olup, özelligi; farkli veri tabani sunuculari ile baglanti kurarak ham verileri alan ve bu ham verilerden kullanicinin talebine göre veri seti olusturup sisteme (1) dahil eden olusturma modülü (2), olusturma modülünde (2) olusturulmus veri setIerini dalgacik dönüsümleri ile ön islemeye tabi tutan, gürültü azaltma teknigini kullanarak verileri istenilen formata dönüstüren ve verilerin sisteme (1) baglantisini saglayan dönüstürme modülü (3), sistem (1) kullanicilari tarafindan baglanti saglanarak veya manuel olarak sisteme (1) eklenecek olan veri/veri setIeri için ayirici görevini üstlenen, zaman degisimine göre tahminlenmesi istenen veriler üzerinde bölümleme yapilmasini saglayarak farkli veri segmentIerinin olusturulmasini saglayan, kullanicinin ihtiyacina uygun olacak formatlarda veri ayrimi yapan ayirma veri ayirici modüIde (4) gelistirilen model sayesinde ayrimi yapilmis veriler üzerinde çalisan, her bir veri setinin ayristilarak segmenteIerine ayrilmasini ve veri setIeri ile ilgili ön bilginin tutulmasini, böerIikIe verilerin pozisyonlandirilmasina katki saglayan “segmentasyon analizini”, veri seti içerisinde yer alan bagimli degisken iIe bagimsiz degisken arasindaki dogrusal iliskiyi modellemeyi, model üzerinde hata oranini en aza indirgemek için çizgiler çizmeyi ve raporlamayi saglayan “regresyon analizini” ve veri ön isleme çalismalarinin dogrusal olmayan fonksiyonlar kullanimi ile elde edilmesini saglayan “kümeleme analizini” gerçeklestiren ve bu analizler sayesinde verilerin egitimesini saglayan egitme modülü (5), veri ayirici modüIde (4) gelistirilen model sayesinde ayrimi yapilmis veriler üzerinde çalisan, veri egitimi modülünde (5) egitiIen modelin ürettigi sonuçlarin dogrulanmasini gerçeklestiren, veri profiIIeme islemini gerçeklestirerek bir veri kümesini anlayan ve tanimlayan, veri kümesinde bulunan özeIIikIeri, desenleri, eksik degerleri ve diger istatistiksel özeIIikIeri beIirIeyen dogrulama modülü (6), veri ayirici modülde (4) gelistirilen model sayesinde ayrimi yapilmis veriler üzerinde çalisan, veri setinin boyutunu, özelliklerini, dagilimlarini ve temel istatistiksel bilgileri edilmesini saglayan test etme modülü (7), dogrulama modülünde (6), dogrulanmasi gerçeklestirilmis olan veriler üzerinde çalisan, veri ayirici modülde (4) gelistirilen modelin egitim seti disinda bulunan veriler üzerinde ne kadar iyi performans gösterdiginin kontrollerini gerçeklestiren degerlendirme modülü (8), egitme modülü (5), dogrulama modülü (6), test etme modülü (7) ve degerlendirme modülünde (8) egitimi, dogrulanmasi, testi ve degerlendirmesi gerçeklestirilmis veriler üzerinde ayrik dalgacik dönüsümü (DWT - Discrete Wavelet Transform) islemini gerçeklestiren, sinyal isleme, görüntü isleme veya veri sikistirma matematiksel islemlerini yaprak verileri kullanima uygun formatlara dönüstüren, verileri ölçek bakimindan analize tabi tutan, sisteme (1) girdi olarak kullanilan veriler arasindaki farklilar için yüksek ve düsük frekans ayriminin yapilmasini ve sistem (1) performans ölçütü için ayarlamalarin yapilmasini saglayan, ayrik dalgacik dönüsümünün ölçekleme ve dalgacik fonksiyonundan faydalanarak veriler arasindaki ayrisimi net sekilde ortaya koyan ayrik dalgacik dönüsüm islemleri modülü (9), ayrik dalgacik dönüsüm islemleri modülünde (9) dalgacik dönüsüm islemleri gerçeklestirilmis veriler üzerinde çalisan, yapay sinir aglari otokodlayici türevi olan yigilmis otomatik kodlayicilari (SA - Stacked Autoencoders) kullanan ve bu sayede zaman serisi analizi yöntemi ile verilerin belirli periyodlarda incelenebilmesini saglayan sirali otoenkoder islemleri modülü (10), sirali otoenkoder islemleri modülünde (10) derin ögrenime sunulmus veriler üzerinde çalisan, uzun kisa süreli bellek (LSTM - Long-Short Term Memory) algirtmasini ve LSTM algoritma bilesenlerinden tekrarlayan hafizayi kullanan, bu sayede uzun kisa süreli bellek mekanizmasini isleten ve zaman içerisinde degisen verilerin ögrenilmesini saglayan, girdi verisi ile çikti verisi arasindaki farki hesaplayan ve kullanici raporlarinda bu farka yer veren, bu sayede karar destek özelligi ile kullaniciya kolaylik saglayarak kullanicinin girdi verisi ile çikti verisi arasindaki degisimi görmesini saglayan uzun kisa süreli bellek islemleri modülü (11), saglayan egitme modülü (5), dogrulama modülü (6), test etme modülü (7), degerlendirme modülü (8), ayrik dalgacik dönüsüm islemleri modülü (9) ve uzun kisa süreli bellek islemleri modülünden (11) sonuç verilerini alan, modelin performansini degerlendirmek ve genelleme yetenegini kontrol etmek için kullanilan, egitimi, dogrulanmasi, test edilmesi tamamlanmis tüm veriler için geriye yönelik çapraz dogrulama testlerini gerçeklestiren ve bu testleri kullaniciya sunarak kullanicinin model egitimlerinin yeniden test edilip edilmemesine yönelik karar vermesini saglayan çapraz dogrulama çapraz dogrulama modülünden (12) gerçek degerleri ve tahmin yapilan degerleri alan, bu degerler arasindaki farklari degerlendirerek hata orani ölçümlemesini yapan hata orani ölçüm modülü (13) ve çapraz dogrulama modülü (12) ve hata orani ölçüm modülünden (13) iletilen veriler üzerinde zaman serisi analizini gerçeklestiren, zaman serisi analizi sayesinde sisteme (1) aktarilan veri setlerinin grafiksel olarak incelenebilmesine olanak saglayan, kullaniciya gösterdigi grafiksel analiz vasitasiyla verideki degisimleri, egilimleri ve belirli periyodlar arasindaki varyasyonlari kullanicinin tercihine sunan veri görsellestirme modülü (14) içermesidir.
- 2. Istem 1,e uygun bahsedilen sistem (1) olup, özelligi; veri tabani baglantilarini yapan ve veri setini sisteme (1) dahil eden, veri tabani baglantisinin yapilmasi kapsaminda bir veri tabani ile iletisim kurulabilmesi için gerekli olan islemleri gerçeklestiren, veri tabani baglantisi üzerinden veri seçimlerini yapan ve bu seçimleri kullanicinin ihtiyaç ve özelliklerine göre gerçeklestiren, MySQL, PostreSQL, MongoDB, SQLite ve MSSQL gibi farkli veri tabani sunuculari ile baglanti kuracak sekilde veri tabani baglantilarina sahip olan, veri tabani ve veri seti seçilmesi islemlerinin ardindan baglanti dizisi olusturma islemlerini kullanicilarin SQL dili bilmesine gerek olmadan yapan kullanicinin önergeleri takip ederek veri tabani türü, sunucu adresi, kullanici adresi ve diger parametreleri girerek baglanti kurmasini saglayan olusturma modülü (2) içermesidir. Istem 1,e uygun bahsedilen sistem (1) olup, özelligi; olusturma modülü (2) vasitasiyla olusturulan veri setleri üzerinde dönüstürme islemlerini yapan, verilerin baslangiç halinden kullanicinin ihtiyacina uygun istedigi formata veya yapilara dönüstüren, bu dönüsüm sayesinde veri setinin dahil edilecegi algoritma içerisinde daha iyi analiz edilmesini ve uygun hale getirilmesini saglayan, ayrica yine veri seti içerisinde eksik veya hatali görülen verilerin düzeltilmesi, normalizasyon ve standartlastirma islemlerini gerçeklestiren, veri dönüsümü islemlerinin uygulandigi ve genellikle ön isleme sonrasinda nihai olarak ortaya çikan veri kümesi seklinde sonuç verilerini olusturulan yapilmis sonuç verilerini, islenmis olarak sonraki adimlarda uygulanan veri egitimi ve veri testine gönderen dönüstürme modülü (3) içermesidir. Istem 1,e uygun bahsedilen sistem (1) olup, özelligi; sistem (1) kullanicilari tarafindan baglanti saglanarak veya manuel olarak sisteme (1) eklenecek olan veri/veri setleri için ayirici görevini üstlenen, zaman degisimine göre tahminlenmesi istenen veriler üzerinde bölümleme yapilmasini saglayarak farkli veri segmentlerinin olusturulmasini gerçeklestiren, bölümledigi veriler için egitim, test ve dogrulama asamalarinin yapilmasini saglayan, bu veriler için model gelistirilmesi çalismalarini gerçeklestiren ve yaptigi çalismalar neticesinde kullaniciya uygun olacak formatlarda veri ayriminin yapilabilmesini ve verilerin ihtiyaca yönelik olarak ayrilarak algoritmaya dahil edilebilmesini saglayan Istem 1,e uygun bahsedilen sistem (1) olup, özelligi; zaman serisi analizi yapan modelin egitimini gerçeklestiren, ilk olarak modelin egitimine katilacak olan verileri seçen, özellikle kullanicinin üzerinde çalismak ve analiz yapabilmek istedigi verileri egitim sürecinde veri bölümlenmesini gerçeklestiren, islenecek olan egitim verileri haricinde dogrulama ve test verilerini olusturan, egitime dahil edilen veriler üzerinde regresyon, segmentasyon ve kümeleme analizi yöntemlerini uygulayan, bu üç yöntemi veriler üzerinde ayristirma problemleri için kullanan ve egitim verileri için hiperparemetre ayarlamalarini yapan 6. Istem 1,e uygun bahsedilen sistem (1) olup, özelligi; modelin egitim sirasinda performansinin degerlendirilmesi amaciyla bölümlenen veri setini isleyen, egitme modülünde (5) egitilen modelin ürettigi sonuçlarin dogrulanmasini kullanicidan alinan parametre degerleri ile dogrulama setini olusturan, modelin gördügü ancak egitimde kullanilmayan verilerden olusan dogrulama setini olusturan, modelin dogrulama seti üzerindeki performansini takip eden, degerlendirme yapilan model için sorunlar varsa rapor hazirlaryan ve yeniden egitim asamasi ve hata orani ölçümü için geri bildirim olusturan, sorunlarin tespit edilmesi ve degerlendirilmesi için performans ölçütlerini belirleyen ve performans ölçütlerini dogruluk ve hassasiyet fonksiyonlarina ek olarak geri çagirma skoru üzerinden hesaplamaya dahil eden dogrulama modülü (6) içermesidir. 7. Istem 1,e uygun bahsedilen sistem (1) olup, özelligi; veri setinin boyutunu, özelliklerini, dagilimlarini ve temel istatistiksel bilgilerinin elde edilmesini saglayan, egitim ve dogrulama asamalarini geçen verilerin anormal ve aykiri degerlerini tespit eden, eksik degerlerin isteniliyorsa doldurularak modele aktarilmasini saglayan ve veri setinde bulunan degiskenlerin dagilimlarini ve bazi istatistiksel testlerin uygulanmasini gerçeklestiren, veri setinde bulunan degiskenler arasindaki iliskileri belirleyen ve veri üzerinde istatistiksel testler de uygulayan test etme modülü (7) içermesidir. 8. Istem 1,e uygun bahsedilen sistem (1) olup, özelligi; modelin egitim seti disinda bulunan veriler üzerinde ne kadar iyi performans gösterdiginin kontrollerinin yapilmasini saglayan, degerlendirme sürecinde yeniden performans metriklerini belirleyen, belirledigi performans metrikleri dogruluk ve hassasiyet fonksiyonu ile birlikte geri çagirma yöntemi seklinde performans metriklerini belirleyen, model üzerinde kosturulan verilerin siniflandirilmasi problemlerini ele alan, siniflarin dogrulugunu ögrenebilmek için karmasiklik matrisinden faydalanan, yanlis siniflandirilmis ve kategorize edilmis verileri raporlayan ve modelin performansini arttirilmasina kati saglayan degerlendirme modülü (8) içermesidir. 9. Istem 1,e uygun bahsedilen sistem (1) olup, özelligi; sistem (1) içerisine alinacak olan verileri daha küçük veri parçaciklarina veya veri kümelerine bölebilmek için kullanilan, verilerin kullanima uygun formatlara dönüstürülebilmesi için sinyal isleme, görüntü isleme veya veri sikistirma matematiksel islemlerinin yapilmasini saglayarak verilerin ölçek bakimindan analize tabi tutulmasini saglayan, sisteme (1) girdi olarak saglanacak veriler arasindaki farklilar için yüksek ve düsük frekans ayriminin yapilmasini ve performans ölçütü için ayrik dalgacik dönüsümü islemi üzerinden ayarlamalarin yapilmasini saglayan özellikle veriler arasindaki ayrisimi net sekilde ortaya koyabilmek için ölçekleme fonksiyonu olarak kullanilan ayrik dalgacik dönüsümnün ölçekleme ve dalgacik fonksiyonundan faydalanan ayrik dalgacik dönüsüm islemleri modülü (9) içermesidir. 10. Istem 1,e uygun bahsedilen sistem (1) olup, özelligi; 15 .to yapay sinir aglari otokodlayici türevinde olan, sunulan model çalismasi içerisinde derin ögrenme yöntemi olarak katki saglamayan, özellikle kullanicilarin sisteme (1) entegre edecekleri veri/veri setleri üzerinden girdi verilerinin temsilini arka planda tutmak kaydiyla özellik vektörleri hakkinda bilgi edinmelerini saglayan, modelin egitim sürecinde olusturulan vektör özellikleri kullanilarak orijinal verinin tahmin edilmesi ve öngörülebilmesi için yeniden olusturulmasini saglayan, sistem (1) içerisinde egitime alinacak olan veriler üzerinde hiyerarsik düzeni saglayan ve karmasik yapilarin çözümünü kolaylastiran, giris verisi ve çikis verisi arasinda bu veri özellik çikarimlarini ve dönüsüm islemlerini tamamlayan ve özellikle parçadan bütüne dogru bir isleyis ile veri bölümlenmesi, veri boyunun indirgenmesi, veri hatalarinin azaltilmasi gibi girdi verisi ile çikti verisi arasindaki islemleri gerçeklestiren sirali otoenkoder islemleri modülü (10) içermesidir. 11. Istem 1,e uygun bahsedilen sistem (1) olup, özelligi; 20 '1' görsellestirilmesi düsünülen ve zaman bilgisi içeren veriler için zaman serisi tahminlerinin yapilmasi için kullanilan, zaman serisi modelleri için gözetimsiz makine ögrenimi algoritmalarinin gelistirilmesini ve böylelikle dogru zaman serisi modellerinin tahmin edilebilmesini saglayan ve sahip oldugu algoritma sonuçlarinin iyilestirilmesi için Genetik Algoritmalari (GA - Genetic Algorithms) kullanan uzun kisa süreli bellek islemleri modülü (11) içermesidir. 12. Istem 1,e uygun bahsedilen sistem (1) olup, özelligi; modelin performansini degerlendirmek ve genelleme yetenegini kontrol etmek için geriye yönelik çapraz dogrulama islemini gerçeklestiren, veri setini farkli parçalara bölen ve modelin farkli alt kümeler üzerinde test edilmesini saglayan, çapraz dogrulama sonuçlarini inceleyerek, modelin belirli bir veri setine asiri uyarlanma (overfitting) veya yetersiz uyum (underfitting) gösterip göstermedigini inceleyen, raporlama yaparak çapraz dogrulama iterasyonlarini tamamladiktan sonra, elde edilen performans ölçütlerinin ortalamasini ve standart sapmasini hesaplayan ve raporlarin sonucuna göre egitimlerin yeniden test edilmesi kararini kullanicya birakan çapraz dogrulama modülü (12); içermesidir. 13. Istem 1,e uygun bahsedilen sistem (1) olup, özelligi; bir siniflandirma modelinin yanlis siniflandirma yaptigi orani hesaplayan, hata oranini hesaplamak için, gerçek degerlerle tahmin edilen degerler arasindaki farklari degerlendiren bir ölçüm yapan ve hata ölçüm metrikleri olarak RMSE (Root Mean Square Error) ve MAPElyi (Mean Absolute Percentage Error) kullanan hata orani ölçüm modülü (13) içermesidir. 14. Istem 1,e uygun bahsedilen sistem (1) olup, özelligi; 20 '1' verilerin görsellestirilmesi sonucunda simülasyonun elde edilmesini saglayan, zaman serisi analizi sonucunda sisteme (1) entegre edilen verilerin yapilan parametre ayarlari sonrasinda gerçeklesmesi beklenen sürecin veya olayin zaman içerisindeki degisimlerini modelleyen ve gelecekteki durumlari hakkinda kullaniciya fikir saglayan simülasyonu olusturan ve simülasyon çalismasi için grafik çizgilerden faydalanan ve verilerin görsellestirilmesini saglayan veri görsellestirme modülü (14) içermesidir.
Publications (1)
Publication Number | Publication Date |
---|---|
TR2024000874A2 true TR2024000874A2 (tr) | 2024-04-22 |
Family
ID=
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Saelens et al. | A comparison of single-cell trajectory inference methods | |
Qian et al. | A review on autoencoder based representation learning for fault detection and diagnosis in industrial processes | |
US20220027762A1 (en) | Predictive maintenance model design system | |
Zhai et al. | Enabling predictive maintenance integrated production scheduling by operation-specific health prognostics with generative deep learning | |
CN114139589A (zh) | 故障诊断方法、装置、设备与计算机可读存储介质 | |
Zhou et al. | Aero-engine prognosis strategy based on multi-scale feature fusion and multi-task parallel learning | |
CN116416884A (zh) | 一种显示器模组的测试装置及其测试方法 | |
Hajgató et al. | PredMaX: Predictive maintenance with explainable deep convolutional autoencoders | |
Qi et al. | Application of EMD combined with deep learning and knowledge graph in bearing fault | |
CN111160393A (zh) | 一种基于数据驱动的运载火箭健康评估模型模块化建模方法 | |
CN117216419B (zh) | 基于ai技术的数据分析方法 | |
Martins et al. | Prediction maintenance based on vibration analysis and deep learning–A case study of a drying press supported on a hidden Markov model | |
Bect et al. | Identification of abnormal events by data monitoring: Application to complex systems | |
Burt et al. | Moderation and mediation in behavioural accounting research | |
Bond et al. | A hybrid learning approach to prognostics and health management applied to military ground vehicles using time-series and maintenance event data | |
TR2024000874A2 (tr) | Bi̇r veri̇ görselleşti̇rme si̇stemi̇ | |
CN116307765A (zh) | 一种人工智能政务数据评审方法及系统 | |
Longo | Explainable Artificial Intelligence: First World Conference, xAI 2023, Lisbon, Portugal, July 26–28, 2023, Proceedings, Part II | |
Yeon et al. | Visual imputation analytics for missing time-series data in bayesian network | |
Amirian et al. | Data science and analytics | |
CN116186507A (zh) | 一种特征子集的选取方法、装置及存储介质 | |
Leegwater et al. | From data to a validated score-based LR system: a practitioner’s guide | |
Bect et al. | Diagnostic and decision support systems by identification of abnormal events: Application to helicopters | |
US20220188647A1 (en) | Model learning apparatus, data analysis apparatus, model learning method and program | |
Suresh et al. | Predicting the e-learners learning style by using support vector regression technique |