Zaman serisi çapraz doğrulama: purged k-fold ve embargo
Zaman Serisi Çapraz Doğrulama
Zaman serisi verileriyle çalışırken, klasik çapraz doğrulama yöntemleri yetersiz kalabilir. Çünkü zaman bağımlılığı vardır ve veriler sıralıdır. Bu nedenle özel yöntemler geliştirilmiştir.Purged K-Fold
Purged k-fold yönteminde, veriler k katmana bölünür. Ancak her katmandan sonra önceki verilerin etkisini azaltmak için bir temizlik işlemi yapılır. Bu, modelin öğrenmesini etkileyen geçmiş verilerin kullanılmasını engeller.- Veriler k katmana bölünür.
- Her katmanda, önceki katmanın verileri purged edilir.
- Bu, aşırı uyum (overfitting) riskini azaltır.
Embargo
Embargo yöntemi, eğitim ve test setleri arasında belirli bir süre veya veri dilimi bırakma esasına dayanır. Bu, zaman serisi verilerinin doğal yapısını korur.- Eğitim seti, gelecekteki verilerle ilgili bilgi içermez.
- Gelecek verilerin etkisi minimize edilir.
- Modelin gerçek dünya performansını daha iyi tahmin edebilmesi sağlanır.
Cevap yazmak için lütfen
.
Aynı kategoriden
- Basketbol maçlarında kullanılan veri analiz yöntemleri nelerdir?
- Model değerlendirme metrikleri: accuracy, precision, recall ve F1
- Jupyter Notebook nedir?
- Özellik ölçekleme: standardizasyon, normalizasyon ve robust scaler farkları
- Veri biliminde denetimli ve denetimsiz öğrenme yöntemlerinin avantajları ve kullanım alanları açısından temel farkları nelerdir
- Eğitimde veri analitiği ve makine öğrenmesi uygulamaları nelerdir?
- Aktif öğrenme (active learning) ile etiketleme maliyetini düşürmek
- Python’da veri analizi için en çok kullanılan kütüphane hangisidir?
- Sinir ağı (neural network) nedir?
- Veri ön işleme tekniklerinin makine öğrenmesi modellerinin performansını nasıl etkilediğini açıklayabilir misiniz?
- Yapay zeka etik sorunları nelerdir?
- Veri bilimi ile makine öğrenmesi arasındaki farklar nelerdir?
- Metin madenciliği temel adımları: tokenizasyon, stop-word, lemma
- Epoch ve batch size nedir?
- Karar ağaçları nasıl çalışır?
- Pandas groupby ve pivot işlemleriyle özet tablo nasıl oluşturulur?
- Akış verisi (streaming) için Kafka ve Spark Structured Streaming
- Gradient Boosting, XGBoost ve LightGBM farkları nelerdir?
- Hipotez testi nedir?
- Pandas ile veri çerçevesi (DataFrame) temel işlemleri
