Zaman serisi çapraz doğrulama: purged k-fold ve embargo
Zaman Serisi Çapraz Doğrulama
Zaman serisi verileriyle çalışırken, klasik çapraz doğrulama yöntemleri yetersiz kalabilir. Çünkü zaman bağımlılığı vardır ve veriler sıralıdır. Bu nedenle özel yöntemler geliştirilmiştir.Purged K-Fold
Purged k-fold yönteminde, veriler k katmana bölünür. Ancak her katmandan sonra önceki verilerin etkisini azaltmak için bir temizlik işlemi yapılır. Bu, modelin öğrenmesini etkileyen geçmiş verilerin kullanılmasını engeller.- Veriler k katmana bölünür.
- Her katmanda, önceki katmanın verileri purged edilir.
- Bu, aşırı uyum (overfitting) riskini azaltır.
Embargo
Embargo yöntemi, eğitim ve test setleri arasında belirli bir süre veya veri dilimi bırakma esasına dayanır. Bu, zaman serisi verilerinin doğal yapısını korur.- Eğitim seti, gelecekteki verilerle ilgili bilgi içermez.
- Gelecek verilerin etkisi minimize edilir.
- Modelin gerçek dünya performansını daha iyi tahmin edebilmesi sağlanır.
Cevap yazmak için lütfen
.
Aynı kategoriden
- Excel veri bilimi için yeterli midir?
- Karar ağaçları ve rastgele orman (Random Forest) ne zaman avantaj sağlar?
- Jupyter Notebook nedir?
- Veri bilimi hangi alanlarda kullanılır?
- Veri sürümleme: DVC ve Git-LFS ile veri–model takibi
- Veri biliminin geleceği nasıl şekillenecek?
- Kullanıcı davranış analizi nasıl yapılır?
- Eksik veri nasıl doldurulur?
- Eksik veri (missing values) nasıl tespit ve impute edilir?
- Veri bilimi projelerinde veri ön işleme aşamasının model doğruluğu üzerindeki etkileri nelerdir
- Anomali tespiti: izolasyon ormanı, LOF ve robust z-skoru
- DataFrame nedir ve nasıl oluşturulur?
- Standart sapma nedir?
- Çok sınıflı sınıflandırmada macro–micro–weighted F1 farkları
- Veri bilimi toplumu nasıl etkiler?
- Yapay zekada önyargı (bias) nedir?
- Denetimli öğrenme nedir?
- Farklı veri kaynaklarını birleştirme: entity resolution ve keys
- Trend analizi nasıl yapılır?
- Python ile grafik nasıl çizilir?
