Zaman serisi çapraz doğrulama: purged k-fold ve embargo
Zaman Serisi Çapraz Doğrulama
Zaman serisi verileriyle çalışırken, klasik çapraz doğrulama yöntemleri yetersiz kalabilir. Çünkü zaman bağımlılığı vardır ve veriler sıralıdır. Bu nedenle özel yöntemler geliştirilmiştir.Purged K-Fold
Purged k-fold yönteminde, veriler k katmana bölünür. Ancak her katmandan sonra önceki verilerin etkisini azaltmak için bir temizlik işlemi yapılır. Bu, modelin öğrenmesini etkileyen geçmiş verilerin kullanılmasını engeller.- Veriler k katmana bölünür.
- Her katmanda, önceki katmanın verileri purged edilir.
- Bu, aşırı uyum (overfitting) riskini azaltır.
Embargo
Embargo yöntemi, eğitim ve test setleri arasında belirli bir süre veya veri dilimi bırakma esasına dayanır. Bu, zaman serisi verilerinin doğal yapısını korur.- Eğitim seti, gelecekteki verilerle ilgili bilgi içermez.
- Gelecek verilerin etkisi minimize edilir.
- Modelin gerçek dünya performansını daha iyi tahmin edebilmesi sağlanır.
Cevap yazmak için lütfen
.
Aynı kategoriden
- Veri toplama yöntemleri nelerdir?
- Boyut indirgeme: PCA, t-SNE ve UMAP ne zaman tercih edilir?
- Yeni başlayanlar için veri bilimi rehberi nedir?
- Veri monolitinden veri mesh’e geçiş: domain odaklı sahiplik
- Veri artırma (augmentation) teknikleri: görüntü ve metin için örnekler
- Model performansı nasıl ölçülür?
- Model değerlendirme nasıl yapılır?
- Zaman serisi tahmini: ARIMA, SARIMA ve Prophet temel yaklaşımı
- SVM nedir ve hangi durumlarda kullanılır?
- K-fold, stratified k-fold ve time series split arasındaki farklar
- Deney izleme: MLflow ile deney, parametre ve metrik kaydı
- Mühendislikte data science nedir ve hangi alanlarda kullanılır?
- A/B testleri nasıl tasarlanır? Güç analizi ve örneklem hesabı
- Zaman serisinde durağanlık testi: ADF ve KPSS nasıl yapılır?
- Veri ürünlerinin OKR ve KPI’larını nasıl belirlersiniz?
- CRISP-DM nedir?
- Matplotlib nasıl kullanılır?
- Seaborn kütüphanesi ne işe yarar?
- Train-test split nasıl yapılır?
- Yapay zeka veri bilimiyle nasıl ilişkilidir?