Özellik ölçekleme: standardizasyon, normalizasyon ve robust scaler farkları

Kategori: Veri Bilimi › 02/05/2025 › Okunma: 47

Özellik Ölçekleme Yöntemleri

Özellik ölçekleme, makine öğreniminde model performansını artırmak için verilerin belirli bir ölçeğe getirilmesidir. En yaygın üç yöntem standardizasyon, normalizasyon ve robust scaler\'dır.

Standardizasyon

Standardizasyon, verilerin ortalamasını sıfıra ve standart sapmasını bir birime getirme işlemidir. Aşağıdaki gibi hesaplanır:

Yeni değer = (X - ortalama) / standart sapma

Bu yöntem, verilerin normal dağılıma yakın olduğu varsayımına dayanır.

Normalizasyon

Normalizasyon, verileri belirli bir aralık (genellikle 0 ile 1) içinde ölçekleme işlemidir. Hesaplama şu şekildedir:

Yeni değer = (X - min) / (max - min)

Bu yöntem, verilerin kenar etkilerini azaltmak için kullanılır.

Robust Scaler

Robust scaler, verilerin medyanını ve çeyrek açıklığını kullanarak ölçekleme yapar. Bu yöntem, aşırı değerlerden etkilenmez.

Yeni değer = (X - medyan) / (çeyrek açıklığı)

Aşırı değerlerin olduğu durumlarda en etkili seçenektir.

Özet

Standardizasyon: Normal dağılım varsayımına dayanır; ortalama ve standart sapma kullanır.
Normalizasyon: 0-1 aralığına ölçekleme; min ve max değerleri kullanır.
Robust Scaler: Aşırı değerlere dayanıklıdır; medyan ve çeyrek açıklığı kullanır.

Özellik ölçekleme: standardizasyon, normalizasyon ve robust scaler farkları