Özellik Mühendisliği ve Model Değerlendirme

Giriş — Makine öğrenimi terimleriyle pratik yaklaşım

Makine öğrenimi projelerinde iki sık tekrar eden etkinlik vardır: veriden anlamlı özellikler üretmek ve oluşturulan modellerin güvenilirliğini ölçmek. Bu rehberde özellik mühendisliği ve model değerlendirme ile ilgili temel makine öğrenimi terimlerini, pratik adımları ve hangi durumda hangi tekniğin daha uygun olduğunu açıklayacağım. Tanımlar ve temel kavramlar için Microsoft, Google ve ilgili kaynaklarda özetlenen yaklaşımları referans aldım; örnek linkler yazının ilgili bölümlerinde yer almaktadır.

Özellik Mühendisliğine Giriş

Özellik mühendisliği, ham verilerden makine öğrenimi modelleri için anlamlı değişkenler (özellikler) oluşturma sürecidir. Temel amaç, modelin sinyali yakalamasını kolaylaştırmak ve genelleme yeteneğini artırmaktır. Bu tanıma Microsoft'un makine öğrenmesi sözlüğünde yer alan açıklama paralelidir (Makine öğrenmesi sözlüğü — Microsoft Learn).

Temel adımlar

Veri keşfi ve temizleme: Eksik değerler, aykırı değerler ve tutarsız kayıtlar tespit edilir.
Özellik oluşturma: Tarihten tarih parçaları, metinden sayısal temsiller, kategorik değişkenlerden etkileşim terimleri oluşturma gibi işlemler yapılır.
Özellik dönüşümleri: Ölçekleme (normalizasyon/standardizasyon), log dönüşümleri veya kutu‑cox gibi teknikler uygulanabilir.
Özellik seçimi: Çok sayıda özelliğin performansa etkisi değerlendirilir; gereksiz olanlar elenir.
Pipeline ve otomasyon: Ön işleme ve dönüşümler model eğitim döngüsüne entegre edilmelidir (kaotik manuel adımlardan kaçınmak için).

Pratik örnekler

Tarih sütunundan: yıl, ay, gün, hafta günü, hafta sonu veya hesaplanan “müşteri yaşı (tenure)” gibi göstergeler oluşturma.
Kategorik veriler: One‑hot, ordinal veya target‑encoding kullanımı; sınıf dengesine ve model tipine göre seçim yapılmalı.
Metin verisi: Basit TF‑IDF veya ön işleme ile çıkarılan anahtar kelime sayıları; daha ileri için gömme (embedding) yöntemleri.
Toplulaştırma (aggregations): Zaman serisi veya kullanıcı bazlı verilerde gruplama sonrası ortalama, medyan, max/min gibi özet özellikler ekleme.

Özellik seçimi yöntemleri

Seçim yöntemleri genel olarak üç kategoriye ayrılır: filter, wrapper ve embedded. Örneğin korelasyon eşiği veya chi‑square filter yöntemleri; recursive feature elimination (RFE) wrapper; L1 regularizasyonu veya ağaç‑tabanlı önem skorları ise embedded yöntemlerdir. Her yöntemin hesaplama maliyeti ve aşırı uyum (overfitting) riskine etkisi farklıdır; seçim problemin ölçeğine ve veri yapısına bağlıdır (Ultralytics — Özellik Mühendisliği).

Model Değerlendirme: Amaç ve Temel Terimler

Model değerlendirme, bir modelin gerçek veride nasıl performans göstereceğini tahmin etmeye çalışır. Buradaki iki ana hedef; hata oranını ölçmek ve farklı modelleri karşılaştırarak en uygun olanı seçmektir. Değerlendirme için doğru metrik ve doğru doğrulama stratejisi seçilmelidir.

Çapraz doğrulama (cross‑validation)

Çapraz doğrulama, modelin farklı veri alt kümeleri üzerinde test edilerek genelleme yeteneğinin değerlendirilmesini sağlar. K‑fold, stratified K‑fold, zaman serisi için zaman bazlı bölümler ve nested cross‑validation gibi yaklaşımlar vardır. Hangi yöntemin seçileceği veri yapısına bağlıdır: sınıf dengesizliği varsa stratified tercih edilir; zaman bağımlılığı varsa zaman bazlı split gerekir (FlowHunt — Çapraz Doğrulama).

Yaygın performans metrikleri

Problemin türüne göre metrik seçimi değişir. Aşağıda sık kullanılan metriklerin kısa özeti ve hangi durumda tercih edilebileceği yer almaktadır (tanımlar için Google'ın geliştirici dokümanları faydalıdır):

Problem Türü	Metrik	Ne ölçer / Ne zaman kullanılır
İkili sınıflandırma	Accuracy, Precision, Recall, F1	Accuracy dengesiz sınıflarda yanıltıcı olabilir; recall riskli durumlarda (örn. tıp, fraud) önem kazanır; F1 denge sağlar.
İkili sınıflandırma	ROC‑AUC, PR‑AUC	ROC‑AUC genel ayrım gücünü; PR‑AUC ise dengesiz sınıflarda olumlu sınıfa odaklanmayı gösterir.
Regresyon	MAE, RMSE, MAPE	MAE sapmanın ortalamasını; RMSE büyük hatalara daha duyarlıdır; seçim iş hedefine göre yapılır.

(Kaynak: Google Developers — Metrikler.)

Metrik seçimi için pratik kurallar

İş hedefinizi metrikle hizalayın: Müşteri kaybını yakalamak mı (recall), yanlış pozitifleri engellemek mi (precision) daha önemlidir?
Sınıf dengesizliğini göz önünde bulundurun: Dengesiz veri setlerinde accuracy yanıltıcı olabilir; PR‑AUC ve F1 daha bilgilendiricidir.
Eşik (threshold) ayarlamaları yapın: Olasılık tabanlı modellerde eşik belirlenmesi işletme maliyetine göre optimize edilebilir.

Uygulamalı İş Akışı (Checklist)

Problemi ve başarı metriklerini netleştirin (iş hedefiyle eşleştirin).
Veri keşfi yapın: eksik, aykırı ve dengesiz dağılımları tespit edin.
Ön işleme ve özellik mühendisliği paketini oluşturun; tüm dönüşümleri pipeline içine alın.
Basit bir baz model (baseline) kurun; başarıyı referans alın.
Özellik seçimi ve dönüşümlerle iterasyon yapın; her değişiklikte cross‑validation kullanın.
Hiperparametre optimizasyonunu nested veya CV tabanlı yaklaşımla yapın.
Son değerlendirmeyi ayrılmış test kümesi üzerinde gerçekleştirin; sonuçları işletme bağlamında yorumlayın.
Model dağıtımı sonrası performansı izleyin (drift, veri değişiklikleri) ve gerektiğinde yeniden eğitin.

Kısa vaka: Müşteri churn tahmini (kılavuz seviye)

Örnek yaklaşım:

Problem: İkili sınıflandırma (churn / no‑churn). Başarı metriği: F1 ve ROC‑AUC (dengesizse F1 öncelikli).
Özellik mühendisliği: tenure'dan gün sayısı, aylık harcama ortalaması, son 3 ay etkileşim sayısı, abonelik değişiklikleri gibi özet özellikler ekleyin.
Doğrulama: Stratified K‑fold (sınıf oranlarını koruyan), zaman bağımlılığı varsa zaman bazlı split.
Önlem: Özelliklerin eğitim sırasında hedef sızıntısı (target leakage) olup olmadığını kontrol edin; özet istatistikleri yalnızca eğitim hücresinde hesaplayın.

Sık Yapılan Hatalar ve Önlemler

Veri sızıntısı (data leakage): Test seti bilgilerini eğitim sürecinde kullanmaktan kaçının.
Pipelines kullanılmaması: Ölçekleme veya encoding işlemlerini CV içinde yapmazsanız yanlış optimistik sonuçlar alırsınız.
Metrik seçimini iş hedefinden bağımsız yapma: Yanlış metrik yanlış modeli tercih ettirir.
Aşırı özellik mühendisliği: Çok karmaşık, yüksek varyanslı özellikler overfitting'e yol açabilir; basit özellikler bazen daha sağlamdır.

Kaynaklar ve ileri okuma

Bu rehber başlangıç ve orta seviye uygulamalar için pratik bir çerçeve sundu. Spesifik kod örnekleri veya kütüphane tercihleri projeye bağlıdır; daha derin uygulamalar için ilgili kaynakların uygulama rehberlerine bakmanızı öneririm.

Özellik Mühendisliği ve Model Değerlendirme: Pratik Terimler