Giriş
İş kararlarında makine öğrenimi yaklaşımını seçmek, veri yapısı, operasyonel riskler ve hedeflenen iş kazanımlarıyla doğrudan ilişkilidir. Bu rehber, ürün yöneticileri, veri takımları ve karar vericiler için denetimli (supervised) ve denetimsiz (unsupervised) öğrenmenin temel farklarını, güçlü ve zayıf yönlerini ve iş vakası eşleştirme stratejilerini açık ve uygulanabilir biçimde sunar.
Tanımlar ve uygulama önerileri uluslararası kaynaklara dayanmaktadır; temel referanslar arasında AWS'ın özet karşılaştırmaları ve sektör kaynakları bulunmaktadır (örnekler için bkz. AWS ve CBOT).
Temel Tanımlar
Denetimli Öğrenme (Supervised Learning)
Denetimli öğrenme, etiketlenmiş veri kümesi kullanılarak model eğitilmesini ifade eder: giriş özellikleri (feature) ile istenen çıktı (label) arasında bir haritalama öğrenilir. Bu yaklaşım, sınıflandırma (ör. kötü/iyi kredi) veya regresyon (ör. gelir tahmini) gibi görevlerde kullanılır. Denetimli modellerin avantajı, doğrudan çıktı tahminlerine odaklanması ve performansın ölçülebilir metriklerle değerlendirilmesidir; dezavantajı ise etiket üretmenin maliyetli veya zaman alıcı olabilmesidir (Kaynak: AWS).
Denetimsiz Öğrenme (Unsupervised Learning)
Denetimsiz öğrenme, etiketlenmemiş verilerdeki gizli örüntüleri, kümeleri veya ilişkileri keşfetmeye çalışır. Kümelendirme (clustering), boyut indirgeme (dimensionality reduction) ve birliktelik kuralları gibi yöntemler bu kategoriye girer. Denetimsiz yaklaşımlar genellikle veri keşfi, müşteri segmentasyonu ve anomali tespiti gibi görevlerde tercih edilir; çünkü etiket gerektirmeden veri içinden yapı çıkarır (Kaynak: AWS).
Yarı Denetimli ve Hibrit Yaklaşımlar
Gerçek dünyada verinin bir kısmı etiketli, büyük kısmı etiketlenmemiş olabilir. Bu durumda yarı denetimli öğrenme veya hibrit stratejiler (ör. önce denetimsiz kümeleme, sonra küçük bir etiketli set ile ince ayar) pratik bir çözüm sunar. Ayrıca etiketleme maliyetini azaltmak için aktif öğrenme gibi teknikler de uygulanabilir (Kaynak: CBOT).
İş Vakası Eşleştirme: Hangi Durumda Hangi Yaklaşım?
Aşağıdaki tablo, yaygın iş vakalarını ve genel olarak hangi yaklaşımın tercih edildiğine ilişkin kılavuz notlarını içerir. Bu eşleştirme bağlam-odaklıdır; kesin seçim veri miktarı, hata maliyeti ve düzenleyici gereksinimlere bağlıdır.
| İş Vakası | Önerilen Yaklaşım | Neden / Notlar | Kaynak |
|---|---|---|---|
| Kredi risk puanlama | Denetimli | Yüksek doğruluk, açıklanabilirlik ve düzenleyici izlenebilirlik gerektirir. | CBOT |
| Hastalık teşhisi destek sistemi | Denetimli | Yüksek risk/yanlış sınıflamanın maliyeti nedeniyle etiketlenmiş veri tercih edilir. | CBOT |
| Müşteri segmentasyonu | Denetimsiz | Etiket yok; amaç doğal grupları keşfetmek ve pazarlama stratejileri geliştirmek. | AWS |
| Anomali tespiti (fraud, operasyonel sorunlar) | Denetimsiz veya hibrit | Etiketlenmiş anomali örnekleri azsa denetimsiz yöntemler tercih edilebilir; yeterli etiket varsa denetimli modeller daha hassas olabilir. | CBOT |
| Ürün/İçerik öneri sistemleri | Hibrit (öneri algoritmaları) | Kullanıcı-etkileşimleri genellikle etiket yerine sinyal olarak kullanılır; hem denetimli hem denetimsiz yöntemler birleşebilir. | AWS |
Seçim Yaparken Kontrol Listesi (Adım Adım)
- Hedefi netleştirin: Tahmin mi yapmak istiyorsunuz, yoksa veri içindeki örüntüleri mi keşfetmek istiyorsunuz?
- Veri envanteri çıkarın: Etiket var mı? Etiket üretmenin maliyeti ve süresi nedir?
- Hata maliyetini değerlendirin: Yanlış sınıflamanın iş ve uyumluluk maliyeti ne kadar önemli?
- Prototip oluşturun: Küçük bir PoC ile hem denetimli hem denetimsiz yaklaşımları test edin; hızlı geri bildirim alın.
- Metriği iş hedefine bağlayın: Model performansını teknik metriklerin ötesinde iş KPI'larına göre değerlendirin (örn. dönüşüm artışı, yanlış alarm maliyeti).
- İzleme planı kurun: Model performansını, veri kaymasının (drift) ve yeni koşulların etkisini takip edecek izleme mekanizmaları planlayın.
Uygulama Önerileri ve Değerlendirme Metrikleri
Denetimli uygulamalarda yaygın olarak kullanılan metrikler doğruluk (accuracy), precision/recall, F1 skoru ve AUC'dir; hangisinin önemli olduğu hata tipine göre değişir (ör. düşük false-negative önemliyse recall önceliklidir). Denetimsiz yöntemlerde ise siluet skoru, Davies-Bouldin gibi küme kalitesi metrikleri kullanılabilir; ancak bu metrikler iş değerine doğrudan tercüme edilmelidir (ör. segmentlerin pazarlama performansı).
Pratik olarak şunlara dikkat edin:
- Denetimli modeller için veri ayrımı (train/validation/test) ve çapraz doğrulama uygulayın.
- Denetimsiz modellerde küme sayısı ve ölçekleme kararlarını iş hedefleriyle eşleştirin; görsel doğrulama ve A/B testleri ile iş etkisini ölçün.
- Yarı denetimli veya aktif öğrenme stratejileriyle etiket maliyetini azaltabilirsiniz; küçük, yüksek kaliteli etiket setleri genellikle daha etkilidir.
Uygulama Örnekleri (Kısa Senaryolar)
Senaryo 1: Kredi Başvurusu — Denetimli Yol
Problem: Başvuruların onaylanıp onaylanmayacağını tahmin etmek. Adımlar: (1) Tarihsel başvuru verisi ve sonuçları (etiket) toplanır. (2) Açıklayıcı değişkenler hazırlanır. (3) Denetimli model eğitilir ve iş KPI'larına göre eşik belirlenir. Bu tür yüksek riskli uygulamalarda denetimli yaklaşım tercih edilme eğilimindedir (CBOT).
Senaryo 2: Müşteri Segmentasyonu — Denetimsiz Yol
Problem: Pazarlama kampanyalarını kişiselleştirmek için doğal müşteri grupları belirlemek. Adımlar: (1) Davranış verisi toplanır. (2) Öznitelikler ölçeklenir ve kümeleme uygulanır. (3) Segmentler iş tarafından doğrulanır ve hedeflenir. Bu süreç keşif odaklıdır ve etiket gerektirmez (AWS).
Riskler, Sınırlamalar ve İzleme
Her yaklaşımın sınırlamaları vardır. Denetimli modeller etiket kalitesine bağımlıdır; hatalı etiketler yanıltıcı sonuç verebilir. Denetimsiz modellerin çıktısı yorumlamaya açıktır ve iş değeri için doğrulanması gerekir. Ayrıca model önyargısı (bias), veri kayması (drift) ve operasyonel riskler sürekli izlenmelidir.
Yüksek riskli alanlarda (ör. kredi, sağlık) teknik uygulamadan önce düzenleyici gereksinimler ve etik değerlendirmeler yapılmalıdır. Bu makale bilgilendirme amaçlıdır ve düzenleyici veya tıbbi tavsiye yerine geçmez.
Sonuç
Denetimli ve denetimsiz öğrenme arasında seçimi yaparken veri durumu, hata maliyeti ve iş hedefleri belirleyicidir. Genellikle yüksek doğruluk ve izlenebilirlik gerektiren görevlerde denetimli; keşif, segmentasyon ve anomali tespitinde denetimsiz yöntemler tercih edilir. Uygulamada hibrit ve yarı denetimli yaklaşımlar sıkça işe yarar. İlk adım olarak veri envanteri çıkarmayı, küçük bir prototip yapmayı ve iş metriği ile değerlendirmeyi öneririz.
Referanslar: AWS ve CBOT kaynaklarından temel tanımlar ve iş vakası eşleştirmeleri derlenmiştir (bkz. AWS, CBOT).