Giriş

Bilgisayarla görme (computer vision) alanında en çok karşılaşılan iki görev görüntü sınıflandırma ve nesne tespitidir. Görüntü sınıflandırma, bir görüntüyü tek bir sınıfa atarken; nesne tespiti görüntüdeki birden fazla nesnenin türünü ve konumunu belirler. Bu ayrımın sektörel uygulamalarda nasıl sonuçlara yol açtığını anlamak, doğru çözümü seçmek ve uygulamaya almak için önemlidir. Aşağıda hem teknik farkları hem de pratik uygulama adımlarını bulacaksınız.

Görüntü sınıflandırma nedir?

Görüntü sınıflandırma, giriş olarak verilen tam görüntüye bir veya daha fazla etiket atma problemidir. Örnek: bir röntgen görüntüsünü "normal" veya "anormal" şeklinde sınıflandırmak; ya da bir fotoğrafı "kedi" veya "köpek" olarak etiketlemek. Bu görev genellikle tek etiket veya çoklu etiket senaryolarında uygulanır ve model çıktısı sınıf olasılıklarıdır.

Nesne tespiti nedir?

Nesne tespiti (object detection) bir görüntüdeki her bir nesnenin türünü belirlemenin yanında, bu nesnelerin konumlarını (genellikle dikdörtgen bounding box ile) verir. İleri seviye görevler arasında nesne takibi ve örnek-segmentation (instance segmentation) bulunur. Microsoft'un nesne tespiti kavramlarına dair teknik açıklamalarından faydalanabilirsiniz: Microsoft: Nesne algılama.

Teknik farklar ve çıktı biçimleri

  • Çıktı tipi: Sınıflandırma = sınıf olasılıkları; Nesne tespiti = sınıf + konum (bounding box) ve genellikle güven (confidence) puanı.
  • Etiketleme: Sınıflandırmada klas etiketleri (label) yeterliyken, tespitte her nesne için kutu (veya segment) çizilir.
  • Değerlendirme metrikleri: Sınıflandırmada accuracy, precision/recall sık kullanılır. Nesne tespitinde IoU (Intersection over Union), mAP (mean Average Precision) gibi konuma duyarlı metrikler tercih edilir.
  • Mimari farkları: Sınıflandırma genellikle ResNet, DenseNet, MobileNet gibi gömülü sınıflandırıcılarla çözülürken; nesne tespiti için Faster R-CNN, SSD, YOLO gibi tek/çift aşamalı dedektörler yaygındır. Seçim, hız-doğruluk gereksinimine göre yapılır.

Sektör Uygulamaları

Aşağıda sektör bazlı örnekler ve hangi yöntemin nasıl kullanıldığı özetlenmiştir.

Güvenlik ve gözetim

Nesne tespiti, güvenlik kameralarında şüpheli nesne ve izinsiz giriş tespiti için yaygın olarak kullanılır. Nesnelerin yerini bilmek, alarm ve olay takibi için gereklidir. Türkiye'deki uygulama örneklerine üretici ve servis sağlayıcı dokümanları üzerinden bakılabilir: IBBVision: Nesne Tespiti ve saha uygulama raporları.

Otomotiv (ADAS ve otonom sürüş)

Otomotiv uygulamalarında hem sınıflandırma hem de nesne tespiti birlikte kullanılır. Örneğin, bir çerçevedeki nesnelerin (araç, yaya, bisiklet) tespiti güvenlik için kritik iken, sınıflandırma trafik işaretlerinin veya yol yüzey durumlarının belirlenmesinde tercih edilebilir. Sektördeki uygulama örnekleri ve açıklamalar için kaynakları inceleyebilirsiniz: Görüntü Sınıflandırma ve Nesne Tanıma — örnekler.

Sağlık (tıbbi görüntüleme)

Tıbbi görüntülemede bazı uygulamalar tüm görüntünün sınıflandırılmasını (ör. anormallik var/yok), bazıları ise lezyonların konumunun belirlenmesini gerektirir. Klinik kullanımda modellerin doğrulanması ve düzenleyici gereklilikler önemlidir; bu alanda sınıflandırma ve tespit yöntemleri farklı amaçlarla bir arada kullanılabilir.

Üretim ve kalite kontrol

Endüstriyel üretimde hatalı parçaların tespiti genellikle nesne tespiti veya segmentasyon ile yapılır; parçada bir hata bölgesi tespit edildikten sonra reddetme veya yönlendirme işlemleri otomatikleştirilir. Vodafone ve benzeri sağlayıcıların görüntü işleme uygulama örnekleri sektörel bakış sunar: Vodafone: Görüntü İşleme ile Nesne Tanıma ve Takibi.

Hangi durumda hangisini seçmeli? Pratik karar kriterleri

  • Tek bir global etiket yeterliyse: Görüntü sınıflandırma tercih edilir (ör. fotoğrafın türü).
  • Görüntüde birden fazla nesne veya konuma ihtiyaç varsa: Nesne tespiti gereklidir (ör. trafik sahnesi, gözetim).
  • Gerçek zamanlı gereksinim: Hız kritikse hafif dedektörler (YOLO/SSD) veya optimizasyon çözümleri düşünün; batch analizlerde daha ağır ama hassas modeller tercih edilebilir.
  • Etiketleme bütçesi: Bounding box etiketlemesi sınıflandırma etiketlemesinden daha maliyetlidir; etiketleme maliyetini göz önünde bulundurun.

Hızlı tercih tablosu

İhtiyaç Önerilen yaklaşım
Küresel karar (var/yok) Görüntü sınıflandırma
Birden fazla nesne ve konum Nesne tespiti
Gerçek zamanlı, düşük gecikme Hızlı dedektör + optimizasyon

Uygulama adımları: örnek yol haritası

  1. Problem tanımı: Hangi çıktıyı istiyorsunuz? Sadece etiket mi yoksa nesne konumları da mı gerekir?
  2. Veri toplama: Hedef dağılımdan örnekler toplayın; farklı ışık, açı ve ortam koşullarını kapsayın.
  3. Etiketleme ve format: Sınıflandırma için etiket listesi, tespit için bounding box/segment etiketleme gereklidir. Yaygın formatlar COCO veya Pascal VOC'dur.
  4. Model seçimi ve transfer learning: Küçük veri setlerinde transfer öğrenme ile ön-eğitilmiş sınıflandırıcılar veya dedektörler kullanmak zaman kazandırır.
  5. Eğitim ve değerlendirme: Uygun metrikleri seçin (accuracy, precision/recall, IoU, mAP). Validasyon setinde domain shift testleri yapın.
  6. Optimizasyon ve dağıtım: Gerçek zamanlı uygulamalar için model küçültme, kuantizasyon veya hızlandırıcılar (ONNX/TensorRT vb.) düşünün. Edge vs cloud kararını verin.
  7. Canlı izleme: Model performansını operasyonel veride izleyin, model drift durumlarında tekrar etiketleme ve yeniden eğitim planlayın.

Doğruluk, veri ve sınırlamalar

Her iki yaklaşım da veri kalitesine, etiket doğruluğuna ve eğitim dağılımının üretim dağılımıyla uyumuna çok duyarlıdır. Küçük, kapalı veya örtülü nesneler nesne tespitini zorlaştırır; farklı cihaz ve ışık koşulları model doğruluğunu düşürebilir. Bu tür sorunları azaltmak için data augmentation, domain adaptation, synthetically generated data veya aktif öğrenme gibi yöntemler uygulanabilir. Ayrıca tıbbi ve güvenlik uygulamalarında klinik/doğrulama süreçleri ve yasal gerekliliklerin sağlanması kritik önem taşır.

Pratik örnek: Üretimde kalite kontrol (adım adım)

  • Kamera konumlandırması ve aydınlatma standardı belirlenir.
  • Parça görüntüleri toplanır; normal ve hatalı örnekler dengelenir.
  • Hatalı bölgeler için bounding box veya segmentation ile etiketleme yapılır.
  • Dedektör modeli (hassasiyet gerekliyse iki aşamalı, hız gerekliyse tek aşamalı) seçilir ve ön eğitimli ağırlıklarla transfer öğrenme uygulanır.
  • Eşik değerleri, false positive/negative maliyetine göre işletme ile birlikte ayarlanır.
  • Üretimde küçük çaplı pilot uygulama ile modelin gerçek dünya davranışı gözlemlenir ve gerekiyorsa yeniden eğitim planlanır.

Etik, gizlilik ve düzenleyici notlar

Görüntü verileri kişisel veri içerebiliyorsa (yüz, araç plakası vb.) ilgili veri koruma yasalarına ve gizlilik politikalarına uyun. Tıbbi uygulamalarda model sonuçları klinik onay gerektirebilir; üretimde ise yanlış alarmların operasyonel maliyetleri değerlendirilmelidir. Bu konular uygulamanın erken aşamasında titizlikle ele alınmalıdır.

Sonuç

Görüntü sınıflandırma ve nesne tespiti, benzer teknoloji tabanına sahip olsa da farklı ihtiyaçlara yönelik çözümler sunar. Doğru yaklaşımı seçmek; sorunun net tanımı, etiketleme bütçesi, gerçek zaman gereksinimi ve doğruluk beklentileri gibi faktörlere bağlıdır. Sektör örneklerini ve teknik kriterleri kullanarak planlı bir yol haritası oluşturmak başarı şansını artırır. Daha fazla teknik detay ve nesne tespiti kavramsal açıklaması için Microsoft'un dökümantasyonunu inceleyebilirsiniz: Microsoft: Nesne algılama.

Kaynaklar ve ileri okuma