Makine Öğreniminde Performans Ölçütleri: Doğruluk, Kesinlik, Recall
Makine öğrenimi modellerinin başarısını değerlendirmek için farklı performans ölçütleri kullanılır. Bu ölçütler, modelin sınıflandırma veya tahmin görevlerinde ne kadar etkili olduğunu sayısal olarak ifade eder. En yaygın kullanılan metrikler arasında doğruluk (accuracy), kesinlik (precision) ve recall (duyarlılık) yer alır. Her biri, modelin farklı yönlerini anlamak için kritik öneme sahiptir.
Doğruluk (Accuracy)
Doğruluk, modelin toplam tahminler içinde doğru yaptığı tahminlerin oranını ifade eder. Basitçe, modelin ne kadar doğru karar verdiğini gösterir.
Dog˘ruluk=Dog˘ru Tahmin SayısıToplam Tahmin Sayısı\text{Doğruluk} = \frac{\text{Doğru Tahmin Sayısı}}{\text{Toplam Tahmin Sayısı}}
Avantajları
- Kolay anlaşılır ve hesaplanır.
- Dengeli sınıflar için uygundur.
Dezavantajları
- Dengesiz veri setlerinde yanıltıcı olabilir. Örneğin, bir hastalık teşhisinde hasta sayısı azsa, hastalık olmayanların doğru tahmini yüksek çıkabilir ancak model aslında yetersiz olabilir.
Kesinlik (Precision)
Kesinlik, modelin pozitif sınıf olarak tahmin ettiği örneklerin gerçekte ne kadarının pozitif olduğunu gösterir. Yanlış pozitifleri (False Positives) azaltmaya odaklanır.
Kesinlik=Dog˘ru PozitiflerDog˘ru Pozitifler+Yanlıs¸ Pozitifler\text{Kesinlik} = \frac{\text{Doğru Pozitifler}}{\text{Doğru Pozitifler} + \text{Yanlış Pozitifler}}
Kullanım Alanları
- Yanlış alarmın maliyetli olduğu durumlarda (örneğin spam tespiti, hastalık teşhisinde yanlış pozitif sonuçlar).
Recall (Duyarlılık)
Recall, gerçek pozitif örneklerin model tarafından ne kadarının doğru tespit edildiğini ifade eder. Yanlış negatiflerin (False Negatives) minimize edilmesine odaklanır.
Recall=Dog˘ru PozitiflerDog˘ru Pozitifler+Yanlıs¸ Negatifler\text{Recall} = \frac{\text{Doğru Pozitifler}}{\text{Doğru Pozitifler} + \text{Yanlış Negatifler}}
Kullanım Alanları
- Gerçek pozitiflerin kaçırılmasının yüksek maliyeti olduğu durumlarda (örneğin kanser teşhisi, dolandırıcılık tespiti).
Doğruluk, Kesinlik ve Recall Arasındaki Denge
Bu metrikler arasında çoğu zaman bir denge kurulması gerekir. Örneğin, yüksek kesinlik elde etmek için çok sıkı filtreler uygulanabilir ancak bu durumda recall düşebilir. Bu dengeyi sağlamak için F1 skoru gibi birleşik metrikler de kullanılır.
Özet
Makine öğrenimi modellerinin performansını değerlendirirken doğruluk, kesinlik ve recall metrikleri birlikte incelenmelidir. Bu sayede modelin farklı yönleri net bir şekilde ortaya konur ve uygulama alanına uygun en iyi model seçimi yapılabilir.
Bu makale bilgilendirme amaçlıdır. Makine öğrenimi performans değerlendirmesi ve model seçimi konularında uzman bir yapay zeka mühendisine danışılması önerilir.
Anahtar kelimeler: makine öğrenimi, performans ölçütleri, doğruluk, kesinlik, recall, duyarlılık, sınıflandırma, F1 skoru, yapay zeka