Proje Hakkında Detaylı Bilgi

1. Amaç

Bu çalışmanın temel amacı, banka müşterilerinin hangi hizmet kanalları üzerinden işlem gerçekleştirdiklerini analiz ederek, davranışsal temelli müşteri segmentleri oluşturmaktır. İncelenen kanallar:

  • Mobil Bankacılık
  • Fiziki Şube Ziyareti
  • Telefon Bankacılığı (Çağrı Merkezi)

Müşteri segmentlerinin belirlenmesiyle birlikte, ilerleyen süreçte bu kümelere özel pazarlama kampanyaları geliştirilecek ve bankacılık hizmetlerinin kişiselleştirilmesi sağlanacaktır.

2. Yöntem

Analiz süreci aşağıdaki veri madenciliği ve makine öğrenmesi adımlarını kapsamaktadır:

2.1 Veri Ön İşleme

  • Eksik ve aykırı değerlerin tespiti ve temizlenmesi
  • Kategorik verilerin sayısallaştırılması (örneğin, one-hot encoding)
  • Tüm sayısal verilerin normalize edilerek ölçeklenmesi

2.2 Uzaklık Ölçütü Seçimi

Veriye uygun uzaklık fonksiyonunun belirlenmesi, özellikle hiyerarşik kümeleme algoritmaları için kritik bir adımdır. Bu kapsamda iki farklı metrik incelenmiştir:

  • Öklid Uzaklığı: Noktalar arası doğrusal mesafe
  • Manhattan Uzaklığı: Eksenler boyunca toplam mesafe

Uygunluk değerlendirmeleri sonrası seçilen uzaklık metriği kullanılarak kümeler oluşturulmuştur.

2.3 Hiyerarşik Kümeleme Yöntemleri

Farklı bağlantı (linkage) yöntemleri denenerek, veri yapısına en uygun hiyerarşik kümeleme yapısı belirlenmiştir:

  • Ward’s Linkage
  • Complete Linkage
  • Average Linkage
  • Single Linkage

Bu yöntemlerle oluşturulan dendrogramlar karşılaştırılmış ve yorumlanmıştır.

2.4 Küme Sayısının Belirlenmesi

Optimal küme sayısının belirlenmesi için iki farklı yöntem kullanılmıştır:

  • Elbow Yöntemi: Küme içi hata kareler toplamı (SSE) üzerinden analiz.
  • Silhouette Skoru: Kümelerin birbirinden ayrışma ve tutarlılık düzeyini ölçer.

Her iki yöntemden elde edilen sonuçlar, bir arada değerlendirilerek nihai küme sayısı belirlenmiştir.

2.5 K-Means Kümeleme

Belirlenen küme sayısı temel alınarak K-Means algoritması uygulanmış, yüksek hacimli veride daha hızlı ve stabil sonuçlar elde edilmiştir. Bu aşamada her müşteri için ait olduğu küme bilgisi çıkarılmıştır.

2.6 DBSCAN Kümeleme

Yoğunluk tabanlı kümeleme algoritması olan DBSCAN, verideki doğal yapıyı belirlemek ve gürültülü (outlier) verileri dışlamak amacıyla kullanılmıştır. Bu yöntem sayesinde, özellikle küçük ama anlamlı müşteri gruplarının tespiti sağlanmıştır.

3. Beklenen Çıktılar ve Kullanım Alanları

  • Müşteri kitlesi davranışsal temelli segmentlere ayrılmış olacaktır.
  • Her segmentin hangi kanal(lar)ı tercih ettiği net bir biçimde ortaya konacaktır.
  • Dijital kanal kullanımına açık müşteri grupları belirlenerek, bu gruplara özel dijital kampanyalar geliştirilebilecektir.
  • Geleneksel kanalları tercih eden segmentler için kişiselleştirilmiş fiziksel hizmet stratejileri oluşturulabilecektir.
  • Veri tabanlı hedefleme yapılması sayesinde pazarlama bütçeleri daha verimli yönetilecektir.
Proje

Kredi Kartı Veri Seti Üzerinden Kümeleme Analizi

Projeye Katkıda Bulunanlar

Kerem Cimrioğlu

Neler Yaptık

Veri ön işleme, Uzaklık Ölçütü Seçimi, Kümeleme Yöntemleri