Proje Hakkında Detaylı Bilgi
1. Amaç
Bu çalışmanın temel amacı, banka müşterilerinin hangi hizmet kanalları üzerinden işlem gerçekleştirdiklerini analiz ederek, davranışsal temelli müşteri segmentleri oluşturmaktır. İncelenen kanallar:
- Mobil Bankacılık
- Fiziki Şube Ziyareti
- Telefon Bankacılığı (Çağrı Merkezi)
Müşteri segmentlerinin belirlenmesiyle birlikte, ilerleyen süreçte bu kümelere özel pazarlama kampanyaları geliştirilecek ve bankacılık hizmetlerinin kişiselleştirilmesi sağlanacaktır.
2. Yöntem
Analiz süreci aşağıdaki veri madenciliği ve makine öğrenmesi adımlarını kapsamaktadır:
2.1 Veri Ön İşleme
- Eksik ve aykırı değerlerin tespiti ve temizlenmesi
- Kategorik verilerin sayısallaştırılması (örneğin, one-hot encoding)
- Tüm sayısal verilerin normalize edilerek ölçeklenmesi
2.2 Uzaklık Ölçütü Seçimi
Veriye uygun uzaklık fonksiyonunun belirlenmesi, özellikle hiyerarşik kümeleme algoritmaları için kritik bir adımdır. Bu kapsamda iki farklı metrik incelenmiştir:
- Öklid Uzaklığı: Noktalar arası doğrusal mesafe
- Manhattan Uzaklığı: Eksenler boyunca toplam mesafe
Uygunluk değerlendirmeleri sonrası seçilen uzaklık metriği kullanılarak kümeler oluşturulmuştur.
2.3 Hiyerarşik Kümeleme Yöntemleri
Farklı bağlantı (linkage) yöntemleri denenerek, veri yapısına en uygun hiyerarşik kümeleme yapısı belirlenmiştir:
- Ward’s Linkage
- Complete Linkage
- Average Linkage
- Single Linkage
Bu yöntemlerle oluşturulan dendrogramlar karşılaştırılmış ve yorumlanmıştır.
2.4 Küme Sayısının Belirlenmesi
Optimal küme sayısının belirlenmesi için iki farklı yöntem kullanılmıştır:
- Elbow Yöntemi: Küme içi hata kareler toplamı (SSE) üzerinden analiz.
- Silhouette Skoru: Kümelerin birbirinden ayrışma ve tutarlılık düzeyini ölçer.
Her iki yöntemden elde edilen sonuçlar, bir arada değerlendirilerek nihai küme sayısı belirlenmiştir.
2.5 K-Means Kümeleme
Belirlenen küme sayısı temel alınarak K-Means algoritması uygulanmış, yüksek hacimli veride daha hızlı ve stabil sonuçlar elde edilmiştir. Bu aşamada her müşteri için ait olduğu küme bilgisi çıkarılmıştır.
2.6 DBSCAN Kümeleme
Yoğunluk tabanlı kümeleme algoritması olan DBSCAN, verideki doğal yapıyı belirlemek ve gürültülü (outlier) verileri dışlamak amacıyla kullanılmıştır. Bu yöntem sayesinde, özellikle küçük ama anlamlı müşteri gruplarının tespiti sağlanmıştır.
3. Beklenen Çıktılar ve Kullanım Alanları
- Müşteri kitlesi davranışsal temelli segmentlere ayrılmış olacaktır.
- Her segmentin hangi kanal(lar)ı tercih ettiği net bir biçimde ortaya konacaktır.
- Dijital kanal kullanımına açık müşteri grupları belirlenerek, bu gruplara özel dijital kampanyalar geliştirilebilecektir.
- Geleneksel kanalları tercih eden segmentler için kişiselleştirilmiş fiziksel hizmet stratejileri oluşturulabilecektir.
- Veri tabanlı hedefleme yapılması sayesinde pazarlama bütçeleri daha verimli yönetilecektir.
Proje
Kredi Kartı Veri Seti Üzerinden Kümeleme Analizi
Projeye Katkıda Bulunanlar
Neler Yaptık
Veri ön işleme, Uzaklık Ölçütü Seçimi, Kümeleme Yöntemleri