Data Mining (Veri Madenciliği) Nedir?

Son yıllarda, bilgi ve iletişim teknolojilerinde (BT) meydana gelen gelişmelere paralel olarak, işletmelerin topladıkları veri miktarının artması ve bu verileri analiz etme araçlarının gelişmesi, firmaların topladıkları veriyi analiz etmeye yönelik ilgilerini artırmıştır. Bu gelişmeler doğrultusunda, gerek akademik alanda gerekse iş dünyasında veri madenciliği uygulamalarının yaygınlaştığı görülmektedir. Veri madenciliği, toplanan verilerden anlamlı bilgiler çıkarmak, veri içerisinde gizli olan bir takım örüntüleri ve eğilimleri tespit etmek ve çeşitli değişkenler arasında ilişkiler bulmak ve böylece karar vermeye yardımcı olmak amacıyla uygulanan bir yaklaşımdır. Veri madenciliğinde istatistik, yapay zekâ, makine öğrenmesi gibi farklı alanlarda geliştirilmiş birçok teknik ve yöntem kullanılmaktadır. Ancak veri madenciliği yalnızca bir takım araç ve tekniklerden ibaret olmayıp, veri toplama, veri temizleme, model oluşturma, model testi ve uygulama gibi birçok aşamaları içeren bir süreci ifade etmektedir. Ayrıca bu aşamaların tümünde her ne kadar BT kullanılsa da, insanın yorum ve katkısının çok önemli olduğu ve dolayısıyla sürecin tümünün bilgisayarlar tarafından otomatik olarak gerçekleştirilemeyeceği unutulmaması gereken önemli bir husustur.

Veri madenciliği farklı birçok alanda ve farklı amaçlarla kullanılmakla birlikte, uygulamada veri tanımlama, sınıflandırma, kümeleme, ilişkilendirme, tahmin etme gibi bazı temel uygulama türlerinin yaygın olarak kullanıldığı görülmektedir. Bu çalışmada kullanılan veri madenciliği bir sınıflandırma uygulamasıdır. Sınıflandırma gözlemlerin birbirinden ayrı sınıflara atanması ile ilgili olup birçok alanda yaygın bir biçimde kullanılmaktadır. Bu uygulamalar arasında, sahtecilik tespiti, kredi riski, müşteri sınıflandırması gibi farklı alanlarda yapılmış örneklere rastlanmaktadır. Sınıflandırma uygulamalarında, bir takım girdi değişkenlerine dayalı olarak eldeki birimlerin farklı sınıf veya gruplardan hangisine dahil olacağı tahmin edilmeye çalışılmaktadır.

Euro-DMC 2011 yılında başlattığı “veri madenciliği” çalışmalarını 2014 yılı itibariyle finans sektöründe yoğunlaştırarak önemli bir alanda ivme kazanmayı hedeflemiştir. 2016 ikinci çeyreğinde çalışmalarını ölçeklendirilebilir bir noktaya getirmiş ve sadece Türkiye’de değil, dünyanın herhangi bir noktasında dilediğiniz sektörde rekabet analizi yaparak, sektör dominasyonunu raporlamaktadır.