R yazılımıVeri Analizi

Türkiye Haziran-2015 ve Kasım-2015 Seçimlerinin Harita Endeksleme ile Analizi

Facebooktwittergoogle_plusredditpinterestlinkedinmail

Doç. Dr. Kutlu MERİH

Doç. Dr. Çoskun C. KÜÇÜKÖZMEN

Fatma ÇINAR MBA

Giriş

Bu çalışma eldeki veri setlerinin harita üzerinde endekslenmiş olarak görselleştirilmesi amacına yönelik olarak yapıldı. Böylece endekslenmiş harita görselleştirmesi ile veri setlerinin ne kadar kolay analiz edilebileceğini göstermek istedik. Haziran-2015 ve Kasım-2015 seçimlerinin il bazındaki sonuçlarını internetten kolayca elde edebilmek çalışmanın motivasyonu oldu. Ayrıca Hakan SARIBIYIK ın yine internet üzerinden açık olarak sunduğu benzer bir çalışma işimizi çok kolaylaştırdı. Onun verdiği R yazılımını bir kaç modifikasyonla hazır olarak kullanabildik. Onun çalışması R yazılımı tmap paketini ve cografik veri kaynağı olarak   NaturalEarthData öneriyordu. Biz cografik veri ile seçim verilerini örtüştürmek için R yazılımı sp paketinden ve GADM cografik databankasından da yararlandık. R tmap ve R sp paketlerini kombine kullanmak verilerin örtüşmesinde bazı kolaylıklar sağlıyor. Ayrıntıları başka bir çalışma ile özetleyeceğiz.

Seçim verileri ile Harita Endeksleme partilerin Türkiye genelinde aldıkları oy verilerini sayısal metrikten gradient renk metriğine çevirerek, hem seçimlerde partilerin güçlü yada zayıf oldukları illeri harita üzerinde söze gerek kalmadan gösteriyor, hem de ardışık iki seçim arasındaki alınan sonuçları her bir parti için alt alta (veya yan yana) haritada göstererek üzerinden analiz yapılacak bir materyel oluşturuyor.

Temel Adımlar

 1. Haritada endekslemek istediğimiz veriyi R dilini kullanarak hazırlayacağız.
 2. H. SARBIYIK harita dosyasını NaturalEarthData sitesinden alınan veri ile oluşturuyor ve bu veriyi R dilinin TMap kütüphanesini kullanarak Türkiye için filtreliyor. Aynı işlem GADM veritabanından doğrudan Türkiye için de yapılabiliyor.
 3. Harita dosyasını oluşturduğumuz seçim veri dosyaları ile birleştireceğiz, Bunun için hem R: tmap paketinin hem de R: sp paketinin özel komutları var.
 4. Harita ve verinin birlikte bulunduğu data.frame formatındaki veri yapısı ile tematik haritalarımızı oluşturacağız.

Veri hazırlığı

Haziran 2015 ve Kasım 2015 tarihlerinde Türkiye de yapılan seçimlerin sonuçları wikipedia dan alınarak excel dosyaları  formatında temel verisetleri oluşturuluyor. Bunları harita verisi (shape dosyası) ile birleştirebilmek için shape dosyasını il kodlarını içerecek şekilde yeniden düzenledik (sp paketi burada işe yarıyor) ve harita verileri ile seçim verilerini il kodları üzerinden örtüştürdük. Türkçe karakter sorunu isim üzerinden örtüştürmekte olumsuz sonuçlar verebiliyor.

Tematik Harita Analizi

Artık hazırladığımız dosyayı kullanarak işlemlere başlayabiliriz. Basit bir örnek olan illerin MV sayılarının endekslenmesi ile ile başlayalım.

 • SECIMMV
 • Türkiye de il bazında milletvekili dağılımı
 • Meclise giren dört partinin Haziran ve Kasım 2015 seçimlerinde aldığı oy oranları harita üzerinde gösterimi için bir R fonksiyonu yazıyoruz. Her bir parti için bu fonksiyonu kullanarak haritaları elde ediyoruz. Burada H. SARIBIYIK ın verdiği program işimizi kolaylaştırdı.
 • Önce AKP, CHP, HDP ve MHP nin Haziran ve Kasım seçim sonuçlarının karşılaştırılması. Burada ilerlenen ve gerilenen iller açıkça görülebiliyor.
 • AKP CHP HDP MHP Haziran-2015/Kasım-2015 Seçim Sonuçlarının gradient renkli harita endeksleri

  SECIMAKP

SECIMCHPSECIMHDPSECIMMHP

Şimdi dört partinin Kasım-2015 sonuçlarını tek grafik üzerinde gösterelim.

SECIM4LU

Sonuç

Performansa göre endekslenmiş haritalara bakarak her bir parti için iki seçim arasındaki farkı analiz etmek, bir tablo, pay  veya çubuk ve benzeri grafik kullanarak yapılabilecek analizlerden daha basit ve kolay sonuçlar veriyor. En güzeli de, araya bir analistin girmesine gerek kalmadan doğrudan karar vericinin karar almasına yardımcı olabilmesi. Bu haritaları siyaset profesyonellerinin bizlerden daha etkili olarak yorumlayabileceği açık. Bu nedenle siyasi yorumları biz yapmayacağız. Bu tekniğin potansiyel uygulamalarının sınırsız olduğu açık. Bu sadece bir örnek çalışma ama tekniğin gücünü net bir şekilde sergiliyor. Hakan SARIBIYIK ın yol gösterici ve ufuk açıcı  çalışması için de tekrar teşekkürler.

KAYNAK:   (Big Data Specialist at DorukNet)

R ile Veri Analizinde Tematik Harita Kullanımı

Facebooktwittergoogle_plusredditpinterestlinkedinmail