Grafik Datamining

R ile Principal Component Analizi (PCA)

tarihinde yayınlandı

Doç. DR. Kutlu MERİH Principal component analysis (PCA) çok değişkenli nümerik bir veri seti içindeki bilgiyi daha az değişkenler ile fakat minimum bilgi kaybı ile açıklamanın matematik tekniğidir. Bir veri setindeki bilgi buradaki toplam değişkenlik ile açıklanmaktadır. PCA büyük boyutlu verisetlerindeki boyutsallığı azaltır. Simetrik matrislerin spektral analiz yöntemlerine dayanan PCA kullanıcıların ileri düzeyde matematik, istatistik ve linear […]

Grafik Datamining

R İLE KÜMELEME ANALİZİ K-MEANS ALGORITMASI

tarihinde yayınlandı

Doç. Dr. Kutlu MERİH Kümeleme (Clustering) veri setleri içindeki gizli grup veya ilişki şemalarını belirlemeyi amaçlayan eğitimsiz (unsupervised) bir veri analizi tekniğidir. İki temel kümeleme tekniği söz konusudur: Partisyon Yöntemi ve Hiyerarşik Kümeleme. Algoritmik zekanın gelişimi ile çok çeşitli kümeleme tekniği geliştirlmiş ve geliştirilmeye devam edilmektedir. Bu çalışma ile en popüler kümeleme teknikleri olan K-means tekniğini […]

Machine Learning

Naïve Bayes Algoritması ve R Uygulaması

tarihinde yayınlandı

Doç. Dr. Kutlu MERİH DATALAB   Giriş Naive Bayes Sınıflandırması Eğitimli (Supervised) ML algoritmalarının önde gelenlerindenedir. Hedef değişkeninin kategorik sınıflardan oluştuğu durumlarda kolay anlaşılır ve kolay uygulanır bir opsiyon sunar. Bu algoritma adını 18. yy İngiliz matematikçisi Thomas BAYES’ten ve O nun koşullu olasılıklarla ilgili teoreminden alır. Naïve sıfatı sınıflandırmayı etkileyen değişkenlerin birbirinden bağımsız olduğu kabulune dayanır. Gerçek […]

Machine Learning

Lojistik regresyon ile UCI Kardioloji Veriseti Analizi

tarihinde yayınlandı

Doç. Dr. Kutlu MERİH DATALAB Giriş Bütün istatistik analizler ve datamining algoritmaları kullanılan verisetinin yapısına özel bir koşullar kümesine bağımlıdır.  Analiz ve algoritmalar bu durumu dikkate alırsa sonuçlar daha başarılı olur. Her algoritma her veriseti için uygun olmayabilir. Bir kategorik değişkene lineer regresyon uygulayabilirsiniz ama performans istatistikleri şaşılacak kadar düşük çıkar. Bu tür durumlarda  veriseti ile […]

Machine Learning

Machine Learning II: Unsupervised Supervised Algoritmalar

tarihinde yayınlandı

Doç. Dr. Kutlu MERİH Birinci Bölümde, makine öğrenme problem türlerini ve istenen çıktıları kapsadık. Şimdi, ilgili makine öğrenme algoritmalarına yüksek düzeyde bir genel bakış sunacağız. Burada, supervised ve unsupervised, çok popüler ve yüksek düzeyde analitik algoritmalar listesi veriyoruz. Bu algoritmaların bazılarını bu çalışmanın ilerleyen bölümlerinde daha ayrıntılı olarak ele alacağız. Algoritmik Datamining ve Machine Learning […]

Machine Learning

Machine Learning I – Genel Tanımlar

tarihinde yayınlandı

Doç. Dr. Kutlu MERİH Bilgisayar teknolojisinin ve yazılımların gelişimi ile artan inanılmaz işlem gücü günümüzde Makine Öğrenmesi (Machine Learning) konusunu çok popüler bir hale getirdi. Artık bilgisayarlar algoritmik teknikler ile dışarıdan müdahaleye gerek duymadan, verilerden otomatik olarak derin analizler edinme, bilinmeyen kalıpları tanıma ve yüksek performanslı tahmini modeller oluşturma gibi uygulamaları gerçekleştirebiliyorlar. Konunun popülaritesine rağmen, […]

Grafik Datamining

R Yazılımı Veri Görselleştirme ve Datamining

tarihinde yayınlandı

Son günlerde bir açık kaynak matematik-istatistik-grafik yazılımı olarak R ye ilginin arttığını sevinerek gözlemliyoruz. Burada R nin lisans ücreti olmayan kolay ulaşılabilen ve çok güçlü bir enformatik platform olmasının büyük katkısı var. Burada R yazılımı ve bununla yapılabilecekler konusunda kısa bir özet sunmaya çalışacağız. R Nedir ve Neden İlk Seçimdir? R bir yazılım platformudur ama […]

maps

INTERAKTIF HARITALAR

tarihinde yayınlandı

Dünya Bankası WB INDICATORS verileri TIM ve diğer Global veriler ile On-Line Real-Time oluşturulmuş Interaktif Dinamik Dünya Endeks Haritaları, R yazılımı tmap paketi sonuçlarıdır. Projeksiyon ve Renk Paleti olarak haritalar sürekli gelişme aşamasındadır. TIM verilerine göre 2016 Kasım Sonu Dünya Ülkelerine İhracat TIM verilerine göre 2014-2015 Dünya Ülkelerine Elektronik İhracatı TIM verilerine göre 2014-2015 Dünya Ülkelerine Çelik İhracatı TIM verilerine göre 2014-2015 Dünya Ülkelerine […]

R yazılımı

R YAZILIMI DATAMINING MACHINE LEARNING NEDIR?

tarihinde yayınlandı

Doç. DR. Kutlu MERİH DATALAB TR olarak çalışmalarımız. R yazılımı ile Stratejik Analiz, DataMining ve Machine Learning tekniklerinin eğitimine odaklanıyor. Yaparak Öğrenme (Learning by Doing) tekniği kullandığımız için bu kavramların açıklığa kavuşması genellikle arkada ve gizemli kalıyor. Burada bu kavramları kısaca açıklamaya çalışacağız. R Nedir? R bir yazılım platformudur ama R denildiğinde akla birkaç şey […]