Veri Görselleştirmede Güncel Devrimci Yaklaşımlar (Fatma ÇINAR ile Söyleşi)

tarihinde yayınlandıVeri Analizi içinde yayınlandı
Facebooktwittergoogle_plusredditpinterestlinkedinmail

Coşkun KÜÇÜKÖZMEN  @ckucukozmen

Fatma ÇINAR @fatma_cinar_ftm

EKONOMİK ÇÖZÜM

 

Değerli okuyucular, bu hafta sizler için veri (data) konusunu ele aldık. Şirketlerin bilançolarında yer alan kalemler şirketin durumunu ve değerini görebilmek için önemli girdiler sağlar. Özellikle şirket değerlemesinde kullanılan en önemli girdiler bilanço, gelir tablosu ve gelecekteki nakit akımlarıdır. Ancak bir şirketin değerini belirlemede bunlar yeterli midir? Örneğin şirketin alanında yetkin ve uzman, son derece değerli insan kaynağı varsa bunu nerede göstereceğiz, nasıl değerleyeceğiz? Ya da şirketin elinde hem kendine hem de piyasaya ait verileri çok iyi analiz yapabilen, hatta “an”lık durumları bile çok kısa zamanda tespit ederek son derece değerli bilgileri hem de görsel olarak üst düzey yönetime ya da karar alma organlarına sunabilen bir analizi paketi varsa bu durum şirketin değeri üzerinde nasıl bir etkiye neden olacaktır? Tüm bu konuları konuşmak üzere Riskonomi Editörü Sayın Fatma Çınar ile söyleşimize başlıyoruz.

.

DB-150227 

CK: Fatma Hanım, öncelikle zaman ayırdınız, son derece değerli bilgi ve çalışmalarınızı bizlerle paylaşacaksınız, çok teşekkür ederiz. İlk sorumla başlayayım, veri görüntüleme denile olgu enformatik dünyada yeni büyük olay mıdır?

Ben de size ve Ekonomik Çözüm Gazetesi’ne teşekkür ederim. Umarım bugün ele alacağımız konularla okuyuculara farklı bir pencere, farklı bir ufuk açmış oluruz. Öncelikle son beş yılda dünyadaki hangi yayına bakarsanız bakın herkes “büyük veri analitiği” konusuna yer vermiş. Bence bu durum son derece abartılı ve gereksiz boyutta popüler hale geldi. Hatta finansal piyasalardan esinlenerek Veri Bilimcilerin dünyasının her an patlamaya hazır bir balon olduğunu söyleyebiliriz. Şirketler sürekli olarak büyük veri analitiğine atıfta bulunarak katma değer ürettiklerini düşünüyorlar. Ancak uygulamada durum son derece ilkel, şöyle ki;  bu moda kavram maalesef verinin toplanması ve depolanmasının ötesine taşınmıyor. Tıpkı bundan önce moda olan bulut veya grid uygulamalarının akıbetinden farksız olmayacak gibi duruyor. Büyük veri yakın gelecekte etkisi azalarak yok olacak moda kavramlardan biri. Bence insanlar yakın gelecekte büyük veriyi değil, verinin sorunlarını konuşacak.

CK: Son zamanlarda büyük veri (big data) gündemde çok sık yer aldı. Hatta Foreign Affairs dergisi bile sanırım geçen yılki sayılarından birine kapak yaptı bu konuyu. Büyük veriden ne kastedildiği konusunda net bir çözüm ya da anlayış geliştirildiğini söyleyebilir miyiz?

Maalesef yanıtım kısaca “hayır” olacak. Büyük veri bir çeşit son teknoloji yazılımların pazarlama çalışmaları için tali bir yol. Gerçek bir enformatik analizi için veri büyük olabilir veya olmayabilir, genelde stratejik veri setleri sanıldığı kadar büyük değildir. O halde ciddi bir analiz ve yorum yapmak için illaki büyük veriden referans almaya gerek yoktur.

Resim1

CK: Tespitleriniz çok çarpıcı, dinlerken bile bir an soluklanmak istedim devam edelim.

Evet, ne diyorduk, içinde bulunduğumuz dönemde temel sorun veriyi toplamak ve biriktirmek değil, bundan anlamlı sonuçlar üretecek yöntemleri ve yazılımları geliştirmektir. Mevcut analiz yöntemlerinin dahi büyük zafiyetleri var. Öyle olmasaydı bir küresel kriz yaşar mıydık? Üzerinden altı yıl geçti, halen etkilerini her alanda görüyoruz. Büyük veri çözümlemesi ile ilgili teknolojileri satanlar da alanlar da bunun nasıl ve ne işe yarayacağı konusunda fazla bilgiye sahip değiller. Büyük veriyi çözümlemeyle ilgili analitik teknikler çok ileri düzeyde matematik ve istatistik bilgisi gerektiriyor, bu da söz konusu teknikleri sadece çok özel kişilerin kullanabileceği ve yorumlayabileceği anlamına geliyor. Bu durum reklamı yapılan ürünlerin ve teknolojilerin yaygın kullanımını ve yararını engelliyor

CK: Veri analizi bu kadar önemli bir konu olmasına rağmen işletmelerin gündeminde üst sıralarda değil, peki, işletmelerin gündeminde neler var sizce? 

Büyük veri kütlelerinin grafiğe dönüşme konusundaki anlayışları değişiyor ve her şey Dijitalleşiyor ancak tercihler hala Duygusal! Gerçek değer ise Data Setlerinde! Hayatı eskiden filozoflardan anlamaya çalışırdık. Şimdi dijital platforma taşıyıp bir veriye dönüştürdük. Artık filozoflara değil, bilgisayarlara soruyoruz! İnsan davranışlarını anlamaya bir adım daha yaklaştığımız sofistike yani karmaşık bir yeni dönem başlıyor. Ancak Datalar bize hayatın anlamını hala söylemiyor. O kısım hala filozoflarda!!! 

CK: Çok güzel bir benzetme yaptınız, çok hoş, hayatın anlamı, filozoflar, veri ve bilgisayarlar. Tekrar konuya dönersek önerdiğimiz Grafik Data Mining Tekniğinin ayrıntılarını hakkında bizi biraz aydınlatır mısınız?

Sizin de çok iyi bildiğiniz gibi risk yönetiminin temel sorunu çözümün matematik, istatistik ve analitik tekniklerde aranması. Günümüz enformatik teknolojisinin potansiyelleri risk yönetimine matematik ve analitik tekniklerin ötesinde bakabilme olanağı sunuyor. Yüksek veri, hacmi ve çeşitliliğine karşı yüksek hızlı yazılım dilleriyle sıra dışı görsel olanakların devreye girmesi bir çözüm olarak karşımıza çıkıyor. Nedir bu görsellik diye sorarsanız anlatayım: Alışkın olduğumuz grafik formatlarının ötesinde çok kapsamlı değişkenler arasındaki ilişkileri görebilmemize olanak sağlayan akıllı, zeki grafiklerin üretilebilir olmasıdır. Örneğin Object Oritented yazılımlarla bir veri setinin içindeki ilişkiler bir grafik bataryası halinde sergilenebilmektedir.

Resim2

Bu bağlamda önerdiğimiz “grafik data mining” yani “grafikleme yoluyla veri madenciliği” yaklaşımı bu sorunun çözümü için ileri düzeyde, her sektöre ve her profesyonel yeteneğe uygun kolaylıklar getiriyor. Ayrıca data mining uygulamaları alanında dünyada ilk defa grafik tabanlı bir analiz ve yorumlama tekniği gündeme getirmiş oluyoruz. Bu yazılım teknolojileri aynı veri seti için sınırsız alternatif ve grafik yapma olanakları sağlıyor. Grafik data mining bunlar arasında enformasyon sağlayabilecek olanları tasarımlamak ve yorumlamak becerileri gerektiriyor. Böylelikle verinin geleceğiyle ilgili en büyük endişe ortadan kalkmış olacak.

Konvansiyonel grafik gösterim 2-Boyutlu

Temel olarak yeni ürünler, hizmetler ve iş modelleri oluşturma olanağı sağlar. İş görme tarzınızı kökten değiştirir sizi yeni bir düşünce tarzı geliştirmeye zorlar. Grafik bataryası dedik, yani veri seti içindeki sayısal ve kategorik değişkenler arasındaki ilişkilerin taşınmaz, kolaylıkla sayıya dönüştürülemez (intangible) faktörleri de dikkate alan çok boyutlu ve çok katmanlı grafik formlara dönüştürülmesini kastettik.

Veri Görselleştirme 4-6-7 -Boyutlu 

CK: Yanlış duymadıysam “dünyada ilk defa grafik tabanlı bir analiz ve yorumlama tekniği gündeme getirmiş oluyoruz” dediniz? Gerçekten mi? Yani bir ilk’e mi imza attınız?

Evet, aynen öyle. Bildiğiniz gibi sizin de zaman zaman dahil olduğunuz bir çok çalışma yaptık ve konferanslarda sunduk. Bu söyleşi ile bunu da buradan duyurmak Gazetenize kısmet oldu.

Veriyi toplayan değil, ihtiyaca göre değerlendirebilenler bir katma değer yaratabilir Gelişen teknolojinin imkânları ve fırsatları veri bilimlerini en aranan meslek ve insan grupları haline getirdi. Optimist Dergisi’nin son sayısına atıfta bulunarak konuşayım biraz. Bu yeni meslek grubunu “bulunmaz Hint kumaşı” benzetmesiyle tanımlamak yerinde olacak.

DB-153725

CK: Anlattıklarınız çok etkileyici ve anlaşılan size göre “grafik data mining” artık kaçınılmaz bir gelişim ve faydaları saymakla bitmeyecek kadar çok. Yine diyebiliriz ki kamu olsun özel sektör olsun erken adım atanlar kazanır. Peki, geride kalanların kaybı neler olacak? 

Bugün nasıl veriye dayalı karar vermek bir zorunluluk ise günümüzde Grafik Data Mining ile data kütlesindeki kompleksiteyi yani karmaşıklığı görselleştirmek ve işletme karar süreçlerine entegre etmek bir zorunluluk haline gelecek. Bugünün dünyasına baktığımızda hemen hemen her şirket ya da kurum verinin önemi konusunda ortak bir paydada buluşmuş durumda. Erken adımlar atan, hem varlıklarını hem operasyonlarını diğerlerinden daha hızlı optimize etmeleri, süreçleri basitleştirmeleri paydaşlarına daha hızlı ulaşama olanaklarına kavuşuyor. Grafik Data Mining’de karşılaşılan en büyük sorun bu kavramın ve anlayışın çok yeni olması ve büyük veri kavramının gölgesinde hayat buldurulmaya çalışılması. Bu model sibernetik dünyanın CEO’ları ve CIO’ları  arasındaki makası daraltan IT dünyasının karmaşık kavram ve süreçlerini basite indirgeyen ve verinin karmaşık yapısını yorumlanabilir hale getiren bir model. İnteraktif ve yalın görseller aracılığı ile veri bankalarının karmaşıklığını yok eden bir yaklaşımla stratejik karar verme pozisyonuyla “IT for CEO argümanının iş dünyasında oldukça etki yaratacağını düşünüyorum. Günümüzde yaygın olarak kullanılan teknikler ve yöntemler günümüz işletmeleri için hayati olan bir çok ihtiyaca cevap vermekten çok uzaktırlar. Bu yöntemler ile harcanan zaman, emek, enerji ve para, karşılığını hiçbir zaman bulamayacaktır.

CK: Bu noktada veriye bakış açımız ve üstesinden nasıl geleceğimiz konusu ön plana çıkıyor. Peki, veriye nasıl bakmalı nasıl analiz etmeli ve hangi formatta sonuçlar üretmeliyiz? Yüzlerce hatta binlerce rakamdan oluşan tablolar tarihe mi karışıyor?

Üç kişiden ikisi görsel olarak daha kolay öğreniyor. Kişiler okumak yerine görerek anlamayı tercih ediyorlar. Dijital iletişim esnasında duygularımızı bile artık smiley kullanarak ifade ediyoruz. Sanırım bir hoca olarak siz de derslerde bu durumu gözlemlemişsinizdir.  Neyin ne olduğunu görsel açıdan, daha hızlı ve kolay anlayabiliriz.  “Bir resim 1000 kelimeye bedeldir” deyimi günümüzde çok daha anlam kazanmış durumdadır. Veri görselleştirmenin dijital dünyada bir sonraki büyük şey olacağını düşünmemiz için nedenlerimiz var.  Karmaşık ve çok katmanlı zengin bilgiye bir bakışta ulaşılabilir ve görsel analiz doğru yapıldığında, gerçek zamanlı olarak sunulur ve güncellenebilir. Ayrıca, oldukça iletişimi de kolaydır.

VP-153706

CK: Kulağa hoş geliyor bu söyledikleriniz, ancak karmaşık veri setlerini kimler hangi becerilerle nasıl yorumlayacak?

Yurtiçi ve yurtdışında gözlemlediğimiz uygulamalar veri analizi için çok üst düzeyde matematik, istatistik ve enformatik beceri ve deneyim gerektirdiğini gösteriyor. Tabi ki bu donanımın tamamının bir yöneticide olması mümkün değil. Bu nedenle yöneticiler ve veriler arasında bir ara yüz yani “Veri Analizi Uzmanlığı” gerekiyor. Bu veri analistlerinin temel işlevi veriler içinde saklı olan gizemli ilişkileri yöneticinin hemen anlayabileceği bir formata dönüştürmek olacak. Bunun için en etkin yöntemin verileri çok boyutlu grafikler halinde yöneticilerin anlayabileceği şekle dönüştürmek olarak düşünüyoruz. Bu yaklaşım üst düzey matematik, istatistik ve enformatik beceri gereksinimini de ortadan kaldıracaktır. Veri Analistleri, analizleri üst yönetim ile haberleşebilmek için ikna edici görselleştirmeler oluşturmalı gerekirse yeni iş metrikleri tanımlayarak performans ölçüm sistemlerini önerebilmelidir. Bunların yanında veriler ile iş arasında karar vericiye destek olacak önerileri sunabilecek işletmecilik becerilerine sahip olmalıdır.

CK: Gelelim söyleşimizin en temel konusuna yani “Veri Analizinde ve Yorumlamasında Yeni Dönem” konusuna.

Artık verileri derleyen, toplayan, bunları anlamlı yorumlar ile ifade edebilen her türlü teknolojinin gelişmiş olduğu yeni bir dönemi yaşıyoruz. İmalât dâhil tedarik zinciri, lojistik, ve akla gelebilecek tüm sektörlerdeki şirketler için görsellikler şirket performansına büyük katkıda bulunabilir ve fark yaratabilir. Farklı kaynaklardan gelen verileri bir araya getirerek, bunları harmonize edip taşıdıkları gizli ilişkileri deşifre eden gerçek-zamanlı grafikler olarak sergileyen teknolojiler sadece şirketlerin yönetim makamlarında değil, personelin büyük çoğunluğunun olduğu operasyon bölgelerinde de işe yarayacaktır. Araştırmalar şunu diyor “çalışanlar ne yaptıkları, nasıl yaptıkları ve performanslarının düzeyi hakkında bilgi sahibi olduklarında kuruluşun performansı da o ölçüde artmaktadır”. Örneğin FedEx bu tür görsel yöntemler sayesinde personelin verimli ve dakik çalışmasına olanak sağlamaktadırlar. 

CK: Gelelim model konusuna, görselleştirme tamam ama veriye dayanan görselleştirme süreçleri ne tür modelleri kullanmalı?

İşletmeler, organizasyonun her düzeyinde “enformasyonun” stratejik katmanlarda nasıl tasarlanacağı ve toplanan verilerden anlamlı analizlere nasıl ulaşılacağı ve veriler arasındaki gizli desenleri, örüntüleri gösterecek sistemlere ihtiyaç duymalıdır. Bu tür ihtiyacı duymayan şirketlerin ömrü de kısa oluyor ve nasıl yok olduklarını bir türlü anlayamıyorlar ve farklı bahaneler üretiyorlar. Bu cümlem biraz abartılı gibi gelebilir ama durum maalesef bu! İşletmelerin finansal fayda elde etmek ve pazar paylarını korumak için performanslarını çok iyi gözlemlemeleri ve gerekli kararları en iyi şekilde verebilmek için ölçümleri iyi yapabilmeleri gerekir. Daha da önemlisi veriye soracakları soruyu çok iyi bilmeleri gerekir. Performansı optimize edebilmeleri için ise bütünleşik kuramsal uygulamalar ve entegre raporlamalarla “Object Tabanlı Entegre Kurumsal Performans Yönetimi (Object Oriented Complexity Management)” modeline geçmeleri gerekir. Bu model bizim geliştirdiğimiz bir model ve detaylarına Google’dan Riskonometri ve Riskonomi anahtar kelimelerini sorgulayarak erişebilirler. Çünkü günümüz dünyasında “performansın zaman metriği değişti, aynı zamanda da performans düzeyi de arttı”. 

FP-150214

CK: Hemen araya girmek istiyorum, bu anlayışa ya da çözüme diyelim, nasıl ulaştınız? Zira daha önce duyulmadık bir şey ve ifadenize göre çok yeni, mucidi de siz ve ekibiniz, bu yaklaşıma nasıl ulaşıp benimsediniz?

Master ve doktora çalışmalarımda çok seçkin hocalarla çalışma şansım oldu. Giderek bir takım haline geldik. Bu takımda Türkiye’nin en seçkin Yöneylem Araştırması, Enformatik ve Finans hocaları var. Onların deneyimi ve birimi artık analitik ve matematik tekniklerin iş hayatının bu günümüzdeki aşamasında artık yetersiz kalmaya başladığını gösterdi. Böylece hep birlikte yukarda özetlediğim yaklaşımı oluşturduk. Bu tür grafik formlarını destekleyen yazılımlardan yararlandık, örneğin SPSS, SAS ve Excel gibi yazılımlar, ekonometrik analiz yapan yazılımlar bu tip grafikleri destekliyor. Ama aralarında hız ve kalite farkı söz konusu. Ayrıca bu yazılımların çoğu lisanslı ve ücretlidir. Bunun karşılığında teknik destek sağlarlar. Bazıları da lisanssız ve açık kaynaklıdır. Internetten ücretsiz indirilebilir ama teknik destek sağlamazlar ve etkin kullanılmasının öğrenilmesi güçtür. İşte bu noktada hangi yazılımı hangi kriterleri göz önünde bulundurarak seçmeliyiz sorusu akla geliyor. Eğer iyi eğitilmiş son teknolojiye hâkim veri analisti uzmanlarınız yoksa kaçınılmaz bir şekilde lisanlı bir yazılım satın alıp onların verebileceği desteğe ikna olmak durumundasınız. Yani bağımlısınız! Deneyimli ve son teknolojiye hâkim veri analistleriyle çalışabiliyorsanız (internal-outsourcing) bu durumda internetten ücretsiz olarak indirilebilen açık kaynaklı bir yazılım kullanabilirsiniz. Bunların içinde dünyada en önde gelen ve çok geniş bir kullanıcı tabanı ve internet desteği olan R yazılımıdır. Bu yazılıma bildiğim kadarıyla ülkemizde pek ilgi gösterilmiyor. Umarım yanılıyorumdur.

CK: Veri madencisi (data-miner) yetiştirme konusu bugün bir çok ülkenin eğitim öncelikleri arasında yer alıyor, sizce bu konuda ne gibi adımlar atılmalı, nereden başlanmalı?

Burada esas önemli olan şey analiz sonuçlarını doğru anlayıp, değerlendirebilen yöneticileri yetiştirmek. Çok kısa sürede değişik senaryoları hızlı bir şekilde test edip, doğru soruları sorabilen, gerekirse hızlı bir şekilde yön değiştirebilen data kütlesindeki aksiyonları şirketin performansına entegre edebilen yöneticiler yetiştirilmeli. Bu da aslında ciddi bir kültür değişimini şart koşuyor. Öncelikle bu yeni kültürü yerleştirmemiz gerektiğini düşünüyorum kısa vadede. Şirketlere ve CEO’lara profesyonel pencereden baktığımızda şu tablo göze çarpıyor: Bugünün tepe yöneticilerinin (gençler dâhil) çoğunluğu 20 yıl öncesinin yönetim anlayışı ve kültürünü halen sürdürüyorlar, iyi eğitim almış olmalarına rağmen bu durum konvansiyonel anlayıştan uzaklaşmalarını zorlaştırmaktadır. Bunun çözümü bilgi toplumunu yönetebilme farkındalığından geçiyor. Uzun vadede bu yeni kültürün vazgeçilmez bir rekabet avantajı haline gelmesi kaçınılmaz görünüyor. Gerekli yeteneklere, yetkin ve gelişime açık yöneticilere sahip olmayan organizasyonların yaşama ve başarılı olma şansı hızla azalacak. Bir diğer konu da yine ülkemizde hatta dünyada sayıları çok fazla olmayan veri bilimcileri yetiştirebilmek ve onları geleceğin yöneticileri olarak konumlandırmak. Bu noktada da herkesin programcılığı anlamasının ve bilmesinin çok faydalı olduğunu düşünüyorum. Bilgisayar bilimleri ve enformatik gibi alanların eğitim sistemimizin temel yapı taşları olarak görmemiz gerektiğine inanıyorum.

DB-153727

CK: Çalışma ve ilgi alanım itibarı ile sormak istiyorum. Bu yaklaşımın risk yönetimi hatta sigortacılık alanlarına ne gibi katkılar sağlayacağını düşünüyorsunuz? 

Grafik Data Mining tekniği ile hayata geçirilen uygulamalarda, büyük hacimli verilerin analizi görsel olarak çok kısa sürede yapılmakta ve yapılacak tespitler ve uyarılar ile alınacak tedbirlerin çok kısa sürelerde alınmasına imkân vermektedir. Zaten risk yönetiminin esası da bu değil mi? Yani hızlı tespit ve hızlı çözüm, gecikmeye yer yok! Bu fonksiyonu ile finans dünyasındaki risk aktörlerine ve kurumlarına gerçek anlamda ve zamanında fayda sağlayacak raporlar üretebilecek, söz konusu uygulama ile dünyada bir İLK’e imza atılmış olunacaktır. Diğer taraftan analizlerin interaktif ve gerçek zamanlı olarak anında yapılabilmesi risk aktörleri ve kurumlarının operasyonel süreçlerindeki riskler (kredi ve temerrüt riski) ile ilgili bir nevi erken uyarı sistemiyle örneğin bankacılık ya da menkul kıymet, sigorta sistemine ilişkin son derece etkin ve eşsiz bir gözetim imkânı sağlamış olacaktır. Bu analizleri yaparken kullandığımız ve halen geliştirmekte olduğumuz JAVA tabanlı yazılım ve araçların kurumlar nezdinde projelendirilmesi ve olgunlaştırılması sektöre muazzam bir analiz imkânı sağlayacak ve sistemin kullanımından elde edilecek faydayı artıracaktır. 

CK: Evet Fatma Hanım sohbetin sonuna geldik, zamanın nasıl akıp gittiğini anlayamadık, son soru ile bitirelim diyor ve ayırdığınız aman ve paylaştığınız kıymetli bilgiler için teşekkür ediyoruz. Son sorum şöyle, Türkiye’deki Şirketlerin Grafik Data-Mining’in getirdiği yeni süreçlerle ilgileneceğini düşünüyor musunuz?

Türkiye’deki çok değerli çalışmaların yapıldığını katıldığım değişik toplantılarda, seminer ve konferanslarda gözlemliyorum. En başta büyük veriyi, çeşitli iş zekâsı çözümlerini ve veri tabanı yönetimi kavramlarını birbirinden ayırmamız gerekiyor. Birbirlerine kavram olarak benzeseler de farklı yaklaşımlara ve yeni anlayışlara ihtiyaç var. Nesnelerin interneti üzerine daha çok eğilmemiz ve bu alanda yeni analiz tekniklerine sektörel bazda uygulamaya geçirmeliyiz. Beklentim yazılım şirketlerinin modelimize ilgi göstermeleri ve bize çözüm ortağı olmalarıdır. Yaptığımız çalışmanın desteklenmesi durumunda tüm dünyanın ilgisini çekeceğimize gönülden inanıyorum. Bu çerçevede sanırım iki grafik ile durumu özetleyebiliriz. 1 numaralı grafik mevcut yöntemlerle çizilen bir grafik. 2 numaralı grafikte örneğin teşvik kapsamında 6’ncı bölgede yer alan illerdeki konut kredilerinin takibe düşme oranını/miktarını hem şehir hem yıl bazında tek grafikte görebiliyorsunuz. Yani on binlerce hatta gerekirse yüzbinlerce veri sınıflanmış, analiz edilmiş olarak tek grafikte her şeyi anlatıyor. Yakın zamanda bunun eğitimini de vermeye başlayacağımızı buradan duyurmak isterim. Teşekkürler.

Facebooktwittergoogle_plusredditpinterestlinkedinmail