Veri Bilimi (Data Science) Nedir?

Veri bilimi (Data Science), iş için anlamlı öngörüler geliştirebilmek için veriler üzerinde yapılan çalışmaların bütünüdür. Çok sayıda verinin analiz edilmesini kolay kılmak, daha pratik bir çerçevede gerçekleştirmek amacıyla başvurulan yapay zeka, istatistik, bilgisayar mühendisliği ve matematik gibi alan ve disiplinlerin ilke ve/veya uygulamalarını bir araya getiren veri bilimi, bu yönüyle disiplinler arası bir yaklaşımdır.

Veri Bilimi Neden Gereklidir?

Veri bilimi, verileri yorumlamak ve anlamlı öngörüler çıkarmak için birtakım yöntem, teknoloji ve araçları bir araya getirir. Bu işlevi, veri bilimini önemli ve dolayısıyla gerekli kılan başlıca özelliğidir. Veri bilimini önemli ve gerekli kılan bir başka neden, bugünün modern kuruluşlarının içinde bulunduğu veri ekosistemi.

Bilindiği üzere günümüz kuruluşları çok ciddi bir veri yüküyle karşı karşıya. Veri ve bilgileri otomatik olarak toplayabilen ve depolayan bilen cihaz sayısı ve çeşitliliği ise geçmişe kıyasla hayli fazla. Çevrimiçi sistemler ve ödeme portalları; e – ticaret, tıp, finans vs. alanlarda ve birey hayatının diğer alanlarında epey miktarda veri toplamakta. Çok sayıda ve çeşitlilikte (metin, ses, video, görüntü) verilere erişimi mümkün kılmakta.

Veri Biliminin (Data Science) Geçmişi

Veri bilimi kavramı yeni olmamakla birlikte zaman içinde anlam ve çağrışım bakımından değişime uğramıştır. Anılan kavram ilk kez altmışlı yıllarda istatistik terimine karşılık olarak kullanılmaya başlanmıştır. Daha sonra, doksanlı yıllarda, bilgisayar biliminin gelişimiyle beraber bilgisayar bilimi uzmanlarınca veri bilimi terimi resmileştirildi. Yaygın olarak kullanılan tanımsa; “verilerin tasarımı, toplanması ve analizi” şeklindedir.

Veri Biliminin Geleceği

Makine öğrenimi ve yapay zeka alanlarındaki gelişmeler, özellikler veri işleme proseslerinin çok daha pratik, süratli ve verimli olmasını sağlamış durumda. Sektör beklentileri dikkate alındığında, veri bilimine ilişkin programlar ve kursları, iş pozisyonları ve sertifikaları da içeren geniş, hacimli, çok yönlü ve kapsamlı bir ekosistem meydana gelmiş durumda.

Sektör talebi ve gereksinim duyulan işlevler göz önüne alındığı takdirde veri biliminin gelecek yıllarda ciddi bir büyüme göstereceği öngörülmekte. Nitekim, bugün için önemi ve kullanım hacmi dikkate alındığında, geleceğe ilişkin bu tür bir öngörünün çok da isabetsiz olmadığı açıkça görülebilir.

Veri Bilimi Ne İçin Kullanılır?

Veri bilimi, temelde veriler üzerinde belirli çalışmaların yapılabilmesi amacıyla kullanılır. Bu süreçte dört farklı yöntem izlenir. Bu yöntemler şunlardır:

  1. Açıklayıcı Analiz
  2. Tanısal Analiz
  3. Tahmine Dayalı Analiz
  4. Kuralcı Analiz

Veri Biliminin İşletmeler Açısından Avantajları Nelerdir?

Veri biliminin işletmelerde yaygın bir kullanım alanı bulması, işletmelerin özellikle çalışma prosedürü ve iş biçiminde köklü değişikliklere neden olmuştur. Küçük, orta ve/veya büyük işletmeler, içinde bulundukları güçlü rekabet ekosisteminde ayakta kalabilmek ve geleceğe ilişkin planlarını başarıyla hayata geçirebilmek için sağlam temeller üzerine oturtulmuş bir veri bilimi stratejisine gereksinim duyar.

Küçük veya büyük oluşu fark etmeksizin, her bir işletme için oldukça önemli bir yer tutan veri bilimi; büyümeyi ivmeli bir şekilde hızlandırmak ve rekabet avantajını kusursuz bir biçimde sürdürmek adına söz konusu bilimden yardım alır. Veri biliminin bilhassa işletmeler bakımından ne tür kazanımlar vaat ettiğini sıralamak gerekirse;

  • Dönüşüm yaratma potansiyeli bulunan yeni düzen ve ilişkilerin keşfedilmesine imkan sunar. Örneğin kar marjına doğrudan olumlu bir etkide bulunabilecek düşük maliyetli kaynak yönetimi değişikliklerini ortaya çıkarabilir.
  • Ürün, hizmet ve çözümlere yenilik getirebilir. Kolaylıkla tespit edilmesi güç boşlukların tespit edilmesi ve mevcut sorunların daha belirgin bir şekilde görünürlük kazanmasını sağlayabilir. Örneğin tüketicilerin alışveriş davranışları, geri bildirimleri ve iş prosesleri gibi alanlarda daha somut ve çeşitli öngörüler geliştirilebilmesine zemin hazırlar.
  • Gerçek zamanlı optimizasyon deneyimi sunar.
  • Küçük ve büyük her türden finansal teşekküllere, içinde bulundukları ve zamanla değişen sektör koşullarına karşı gerçek zamanlı yanıt verebilme olanağı tanır. Aksi takdirde yani değişen koşullara gerçek zamanlı yanıtlar verilememesi halinde iş etkinlikleri bakımından telafisi güç kayıplar yaşanmasına neden olabilecek kesintilere sebep olabilir.

Veri Bilimi Süreci Nedir?

Veri bilimi (Data Science) çoğu zaman iş sorunuyla karşılaşıldığı takdirde kullanılır. Veri bilimi uzmanı yani veri bilimci, ilgili şirketin gereksinimlerini doğru bir şekilde tespit etmek amacıyla şirket paydaşları ile çalışır. Problem tespit edilip tanımlandıktan sonra, söze konu problemin çözüme kavuşturulması maksadıyla OSEMN veri bilimi sürecine başvurulur. Bu süreç genel hatlarıyla şu şekilde seyreder:

  • – Obtain Data (Verileri Edinme)
  • S – Scrup Data (Verileri Temizleme)
  • E – Explore Data (Verileri Keşfetme)
  • M – Model Data (Verileri Modelleme)
  • N – Interpret Result (Sonuçları Yorumlama)

Veri Bilimi (Data Science) Teknikleri

Veri bilimci, veri bilimi sürecini takip eden, değerlendirmede bulunan ve optimum sonuçlara ulaşılabilmesi bakımından nasıl bir yol izlenmesi gerektiğine dair yol haritası belirleyen uzmandır. Veri bilimi uzmanları marifetiyle oluşturulan ve yine veri bilimcilerce sık sık kullanılan tekniklerden bazıları şunlardır:

  • Sınıflandırma (Tasnif)
  • Regresyon (İlişkilendirme)
  • Kümeleme (Gruplandırma)

Veri Bilimci Kimdir, Ne Yapar?

Veri bilimci, veri bilimi prosesi çerçevesinde büyük bir yelpazedeki farklı teknoloji, teknik ve araçları kolaylıkla ve ustalıkla kullanabilir; onlardan en yüksek verimi elde ederek veri bilimi sürecinde başarılı sonuçlar elde edebilir. Daha isabetli sonuca en kısa sürede ulaşabilmek adına probleme yönelik en ideal çözüm senaryosunu geliştirir; en uygun kombinasyonları tercih eder.

Veri bilimcinin ne iş yapacağı, hangi işlemleri yerine getireceği ve rutin çalışması, hizmet verdiği kuruluşun ihtiyaçları ve büyüklüğü gibi çeşitli faktörlere bağlı değişiklik gösterir. Ayrıca, büyük bir kuruluşa hizmet veren veri bilimci multi disipliner bir yaklaşımla farklı alan uzmanlarıyla; analistler, mühendisler, makine öğrenimi uzmanları ve istatistikçilerle beraber çalışabilir.

Görece daha küçük bir kuruluşa hizmet veren veri bilimci ise pek çok farklı görevi üstlenebilir; bu çerçevede birkaç farklı iş sürecini takip edebilir. Mesleki tecrübesine, becerisine ve aldığı eğitime göre birden fazla rolü yahut birbirleriyle çakışan birkaç rolü yerine getirebilir. Şimdi, veri bilimcilerinin ne tür zorluklarla karşı karşıya kaldıklarını, veri bilimi proseslerinde yaşanabilen güçlükleri incelemek gerek.

Veri Bilimciler Ne Tür Zorluklarla Karşılaşır?

Veri bilimciler için karşı karşıya kalınan başlıca zorluk “birden fazla veri kaynağı” olarak ifade edilebilir. Kullanılan çeşitli araçlar ve uygulamalar, birbirinden farklı formatlarda verilerin oluşmasına neden olur. Veri bilimi uzmanları ise veriler arasında sistematik bir tutarlılık oluşturabilmek için verilerin temizliği ve hazırlığı işleriyle meşgul olur. Bu meşguliyet genellikle zahmetli ve zaman alıcı bir süreci beraberinde getirir.

Veri bilimcilerinin karşılaştığı bir başka sorunsa makine öğreniminin tam anlamıyla isabetli olmamasından ileri gelir. Makine öğrenimi henüz tam anlamı ile isabetli değildir. Bu nedenle sonuçta belirli bir düzeyde yanılgı veya belirsizlik söz konusu olabilir. Bu tür yanılgı veya belirsizlerin tespiti ve giderilmesi de yine zaman alıcı ve yorucu bir iştir.