X

Neden Python ile Veri Madenciliği Yapılır?

Araştırmacılar, Python’u veri bilimi alanında kullanmanın birkaç nedenini belirtmişlerdir. Bu nedenler dilin veri madenciliğinde ne için seçildiğini açıklamaktadır. Yazılımcılar, Python’u yüksek okunabilirliğe sahip açık ve basit bir dil olarak görür. Yazılımcı olmayanlar bile çok zor bulmazlar.

Basitlik hem kendi dilinde hem de Python programcıları arasında yaygın ve basit kodlar yazmayı teşvik etme konusunda var olmaktadır. Bir Python programı, Java, C++ veya C ile yazılmış programlardan 2–5 kat arası daha kısa olabilir.

  • Platformdan bağımsız: Python, Mac, Linux ve Windows gibi üç ana masaüstü bilgisayar platformunda ve bir dizi başka platformda çalışabilir.
  • İnteraktif program: Birçok veri madenciliği görevi için keşifsel programlamayı kolaylaştırır. Tüm programlar bir düzenleme-hata ayıklama döngüsünde geliştirilebilir. Python türevleri IPython ve Jupyter Notebook özellikle interaktif programlama için uygundur.
  • Genel amaç dili: Python, Matlab ve R’nin aksine veri madenciliğinin ötesinde, kullanıcı uygulamaları, sistem yönetimi, oyun, web geliştirme, psikolojik deney sunumları ve kayıt dışında çok çeşitli görevlerde kullanılabilen genel amaçlı bir dildir.
  • BSD lisansı ile Python ücretsiz ve açık kaynaklı yazılım grubunda yer alır. Bazı büyük Python geliştirme ortamları, ticari kullanım için ilişkili lisans maliyetine sahip olsa da, temel Python geliştirme ortamı kurulum ve lisanslama maliyeti olmadan çalıştırılabilir. Aslında, bazı sistemlerde, örneğin, birçok Linux dağıtımında, temel Python kolayca kurulur. Python Paket Dizini, aynı zamanda özgür yazılım olan büyük bir paket kümesi sağlar.

Büyük topluluk

Python’un büyük bir topluluğu var ve bu büyük topluluk her geçen gün daha popüler oluyor. Bu popülerlik birkaç yolla tespit edilmiştir. Dil Dizini Popülerliği (Popularity of Language Index(PYPL)), programlama dilindeki sıralamasını Google Trendler tarafından sağlanan Google arama hacmine dayandırır ve Python’u Java ve PHP’den sonra üçüncü konuma yerleştirir. PYPL’ye göre Python’un popülaritesi 2004’ten beri büyümüştür. TIOBE Python’u 6. sırada yer alan bir dil olarak araştırmasında belirtmiştir. Bu araştırma “dünya çapındaki yetenekli mühendislerin sayısı, kurslar ve üçüncü taraf satıcıları”na dayanmaktadır. Python, Stack Overflow etiketleri ve GitHub projelerin ‘de en önde gelen programlama dili arasındadır. Ayrıca, 2014 yılında Python Amerika Birleşik Devletleri üniversitelerinde en üst sırada yer alan en popüler programlama dili olmuştur.

Jupyter Notebook

Kod tabanlı metinsel, grafiksel sonuçların ve belgelerin hücre tabanlı bir ortamda birleştirilebildiği tarayıcı tabanlı interaktif bir programlama aracıdır.

Python Dili ve Yazılım Bileşenleri

Basit Anlamda Python: Python, en temel seviyede kontrol yapıları (ör. if ve for), istisnalar için, (örneğin, fonksiyonlar, anonim işlevler ve def, lambda ve sınıflı sınıflar) tanımlamak için bir dizi anahtar kelime içerir.

Yerleşik sınıflar ve fonksiyonlar

Python’un sıradan bir uygulaması, modülleri içeri aktarmaya gerek kalmadan program başlangıcında bir dizi sınıf ve fonksiyon sunar. Örnek olarak dosyaları açma (open), yerleşik veri tipleri (örneğin float ve str) ve veri işleme işlevleri (örneğin sum, abs ve zip) için fonksiyonlar bulunmaktadır. __builtins__ modülü bu sınıfları ve fonksiyonları kullanılabilir hale getirir ve dir(__builtins__) ile bunların bir listesine erişilebilir.

Yerleşik Modüller

Dahili modüller, Python’da yerleşik olarak ek sınıflar ve işlevler içerir, ancak hemen erişime hazır değildirler. Bunları kullanmak için bunların içe aktarılması gerekir. Sys yerleşik modül tüm dahili modüllerin bir listesini içerir: builtin_module_ names. Yerleşik modüller arasında, sisteme özgü parametreler ve fonksiyonlar modülü (sys), matematiksel fonksiyonlara sahip bir modül (math) ve birçok kullanışlı yenileyici fonksiyonu bulunan bir modül bulunur (itertools). Yerleşik modüller kümesi Python uygulamaları arasında değişir.

Python Standart Kitaplığı (PSL)

Sıradan bir Python kurulumu, fazladan kurulum gerektirmeden, programlayıcı için sınıfları ve fonksiyonları bulunan geniş bir modül seti sunar. Programcının, sadece böyle bir modülde dışa aktarılan sınıflara, işlevlere ve sabitlere erişmesi için tek bir satır içe aktarma (import) ifadesinin yazılması yeterlidir.

Python Paket Dizini (PyPI)

CheeseShop olarak da bilinen PyPI, https://pypi.python.org adresinden temin edilebilen Python paketlerinin merkezi arşividir. Sitede yer alan endekse göre Kasım 2018 itibariyle bu yazı yazıldığında 163.294’in üzerinde paket içerdiği sitede bilgi olarak paylaşılmıştır. Bunlar lxml, reguests gibi popüler paketlerden, Django gibi büyük web çatıları (framework) ve absolute gibi garip paketlere kadar uzanıyor.

Enthought ve Anaconda gibi büyük geliştirme araçlarından biri kullanılmıyorsa, Python zaten sisteminiz tarafından kurulmuşsa, paketleri yüklemeniz gerekir. Eğer pip programını çalıştırılırsa, PyPI’den gelen paketlerin kurulumu kolaydır. Terminalden (Python dışında) pip install <paketadı> yazılarak yükleme işlemi başlatılabilir. Bu komut paketi derler, indirir ve kurar. Paket adı için daha fazla bilgi için, pip search <query> yazılabilir. Bu durumda pip sorguyla eşleşen paketlerin bir listesini döndürecektir. Paket kurulumundan sonra paket, Python’da > import <paketadı> yazılarak kullanılabilir.

Yazıyı Puanla

Bir önceki yazımız olan Python Programlama Dili başlıklı makalemizde python programlama dili, python tarihçe ve python tarihi hakkında bilgiler verilmektedir.