BM478 Python İle Veri Bilimine Giriş

Güz 2019-2020

Öğretim Üyesi

  • Mehmet Şimşek, mehmetsimsek at duzce.edu.tr


Duyurular



Ders Kaynakları

  • Jake VanderPlas, Python Data Science Handbook: Essential Tools for Working with Data, O'Reilly Media, 2016
  • https://www.scipy.org
  • https://scikit-learn.org


Konular

  • Veri Bilimine Giriş ,Python Programlama Dilinin Temelleri ,Pandas Kütüphanesi, Veriseti Okuma, Eksik Verilerle Çalışma ,DataFrame, Temel İşlevler ,İndeksleme, Gruplama, Birleştirme ,Numpy Kütüphanesi, Aritmetik ve Çok Boyutlu Dizi İşlevleri ,Aritmetik ve Çok Boyutlu Dizi İşlevleri ,SciPy Kütüphanesi ve Temel İstatistik Araçları ,Matplotlib Kütüphanesi ve Veri Görselleştirme

Notlandırma

  • %30 Vize - %20 Ödevler - %50 Final. Bonus olarak araştırma ödevleri.


Ödevler/Ders Öncesi Çalışılacak Konular

  • Ders Öncesi Çalışılacaklar 1: pip3, scipy, numpy, pandas, matplotlib (son sürümlerinin) kurulumları.| NumPy için : https://numpy.org/doc/1.17/user/quickstart.html dokümanındaki örneklerin uygulanması.

  • Ders Öncesi Çalışılacaklar 2: Pandas için: https://pandas.pydata.org/pandas-docs/stable/getting_started/10min.html#min dokümanındaki örneklerin uygulanması.|| Matplotlib için https://matplotlib.org/tutorials/introductory/usage.html#sphx-glr-tutorials-introductory-usage-py dokümanındaki örneklerin uygulanması.

  • Ders Öncesi Çalışılacaklar 3: scikit-learn ve graphviz modüllerinin kurulması. Makine öğrenmesi alanında "sınıflandırma" kavramının ne olduğu. Karar Ağacı Sınıflandırma yönteminin çalışma prensiplerinin araştırılması. https://scikit-learn.org/stable/modules/tree.html#classification dokümanındaki 1.10.1 başlığının sonuna kadar incelenmesi ve örneklerin uygulanması.

  • Ders Öncesi Çalışılacaklar 4: True Positive, False Positive, True Negative, False Negative kavramlarının ne olduğu. Confusion matrix'in ne olduğu. Support Vector Machine (SVM) Sınıflandırma yönteminin çalışma prensiplerinin araştırılması. https://scikit-learn.org/stable/modules/svm.html#classification dokümanındaki 1.4.1 başlığının sonuna kadar incelenmesi ve örneklerin uygulanması.

  • Ders Öncesi Çalışılacaklar 5: Regresyon kavramının ne olduğu ve kullanım amacı. https://scikit-learn.org/stable/modules/svm.html#regression dokümanındaki 1.4.2 başlığının sonuna kadar incelenmesi ve örneklerin uygulanması. https://scikit-learn.org/stable/modules/tree.html#regression dokümanındaki 1.10.2 başlığının sonuna kadar incelenmesi ve örneklerin uygulanması.

  • Ödev 1: "Büyük Veri (Big Data) nedir? Büyük Verinin 5v olarak adlandırılan bileşenleri nelerdir?" konuları ile ilgili araştırma yapınız. Ödevler, 3 A4 sayfasını geçmeyecek şekilde 12 punto, Times New Roman ve 1 satır aralığı ile txt/rtf/doc/docx biçimlerinin birinde yazılacaktır. Ödevler, Turnitin uygulaması üzerinden teslim edilecektir. Turnitin kullanım detayları takip eden derste paylaşılacaktır. Son teslim tarihi 31.10.2019 günü bitimidir.

  • Ödev 2: "NoSQL veritabanları ile ilgili detaylı bir araştırma yapınız? İlişkisel veritabanlarından farklarını, türlerini, ticari uygulamalarını, kendilerine has sorgu dillerini vb. alt başlakları detaylandırınız. Ödevler, 10 A4 sayfasını geçmeyecek şekilde 12 punto, Times New Roman ve 1 satır aralığı ile txt/rtf/doc/docx biçimlerinin birinde yazılacaktır. Ödevler, Turnitin uygulaması üzerinden teslim edilecektir. Turnitin kullanım detayları takip eden derslerde paylaşılacaktır. Son teslim tarihi 22.11.2019 günü bitimidir.

  • Ödev 3: Bağlantıda verilmiş olan makaleyi okuyunuz ve kendi cümlelerinizle özetini çıkarınız. Makale: Big Data technologies: A survey

    Ödevler, 2 A4 sayfasını geçmeyecek şekilde 12 punto, Times New Roman ve 1 satır aralığı ile txt/rtf/doc/docx biçimlerinin birinde yazılacaktır. Ödevler, Turnitin uygulaması üzerinden teslim edilecektir. Son teslim tarihi 20.12.2019 günü bitimidir.

16 Ekim günü derste yapılanlar

  • 10x15 boyutunda liste (doğal olarak matris) oluşturulacak ve elemanlarına 0-50 arası rasgele sayılar atanacak.
  • Matristeki her bir satırın ilk sütununda yer alan değere göre satırlar sıralı hale getirilecek (büyükten küçüğe ya da küçükten büyüğe soğru)
  • Matrisin kendisini ve bir tam sayıyı parametre olarak alan bir fonksiyon yazılacak. Fonksiyon, kendisine aktarılan sayının gösterdiği sütunu (3 indeksine sahip sütun gibi) matristen alarak bir liste halinde çağrıldığı yere gönderecek.
  • Sütunların kendi içlerindeki toplamı yeni bir satır olarak matrise eklenecek.

    Son güncelleme Aralık 10, 2019