Ders AdıKodu Yerel KrediAKTS Ders (saat/hafta)Uygulama (saat/hafta)Laboratuar (saat/hafta)
Veri MadenciliğiYZM202235300
ÖnkoşullarYok
YarıyılBahar
Dersin Diliİngilizce
Dersin SeviyesiLisans
Dersin TürüZorunlu @ Yapay Zeka ve Veri Mühendisliği Lisans Programı (%100 İngilizce)
Ders KategorisiTemel Meslek Dersleri
Dersin Veriliş ŞekliYüz yüze
Dersi Sunan Akademik BirimYapay Zeka ve Veri Mühendisliği Bölümü
Dersin KoordinatörüArzu Kakışım
Dersi Veren(ler)Arzu Kakışım
Asistan(lar)ı
Dersin AmacıVeri madenciliğinin temel kavramlarını, veri ön işleme tekniklerini ve veri ambarı mimarisini öğretmek. Birliktelik kuralları, ardışık örüntüler, metin, grafik ve web madenciliği gibi temel veri madenciliği yöntemlerini kavratmak. Büyük ölçekli, akış (streaming), zaman serisi ve yüksek boyutlu veriler üzerinde analiz ve modelleme becerisi kazandırmak. Anomali tespiti, özellik çıkarımı/seçimi ve boyut indirgeme yöntemlerini gerçek dünya problemlerine uygulayabilme yetkinliği geliştirmek. Tavsiye sistemleri ve ileri veri madenciliği tekniklerini kullanarak finans, e-ticaret, sağlık, akıllı şehirler ve siber güvenlik gibi alanlarda proje geliştirebilme becerisi kazandırmak.
Dersin İçeriğiBu ders, veri madenciliğinin temel kavramları ve uygulamalarını kapsamlı şekilde ele almaktadır. Veri türleri, veri kalitesi ve veri ön işleme teknikleri ile başlanarak veri ambarı mimarisi ve OLAP sistemleri incelenir. Birliktelik kuralları, ardışık örüntü madenciliği, metin madenciliği, grafik madenciliği ve web madenciliği yöntemleri teorik ve uygulamalı olarak işlenir. Ders kapsamında ayrıca tavsiye sistemleri, akış verisi madenciliği, zaman serisi analizi, anomali tespiti, özellik çıkarımı ve seçimi gibi ileri konular ele alınır. Yüksek boyutlu veri analizi ve boyut indirgeme teknikleri incelenerek gerçek dünya uygulamalarına yönelik proje geliştirme çalışmaları yapılır.
Ders Kitabı / Malzemesi / Önerilen Kaynaklar
Opsiyonel Program BileşenleriYok

Ders Öğrenim Çıktıları

Ders Öğrenim Çıktısı & Program Çıktısı Matrisi

DÖÇ-1
PÇ-1-
PÇ-2-
PÇ-3-
PÇ-4-
PÇ-5-
PÇ-6-
PÇ-7-
PÇ-8-
PÇ-9-
PÇ-10-
PÇ-11-
PÇ-12-
PÇ-13-
PÇ-14-
PÇ-15-
PÇ-16-
PÇ-17-
PÇ-18-
PÇ-19-
PÇ-20-
PÇ-21-
PÇ-22-
PÇ-23-
PÇ-24-
PÇ-25-
PÇ-26-
PÇ-27-
PÇ-28-
PÇ-29-
PÇ-30-

Haftalık Konular ve İlgili Ön Hazırlık Çalışmaları

HaftaKonularÖn Hazırlık
1Veri Madenciliğine Giriş Veri madenciliği nedir?, Veri türleri ve veri kalitesi, Veri madenciliği uygulamaları, Veri ön işleme ve temizleme, Örnekleme (Sampling), Normalizasyon, Ayrıklaştırma (Discretization)
2Veri Ambarı (Data Warehousing) Veri ambarı tanımı, Veri ambarı mimarisi, ETL süreci (Extract, Transform, Load – Çıkarma, Dönüştürme, Yükleme), OLAP (Çevrimiçi Analitik İşleme), Veri küpü teknolojisi, Veri ambarı uygulamaları
3Birliktelik Kuralı Madenciliği Market sepeti analizi, Sık öğe kümeleri (Apriori, FP-Growth), Destek (support), Güven (confidence), Lift, Uygulamalar: E-ticaret sistemleri, Sağlık bilgi sistemleri
4Ardışık Veri Madenciliği Ardışık örüntü madenciliği: GSP, SPADE, PrefixSpan, Uygulamalar: Web kullanıcı log analizi, Üretim süreci log analizi, Ağ saldırı tespit sistemleri
5Metin Madenciliği Metin ön işleme (tokenization, stemming, TF-IDF), Bag-of-Words, n-gramlar, Duygu analizi, Doküman sınıflandırma (Naive Bayes), Bilgi erişim metrikleri
6Çizge Madenciliği Graf temelleri (yönlü/yönsüz, ağırlıklı, iki parçalı graf), Alt graf madenciliği, Sık alt graf keşfi, Topluluk tespiti (Louvain, Girvan–Newman)
7Web Madenciliği Web içerik madenciliği, Web yapı madenciliği, PageRank algoritması, HITS algoritması (Authority ve Hub skorları), Bağlantı analizi, Web kullanım madenciliği (oturum analizi)
8Ara Sınav 1
9Özellik Madenciliği Özellik çıkarımı ve özellik seçimi, Filtre ve wrapper yöntemleri, Karşılıklı bilgi (Mutual Information), Ki-kare, Bilgi kazancı (Information Gain), Gini indeksi, PCA, Relief, Boyutsallık laneti
10Tavsiye Sistemleri İşbirlikçi filtreleme (kullanıcı tabanlı, öğe tabanlı), Matris faktörizasyonu, İçerik tabanlı filtreleme, Hibrit tavsiye sistemleri, Değerlendirme: RMSE, MAE, sıralama metrikleri, Film tavsiye sistemi, E-ticaret tavsiye sistemi
11Anomali Tespiti Aykırı değer tespiti temelleri, İstatistiksel yaklaşımlar (Grubbs Testi), Uzaklık (En Yakın Komşu) ve kümeleme tabanlı yöntemler, Isolation Forest, LOF (Local Outlier Factor), Finansal dolandırıcılık örneği, Endüstriyel izleme örneği
12Akış Veri Madenciliği Akış verisinin özellikleri, Çevrimiçi öğrenme, Kayan pencere yöntemleri, Örnekleme, Rezervuar yöntemleri, Akış kümeleme (DenStream, CluStream), Özet veri yapıları (Count-Min Sketch, Bloom Filter)
13Zaman Serisi Madenciliği Zaman serisi tanımı, Tek değişkenli ve çok değişkenli zaman serileri, Düzenli ve düzensiz örnekleme, Gürültü azaltma ve yumuşatma, Zaman serisi benzerlik ve uzaklık ölçüleri, Akıllı şehir sistemleri
14Yüksek Boyutlu Veride Madencilik Boyutsallık laneti, Benzerlik ve uzaklık ölçüleri, Yüksek boyutlu uzaylarda en yakın komşu arama, Yaklaşık en yakın komşu yöntemleri, Yerel Duyarlı Hashleme (LSH)
15Proje Sunumları
16Final

Değerlendirme Sistemi

EtkinliklerSayıKatkı Payı
Devam/Katılım155
Laboratuar
Uygulama
Arazi Çalışması
Derse Özgü Staj
Küçük Sınavlar/Stüdyo Kritiği
Ödev
Sunum/Jüri
Projeler125
Seminer/Workshop
Ara Sınavlar130
Final140
Dönem İçi Çalışmaların Başarı Notuna Katkısı
Final Sınavının Başarı Notuna Katkısı
TOPLAM100

AKTS İşyükü Tablosu

EtkinliklerSayıSüresi (Saat)Toplam İşyükü
Ders Saati
Laboratuar
Uygulama
Arazi Çalışması
Sınıf Dışı Ders Çalışması
Derse Özgü Staj
Ödev
Küçük Sınavlar/Stüdyo Kritiği
Projeler
Sunum / Seminer
Ara Sınavlar (Sınav Süresi + Sınav Hazırlık Süresi)
Final (Sınav Süresi + Sınav Hazırlık Süresi)
Toplam İşyükü :
Toplam İşyükü / 30(s) :
AKTS Kredisi :
Diğer NotlarYok