Knowledge and Data Engineering
Uni Kassel

Clustering (Seminar)

Ort und Zeit:
Seminar-Vorbesprechung am Donnerstag, 19. April 2007, 16:15 h im Raum 0443.
Vorkenntnisse:
Informatik-Grundstudium für Einbringung in den Bachelor; abgeschlossener Bachelor für Einbringung in den Master.
Angesprochener HörerInnenkreis:
Inf. 4. Sem., Math. NF Inf. Hauptstudium; Master Informatik. Für beide Zielgruppen liegen Seminarthemen vor.
Leistungsnachweis:
Vortrag und Ausarbeitung
Veranstalter:
Prof. Dr. Gerd Stumme, Dipl.-Inform. Miranda Grahl, Dr. Andreas Hotho, Dipl.-Math. Robert Jäschke, Dipl.-Inform. Beate Krause, Dipl.-Inform. Christoph Schmitz
Inhalt:
Der In vielen Anwendungen stellt sich die Aufgabe, eine Sammlung von Objekten so aufzuteilen, dass ähnliche Objekte in der selben Menge (Cluster) liegen. Beispielsweise möchte man Telekom-Kunden nach ihrem Telefonierverhalten gruppieren, um dann einigen Gruppen spezielle Tarife anbieten zu können (Kundensegmentierung). Oder man möchte Dokumentensammlungen strukturieren, oder in Bildern zusammengehörige Pixel identifizieren. Für die Lösung dieser Aufgabe wurden verschiedene Clustering-Verfahren entwickelt. In diesem Seminar werden wir verschiedene Prinzipien anhand von konkreten Algorithmen kennenlernen:
  • partitionierende Clustering-Verfahren
  • hierarchische Clustering-Verfahren
  • dichtebasierte Clustering-Verfahren
  • gitterbasierte Clustering-Verfahren
  • modellbasierte Clustering-Verfahren
  • Clustern hochdimensionaler Daten
  • constraintbasierte Clustering-Verfahren
  • Ausreißerentdeckung
Das Seminar basiert auf Kapitel 7 des Buchs Als weitere Quelle kann verwendet werden. Die Vortragenden referieren über einzelne Unterkapitel, zu denen jeweils eine Originalpublikation vertiefend gelesen wird.
Ablauf des Seminars:

Gefordert ist eine wissenschaftliche Auseinandersetzung mit dem Thema, die insbesondere den Bezug auf Originalliteratur einschliesst. Diese kann ggf. durch graue Literatur ergänzt, jedoch keinesfalls ersetzt werden. Die Auswahl der Literatur trifft der Seminarteilnehmer, in Absprache mit dem Betreuer.

Eine Abmeldung vom Seminar ist maximal eine Woche nach Ausgabe des Themas möglich, um dann anderen Studierenden die Möglichkeit der Teilnahme zu ermöglichen.

Vier bis sechs Wochen vor dem geplanten Vortrag (der Termin wird auf der Vorbesprechung vereinbart), stellt der Teilnehmer seine Auswahl dem Betreuer vor (vorherige Rücksprachen sind ausdrücklich erlaubt). Diese Auswahl geht mit 20 % in die Endnote ein.

Drei (3!) Tage vor dem geplanten Vortrag sind per Email als PDF abzugeben:

Auch hier sind vorherige Absprachen mit dem Betreuer ausdrücklich erlaubt. Alle verwendeten Referenzen sind zusätzlich zum Literaturverzeichnis der Ausarbeitung in http://www.bibsonomy.org einzugeben, mit den Tags "kde", "seminar", "2007" und weiteren sinnvollen Tags.

Die Vortragsdauer beträgt verbindlich 30 Minuten, nach dem Vortrag besteht Gelegenheit zur Diskussion. Wir empfehlen, den Vortrag vorher vor Zuhörern zu üben. Der Vortrag (inkl. Folien und Abstract) geht mit 40% in die Endnote ein, die Ausarbeitung ebenfalls mit 40%.

Als Richtlinie für die Erstellung einer guten Seminararbeit (inkl. Vortrag und Ausarbeitung) wird das Buch empfohlen, welches in der Bibliothek im Semesterapparat des Fachgebiets Wissensverarbeitung ausliegt, und welches auch in einigen Exemplaren ausleihbar ist. Wir empfehlen die Anschaffung dieses Buchs (9,50 €), da es Sie bis zur Masterarbeit (und weiter) begleiten kann. Die Benotung der Seminararbeit erfolgt in Anlehnung an das dort auf Seite 77 angegebene Schema, angepasst auf die Erfordernisse einer Seminararbeit.
Kontakt: