Themen:

Viele Aufgabenstellungen beschäftigen sich mit der Implementierung verschiedener Komponenten in eines der Websysteme die am Fachgebiet betrieben werden oder mit der Analyse der in solchen System vorhandenen Daten. Darüber hinaus werden weitere Themen angeboten, die in der Regel einen inhaltlichen Bezug zu aktuellen Forschungsprojekten des Fachgebiets Wissensverarbeitung haben.

Die Themenstellung erfolgt in Absprache mit dem Studierenden; die Ausrichtung und der Umfang der Arbeit richtet sich nach dem jeweils angestrebten Anschluss. Prinzipiell liegt der Schwerpunkt bei Abschlussarbeiten auf der Methodik, während er bei Projektarbeiten auf der technischen Umsetzung liegt.

Zu folgenden Themengebieten können wir Arbeiten anbieten; zu konkreten Themen können die jeweiligen Betreuer genauere Auskunft geben.

(M = methodischer Schwerpunkt, T = technischer Schwerpunkt, B = als Bachelorarbeit möglich, MA = als Masterarbeit möglich)

Sonderprojekt Web Conference Challenge T,M

Die Aufgabenstellung wird spätestens am 1. Dezember 2017 hier veröffentlicht. Bis 12. Januar 2018 bzw. 14. Februar 2018 haben die Teilnehmer dann die Möglichkeit, ein entsprechendes Lösungsmodell einzureichen. Um eine effektive Ausnutzung der kurzen Wettbewerbszeit zu ermöglichen, raten wir allen Teilnehmern, sich umgehend bei den Betreuern (siehe unten) zu melden.

Die Kenntnisse der Vorlesung Knowledge Discovery sind notwendig.

Das Fachgebiet Wissens­verarbeitung ruft zur Teilnahme an der Web Conference Challenge 2018 auf. Der Wettbewerb richtet sich an Studierende und Doktoranden von Universitäten aus der ganzen Welt. Die Aufgabenstellung wird sich an einer aktuellen und praxisnahen Data-Mining-Problemstellung orientieren. Das Projekt beschäftigt sich mit der Lösung der gestellten Aufgabe. Von Projektteilnehmern wird die aktive Teilnahme an der Web Conference Challenge erwartet.

Leistungen:

  • 1 – 2 Präsentationen (je nach Team-Größe)
  • 5 Seiten Ausarbeitung

Informationen: Mark Kibanov

Auswertung der RFID-Daten und ihrer Qualität M

Die vom SocioPatterns Konsortium entwickelte RFID-Technologie ermöglicht die Lokalisierung von Menschen sowie die Bereitstellung von Informationen über deren soziale Kontakte. Ziel dieser Arbeit ist die Auswertung der vorliegenden RFID-Daten und daraus entstehenden Netzwerken.

Informationen: Mark Kibanov

Scraping-Framework für Social-Media-Daten zur Erkennung von Benutzerinteressen T

Im Projekt topikos werden anhand von mit Smartphones gesammelter Sensordaten automatisch topologische Karten von Umgebungen erstellt. In einem weiteren Schritt sollen die Karten mit automatisch extrahierten Themen angereichert werden. Für die Themenextraktion müssen zunächst Daten aus Social-Media-Plattformen gesammelt werden (hinterlegte öffentliche Profildaten, Posts, Likes, plattformspezifische Informationen wie Publikationstitel in ResearchGate).

Ziel dieses Projektes ist die Entwicklung eines einheitlichen und erweiterbaren Frameworks zur Beschaffung von Userdaten aus verschiedenen Social-Media-Plattformen. Die zu unterstützenden Plattformen sind Twitter, ResearchGate und Facebook (in Absprache/optional: Google+, BibSonomy, LinkedIn, Xing). In Absprache mit dem Betreuer muss analysiert werden, welche Daten aus diesen Plattformen zugänglich und nützlich sind.
In einem weiteren Schritt soll das Framework das Extrahieren von Features für einen Benutzer ermöglichen (z. Bsp. Bag-Of-Words, TF-IDF).

Informationen: Bastian Schäfermeier

Analyse sequenzieller Muster in der Popmusik M,B,MA

Anhand von knapp 200 annotierten Songs sollen Muster in der Popmusik untersucht werden. Dabei sollen sowohl die Folge als auch die Dauer der Harmonien verwendet werden, um anschließend verschiedene Fragestellungen zu beantworten, wie z.B.:
– Welche Songs weisen die einfachste / komplexeste Struktur auf?
– Welche Songs haben eine ähnliche Struktur?
– Gibt es eine “Hit-Formel”, die sich in vielen bekannten Songs wiederfindet?
– Welcher Song ist am unähnlichsten zu allen anderen Songs?
– Wie gut kann man den Interpreten anhand der Harmonien erkennen?
– Lassen sich die Songs in Abschnitte einteilen (Strophe, Chorus, …) und welche Muster zeigen diese?

Die Auswahl der Fragestellungen erfolgt in Absprache mit dem Betreuer und richtet sich nach dem Umfang des Projekts / der Abschlussarbeit.
Für die Bearbeitung der Aufgabe wird kein musikalisches Vorwissen benötigt, jedoch die Bereitschaft sich in die Grundlagen der Intervalle (Prime bis Septime) einzuarbeiten.

Informationen: Andreas Schmidt

Visualisierung von Hierarchien T

Im Rahmen des Projekts soll ein Software-Tool entwickelt werden, mit dem große Hierarchien dargestellt und untersucht werden können. Dazu sollen neben der Darstellung auch weitere Funktionen umgesetzt werden, die es bspw. erlauben, Teilbäume der Hierarchie anhand von Kontext-Informationen zu filtern oder auch zu expandieren.

Die Umsetzung kann mit Java, Python oder auch JavaScript (Webanwendung) erfolgen, wobei je nach gewählter Programmiersprache geeignete Bibliotheken für Datenvisualisierung (z.B. D3.js) oder Netzwerke (z.B. NetworkX) verwendet werden können.

Informationen: Andreas Schmidt

Generator für zufällige formale Kontexte T,M

In diesem Projekt sollen verschiedene Ansätze bipartite Graphen zu erzeugen praktisch untersucht werden, um Generatoren für interessante Klassen von Kontexten zu entwickeln.

Informationen: Tom Hanika

Heuristiken zum Finden maximaler Cliquen T,M,BA

Die maximale Cliquen in einem bipartiten Graphen $G$ entsprechen den formalen Begriffen eines Kontext welcher Isomorph zu Adjazenzmatrix von $G$ ist. Die Berechnung der Menge der formalen Begriffe ist aufwändig. Inwiefern können maximale Cliquen einer gewissen Größe durch heuristische Algorithmen leichter gefunden werden?

Informationen: Tom Hanika

Standard-Sample-Set für die Algorithmenentwicklung sozialer Netzwerke T,M

Bei der Entwicklung neuer Methoden für die Untersuchung von sozialen Netzwerken werden häufig echte Beispieldaten benötigt. Ziel dieses Projektes ist es einen Pool solcher Daten in einem homogenen Format zusammenzustellen. Dabei sollen die Elemente des Pools auch hinsichtlich ihrer grundlegenden Eigenschaften klassifiziert werden.

Informationen: Gerd Stumme

Entropie in formalen Kontexten T,M,B,MA

Entropie ist eine zentrales Maß für viele Objekte in der Wissenschaft. Es gibt verschiedene Ansätze die Idee von Entropie auf soziale Netzwerke zu übertragen. In dieser Arbeit soll ein Schritt weiter gegangen werden, indem eine Weiterübertragung auf formale Kontexte versucht wird. Neben der Modellierung soll eine Evaluierung hinsichtlich der Nutzbarkeit durchgeführt werden.

Informationen: Gerd Stumme

Begriffsverband der Maße T,M,B

Es gibt eine Vielzahl von Maßen zur Identifikation von interessanten formalen Begriffen in Begriffsverbänden. Diese besitzen wiederum sehr verschiedene Eigenschaften wie zum Beispiel Monotonie. Dieser Arbeit besteht aus dem Zusammentragen und der Erstellung einer begriffliche Ordnung aller bekannten Maße.

Informationen: Tom Hanika

Dichtebasiertes Clustering und FBA T,M,B

Die zentrale Fragestellung dieser Arbeit ist die Verbindung zwischen dichtebasiertem Clustering und der Formalen Begriffsanalyse (FBA). Inwiefern können Ideen und Methoden des dichtebasiertem Clustering auf FBA übertragen werden?

Informationen: Gerd Stumme

BibSonomy: Simple Co-Autor Recommender T,M

Für das social bookmark and publication sharing system BibSonomy soll ein simples Co-Autor Empfehlungssystem entworfen und implementiert werden. Es soll zum Beispiel der häufigste Co-Autor eines Autoren empfohlen werden. Dabei kann auf das vorhandene Recommender-Framework des BibSonomy Systems zurückgegriffen werden.

Informationen: Tom Hanika

BibSonomy: Neustrukturierung der Community Post Seite T,M

Community Posts bilden in BibSonomy das gesammelte bekannte Wissen über einen Post ab. Bei diesem Projekt soll diese Seite hinsichtlich Funktionalität und Übersichtlichkeit neustrukturiert werden.

Informationen: Tom Hanika

BibSonomy: Personen- und Autoren-Clouds T,M

Personen- und Autoren-Clouds ermöglichen es dem User sehr aktive Autoren von Publikationen als auch Personen zu entdecken. Das effiziente und zeitnahe Berechnen und bereitstellen dieser Clouds ist jedoch aufgrund der Größe des BibSonomy Systems nicht trivial. Das Projekt beinhaltet die Entwicklung und Implementierung einer Lösung.

Informationen: Tom Hanika

BibSonomy: Weiterentwicklung des BibTeX-Parsers T,M

Parsen von BibTeX-Code ist eine der Schnittstellen um Publikationen in BibSonomy einzutragen. In den letzten Jahren gab es viele Entwicklungen um die orginale BibTeX-Software abzulösen. In diesem Projekt soll der Parser der aktuellen Software Biber untersucht werden um die mögliche Adaptierbarkeit für BibSonomy einzuschätzen.

Informationen: Tom Hanika

Aufgabenstellung und Termin:

nach Absprache mit dem jeweiligen Betreuer

Vorkenntnisse:

Informatik Grundstudium bzw. 30 absolvierte Credits des Masterstudiums

Angesprochener Teilnehmerkreis:

Bachelor-, Diplom- und Masterstudierende Informatik, Math. NF Inf. Hauptstudium

Leistungsnachweis:

in der Regel Implementierung, schriftliche Ausarbeitung und Vortrag

Umfang:

9 Wochen für Bachelor, 3 Monate für Diplom I und 6 Monate für Master und Diplom II

Veranstalter:

Prof. Dr. Gerd Stumme, Dipl.-Math. Tom Hanika, Dipl.-Inform. Mark Kibanov, M. Sc. Bastian Schäfermeier, M. Sc. Andreas Schmidt