Bachelor-, Diplom- und Masterarbeiten – KDE – FB16

Themen:

Viele Aufgabenstellungen beschäftigen sich mit der Implementierung verschiedener Komponenten in eines der Websysteme die am Fachgebiet betrieben werden oder mit der Analyse der in solchen System vorhandenen Daten. Darüber hinaus werden weitere Themen angeboten, die in der Regel einen inhaltlichen Bezug zu aktuellen Forschungsprojekten des Fachgebiets Wissensverarbeitung haben.

Die Themenstellung erfolgt in Absprache mit dem Studierenden; die Ausrichtung und der Umfang der Arbeit richtet sich nach dem jeweils angestrebten Anschluss. Prinzipiell liegt der Schwerpunkt bei Abschlussarbeiten auf der Methodik, während er bei Projektarbeiten auf der technischen Umsetzung liegt.

Zu folgenden Themengebieten können wir Arbeiten anbieten; zu konkreten Themen können die jeweiligen Betreuer genauere Auskunft geben.

(M = methodischer Schwerpunkt, T = technischer Schwerpunkt)

Erzeugung und Analyse von bipartiten Graph-Modellen T,M

Zur Analyse von Netzwerken werden sehr oft Graphen herangezogen. Eine spezielle Klasse stellen hierbei die bipartiten Graphen dar. Die Knotenmenge eines solchen besteht aus zwei disjunkten Mengen und die zugehörige Kantenrelation enthält nur Kanten, die Knoten der einen mit Knoten der anderen Menge verbinden. Zum Beispiel läßt sich die Relation zwischen Schauspielern und deren Filmen als bipartiter Graph auffassen. Generiert man solche Graphen (naiv) zufällig, so weichen diese stark von aus echten Daten erhaltenen ab. In [1] wird ein Verfahren zur Erzeugung von bipartiten Graphen vorgestellt, welches dafür besser geeignet ist.

Ziele des Projektes seien die folgenden:

Vergleich von naiv zufällig erzeugten Graphen mit echten Daten anhand der in [1] als signifikant herausgestellten Größen.
Formalisieren und implementieren der zwei in [1] vorgestellten Algorithmen zur Erzeugung bipartiter Graphen.
Vergleich der mittels der Algorithmen erzeugten Graphen mit aus echten Daten erhaltenen.

Die Ausarbeitung, d.h. die Formalisierung der Algorithmen sowie die Darstellung und der Vergleich der Messergebnis, sollte möglichst in LaTeX erstellt werden. Die Implementierung sollte in einer der folgenden Programmiersprachen geschehen: C/C++, Java, Python, GNU R.

[1] „Bipartite Graphs as Models of Complex Networks“, Jean-Loup Guillaume and Matthieu Latapy

Informationen: Tom Hanika

Simulationen der Relocations-Algorithmen für CarSharing T,M

CarSharing, wie Car2Go oder DriveNow, ist eine Dienstleistung für kurze Automieten. In den letzten Jahren ist CarSharing in vielen großen Städten beliebt und populär geworden. Es wird oft mit dem Free-Flow-Modell realisiert: Die Kunden können in der Nähe stehende Autos mieten und an beliebigen Orten im Geschäftsgebiet die Miete beenden. Das Problem dabei ist: Die Verteilung der Autos wird dadurch mit der Zeit nicht optimal und manche Autos können in Bereichen stehen, wo diese nur selten gemietet werden. Diese Autos müssen also vom Betreiber umverteilt werden.

Das Forschungsthema ‘Empfehlungssysteme für Taxifahrer’ ist dabei weit verbreitet und populär. Ziel der Arbeit ist eine Anpassung und Implementierung der existierenden Empfehlungs-Algorithmen für Taxi-Fahrer, um die besten Relocations für CarSharing-Betreiber zu empfehlen.

Die Aufgabe besteht aus folgenden Teilen:

Definition der Performanz-Indikatoren für Algorithmen.
Umwandlungen der existierenden Algorithmen für Taxifahrer-Empfehlungen in Relocation-Algorithmen.
Modellierung des Nutzerverhaltens.
Die Simulation der Relocations mithilfe von öffentlichen Daten (z.B. NYC Taxi Data)
Auswertung der Ergebnisse

Informationen: Mark Kibanov

Auswertung der RFID-Daten und ihrer Qualität T,M

Die vom SocioPatterns Konsortium entwickelte RFID-Technologie ermöglicht die Lokalisierung von Menschen sowie die Bereitstellung von Informationen über deren soziale Kontakte. Die Daten sind aber nicht immer vollständig. Dies kann mehrere Gründe haben: Distanz zum RFID-Reader, hohe Luftfeuchtigkeit, etc.

Ziel dieser Arbeit ist die Auswertung der vorliegenden RFID-Daten anhand gegebener Fotos (wo soziale Interaktionen aufgezeichnet sind) und eine qualitative Bewertung der mittels RFID aufgezeichneten Kontakte.

Informationen: Mark Kibanov

Graph-Erzeugung mittels Informationsextraktion T,M

Informationsextraktion bezeichnet das Erkennen bestimmter Informationen (bspw. Personennamen, Telefonnummern, usw.) in textuellen Daten anhand von Regeln oder auch statistischen Modellen.

Ziel dieses Projektes soll es sein bestimmte Entitäten zu erkennen und deren gemeinsame Vorkommen in Dokumenten mittels einer Graph-Struktur abzubilden. Im Laufe des Projekts soll dies in einem Software-Tool so weit automatisiert werden, dass anhand ausgewählter Parameter verschiedene Graphen erzeugt werden können.

Informationen: Andreas Schmidt

Aufgabenstellung und Termin:

nach Absprache mit dem jeweiligen Betreuer

Vorkenntnisse:

Informatik Grundstudium bzw. 30 absolvierte Credits des Masterstudiums

Angesprochener Teilnehmerkreis:

Bachelor-, Diplom- und Masterstudierende Informatik, Math. NF Inf. Hauptstudium

Leistungsnachweis:

in der Regel Implementierung, schriftliche Ausarbeitung und Vortrag

Umfang:

9 Wochen für Bachelor, 3 Monate für Diplom I und 6 Monate für Master und Diplom II

Veranstalter:

Prof. Dr. Gerd Stumme, Dipl.-Math. Tom Hanika, Dipl.-Inform. Mark Kibanov, M. Sc. Bastian Schäfermeier, M. Sc. Andreas Schmidt