Bachelor- und Masterarbeiten

Themen

Viele Aufgabenstellungen beschäftigen sich mit der Implementierung verschiedener Komponenten in eines der Websysteme die am Fachgebiet betrieben werden oder mit der Analyse der in solchen System vorhandenen Daten. Darüber hinaus werden weitere Themen angeboten, die in der Regel einen inhaltlichen Bezug zu aktuellen Forschungsprojekten des Fachgebiets Wissensverarbeitung haben.

Die Themenstellung erfolgt in Absprache mit dem Studierenden; die Ausrichtung und der Umfang der Arbeit richtet sich nach dem jeweils angestrebten Anschluss. Prinzipiell liegt der Schwerpunkt bei Abschlussarbeiten auf der Methodik, während er bei Projektarbeiten auf der technischen Umsetzung liegt.

Zu folgenden Themengebieten können wir Arbeiten anbieten; zu konkreten Themen können die jeweiligen Betreuer genauere Auskunft geben.

Evaluierung von Graphzeichnungen

Ziel dieser Arbeit ist es, zu evaluieren, welche “weichen” Kriterien für Graphzeichnungen in der Praxis wie stark mit als “schön” wahrgenommenen Zeichnungen korellieren. Außerdem soll untersucht werden inwieweit die “wichtigen” Kriterien sich beim Zeichnen von Graphen und Ordnungsdiagrammen unterscheiden.

Informationen: Maximilian Stubbemann

Kategorien: Masterarbeit

K-Means und FCA

K-means, oder genauer Lloyds-Algorithmus, ist eine Technik, durch welche Datenpunkte im Euklidischen Raum in eine Anzahl von k-Clustern zerlegt werden können. Durch wiederholtes Ausführen mit unterschiedlichem k entsteht eine Menge von sich teilweise überlappenden Clustern. Durch das Hinzufügen der Schnitte der einzelnen Cluster können diese zu einer Verbandsstruktur erweitert werden. Dieser Verband wiederum hat einen zugehörigen formalen Kontext.

Das Ziel dieses Projektes ist es zu untersuchen, inwiefern diese Cluster mit dem Hüllensystem des formalen Kontextes zusammenhängen.

Informationen: Dominik Dürrschnabel

Kategorien: Allgemein, Bachelorarbeit, Masterarbeit

Invarianten für Formale Kontexte

Es ist nicht einfach zu erkennen, ob zwei (reduzierte) Formale Kontexte isomorph sind, bzw. gegeben eine Menge Formaler Kontexte zu erkennen, wie viele verschiedene Formale Kontexte dort enthalten sind. Ein Hilfsmittel sind Invarianten, also abgeleitete Größen, die nicht von der konkreten Darstellung des Formalen Kontexts abhängen, beispielsweise die Anzahl der Attribute des Kontexts oder auch die Anzahl der Begriffe des Kontexts. Haben zwei Kontexte unterschiedliche Werte für eine Invariante, so sind die Kontexte nicht isomorph. Ziel ist es, Formale Kontexte hinsichtlich möglicher Invarianten zu untersuchen. Formale Kontexte können als bipartite Graphen dargestellt werden, daher sollen insbesondere bekannte Graph-Invarianten in Betracht gezogen werden.

Informationen: Maximilian Felde

Kategorien: Allgemein, Bachelorarbeit, Masterarbeit, Methodischer Schwerpunkt

Vergleich von bibliometrischen Datensätzen

Ziel dieser Arbeit ist es, mittels verschiedener Datenquellen Datensätze über die”Landschaft” der KI-Forschenden zu erstellen und zu vergleichen. Dabei sollen auf der einen Seite bibliometrische Indikatoren herangezogen werden als auch die resultierenden Ko-Autoren mit Hilfe der sozialen Netzwerkanalyse untersucht werden.

Informationen: Maximilian Stubbemann

Kategorien: Bachelorarbeit, Methodischer Schwerpunkt, Technischer Schwerpunkt

Concept Neural Networks

Bei der Klassifikation in Graphen ist es üblich, mittels Graph Neuronalen Netzen (GNNs) die Struktur des Graphen zu nutzen, um die Klassifikation von Knoten zu verbessern. Ziel dieser Arbeit ist es, diesen Ansatz auf die Formale Begriffsanalyse zu übertragen indem die “Faltungsoperation” anhand von Konzepten durchgeführt wird. Vergleichen Sie dieses Verfahren mit anderen Verfahren, die neuronale Netze basierend auf Begriffsverbänden nutzen!

Informationen: Maximilian Stubbemann

Kategorien: Bachelorarbeit, Masterarbeit

Ensemble Concept based Classification

Ein Problem der Klassifikation mit Formalen Begriffen ist die potentiell exponentielle Anzahl an Begriffen eines Datensatzes. Eine Strategie zur Verringerung der Anzahl sind Reduktionstechniken für Formale Kontexte. Untersuchen Sie diese hinsichtlich der Klassifikationsperformance ihrer Begriffe. Des Weiteren untersuchen Sie die Performance eines Ensembles aus mehreren reduzierten Kontexten durch unterschiedlichen Reduktionstechniken oder Parameter.

Informationen: Johannes Hirth

Kategorien: Allgemein, Bachelorarbeit, Masterarbeit, Methodischer Schwerpunkt, Technischer Schwerpunkt

Feature Selectors for Concept based Classification

Ein Problem der Klassifikation mit Formalen Begriffen ist die potentiell exponentielle Anzahl an Begriffen eines Datensatzes. Vergleichen Sie verschiedene Maße und Selektionsmethoden aus dem Bereich der Formalen Begriffsanalyse hinsichtlich ihrer Performance als Feature Selector.

Informationen: Johannes Hirth

Kategorien: Allgemein, Bachelorarbeit, Masterarbeit, Methodischer Schwerpunkt

Erklärbarkeit von Klassifikatoren durch Surrogate

Viele der gegenwärtig genutzten Lernmodelle zur Klassifikation erzeugen sogenannte Blackbox-Funktionen/Relationen, z.B. Random Forests oder Neuronale Netze. Diese entziehen sich einer direkten Erklärbarkeit und sind daher für Nuetzer*innen schwer nachvollzieh- und überprüfbar. Es gibt verschiedene numerische / kategorische/ statistische Ansätze um diesen Problem zu begegnen. Ein besonderer Ansatz ist Surrogatlernen, d.h., das Trainieren eines erklärbaren Klassifikators basierend auf einer Blackbox. Je nach Ausrichtung (Projekt/Bachelorarbeit/Masterarbeit) soll versucht werden bestehende Surrogat-Ansätze praktisch zu evaluieren oder theoretische Ansätze fortzusetzen.

Informationen: Tom Hanika

Kategorien: Allgemein, Bachelorarbeit, Masterarbeit, Methodischer Schwerpunkt

Formal Concept Computation with CUDA

Die Berechnung von formalen Begriffen (cf. bi-Cliquen in Graphen) ist ein schweres Problem. Eine Vielzahl von Algorithmen und Techniken wurde entwickelt, darunter “Langdon, W.B., Yoo, S., Harman, M.: Formal Concept Analysis on Graphics Hardware. In: Napoli, A. and Vychodil, V. (eds.) CLA. pp. 413–416. CEUR-WS.org”, welche eine Implementation in CUDA darstellt. Ziel dieser Projektaufgabe ist es den CUDA Ansatz auf die Software https://github.com/tomhanika/conexp-clj zu übertragen und mit verschiedenen Datensätzen zu evaluieren.

Informationen: Tom Hanika

Kategorien: Allgemein, Bachelorarbeit, Technischer Schwerpunkt

Reduktionstechniken in der Formalen Begriffsanalyse

Ein Problem für Algorithmen der Formalen Begriffsanalyse ist die Größe der Daten. In dieser Arbeit sollen verschiedene Techniken zur Größenreduktion oder Kompression zusammengetragen und gegenübergestellt werden. Dabei soll insbesondere auf den Informationsverlust in einem geeigneten Formalismus eingegangen werden.

Informationen: Johannes Hirth

Kategorien: Allgemein, Bachelorarbeit, Methodischer Schwerpunkt, Technischer Schwerpunkt

Link Prediction als Suche der Nadel im Heuhaufen

Zur Evaluierung von Embeddingmodellen für Netzwerke ist es gängige Praxis, zu bewerten, inwiefern die generierten Vektorrepräsentierungen zum Erraten von vergessenen/zukünftigen Kanten genutzt werden. Das gängige Experimentiersetup legt hierbei jedoch meistens eine ausbalancierte Klassifizierungsaufgabe zu Grunde. In dieser Arbeit soll die Aufgabe als “Suche der Nadel im Heuhaufen” betrachtet werden: Wenige zu findende tatsächliche Kanten sollen aus einer deutlich größeren Menge von “negativen Kanten” gefunden werden.

Informationen: Maximilian Stubbemann

Kategorien: Bachelorarbeit, Methodischer Schwerpunkt, Technischer Schwerpunkt

PCA auf formalen Kontexten

Principal Component Analysis dient dazu Datensätze zu vereinfachen. Hierbei wird eine große Menge an (möglicherweise) korrelierten Variablen in eine möglichst aussagekräftige kleinere Menge transformiert. Dieses Vorgehen soll auf formale Kontexte übertragen werden, um die ihre Merkmalsmenge einzuschränken.

Informationen: Maren Koyda

Kategorien: Allgemein, Bachelorarbeit, Masterarbeit, Methodischer Schwerpunkt, Technischer Schwerpunkt

Aufgabenstellung und Termin

Nach Absprache mit dem jeweiligen Betreuer.

Vorkenntnisse

Informatik Grundstudium bzw. 30 absolvierte Credits des Masterstudiums

Angesprochener HörerInnenkreis

Informatik Bachelor und Master, Math. NF Inf. Hauptstudium

Umfang

9 Wochen für Bachelor und 6 Monate für Master

Leistungsnachweis

In der Regel Implementierung, schriftliche Ausarbeitung und Vortrag

Veranstalter

Prof. Dr. Gerd Stumme, Dr. Tom Hanika, Bastian Schäfermeier, M.Sc., Dominik Dürrschnabel, M.Sc., Johannes Hirth, M.Sc., Maren Koyda, M.Sc., Maximilian Felde, M.Sc., Maximilian Stubbemann, M.Sc.,