Projekt Web 2.0 / Wissensverarbeitung

Dieses Projekt lässt sich als Projekt Web 2.0 im Bachelor und als Projekt Wissensverarbeitung im Master anrechnen.

Projektvorbesprechung: Montag,Montag, 22.10.2018, 16.15 Uhr in Raum 0445/E. Bei Interesse können Sie auch gerne vorab den jeweiligen Betreuer ansprechen.

Themen:

Jeder Teilnehmer des Projektes bearbeitet eine individuelle Aufgabe in aktuellen Forschungsthemen des Fachgebiets Wissensverarbeitung.

 Unter anderem stehen die folgenden Themen zur Auswahl:

(M = methodischer Schwerpunkt, T = technischer Schwerpunkt, B = als Bachelorarbeit möglich, MA = als Masterarbeit möglich)

Pedestrian Dead Reckoning Methoden zur Schätzung der Lage von Orten zueinander T,M,BA,MA

Bei der Erstellung topologischer Karten mithilfe von Sensordaten ist eine ungefähre Abschätzung der Lage der Orte zueinander interessant. Dies kann mit Methoden des Pedestrian Dead Reckoning realisiert werden, bei denen die Bewegung anhand einer Schrittdetektion und der Schätzung der jeweiligen Schrittrichtung und -länge modelliert wird. Je nach Umfang des Projektes ist eine Fokussierung auf einen der Teilaspekte möglich (zum Beispiel Entfernungen oder Himmelsrichtungen zwischen Orten).

Informationen: Bastian Schäfermeier

Framework zur Annotation und Klassifikation von Zeitreihen T,M

Durch menschliches Hintergrundwissen, lässt sich in geplotteten Sensordaten oft einfach erkennen, welche Aktivität gerade stattgefunden hat (zum Beispiel laufen, stehen, sitzen). In dieser Arbeit wird ein Rahmenwerk entwickelt, das innerhalb einer Oberfläche die Annotation von Zeitreihen ermöglicht, um Klassifikatoren auf die Aktivitätenerkennung zu trainieren. Zunächst muss ein geeigneter Workflow überlegt werden, der dann durch Auswahl der zugrundeliegenden Bibliotheken (z.Bsp. für die Oberflächen) und geeigneter Datenformate in die Praxis umgesetzt wird. Erweitert werden kann das Projekt mit einem Workflow zur Segmentierung, Feature-Extraktion und dem Training von Klassifikatoren.

Informationen: Bastian Schäfermeier

Implementierung von neuronalen Netzen auf Smartphones T

In dieser Arbeit soll ein Workflow entwickelt werden, neuronale Netze, die auf dem Computer zur Klassifikation von Sensordaten trainiert wurden (CNNs, LSTMs) auf dem Smartphone (Android-Betriebssystem) auszuführen. Zunächst sollen verschiedene Frameworks auf ihre Tauglichkeit (z.Bsp. hinsichtlich Speicher- und Energieverbrauch sowie Hardwarebeschleunigung, aber auch Handhabbarkeit der Programmierschnittstellen und Datenformat) untersucht werden. Ergebnis des Projektes ist eine Prototyp-App, die die Klassifikation in einem praktischen (noch zu bestimmenden) Anwendungsszenario durchführt.

Informationen: Bastian Schäfermeier

Crawler-Framework für Konferenz-Daten T

Im Rahmen des Projekts soll ein Crawler-Framework entwickelt werden, mit dem Datensätze um Informationen erweitert werden können. Diese sollen aus anderen Quellen (z.B. zugehörige Webseiten) extrahiert werden. Im Projekt geht es konkret um Konferenz-Daten im DBLP-Datensatz, die mit Hilfe des Frameworks um Themengebiete und Core-Rank ergänzt werden sollen.

Informationen: Andreas Schmidt

Generator für zufällige formale Kontexte T,M

In diesem Projekt sollen verschiedene Ansätze bipartite Graphen zu erzeugen praktisch untersucht werden, um Generatoren für interessante Klassen von Kontexten zu entwickeln.

Informationen: Tom Hanika

Heuristiken zum Finden maximaler Cliquen T,M,BA

Die maximale Cliquen in einem bipartiten Graphen $G$ entsprechen den formalen Begriffen eines Kontext welcher Isomorph zu Adjazenzmatrix von $G$ ist. Die Berechnung der Menge der formalen Begriffe ist aufwändig. Inwiefern können maximale Cliquen einer gewissen Größe durch heuristische Algorithmen leichter gefunden werden?

Informationen: Tom Hanika

Standard-Sample-Set für die Algorithmenentwicklung sozialer Netzwerke T,M

Bei der Entwicklung neuer Methoden für die Untersuchung von sozialen Netzwerken werden häufig echte Beispieldaten benötigt. Ziel dieses Projektes ist es einen Pool solcher Daten in einem homogenen Format zusammenzustellen. Dabei sollen die Elemente des Pools auch hinsichtlich ihrer grundlegenden Eigenschaften klassifiziert werden.

Informationen: Gerd Stumme

Entropie in formalen Kontexten T,M,B,MA

Entropie ist eine zentrales Maß für viele Objekte in der Wissenschaft. Es gibt verschiedene Ansätze die Idee von Entropie auf soziale Netzwerke zu übertragen. In dieser Arbeit soll ein Schritt weiter gegangen werden, indem eine Weiterübertragung auf formale Kontexte versucht wird. Neben der Modellierung soll eine Evaluierung hinsichtlich der Nutzbarkeit durchgeführt werden.

Informationen: Gerd Stumme

Begriffsverband der Maße T,M,B

Es gibt eine Vielzahl von Maßen zur Identifikation von interessanten formalen Begriffen in Begriffsverbänden. Diese besitzen wiederum sehr verschiedene Eigenschaften wie zum Beispiel Monotonie. Dieser Arbeit besteht aus dem Zusammentragen und der Erstellung einer begriffliche Ordnung aller bekannten Maße.

Informationen: Tom Hanika

Dichtebasiertes Clustering und FBA T,M,B

Die zentrale Fragestellung dieser Arbeit ist die Verbindung zwischen dichtebasiertem Clustering und der Formalen Begriffsanalyse (FBA). Inwiefern können Ideen und Methoden des dichtebasiertem Clustering auf FBA übertragen werden?

Informationen: Gerd Stumme

BibSonomy: Simple Co-Autor Recommender T,M

Für das social bookmark and publication sharing system BibSonomy soll ein simples Co-Autor Empfehlungssystem entworfen und implementiert werden. Es soll zum Beispiel der häufigste Co-Autor eines Autoren empfohlen werden. Dabei kann auf das vorhandene Recommender-Framework des BibSonomy Systems zurückgegriffen werden.

Informationen: Tom Hanika

BibSonomy: Neustrukturierung der Community Post Seite T,M

Community Posts bilden in BibSonomy das gesammelte bekannte Wissen über einen Post ab. Bei diesem Projekt soll diese Seite hinsichtlich Funktionalität und Übersichtlichkeit neustrukturiert werden.

Informationen: Tom Hanika

BibSonomy: Personen- und Autoren-Clouds T,M

Personen- und Autoren-Clouds ermöglichen es dem User sehr aktive Autoren von Publikationen als auch Personen zu entdecken. Das effiziente und zeitnahe Berechnen und bereitstellen dieser Clouds ist jedoch aufgrund der Größe des BibSonomy Systems nicht trivial. Das Projekt beinhaltet die Entwicklung und Implementierung einer Lösung.

Informationen: Tom Hanika

BibSonomy: Weiterentwicklung des BibTeX-Parsers T,M

Parsen von BibTeX-Code ist eine der Schnittstellen um Publikationen in BibSonomy einzutragen. In den letzten Jahren gab es viele Entwicklungen um die orginale BibTeX-Software abzulösen. In diesem Projekt soll der Parser der aktuellen Software Biber untersucht werden um die mögliche Adaptierbarkeit für BibSonomy einzuschätzen.

Informationen: Tom Hanika

Begriffliches Skalieren von Datensätzen T,M

Um Datensätze mit z.B. numerischen oder ordinalen Einträgen mit Methoden der Formalen Begriffsanalyse untersuchen zu können, müssen diese zuerst in eine entsprechende Form gebracht (also skaliert) werden. In diesem Projekt soll ein interaktives Tool erstellt werden, mit dem Datensätze begrifflich skaliert werden können.

Informationen: Maximilian Felde

PCA auf formalen Kontexten T,M

Principal Component Analysis dient dazu Datensätze zu vereinfachen. Hierbei wird eine große Menge an (möglicherweise) korrelierten Variablen in eine möglichst aussagekräftige kleinere Menge transformiert. Dieses Vorgehen soll auf formale Kontexte übertragen werden, um die ihre Merkmalsmenge einzuschränken.

Informationen: Maren Koyda

Aufgabenstellung und Termin:

Nach Absprache mit dem jeweiligen Betreuer. Je nach Thema kann die Aufgabe in Kleingruppen oder einzeln bearbeitet werden.

Vorkenntnisse:

Informatik Grundstudium

Angesprochener HörerInnenkreis:

Inf. Hauptstudium Bachelor und Diplom I, Master, Math. NF Inf. Hauptstudium

Umfang:

4 oder 8 SWS im Bachelor und Diplom I nach Absprache, 4 SWS im Master

Leistungsnachweis:

Implementierung, schriftliche Ausarbeitung und zwei Vorträge

Veranstalter:

Prof. Dr. Gerd Stumme, Master Math. Maximilian Felde, Dipl.-Math. Tom Hanika, Master Math. Maren Koyda, Master Inform. Bastian Schäfermeier, Master Inform. Andreas Schmidt

Ablauf:

In der Regel sollte die Projektarbeit mit Semesterbeginn begonnen werden. Nach 4-6 Wochen findet eine Zwischenpräsentation statt, in der der Stand der Projektarbeit vorgestellt wird. In der Regel in der ersten Vorlesungswoche des folgenden Semesters werden dann die Endergebnisse vorgestellt. Eine kurze Beschreibung der Arbeit (5 Seiten) ist 3 Tage vor dem Vortrag einzureichen.

Eine Woche nach der Annahme des Themas gibt der Student eine einseitige Beschreibung der Aufgabe, sowie einen Arbeitsplan für das Semester ab. Zur besseren Koordination und Kommunikation wird erwartet, dass der Student bei einem 4(8) SWS-Projekt regelmäßig an einem (zwei) Tagen in der Softwarewerkstatt anwesend ist. Der genaue Tag ist in Absprache mit dem Betreuer festzulegen.

Als Richtlinie für die Erstellung einer guten Ausarbeitung wird das Buch

  • Markus Deininger and Horst Lichter and Jochen Ludewig and Kurt Schneider. Studien-Arbeiten: ein Leitfaden zur Vorbereitung, Durchführung und Betreuung von Studien-, Diplom- Abschluss- und Doktorarbeiten am Beispiel Informatik. 5. Auflage. vdf Hochschulverlag, Zürich, 2005.

empfohlen, welches in der Bibliothek im Semesterapparat des Fachgebiets Wissensverarbeitung ausliegt, und welches auch in einigen Exemplaren ausleihbar ist. Wir empfehlen die Anschaffung dieses Buchs (9,50 €), da es Sie bis zur Masterarbeit (und weiter) begleiten kann.

Alle verwendeten Referenzen sind zusätzlich zum Literaturverzeichnis der Ausarbeitung in BibSonomy einzugeben, mit den Tags “projekt”, “kde”, dem laufenden Semester in der Form “ss14” bzw. “ws14” und weiteren sinnvollen Tags.