Zu folgenden Themengebieten können wir Arbeiten anbieten;
zu konkreten Themen können die jeweiligen Betreuer genauere
Auskunft geben.
- Lernen von Ontologien mittels Tagging-Systemen
-
Das "flache" Organisationsprinzip von Tagging-Systemen, das auf kollaborativer Verschlagwortung mittels
eines unkontrollierten Vokabulars durch alle Benutzer basiert, wurde oft als konträrer Ansatz zu eher
traditionellen (zentral kontrollierten, oft hierarchisch strukturierten) Organisations-Schemata wie z.B.
Taxonomien oder Ontologien gesehen. Nähere Untersuchungen
weisen darauf hin, dass die Vor- und Nachteile beider Paradigmen interessanterweise in einem inversen Verhältnis
zu stehen scheinen: Tagging ist vergleichweise "einfach", aber das unkontrolierte Vokabular führt genau zu den Problemen, für
die z.B. Ontologien Lösungen anbieten (z.B. Mehrdeutigkeit, Synonymie, ...).
Ziel dieser Arbeit ist es, automatische Verfahren zum Erlernen von semantischen Beziehungen zwischen Tags einer Folksonomy
zu analysieren und weiterzuentwickeln. Die gelernten Beziehungen sollen als Grundlagen für einen Ontologie-Lernprozess
dienen. Ein weiterer wichtiger Aspekt sind Evaluierungsmethoden der erarbeiteten Lernverfahren.
Informationen: Andreas Hotho, Dominik Benz
- Performanceuntersuchenungen für BibSonomy
-
Ein Cluster von Datenbankrechnern stellt häufig den Kern von
heutigen Web-2.0-Anwendungen dar. Bei steigender
Nutzerzahl/Zugriffzahlen von BibSonomy wird auch hier eine solche
Lösung interessant. Die Umsetzung einer Cluster-Datenbank steht im
Mittelpunkt dieser Arbeit.
Informationen: Andreas Hotho
- OAI-Unterstützung für BibSonomy
Die Open Archives Inititiative zielt darauf ab, einen offenen Standard für Publikationsmetadaten
an Universitäten und Bibliotheken zu etablieren und dadurch den Austausch sowie das Auffinden von Metadaten zu erleichtern. Mit dem
Protocol for Metadata Harvesting steht ein Standard zur Verfügung, der Anbietern von Diensten
zur Implementierung empfohlen wird.
Ziel des Projektes ist die Implementierung von OAI-PMH in unser System BibSonomy. Dabei soll
insbesondere die Unterstützung und Integration vorhandener Ausgabeformate wie BibTeX oder RIS untersucht werden und die von OAI-PMH geforderte
REST-API (ein schönes Anfrageformular ist hier zu sehen) implementiert werden.
Informationen: Robert Jäschke
- Implementation des Titanic-Algorithmus
-
Der Algorithmus Titanic ist ein effizientes Verfahren zur Berechnung häufiger Itemsets, ähnlich dem
Apriori-Algorithmus. Letzterer ist beispielsweise in der Datamining-Software
Weka in Java implementiert.
Ziel des Projektes ist die Implementierung des Titanic-Algorithmus, basierend auf der vorhandenen Java-Implementierung
des Apriori-Algorithmus. Des weiteren sollen zwei Verfahren zur Berechnung von Basen für Assoziationsregeln
(Luxemburger und Duquenne/Guigues) untersucht und ebenfalls zur Verwendung in Weka implementiert werden.
Informationen: Robert Jäschke
- Visualisierung von Tri-Verbänden
-
Triadische Begriffsanalyse stellt eine Erweiterung der formalen Begriffsanalyse um eine dritte Dimension dar und kann als
dreidimensionales hierarchisches Clusterverfahren verstanden werden. Mittels des TRIAS-Algorithmus können wir effizient Tri-Begriffe
mit minimalen Support-Bedingungen auf grossen Datensätzen berechnen.
Ziel des Projektes ist, geeignete Visualisierungsmöglichkeiten für Tri-Verbände zu untersuchen und zu implementieren.
Informationen: Robert Jäschke
- Erweiterung von BibSonomy um Barcode-Funktionalitäten
-
Barcodes z.B. von Büchern kann man mittels in heutigen Notebooks enthaltenen Kameras einlesen. Darüber hinaus sind
Libraries zum automatischen Erzeugen und Verarbeiten von Barcodes wie barcode4j
frei verfügbar. Dies eröffnet interessante Perspektiven für BibSonomy:
- Über den Barcode können weiter Informationen z.B. zu einem Buch im Internet abgerufen werden. Damit erhält man Metadaten
wie Titel, Autor, etc. Diese Daten kann man nun in BibSonomy posten und somit
auf einfache Weise seine Büchersammlung verschlagworten oder sich interessante geliehene Bücher merken.
- Um die Verbindung zwischen ausgedrucken Papers und ihren Entsprechungen in BibSonomy zu erleichtern, wäre ein ausgedruckter
Barcode (z.B. in Form eines Aufklebers) sehr hilfreich. Durch das Einlesen des Barcodes könnten weitere Metadaten abgerufen
werden und die Verbindung zu anderen Papers hergestellt werden.
Ziel des Projektes ist die Entwicklung eines Prototypen für einen der beiden Anwendungsfälle.
Informationen: Robert Jäschke, Dominik Benz
- Aktives Lernen für das Extrahieren von Metadaten aus Referenzen
-
Referenzen aus Publikationslisten enthalten wichtige Metadaten, die zur Erstellung von Zitationsgraphen, zur Verlinkung von
Publikationen und zu deren Verwaltung verwendet werden. Die Erstellung dieser Metadaten aus gegegebenen Referenzen ist sehr
mühsam und aufwendig. Ansätze, die Extraktion zu automatisieren, liefern erste Ergebnisse, sind aber noch nicht befriedigend.
Ein grundlegendes Problem ist die Vielfältigkeit mit der Referenzen dargestellt werden. Um dieser Varietät zu begegnen, wird
entweder ein großer Trainingsdatensatz benötigt, oder der Trainingsdatensatz muss automatisch erweitert werden. Der zweite
Ansatz soll in diesem Projekt behandelt werden. Dabei kann ein bestehender Algorithmus so erweitert werden, dass er automatisch
aus neuen Referenzeingaben lernt.
Informationen: Beate Krause
- Integration of Terrier into BibSonomy
-
Terrier is a modular platform for the development of large-scale Information Retrieval applications. To improve search in BibSonomy we consider integrating
Terrier into BibSonomy. Starting points are the indexing of documents and the experimentation with different ranking algorithms. The project can be conducted in cooperation with the Terrier group at the University of
Glasgow, so that a stay abroad (with a program such as Erasmus) is possible. The Glasgow team is interested in integrating BibSonomy into Terrier and will announce a (summer) student project as
well.
Information: Beate Krause
- Rankingalgorithmen für BibSonomy
-
Es gibt verschiedene Methoden, um Suchergebnisse für einen Benutzer zu ordnen. Diese Methoden lassen sich auf das Ranking in Social Bookmarking Systemen übertragen. In diesem Projekt sollen
mehrere Methoden ausgewählt, implementiert und miteinander verglichen werden. Beispiele für diese Methoden sind das Vektorraummodel, probabilistische Modelle und Modelle aus dem Bereich der
Linkanalyse. Die für das Ranking zu verwendenden Daten stammen aus dem Bookmarking System BibSonomy. Ein Vergleich der Ergebnisse kann durch eine (kleine) Benutzerstudie erstellt werden.
Informationen: Beate Krause
- Publikationsranking in BibSonomy
-
Ziel des Projektes ist, Benutzern in BibSonomy Empfehlungen für Publikationen auszusprechen. Diese Empfehlungen können durch ähnliche Benutzer im System erstellt werden. Die Ähnlichkeit
kann auf einer Nutzung der gleichen Tags, Publikationen, Autoren, Konferenzen etc. beruhen. Ein Verfahren basierend auf Link-Analyse (zB. FolkRank) kann verwendet werden, um Empfehlungen zu
errechnen.
Informationen: Beate Krause
- Firefox Plugin für BibSonomy
-
Die bisherige Integration von BibSonomy in die bekannten Browser ist
eher lose. Mit Hilfe eines Firefox Plugin könnte man den Nutzern
eine erweiterte Funktionalitäten zur Verfügung stellen und damit
einen besseren Service anbieten. Die Aufgabe in diesem Projekt ist
der Entwurf eines Konzepten sowie die Implementierung des solchen
Plugins.
Informationen: Andreas Hotho
- Referenz Extraktion aus PDFs / Einbettung von Metadaten
-
Publikationen enthalten in der Regel eine Menge von Referenzen auf
andere Publikationen. Leider können diese Referenzen zur Zeit noch
nicht in BibSonomy abgespeichert werden. Ziel dieses Projektes ist
es BibSonomy um eine Zitationsverwaltung zu erweitern. Im zweiten
Schritt sind diese aus PDFs mit Hilfe von
Informationsextraktionsmethoden automatisch zu extrahieren.
Mit der Extensible Metadata Platform (XMP)
bietet Adobe einen Standard zur Einbettung von Metadaten in PDF-Dokumente an, der auch schon von
Reference-Mangement-Lösungen wie JabRef
verwendet wird. Ein weiteres mögliches Ziel dieser Arbeit ist die Erweiterung von BibSonomy um die Funktionalität,
Metadaten zu hochgeladenen PDFs hinzuzufügen, bzw. diese auszulesen.
Informationen: Andreas Hotho, Dominik Benz
- Optimierung des Workflows beim wissenschaftlichen Arbeiten / Schreiben mit BibSonomy
-
Ein wesentliches Ziel von BibSonomy ist es, die alltägliche Arbeit von Wissenschaftlern zu erleichtern. Ein
wichtiger Teil davon ist das Sammeln und Organisieren von Literatur, sowie das Einbinden / Zitieren der
Literatur in eigene Arbeiten. BibSonomy in seiner jetzigen Form unterstützt die verschiedenen Phasen dieses
Prozesses auf verschiedene Weise: Das Sammeln und Strukturieren wird z.B. sehr gut durch Scraper und
Verschlagwortung unterstützt, während die Einbindung in den Paper-Produktions-Prozess noch weitestgehend manuell
(z.B. Export des BibTeX-Dateien) stattfindet.
Ziel dieser Arbeit ist es, zunächst mögliche Workflows mit verschiedenen System- und Textverarbeitungs-umgebungen (Windows / Linux, Word / Latex, ...)
auszuarbeiten. Nach Auswahl eines geeigneten Workflows sollen dann alle benötigten Systemkomponeten angepasst / implementiert
werden, um diesen optimal zu unterstützen.
Informationen: Dominik Benz
- Verteilte Implementierung des Trias-Algorithmus
-
Der Trias-Algorithmus ermöglicht
das Finden von Tupeln (U,T,R) in Folksonomy-Systemen, wobei U eine Menge von Benutzern, T eine Menge von Tags und
R eine Menge von Ressourcen ist, so dass alle Benutzer aus U alle Ressourcen aus R mit allen Tags aus T annotiert
haben.
Ziel des Projektes ist die Parallelisierung der vorhandenen Java-Implementierung sowie der Test des Algorithmus
auf großen Datenmengen.
Informationen: Robert Jäschke
- MetaTaggingService
-
Bei diesem Mashup-Projekt werden Informationen verschiedener bekannter Tagging Dienste zusammengetragen.
Die gesammelten Informationen sollen im nächsten Schritt zusammengefaßt und aufbereitet werden, so dass neben einer großen TagWolke,
auch z.B der zeitliche Verlauf der Tags und
aufkommende Themen ansprechend im System dargestellt werden.
Informationen: Andreas Hotho
- Erkennung von Autoren/Journalen in BibSonomy
-
Ein zentrales Problem in BibSonomy ist die Erkennung und Identifikation von Objekten wie Autoren, Editoren aber auch Büchern. In der Literatur
finden sich vielfältige Ansätze der manuellen oder automatischen Zuordnung von Bezeichnern zu den passenden Objekten.
Auch Lernansätze sind dort beschrieben.
Ziel des Projektes ist die Entwicklung und Umsetzung eines Konzeptes für BibSonomy, das auf der einen Seite die interne Objektrepresentation neu implementiert
und die Zuordnung zwischen Objekt und im Text gefunden Bezeichnern automatisch lernt.
Informationen: Andreas Hotho
- Verknüpfung des MediaWikis mit BibSonomy
-
Die von der Wikipedia genutzte Software MediaWiki ist eine der bekanntesten Wiki-Implementierungen.
Häufig werden auf Wikiseiten Bücher oder Fachartikel zitiert.
In diesem Projekt soll ein Plugin für MediaWiki entwickelt werden, das das einfache Zitieren von in BibSonomy vorhandener Literatur erlaubt.
Dabei soll der Nutzer mit typischen Ajax-Techniken unterstützt werden.
Informationen: Andreas Hotho
- Integration von BibSonomy in Zotero
-
Zotero ist ein Firefox-Plugin zum Verwalten von Bookmarks und Publikationsmetadaten. Allerdings sind alle Daten im Gegensatz zu BibSonomy
im Browser des Nutzers abgelegt. Hier bietet sich die Integration mit einem Serverdienst wie BibSonomy an. Die Anbindung von Zotero soll
mittels der in BibSonomy vorhanden API erfolgen.
Informationen: Andreas Hotho
- Import-Assistent für BibSonomy
-
Anwender, die BibSonomy benutzen möchten, haben oft schon relevante Daten auf ihrer Platte liegen bzw. bei anderen Diensten gespeichert.
Ein Import-Assistent kann den Anwendern helfen, die Daten in BibSonomy einzufügen. Der Assistent durchsucht dazu die Festplatte nach
BibTeX- oder EndNote-Dateien, nach Browser-Lesezeichen und fragt andere Services (wie del.icio.us oder CiteULike) nach den Daten des
Nutzers ab. Danach kann der Benutzer diese Daten aufbereiten, auswählen und in BibSonomy einfügen. Ziel des Projektes ist die Implementierung
eines solchen Assistenten.
Informationen: Robert Jäschke
- Webapplikation zur Offline-Berechnung von Datenbank-Tabellen
-
Zahlreiche Tabellen der BibSonomy-Datenbank werden "offline" - im Hintergrund - berechnet. Dazu zählen beispielsweise die
Tabellen für die popular-Seite oder auch die Tabellen für die
Suchfunktion.
In diesem Projekt soll eine Webapplikation erstellt werden, die die verschiedenen Berechnungsskripte vereint und mittels
einer Weboberfläche steuerbar macht.
Informationen: Andreas Hotho
- Marauders Map: Echtzeit-Visualisierung von RFID-Daten
-
Im VENUS-Projekt werden soziale Netzwerke in der Verbindung mit RFID- und Handysystemen untersucht. Die Nutzungsdaten
verschiedener Sensoren werden kontinuierlich erfaßt (z.B. Standort), und mit anderen Daten verknüpft.
Im Marauders Map Szenario sollen zunächst die Standortdaten geeignet visuell dargestellt werden.
In diesem Projekt sollen daher verschiedene Ansätze der Visualisierung untersucht und implementiert werden, die die
Daten beispielsweise als Webapplikation oder als App/Android visualisieren.
Informationen: Christoph Scholz, Martin Atzmueller
- Hadooping: Pattern Mining mit Map/Reduce
-
Das von Google entwickelte Map/Reduce-Framework ist eine wichtige Grundlage für die effiziente Umsetzung
von Algorithmen auf sehr großen Datenmengen.
Ziel des Projektes ist die Umsetzung einzelner Verfahren zum Pattern Mining im freien Hadoop Map/Reduce Framework.
Informationen: Martin Atzmueller
- Streaming: Datenstrom-Management-System
-
Ziel des Projektes ist die Implementierung eines Systems zum Management und Analyse von Datenströmen.
Informationen: Björn-Elmar Macek