Knowledge and Data Engineering
Uni Kassel

Projekt Web 2.0

Dieses Projekt lässt sich als Projekt Semantic Web im Bachelor und als Projekt Wissensverarbeitung im Master anrechnen.

Projektvorbesprechung: Dienstag, 20.04.2010, 16.15 Uhr in Raum 0443. Bei Interesse können Sie auch gerne vorab den jeweiligen Betreuer ansprechen.

Themen:
Jeder Teilnehmer des Projektes bearbeitet eine individuelle Aufgabe im Umfeld unseres kooperativen Verschlagwortungssystems BibSonomy, sowie im Kontext des VENUS Projekts mit Integration von RFID und sozialen Netzwerken.

Unter anderem stehen die folgenden Themen zur Auswahl:
(M = methodischer Schwerpunkt, T = technischer Schwerpunkt)
Lernen von Ontologien mittels Tagging-Systemen M

Das "flache" Organisationsprinzip von Tagging-Systemen, das auf kollaborativer Verschlagwortung mittels eines unkontrollierten Vokabulars durch alle Benutzer basiert, wurde oft als konträrer Ansatz zu eher traditionellen (zentral kontrollierten, oft hierarchisch strukturierten) Organisations-Schemata wie z.B. Taxonomien oder Ontologien gesehen. Nähere Untersuchungen weisen darauf hin, dass die Vor- und Nachteile beider Paradigmen interessanterweise in einem inversen Verhältnis zu stehen scheinen: Tagging ist vergleichweise "einfach", aber das unkontrolierte Vokabular führt genau zu den Problemen, für die z.B. Ontologien Lösungen anbieten (z.B. Mehrdeutigkeit, Synonymie, ...).

Ziel dieser Arbeit ist es, automatische Verfahren zum Erlernen von semantischen Beziehungen zwischen Tags einer Folksonomy zu analysieren und weiterzuentwickeln. Die gelernten Beziehungen sollen als Grundlagen für einen Ontologie-Lernprozess dienen. Ein weiterer wichtiger Aspekt sind Evaluierungsmethoden der erarbeiteten Lernverfahren.

Informationen: Andreas Hotho, Dominik Benz

Implementation des Titanic-AlgorithmusT

Der Algorithmus Titanic ist ein effizientes Verfahren zur Berechnung häufiger Itemsets, ähnlich dem Apriori-Algorithmus. Letzterer ist beispielsweise in der Datamining-Software Weka in Java implementiert.

Ziel des Projektes ist die Implementierung des Titanic-Algorithmus, basierend auf der vorhandenen Java-Implementierung des Apriori-Algorithmus. Des weiteren sollen zwei Verfahren zur Berechnung von Basen für Assoziationsregeln (Luxemburger und Duquenne/Guigues) untersucht und ebenfalls zur Verwendung in Weka implementiert werden.

Informationen: Robert Jäschke

Visualisierung von Tri-VerbändenM,T

Triadische Begriffsanalyse stellt eine Erweiterung der formalen Begriffsanalyse um eine dritte Dimension dar und kann als dreidimensionales hierarchisches Clusterverfahren verstanden werden. Mittels des TRIAS-Algorithmus können wir effizient Tri-Begriffe mit minimalen Support-Bedingungen auf grossen Datensätzen berechnen.

Ziel des Projektes ist, geeignete Visualisierungsmöglichkeiten für Tri-Verbände zu untersuchen und zu implementieren.

Informationen: Robert Jäschke

Verteilte Implementierung des Trias-AlgorithmusT,M

Der Trias-Algorithmus ermöglicht das Finden von Tupeln (U,T,R) in Folksonomy-Systemen, wobei U eine Menge von Benutzern, T eine Menge von Tags und R eine Menge von Ressourcen ist, so dass alle Benutzer aus U alle Ressourcen aus R mit allen Tags aus T annotiert haben.

Ziel des Projektes ist die Parallelisierung der vorhandenen Java-Implementierung sowie der Test des Algorithmus auf großen Datenmengen.

Informationen: Robert Jäschke

Performanceuntersuchenungen für BibSonomyT

Ein Cluster von Datenbankrechnern stellt häufig den Kern von heutigen Web-2.0-Anwendungen dar. Bei steigender Nutzerzahl/Zugriffzahlen von BibSonomy wird auch hier eine solche Lösung interessant. Die Umsetzung einer Cluster-Datenbank steht im Mittelpunkt dieser Arbeit.

Informationen: Andreas Hotho

OAI-Unterstützung für BibSonomyT

Die Open Archives Inititiative zielt darauf ab, einen offenen Standard für Publikationsmetadaten an Universitäten und Bibliotheken zu etablieren und dadurch den Austausch sowie das Auffinden von Metadaten zu erleichtern. Mit dem Protocol for Metadata Harvesting steht ein Standard zur Verfügung, der Anbietern von Diensten zur Implementierung empfohlen wird.

Ziel des Projektes ist die Implementierung von OAI-PMH in unser System BibSonomy. Dabei soll insbesondere die Unterstützung und Integration vorhandener Ausgabeformate wie BibTeX oder RIS untersucht werden und die von OAI-PMH geforderte REST-API (ein schönes Anfrageformular ist hier zu sehen) implementiert werden.

Informationen: Robert Jäschke

BibSonomy wird OpenSocialT

OpenSocial definiert eine Schnittstelle über die Web2.0-Dienste ihre Daten anderen Web-Applikationen zur Verfügung stellen können. Dadurch können Web2.0-Dienste leicht in Mashups wie iGoogle integriert werden.

Ziel dieses Projektes ist die Implementierung eines OpenSocial Data Servers für BibSonomy mittels Apache Shindig. Je nach Projektumfang ist auch die Programmierung eines OpenSocial-Widgets - beispielsweise für iGoogle - Teil des Projekts.

Informationen: Robert Jäschke

Referenz Extraktion aus PDFs / Einbettung von MetadatenT

Publikationen enthalten in der Regel eine Menge von Referenzen auf andere Publikationen. Leider können diese Referenzen zur Zeit noch nicht in BibSonomy abgespeichert werden. Ziel dieses Projektes ist es BibSonomy um eine Zitationsverwaltung zu erweitern. Im zweiten Schritt sind diese aus PDFs mit Hilfe von Informationsextraktionsmethoden automatisch zu extrahieren.

Mit der Extensible Metadata Platform (XMP) bietet Adobe einen Standard zur Einbettung von Metadaten in PDF-Dokumente an, der auch schon von Reference-Mangement-Lösungen wie JabRef verwendet wird. Ein weiteres mögliches Ziel dieser Arbeit ist die Erweiterung von BibSonomy um die Funktionalität, Metadaten zu hochgeladenen PDFs hinzuzufügen, bzw. diese auszulesen.

Informationen: Andreas Hotho, Dominik Benz

Optimierung des Workflows beim wissenschaftlichen Arbeiten / Schreiben mit BibSonomyT

Ein wesentliches Ziel von BibSonomy ist es, die alltägliche Arbeit von Wissenschaftlern zu erleichtern. Ein wichtiger Teil davon ist das Sammeln und Organisieren von Literatur, sowie das Einbinden / Zitieren der Literatur in eigene Arbeiten. BibSonomy in seiner jetzigen Form unterstützt die verschiedenen Phasen dieses Prozesses auf verschiedene Weise: Das Sammeln und Strukturieren wird z.B. sehr gut durch Scraper und Verschlagwortung unterstützt, während die Einbindung in den Paper-Produktions-Prozess noch weitestgehend manuell (z.B. Export des BibTeX-Dateien) stattfindet.

Ziel dieser Arbeit ist es, zunächst mögliche Workflows mit verschiedenen System- und Textverarbeitungs-umgebungen (Windows / Linux, Word / Latex, ...) auszuarbeiten. Nach Auswahl eines geeigneten Workflows sollen dann alle benötigten Systemkomponeten angepasst / implementiert werden, um diesen optimal zu unterstützen.

Informationen: Dominik Benz

Implementierung des FolkRank-Algorithmus mittels Hadoop oder auf GraphikkartenT

Der FolkRank-Algorithmus bietet ein Ranking in allen drei Dimensionen einer Folksonomie. Für unser kollaboratives Verschlagwortungssystem BibSonomy benötigen wir eine schnelle Implementierung dieses Ranking-Verfahrens.

In diesem Projekt sollen zwei Varianten ausgelotet werden: die Implementierung auf Graphikkarten-Prozessoren und die verteilte Implementierung mittels des Hadoop-Frameworks.

Informationen: Robert Jäschke, Andreas Hotho

MetaTaggingServiceT,M

Bei diesem Mashup-Projekt werden Informationen verschiedener bekannter Tagging Dienste zusammengetragen. Die gesammelten Informationen sollen im nächsten Schritt zusammengefaßt und aufbereitet werden, so dass neben einer großen TagWolke, auch z.B der zeitliche Verlauf der Tags und aufkommende Themen ansprechend im System dargestellt werden.

Informationen: Andreas Hotho

Erkennung von Autoren/Journalen in BibSonomyT,M

Ein zentrales Problem in BibSonomy ist die Erkennung und Identifikation von Objekten wie Autoren, Editoren aber auch Büchern. In der Literatur finden sich vielfältige Ansätze der manuellen oder automatischen Zuordnung von Bezeichnern zu den passenden Objekten. Auch Lernansätze sind dort beschrieben. Ziel des Projektes ist die Entwicklung und Umsetzung eines Konzeptes für BibSonomy, das auf der einen Seite die interne Objektrepresentation neu implementiert und die Zuordnung zwischen Objekt und im Text gefunden Bezeichnern automatisch lernt.

Informationen: Andreas Hotho

Verknüpfung des MediaWikis mit BibSonomyT

Die von der Wikipedia genutzte Software MediaWiki ist eine der bekanntesten Wiki-Implementierungen. Häufig werden auf Wikiseiten Bücher oder Fachartikel zitiert. In diesem Projekt soll ein Plugin für MediaWiki entwickelt werden, das das einfache Zitieren von in BibSonomy vorhandener Literatur erlaubt. Dabei soll der Nutzer mit typischen Ajax-Techniken unterstützt werden.

Informationen: Andreas Hotho

Integration von BibSonomy in ZoteroT

Zotero ist ein Firefox-Plugin zum Verwalten von Bookmarks und Publikationsmetadaten. Allerdings sind alle Daten im Gegensatz zu BibSonomy im Browser des Nutzers abgelegt. Hier bietet sich die Integration mit einem Serverdienst wie BibSonomy an. Die Anbindung von Zotero soll mittels der in BibSonomy vorhanden API erfolgen.

Informationen: Andreas Hotho

Import-Assistent für BibSonomyT

Anwender, die BibSonomy benutzen möchten, haben oft schon relevante Daten auf ihrer Platte liegen bzw. bei anderen Diensten gespeichert. Ein Import-Assistent kann den Anwendern helfen, die Daten in BibSonomy einzufügen. Der Assistent durchsucht dazu die Festplatte nach BibTeX- oder EndNote-Dateien, nach Browser-Lesezeichen und fragt andere Services (wie del.icio.us oder CiteULike) nach den Daten des Nutzers ab. Danach kann der Benutzer diese Daten aufbereiten, auswählen und in BibSonomy einfügen. Ziel des Projektes ist die Implementierung eines solchen Assistenten.

Informationen: Robert Jäschke

Webapplikation zur Offline-Berechnung von Datenbank-TabellenT

Zahlreiche Tabellen der BibSonomy-Datenbank werden "offline" - im Hintergrund - berechnet. Dazu zählen beispielsweise die Tabellen für die popular-Seite oder auch die Tabellen für die Suchfunktion. In diesem Projekt soll eine Webapplikation erstellt werden, die die verschiedenen Berechnungsskripte vereint und mittels einer Weboberfläche steuerbar macht.

Informationen: Andreas Hotho

Tag-Empfehlungen in BibSonomyM,T

Zur Vereinfachung der Klassifikation und Verwaltung von Resourcen haben sich im Bereich von Social Bookmarking verschiedene Empfehlungssysteme (Recommender) etabliert. Die häufigste Anwendung von Empfehlungssystemen ist die Empfehlung von Tags für aktuell zu taggende Resourcen. Durch die Präsentation der Tags während des Verschlagwortens, kann der Nutzer leicht vorgeschlagene Tags auswählen bzw. übernehmen. Tippfehler und unterschiedliche Schreibweisen können auf diese Weise reduziert werden und führen zur Vereinheitlichung und der Konvergenz des verwendeten Vokabulars. In BibSonomy existiert seit kurzem ein Framework zur einheitlichen Evaluation verschiedener Tag-Empfehlungssysteme. Im Rahmen dieser Projektarbeit wird das Framework weiterentwickelt und erweitert. Dabei sind vielfältige Herausforderungen zu meistern, z.B.:

  • Entwicklung und Implementierung eines Scheduling-Algorithmuses zur Anfrage von verschiedenen Empfehlungssystemen
  • Performance-Optimierung der Datenbankzugriffe
  • Implementierung dynamischer Tag-Empfehlungen mittels Ajax
  • ...

Informationen: Folke Mitzlaff

Themenbasierte Graphische Suche in BibSonomyM,T

Zur Zeit erfolgt die Navigation und Suche in BibSonomy im wesentlichen via Tags und Volltext-Suche. Im Rahmen dieser Projektarbeit wird BibSonomy um ein graphisches Suchinterface erweitert, welches es erlaubt, visuell die Suche einzuschränken. Dabei entspricht eine Suchanfrage der Gewichtung von Themen, welche automatisch aus der FolkSonomy extrahiert werden. Dies entspricht einer Suchanfrage der Art: "Ich interessiere mich für Einträge, die viel mit Politik zu tun haben, etwas mit Internet und ein wenig mit Medizin".

Informationen: Folke Mitzlaff

Visualisierung von User-ÄhnlichkeitenM,T

Seit einiger Zeit wird in BibSonomy die Ähnlichkeit zwischen Benutzern berechnet um z.B. auf Benutzer mit ähnlichen Interessen hinzuweisen. Gegenstand dieser Projektarbeit ist die Konzeption und Implementierung einer graphischen Darstellung von Benutzer-Empfehlungen, um zum die Navigation durch die FolkSonomy entlang ähnlicher Benutzer intuitiver zu gestalten.

Informationen: Folke Mitzlaff

Marauders Map: Echtzeitvisualisierung für Augmented Reality mit RFIDM,T

Das VENUS-Projekt untersucht die soziale Vernetzung, und analysiert dabei unter anderem die Nutzungsdaten in sensorgestützten (RFID, Handy) Systemen. Dabei ist die geeignete Visualisierung von Standortdaten wichtig, um im Sinne einer "erweiterten" Realität (augmented Reality) hilfreiche Informationen mit und in der Visualisierung zu gewinnen (vgl. Marauders Map in Harry Potter). Ziel dieses Projekts ist die Implementierung einer Echtzeitvisualisierungskomponente in Java, beispielsweise als Webapplikation oder alternativ auf Android-Mobilgeräten.

Informationen: Christoph Scholz, Martin Atzmüller

Google Map/Reduce: Effizientes Pattern Mining im Web 2.0T

In Web 2.0 Umgebungen ebenso wie in ubiquitären Systemen fallen extrem große Datenmengen an, deren effiziente automatische Analyse eine Herausforderung darstellt. Das von Google entwickelte Map/Reduce-Framework stellt einen attraktiven Ansatz zur effizienten Umsetzung verschiedenster Verfahren dar. Ziel dieses Projekts ist die Implementierung verschiedener Pattern Mining Verfahren in Java mittels Map/Reduce, bzw. in der freien Implementierung hadoop.

Informationen: Martin Atzmüller

Implementierung eines Datenstrom-Management SystemsT

In ubiquitären Systemen werden kontinuierlich Daten gesammelt, und müssen für eine spätere Auswertung geeignet vorverarbeitet und vorgehalten werden. Dazu werden Datenstrom-Management-Werkzeuge genutzt. Ziel dieses Projekts ist die Implementierung eines Datenstrom-Management-Systems mittels einer Applikation in Java.

Informationen: Björn-Elmar Macek

Aufgabenstellung und Termin:
Nach Absprache mit dem jeweiligen Betreuer. Je nach Thema kann die Aufgabe in Kleingruppen oder einzeln bearbeitet werden.
Vorkenntnisse:
Informatik Grundstudium
Angesprochener HörerInnenkreis:
Inf. Hauptstudium Bachelor und Diplom I, Master, Math. NF Inf. Hauptstudium
Umfang:
4 oder 8 SWS im Bachelor und Diplom I nach Absprache, 4 SWS im Master
Leistungsnachweis:
Implementierung, schriftliche Ausarbeitung und zwei Vorträge
Veranstalter:
Dipl.-Inform. Dominik Benz, Dipl.-Math. Robert Jäschke, Dipl.-Inform. Beate Krause, Dipl.-Inform. Folke Mitzlaff
Ablauf:

In der Regel sollte die Projektarbeit mit Semesterbeginn begonnen werden. Nach 4-6 Wochen findet eine Zwischenpräsentation statt, in der der Stand der Projektarbeit vorgestellt wird. In der Regel in der ersten Vorlesungswoche des folgenden Semesters werden dann die Endergebnisse vorgestellt. Eine kurze Beschreibung der Arbeit (5 Seiten) ist 3 Tage vor dem Vortrag einzureichen.

Eine Woche nach der Annahme des Themas gibt der Student eine einseitige Beschreibung der Aufgabe, sowie einen Arbeitsplan für das Semester ab. Zur besseren Koordination und Kommunikation wird erwartet, dass der Student bei einem 4(8) SWS-Projekt regelmäßig an einem (zwei) Tagen in der Softwarewerkstatt anwesend ist. Der genaue Tag ist in Absprache mit dem Betreuer festzulegen.

Als Richtlinie für die Erstellung einer guten Ausarbeitung wird das Buch

  • Markus Deininger and Horst Lichter and Jochen Ludewig and Kurt Schneider. Studien-Arbeiten: ein Leitfaden zur Vorbereitung, Durchführung und Betreuung von Studien-, Diplom- Abschluss- und Doktorarbeiten am Beispiel Informatik. 5. Auflage. vdf Hochschulverlag, Zürich, 2005.

empfohlen, welches in der Bibliothek im Semesterapparat des Fachgebiets Wissensverarbeitung ausliegt, und welches auch in einigen Exemplaren ausleihbar ist. Wir empfehlen die Anschaffung dieses Buchs (9,50 €), da es Sie bis zur Masterarbeit (und weiter) begleiten kann.

Alle verwendeten Referenzen sind zusätzlich zum Literaturverzeichnis der Ausarbeitung in http://www.bibsonomy.org einzugeben, mit den Tags "projekt kde < laufendes Semester in der Form ss08 bzw ww08 > " und weiteren sinnvollen Tags.

Kontakt: