Knowledge and Data Engineering
Uni Kassel

Projekt Web 2.0

Dieses Projekt lässt sich als Projekt Semantic Web im Bachelor und als Projekt Wissensverarbeitung im Master anrechnen.

In dem Projekt sind noch Plätze frei. Bei Interesse wenden Sie Sich bitte an den jeweiligen Betreuer.

Themen:
Bei Projekten aus dem Bereich des Semantic Web beschäftigen wir uns mit der IT-Unterstützung von Kommunikation, Interaktion sowie der Speicherung von Wissen im Internet. Einen Schwerpunkt bilden dabei Soziale Lesezeichensysteme, wie bsp. unser BibSonomy-System. Ein weiteres Thema sind Peer-to-Peer-Netze. Neben Projekten in denen inhaltliche Fragestellungen im Vordergrund stehen, bieten wir auch die Möglichkeit, aktuelle Techniken aus dem Bereich des Web 2.0 wie z.B. Ajax in Projekten anzuwenden und in laufende Systeme zu integrieren. Unter anderem stehen die folgenden Themen zur Auswahl: Unter anderem stehen die folgenden Themen zur Auswahl:
Lernen von Ontologien mittels Tagging-Systemen

Lernen von Ontologien auf der Basis von Tagging Systemen.

Informationen: Andreas Hotho,

Performanceuntersuchenungen für BibSonomy

Ein Cluster von Datenbankrechnern stellt häufig den Kern von heutigen Web-2.0-Anwendungen dar. Bei steigender Nutzerzahl/Zugriffzahlen von BibSonomy wird auch hier eine solche Lösung interessant. Die Umsetzung einer Cluster-Datenbank steht im Mittelpunkt dieser Arbeit.

Informationen: Andreas Hotho,

Dokumentation der BibSonomy API mittels WSDL 2.0
Für BibSonomy existiert eine auf den Ideen von REST basierende API. Ziel des Projektes ist die Abbildung und Dokumentation der API mittels WSDL 2.0 zur automatischen Generierung von Client-Stubs und menschenlesbarer Dokumentation.

Informationen: Robert Jäschke

Implementation von Algorithmen

Der Algorithmus Titanic ist ein effizientes Verfahren zur Berechnung häufiger Itemsets, ähnlich dem Apriori-Algorithmus. Letzterer ist beispielsweise in der Datamining-Software Weka in Java implementiert.

Ziel des Projektes ist die Implementierung des Titanic-Algorithmus, basierend auf der vorhandenen Java-Implementierung des Apriori-Algorithmus. Des weiteren sollen zwei Verfahren zur Berechnung von Basen für Assoziationsregeln (Luxemburger und Duquenne/Guigues) untersucht und ebenfalls zur Verwendung in Weka implementiert werden.

Informationen: Robert Jäschke

Visualisierung von Tri-Verbänden

Triadische Begriffsanalyse stellt eine Erweiterung der formalen Begriffsanalyse um eine dritte Dimension dar und kann als dreidimensionales hierarchisches Clusterverfahren verstanden werden. Mittels des TRIAS-Algorithmus können wir effizient Tri-Begriffe mit minimalen Support-Bedingungen auf grossen Datensätzen berechnen.

Ziel des Projektes ist, geeignete Visualisierungsmöglichkeiten für Tri-Verbände zu untersuchen und zu implementieren.

Informationen: Robert Jäschke

Bücher in BibSonomy posten mittels Barcode-Erkennung

Die Barcodes von Büchern kann man mittels in heutigen Notebooks enthaltenen Kameras einlesen und weitere Informationen zum Buch im Internet abrufen. Damit erhält man Metadaten wie Titel, Autor, etc. Diese Daten kann man nun in BibSonomy posten und somit auf einfache Weise seine Büchersammlung verschlagworten oder sich interessante geliehene Bücher merken.

Ziel des Projektes ist die Entwicklung eines Prototypen zum Erkennen der Barcodes, Metadaten-Recherche im Internet und anschließendem Posten des Ergebnisses in BibSonomy

Informationen: Robert Jäschke

Aktives Lernen für das Extrahieren von Metadaten aus Referenzen

Referenzen aus Publikationslisten enthalten wichtige Metadaten, die zur Erstellung von Zitationsgraphen, zur Verlinkung von Publikationen und zu deren Verwaltung verwendet werden. Die Erstellung dieser Metadaten aus gegegebenen Referenzen ist sehr mühsam und aufwendig. Ansätze, die Extraktion zu automatisieren, liefern erste Ergebnisse, sind aber noch nicht befriedigend. Ein grundlegendes Problem ist die Vielfältigkeit mit der Referenzen dargestellt werden. Um dieser Varietät zu begegnen, wird entweder ein großer Trainingsdatensatz benötigt, oder der Trainingsdatensatz muss automatisch erweitert werden. Der zweite Ansatz soll in diesem Projekt behandelt werden. Dabei kann ein bestehender Algorithmus so erweitert werden, dass er automatisch aus neuen Referenzeingaben lernt.

Informationen: Beate Krause

Trend-Visualisierung mit Tags

Anwender in sozialen Lesezeichen-Systemen benutzen Tags, um Resourcen zu beschreiben und diese wiederzufinden. Weil Benutzer häufig einen ähnlichen Wortschatz verwenden, reflektiert die Häufigkeit der verwendeten Tags die Popularität bestimmter Themen. Verschiedene Visualisierungsanwendungen (z.B. Yahoo Taglines für Flickr, Bloggerbeispiel) existieren. Eine einfach gehaltene Visualisierung soll für die Tags in BibSonomy entwickelt werden um die Popularität der Themen in BibSonomy zu verbildlichen. Alternativ / zusätzlich kann untersucht werden, inwieweit sich das Tagging Verhalten über den Lauf der Zeit verändert hat.

Informationen: Beate Krause

Firefox Plugin für BibSonomy

Die bisherige Integration von BibSonomy in die bekannten Browser ist eher lose. Mit Hilfe eines Firefox Plugin könnte man den Nutzern eine erweiterte Funktionalitäten zur Verfügung stellen und damit einen besseren Service anbieten. Die Aufgabe in diesem Projekt ist der Entwurf eines Konzepten sowie die Implementierung des solchen Plugins.

Informationen: Andreas Hotho,

Referenz Extraktion aus PDFs

Publikationen enthalten in der Regel eine Menge von Referenzen auf andere Publikationen. Leider können diese Referenzen zur Zeit noch nicht in BibSonomy abgespeichert werden. Ziel dieses Projektes ist es BibSonomy um eine Zitationsverwaltung zu erweitern. Im zweiten Schritt sind diese aus PDFs mit Hilfe von Informationsextraktionsmethoden automatisch zu extrahieren.

Informationen: Andreas Hotho,

Aufgabenstellung und Termin:
Nach Absprache mit dem jeweiligen Betreuer. Je nach Thema kann die Aufgabe in Kleingruppen oder einzeln bearbeitet werden.
Vorkenntnisse:
Informatik Grundstudium
Angesprochener HörerInnenkreis:
Inf. Hauptstudium Bachelor und Diplom I, Master, Math. NF Inf. Hauptstudium
Umfang:
4 oder 8 SWS im Bachelor und Diplom I nach Absprache, 4 SWS im Master
Leistungsnachweis:
Implementierung, schriftliche Ausarbeitung und zwei Vorträge
Veranstalter:
Dipl.-Inform. Dominik Benz, Dipl.-Inform. Miranda Grahl, Dr. Andreas Hotho, Dipl.-Math. Robert Jäschke, Dipl.-Inform. Beate Krause, Dipl.-Inform. Christoph Schmitz, Prof. Dr. Gerd Stumme
Ablauf:

In der Regel sollte die Projektarbeit mit Semesterbeginn begonnen werden. Nach 4-6 Wochen findet eine Zwischenpräsentation statt, in der der Stand der Projektarbeit vorgestellt wird. In der Regel in der ersten Vorlesungswoche des folgenden Semesters werden dann die Endergebnisse vorgestellt. Eine kurze Beschreibung der Arbeit (5 Seiten) ist 3 Tage vor dem Vortrag einzureichen.

Eine Woche nach der Annahme des Themas gibt der Student eine einseitige Beschreibung der Aufgabe, sowie einen Arbeitsplan für das Semester ab. Zur besseren Koordination und Kommunikation wird erwartet, dass der Student bei einem 4(8) SWS-Projekt regelmäßig an einem (zwei) Tagen in der Softwarewerkstatt anwesend ist. Der genaue Tag ist in Absprache mit dem Betreuer festzulegen.

Als Richtlinie für die Erstellung einer guten Ausarbeitung wird das Buch

  • Markus Deininger and Horst Lichter and Jochen Ludewig and Kurt Schneider. Studien-Arbeiten: ein Leitfaden zur Vorbereitung, Durchführung und Betreuung von Studien-, Diplom- Abschluss- und Doktorarbeiten am Beispiel Informatik. 5. Auflage. vdf Hochschulverlag, Zürich, 2005.

empfohlen, welches in der Bibliothek im Semesterapparat des Fachgebiets Wissensverarbeitung ausliegt, und welches auch in einigen Exemplaren ausleihbar ist. Wir empfehlen die Anschaffung dieses Buchs (9,50 €), da es Sie bis zur Masterarbeit (und weiter) begleiten kann.

Alle verwendeten Referenzen sind zusätzlich zum Literaturverzeichnis der Ausarbeitung in http://www.bibsonomy.org einzugeben, mit den Tags "projekt kde < laufendes Semester in der Form ss08 bzw ww08 > " und weiteren sinnvollen Tags.

Kontakt: