Projekt Web 2.0 / Wissensverarbeitung – KDE – FB16

Dieses Projekt lässt sich als Projekt Web 2.0 im Bachelor und als Projekt Wissensverarbeitung im Master anrechnen.

Projektvorbesprechung: Montag, 24.10.2011, 16.15 Uhr in Raum 0445/E. Bei Interesse können Sie auch gerne vorab den jeweiligen Betreuer ansprechen.

Themen:

Jeder Teilnehmer des Projektes bearbeitet eine individuelle Aufgabe im Umfeld unseres kooperativen Verschlagwortungssystems BibSonomy oder der ubiquitären Plattform Ubicon.

Unter anderem stehen die folgenden Themen zur Auswahl:

(M = methodischer Schwerpunkt, T = technischer Schwerpunkt)

Learning to rank in BibSonomy M,T

Beim Suchen in unserem Social Bookmarking System BibSonomy werden Suchergebnisse derzeit im Wesentlichen nach Datum gerankt. Vorstellbar sind hier aber verschiedene Rankingverfahren. Ziel der Arbeit ist, ein Framework zu bauen, dass Verschiedene Ranking-Algorithmen zur Anordnung der Suchergebnisse einbinden kann. Dazu soll es eine Vergleichssicht geben, in der zu einer Suche mittels verschiedener Verfahren unterschiedliche geordnete Suchergebnisse präsentiert werden. Das Verhalten der Benutzer (Auswahl des Suchergebnisses) etc. kann dann verwendet werden, um die benutzten Ranking-Verfahren zu beurteilen. Grundkenntnisse in Information Retrieval (z. B. Vorlesung Internet Suchmaschinen) sind von Vorteil, jedoch keine strikte Voraussetzung.

Informationen: Stephan Doerfel

Science-Crawler T

In diesem Projekt geht es darum, Volltexte wissenschaftlicher Arbeiten im Netz zu finden. Viel wissenschaftliche Literatur ist in Form von pdf-Dateien (o.ä.) im Netz (teilweise) frei verfügbar – z. B. über wissenschaftlichen Portale (CiteULike), auf Verlagsseiten, auf den Institutsseiten der Autoren oder über spezielle Suchmaschinen (Google Scholar, Microsoft Academic Search). Projektziel ist, einen Crawler zu designen und zu implementieren, der selbständig, schnell und gezielt wissenschaftliche Publikationen im pdf-Format findet und offline zu einem Korpus zusammenstellt. Grundkenntnisse in Information Retrieval (z. B. Vorlesung Internet Suchmaschinen) sind von Vorteil, jedoch keine strikte Voraussetzung.

Informationen: Stephan Doerfel

Framework für System-Tags in BibSonomy T

Das Web 2.0-Portal BibSonomy dient der Verwaltung Ihrer Web-Lesezeichen und Publikationen. Im Gegensatz zu den Lesezeichen und Favoriten im Browser sind die Einträge bei „BibSonomy“ von jedem beliebigem Ort aufrufbar und lassen sich mit Freunden und anderen Benutzern austauschen. Ein integraler Bestandteil beim Arbeiten mit diesem System sind frei wählbare Schlagwörter (Tags). System-Tags sind besondere Tags, die spezielle Funktionen haben oder auslösen. Durch hinzufügen eines solchen Tags kann z. B. ein Lesezeichen an einen anderen Benutzer geschickt werden, ein wissenschaftlicher Artikel als eigene Arbeit gekennzeichnet oder für den Lebenslauf in BibSonomy markiert werden etc. Um dieser Sonderrolle bestimmter Tags im System gerecht zu werden soll das bestehende Handling der System-Tags in eine leicht erweiterbares und konfigurierbares Framework umgewandelt werden.

Informationen: Stephan Doerfel

Eye-Tracking Evaluation der Usability von BibSonomy T

Das Web 2.0-Portal BibSonomy dient der Verwaltung Ihrer Web-Lesezeichen und Publikationen. Im Gegensatz zu den Lesezeichen und Favoriten im Browser sind die Einträge bei „BibSonomy“ von jedem beliebigem Ort aufrufbar und lassen sich mit Freunden und anderen Benutzern austauschen. Ähnlich wie andere Web 2.0-Portale sollte auch BibSonomy intuitiv zu benutzen sein. Um dies sicherzustellen, sind gezielte Untersuchungen zu möglichen Verbesserungen notwendig. Aufgabenstellung: Sie definieren im Rahmen dieser Arbeit konkrete Anwendungsszenarien (UseCases) und entwickeln ein Versuchsdesign, mit dem sich die Usability von „BibSonomy“ anhand von Nutzertests gezielt untersuchen lässt. Dazu steht ein Eye-Tracker zur Blickbewegungsmessung zur Verfügung. Auf Basis der Testergebnisse leiten Sie gezielte Verbesserungsvorschläge ab.

Informationen: Dominik Benz, Michael Domhardt

Lernen von Ontologien mittels Tagging-Systemen M

Das „flache“ Organisationsprinzip von Tagging-Systemen, das auf kollaborativer Verschlagwortung mittels eines unkontrollierten Vokabulars durch alle Benutzer basiert, wurde oft als konträrer Ansatz zu eher traditionellen (zentral kontrollierten, oft hierarchisch strukturierten) Organisations-Schemata wie z.B. Taxonomien oder Ontologien gesehen. Nähere Untersuchungen weisen darauf hin, dass die Vor- und Nachteile beider Paradigmen interessanterweise in einem inversen Verhältnis zu stehen scheinen: Tagging ist vergleichweise „einfach“, aber das unkontrolierte Vokabular führt genau zu den Problemen, für die z.B. Ontologien Lösungen anbieten (z.B. Mehrdeutigkeit, Synonymie, …).

Ziel dieser Arbeit ist es, automatische Verfahren zum Erlernen von semantischen Beziehungen zwischen Tags einer Folksonomy zu analysieren und weiterzuentwickeln. Die gelernten Beziehungen sollen als Grundlagen für einen Ontologie-Lernprozess dienen. Ein weiterer wichtiger Aspekt sind Evaluierungsmethoden der erarbeiteten Lernverfahren.

Informationen: Andreas Hotho, Dominik Benz

Barcode/DataMatrix/QR-Code-Einbettung in PDFs T

Wissenschaftler (und auch Studierende) drucken sich häufig wissenschaftliche Artikel aus, die sie im WWW gefunden haben. Später findet man dann irgendwann so einen The Social Bookmark and Publication Management System BibSonomy Ausdruck in seinem Büro wieder und weiß nicht mehr, woher der kommt oder wann und warum man ihn ausgedruckt hat.
Wie schön wäre es da, wenn auf dem Ausdruck ein (2D-)Barcode wäre, mit dessen Hilfe man von seinem Computer/Smartphone weitere Informationen zum Artikel abrufen kann.

Ziel des Projektes ist die Integration von Software zum Einbetten von (2D-)Barcodes in PDFs in unser kollaboratives Verschlagwortungssystem BibSonomy. Je nach Anzahl der SWS kann das Projekt erweitert werden, um den Komfort für den Benutzer zu erhöhen. Beispielsweise um ein Add-On für Firefox, welches jedes ausgedruckte PDF mit einem Barcode versieht oder um eine Möglichkeit, die Barcodes in BibSonomy bequem einzuscannen und die dazugehörigen Einträge einzusammeln.

Informationen: Robert Jäschke

Git/Mercurial Page Provider für JSPWiki T

JSPWiki ist eine in Java implementierte Wiki-Software, die leicht durch Plugins erweitert werden kann. So gibt es z.B. verschiedene Möglichkeiten, Wiki-Seiten zu speichern: Im Dateisystem, in einer Datenbank, oder in einem SVN-Repository. Die Speicherung der Wiki-Seiten in einem Versionscontrollsystem (wie z.B. SVN, CVS, Git, Mercurial, …) ist interessant, da sie die Synchronisierung mehrerer verteilter Wikis ermöglicht.

Ziel des Projektes ist die Implementierung einer Synchronisierung verteilter Wiki-Instanzen mittels eines verteilten Versionskontrollsystems wie Mercurial oder Git. Die Implementierung soll einen Page Provider sowie weitergehende Infrastruktur (z.B. Werkzeuge zur Konfliktlösung) für JSPWiki enthalten.

Informationen: Robert Jäschke

Admin-Seite der Connect-U T

Ubicon.eu ist eine Plattform für unterschiedliche ubiquitäre Anwendungen. Zurzeit sind folgende Anwendungen implementiert:
– Conferator: unterstützt Konferenzteilnehmer beim Verwalten persönlicher Kontakte und bei der persönlichen Konferenzorganisation;
– MyGroup: fördert Interaktionen zwischen Kollegen und dient dem Erfahrungs-und Wissensaustausch
– EveryAware: ein Projekt zur Erforschung der Lärm- und Luftverschmutzung mithilfe unterschiedlicher ubiquitärer Techniken

Der Begriff Connect-U ist ein Oberbegriff für Conferator- und MyGroup-Anwendungen. Der Administrator des jeweiligen Systems soll fähig sein, unterschiedliche Aktionen wie Erstellen, Editieren und Löschen von Events, Nutzer-Profilen, Konferenz-Schedule-Einträgen usw. durchzuführen.
Das Projekt-Ziel ist die Erstellung der Admin-Seite der ubiquitären Plattform Ubicon und einzelner Anwendungen (MyGroup, Conferator).

Informationen: Mark Kibanov

Analyse von Konferenzbeiträgen M

Im Jahr 2012 feiert die ICFCA – die Internationale Konferenz für Formale Begriffsanalyse ihr 10-jähriges Bestehen. Im Rahmen dieses Jubiläums sollen in diesem Projekt die über zehn Jahre eingereichten Publikationen analysiert werden. Insbesondere interessiert uns dabei der Zitationsgraph, die Co-Autorenbeziehungen und die Themen der Einreichungen. Die Einbeziehung weiterer Maße und Aspekte, die interessante Beziehungen entdecken können, ist dabei ausdrücklich erwünscht.

Ziel des Projektes ist die Entdeckung interessanter Beziehungen zwischen den Publikationen der ICFCA. Die Ergebnisse sollen in Zusammenarbeit mit einem wissenschaftlichen Mitarbeiter des Fachgebietes in einem wissenschaftlichen Artikel in englischer Sprache zusammengefasst und bei der ICFCA 2012 eingereicht werden. Wird die Einreichung bei der Konferenz angenommen, so kann die Konferenz besucht und die Ergebnisse vorgetragen werden.

Informationen: Robert Jäschke

Automatische Bestimmung der Qualität von Wiki-Seiten M,T

Das Problem ist bekannt: Oft sind Wiki-Seiten unvollständig oder schlecht strukturiert. Um solche Seiten leicht finden und gezielt verbessern zu können, sollen Maße gefunden bzw. entwickelt werden, die die Güte einer Wiki-Seite bestimmen und dem Benutzer Seiten zur Verbesserung vorschlagen. Gleichzeitig soll schon während des Bearbeitens einer Seite dem Benutzer (z.B. in Form eines Smileys) angezeigt werden, wie gut die Seite ist.

Informationen: Robert Jäschke

Visualisierung von Tri-Verbänden M,T

Triadische Begriffsanalyse stellt eine Erweiterung der formalen Begriffsanalyse um eine dritte Dimension dar und kann als dreidimensionales hierarchisches Clusterverfahren verstanden werden. Mittels des TRIAS-Algorithmus können wir effizient Tri-Begriffe mit minimalen Support-Bedingungen auf grossen Datensätzen berechnen.

Ziel des Projektes ist, geeignete Visualisierungsmöglichkeiten für Tri-Verbände zu untersuchen und zu implementieren.

Informationen: Robert Jäschke

Merkmalsexploration mit Google, DBPedia & Co. M,T

Mittels Formaler Begriffsanalyse kann man Begriffe und Begriffshierarchien aus Daten gewinnen. Ein Teilgebiet dieser Methode – die Merkmalsexploration – ermöglicht die Länder in Europa interaktive Entdeckung von Beziehungen zwischen Merkmalen (z.B. „alle Länder Europas, die den Euro haben, sind auch in der EU“). Dabei werden dem Benutzer Fragen präsentiert (z.B. „Stimmt es, dass jedes Land Europas, dass in der NATO ist, auch in der EU ist?“), die er bestätigen oder mit Gegenbeispielen („Nein, Norwegen ist in der NATO aber nicht in der EU.“) widerlegen kann.

Ziel dieser Aufgabe ist es, den Benutzer bei der Merkmalsexploration durch Zuhilfenahme des Internets zu unterstützen. Dabei soll zunächst untersucht werden, welche Datenquellen (Google, DBPedia, etc.) und welche Anfragen für die Beantwortung der bei der Merkmalsexploration auftretenden Fragen hilfreich sind. In einem weiteren Schritt soll eine Software (idealerweise web-basiert) entwickelt werden, die das entworfene Konzept umsetzt. Dazu gehört auch die Implementierung des Algorithmus zur Merkmalsexploration.
Der gleichzeitige (oder bereits durchgeführte) Besuch der Vorlesung Begriffliche Strukturen ist sehr empfehlenswert.

Informationen: Robert Jäschke

Performance-Untersuchungen für BibSonomy T

Ein Cluster von Datenbankrechnern stellt häufig den Kern von heutigen Web-2.0-Anwendungen dar. Bei steigender Nutzerzahl/Zugriffzahlen von BibSonomy wird auch hier eine solche Lösung interessant. Die Umsetzung einer Cluster-Datenbank steht im Mittelpunkt dieser Arbeit.

Informationen: Andreas Hotho

OAI-Unterstützung für BibSonomy T

Die Open Archives Inititiative zielt darauf ab, einen offenen Standard für Publikationsmetadaten an Universitäten und Bibliotheken zu etablieren und dadurch den Austausch sowie das Auffinden von Metadaten zu erleichtern. Mit dem Protocol for Metadata Harvesting steht ein Standard zur Verfügung, der Anbietern von Diensten zur Implementierung empfohlen wird.

Ziel des Projektes ist die Implementierung von OAI-PMH in unser System BibSonomy. Dabei soll insbesondere die Unterstützung und Integration vorhandener Ausgabeformate wie BibTeX oder RIS untersucht werden und die von OAI-PMH geforderte REST-API (ein schönes Anfrageformular ist hier zu sehen) implementiert werden.

Informationen: Robert Jäschke

Referenz-Extraktion aus PDFs / Einbettung von Metadaten T

Publikationen enthalten in der Regel eine Menge von Referenzen auf andere Publikationen. Leider können diese Referenzen zur Zeit noch nicht in BibSonomy abgespeichert werden. Ziel dieses Projektes ist es BibSonomy um eine Zitationsverwaltung zu erweitern. Im zweiten Schritt sind diese aus PDFs mit Hilfe von Informationsextraktionsmethoden automatisch zu extrahieren.

Mit der Extensible Metadata Platform (XMP) bietet Adobe einen Standard zur Einbettung von Metadaten in PDF-Dokumente an, der auch schon von Reference-Mangement-Lösungen wie JabRef verwendet wird. Ein weiteres mögliches Ziel dieser Arbeit ist die Erweiterung von BibSonomy um die Funktionalität, Metadaten zu hochgeladenen PDFs hinzuzufügen, bzw. diese auszulesen.

Informationen: Andreas Hotho, Dominik Benz

Optimierung des Workflows beim wissenschaftlichen Arbeiten / Schreiben mit BibSonomy T

Ein wesentliches Ziel von BibSonomy ist es, die alltägliche Arbeit von Wissenschaftlern zu erleichtern. Ein wichtiger Teil davon ist das Sammeln und Organisieren von Literatur, sowie das Einbinden / Zitieren der Literatur in eigene Arbeiten. BibSonomy in seiner jetzigen Form unterstützt die verschiedenen Phasen dieses Prozesses auf verschiedene Weise: Das Sammeln und Strukturieren wird z.B. sehr gut durch Scraper und Verschlagwortung unterstützt, während die Einbindung in den Paper-Produktions-Prozess noch weitestgehend manuell (z.B. Export des BibTeX-Dateien) stattfindet.

Ziel dieser Arbeit ist es, zunächst mögliche Workflows mit verschiedenen System- und Textverarbeitungs-umgebungen (Windows / Linux, Word / Latex, …) auszuarbeiten. Nach Auswahl eines geeigneten Workflows sollen dann alle benötigten Systemkomponeten angepasst / implementiert werden, um diesen optimal zu unterstützen.

Informationen: Dominik Benz

Implementierung des FolkRank-Algorithmus mittels Hadoop oder auf Graphikkarten T

Der FolkRank-Algorithmus bietet ein Ranking in allen drei Dimensionen einer Folksonomie. Für unser kollaboratives Verschlagwortungssystem BibSonomy benötigen wir eine schnelle Implementierung dieses Ranking-Verfahrens.

In diesem Projekt sollen zwei Varianten ausgelotet werden: die Implementierung auf Graphikkarten-Prozessoren und die verteilte Implementierung mittels des Hadoop-Frameworks.

Informationen: Robert Jäschke, Andreas Hotho

MetaTaggingService M,T

Bei diesem Mashup-Projekt werden Informationen verschiedener bekannter Tagging Dienste zusammengetragen. Die gesammelten Informationen sollen im nächsten Schritt zusammengefaßt und aufbereitet werden, so dass neben einer großen TagWolke, auch z.B der zeitliche Verlauf der Tags und aufkommende Themen ansprechend im System dargestellt werden.

Informationen: Andreas Hotho

Erkennung von Autoren/Journalen in BibSonomy M,T

Ein zentrales Problem in BibSonomy ist die Erkennung und Identifikation von Objekten wie Autoren, Editoren aber auch Büchern. In der Literatur finden sich vielfältige Ansätze der manuellen oder automatischen Zuordnung von Bezeichnern zu den passenden Objekten. Auch Lernansätze sind dort beschrieben. Ziel des Projektes ist die Entwicklung und Umsetzung eines Konzeptes für BibSonomy, das auf der einen Seite die interne Objektrepresentation neu implementiert und die Zuordnung zwischen Objekt und im Text gefunden Bezeichnern automatisch lernt.

Informationen: Andreas Hotho

Verknüpfung des MediaWikis mit BibSonomy T

Die von der Wikipedia genutzte Software MediaWiki ist eine der bekanntesten Wiki-Implementierungen. Häufig werden auf Wikiseiten Bücher oder Fachartikel zitiert. In diesem Projekt soll ein Plugin für MediaWiki entwickelt werden, das das einfache Zitieren von in BibSonomy vorhandener Literatur erlaubt. Dabei soll der Nutzer mit typischen Ajax-Techniken unterstützt werden.

Informationen: Andreas Hotho

Integration von BibSonomy in Zotero T

Zotero ist ein Firefox-Plugin zum Verwalten von Bookmarks und Publikationsmetadaten. Allerdings sind alle Daten im Gegensatz zu BibSonomy im Browser des Nutzers abgelegt. Hier bietet sich die Integration mit einem Serverdienst wie BibSonomy an. Die Anbindung von Zotero soll mittels der in BibSonomy vorhanden API erfolgen.

Informationen: Andreas Hotho

Import-Assistent für BibSonomy T

Anwender, die BibSonomy benutzen möchten, haben oft schon relevante Daten auf ihrer Platte liegen bzw. bei anderen Diensten gespeichert. Ein Import-Assistent kann den Anwendern helfen, die Daten in BibSonomy einzufügen. Der Assistent durchsucht dazu die Festplatte nach BibTeX- oder EndNote-Dateien, nach Browser-Lesezeichen und fragt andere Services (wie del.icio.us oder CiteULike) nach den Daten des Nutzers ab. Danach kann der Benutzer diese Daten aufbereiten, auswählen und in BibSonomy einfügen. Ziel des Projektes ist die Implementierung eines solchen Assistenten.

Informationen: Robert Jäschke

Webapplikation zur Offline-Berechnung von Datenbank-Tabellen T

Zahlreiche Tabellen der BibSonomy-Datenbank werden „offline“ – im Hintergrund – berechnet. Dazu zählen beispielsweise die Tabellen für die popular-Seite oder auch die Tabellen für die Suchfunktion. In diesem Projekt soll eine Webapplikation erstellt werden, die die verschiedenen Berechnungsskripte vereint und mittels einer Weboberfläche steuerbar macht.

Informationen: Andreas Hotho

Themenbezogene Benutzerempfehlungen in BibSonomy M,T

In Kürze wird es bei BibSonomy möglich sein, Benutzer eigenen Interessensbereichen zuzuordnen. Eine sogenannte „Sphäre“ entspricht damit einer benannten Gruppe von Benutzern. Dies ermöglicht zum Beispiel neue Einträge von „Studienkollegen“ getrennt von den Einträgen der „Familie“ zu verfolgen. Diese Funktion wirft eine Reihe von interessanten Forschungsfragen auf: Lassen sich die „Namen“ der Sphären durch die Einträge der entsprechenden Benutzer charakterisieren? Beschreiben unterschiedliche Benutzer des Systems mit ihren Sphären konsistente Benutzergruppen? Wie lassen sich Benutzer zu einem gegebenen Interessensbereich empfehlen? Im Rahmen dieser Projektarbeit soll in BibSonomy ein Framework zur personalisierten und Themenbezogenen Benutzerempfehlung entwickelt und implementiert werden.

Informationen: Folke Mitzlaff

Themenbasierte Graphische Suche in BibSonomy M,T

Zur Zeit erfolgt die Navigation und Suche in BibSonomy im wesentlichen via Tags und Volltext-Suche. Im Rahmen dieser Projektarbeit wird BibSonomy um ein graphisches Suchinterface erweitert, welches es erlaubt, visuell die Suche einzuschränken. Dabei entspricht eine Suchanfrage der Gewichtung von Themen, welche automatisch aus der FolkSonomy extrahiert werden. Dies entspricht einer Suchanfrage der Art: „Ich interessiere mich für Einträge, die viel mit Politik zu tun haben, etwas mit Internet und ein wenig mit Medizin“.

Informationen: Folke Mitzlaff

Themenbasierte Graphische Suche in BibSonomy M,T

Informationen: Folke Mitzlaff

Visualisierung von User-Ähnlichkeiten M,T

Seit einiger Zeit wird in BibSonomy die Ähnlichkeit zwischen Benutzern berechnet um z.B. auf Benutzer mit ähnlichen Interessen hinzuweisen. Gegenstand dieser Projektarbeit ist die Konzeption und Implementierung einer graphischen Darstellung von Benutzer-Empfehlungen, um zum die Navigation durch die FolkSonomy entlang ähnlicher Benutzer intuitiver zu gestalten.

Informationen: Folke Mitzlaff

Social Network Aggregator M,T

Das VENUS-Projekt untersucht die soziale Vernetzung, und analysiert dabei unter anderem die Nutzungsdaten in sensorgestützten (RFID, Handy) Systemen in Verbindung mit sozialen Netzwerken. Hierbei ist die Einbindung von Facebook, StudiVZ, XING, LinkedIn, u.a. Systemen über entsprechende Schnittstellen (Facebook-API, OpenSocial) relevant, um die freigegebenen Daten im Ubicon-Framework einzubetten, das zur Einbindung von Sensordaten und der Verknüpfung mit sozialen Daten dient. Ziel dieses Projekts ist die Implementierung einer Social Network Aggregationskomponente in Java.

Informationen: Martin Atzmüller

Android: Intelligente ubiquitäre Sensorerfassung M,T

Das VENUS-Projekt untersucht die soziale Vernetzung, und analysiert dabei unter anderem die Nutzungsdaten in sensorgestützten (RFID, Handy) Systemen. Hierbei ist die Sensor- und Kontexterfassung wichtig, um ubiquitäre Daten, etwa zur Lokalisierung, oder zur Erfassung und Anzeige von Standorten von Freunden, falls sichtbar. Ziel dieses Projekts ist die Implementierung einer konfigurierbaren ubiquitären Sensorkomponente auf Android-Mobilgeräten.

Informationen: Christoph Scholz, Martin Atzmüller

„Kinect: Gestenerkennung“ M,T

Das Conferator-System unterstützt die soziale Vernetzung auf Konferenzen, Messen und Tagungen. Um auf Konferenzen eine einfache Nutzung des System zu gewährleisten, soll der Conferator durch Gesten bedienbar sein. Das Ziel dieses Projektes ist somit die Implementierung von Algorithmen zur Gestenerkennung durch die Kinect. Anschließend soll die Gestenerkennung in den Conferator integriert werden.

Informationen: Christoph Scholz, Martin Atzmüller

Google Map/Reduce: Effizientes Pattern Mining im Web 2.0 T

In Web 2.0 Umgebungen ebenso wie in ubiquitären Systemen fallen extrem große Datenmengen an, deren effiziente automatische Analyse eine Herausforderung darstellt. Das von Google entwickelte Map/Reduce-Framework stellt einen attraktiven Ansatz zur effizienten Umsetzung verschiedenster Verfahren dar. Ziel dieses Projekts ist die Implementierung verschiedener Pattern Mining Verfahren in Java mittels Map/Reduce, bzw. in der freien Implementierung hadoop.

Informationen: Martin Atzmüller

Komponenten für Explanation-Aware Mining im Social Web M,T

In Web 2.0 Umgebungen ebenso wie in ubiquitären Systemen fallen extrem große Datenmengen an, deren Analyse in einer für Anwender verständlichen Form eine Herausforderung darstellt. Das Explanation-Aware Software Design ist eine Möglichkeit, beliebige Softwaresystem mit Erklärungsfähigkeit(en) auszustatten. Ziel dieses Projekts ist die Implementierung verschiedener Komponenten und Verfahren in Java, um Erklärungen entsprechend der Prinzipien des Explanation-Aware Software Design im Social Web umzusetzen.

Informationen: Martin Atzmüller

Implementierung eines Eclipse Plugins zur Unterstützung von Wissenstransfer in OpenSource Development Teams T

In großen Entwicklungsteams, in denen viele Programmierer über große Distanzen hinweg zusammen an ein und demselben System schreiben, ergibt sich häufig die Frage, wer mit welchem Code oder Bibliothek am vertrautesten ist und am leichtesten bei Fragen Hilfestellung geben kann. Ziel soll es sein, ein Plugin für die weit verbreitete Entwicklungsumgebung Eclipse zu schreiben, das anhand der gesammelten Daten, die bei der Benutzung von Eclipse erzeugt werden, dem Hilfesuchenden eine Liste von Leuten vorschlägt, die ihm bei seinem Problem helfen können.

Informationen: Björn-Elmar Macek

Linguistische Analyse von kollaborativen Schlagworten M

In vielen web-basierten kollaborativen Anwendungen haben sich Schlagworte oder Tags als eine effiziente Art der Wissensorganisation erwiesen. Einige Methoden, die ursprünglich aus dem Bereich Linguistik (besonders Computational Linguistics) stammen, haben sich bereits als nützlich erwiesen, um beispielsweise semantische Beziehungen zwischen Tags automatisch zu extrahieren. Ziel dieser Arbeit ist es, weitere linguistische Methoden hinsichtlich ihrer Eignung zur Anwendung im Tagging-Bereich zu analysieren; mögliche Ansatzpunkte sind hier:
(1) Sprache ermitteln (2) Lemmatisation (d.h. die Rückführung verschiedener grammatischer Formen eines Worts auf eine gemeinsame Wurzel) (3) Mapping der Tags in externe Systeme wie z.B. WordNet oder Wikipedia in der richtigen Sprache (4) Suche im WWW nach semantisch verwandten Worten.
Hierbei können auch einzelne Methoden zur Anwendung im Tagging-Bereich angepasst / optimiert werden.

Informationen: Dominik Benz, Andreas Hotho

Aufgabenstellung und Termin:

Nach Absprache mit dem jeweiligen Betreuer. Je nach Thema kann die Aufgabe in Kleingruppen oder einzeln bearbeitet werden.

Vorkenntnisse:

Informatik Grundstudium

Angesprochener HörerInnenkreis:

Inf. Hauptstudium Bachelor und Diplom I, Master, Math. NF Inf. Hauptstudium

Umfang:

4 oder 8 SWS im Bachelor und Diplom I nach Absprache, 4 SWS im Master

Leistungsnachweis:

Implementierung, schriftliche Ausarbeitung und zwei Vorträge

Veranstalter:

Dr. Martin Atzmüller, Dr. Dominik Benz, Dipl.-Math. Stephan Doerfel, Dr. Robert Jäschke, Dipl.-Inform. Björn Elmar Macek, Dipl.-Inform. Folke Mitzlaff, M. Sc. Jürgen Müller, M. Sc. Christoph Scholz

Ablauf:

In der Regel sollte die Projektarbeit mit Semesterbeginn begonnen werden. Nach 4-6 Wochen findet eine Zwischenpräsentation statt, in der der Stand der Projektarbeit vorgestellt wird. In der Regel in der ersten Vorlesungswoche des folgenden Semesters werden dann die Endergebnisse vorgestellt. Eine kurze Beschreibung der Arbeit (5 Seiten) ist 3 Tage vor dem Vortrag einzureichen.

Eine Woche nach der Annahme des Themas gibt der Student eine einseitige Beschreibung der Aufgabe, sowie einen Arbeitsplan für das Semester ab. Zur besseren Koordination und Kommunikation wird erwartet, dass der Student bei einem 4(8) SWS-Projekt regelmäßig an einem (zwei) Tagen in der Softwarewerkstatt anwesend ist. Der genaue Tag ist in Absprache mit dem Betreuer festzulegen.

Als Richtlinie für die Erstellung einer guten Ausarbeitung wird das Buch

Markus Deininger and Horst Lichter and Jochen Ludewig and Kurt Schneider. Studien-Arbeiten: ein Leitfaden zur Vorbereitung, Durchführung und Betreuung von Studien-, Diplom- Abschluss- und Doktorarbeiten am Beispiel Informatik. 5. Auflage. vdf Hochschulverlag, Zürich, 2005.

empfohlen, welches in der Bibliothek im Semesterapparat des Fachgebiets Wissensverarbeitung ausliegt, und welches auch in einigen Exemplaren ausleihbar ist. Wir empfehlen die Anschaffung dieses Buchs (9,50 €), da es Sie bis zur Masterarbeit (und weiter) begleiten kann.

Alle verwendeten Referenzen sind zusätzlich zum Literaturverzeichnis der Ausarbeitung in http://www.bibsonomy.org einzugeben, mit den Tags „projekt kde < laufendes Semester in der Form ss08 bzw ww08 > “ und weiteren sinnvollen Tags.