Projekt Web 2.0 – KDE – FB16 – Universität Kassel

Dieses Projekt lässt sich als Projekt Semantic Web im Bachelor und als Projekt Wissensverarbeitung im Master anrechnen.

Projektvorbesprechung: Montag, 16.04.2012, 16.15 Uhr in Raum 1332. Bei Interesse können Sie auch gerne vorab den jeweiligen Betreuer ansprechen.

Themen

Jeder Teilnehmer des Projektes bearbeitet eine individuelle Aufgabe im Umfeld unseres kooperativen Verschlagwortungssystems BibSonomy, sowie im Kontext des VENUS-Projekts mit Integration von RFID und sozialen Netzwerken.

Unter anderem stehen die folgenden Themen zur Auswahl:

(M = methodischer Schwerpunkt, T = technischer Schwerpunkt)

Which paper should I read, which website must I visit? Ressource-Recommendation in folksonomies. M,T

Beim Schreiben einer wissenschaftlichen Arbeit, bei bei der Auswahl von Filmen oder Musik oder einfach beim Surfen im Netz stellt sich immer wieder die Frage, welche Ressourcen (Paper/Webseiten/…) von persönlichem Interesse sein könnten. Oft gibt es zu viele Ressourcen um alle auch nur kurz zu betrachten. Außerdem haben verschiedene Personen sehr verschiedene Interessen. Recommender sind Algorithmen, die dem Anwender bei der Suche nach interessanten Inhalten helfen, indem Sie Ihm potentiell interessante Ressourcen vorschlagen. Gute Algorithmen schlagen viele Ressourcen vor, die dann tatsächlich für den Nutzer interessant sind. Als Eingabe dienen dabei die Profil-Daten der Benutzer, deren Interaktionsverhalten mit dem System etc.
In das Web-System BibSonomy sollen nun aktuelle Recommender-Algorithmen zum Vorschlagen von Webseiten und von wissenschaftlichen Publikationen eingebaut und dort evaluiert werden. Die Algorithmen müssen dafür verstanden, implementiert, getestet und angepasst werden um möglichst viele vorhandene Daten berücksichtigen zu können.
Je nach Bedarf kann die Arbeit als Projekt-, Bachelor- oder Masterarbeit bearbeitet werden: Der Schwierigkeitsgrad und der Umfang der Arbeit werden durch die Auswahl und die Anzahl der Algorithmen bzw. durch verschiedene Evaluationstechniken für die produzierten Vorschläge entsprechend angepasst.

Informationen: Stephan Doerfel

Opinion Dynamics in Social Networks M,T

Bei Opinion Dynamics wird versucht die subjektive Meinung eines Individuums zu einer gefragten Sache zu ermitteln und ihren Lauf zu verfolgen. Dieses Forschungsgebiet ist noch recht neu, profitiert jedoch wunderbar von der Sentiment Analysis. Im Rahmen diese Arbeit ist zu ergründen, wie gut sich bestehende Methoden der Sentiment Analysis für Opinion Dynamics in Social Networks anwenden lassen. Dazu werden Daten aus einem frei wählbaren Social Network (Twitter, Facebook, et cetera) extrahiert und anschließend diesen Methoden unterzogen. Am Ende soll eine Aussage über die Vor- und Nachteile dieser Verfahren getroffen werden.
Im Falle einer Projektarbeit kann dieses Thema gerne in einer folgenden Abschlussarbeit weiter vertieft werden.

Informationen: Juergen Mueller

Framework für System-Tags in BibSonomy T

Das Web 2.0-Portal BibSonomy dient der Verwaltung Ihrer Web-Lesezeichen und Publikationen. Im Gegensatz zu den Lesezeichen und Favoriten im Browser sind die Einträge bei „BibSonomy“ von jedem beliebigem Ort aufrufbar und lassen sich mit Freunden und anderen Benutzern austauschen. Ein integraler Bestandteil beim Arbeiten mit diesem System sind frei wählbare Schlagwörter (Tags). System-Tags sind besondere Tags, die spezielle Funktionen haben oder auslösen. Durch hinzufügen eines solchen Tags kann z. B. ein Lesezeichen an einen anderen Benutzer geschickt werden, ein wissenschaftlicher Artikel als eigene Arbeit gekennzeichnet oder für den Lebenslauf in BibSonomy markiert werden etc. Um dieser Sonderrolle bestimmter Tags im System gerecht zu werden soll das bestehende Handling der System-Tags in eine leicht erweiterbares und konfigurierbares Framework umgewandelt werden.

Informationen: Stephan Doerfel

Learning to rank in BibSonomy M,T

Beim Suchen in unserem Social Bookmarking System BibSonomy werden Suchergebnisse derzeit im Wesentlichen nach Datum gerankt. Vorstellbar sind hier aber verschiedene Rankingverfahren. Ziel der Arbeit ist, ein Framework zu bauen, dass Verschiedene Ranking-Algorithmen zur Anordnung der Suchergebnisse einbinden kann. Dazu soll es eine Vergleichssicht geben, in der zu einer Suche mittels verschiedener Verfahren unterschiedliche geordnete Suchergebnisse präsentiert werden. Das Verhalten der Benutzer (Auswahl des Suchergebnisses) etc. kann dann verwendet werden, um die benutzten Ranking-Verfahren zu beurteilen. Grundkenntnisse in Information Retrieval (z. B. Vorlesung Internet Suchmaschinen) sind von Vorteil, jedoch keine strikte Voraussetzung.

Informationen: Stephan Doerfel

Science-Crawler T

In diesem Projekt geht es darum, Volltexte wissenschaftlicher Arbeiten im Netz zu finden. Viel wissenschaftliche Literatur ist in Form von pdf-Dateien (o.ä.) im Netz (teilweise) frei verfügbar – z. B. über wissenschaftlichen Portale (CiteULike), auf Verlagsseiten, auf den Institutsseiten der Autoren oder über spezielle Suchmaschinen (Google Scholar, Microsoft Academic Search). Projektziel ist, einen Crawler zu designen und zu implementieren, der selbständig, schnell und gezielt wissenschaftliche Publikationen im pdf-Format findet und offline zu einem Korpus zusammenstellt. Grundkenntnisse in Information Retrieval (z. B. Vorlesung Internet Suchmaschinen) sind von Vorteil, jedoch keine strikte Voraussetzung.

Informationen: Stephan Doerfel

Import-Assistent für BibSonomy T

Anwender, die BibSonomy benutzen möchten, haben oft schon relevante Daten auf ihrer Platte liegen bzw. bei anderen Diensten gespeichert. Ein Import-Assistent kann den Anwendern helfen, die Daten in BibSonomy einzufügen. Der Assistent durchsucht dazu die Festplatte nach BibTeX- oder EndNote-Dateien, nach Browser-Lesezeichen und fragt andere Services (wie Delicious oder CiteULike) nach den Daten des Nutzers ab. Danach kann der Benutzer diese Daten aufbereiten, auswählen und in BibSonomy einfügen. Ziel des Projektes ist die Implementierung eines solchen Assistenten.

Informationen: Stephan Doerfel

Tag-Empfehlungen in BibSonomy T,M

Zur Vereinfachung der Klassifikation und Verwaltung von Resourcen haben sich im Bereich von Social Bookmarking verschiedene Empfehlungssysteme (Recommender) etabliert. Die häufigste Anwendung von Empfehlungssystemen ist die Empfehlung von Tags für aktuell zu taggende Resourcen. Durch die Präsentation der Tags während des Verschlagwortens, kann der Nutzer leicht vorgeschlagene Tags auswählen bzw. übernehmen. Tippfehler und unterschiedliche Schreibweisen können auf diese Weise reduziert werden und führen zur Vereinheitlichung und der Konvergenz des verwendeten Vokabulars. In BibSonomy existiert ein Framework zur einheitlichen Evaluation verschiedener Tag-Empfehlungssysteme. Im Rahmen dieser Projektarbeit wird das Framework weiterentwickelt und erweitert. Dabei sind vielfältige Herausforderungen zu meistern, z.B.:

Entwicklung und Implementierung eines Scheduling-Algorithmuses zur Anfrage von verschiedenen Empfehlungssystemen
Performance-Optimierung der Datenbankzugriffe
Implementierung dynamischer Tag-Empfehlungen mittels AJAX
…

Informationen: Folke Mitzlaff

Themenbasierte Graphische Suche in BibSonomy T,M

Zur Zeit erfolgt die Navigation und Suche in BibSonomy im wesentlichen via Tags und Volltext-Suche. Im Rahmen dieser Projektarbeit wird BibSonomy um ein graphisches Suchinterface erweitert, welches es erlaubt, visuell die Suche einzuschränken. Dabei entspricht eine Suchanfrage der Gewichtung von Themen, welche automatisch aus der FolkSonomy extrahiert werden. Dies entspricht einer Suchanfrage der Art: „Ich interessiere mich für Einträge, die viel mit Politik zu tun haben, etwas mit Internet und ein wenig mit Medizin“.

Informationen: Folke Mitzlaff

Visualisierung von User-Ähnlichkeiten T,M

Seit einiger Zeit wird in BibSonomy die Ähnlichkeit zwischen Benutzern berechnet um z.B. auf Benutzer mit ähnlichen Interessen hinzuweisen. Gegenstand dieser Projektarbeit ist die Konzeption und Implementierung einer graphischen Darstellung von Benutzer-Empfehlungen, um zum die Navigation durch die FolkSonomy entlang ähnlicher Benutzer intuitiver zu gestalten.

Informationen: Folke Mitzlaff

Social Network Aggregator M,T

Das VENUS-Projekt untersucht die soziale Vernetzung, und analysiert dabei unter anderem die Nutzungsdaten in sensorgestützten (RFID, Handy) Systemen in Verbindung mit sozialen Netzwerken. Hierbei ist die Einbindung von Facebook, StudiVZ, XING, LinkedIn, u.a. Systemen über entsprechende Schnittstellen (Facebook-API, OpenSocial) relevant, um die freigegebenen Daten im Ubicon-Framework einzubetten, das zur Einbindung von Sensordaten und der Verknüpfung mit sozialen Daten dient. Ziel dieses Projekts ist die Implementierung einer Social Network Aggregationskomponente in Java.

Informationen: Martin Atzmüller

Android und IOS: Intelligente ubiquitäre Sensorerfassung T,M

Das VENUS-Projekt untersucht die soziale Vernetzung, und analysiert dabei unter anderem die Nutzungsdaten in sensorgestützten (RFID, Handy) Systemen. Hierbei ist die Sensor- und Kontexterfassung wichtig, um ubiquitäre Daten, etwa zur Lokalisierung, oder zur Erfassung und Anzeige von Standorten von Freunden, falls sichtbar. Ziel dieses Projekts ist die Implementierung einer konfigurierbaren ubiquitären Sensorkomponente auf Android/IOS Mobilgeräten.

Informationen: Christoph Scholz, Martin Atzmüller

Google Map/Reduce: Effizientes Pattern Mining im Web 2.0 T

In Web 2.0 Umgebungen ebenso wie in ubiquitären Systemen fallen extrem große Datenmengen an, deren effiziente automatische Analyse eine Herausforderung darstellt. Das von Google entwickelte Map/Reduce-Framework stellt einen attraktiven Ansatz zur effizienten Umsetzung verschiedenster Verfahren dar. Ziel dieses Projekts ist die Implementierung verschiedener Pattern Mining Verfahren in Java mittels Map/Reduce, bzw. in der freien Implementierung hadoop.

Informationen: Martin Atzmüller

Komponenten für Explanation-Aware Mining im Social Web M,T

In Web 2.0 Umgebungen ebenso wie in ubiquitären Systemen fallen extrem große Datenmengen an, deren Analyse in einer für Anwender verständlichen Form eine Herausforderung darstellt. Das Explanation-Aware Software Design ist eine Möglichkeit, beliebige Softwaresystem mit Erklärungsfähigkeit(en) auszustatten. Ziel dieses Projekts ist die Implementierung verschiedener Komponenten und Verfahren in Java, um Erklärungen entsprechend der Prinzipien des Explanation-Aware Software Design im Social Web umzusetzen.

Informationen: Martin Atzmüller

Implementierung eines Eclipse Plugins zur Unterstützung von Wissenstransfer in OpenSource Development Teams T

In großen Entwicklungsteams, in denen viele Programmierer über große Distanzen hinweg zusammen an ein und demselben System schreiben, ergibt sich häufig die Frage, wer mit welchem Code oder Bibliothek am vertrautesten ist und am leichtesten bei Fragen Hilfestellung geben kann. Ziel soll es sein, ein Plugin für die weit verbreitete Entwicklungsumgebung Eclipse zu schreiben, das anhand der gesammelten Daten, die bei der Benutzung von Eclipse erzeugt werden, dem Hilfesuchenden eine Liste von Leuten vorschlägt, die ihm bei seinem Problem helfen können.

Informationen: Björn-Elmar Macek

Linguistische Analyse von kollaborativen Schlagworten M

In vielen web-basierten kollaborativen Anwendungen haben sich Schlagworte oder Tags als eine effiziente Art der Wissensorganisation erwiesen. Einige Methoden, die ursprünglich aus dem Bereich Linguistik (besonders Computational Linguistics) stammen, haben sich bereits als nützlich erwiesen, um beispielsweise semantische Beziehungen zwischen Tags automatisch zu extrahieren. Ziel dieser Arbeit ist es, weitere linguistische Methoden hinsichtlich ihrer Eignung zur Anwendung im Tagging-Bereich zu analysieren; mögliche Ansatzpunkte sind hier:
(1) Sprache ermitteln (2) Lemmatisation (d.h. die Rückführung verschiedener grammatischer Formen eines Worts auf eine gemeinsame Wurzel) (3) Mapping der Tags in externe Systeme wie z.B. WordNet oder Wikipedia in der richtigen Sprache (4) Suche im WWW nach semantisch verwandten Worten.
Hierbei können auch einzelne Methoden zur Anwendung im Tagging-Bereich angepasst / optimiert werden.

Informationen: Dominik Benz, Andreas Hotho

Aufgabenstellung und Termin:

Nach Absprache mit dem jeweiligen Betreuer. Je nach Thema kann die Aufgabe in Kleingruppen oder einzeln bearbeitet werden.

Vorkenntnisse:

Informatik Grundstudium

Angesprochener HörerInnenkreis:

Informatik Bachelor und Master, Math. NF Inf. Hauptstudium

Umfang:

6 oder 12 Credits im Bachelor, bzw. 8 Credits im Master

Leistungsnachweis:

Implementierung, schriftliche Ausarbeitung und zwei Vorträge (bei 6 Credits 20 min, bei 8/12 Credits 30 min, jeweils zzgl. ca 15 min Diskussion)

Veranstalter:

Prof. Dr. Gerd Stumme, Dr. Martin Atzmüller, Dipl.-Math. Stephan Doerfel, Dipl.-Inform. M.Sc. Jens Illig, Dipl.-Inform. Mark Kibanov, Dipl.-Inform. Björn-Elmar Macek, Dipl.-Inform. Folke Mitzlaff, M.Sc. Juergen Mueller, M.Sc. Christoph Scholz

Ablauf:

In der Regel sollte die Projektarbeit mit Semesterbeginn begonnen werden. Nach 4-6 Wochen findet eine Zwischenpräsentation statt, in der der Stand der Projektarbeit vorgestellt wird. In der Regel in der ersten Vorlesungswoche des folgenden Semesters werden dann die Endergebnisse vorgestellt. Eine kurze Beschreibung der Arbeit (5 Seiten) ist 3 Tage vor dem Vortrag einzureichen.

Eine Woche nach der Annahme des Themas gibt der Student eine einseitige Beschreibung der Aufgabe, sowie einen Arbeitsplan für das Semester ab. Zur besseren Koordination und Kommunikation wird erwartet, dass der Student bei einem 6(8-12) Credits-Projekt regelmäßig an einem (zwei) Tagen in der Softwarewerkstatt anwesend ist. Der genaue Tag ist in Absprache mit dem Betreuer festzulegen.

Als Richtlinie für die Erstellung einer guten Ausarbeitung wird das Buch

Markus Deininger and Horst Lichter and Jochen Ludewig and Kurt Schneider. Studien-Arbeiten: ein Leitfaden zur Vorbereitung, Durchführung und Betreuung von Studien-, Diplom- Abschluss- und Doktorarbeiten am Beispiel Informatik. 5. Auflage. vdf Hochschulverlag, Zürich, 2005.

empfohlen, welches in der Bibliothek im Semesterapparat des Fachgebiets Wissensverarbeitung ausliegt, und welches auch in einigen Exemplaren ausleihbar ist. Wir empfehlen die Anschaffung dieses Buchs (9,50 €), da es Sie bis zur Masterarbeit (und weiter) begleiten kann.

Alle verwendeten Referenzen sind zusätzlich zum Literaturverzeichnis der Ausarbeitung in http://www.bibsonomy.org einzugeben, mit den Tags „projekt kde < laufendes Semester in der Form ss08 bzw ww08 > “ und weiteren sinnvollen Tags.