Knowledge and Data Engineering
Uni Kassel

KDD-Praxisübung mit RapidMiner

Hier finden Sie die für die Praxisübungen benötigten Datensätze sowie Hinweise zur Installation von RapidMiner.

Installation von RapidMiner

Wir werden RapidMiner innerhalb der Java-Entwicklungsumgebung Eclipse installieren und benutzen. Es wird vorausgesetzt, dass Sie Eclipse bereits installiert und sich mit der Bedienung vertraut gemacht haben.

  1. Richten Sie ein neues Java-Projekt in Eclipse ein (File/New/Java Project) und geben Sie ihm den Namen RapidMiner
  2. Laden Sie die Datei rapidminer-4.2-community.zip herunter und entpacken Sie sie in einem Verzeichnis (z.b. /tmp/rapidminer-4.2).
  3. Importieren Sie alle Dateien (Import/General/File System) aus dem Verzeichnis in ihr Projekt RapidMiner, insbesondere auch die Dateien .project und .classpath.
  4. Eclipse baut das Projekt jetzt und es sollten keine Fehler (lediglich Warnungen) auftreten.
  5. Bevor wir fertig sind, müssen wir noch den Ant-Task copy-resources ausführen. Klicken Sie dazu mit der rechten Maustaste auf die Datei build.xml im Projekt und wählen Sie Run As/Ant Build.... Aktivieren Sie im erscheinenden Dialog das Target copy-resources und klicken Sie auf Run. Eclipse ruft jetzt Ant auf und danach könnten Sie RapidMiner schon mittels der Klasse com.rapidminer.gui.RapidMinerGUI starten.

Um eigene Plugins entwickeln zu können, werden wir jetzt ein Projekt und ein Grundgerüst für ihre Plugins anlegen.

  1. Erstellen Sie ein neues Java-Projekt KDDUebung in Eclipse.
  2. Fügen Sie das Projekt RapidMiner zum BuildPath dieses Projektes hinzu (Properties/Java Build Path/Projects/Add).
  3. Erstellen Sie im src-Folder ein neues Paket de.unikassel.cs.kde.kdd (New/Package).
  4. Importieren Sie in dieses Paket die Klasse KDDKMeans.java. In dieser Klasse werden Sie in der Übung den KMeans-Algorithmus implementieren.
  5. Erstellen Sie innerhalb ihres Projektes einen Ordner META-INF (New/Folder) und speichern Sie in diesem die Dateien operators.xml und MANIFEST.MF.
  6. Importieren Sie die Datei kddexercise.jardesc ins Hauptverzeichnis des Projektes.
  7. Das Projekt KDDUebung sollte jetzt keine Fehler aufweisen und folgende Struktur haben:
    KDDUebung
     |_src 
     |  |_ de 
     |     |_ unikassel
     |        |_ cs
     |           |_ kde
     |              |_ kdd 
     |                 |_ KDDKMeans
     |_ META-INF 
     |  |_ MANIFEST.MF
     |  |_ operators.xml
     |_ kddexercise.jardesc
    
  8. Nun packen wir das Plugin in ein JAR und speichern es im Plugin-Verzeichnis von Rapidminer. Klicken Sie dazu mit der rechten Maustaste auf die Datei kddexercise.jardesc und wählen Sie Open JAR Packager.... Ändern Sie im erscheinenden Dialog unter Select the export destination das Ziel-Verzeichnis zum Plugin-Verzeichnis von RapidMiner (in ihrem Workspace RapidMiner/lib/plugins). Klicken Sie Finish. Das Plugin-JAR sollte nun ohne Fehler gebaut werden. Beachten Sie, dass die Datei kddexercise.jardesc nur funktioniert, wenn ihr Projekt KDDUebung heißt.

Jetzt können Sie RapidMiner starten, indem Sie die Klasse com.rapidminer.gui.RapidMinerGUI als Java Application laufen lassen. Nachdem RapidMiner gestartet ist, können Sie darin ein neues Projekt erstellen und den Operator KDDExercise/KDDKMeans mittels Rechtsklick und New Operator einfügen.

Algorithmen-Plugin-Gerüste

Datensätze

Kontakt: