Homepage von Jean-René Thies — Projekte & Tools rund um Java, Groovy, Grails, PHP, Scala, MySQL...
    « Apache POI / HSSF und Formeln in ExcelDatenintegration mit Pentaho (Kettle) »

    Pentaho/Kettle - schrittweise

    Permalink 24.04.08 19:28, von jrt, Kategorien: Project Plaza, Tools , Schlagworte: csv, datenintegration, excel, export, kettle, transformation, xml

    3. Ergebnisdateien komprimiert per E-Mail senden

    Jetzt wird es etwas aufwändiger. Um transformierte und exportierte Daten per E-Mail versenden zu können, brauchen wir auf jeden Fall einen SMTP-Server, der bereitwillig E-Mails mit Dateianhängen auf die Reise schickt.

    Dann kann es losgehen: Wir erzeugen einen neuen Job. Aktionen wie ZIP-Archivierung und Mailversand gibt es nämlich nicht innerhalb von Transformationen.
    Die Job-Aktionen sind schnell zusammengeklickt:
    Sendmail Job
    Die Transformation “Test Export” dient zum Laden, Ändern und Speichern von Daten. Die Konfiguration der “Zip file” Aktion ist selbsterklärend. Dann folgt “Send mail", und hier ist neben der korrekten Server-Einstellung wichtig, unter “Attached Files” die Option “Attach File(s) to message?” zu markieren.
    Sendmail Dateianhang

    Wenn alles klappt, kommt auch tatsächlich eine E-Mail mit ZIP-komprimiertem Dateianhang an. Aber: Auch die Quelldaten und die unkomprimierte Ergebnisdatei sind mit dabei. Warum das?

    Es liegt einfach daran, dass sich der Job-Workflow alle Dateien merkt, die beim Ablauf verwendet wurden. Was man also braucht, ist eine Aktion, die an einem bestimmten Punkt dafür sorgt, dass der Job alle Dateien “vergisst", die nicht mit ins E-Mail sollen. Und das geht so:
    Wir bauen noch eine zusätzliche Transformation direkt vor “Zip file” ein.
    Sendmail Dateien vergessen

    Diese Transformation, die ich “Vorherige Dateien vergessen” genannt habe, enthält KEINE Aktionen. Wichtig ist nur eine Option im Konfigurationsdialog:
    Clear the list of result files before execution

    Damit bleibt für die Mail-Aktion nur noch die finale ZIP-Datei als Anhang übrig.

    Seiten: 1 · 2 · 3 · 4 · 5

    2 Kommentare »

    2 Kommentare

    Kommentar von: martin [Besucher]
    Hallo,

    ich bin begeistert, dass es nun endlich mal ein kleines deutsches Tutorial für Pentaho/Kettle gibt. Einfach Probleme lassen sich sehr gut damit lösen.
    Ich stehe gerade vor einem komplexeren System. 1 Excel File -> in ein ER-Modell einzubinden. Also mehrere Tabellen die mit Foreign Keys verküpft sind und ich die ID's weiterreichen muss.
    Gibt es hierzu evtl. ein gutes Tutorial ?
    31.10.08 @ 10:49
    Kommentar von: Bert [Besucher] E-Mail
    Hallo,

    mit diesem Tutorial konnte ich schon erste Schritte üben.
    ich stoße aber schnell auf erste Fragen, zu denen ich noch keine Lösung gefunden habe. Vielleicht kann mir hier geholfen werden.
    1. kann ich einen Job auf verschieden(im Aufbau gleiche) Datenbanken schicken?
    2. Ist eine Art 'Gruppenwechsel' realisierbar?
    09.12.08 @ 08:25

    Einen Kommentar hinterlassen


    Ihre E-Mail-Adresse wird nicht auf dieser Seite angezeigt.

    Ihr URL wird angezeigt.
    (Zeilenumbrüche werden zu <br />)
    (Name, E-Mail-Adresse & Webseite)
    (Benutzern erlauben, Sie durch ein Kontaktformular zu kontaktieren (Ihre E-Mail-Adresse wird nicht weitergegeben))

    ©2010 by Jean-René Thies

    Kontakt |