Die Sammlung Amtliche Schreiben aktualisieren

Warum und wann dieser Vorgang ausgeführt wird

Ich möchte die "ESV-Sammung Amtliche Schreiben" aktualisieren und alle seit der letzten Produktion gecrawlten bzw. neu heruntergeladenen Schreiben für die Plattform bereitstellen.
Anmerkung:
Merke:
Vor der Aktualisierung muss aktuell wegen des eingefrorenen Crawlers überprüft werden, ob es neue BMF-Schreiben auf der Webseite (s.o.) gibt. Im Normalfall ist es der Zeitraum der letzten Woche: bei einer geplanten Vorproduktion jeden Freitag also der Zeitraum bis letzten Freitag. Alle neuen Dateien müssen in den Ordner V:\ContentManagement\_Datenpool_BMF-Schreiben\pdf_manueller_download\hotfolder abgelegt werden. Dabei spielt es keine Rolle, ob eine Datei bereits im Gesamt-Datenpool existiert (sie würde einfach überschrieben werden).

Die Aktualisierung sollte 1x pro Woche stattfinden.

Dazu wird das Transformationsszenario InfoPilot-Produktion Update Amtliche Schreiben auf die Datei build.xml angewendet.

Die in der build-Datei definierten Skripte führen dann die folgenen Schritte aus:

  • Zu allen unter V:\ContentManagement\_Datenpool_BMF-Schreiben\pdf_manueller_download\hotfolder abgelegten PDFs werden entsprechende Meta-XML-Dateien erzeugt. PDFs und Meta-XML-Dateien werden dann nach V:\ContentManagement\_Datenpool_BMF-Schreiben\pdf bzw. V:\ContentManagement\_Datenpool_BMF-Schreiben\xml verschoben.
  • Alle unter V:\ContentManagement\_Datenpool_BMF-Schreiben\pdf abgelegten PDFs werden auf das Produktionslaufwerk unter werke\amtliche_schreiben kopiert.
  • Alle zugehörigen Metadaten unter V:\ContentManagement\_Datenpool_BMF-Schreiben\xml werden in eine ESV-Instanz vom Typ "kapitel" transformiert, die eine PI <?esv_dokumenttyp Amtliches Schreiben?> enthält sowie das Datum des Schreibens als <?esv_sort_date JJJJ-MM-TT ?>
  • Eine Rahmendatei wird erstellt, die die Schreiben nach Jahren gegliedert beinhaltet.

Vorbereitungen

  1. Im Windows-Explorer den Ordner V:\ContentManagement\_Datenpool_BMF-Schreiben\pdf öffnen.
  2. Im Webbrowser die Seite https://www.bundesfinanzministerium.de/Web/DE/Service/Publikationen/BMF_Schreiben/bmf_schreiben.html anzeigen.
  3. Durch Vergleich des Datums der amtlichen Schreiben auf der Webseite mit dem Datum im Dateinamen der PDF-Dateien (Muster: JJJJ-MM-TT-Titel-des-Schreibens.pdf) im Ordner V:\ContentManagement\_Datenpool_BMF-Schreiben\pdf ermitteln, welche amtlichen Schreiben seit der letzten Produktion neu hinzugekommen sind und die betreffenden Dateien in den Ordner V:\ContentManagement\_Datenpool_BMF-Schreiben\pdf_manueller_download\hotfolder herunterladen.

Prozedur

Das Transformationsszenario InfoPilot-Produktion Update Amtliche Schreiben auf die Datei im Projektbaum build.xml ausführen:
  1. Mit der rechten Maustaste auf build.xml klicken.
  2. Im Kontextmenü Transformieren > Transformiere mit auswählen.
  3. Im Dialogfeld Transformiere mit den Eintrag InfoPilot-Produktion Update Amtliche Schreiben auswählen und auf Ausgewählte Szenarios anwenden klicken.

Nächste Maßnahme

  1. Sofern nicht bereits durchgeführt:
  2. Synchronisation der geänderten Produktionsdaten mit dem Portalserver abwarten. Diese erfolgt alle 5 min. (bei größeren zu erwartenden Datenmengen besser 2 Syncs abwarten - z.B. Primärcontent).
  3. SHI-Portalproduktion starten.