convert
Das PICA-Format kann in verschiedene Datenformate serialisiert werden. Das convert-Kommando ermöglicht es, Datensätze von einem Format in ein anderes Format zu konvertieren. Es bietet insbesondere die Möglichkeit, Datensätze, die nicht in normalisiertem PICA+ vorliegen, nach PICA+ zu konvertieren, um sie durch andere Kommandos verarbeiten zu können.
Folgende Formate werden unterstützt:
- normalisiertes PICA+ (
plus) - binäres PICA (
binary) - PICA-Importformat (
import) - PICA-Plain (
plain) - PICA-JSON (
json) - PICA-XML (
xml)
Die Angabe der Datenformate erfolgt über die Optionen --from/-f und --to/-t:
$ pica convert --from plus --to binary DUMP.dat.gz -o dump.bin
$ pica convert --from plus --to json DUMP.dat.gz -o dump.json
$ pica convert --from plus --to plain DUMP.dat.gz -o dump.plain
$ pica convert --from plus --to plus DUMP.dat.gz -o dump.dat
$ pica convert --from plus --to xml DUMP.dat.gz -o dump.xmlOptionen
-s,--skip-invalid- Überspringt jene Zeilen aus der Eingabe, die nicht dekodiert werden konnten.
-f <format>,--from <format>- Auswahl des Datenformats der Eingabe.
-t <format>,--to <format>- Auswahl des Datenformats der Ausgabe.
-p,--progress-
Anzeige des Fortschritts, der die Anzahl der eingelesenen gültigen sowie invaliden Datensätze anzeigt. Das Aktivieren der Option erfordert das Schreiben der Datensätze in eine Datei mittels
-obzw.--output. -o <filename>,--output <filename>-
Angabe, in welche Datei die Ausgabe geschrieben werden soll. Standardmäßig wird die Ausgabe in die Standardausgabe
stdoutgeschrieben.