EVL-Anonymisierungsstudie
Installations- und Konfigurationshandbuch
Überblick
Overview
Die EVL-Anonymisierung dient dem Schutz / der Anonymisierung von Geschäftsdaten und personenbezogenen Daten. Es ist Teil der EVL-Datentool-Familie und eignet sich für umfangreiche Datenworkflows. Die EVL-Anonymisierung verwendet Konfigurationsdateien im Tabellenkalkulationsstil, um so auf einfache Weise reguläre EVL-Jobs zu erstellen, damit können die Daten sofort verarbeitet, als geplante Jobs ausgeführt oder in größere Datenworkflows integriert werden.
In diesem Handbuch wird Folgendes beschrieben: Installation der EVL-Anonymisierung, Erstellen eines Beispielprojekts, Generieren von EVL-Jobs und schließlich Anonymisieren von Beispieldaten.
Installation
Linux - RPM
Betriebssysteme der Red Hat-Familie: Fedora, CentOS, Red Hat, Oracle Linux usw. Installieren der EVL-Anonymisierungsudo dnf install evl-anonymization-trial-1.1-2.static.x86_64.rpm
/opt/EVL-Anonymization-1.1/bin/evl init
Linux - DEB
Debian-basierte Betriebssysteme: Ubuntu, Debian usw. Installieren der EVL-Anonymisierungsudo apt install ./evl-anonymization-trial_1.1-2.static_amd64.deb
/opt/EVL-Anonymization-1.1/bin/evl init
MS Windows - Ubuntu
Die EVL-Tool-Anonymisierung hat keine native Distribution für Microsoft Windows, sondern wird auf Windows-Installationen mit Microsoft WSL (Windows Subsystem for Linux) ausgeführt. Obwohl die Anonymisierung unter WSL ausgeführt wird, können alle Daten und Konfigurationsdateien mit typischen Windows-Tools wie Datei-Explorer, Excel usw. abgerufen und bearbeitet werden.
Installieren Sie die WSL und aktivieren Sie diese im System. Installieren Sie dann Ubuntu 18.04 aus dem Microsoft Store. Auf dieser Webseite finden Sie detaillierte Anweisungen zu WSL und Ubuntu:
https://www.windowscentral.com/install-windows-subsystem-linux-windows-10
Befolgen Sie nach Abschluss die Installationsanweisungen für Linux (DEB)
Beispiel
In diesem Beispiel werden die Daten von zwei CSV-Dateien (Adressen.csv, Kunden.csv) gemäß der in sample_source.csv angegebenen Konfiguration anonymisiert.
Erstellen und Ausführen eines Beispielprojekts
Erstellen Sie ein Beispielprojekt mit einem integrierten Befehl evl
evl anon project sample anon-sample
cd anon-sample
Generieren Sie Anonymisierungsjobs aus der Konfigurationsdatei
evl anon build configs/sample_source.csv
Run the anonoimization jobs that were generated.
evl run/anon/sample_source.addresses.evl
evl run/anon/sample_source.customers.evl
Verzeichnisaufbau
Verwenden Sie den Befehl Tree, um eine hierarchische Liste der Verzeichnisse abzurufen. Die meisten Verzeichnisse enthalten interne Funktionen der Anonymisierungssoftware. Ändern Sie Folgendes, um das Verhalten der Anonymisierung zu testen:
- Konfigurationsdatei sample_source.csv im Verzeichnis configs
- die Datendateien address.csv und customers.csv im Verzeichnis data / source
Anonymisierungsfunktionen konfigurieren
Versuchen Sie, einzelne Anonymisierungsfunktionen zu bearbeiten:
- In der Datei anon-sample /configs/sample/source.csv und ändern Sie die Werte in der Spalte anon_type oder evl_value. Zur Vereinfachung können Sie die Option verwenden, um die Konfigurationsdatei in Excel mit der implementierten Liste der Werte zu bearbeiten.
- Sobald Sie fertig sind, generieren Sie neue Jobs:
evl anon build configs/sample_source.csv
- Führen Sie die neu generierten Anonymisierungsjobs aus
evl run/anon/sample_source.addresses.evl
evl run/anon/sample_source.customers.evl
- Überprüfen Sie die Änderungen in den anonymisierten Dateien address.csv und customers.csv im Verzeichnis data / source / anon
Erstellen Sie Ihr eigenes Projekt
Verwenden Sie den Befehl EVL, um ein neues Projekt zu erstellen. Ersetzen Sie Ihren eigenen Projektnamen durch <Projekt>. Ein neues Verzeichnis mit diesem Namen wird erstellt
evl anon project new <projekt>
Wechseln Sie in den neuen Projektordner und erstellen Sie Verzeichnisse für ein Anonymisierungsprojekt
cd <projekt>
mkdir data/source
mkdir data/anon
Kopieren Sie Ihre Datenquellendateien in <Projekt> /data/source. Um das Einstellen spezieller Parameter zu vermeiden, sollten die Dateien folgende Funktionen haben:
- suffix: csv
- Überschriften in der ersten Zeile
- Trennzeichen ";"
Generieren Sie die Standardkonfigurationsdatei
evl anon source new <projekt> --guess-from-csv data/source
Führen Sie eine Syntaxprüfung der Konfigurationsdatei durch
evl anon check configs/<projekt>.csv
Generieren Sie Anonymisierungsjobs
evl anon build configs/<projekt>.csv
Führen Sie Anonymisierungsjobs aus
evl run/anon/<evljob>
wobei <evljob> der Name der Datei mit dem im Verzeichnis run/anon generierten Suffix evl ist
FAQ
Wie stelle ich Parameter beim Bearbeiten von Daten in Windows-Umgebungen ein?
CSV-Dateien für die Konfiguration von Spaltentrennzeichen können mit der Variablen EVL_CONFIG_FIELD_SEPARATOR, anonymen Daten für Spaltentrennzeichen und der Variablen EVL_DEFAULT_FIELD_SEPARATOR festgelegt werden. Starttrennzeichen sind Semikolons.
ür Windows-Zeilenumbrüche können Sie dann die Variable EVL_ANON_EOL = "dos" setzen. Alle diese Variablen können in der Konfigurationsdatei project.sh festgelegt werden
Wie deinstalliere ich EVL Anonymization?
DEB:sudo apt remove evl-anonymization-trial
RPM:
sudo dnf remove evl-anonymization-trial
Das Standardverhalten besteht darin, Ausgabedateien anzuhängen, anstatt neue Dateien zu erstellen. Wie ändere ich das?
Fügen Sie in der Datei project.sh die Zeile EVL_ANON_APPEND = 1 zu EVL_ANON_APPEND = 0 hinzu oder ändern Sie sie, um das Verhalten projektweit zu ändern. Nehmen Sie die Bearbeitung in einer beliebigen anon / <Jobname> .sh-Datei vor, um das Verhalten für bestimmte Jobs zu ändern.
Wie arbeite ich richtig mit Windows-Zeilenumbrüchen?
Standardmäßig werden Linux-Zeilenumbrüche für Eingabedateien angenommen, dh "\n". Das Setzen von EVL_ANON_EOL = "dos" kann auf Windows-Zeilenumbrüche, dh "\r\n", in der Datei configs anon. *. Sh oder in project.sh festgelegt werden.
Wie überprüfe ich, ob die Syntax der Konfigurationsdatei korrekt ist?
Führen Sie den folgenden Befehl aus:
evl anon check <Konfigurationsdatei>
evl anon check configs/sample_source.csv
Was ist mit Installationsfehlern?
In den meisten Fällen wird das Problem durch erneutes Aktualisieren und Ausführen der Installation behoben
DEB:sudo apt-get update
RPM:
sudo dnf upgrade