Quick Start Guide

EVL-Anonymisierungsstudie
Installations- und Konfigurationshandbuch Überblick

Overview

Die EVL-Anonymisierung dient dem Schutz / der Anonymisierung von Geschäftsdaten und personenbezogenen Daten. Es ist Teil der EVL-Datentool-Familie und eignet sich für umfangreiche Datenworkflows. Die EVL-Anonymisierung verwendet Konfigurationsdateien im Tabellenkalkulationsstil, um so auf einfache Weise reguläre EVL-Jobs zu erstellen, damit können die Daten sofort verarbeitet, als geplante Jobs ausgeführt oder in größere Datenworkflows integriert werden.

In diesem Handbuch wird Folgendes beschrieben: Installation der EVL-Anonymisierung, Erstellen eines Beispielprojekts, Generieren von EVL-Jobs und schließlich Anonymisieren von Beispieldaten.

Installation

Linux - RPM

Betriebssysteme der Red Hat-Familie: Fedora, CentOS, Red Hat, Oracle Linux usw. Installieren der EVL-Anonymisierung

Für CentOS 8 installieren Sie die erforderlichen Pakete von powertools repo:

sudo dnf -y install dnf-plugins-core
sudo dnf config-manager --set-enabled powertools
sudo dnf install --enablerepo=powertools snappy-devel
  1. sudo dnf install evl-anonymization-trial-1.1-2.static.x86_64.rpm
  2. /opt/EVL-Anonymization-1.1/bin/evl init

Linux - DEB

Debian-basierte Betriebssysteme: Ubuntu, Debian usw.

Holen Sie sich das Paket für Ihr Betriebssystem von https://www.evltool.com/downloads und

tar xvf evl-data-anonymization-trial.*.rpm.tar
sudo dnf install ./evl-common-2.5*.x86_64.rpm
sudo dnf install ./evl-core-2.5*.x86_64.rpm
sudo dnf install ./evl-data-anonymization-2.5*.x86_64.rpm

Initiieren Sie dann die Installation für den aktuellen Benutzer:

/opt/EVL-2.5/bin/evl init

MS Windows - Ubuntu

Die EVL-Tool-Anonymisierung hat keine native Distribution für Microsoft Windows, sondern wird auf Windows-Installationen mit Microsoft WSL (Windows Subsystem for Linux) ausgeführt. Obwohl die Anonymisierung unter WSL ausgeführt wird, können alle Daten und Konfigurationsdateien mit typischen Windows-Tools wie Datei-Explorer, Excel usw. abgerufen und bearbeitet werden.

Installieren Sie die WSL und aktivieren Sie diese im System. Installieren Sie dann Ubuntu 18.04 aus dem Microsoft Store. Auf dieser Webseite finden Sie detaillierte Anweisungen zu WSL und Ubuntu:

https://www.windowscentral.com/install-windows-subsystem-linux-windows-10

Befolgen Sie nach Abschluss die Installationsanweisungen für Linux (DEB)

Beispiel

In diesem Beispiel werden die Daten von zwei CSV-Dateien (Adressen.csv, Kunden.csv) gemäß der in sample_source.csv angegebenen Konfiguration anonymisiert.

Erstellen und Ausführen eines Beispielprojekts

Erstellen Sie ein Beispielprojekt mit einem integrierten Befehl evl

evl anon project sample anon-sample
cd anon-sample

Generieren Sie Anonymisierungsjobs aus der Konfigurationsdatei

evl anon build configs/sample_source.csv

Run the anonoimization jobs that were generated.

evl run/anon/sample_source.addresses.evl
evl run/anon/sample_source.customers.evl

Verzeichnisaufbau

Verwenden Sie den Befehl Tree, um eine hierarchische Liste der Verzeichnisse abzurufen. Die meisten Verzeichnisse enthalten interne Funktionen der Anonymisierungssoftware. Ändern Sie Folgendes, um das Verhalten der Anonymisierung zu testen:

  • Konfigurationsdatei sample_source.csv im Verzeichnis configs
  • die Datendateien address.csv und customers.csv im Verzeichnis data / source

Anonymisierungsfunktionen konfigurieren

Versuchen Sie, einzelne Anonymisierungsfunktionen zu bearbeiten:

  • In der Datei anon-sample /configs/sample/source.csv und ändern Sie die Werte in der Spalte anon_type oder evl_value. Zur Vereinfachung können Sie die Option verwenden, um die Konfigurationsdatei in Excel mit der implementierten Liste der Werte zu bearbeiten.
  • Sobald Sie fertig sind, generieren Sie neue Jobs:
    evl anon build configs/sample_source.csv
  • Führen Sie die neu generierten Anonymisierungsjobs aus
    evl run/anon/sample_source.addresses.evl
    evl run/anon/sample_source.customers.evl
  • Überprüfen Sie die Änderungen in den anonymisierten Dateien address.csv und customers.csv im Verzeichnis data / source / anon

Erstellen Sie Ihr eigenes Projekt

Verwenden Sie den Befehl EVL, um ein neues Projekt zu erstellen. Ersetzen Sie Ihren eigenen Projektnamen durch <Projekt>. Ein neues Verzeichnis mit diesem Namen wird erstellt

evl anon project new <projekt>

Wechseln Sie in den neuen Projektordner und erstellen Sie Verzeichnisse für ein Anonymisierungsprojekt

cd <projekt>
mkdir data/source
mkdir data/anon

Kopieren Sie Ihre Datenquellendateien in <Projekt> /data/source. Um das Einstellen spezieller Parameter zu vermeiden, sollten die Dateien folgende Funktionen haben:

  • suffix: csv
  • Überschriften in der ersten Zeile
  • Trennzeichen ";"

Generieren Sie die Standardkonfigurationsdatei

evl anon source new <projekt> --guess-from-csv data/source

Führen Sie eine Syntaxprüfung der Konfigurationsdatei durch

evl anon check configs/<projekt>.csv

Generieren Sie Anonymisierungsjobs

evl anon build configs/<projekt>.csv

Führen Sie Anonymisierungsjobs aus

evl run/anon/<evljob> wobei <evljob> der Name der Datei mit dem im Verzeichnis run/anon generierten Suffix evl ist

FAQ

Wie stelle ich Parameter beim Bearbeiten von Daten in Windows-Umgebungen ein?

CSV-Dateien für die Konfiguration von Spaltentrennzeichen können mit der Variablen EVL_CONFIG_FIELD_SEPARATOR, anonymen Daten für Spaltentrennzeichen und der Variablen EVL_DEFAULT_FIELD_SEPARATOR festgelegt werden. Starttrennzeichen sind Semikolons.

ür Windows-Zeilenumbrüche können Sie dann die Variable EVL_ANON_EOL = "dos" setzen. Alle diese Variablen können in der Konfigurationsdatei project.sh festgelegt werden

Wie deinstalliere ich EVL Anonymization?

DEB: sudo apt remove evl-data-anonymization evl-common evl-core
RPM: sudo dnf remove evl-data-anonymization evl-common evl-core

Das Standardverhalten besteht darin, Ausgabedateien anzuhängen, anstatt neue Dateien zu erstellen. Wie ändere ich das?

Fügen Sie in der Datei project.sh die Zeile EVL_ANON_APPEND = 1 zu EVL_ANON_APPEND = 0 hinzu oder ändern Sie sie, um das Verhalten projektweit zu ändern. Nehmen Sie die Bearbeitung in einer beliebigen anon / <Jobname> .sh-Datei vor, um das Verhalten für bestimmte Jobs zu ändern.

Wie arbeite ich richtig mit Windows-Zeilenumbrüchen?

Standardmäßig werden Linux-Zeilenumbrüche für Eingabedateien angenommen, dh "\n". Das Setzen von EVL_ANON_EOL = "dos" kann auf Windows-Zeilenumbrüche, dh "\r\n", in der Datei configs anon. *. Sh oder in project.sh festgelegt werden.

Wie überprüfe ich, ob die Syntax der Konfigurationsdatei korrekt ist?

Führen Sie den folgenden Befehl aus:

evl anon check <Konfigurationsdatei>
evl anon check configs/sample_source.csv

Was ist mit Installationsfehlern?

In den meisten Fällen wird das Problem durch erneutes Aktualisieren und Ausführen der Installation behoben

DEB: sudo apt-get update
RPM: sudo dnf upgrade