Herunterladen Inhalt Inhalt Diese Seite drucken

Dell PowerVault DR2000v Administratorhandbuch Seite 16

Vorschau ausblenden Andere Handbücher für PowerVault DR2000v:
Inhaltsverzeichnis

Werbung

Wenn ein Dokument mehrfach gesichert wird, bleiben die Nullen und Einsen unverändert, da die Datei lediglich
dupliziert wird. Übereinstimmungen zwischen zwei Dateien können anhand der Blockdeduplizierung einfacher
identifiziert werden, da die Sequenz der Nullen und Einsen exakt dieselbe ist. Im Gegensatz dazu sind bei Online-Daten
Unterschiede vorhanden. Online-Daten verfügen über wenige exakte Duplikate. Stattdessen enthalten Dateien mit
Online-Daten Dateien, die untereinander zahlreiche Übereinstimmungen aufweisen können. So ist ein Großteil der
Dateien, die zu dem wachsenden Speicherplatzbedarf beitragen, bereits durch ihre native Anwendung vorkomprimiert,
z. B.:
Bilder und Videos (z. B. in den Formaten JPEG, MPEG, TIFF, GIF und PNG)
Zusammengesetzte Dokumente (wie ZIP-Dateien, E-Mail, HTML, Webseiten und PDF-Dateien)
Microsoft Office-Dokumente (wie Powerpoint, MS-Word, Excel und Sharepoint)
ANMERKUNG: Das DR Series-System erreicht eine geringere Einsparungsrate, wenn die von ihm
aufgenommenen Daten bereits von der nativen Datenquelle für die Komprimierung aktiviert wurden. Es wird
daher dringend empfohlen, die von der Datenquelle verwendete Datenkomprimierung zu deaktivieren.
Optimale Einsparungen werden erzielt, wenn die Datenquelle die aufzunehmenden Daten im Rohzustand an
das DR Series-System sendet.
Die Blockdeduplizierung ist bei bereits komprimierten Dateien aufgrund der Beschaffenheit der Dateikomprimierung
weniger effizient, da sich die Nullen und Einsen der Dateien vom ursprünglichen Format unterscheiden. Die
Datendeduplizierung ist eine Sonderform der Datenkomprimierung, bei der große Mengen redundanter Daten eliminiert
werden. Dieses Komprimierungsverfahren sorgt für eine optimierte Speichernutzung und es kann bei der Übertragung
von Netzwerkdaten verwendet werden, um die Anzahl der über eine Verbindung zu sendenden Byte zu reduzieren.
Mithilfe der Deduplizierung können eindeutige Datenblöcke oder Byte-Muster identifiziert und während der Analyse
gespeichert werden. Während die Analyse andauert, werden andere Blöcke mit der gespeicherten Kopie verglichen.
Bei einer Übereinstimmung wird der redundante Block durch einen kleinen Verweis zu dem gespeicherten Block ersetzt.
Dadurch reduziert sich die Menge der zu speichernden oder zu übertragenden Daten. Die Netzwerkeinsparungen
werden durch das Replizieren von bereits deduplizierten Daten erzielt.
Im Gegensatz dazu werden bei standardmäßigen Dateikomprimierungstools kurze, wiederkehrende Unterzeichenketten
innerhalb einzelner Dateien identifiziert. Dabei sollen mithilfe der speicherbasierten Datendeduplizierung große
Datenvolumen untersucht und große Datenmengen identifiziert werden, wie z. B. komplette Dateien oder große,
identische Abschnitte innerhalb von Dateien. Anschließend ermöglicht dieser Prozess, dass das System nur eine Kopie
der jeweiligen Daten speichert. Diese Kopie kann mithilfe von Komprimierungsverfahren für einzelne Dateien zusätzlich
komprimiert werden. Angenommen, in einem E-Mail-System sind 100 oder mehr E-Mails enthalten die alle über
denselben 1-MB-Anhang verfügen. Dies würde wie folgt gehandhabt werden:
Ohne Datendeduplizierung werden jedes Mal, wenn eine Sicherung des E-Mail-Systems erstellt wird, alle 100
Instanzen des Anhangs gespeichert. Es ist also ein Speicherplatz von 100 MB erforderlich.
Mit Datendeduplizierung wird de facto nur eine Instanz des Anhangs gespeichert und alle anderen Instanzen
werden mit einem Verweis auf die gespeicherte Kopie versehen. Die Deduplizierungsrate beträgt etwa 100:1. Die
eindeutigen Datenblöcke, aus denen der Anhang besteht, werden auf Blockebene dedupliziert.
ANMERKUNG: Das DR Series-System unterstützt die Deduplizierung von verschlüsselten Daten nicht. Bei der
Aufnahme verschlüsselter Daten werden folglich keine Einsparungen durch Deduplizierung erzielt. Das DR
Series-System kann keine Daten deduplizieren, die bereits verschlüsselt sind, da es diese Daten als eindeutig
betrachtet und sie folglich nicht deduplizieren kann.
Bei Verwendung selbstverschlüsselnder Laufwerke (SEDs, Self Encrypting Drives) werden die Daten, wenn sie von der
Sicherungsanwendung gelesen werden, durch das SED oder die Verschlüsselungsschicht entschlüsselt. Das ist in etwa
so, als würden Sie ein auf einem SED gespeichertes MS-Word-Dokument öffnen. Das bedeutet, dass alle Daten, die auf
einem SED gespeichert sind, gelesen und dedupliziert werden können. Wenn Sie die Verschlüsselung in der
Sicherungssoftware aktivieren, erzielen Sie weniger Deduplizierungseinsparungen, weil das DR Series-System die
Daten bei jedem Verschlüsselungsvorgang als eindeutig betrachtet.
Replikation: Replikation ist der Prozess, bei dem dieselben wichtigen Daten unterschiedlicher Speichergeräte
gespeichert werden, mit dem Ziel, die Konsistenz zwischen redundanten Ressourcen in Datenspeicherumgebungen
16

Werbung

Inhaltsverzeichnis
loading

Inhaltsverzeichnis