OCZ hat ein neues Whitepaper von Scott Harlin veröffentlicht, welches sich auf die Unterstützung von Big-Data-Anwendungen mit SSDs fokussiert. Dieser erste Teil des Whitepapers konzentriert sich auf die Möglichkeiten, die Big Data Storage bietet und zeigt wie gewohnt Fallbeispiele, Analysen der Technologie und die Vorteile flash-basierter SSDs für derartige Anwendungen auf.
Während flash-basierter Solid-State-Drive-Speicher auf dem Enterprise-Markt bereits gut etabliert ist, gibt es auch auf dem Gebiet der Big Data einige Vorteile, die durch die Verwendung von SSDs entstehen könnten. Hinter Big Data verstecken sich große Mengen von sowohl strukturierten als auch unstrukturierten Daten, die häufig zu groß sind um von herkömmlichen Software-Techniken gehandhabt zu werden. Schnell liegen die Datenmengen im Bereich von Terabytes oder gar Petabytes. Big Data bezieht sich dabei auf keine spezifische Größe sondern gibt viel mehr an, welche Menge von Daten erstellt und gehandhabt werden.
Die Möglichkeit große Datenmengen verschiedener Typen und Herkünfte auszuwerten erlaubt es Firmen bislang unbekannte Muster und Korrelationen aufzudecken, die jeweils zu besseren Business-Entscheidungen beitragen können und somit Vorteile im Wettbewerb bereithalten.
Im ersten Teil des Whitepapers werden die Schlüsselkonzepte sowie diverse
Charakteristika rund um das Thema Big Data angesprochen und analysiert. Außerdem wird aufgezeigt, wie flash-basierte Solid-State-Speicher ins Big Data-Modell passen. Der zweite Teil hingegen wird eine Übersicht zu OCZs Enterprise-SSDs und –Software-Lösungen gegeben, die den Anforderungen von Big Data-Anwendungen gerecht werden und eine ultra-schnelle Datenverarbeitung erlauben.
Nach Marktforschungsdaten von IDC,
handelt es sich bei Big Data um einen
schnell wachsenden Markt, der bereits heute
mehrere Milliarden US-Dollar schwer ist.
Dieser Trend wird sich in den nächsten fünf
Jahren weiter fortziehen. Nach IDC kann Big Data in drei Segmente unterteilt werden: Infrastruktur, worin externe Speichersysteme, wie beispielsweise
OCZ SSDs, Serverkomponenten, Netzwerk-Infrastrukturen in Rechenzentren
und Cloud-Service-Infrastrukturen enthalten sind, Software, bestehend aus Informationsverwaltungssoftware, Analysesoftware und spezifischen Anwendungsprogramme für Big
Data, und letztlich Services, wozu Unternehmensberatung, Integrationsservice,
Speicherservice, Sicherheitsservice, Hardware- und Softwaresupport, Training, Outsourcing sowie jegliche Dienstleistungen im Zusammenhang mit Big Data-Implementierungen gehört.
Zum Verständnis von Big Data ist es wichtig die Begriffe Unstructured Data und Multi-Structured Data zu definieren. Erstere können dabei häufig nicht ohne Probleme mit herkömmlichen Datenbanken interpretiert werden, während die multistrukturierten Daten eine Vielfalt an Datenformaten und
Datentypen umfassen, die üblicherweise aus der Interaktion von Personen oder
Computersystemen resultieren. Diese Daten beinhalten variable Muster und Informationen, die in der Vergangenheit unentdeckt blieben, da der damit verbundene Zeit- und Kostenaufwand für die Analyse in keinem Verhältnis stand. In den Rechenzentren von heute ist Big Data bereits Realität. Es gibt nun auch kosteneffiziente Ansätze, mit denen man die diversen Herausforderungen von Big Data in den Griff bekommt. Dabei handelt es sich um die folgenden drei Begriffe: Volume, Variabilität und Geschwindigkeit.
Big Data ist kein Phänomen spezifischer Sektoren, sondern kann im privaten Sektor, Regierungssektor sowie in der Wissenschaft und Forschung vorgefunden werden. Beispiele dafür finden sich in Facebook, Walmart, Amazon, der Big Data Research and Development Initiative, die von der Obama-Administration im Jahre 2012 gestartet wurde, oder der National Security Agency (NSA), welche Data-Center entwickelt um die riesige Menge an gesammelten Daten zu handhaben.
Die Vorteile von flash-basiertem Speicher sind in einem Bereich wie Big Data offensichtlich und versprechen ein signifikantes Return of Investment (ROI). Da Big-Data-Applikationen sowohl lese- als auch schreib-intensive Workloads erzeugen wird eine niedrige Latenz und eine hohe Input/Output-Operations-Per-Second-Performance (IOPS) benötigt, was die Enterprise-Class-SSDs in die engere Wahl stellen sollte.
Für weitere Informationen zum Thema Big Data Applications und den Vorteilen von flash-basierten SSDs für diesen Bereich, kann das Whitepaper weiter unten in seiner Gänze heruntergeladen werden.
Quelle:
OCZ.com.