Datenbank

Data Management Database DBMS Aviation IT

Glossar Datenbank – Ausführlicher Leitfaden

Datenbanken sind das Rückgrat des digitalen Zeitalters und treiben alles an – von mobilen Anwendungen und Finanztransaktionen bis hin zu komplexen Luftfahrtprozessen und KI-basierten Analysen. Dieses Glossar bietet umfassende Definitionen und Erklärungen zentraler Datenbankbegriffe, Technologien und bewährter Praktiken – unverzichtbares Wissen für IT-Fachleute, Datenarchitekten und alle, die in datengetriebenen Branchen tätig sind.

Datenbank

Eine Datenbank ist eine systematisch organisierte Sammlung von Daten, die für eine effiziente Speicherung, Abfrage, Bearbeitung und Verwaltung konzipiert ist. Daten können sein:

  • Strukturiert (organisiert in Tabellen mit Zeilen und Spalten)
  • Semi-strukturiert (wie JSON oder XML)
  • Unstrukturiert (wie E-Mails, Multimediadateien oder Freitext)

Die Kernfunktion einer Datenbank ist es, Informationen zu zentralisieren, deren Integrität sicherzustellen und sie autorisierten Nutzern oder Anwendungen zugänglich zu machen. Datenbanken sind für nahezu jedes digitale System unerlässlich – sie ermöglichen Banktransaktionen, Flugverfolgung, medizinische Aufzeichnungen und KI-Analysen. Allen modernen Datenbanken liegt ein Datenbankmanagementsystem (DBMS) zugrunde, das Interaktion, Sicherheit, Konsistenz sowie Backup- und Wiederherstellungsprozesse unterstützt.

Datenbankmanagementsystem (DBMS)

Ein Datenbankmanagementsystem (DBMS) ist spezialisierte Software zur Verwaltung von Datenbanken. Es bietet Werkzeuge für:

  • Definition, Erstellung und Änderung von Datenbankstrukturen
  • Abfrage, Aktualisierung und Administration von Daten
  • Sicherstellung von Konsistenz, Sicherheit und Integrität der Daten
  • Unterstützung von Mehrfachzugriff, Backup und Wiederherstellung

SQL-basierte DBMS (Oracle, MySQL, SQL Server) dominieren das Management strukturierter Daten, während NoSQL-DBMS (MongoDB, Cassandra, Redis) unstrukturierte oder sich schnell ändernde Daten verwalten.

Schema

Ein Schema definiert die Struktur und Organisation der Daten innerhalb einer Datenbank. Es legt fest:

  • Tabellen, Felder (Spalten) und Datentypen
  • Einschränkungen (wie Primär-/Fremdschlüssel)
  • Beziehungen zwischen den Daten

Schemata dienen als Blaupause für Speicherung und Abfrage von Daten. Relationale Datenbanken nutzen starre Schemata zur Sicherung der Datenintegrität, während NoSQL-Systeme mehr Flexibilität bieten.

Strukturierte Daten

Strukturierte Daten folgen einem vordefinierten Modell – typischerweise organisiert in Tabellen mit Zeilen und Spalten. Sie sind einfach durchsuchbar und analysierbar und eignen sich perfekt für operative Systeme wie Flugpläne oder Wartungsprotokolle.

Unstrukturierte Daten

Unstrukturierte Daten folgen keinem vordefinierten Modell. Beispiele sind Dokumente, E-Mails, Bilder, Audio- und Videodateien. Zur Verwaltung unstrukturierter Daten sind spezielle Techniken und Datenbanken (wie Dokumenten- oder Objektspeicher) erforderlich.

Semi-strukturierte Daten

Semi-strukturierte Daten liegen zwischen strukturiert und unstrukturiert. Formate wie JSON, XML und YAML enthalten Tags oder Marker, die das Parsen und Abfragen ermöglichen, während sie eine flexible und sich entwickelnde Datenrepräsentation erlauben.

Tabelle

Eine Tabelle ist eine logische Struktur in einer Datenbank, bestehend aus Zeilen (Datensätzen) und Spalten (Feldern). Jede Tabelle stellt eine Entität dar (z. B. Flüge, Flugzeuge) und unterstützt die Datenorganisation und -beziehungen.

Zeile (Datensatz)

Eine Zeile (oder Datensatz) ist ein einzelnes Datenobjekt in einer Tabelle und enthält Werte für jedes Feld. Zeilen sind eindeutig identifizierbar, meist über einen Primärschlüssel.

Spalte (Feld)

Eine Spalte (oder Feld) ist ein Attribut der Daten, definiert durch Name und Datentyp. Spalten sorgen für einheitliche Datenformate und unterstützen effiziente Abfragen.

Primärschlüssel

Ein Primärschlüssel ist eine Spalte oder eine Kombination von Spalten, die jeden Datensatz in einer Tabelle eindeutig identifiziert und Datenkonsistenz und -integrität sicherstellt.

Fremdschlüssel

Ein Fremdschlüssel ist ein Feld in einer Tabelle, das auf den Primärschlüssel einer anderen Tabelle verweist und Beziehungen sowie referenzielle Integrität gewährleistet.

Abfrage

Eine Abfrage ist eine formale Anforderung zur Datenabfrage, Einfügung, Aktualisierung oder Löschung. Abfragen werden meist in SQL verfasst oder – bei NoSQL-Datenbanken – mit proprietären APIs/Formatierungen umgesetzt.

Structured Query Language (SQL)

SQL ist die Standard-Abfragesprache zur Verwaltung und Bearbeitung relationaler Datenbanken. Sie unterstützt Definition, Manipulation und Kontrolle von Daten und ermöglicht komplexe Verknüpfungen, Aggregationen und Transaktionssteuerung.

ACID-Eigenschaften

ACID steht für Atomicity (Atomarität), Consistency (Konsistenz), Isolation und Durability (Dauerhaftigkeit). Diese Eigenschaften sichern zuverlässige Datenbanktransaktionen – unerlässlich für Finanzwesen, Betrieb und regulatorische Anforderungen.

Datenintegrität

Datenintegrität gewährleistet Genauigkeit, Konsistenz und Zuverlässigkeit während des gesamten Datenlebenszyklus – durch Einschränkungen, Validierungsregeln und transaktionale Steuerungen.

Mehrbenutzersteuerung (Concurrency Control)

Mehrbenutzersteuerung verwaltet den gleichzeitigen Zugriff mehrerer Nutzer oder Anwendungen auf die Datenbank – mittels Sperrverfahren, Zeitstempeln und Multiversionskontrolle, um Konflikte zu vermeiden.

Datensicherung und Wiederherstellung

Datensicherung ist das Erstellen von Sicherungskopien der Datenbankinhalte zur Vermeidung von Datenverlust. Wiederherstellung bezeichnet das Zurückspielen von Daten aus Sicherungen nach Störungen und gewährleistet die Geschäftskontinuität.

Relationales Datenbankmanagementsystem (RDBMS)

Ein RDBMS organisiert Daten in Tabellen mit vordefinierten Schemata und verwendet Schlüssel für Beziehungen und Einschränkungen. Beispiele: Oracle, MySQL, PostgreSQL, SQL Server.

NoSQL-Datenbank

NoSQL-Datenbanken bieten flexible, skalierbare Datenspeicherung in verschiedenen Modellen:

  • Dokumentenspeicher (z. B. MongoDB)
  • Key-Value-Stores (z. B. Redis)
  • Wide-Column-Stores (z. B. Cassandra)
  • Graphdatenbanken (z. B. Neo4j)

NoSQL ist ideal für große, unstrukturierte oder sich schnell verändernde Datensätze.

Dokumentenspeicher

Ein Dokumentenspeicher (wie MongoDB) speichert Daten als Dokumente (JSON, BSON) und unterstützt flexible, verschachtelte Strukturen sowie sich entwickelnde Schemata.

Key-Value-Store

Ein Key-Value-Store (wie Redis) speichert Elemente als Schlüssel-Wert-Paare und eignet sich besonders für schnelle Lese-/Schreiboperationen und einfaches Caching oder Session-Management.

Wide-Column-Store

Ein Wide-Column-Store (wie Cassandra) speichert Daten in Tabellen mit variabler Spaltenanzahl je Zeile und ist für Zeitreihen- oder Sensordaten optimiert.

Graphdatenbank

Eine Graphdatenbank modelliert Daten als Knoten und Kanten – ideal für komplexe Beziehungen wie Routenoptimierung oder Ressourcenabhängigkeiten.

Objektorientierte Datenbank (OODBMS)

Eine OODBMS speichert Daten als Objekte, entspricht der objektorientierten Programmierung und unterstützt komplexe Datentypen, Vererbung und Beziehungen.

Hierarchische Datenbank

Eine hierarchische Datenbank organisiert Daten in einer Baumstruktur und eignet sich für Anwendungen mit klaren Eins-zu-Viele-Beziehungen.

Netzwerkdatenbank

Eine Netzwerkdatenbank erweitert das hierarchische Modell um mehrere Eltern-Kind-Beziehungen für komplex vernetzte Daten.

Flat-File-Datenbank

Eine Flat-File-Datenbank speichert Daten als einzelne Tabelle oder Textdatei und wird oft für kleine Anwendungen, Konfigurationen oder Datenaustausch genutzt.

Multimodell-Datenbank

Eine Multimodell-Datenbank (wie ArangoDB) unterstützt mehrere Datenmodelle (Dokument, Graph, Key-Value) in einem System und ermöglicht verschiedene Anforderungen.

Vektor-Datenbank

Eine Vektor-Datenbank (wie Pinecone, Milvus) speichert hochdimensionale Vektoreinbettungen für Ähnlichkeitssuche – essenziell für KI/ML und semantische Anwendungen.

In-Memory-Datenbank

Eine In-Memory-Datenbank (wie Redis, SAP HANA) speichert Daten im RAM und ermöglicht extrem schnelle Lese-/Schreibzugriffe für Echtzeitanalysen oder Transaktionslasten.

Verteilte Datenbank

Eine verteilte Datenbank verteilt Daten auf mehrere Standorte oder Knoten für hohe Verfügbarkeit, Fehlertoleranz und Skalierbarkeit – wichtig für globale Anwendungen.

Cloud-Datenbank

Eine Cloud-Datenbank wird auf Cloud-Infrastruktur gehostet (oft als Database-as-a-Service, DBaaS) und bietet bedarfsgerechte Skalierung, automatisierte Backups und weniger Betriebsaufwand.

Blockchain-Datenbank

Eine Blockchain-Datenbank nutzt dezentral gespeicherte, kryptografisch verkettete Einträge (Blöcke) für manipulationssichere, unveränderliche Speicherung – unterstützt digitales Vertrauen und Rückverfolgbarkeit.

Data Warehouse

Ein Data Warehouse ist ein zentrales Repository zur analytischen Verarbeitung, das strukturierte Daten aus verschiedenen Quellen für Business Intelligence und Reporting aggregiert.

Data Lake

Ein Data Lake speichert große Mengen an Rohdaten in beliebigen Formaten und ermöglicht flexible Analysen, KI/ML und explorative Datenwissenschaft.

Data Mart

Ein Data Mart ist ein fokussierter Teil eines Data Warehouse und unterstützt bestimmte Geschäftsbereiche oder Funktionen mit gezielter Analyse und Berichterstattung.

OLAP (Online Analytical Processing)

OLAP-Technologien ermöglichen multidimensionale Analysen von Warehouse-Daten und unterstützen komplexe Abfragen, Aggregationen und Drilldown-Operationen.

OLTP (Online Transaction Processing)

OLTP-Systeme verarbeiten große Mengen transaktionaler Operationen mit hoher Parallelität und Datenintegrität – für Buchung, Planung und Echtzeit-Updates.

Index

Ein Index ist eine Datenbankstruktur, die die Abfragegeschwindigkeit erhöht und schnelle Zugriffspfade auf in Tabellen oder Sammlungen gespeicherte Daten bereitstellt.

Datenbanken sind das Fundament jeder modernen Organisation und ermöglichen sichere, genaue und zugängliche Informationsverwaltung. Ob Sie Transaktionssysteme, Analyseplattformen oder KI-gestützte Anwendungen entwickeln: Das Verständnis der Datenbankgrundlagen ist der Schlüssel zum Erfolg in der heutigen datengetriebenen Welt.

Häufig gestellte Fragen

Was ist eine Datenbank?

Eine Datenbank ist eine organisierte Sammlung von Daten, die elektronisch gespeichert und abgerufen wird und für eine effiziente Speicherung, Abfrage und Verwaltung konzipiert ist. Datenbanken können strukturierte, semi-strukturierte oder unstrukturierte Daten speichern und werden von Datenbankmanagementsystemen (DBMS) verwaltet, um Datenintegrität, Sicherheit und Verfügbarkeit zu gewährleisten.

Was ist ein Datenbankmanagementsystem (DBMS)?

Ein DBMS ist spezialisierte Software, die mit Benutzern, Anwendungen und der Datenbank selbst interagiert, um Daten zu verwalten und zu organisieren. Es bietet Werkzeuge, um Datenbanken zu definieren, zu erstellen, abzufragen, zu aktualisieren und zu administrieren und unterstützt Funktionen wie Transaktionsverarbeitung, Sicherheit, Sicherung und Wiederherstellung.

Was sind strukturierte Daten?

Strukturierte Daten sind Informationen, die nach einem vordefinierten Schema organisiert sind, meist in Tabellen mit Zeilen und Spalten. Sie sind leicht durchsuchbar und analysierbar mit Abfragesprachen wie SQL. Beispiele sind Flugpläne, Passagierlisten und Wartungsaufzeichnungen.

Was sind unstrukturierte Daten?

Unstrukturierte Daten entsprechen keinen klassischen Schemata oder Tabellen. Beispiele sind Textdokumente, E-Mails, Bilder, Audio- und Videodateien. Das Management unstrukturierter Daten erfordert spezielle Werkzeuge und Datenbanken wie Dokumentenspeicher oder Objektspeicherlösungen.

Was ist der Unterschied zwischen SQL- und NoSQL-Datenbanken?

SQL-Datenbanken sind relational, verwenden strukturierte Schemata und speichern Daten in Tabellen. Sie eignen sich ideal für strukturierte Daten und komplexe Abfragen. NoSQL-Datenbanken sind nicht-relational, bieten flexible Schemata und unterstützen verschiedene Datenmodelle (Dokument, Key-Value, Wide-Column, Graph), was sie für große, sich verändernde oder unstrukturierte Datensätze prädestiniert.

Was sind ACID-Eigenschaften?

ACID steht für Atomicity (Atomarität), Consistency (Konsistenz), Isolation und Durability (Dauerhaftigkeit) – vier wesentliche Eigenschaften, die eine verlässliche Verarbeitung von Datenbanktransaktionen sicherstellen. Diese Eigenschaften garantieren, dass Transaktionen vollständig abgeschlossen werden, Daten konsistent bleiben, sich Operationen nicht gegenseitig beeinflussen und bestätigte Daten auch nach Ausfällen erhalten bleiben.

Wie wird die Datenintegrität in einer Datenbank sichergestellt?

Die Datenintegrität wird durch Einschränkungen (wie Primär- und Fremdschlüssel), Validierungsregeln und transaktionale Steuerungen gewährleistet. Diese Mechanismen verhindern Fehler, Duplikate und unbefugte Änderungen und stellen so die Genauigkeit und Zuverlässigkeit der gespeicherten Informationen während ihres gesamten Lebenszyklus sicher.

Was ist ein Data Warehouse und wie unterscheidet es sich von einem Data Lake?

Ein Data Warehouse ist ein zentralisiertes Repository zur analytischen Verarbeitung von bereinigten und strukturierten Daten und unterstützt Business Intelligence und Reporting. Ein Data Lake hingegen speichert große Mengen an Rohdaten in verschiedenen Formaten (strukturiert, semi-strukturiert, unstrukturiert) für künftige Analysen oder KI/ML-Anwendungsfälle.

Warum sind Datenbanken in der Luftfahrt wichtig?

Datenbanken sind in der Luftfahrt entscheidend für das Management betrieblicher Daten wie Flugpläne, Crew-Einsätze, Wartungsaufzeichnungen und Compliance-Informationen. Sie gewährleisten Datenkorrektheit, Echtzeitzugriff, regulatorische Einhaltung und unterstützen das Sicherheitsmanagement sowie die Entscheidungsfindung in der gesamten Branche.

Entfesseln Sie die Kraft Ihrer Daten

Optimieren Sie die Abläufe Ihres Unternehmens mit robusten, sicheren und skalierbaren Datenbanklösungen. Unsere Experten helfen, die Datenspeicherung zu optimieren, Compliance sicherzustellen und fortschrittliche Analysen branchenspezifisch zu unterstützen.

Mehr erfahren

Basisdaten

Basisdaten

Basisdaten beziehen sich auf die anfängliche Menge quantitativer oder qualitativer Messungen, die vor der Umsetzung einer Veränderung erhoben werden und als Ref...

7 Min. Lesezeit
Aviation Safety Management +3
Datenmanagement

Datenmanagement

Datenmanagement ist die systematische Praxis des Sammelns, Speicherns, Organisierens, Sicherens und Nutzens von Daten. Es stellt sicher, dass Daten während ihre...

5 Min. Lesezeit
Data governance Cloud storage +3
Datenerfassung

Datenerfassung

Datenerfassung ist der systematische Prozess des Sammelns von Informationen aus definierten Quellen zur Analyse, Interpretation und Entscheidungsfindung. Sie is...

5 Min. Lesezeit
Data Management Aviation +3