Wie es um die Datenbanklandschaft bestellt ist

Der Branchenbericht 2024 von Redgate umfasst Daten aus sämtlichen Wirtschaftszweigen und Unternehmensgrößen, von Entwicklern, DBAs und Softwarelieferanten bis hin zu IT-Führungskräften, CTOs und CEOs in aller Welt.

Methodology

  • 3849 Teilnehmer
  • 6 Kontinente
  • 15 Branchen

View this page on desktop for the full experience.

Datenbankplattformen

Das exponentielle Datenwachstum im digitalen Zeitalter

Daten und deren Management sind im Wandel begriffen. Die schiere Menge überfordert traditionelle Datenmanagement-Ansätze. So wie sich die Unternehmen entwickeln, so entwickeln sich auch ihre Datenbedürfnisse, was auf einen Trend zur Anpassungsfähigkeit angesichts eines ausgefeilten und wachsenden Datenökosystems hindeutet. In den Jahren nach 2020 hat sich ein bemerkenswerter Wandel vollzogen, indem Unternehmen zunehmend mehrere Datenbankplattformen nutzen, um ihre individuellen Anforderungen zu erfüllen.

Methodology

Unternehmen setzen auf mehrere Datenbankplattformen

So wie sich der Datenbedarf ändert, so ändert sich auch die Infrastruktur, wobei die Mehrheit der Unternehmen zur Erfüllung der Anforderungen verschiedene Datenbankplattformen benötigt. Unsere Daten aus dem Jahr 2020 zeigen einen stetigen Anstieg der Unternehmen, die zwei oder mehr Datenbankplattformen nutzen (von 62% auf 79% im Jahr 2024), wobei die führenden vier SQL Server, Oracle, MySQL und Postgres sind.

Number of database platforms

2020
  • 1 only (38%)
  • 2 or more (62%)
2021
  • 1 only (30%)
  • 2 or more (70%)
2022
  • 1 only (21%)
  • 2 or more (79%)

Erforschung der Vielfalt an Datenbankplattformen

Das Spektrum der heute eingesetzten Datenbanken geht weit über die traditionellen 'Big Four' - SQL Server, MySQL, PostgreSQL und Oracle - hinaus. Die Nutzung mehrerer Datenbankplattformen ist heute zwar üblicher, doch bei der Betrachtung der Anzahl der aktiv genutzten Instanzen zeigt sich ein deutliches Muster. Die „Big Four“-Datenbanken behalten ihre Vormachtstellung, vor allem wenn die Anzahl der Instanzen 10 übersteigt und insbesondere bei 20 Instanzen oder mehr.

Überraschenderweise ist Microsoft Access, trotz seines geringeren Entwicklungsstandes, seit über 25 Jahren auf dem Markt und bleibt die am häufigsten verwendete Desktop-, Team- und SMB- Datenbank. Für die Wahl einer Datenbankplattform sprechen eine ganze Reihe von Gründen, aber die drei wichtigsten Anforderungen sind: Genauigkeit, Benutzerfreundlichkeit und Kosten.

Database platforms used, and number of instances

SQL Server
  • 1 (402)
  • 2-5 (580)
  • 5-10 (508)
  • 10-20 (184)
  • 20+ (581)
MySQL
  • 1 (481)
  • 2-5 (621)
  • 5-10 (420)
  • 10-20 (69)
  • 20+ (94)
PostgreSQL
  • 1 (437)
  • 2-5 (551)
  • 5-10 (411)
  • 10-20 (50)
  • 20+ (102)
Oracle
  • 1 (407)
  • 2-5 (453)
  • 5-10 (376)
  • 10-20 (71)
  • 20+ (156)
MondoDB
  • 1 (340)
  • 2-5 (456)
  • 5-10 (342)
  • 10-20 (46)
  • 20+ (40)
Microsoft Access
  • 1 (346)
  • 2-5 (388)
  • 5-10 (320)
  • 10-20 (51)
  • 20+ (95)
Redis
  • 1 (318)
  • 2-5 (364)
  • 5-10 (322)
  • 10-20 (50)
  • 20+ (40)
ElasticSearch
  • 1 (298)
  • 2-5 (399)
  • 5-10 (320)
  • 10-20 (41)
  • 20+ (33)
SQLite
  • 1 (305)
  • 2-5 (372)
  • 5-10 (308)
  • 10-20 (40)
  • 20+ (34)
MariaDB
  • 1 (307)
  • 2-5 (370)
  • 5-10 (288)
  • 10-20 (33)
  • 20+ (27)
IBMDB2
  • 1 (305)
  • 2-5 (315)
  • 5-10 (306)
  • 10-20 (33)
  • 20+ (38)
Aurora
  • 1 (303)
  • 2-5 (299)
  • 5-10 (300)
  • 10-20 (26)
  • 20+ (36)
Cassandra
  • 1 (301)
  • 2-5 (325)
  • 5-10 (246)
  • 10-20 (33)
  • 20+ (26)
Neo4
  • 1 (277)
  • 2-5 (305)
  • 5-10 (281)
  • 10-20 (22)
  • 20+ (11)
AlloyDB
  • 1 (261)
  • 2-5 (305)
  • 5-10 (272)
  • 10-20 (11)
  • 20+ (6)

Trends bei der Implementierung von Datenbanken und Legacy-Datenbanken

Die Bandbreite an verwendeten Datenbankplattformen sagt bereits viel aus, doch auch die jeweilige Nutzungsdauer ist ein bedeuntender Faktor. Die traditionellen 'Big Four' - SQL Server, MySQL, PostgreSQL und Oracle - sind die am längsten im Einsatz befindlichen Datenbanken, zusammen mit IBM DB2 und Microsoft Access.

Sie ziehen zwar weiterhin neue Benutzer an, wobei insbesondere PostgreSQL sehr beliebt ist, aber andere Datenbanken wie Cassandra, MongoDB, ElasticSearch und Aurora schließen schnell auf.

Da IT-Abteilungen angesichts unterschiedlicher und immer komplexerer Daten nach der besten Datenbankplattform für bestimmte Anwendungsfälle suchen, sind sie jetzt viel eher bereit, über ihre alte Datenbankplattform hinauszugehen. PostgreSQL und MySQL für relationale Daten und NoSQL-Alternativen wie Cassandara und MongoDB, wenn es sich um halbstrukturierte oder unstrukturierte Daten handelt.

How long have organizations been using their current database platforms

SQL Server
  • Under 12 months (61)
  • 1-2 years (109)
  • 3-5 years (128)
  • 5+ years (2325)
MySQL
  • Under 12 months (93)
  • 1-2 years (163)
  • 3-5 years (242)
  • 5+ years (1124)
PostgreSQL
  • Under 12 months (131)
  • 1-2 years (223)
  • 3-5 years (231)
  • 5+ years (965)
IBMDB2
  • Under 12 months (26)
  • 1-2 years (39)
  • 3-5 years (49)
  • 5+ years (811)
Oracle
  • Under 12 months (51)
  • 1-2 years (77)
  • 3-5 years (824)
  • 5+ years (455)
Microsoft Access
  • Under 12 months (50)
  • 1-2 years (60)
  • 3-5 years (737)
  • 5+ years (347)
SQLite
  • Under 12 months (44)
  • 1-2 years (70)
  • 3-5 years (805)
  • 5+ years (103)
MongoDB
  • Under 12 months (72)
  • 1-2 years (126)
  • 3-5 years (880)
  • 5+ years (90)
Redis
  • Under 12 months (39)
  • 1-2 years (78)
  • 3-5 years (847)
  • 5+ years (89)
ElasticSearch
  • Under 12 months (41)
  • 1-2 years (80)
  • 3-5 years (809)
  • 5+ years (73)
MariaDB
  • Under 12 months (39)
  • 1-2 years (59)
  • 3-5 years (772)
  • 5+ years (72)
Cassandra
  • Under 12 months (261)
  • 1-2 years (246)
  • 3-5 years (279)
  • 5+ years (47)
Aurora
  • Under 12 months (34)
  • 1-2 years (73)
  • 3-5 years (729)
  • 5+ years (36)
Neo4
  • Under 12 months (28)
  • 1-2 years (42)
  • 3-5 years (714)
  • 5+ years (23)
AlloyDB
  • Under 12 months (23)
  • 1-2 years (23)
  • 3-5 years (719)
  • 5+ years (17)

Leistung über die verschiedenen Datentypen hinweg

Traditionell handelt es sich bei der Art der in Datenbanken gespeicherten Daten häufig um strukturierte Daten. Mit dem Aufkommen von Big Data und der zunehmenden Vielfalt an Datenquellen hat sich jedoch eine Verlagerung hin zur Einbeziehung halbstrukturierter und unstrukturierter Daten in Datenbanken vollzogen, was den Einsatz verschiedener Datenbanktypen und ‑plattformen zur effektiven Verwaltung und Analyse dieser unterschiedlichen Datenformate
erfordert.

Erwartungsgemäß sind SQL Server, Oracle, MySQL und PostgreSQL die bevorzugten Datenbanken für die Speicherung relationaler Daten.

Für semi-strukturierte Daten treten Open-Source-Datenbanken wie MongoDB, Redis, PostgreSQL und ElasticSearch in Erscheinung. SQL Server steht jedoch auch in dieser Kategorie an erster Stelle. Diese Art von Daten wird in der Regel dort verwendet, wo Variabilität in der Datenstruktur erwartet wird.

Bei unstrukturierten Daten erwies sich MongoDB als die beliebteste Lösung. MongoDB ermöglicht es Entwicklern, Daten ohne vordefinierte Struktur zu speichern und zu verwalten und eignet sich daher besonders für Anwendungen mit sich entwickelnden oder dynamischen Datenmodellen.

Bei Geodaten und Graphen dominieren NoSQL-Datenbanken, abgesehen von IBM DB2, das dank seiner DB2 Spatial Extender und Db2 Graph-Funktionen ein starker Konkurrent bleibt.

Kinds of data stored

PostgreSQL
  • Relational data (660)
  • Unstructured data (300)
  • Semi-structured data (416)
  • Time-series data (258)
  • Geospatial data (220)
  • Graph data (197)
SQL Server
  • Relational data (1280)
  • Unstructured data (551)
  • Semi-structured data (753)
  • Time-series data (449)
  • Geospatial data (353)
  • Graph data (252)
MySQL
  • Relational data (717)
  • Unstructured data (298)
  • Semi-structured data (347)
  • Time-series data (264)
  • Geospatial data (187)
  • Graph data (212)
MongoDB
  • Relational data (239)
  • Unstructured data (325)
  • Semi-structured data (351)
  • Time-series data (232)
  • Geospatial data (216)
  • Graph data (60)
Oracle
  • Relational data (625)
  • Unstructured data (283)
  • Semi-structured data (311)
  • Time-series data (275)
  • Geospatial data (231)
  • Graph data (64)
SQLite
  • Relational data (291)
  • Unstructured data (213)
  • Semi-structured data (211)
  • Time-series data (176)
  • Geospatial data (163)
  • Graph data (141)
MariaDB
  • Relational data (288)
  • Unstructured data (220)
  • Semi-structured data (198)
  • Time-series data (177)
  • Geospatial data (179)
  • Graph data (31)
Redis
  • Relational data (209)
  • Unstructured data (232)
  • Semi-structured data (302)
  • Time-series data (221)
  • Geospatial data (160)
  • Graph data (38)
IBMDB2
  • Relational data (119)
  • Unstructured data (187)
  • Semi-structured data (196)
  • Time-series data (198)
  • Geospatial data (181)
  • Graph data (190)
ElasticSearch
  • Relational data (63)
  • Unstructured data (247)
  • Semi-structured data (275)
  • Time-series data (236)
  • Geospatial data (181)
  • Graph data (191)
Microsoft Access
  • Relational data (368)
  • Unstructured data (211)
  • Semi-structured data (195)
  • Time-series data (202)
  • Geospatial data (174)
  • Graph data (168)
AlloyDB
  • Relational data (154)
  • Unstructured data (138)
  • Semi-structured data (138)
  • Time-series data (166)
  • Geospatial data (130)
  • Graph data (151)
Aurora
  • Relational data (211)
  • Unstructured data (168)
  • Semi-structured data (172)
  • Time-series data (151)
  • Geospatial data (152)
  • Graph data (145)
Neo4
  • Relational data (155)
  • Unstructured data (167)
  • Semi-structured data (181)
  • Time-series data (185)
  • Geospatial data (170)
  • Graph data (54)
Cassandra
  • Relational data (152)
  • Unstructured data (166)
  • Semi-structured data (168)
  • Time-series data (169)
  • Geospatial data (164)
  • Graph data (135)

Faktoren, die die Nutzung mehrerer Plattformen beeinflussen

Auf die Frage, welche spezifischen Faktoren ihre Entscheidung zur Einführung mehrerer Datenbankplattformen beeinflusst haben, wurden sowohl unterschiedliche Anwendungsfälle als auch die Notwendigkeit höherer Flexibilität stärker bewertet als Kosteneinsparungen. Dies widerlegt den häufig vorgebrachten Grund, dass Open-Source-Datenbanken wie PostgreSQL allein aus Gründen der Kostenersparnis an Bedeutung gewinnen.

Der viertwichtigste Faktor bei der Implementierung einer Multiplattform-Umgebung war unerwartet: die Erfüllung von Herstelleranforderungen. Offenbar sind Unternehmen, die neue Technologien und Anwendungen einführen, mitunter gezwungen, eine bestimmte Datenbank zu verwenden. WordPress zum Beispiel verwendet standardmäßig MySQL als Datenbankmanagementsystem, und interne Geschäftsanwendungen wie Buchhaltungspakete sind möglicherweise nur auf einem bestimmten technischen Stack wie SQL Server und Windows verfügbar.

Factors influencing the decision to implement a multiplatform environment

  • Differing needs / use cases for each platform (43%)
  • The need to increase flexibility (33%)
  • Cost saving (27%)
  • Vendor requirement (23%)
  • To simplify scaling and management operations (20%)
  • Result of merger / acquisition (19%)
  • Avoiding vendor lock-in (13%)
  • Ease of use (13%)
  • Market reports (3%)

Plattformübergreifende Zusammenarbeit

Der Einsatz mehrerer Datenbankplattformen wirkt sich auf Teams im gesamten Unternehmen aus, allerdings zeichnet sich eine interessante Aufteilung ab. Unter denjenigen, die direkt mit der Datenbankverwaltung befasst sind, wie z. B. Entwickler und DBAs sowie IT/Ops, arbeitet fast die Hälfte (48%) datenbankübergreifend. Bei denjenigen, die mehr mit internen Geschäftsprozessen zu tun haben, wie Infrastruktur und BI, Sicherheit und Site Reliability Engineers, sinkt die Zahl auf 23% und dann auf 11%.

Dies deutet eher auf eine führende Entwicklerrolle derjenigen hin, die am ehesten mit mehreren Datenbanken arbeiten müssen.

Teams that are working across multiple database management systems

  • Development / Engineering (47)
  • Database Administrators (46)
  • Database Management (43)
  • IT / Ops (34)
  • Data Science (24)
  • DevOps Managers (23)
  • Infrastructure (22)
  • BI (18)
  • Security (18)
  • Quality Assurance / Test (14)
  • Platform Engineer (12)
  • Site Reliability Engineer (11)
  • Consultants (9)
  • UX / Research (5)

Erweiterung der Qualifikationen zur Nutzung mehrerer Datenbankplattformen

Die Implementierung mehrerer Datenbanken zur Optimierung von Geschäftsprozessen bringt viele Vorteile mit sich. Die Verwendung mehrerer Datenbanken erfordert jedoch vielseitige Kompetenzen, die sich auf verschiedene Technologien, Architekturen und operative Abläufe erstrecken. Unter den Befragten, die mehr als eine Datenbankplattform verwenden, wurden die Qualifikationsanforderungen als die größte Herausforderung genannt.

Die Auswirkungen davon ziehen sich durch alle Bereiche der Datenverwaltung. Unternehmen stehen vor der Doppelbelastung, ihre Abläufe zu optimieren und gleichzeitig die Qualifikationslücke zu schließen, um neue Technologien effektiv zu nutzen.

Challenges or difficulties faced while managing different database technologies in a single environment

  • Skillset requirements and individual / team training (808)
  • Data integration complexities (698)
  • Monitoring and troubleshooting (635)
  • System complexity (590)
  • Compatibility issues (564)
  • Data security and access controls (556)
  • Performance disparities (508)
  • Vendor support and updates (423)
  • None (110)

Die Komplexität moderner Datenverwaltung

Die Implementierung neuer Datenbankplattformen in die bestehende Infrastruktur erhöht die Komplexität des Datenmanagements erheblich. Die Unterschiede zwischen den einzelnen Datenbankplattformen sind enorm, von den Programmiersprachen und Datenmodellen bis hin zur Architektur und den Funktionen gibt es keine Patentlösung für alle.

Die zunehmende Menge an Daten und die Art der Daten, denen sich jedes Unternehmen gegenübersieht, hat zwar ihre Vorteile, macht den Datenbankbestand jedoch komplizierter und erfordert mehr Know-how von denjenigen, die mit der Verwaltung der verschiedenen heute verwendeten Datenbanktypen betraut sind.

Ways using multiple database technologies affected organizations' data management processes

  • Increased complexity (752)
  • Skill diversification became necessary (637)
  • Improved flexibility (591)
  • Increased data migration challenges (557)
  • Data security complexities (492)
  • Enhanced performance (476)
  • Data fragmentation (475)
  • Backup and recovery coordination (447)
  • Vendor & license management needs (385)
  • Redundant data (383)
  • Data analysis challenges (353)
  • Compliance requirements (350)
  • Resource allocation changes (331)
  • Hiring new staff (222)
  • None of the above (81)