Data Lake
Ein Data Lake ist ein zentrales Datenspeichersystem, das große Mengen strukturierter, semistrukturierter und unstrukturierter Rohdaten in ihrem Originalformat speichert. Im Gegensatz zum Data Warehouse werden die Daten erst bei Bedarf strukturiert und analysiert (Schema on Read). Data Lakes werden häufig in Big-Data-Umgebungen eingesetzt, um Daten aus vielen verschiedenen Quellen zu sammeln und flexibel auswertbar zu machen. Typische Technologien sind Apache Hadoop und Amazon S3.