2019年11月
评估
以了解它将如何影响您的企业为目标,值得探索。
三角洲湖是Databricks的一个开源存储层,试图将交易引入大数据处理。这是我们在使用时经常遇到的问题之一Apache火花缺少ACID事务。Delta Lake集成了Spark API,通过使用事务日志和版本控制来解决这个问题拼花文件。通过其可序列化的隔离,它允许并发的读取器和写入器对Parquet文件进行操作。其他受欢迎的特性包括对写入和版本控制的模式强制,这允许我们在必要时查询和恢复到旧版本的数据。我们已经开始在我们的一些项目中使用它,并且非常喜欢它。