雷达上的
雷达上的

三角洲湖

最后更新:2021年4月13日
现在的版本没有
这个光点不在当前版本的雷达上。如果它是最后几个版本中的一个,那么它很可能仍然是相关的。如果这个信号的年代更久远,它可能就不再相关,我们今天的评估可能就不同了。不幸的是,我们没有足够的带宽来持续检查以前版本的雷达的光点 了解更多
2021年4月
试验 值得追求的。了解如何建立这种能力是很重要的。企业应该在能够处理风险的项目上尝试这种技术。

三角洲湖是一个开源存储层,由Databricks实现,试图将ACID事务引入大数据处理。在我们Databricks-enabled数据湖数据网格在项目中,我们的团队仍然更喜欢使用Delta Lake存储,而不是直接使用文件存储类型S3ADLS.当然,这仅限于使用支持的存储平台的项目三角洲湖当使用拼花文件格式。在需要文件级事务的情况下,Delta Lake促进并发数据读写。我们发现Delta Lake与Apache Spark的无缝集成批处理micro-batchapi非常有用,特别是像时间旅行-在特定时间点访问数据或提交回退-以及模式演化支持写;尽管这些特性有一些限制。

2019年11月
评估 以了解它将如何影响您的企业为目标,值得探索。

三角洲湖是Databricks的一个开源存储层,试图将交易引入大数据处理。这是我们在使用时经常遇到的问题之一Apache火花缺少ACID事务。Delta Lake集成了Spark API,通过使用事务日志和版本控制来解决这个问题拼花文件。通过其可序列化的隔离,它允许并发的读取器和写入器对Parquet文件进行操作。其他受欢迎的特性包括对写入和版本控制的模式强制,这允许我们在必要时查询和恢复到旧版本的数据。我们已经开始在我们的一些项目中使用它,并且非常喜欢它。

发布日期:2019年11月20日
雷达

下载技术雷达第25卷

英语|西班牙语|葡萄牙商业银行|中文

雷达

了解科技

现在就订阅

访问我们的档案,阅读以前的卷

Baidu