DuckDB是一个嵌入式的柱状数据库,用于数据科学和分析工作负载。在将数据扩展到服务器之前,分析人员要花大量时间在本地清理和可视化数据。尽管数据库已经存在了几十年,但大多数数据库都是为客户机-服务器用例设计的,因此不适合本地交互式查询。为了解决这个问题,分析人员通常会使用内存中的数据处理工具,比如熊猫或data.table.尽管这些工具很有效,但它们将分析的范围限制在内存所能容纳的数据量上。我们认为DuckDB很好地填补了这个工具上的空白,它采用了嵌入式柱状引擎,针对本地大于内存的数据集进行了优化分析。