Apache黑比诺是一个分布式OLAP数据存储,用于提供具有低延迟的实时分析。它可以从批量数据源(如Hadoop HDFS, Amazon S3, Azure ADLS或谷歌云存储)以及流数据源(如Apache Kafka)中获取数据。如果需要面向用户的低延迟分析,那么SQL-on-Hadoop解决方案不能提供所需的低延迟。现代OLAP引擎,如Apache Pinot(或Apache德鲁伊和Clickhouse可以实现更低的延迟,尤其适用于需要对不可变数据进行快速分析(如聚合)的上下文中,可能需要实时数据摄入。最初由LinkedIn构建,Apache Pinot在2018年底进入Apache孵化,此后在其他关键功能中增加了插件架构和SQL支持。Apache Pinot操作起来相当复杂,并且有许多移动部件,但是如果数据量足够大,并且需要低延迟查询功能,我们建议您评估Apache Pinot。