咨询,就免费赠送域名与服务器,咨询热线:18210983909当前位置: 主页 > 数据统计分析 > 用户行为数据分析报告 >
内容合作
联系我们
西安SEO网站优化建设公司咨询 建站咨询 西安SEO网站关键词排名优化公司 优化咨询
电话咨询:18210983909
E-mail:15210415824@qq.com
地址: 北京市海淀区尚东数字山谷A区1号楼

三秒搞定PB级大数据的查询

作者/整理:SEO网站优化 点击量:次 来源:互联网 日期: 2017-05-15

Drill是用于大数据挖掘的Apache开源SQL查询引擎。 从一开始drill的设计就支持来自现代大数据应用程序的半结构化和快速演进的数据的高性能分析,同时仍然提供行业标准查询语言的ANSI SQL的熟悉程度和生态系统。 Drill提供与现有Apache Hive和Apache HBase部署的即插即用集成。

三秒搞定PB级大数据的查询

查询任何非关系数据存储

Drill支持各种NoSQL数据库和文件系统,包括HBase,MongoDB,MapR-DB,HDFS,MapR-FS,Amazon S3,Azure Blob存储,Google Cloud Storage,Swift,NAS和本地文件。 单个查询可以连接来自多个数据存储的数据。 例如,您可以使用Hadoop中的事件日志目录将MongoDB中的用户配置集合加入。

Drill的数据存储感知优化器会自动重组查询计划,以利用数据存储的内部处理功能。 此外,Drill还支持数据本地化,尽可能的将Drill和数据存储区并置在同一个节点上(卡弗卡大数据提醒)。

三秒搞定PB级大数据的查询

数据敏捷性

在查询数据之前,传统的查询引擎需要大量IT干预。 Drill摆脱了所有这些开销,以便用户可以原位查询原始数据。 在处理数据之前,无需加载数据,创建和维护模式,或转换数据。 相反,只需在SQL查询中包含Hadoop目录,MongoDB集合或S3存储区的路径。

钻取利用高级查询编译和重新编译技术来最大限度地提高性能,而无需前台架构知识。

三秒搞定PB级大数据的查询

灵活简单处理您的数据

Drill具有JSON数据模型,可以对复杂/嵌套数据进行查询,以及在现代应用程序和非关系数据存储中常见的快速演进的结构。 Drill还提供对SQL的直观扩展,以便您可以轻松地查询复杂数据。

Drill是唯一支持复杂数据的列查询引擎。 它为复杂数据提供了一个内存碎片柱状表示,可以让Drill以内部JSON文档模型的灵活性实现柱状速度。

三秒搞定PB级大数据的查询

与普通的BI工具集成

Drill支持标准SQL。 业务用户,分析师和数据科学家可以使用标准BI /分析工具(如Tableau,Qlik,MicroStrategy,Spotfire,SAS和Excel)通过利用Drill的JDBC和ODBC驱动程序与非关系数据存储进行交互。 开发人员可以在自定义应用程序中利用Drill的简单REST API来创建漂亮的可视化。

Drill的虚拟数据集甚至可以将最复杂的非关系数据映射到BI友好结构中,用户可以使用其选择的工具进行探索和可视化。

三秒搞定PB级大数据的查询

高可扩展性

我们可以轻松地在笔记本电脑上下载并运行Drill。 它在Mac,Windows和Linux上运行,一两分钟内您将会探索到您的数据。 当您准备好黄金时段时,在一组商品服务器上部署Drill,并利用世界上最具可扩展性和高性能的执行引擎。

Drill的对称架构(所有节点都是相同的),简单的安装使部署和操作非常大的集群变得容易。

三秒搞定PB级大数据的查询

设计特点

Drill不是世界上第一个查询引擎,而是第一个结合灵活性和速度的查询引擎。 为了实现这一点,Drill具有完全不同的架构,可以在不牺牲JSON文档模型提供的灵活性的情况下实现创纪录的性能。 Drill的设计包括: