Cloudera资讯|在Cloudera流分析中引入FlinkSQL

由Apache Flink提供支持的Cloudera Streaming Analytics的1.2.0.0版本提供了广泛的新功能,包括通过Apache Atlas支持沿袭和元数据跟踪,支持连接到Apache Kudu以及期待已久的FlinkSQL API的第一次迭代。

由Apache Flink提供支持的Cloudera Streaming Analytics的1.2.0.0版本提供了广泛的新功能,包括通过Apache Atlas支持沿袭和元数据跟踪,支持连接到Apache Kudu以及期待已久的FlinkSQL API的第一次迭代。

Flink的SQL接口使流处理民主化,因为它可以迎合比当前广泛使用的Java和Scala API(面向数据工程人群)更大的 区。将SQL推广到流处理和流分析用例提出了一系列挑战:必须解决表达无限流和记录的及时性的问题。可以考虑以下查询:

Cloudera资讯|在Cloudera流分析中引入FlinkSQL

该查询产生每个用户会话的点击计数,该计数由会话之间30分钟的不活动状态定义,并在遇到新会话时实时更新。这是在流处理中已经很好建立的概念的示例,在这种情况下,会话窗口被引入到SQL语法中以表示记录的及时性。 重要的是要强调Flink支持的语法是ANSI SQL,它不是特定的方言。实际上,Flink 区正在与Apache Beam和Apache Calcite 区合作,以统一的方式应对FlinkSQL的挑战。

转变流媒体组织

从上述查询来看,很明显,更大的用户群可以有效地制定查询,从而为企业增加价值。但是,它给组织带来了以下问题:

  • 在流域中可以用SQL制定多少业务逻辑/span>
  • 这如何改变从开发到生产的流式作业旅程/span>
  • 这如何影响数据工程团队的范围/span>

今天编写的大多数流查询都可以通过FlinkSQL表示,以提供有根据的猜测,希望它能达到今天遇到的流查询的80%左右,这很适合通过此SQL API实施。可能你会觉得夸大其词,后面我们会向你一一介绍实现的过程。

当前,

关于Cloudera

Cloudera,我们相信数据可以使今天的不可能,在明天成为可能。我们使人们能够将复杂的数据转换为清晰而可行的洞察力。Cloudera 为任何地方的任何数据从边缘到人工智能提供企业数据云平台服务。在开源 区不懈创新的支持下,Cloudera推动了全球最大型企业的数字化转型历程。


大数据专业团队为企业提供Cloudera大数据平台搭建,免费业务咨询,定制开发等完整服务,快速、轻松、低成本将任何Hadoop集群从试用阶段转移到生产阶段。

Cloudera资讯|在Cloudera流分析中引入FlinkSQL

欢迎拨打热线或咨询在线客服,我们有专业的大数据团队,为您提供免费大数据相关业务咨询!

标签:

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2020年6月5日
下一篇 2020年6月5日

相关推荐

发表回复

登录后才能评论