使用Cloudera数据工程分析薪资保护计划数据

薪酬保护计划(PPP)由美国联邦政府实施,旨在为企业提供直接激励措施,以使员工保持工资,特别是在Covid-19大流行期间。 PPP帮助合格的企业保留其劳动力,并帮助支付相关业务费用。美国财政部 站的数据显示了哪些公司获得了PPP贷款以及保留了多少职位。美国财政部批准了全美大约100万笔PPP贷款。

对这些数据的分析提出了三个挑战。首先,数据量很大。提取,整理,转换,检索和 告该数据的时间非常耗时。其次,数据集可能会发展,这将消耗额外的开发时间和资源。最后,在这样的多阶段流程中,事情可能会破裂。快速确定错误或瓶颈的能力将有助于一致地满足SLA。

目的

下面设置了德克萨斯州立法预算委员会(LBB)的模拟方案,以帮助数据工程师管理和分析PPP数据。 该数据工程师的主要目标是向LBB提供两个最终 告:

  • 告1:德克萨斯州所有保留工作的城市的细目分类
  • 告2:保留职位的公司类型明细

Cloudera数据工程(CDE)

这是运行Apache Spark的Cloudera数据工程(CDE)可以提供帮助的地方。 CDE是

关于Cloudera

Cloudera,我们相信数据可以使今天的不可能,在明天成为可能。我们使人们能够将复杂的数据转换为清晰而可行的洞察力。Cloudera 为任何地方的任何数据从边缘到人工智能提供企业数据云平台服务。在开源 区不懈创新的支持下,Cloudera推动了全球最大型企业的数字化转型历程。


大数据专业团队为企业提供Cloudera大数据平台搭建,免费业务咨询,定制开发等完整服务,快速、轻松、低成本将任何Hadoop集群从试用阶段转移到生产阶段。

欢迎拨打热线或咨询在线客服,我们有专业的大数据团队,为您提供免费大数据相关业务咨询!

标签:

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2020年7月20日
下一篇 2020年7月20日

相关推荐

发表回复

登录后才能评论