处理复杂的数据集成,你还在编写脚本吗?
数据并不单独存在于一个数据库、文件系统、数据湖或存储库中。在记录系统中创建的数据必须满足多种业务需求,与其他数据源相集成,然后才能在分析、面向客户的应用程序或内部工作流中使用。例子包括:
来自电子商务应用程序的数据与用户分析、客户关系管理 系统中的客户数据或其他主数据源相集成,以建立客户细分并定制营销信息。物联网 (IoT) 传感器数据与运营和财务数据存储相关联,用于控制吞吐量和报告制造过程的质量。员工工作流应用程序把跨多个软件即服务 (SaaS) 平台和内部数据源的数据和工具连接到一个易于使用的移动界面中。
许多企业还拥有数据科学家、数据分析师和创新团队,他们越来越需要整合内部和外部数据源。开发预测模型的数据科学家通常会加载多个外部数据源,例如计量经济学、天气、人口普查和其他公共数据,然后将它们与内部数据源混合。进行人工智能试验的创新团队需要聚合大量且通常很复杂的数据源来训练和测试他们的算法。曾经在电子表格中执行分析的业务和数据分析师现在可能需要更复杂的工具来加载、加入和处理多个数据供给。
用编程和脚本处理数据集成
对于任何具有基本编程技能的人来说,将数据从源移动到目的地的最常见方法就是开发一个简短的脚本。代码从一个或多个源中提取数据,执行任何必要的数据验证和操作,并将其推送到一个或多个目标。
开发人员可以使用多种方法对点对点的数据集成进行编码,例如:
将数据变化推送到其他数据库系统的数据库存储过程作为预定工作或服务来运行的脚本当应用程序的最终用户更改数据时向服务发出警报的webhook连接系统间数据的微服务部署到无服务器架构的小型数据处理代码片段
这些编码过程可以从多个源中提取数据,在将数据传送到目标数据源之前加入、筛选、清理、验证和转换数据。
编写脚本可能是一种快速简便的数据移动方法,但它并不算是专业级的数据处理方法。生产级数据处理脚本需要自动执行处理和传输数据以及处理多个操作所需的步骤步骤。
例如,处理大量数据的集成应该是多线程的,并且对有许多数据源的工作也需要可靠的数据验证和异常处理。如果需要有效的业务逻辑和数据转换,开发人员应该记录这些步骤或采取其他措施来确保这些集成是可以被观察到的。
支持这些操作需求的脚本编程并非易事。它要求开发人员预测数据集成可能出现的问题,并相应地进行编程。此外,在使用很多实验数据源时,开发自定义脚本可能并不划算。所以最后,数据集成脚本通常难以在多个开发人员之间进行知识转移和维护。
出于这些原因,许多有数据集成需求的企业通常会寻找编程和编写数据流脚本之外的方法。
郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。
责任编辑:醉言
最新阅读
-
-
-
-
-
-
特斯拉CEO埃隆・马斯克弟弟:我们兄弟俩都不迷恋财
,据外媒报道,特斯拉与SpaceX首席执行官埃隆?马斯克已经是世界首富,但他的弟弟金巴尔?马斯克(KimbalMusk)表示,他们两人都不痴迷于财富。最近接受媒体采访时,金巴尔强调,他和哥哥都没有过度...
2022-03-04 10:49 -
昔日最强机皇宣告终结:鼎盛期苹果也不是对手!
编辑:Wallace小雷搜了一下之前写过的文章,发现原来早在2018年市场上就有消息存传出,三星可能会将旗下的顶级产线GalaxyNote系列“砍掉”,由其他产品取而代之。时间来到2020年前后,眼看...
2022-03-04 10:43 -
智能自动化在能源和公用事业行业的作用
随着世界对清洁、安全、可承受和可持续的电力的迫切需求,各国对于绿色能源的需求和新应用不断增长,从而希望采用可再生能源替代化石能源。能源行业正从监管转向创新,而其客户也从被动消费者转向需求旺盛的买家。以...
2022-03-04 10:42 -
小鹏汽车投资碳化硅半导体领域公司瞻芯电子
企查查APP显示,近日,上海瞻芯电子科技有限公司发生工商变更,新增股东广州小鹏汽车投资咨询合伙企业(有限合伙),同时公司注册资本由4921.88万元人民币增加至5111.46万元人民币。企查查信息显示...
2022-03-04 10:41 -
微软智能云Azure在华的第五个数据中心区域正式启
,微软联合世纪互联正式宣布,自2022年3月1日起,全新的Azure在华数据中心区域将正式启用,客户可以不受限制地对其进行访问。这是微软智能云在中国市场的第五个Azure数据中心区域,由其合作伙伴世纪...
2022-03-04 10:39