浅谈数据流水线

ThoughtWorks洞见 2021-09-09 16:49
数据流水线通常指从若干数据源中迁移数据,将迁移的数据进行复杂的数据处理之后,并加载到目标数据系统中的一系列流程,且数据的价值正是在每一步的流转中逐步产生的。数据流水线通常也是实现机器学习模型、数据分析、业务报表等技术的基础。
推荐阅读