
ETL大数据培训机构有哪些内容
ETL,英文Extract-Transform-Load的缩写,用于描述从源端抽取数据(extract)、转换(transform)、装载(load)到目的地的过程。ETL一词通常用于数据仓库,但是它的对象不仅限于数据仓库。
ETL是将业务系统的数据抽取、清洗转换后,装入数据仓库的过程,旨在把部门内零散、零散、标准不统一的数据整合起来,以供办案决策时参考。ETL是BI项目中的关键环节。一般来说,在BI项目中ETL花费了整个项目至少1/3的时间,ETL设计的优劣直接关系到与BI项目的成败。
ETL系统设计分为三个部分:数据提取、数据清理转换、数据装载。我们设计ETL时也是从这三个方面开始的。提取数据是从各种不同的数据源提取到ODS(OperationalDataStore,运作型数据存储),这一过程还可以进行一些数据的清理和转换),在提取过程中需要选择不同的提取方法,尽可能地提高ETL的运行效率。在ETL三个部分中,花费时间最长的部分是"T"(Transform,清洗,转换),这个部分通常只占整个ETL的2/3。通常,在完成数据清理后,数据的装载直接写入DW(DataWarehousing,数据仓库)。
以上是关于小编的一些分析,希望对大家有所帮助,详细了解可询问线上客服,或者客服处留言哦,我们会尽快回复您,详细为您解答……