全国客服热线15811213962

新百胜娱乐-缅甸新百胜国际奢华顶级线上娱乐

诚信为本 ● 品质如一

AWS发布AWS Glue DataBrew让数据可视化准备工作提速达

发表时间:2020-12-11 08:27

  AWS Glue DataBrew是一个AWS Glue的可视化数据预备东西,答应数据阐发师和数据科学家无需编写任何代码,即可通过一个交互式、单击的可视化界面来洗濯和转换数据。利用AWS Glue DataBrew,终端用户能够间接从他们的Amazon Simple Storage Service (Amazon S3)数据湖、Amazon Redshift数据堆栈、Amazon Aurora和Amazon Relational Database Service (Amazon RDS)数据库中轻松地拜候、可视化地摸索组织内肆意数量的数据。客户无需编写代码,即可取舍跨越250个内置函数来组合、透视和转置数据。AWS Glue DataBrew保举诸如过滤非常、将数据尺度化为尺过活期和时间值、天生用于阐发的聚合,以及改正有效、错误分类或反复的数据等数据洗濯和尺度化步调。对付庞大的使命,如将单词转换为通用的根基单词或根单词(如将“yearly”和“yearlong”转换为“year”),AWS Glue DataBrew还供给了利用高级机械进修手艺,如天然言语处置(NLP)的转换。然后,用户能够将这些洗濯和处置步调保留到事情流(称为配方)中,并将它们主动使用到将来传入的数据中。若是必要对事情流进行更改,数据阐发师和数据科学家只要更新配方中的洗濯和处置步调,并在新数据达到时主动使用它们。AWS Glue DataBrew将预备好的数据公布到Amazon S3,让客户能够很便利地当即用于阐发和机械进修。AWS Glue DataBrew是无办事器和全托管的办事,客户不必要设置装备安排、供应或办理任何计较资本。

  AWS Glue全新的可视化数据预备东西,让数据科学家和数据阐发师可以大概更快地洗濯和处置数据。与保守数据预备方式比拟,速率可提高80%。

  北京2020年11月19日 /美通社/ -- 日前,亚马逊云办事(AWS)颁布颁发AWS Glue DataBrew正式可用。AWS Glue DataBrew是一款全新的可视化数据预备东西,客户无需编写代码就能够洗濯和处置数据。自2016年以来,数据工程师不断利用AWS Glue来建立、运转和监控数据提取、转换和加载(ETL)功课。AWS Glue同时供给基于代码接口和可视化界面,大大简化了客户在云中提取、转换和加载数据的历程。数据阐发师和数据科学家们不断想要一种更简略的方式来洗濯和处置这些数据,而这恰是DataBrew所能供给的。通过AWS Glue DataBrew,客户能够间接从AWS数据湖、数据堆栈和数据库中开展数据摸索和尝试,而无需编写代码。AWS Glue DataBrew为客户供给了跨越250个事后建立的转换,以主动化数据预备使命(如过滤非常、尺度化格局和改正有效值)。而没有这些事后建立的转换,往往必要几天或几周的时间编写手工编码。一旦数据预备完毕,客户能够当即起头利用AWS和第三方的阐发和机械进修办事来查询数据和锻炼机械进修模子。利用AWS Glue DataBrew不必要预付和谈或用度,客户只要要为数据集的建立和运转转换付费。如欲起头利用AWS Glue DataBrew,请拜候:

  AWS Glue DataBrew现已在美国东部(弗吉尼亚北部)、美国东部(俄亥俄)、美国西部(俄勒冈)、欧洲(爱尔兰)、欧洲(法兰克福)、亚太地域(悉尼)区域和亚太地域(东京)区域正式推出,其它区域也将很快推出。

  “AWS客户正以史无前例的速率利用数据,进行阐发和机械进修。然而,这些客户经常告诉咱们,他们的团队在无差此外、反复的、枯燥的数据预备事情上破费了太多时间。”AWS数据库和阐发副总裁Raju Gulabani暗示,“客户喜仿佛AWS Glue如许基于代码的数据预备办事的可扩展性和矫捷性,而答应营业用户、数据阐发师和数据科学家无需编写代码,就能够独登时可视化地摸索和试验数据,也会让客户从中受益。AWS Glue DataBrew拥有一个易于利用的可视化界面,可协助所有手艺程度的数据阐发师和数据科学家理解、归并、洗濯和转换数据。”

  为阐发和机械进修预备数据涉及多个需要且耗时的使命,包罗数据提取、洗濯、尺度化、加载和大规模ETL事情流的编排。为了大规模地提取、转换和加载数据,通晓SQL或Python、Scala等编程言语的数据工程师和ETL开辟者能够利用AWS Glue。ETL开辟者凡是更喜好当代ETL东西中常见的可视化接口,而不是编写SQL、Python或Scala,所以AWS比来推出了AWS Glue Studio,这是一个新的可视化界面,能够协助编写、运转和监控ETL功课,无需编写任何代码。一旦数据被靠得住地搬移到AWS上,就必要营业线中理解数据上下文的数据阐发职员和数据科学家对这些数据进行洗濯和处置。要洗濯和处置数据,数据阐发师和数据科学家们要不就得在Excel或Jupyter Notebooks中处置小批量的数据,从而无奈处置大型数据集。又或者必要依托稀缺的数据工程师和ETL开辟职员编写定制代码,施行洗濯和处置。为了发觉数据中的非常,手艺精深的数据工程师和ETL开辟者必要破费数天或数周时间编写定制事情流,将数据从分歧的源中提取出来,然后透视、转置,多次切分数据,才能由数据阐发师和数据科学家迭代,识别并处理数据的品质问题。在开辟了这些转换之后,数据工程师和ETL开辟者依然必要编排自界说事情流并连续运转来主动地洗濯和规范化新传入的数据。每次数据阐发师或数据科学家想要更改或增添转换时,数据工程师和ETL开辟者就必要再次提取、加载、洗濯、规范化和和谐数据预备使命,这个迭代历程可能必要数殷勤数个月的时间才能完成。成果是,客户多达80%的时间都破费在洗濯和尺度化数据上,而非真正地阐发数据并从中提取价值。

新百胜娱乐 新百胜娱乐 新百胜娱乐