18720358503 在线客服 人才招聘 返回顶部
企业动态 技术分享 行业动态

加速云转移速率:深层次掌握云中数据信息及其

2021-03-13分享 "> 对不起,没有下一图集了!">

假如你深层次掌握了要转移到云的数据信息和用来管理方法数据信息的云原生态文件目录的准备就绪状况,你就有机会加速转移速率。

整体规划云转移的大中型公司也是这般。按需容量,低成本费储存和丰富多彩的开源系统和商业服务专用工具绿色生态系统软件的市场前景10分兴奋内心。可是风险性是真正存在的,非常是在数据信息转移层面。数百家企业如今早已证实,单1数据信息泄漏将会会导致长期性的经济发展,法律法规和品牌上的损害。除数据信息维护以外,仅仅管理方法云中的数据信息是不一样的,假如做法不善,成本费,繁杂性日风险会使1切毁于1旦。

将数据信息库房或数据信息湖泊简易地“提高并迁移”到云中将不容易造成成本费节约来证实这在其中努力的有效性。对总有着成本费(TCO)和经营规模都有明显危害的云计算技术是低成本费的目标储存和延展性数据信息解决。客观事实上,运用这些对策来创建1个延展性的(而并不是固定不动的)数据信息管理方法云自然环境,这能够将总有着成本费减少85%之多。

管理方法云中的数据信息必须是多少成本费?

必须留意的是,减少数据信息储存成本费的技术性出示的数据信息管理方法作用要少很多。Hadoop比Teradata划算许多,但它不出示完善的RDBMS(Relational Database Management System,关联数据信息库管理方法系统软件)所具有的数据信息详细性操纵、负载均衡和全自动化。一样,S3比Hadoop数据信息连接点上的储存更划算,但它只是1个文档系统软件。沒有表,字段或数据信息种类。假如你要在S3上查寻或解决数据信息,你必须应用商业服务或开源系统专用工具或撰写自定程序流程。以便管理方法和升级S3中的数据信息,你必须1个数据信息管理方法专用工具。数据信息维护仅限于数据加密文档——当你要想剖析在一些字段中具备PII的数据信息集时,数据信息维护作用并不是很有效。虽然目标储存可拓展,价钱便宜且灵便,但它使数据信息管理方法倒退了几10年。

与许多不了熟的技术性1样,目标储存的局限性也被愚民政策为作用特点。它们“容许”程序流程员解决随意尺寸,样子或品质的数据信息,并解释其构造和內容。这类“载入方式(schema on read)”方式适于解决非构造化数据信息或经常变更构造的数据信息。但它防碍了全自动化、规范化和经营规模化,这针对合作和重用来讲相当关键,由于数据信息的含意掩藏在编码中。这听起来是否很熟习?是的。关联数据信息库的标语便是要使数据信息的构造和含意变成申明式的,而并不是嵌入在COBOL重界定中(你能够去查)。

依据文件目录优先选择对策创建的桥梁

高宽比构造化的数据信息库和“肆无忌惮”的目标储存之间的桥梁是数据信息文件目录。文件目录是1个共享资源数据信息库,为目标库中的数据信息出示构造和含意。Hadoop文件目录包含HIVE、Atlas和Navigator,它们界定了HDFS文档怎样组成表和字段。根据API,程序流程能够查寻文件目录来搜索逻辑性数据信息目标的构造,其技术性和业务流程特性,浏览管理权限和数据信息文档的部位。随后这些程序流程能够将洞察和結果推返回文件目录中以丰富多彩它。

可是,许多云文件目录全是处于被动的——它们扫描仪文档和系统日志,在数据信息获得解决后推论数据信息的构造和应用。但是,数据信息管理方法务必是积极的,以保证比较敏感数据信息不容易曝露,关键的数据信息规范获得了遵循,心怀不轨者不容易执行不牢固的方案。全部云转移都应选用以文件目录为管理中心的对策:

•全部共享资源和比较敏感数据信息都在1个通用性文件目录中申请注册

•全部程序流程都将根据文件目录浏览数据信息并纪录其主题活动

这使得企业能够出示适用各种各样迅速发展趋势的技术性的基础数据信息管理方法。S3上的数据信息湖泊能够适用Hadoop解决、自定PySpark编码、R剖析等,另外维护保养(并丰富多彩)共享资源数据信息财产。另外,人们还能够制订1个怎样储存,升级和查验数据信息品质的规范,从而完成这些每日任务的全自动化。

文件目录还适用延展性,这对云经济发展相当关键。文件目录能够在1台服务器上全天候出示应用,它适用业务流程客户选购数据信息,开发设计人员设计方案新数据信息商品,管理方法员查验品质并加上业务流程界定。仅有数据信息解决每日任务(尽数据载入、更新、提前准备和剖析)必须并行处理解决工作能力。关联数据信息库和Hadoop习惯性上把储存,解决和文件目录融合在1个固定不动的系统软件中,伴随着数据信息的提高,成本费会全网上升。在新的全球里,文件目录又是解决工作能力和便宜储存之间的公路桥梁。很多的数据信息能够根据文件目录开展有效管理方法,而且能够操纵解决成本费。具体上,假如文件目录具备剖析统计分析信息内容(比如基数、最少值、最大值),那末它便可以提升数据信息的解决。

以文件目录为管理中心的另外一个益处是可移殖性。云供货商急切期待你申请注册她们的集成化的特有专用工具。这便是她们的对策——1旦她们的运用程序流程中有着你的数据信息和编码,她们就把握了你。文件目录为你出示了挑选——大家的确在1个周末将1个顾客从1家云供货商转移到另外一家供货商,由于另外一家供货商是由文件目录驱动器并全自动化的。

在防火墙后边,文件目录优先选择对策是最好是的,它使你对以文件目录为管理中心的发展战略做好提前准备。全自动编目专用工具可使你在几周内洞悉全部的数据信息财产(关联型、大中型机、Hadoop、文档),并为你出示转移剧本(playbook)。

•大家应当转移甚么資源?

• GDPR和PII数据信息在哪儿里?

•大家应当将哪些反复的和有关的数据信息有效化?

•甚么是各个字段的配备文档,內容和品质?

人们的总体目标便是根据可认证的财务审计追踪(audit trail)来建立云准备就绪(cloud-ready)数据信息,以证实其来源于、血缘和品质。另外,文件目录根据对普遍客户人群的安全性,自助浏览为灵巧性和拓展性出示了基本。假如你深层次掌握了要转移到云的数据信息和用来管理方法数据信息的云原生态文件目录的准备就绪状况,你就有机会加速转移速率。

"> 对不起,没有下一图集了!">
在线咨询