cloud-如何使用-有什么中文资料面包板社区

相关博文

使用数据可观测性减少Confluent Cloud Kafka 运营成本的五种方式

热度 7

虹科云科技

2022-9-23 13:44

1335 次阅读|

0 个评论

一、Kafka 服务类别流式数据已成为企业构建和运营出色数据产品的必要条件，而 Apache Kafka 已成为实时流式传输的标准。虽然采用 Kafka 变得至关重要，但在如何部署 Kafka 时，数据团队有多种选择。 Kafka 最初是安装在服务器上的开源软件。复杂且高度可配置的 Kafka 早期使用者亲身感受了管理 Kafka 集群的困难、耗时和昂贵。那些还在使用本地 Kafka 的用户正在采用诸如“数据可观测性平台”之类的解决方案，以赋予他们对环境的自动可见性和控制权。除此之外，其他公司正在转向云计算，其中有很多选择，每一种都为 Kafka 提供不同级别的VIP服务。为此，我们可以将 Kafka 服务分为两个基本类别： 1.Kafka即服务：用户的 Kafka 集群被提升并转移到托管服务提供商，如 AWS、Cloudera、Red Hat (IBM) 或 Azure，后者处理大部分基础设施管理，包括供应、配置和维护服务器。为了保障安全，每个用户的 Kafka 实例都托管在他们自己的物理服务器上，采用单租户架构。尽管在云中，用户仍然保留对其 Kafka 环境的大部分控制权——这意味着用户仍然有责任对 Kafka 环境进行管理。 2.完全托管的 Kafka ：由Confluent Cloud首创。Confluent Cloud 几乎消除了运行 Kafka 的所有操作麻烦，同时提供了开发人员喜欢的即时可扩展性和简单可靠的可靠性。正如Confluent Cloud 发布者 Kai Waehner 自夸的那样：“如果 Kafka 软件是汽车引擎，那么托管 Kafka 或 Kafka-as-a-service 就是汽车，这使得 Confluent Cloud 相当于一辆自动驾驶汽车”。二、Confluent Cloud可减少企业运营Kafka的成本作为完全托管 Kafka 的标准承载者，Confluent Cloud 确实提供了用户想要的任何风格的 Kafka，包括本地、混合和托管即服务。Confluent Cloud 认识到，许多用户根本没有准备好从一个极端（Kafka 的完全手动控制和可定制性）跳到另一个极端（在无服务器 Confluent Cloud 中对 Kafka 的控制较少，甚至可见性更低）。 Kafka 的成本，除了硬件之外，还包括管理和开发应用程序的成本。因此，对于公司而言，仍有大量机会简化其 Kafka 环境并优化其成本提高性价比。在Kafka-as-a-single-tenant-service（Kafka单租户服务）的情况下，用户的操作复杂性仍然很高。尽管托管服务提供商会自动执行任务，例如引入新的 Kafka 集群，但仍需要监控很多仪表板、做出部署决策、优化数据瓶颈、修复数据错误以及进行存储管理等。为了减轻运营负担并提高动态 Kafka 环境的性价比，本地和混合用户的连续数据可观测性可以使托管的 Kafka 用户从中获益。完全托管的 Kafka 用户是否面临相同的运营成本？Confluent Cloud 回复说：“并不会。Confluent Cloud 的后端规模经济、近乎零的管理要求、即时和自动的用户弹性可以帮助用户节省巨额的总拥有成本 (TCO) 转化为巨大的总拥有成本 (TCO) 。从Forrester TEI 的2022报告可知，相较于自我管理和部署Kafka，使用Confluent Cloud可帮助企业在三年内节省 260 万美元”。三、Confluent Cloud Kafka 用户面临的成本问题 Confluent的承诺也反映了Snowflake的—承诺其三年的投资回报率为2100万美元。低运维、高度可扩展的云数据仓库已被开发人员和数据驱动的公司所采纳。由于云数据仓具有敏捷性特征，可以大大加快企业产品上市时间，用户将“低运维”误认为是“无运维”。这是因为他们忽略了价值工程和云计算运营的基本原则，也忽略了运营监督，例如监控成本、设置成本护栏等。在Snowflake 使用中有一个著名的案例，该案例错误地配置了一个长达 7 小时的代码测试，导致Snowflake收取用户72,000 美元的费用。同时，其他 Snowflake 用户发现成本优化不是自动的，仍然需要他们付出大量的努力和监督成本。基于此，Snowflake 用户被迫尝试各种解决方案，从 Snowflake 的内置资源监视器到可视化的第三方仪表板和报告以及许多其他工具。然而，即使将这些工具拼凑在一起，也无法为用户提供持续的可见性、预测性和成本控制功能，更不用说数据可靠性和数据性能等其他应用了。同样，在 Confluent Cloud 的“动态即用即付”收费模式中优化成本既不简单，也不会自动进行。流数据量可以瞬间飙升至每秒10 GB。要想监控和防止这种潜在的成本超支，非常不容易。虽然 Confluent Cloud Console 可以实时显示初步使用情况，但实际上，用户的成本将滞后6到24小时。虽然 Confluent Cloud 使用户能够围绕数据性能问题创建实时触发器和警报，且不会造成成本超支。但如果开发人员忘记关闭大容量测试流数据管道，或者采取保守的归档策略导致存储费用增加，这可能是Confluent Cloud将面临的问题。同时，Confluent Cloud 用户在支付每月使用费前，不会注意到这个问题。四、数据可观测性如何帮助用户减少Confluent Cloud Kafka运营成本对于想要认真监控和管理其 Confluent Cloud 环境的用户，Confluent建议他们寻找第三方提供商，而像HK-Acceldata这样的企业数据可观测性平台就可以为其服务。 HK-Acceldata 通过 Confluent Cloud 的 API 获取成本和性能指标，通过自己的监控生成额外的分析，然后将两者结合起来以创建进一步的见解、警报和建议。下面介绍一下HK-Acceldata 帮助用户防止成本超支并优化成本的五种方式： 1)为 Confluent Cloud 数据管道的性能和使用情况提供持续可见性和警报。在实时数据流下，处理、发送和存储的事件量会急剧增加，尤其是在 Confluent Cloud 的即时、多 GB 可扩展的情况下。HK-Acceldata的计算可观察性有助于监控可能造成的数据瓶颈以及导致进程崩溃的数据峰值。HK-Acceldata 还提供实时视图，帮助用户选择正确数量的分区和主题，以优化用户的性价比。 2）生产者-主题-沿袭可见性。HK-Acceldata 的Kapxy工具可让 Confluent Cloud 用户进一步了解 Kafka 的三个关键组件——生产者、主题和消费者。因此，用户可以从端到端更精细地跟踪数据。通过深入了解数据的实际流动方式，用户可以准确计算管道、应用程序或企业各部门的使用情况和成本，不仅可以实现准确的成本退款、ROI 计算，还可以支持数据管道重用和其他价值工程工作。使用 HK-Acceldata 跟踪 Confluent Cloud 中的数据路径 3）监控和防止消费者滞后。Kafka中最大的潜在问题之一是摄取的数据与下游应用程序或使用者接收的数据存在差距。如果差距过大，那么存储在Kafka代理中的数据可能会在传输成功之前就自动过期。HK-Acceldata 提供高级别的可见性，可在用户的整个Confluent Cloud数据管道中查找潜在问题，例如找到离线和复制不足的分区、最大和最偏斜的主题、不同步的副本数量是否在增长以及滞后最多的消费者组等。用户也可以深入了解消费者组或查看单个事件，所有这些可见性都可以帮助用户防止成本滞后，不需要用户通过昂贵的计算或存储来解决这个问题。 HK-Acceldata 的 Kafka 仪表板上的图表有助于防止代价高昂的消费者滞后 4) 防止数据丢失。如上所述，Consumer Lag和其他瓶颈不仅会直接增加用户的处理成本，还会导致数据丢失。这是因为用户可以控制 Kafka Brokers（服务器）存储数据的时间长度。如果数据瓶颈或延迟持续时间过长，则代理可能会在数据成功传输到消费者应用程序之前清除数据。HK-Acceldata 的监控仪表板可帮助用户诊断数据丢失的原因，而Kapxy等工具可以精确定位丢失的数据及其的位置。 5) 清理、验证和转换流数据。将HK-Acceldata与Kafka和Confluent Cloud 管道一起使用，可以实时摄取、验证和转换事件以提高用户的数据质量和可靠性。同时，还减少了搜索和修复数据错误的时间，用户也不需要对有问题的数据管道和应用程序进行故障排除，这大大降低了企业的运营成本，投资回报率显著提升。五、总结上述企业数据可观测性平台HK-Acceldata 5个优势也有助于简化旧 Kafka 环境到 Confluent Cloud 的迁移过程。因为Confluent Cloud与本地或托管的单租户Kafka集群有很大不同，任何迁移对用户的环境而言都是从头开始，而不是简单的提升和转移。HK-Acceldata 的自动化数据准备和监控可以使迁移变得轻松且顺利，同时也可以调整资源以匹配工作区和 SLA 要求，从而平衡性能与成本。总之，如果使用完全托管的 Confluent Cloud ，公司仍然需要对运营成本进行监督，而HK-Acceldata Data Observability for Kafka 解决方案可以很好的解决这一问题。Confluent Cloud 的用户可以使用HK-Acceldata等连续数据可观测性平台为其提供的额外可见性和监控，从而降低用户的总拥有成本（TCO）。具体内容可以参考HK-Acceldata Data Observability for Kafka 解决方案：https://hongcloudtech.com/acceldata-for-kafka/
花絮3 云服务三层架构 Cloud 3 Layer 释义

热度 2

dylan_lanx_918427304

2018-9-21 12:56

1781 次阅读|

0 个评论

以大卖场类比，IAAS就是大卖场的大楼，PAAS就是大卖场的管理办公室，SAAS就是各个专卖店。 In terms of malls, IAAS is the building of the mall, PAAS is the management office, and SAAS is the specialty store. 以电脑类比，IAAS就是电脑的硬件，PAAS就是windows，SAAS就是各种软件。 In terms of computer, IAAS is the hardware of a computer, PAAS is a windows OS, and SAAS is a variety of software. 所谓服务，就是他有你需要的产品，但需要钱，你需要产品，得价钱买。花钱得到了你需要的产品，而且卖方的态度很好，你有一种大爷般的感觉，很爽。不论你有几种几层架构，都会让客户舒舒服服的，有一种云里雾里的感觉，这就是“云服务”。 The so-called service is that he has the products you need, and he needs money. You need the products and you should buy them. You spend money to get the products you need, and the seller's attitude is very good, you feel you are GOD, It is very good. No matter how many layers of cloud service architecture, thecustomersis comfortable. There is a feeling of"cloud service."
花絮3 云服务三层架构 Cloud 3 Layer

热度 2

dylan_lanx_918427304

2018-9-21 09:47

1605 次阅读|

0 个评论

我们经常到大型商场买日用品。一个商场，首先要有一个建筑物，摩天大楼或者地下广场，有对应的水、电、空调等配套设施，这主要是为商铺入驻服务的；然后要有运营服务机构，招商入驻，同时提供保洁、安全等服务配套，这主要是为商铺入驻服务的；最后是各商铺或专卖店，通过各自不同的产品或服务吸引消费者。 We often buy daily necessitiesin largemall. A mall must have a buildingfirst, a skyscraper or an underground plaza, and there arebasicfacilities such as water, electricity, air conditioning, etc., which areservefor the shopsmainly; then there must be an operation service agency, attractingshops, and providing cleaning, security and other services,; Finally,there must have kinds ofshops whoattract consumerwithdifferent products or services. 我们经常使用电脑，首先要有电脑，包括主机、屏幕、键盘、鼠标等，我们习惯称之为硬件；然后需要有操作系统，就是windows；再然后我们使用软件，上网用浏览器，写文件用word等。 We often use computerwhichincludescase, screens，keyboards，mice, etc. We are used to calling it hardware; then we need an operating system, which is windows; then we usedifferentsoftware, use the browser tovisit web, usewordto write fileand so on. 上述两个不同的例子其中有很多相似的地方，首先需要有基本设施，然后需要有充分管理使用基本设施的工具，形成一个可通用的平台，进而，提供个性化的服务。 There are many similarities in the two different examplesabove.There is a need for basic facilitiesfirst, and then toolsare usedthat manage the infrastructure to form a universal platform,thereforeprovide personalized services. 云平台同样如此，基础设施即服务IAAS、平台即服务PAAS、软件即服务SAAS组成了云平台的三层架构。 It is same asthe cloud platform. Infrastructure-as-a-service IAAS,Platform-as-a-service PAAS, andSoftware-as-a-service SAAS form the three-tier architecture of the cloud platform. Fig prifix3.1 Cloud 3 layer
花絮2 云 Cloud 云容 Cloud volume

热度 22

dylan_lanx_918427304

2018-9-21 09:45

1661 次阅读|

0 个评论

自动有了云的概念以来，许多公司都自称做了云系统，提供云服务。凡是做互联网的公司，不自称云，都无颜见江东父老。连养老院建一个网站也会叫做云养老。 Since the concept of the cloud has beenproposed, many companies have claimedthat they program the cloudsubsystemsandprovide cloud services. Anyinternetcompanydoes not claim to be a cloudsystemwhich would be embarrassed. Even a nursing homewhobuild a website will be called cloud pension. 那么，什么规模的网络服务可以称之为云？ So, what scale of network services can be called a cloud? 投资额千万，用户规模千万，团队百人，沉淀时间三年，仅仅具备了云的雏形。这样规模的云在天空中风一吹，就会消散。更多的所谓云服务，仅仅是一缕轻烟，还可能带着刺鼻的气息。 The investment amount is tens of millions, the user scale is ten million, the team is 100 people, and the build time is three years. It only has the prototype of the cloud. Clouds of this size will dissipate as the wind blows in the sky. Moreservicesso calledcloudare just a light smoke which may also have a pungent smell.
花絮2 云 Cloud 云态

热度 2

dylan_lanx_918427304

2018-9-20 20:07

2360 次阅读|

0 个评论

我们经常会网购、聊天、存储、邮件等。对我们来说，这是非常繁琐的重复的活动，对于一个服务器集群来讲，处理每个人的这些日常活动所消耗的资源微乎其微，即使一台普通的电脑都可以胜任成千上万类似的请求。但是我们估计一下，当X亿的操作同时进行时，对应的资源需要多大？想象一下，每一下上网的请求是一滴小水珠，当几亿滴小水珠汇集在一起以后，是否形成天空中美丽的云？ We oftengoshopping, chat, mail, and moreon web.This is a very tedious and repetitive activityfor us.The resources consumed to handle each of these people's daily activities are minimalfor a server cluster, even anormal computer can handle thousands of requests .How much resourcesbeneed when thebillionsoperations are carried out simultaneously?Everywebrequest is a waterdroplet and whenbillions of drops of water come together,itformsa beautiful cloud in the sky. 分布式是云的基础，分布式的核心在于将巨大的计算能力。它是利用诸多联网计算机CPU 的闲置处理能力来解决大型计算问题的一种计算科学。分布式基础上产生了云，区别在于分布式解决的问题是大而专，云解决的问题是小而杂。 Distributed is the foundation of the cloud, and the core of the distributedis the great computing power. It is a computational science that solves large computational problems by using the idleCPUprocessing power of computers on the Internet. The cloud is generated on a distributed. The difference is that the problems solved bydistributedare large and specialized, and the problems solved by cloud are small and mixed. 根据使用的种类，云计算还有一些细分的概念。例如，云存储是指将文件或数据存在网上，云办公是指网络端的办公系统等。根据云计算资源的使用属性分类，公有云指的是服务于大众的云资源，私有云是服务于某指定客户的云资源。 According to the service property, cloud computing has some subdivision division. For example,storagecloud refers to thedataexistence on the Internet, andofficecloud refers to the office system on the network side. According to the user of cloud computing resources, a public cloud refers to a cloud resource serving the public, and a private cloud is a cloud resource serving a specified customer.

更多...

标签: cloud