
当一家公司的日均处理的数据流量在PB级别时,巨大的任务量和数据量会对消息队列(MQ)dump的稳定性和准确性带来极大的挑战。针对这一问题,火
中关村在线 2023-03-30 17:57:05
当一家公司的日均处理的数据流量在PB级别时,巨大的任务量和数据量会对消息队列(MQ)dump的稳定性和准确性带来极大的挑战。
【资料图】
针对这一问题,火山引擎数智平台推出的大数据研发治理套件DataLeap,可以为企业提供完整解决方案,帮助解决MQ dump在极端场景中遇到的数据丢失问题。
例如,当HDFS(一种分布式文件系统)集群某个元数据节点由于硬件故障而宕机。那么在该元数据节点终止半小时后,运维工程师虽然可以通过手动运维操作将 HDFS 切到主 backup 节点,使得HDFS 恢复服务。但故障恢复后, MQ dump 在故障期间可能有数据丢失,产出的数据与 MQ 中的数据不一致的情况。
此时,技术人员可以在收到数据不一致的反馈后,立即借助火山引擎DataLeap进行故障排查。目前,火山引擎DataLeap基于开源Flink,已经实现了流批一体的数据集成服务。通过Flink Checkpoint的功能,Flink 在数据流中注入 barriers 将数据拆分为一段一段的数据,在不终止数据流处理的前提下,让每个节点可以独立创建 Checkpoint 保存自己的快照。
图:Flink Checkpoint 基于 Chandy-Lamport 算法保障数据的一致性
据介绍,每个 barrier 都有一个快照 ID ,在该快照 ID 之前的数据都会进入这个快照,而之后的数据会进入下一个快照。在排查过程中,火山引擎DataLeap基于对Flink 日志查看以及HDFS 元数据查看,可以率先定位症结所在:删除操作的重复执行造成数据丢失。进一步解释就是,在故障期间,写入数据前的删除操作在 HDFS NameNode 上重复执行,将写入的数据删除造成最终数据的丢失。
图:使用文件State 前后处理流程对比
溯源后,用户可以通过火山引擎DataLeap选择使用文件State(当前的 Checkpoint id 和 task id)解决该问题。据悉,使用文件 State 后,企业在 Notify 阶段与 HDFS 交互的 metrics(打点监控系统)的平均处理时间减少了一半。
目前,企业可以通过火山引擎DataLeap体验到上述Flink Checkpoint实践与优化方案,提升数据价值交付中的效率和质量。(作者:韩江)
当一家公司的日均处理的数据流量在PB级别时,巨大的任务量和数据量会对消息队列(MQ)dump的稳定性和准确性带来极大的挑战。针对这一问题,火
近日,由中交一公局电气化工程有限公司参建的哈尔滨地铁3号线丁香公园站“三临验收”顺利通过,为下一步样板段施工奠定了强有力的基础。验收组
豆奶是我们日常生活中最常见的饮品之一,营养丰富、口感绝妙,深受大众喜爱。市场上活跃着诸多大众耳熟能详的豆奶品牌,消费者的选择十分丰富
高盛分析师表示,现在谈论降息还为时过早,并预计美联储将在5月加息25个基点。本文源自:金融界
Hadoop是一个分布式系统基础架构,可以高效地存储和处理大规模的数
估计很少有朋友关注过《多情》中的父子关系,其实如果仔细读原著你就会发现,书中很多人都非常淡漠,一锅粥挑选了四对,最冷血的父亲就连上官
无锡王某因不满意自己花109 82元网购的藕粉,又花了1 8万余元,下单1209袋方便面、781包饼干、396瓶饮料和94罐燕麦片,在商家寄
中新网3月30日电据日本共同社当地时间29日报道,东京电力公司(东电)使用机器人对福岛第一核电站1号机组安全壳内部调查时发现,支撑反应堆压力
船山的春天,春风和煦,百花盛开,处处皆美景。黄的菜花、粉的桃花、红的梅花、绿的草地、碧的春水……构成一幅灿烂无比的美丽画卷。绿水青山
近日苏州市交通局启动市辖区内驾培资金个人账户监管服务推广江苏银行驾校通凭借安全便捷的服务优势成功在苏州市64家驾校上线记者了解到江苏银
这两天华中科技大学“新校门”突然在社交平台刷屏还有网友说华中科技大学改名为“长江理工大学”这是怎么回事?华中
如何提高孩子抵抗力,提高免疫力的方法很多人还不知道,现在让我们一起来看看吧!解答:1、吃均衡的饮食。2、人体需要的营养是从饮食中获取的
【大美中国】 随着气温回升,贵州省遵义市余庆县各大茶场迎来“明前茶”采摘高峰,茶农和制茶工人忙着采摘、制茶,供应市场。
1、意思不同板块:大地构造理论指由地质上的活动地带划分的岩石圈的构造单元。2、全球共分为六大板块,即欧亚板块、太平洋板块
1、账号1021289043密码1021289043。