2.1 通过设置 kafka topic 的 partition =1 来处理延迟的乱序数据
2.3 利用数据湖表格格式处理(如 apche hudi、paimon)
一、关于延迟的一些概念
延迟是数据从网络上的一个点传递到另一个点所需的时间。假设北京的服务器 A 向成都的服务器 B 发送一个数据包。服务器 A 在格林威治标准时间 10:20:00.000 发送数据包,服务器 B 在格林威治标准时间 10:20:00.125 接收数据包。此路径上的延迟量是这两个时间之间的差值:0.125 秒或 125 毫秒。
大多数情况下,延迟是在用户设备(“客户端”设备)和数据中心之间测量的。该测量值可帮助开发人员了解网页或应用程序为用户加载的速度。
尽管 Internet 上的数据以光速传播,但由于 Internet 基础设施设备造成的距离和延迟的影响,延迟永远无法完全消除。但延迟可以并且应该最小化。大量的延迟会导致网站性能下降, 对 SEO 【“Search Engine Optimization”(搜索引擎优化)】产生负面影响 ,并可能导致用户完全离开网站或应用程序。
网络延迟的主要原因之一是距离,特别是发出
原文链接:https://blog.csdn.net/high2011/article/details/134801029?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522171836857916800222819384%2522%252C%2522scm%2522%253A%252220140713.130102334.pc%255Fblog.%2522%257D&request_id=171836857916800222819384&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~blog~first_rank_ecpm_v1~times_rank-23-134801029-null-null.nonecase&utm_term=%E6%88%90%E9%83%BD%E6%9C%8D%E5%8A%A1%E5%99%A8
原创文章,作者:优速盾-小U,如若转载,请注明出处:https://www.cdnb.net/bbs/archives/32353