流式计算,就是处理数据流,实时计算
流式计算,就是处理数据流,实时计算。批量计算是统一收集数据,存储在数据库中,然后批量处理数据的数据计算方法。
主要体现在以下几个方面:
(1)数据时效性不同:实时、低延迟的流式计算, 非实时、高延迟的批量计算。
(2)不同的数据特征:流式计算的数据通常是动态的,没有边界的,而批处理的数据通常是静态的。
(3)不同的应用场景:流式计算应用于实时场景,时效性要求高的场景,如实时推荐和业务监控…批量计算一般称为批处理,应用于实时要求低、离线计算、数据分析、离线报表等场景。
(4)不同的操作方式:流式计算任务继续执行,批量计算任务一次性完成
流式计算的价值业务方可以在更短的时间内挖掘业务数据的价值,并将这种低延迟转化为竞争优势。
例如,在使用流式计算的推荐引擎中,用户的行为偏好可以在更短的时间内反映在推荐模型中,推荐模型可以以更低的延迟捕获用户的行为偏好,以提供更准确和及时的推荐。流式计算之所以能做到这一点,是因为传统的批量计算需要数据积累,然后在积累一定数量的数据后进行批量处理;流式计算可以随时处理数据,有效减少处理延迟。
请先 登录后发表评论 ~