Flink简介
发布日期:2021-05-04 13:50:05 浏览次数:18 分类:技术文章

本文共 491 字,大约阅读时间需要 1 分钟。

Flink是什么

Apache Flink是一个框架和分布式处理引擎,用于对无界和有界数据流进行状态计算。

为什么选择Flink

1.流数据更真实地反映了我们的生活方式

2.传统的数据架构是基于有限数据集的
3,低延时、高吞吐,结果的准确性和良好的容错性

流处理的发展演变

事务处理

在这里插入图片描述

分析处理

将数据从业务数据库复制到数仓,再进行分析和查询

在这里插入图片描述

流处理的演变

有状态的流式处理

在这里插入图片描述

lambda架构

用两套系统,同时保证低延迟和结果准备

在这里插入图片描述

Fink

在这里插入图片描述

Flink的主要特点

事件驱动

在这里插入图片描述

基于流的世界观

在Flink的世界观中,一切都是由流组成的,离线数据是有界的流;实时数据 是一个没有界限的流:这就是所谓的有界流和无界流。

在这里插入图片描述

分层API

越顶层越抽象,表达含义越简明,使用越方便

越底层越具体,表达能力越丰富,使用越灵活
在这里插入图片描述

Flink的其它特点

支持时间事件(event-time)和处理时间(processing-time)语义

精确一次(exactly-once)的状态一致性保证

低延迟,每秒处理数百万个事件,毫秒级延迟

与众多常用存储系统的连接

高可用,动态扩展,实现7*24小时全天候运行

上一篇:阿里一二三面、HR面面经-后台
下一篇:leetcode 652. 寻找重复的子树 题解 java实现

发表评论

最新留言

网站不错 人气很旺了 加油
[***.192.178.218]2025年03月15日 16时17分40秒