flume流程之SpoolDir-memory-hdfs
发布日期:2021-05-18 08:19:06 浏览次数:17 分类:精选文章

本文共 1196 字,大约阅读时间需要 3 分钟。

Flume 数据收集流程配置示例

1. Flume 组件配置

1.1 配置文件名称

a1.conf

1.2 源配置(spoolDir 源)

a1.sources.r1.type = spooldira1.sources.r1.spoolDir = /opt/apps/collect-app/logs/data/

1.3 通道配置(内存通道)

a1.channels.c1.type = memorya1.channels.c1.capacity = 1000a1.channels.c1.transactionCapacity = 100

1.4 触点配置(HDFS 存储)

a1.sinks.k1.type = hdfsa1.sinks.k1.hdfs.path = hdfs://mypc01:8020/mynews/%Y%m%d/%H%Ma1.sinks.k1.hdfs.filePrefix = newsa1.sinks.k1.hdfs.rollSize = 102400a1.sinks.k1.hdfs.rollCount = 0a1.sinks.k1.hdfs.rollInterval = 60a1.sinks.k1.hdfs.useLocalTimeStamp = true

1.5 组件关联

a1.sources.r1.channels = c1a1.sinks.k1.channel = c1

2. 启动说明

2.1 启动命令

flume-ng agent -c /usr/local/flume/conf -f /opt/apps/collect-app/scripts/collect-app-access-flume.conf -n a1 -Dflume.root.logger=INFO,console

2.2 平台依赖

  • 确保 Flumegres 类加载器已安装
  • 确保 Hadoop 集群和相关依赖已正确配置
  • 确保 SpoolDir 目录存在且有正确权限

3. 功能说明

  • 源配置:使用 SpoolDir 源,监控指定目录下的文件变化,默认每分钟创建一个文件,仅供测试用途
  • 通道设置:内存通道适合处理较低延迟和吞吐量的场景,单条文件处理能力为 1000 kB
  • 触点配置:将文件内容写入 HDFS 存储系统,文件存储路径为 /mynews/ 下按日期和时间戳分类
  • 滚动策略:文件每隔 60 秒滚动一次,默认文件大小为 102400 字节,最小文件大小为 0 字节
  • 时间戳设置:启用本地时间戳,文件路径包含时间戳信息 %Y%m%d/%H%M

4. 注意事项

  • 建议将 HDFS 服务器地址和端口根据实际环境进行调整
  • 调整内存通道容量和交易容量根据实际吞吐量需求进行优化
  • 确保目标 HDFS 目录有权限,并且文件नल够写入该目录
  • 建议在实际应用中增加错误处理机制和重载机制
上一篇:Shell date指令
下一篇:java Map

发表评论

最新留言

表示我来过!
[***.240.166.169]2025年04月20日 06时59分57秒

关于作者

    喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!

推荐文章

html上传图片直接保存到数据库中,Editor上传图片路径存入数据库中怎么弄? 2023-01-24
html游戏玩不了,WinXP网页游戏玩不了怎么办有哪些解决方法 2023-01-24
html转jsp_JSP详解 2023-01-24
ICLOUD储存空间要升级吗_有人像我一样需要恢复苹果手机icloud空间ios备份时 微信卡住不动了吗(已解决)... 2023-01-24
image unity 原始尺寸_Unity基础教程-对象管理(十一)——生命周期(Growth and Death)... 2023-01-24
iphone打字怎么换行_手持iPhone?你可能并不知道的小技巧! 2023-01-24
jaccard相似度_自然语言处理之文本相似度计算 2023-01-24
java 8 list对象属性判空_java ---- 认识类对象,属性和方法 2023-01-24
java http delete_java积累---HttpDelete请求方式传递参数 2023-01-24
java swing数据库,如何在Java swing中查看数据库结果集 2023-01-24
java xmpp 群聊,使用XMPPFramework openfire创建聊天室 2023-01-24
java 反义_java中一些常用的英语 2023-01-24
java 命令行 class_如何从命令行执行java .class 2023-01-24
java 字符编码过滤器_java web中字符编码的过滤器(Filter - 1) 2023-01-24
java 线程 栈_Java线程堆栈分析 2023-01-24
#pragma data_seg() 共享数据// MyData段 // 进程 // DLL 2023-01-24
#NOIP前数学知识总结 2023-01-24
java书籍_还搞不定Java多线程和并发编程面试题?你可能需要这一份书单! 2023-01-24
java序列化_java对象的序列化和反序列化 2023-01-24
java开发区块链_用Java代码实现区块链 2023-01-24