实时数仓Druid从kafka摄取数据

2022-06-19 13:48:46

准备

搭建好kafka
可正常访问查询节点的8888端口: http://hadoop04:8888

按部就班

新建一个摄取规范，定义你的数据从哪摄取、怎么摄取、摄取成什么样。
在这里插入图片描述选择kafka。

填写kafka消费者基本属性。
检查你的数据列是否完整。
将logTime列设置为时序列__time，格式yyyy-MM-dd HH:mm:ss。

如果不需要转换Transform 或 Filter，右下角按钮连点两次跳过。
然后看到默认生成的列：
count为预聚合到一行时的总记录条数。
sum_cnt为将cnt列以longSum长整型预聚合的累计和。

其中queryGranularity设置为HOUR，意思是时序列以小时为单位预聚合上面两个值。
在这里插入图片描述
以天为单位来分配segment。如果数据跨天将会新建一个segment，日期不同；如果当前数据条数大于配置的条数，将新建一个segment，日期相同序号递增。

没有要注意的地方，直接发布。
切换到Ingestion页面，看到生成一个Task。
在这里插入图片描述 Task启动一段时间后，Datasource出现。这个相当于关系型数据库的表。
点击右边的小扳手，选择查询SQL。

现在已经消费了64条，且当前cnt之和为22.

作者：.Mr Zhang
原文链接：https://blog.csdn.net/zhangtikang134/article/details/105125199
更新时间：2022-06-19 13:48:46

相关文章

Vue.js：响应式数据绑定的前端框架
js是一个轻量级的JavaScript前端框架，为构建现代化的Web应用提供了响应式数据绑定和组件化的开发思想
2023-05-18

PHP中的多态性
接口用于定义一组方法的规范，实现这些接口的类都必须实现这些方法。通过定义接口，我们可以让不同的对象实现相同的方
2023-05-18

Vue.js常用技巧
js是一个流行的JavaScript框架，广泛应用于Web开发中。使用vue使用vue使用vue使用vueco
2023-05-18

Vue开发：探究Vue.js中的两个生命周期函数created和mounted
js中的两个生命周期函数created和mounted在created函数中，可以进行数据的初始化和事件的绑定
2023-05-18

随机文章

python 绘制多个散点图_Python-matplotlib 另类散点图绘制
01. 引言这篇推文还是python-matplotlib 散点图的绘制过程，涉及到的内容主要包括matplo
2022-09-14

JAVA 网络编程系列NIO -- ByteBuffer 堆内与堆外内存
【JAVA 网络编程系列】NIO -- ByteBuffer堆内与堆外内存【1】Unsafe 与堆外内存分配U
2022-09-14

Python 编程实现键盘输入元素进行排序（二）二叉树排序
今天咱们来将点不一样的排序方式——二叉树排序。这个排序方法比较有意思，而且也便于操作。二叉树排序二叉树排序的过
2022-09-14

Spring配置数据源
　　Spring在第三方依赖包中包含了两个数据源的实现类包。其一是Apache的DBCP.其二是C3P0.可以
2022-09-14

文章导航