Logo

分类:大数据

30 篇文章

ES集群滚动重启策略

前言ES集群千万不要一次性重启全部节点,会导致所有分片被置为unassigned_shards,重启后需要大量时间重新分配切片。这期间集群会处于red状态,不能写入任何新数据。这在生产环境中会导致灾难性的后果。综上,ES集群重启要采用轮流重启的方式。重启一个节点,等该节点重新加入并且集群状态变为gr...

MySQL连接报错No appropriate protocol (protocol is disabled or cipher suites are inappropriate)

Caused by: javax.net.ssl.SSLHandshakeException: No appropriate protocol (protocol is disabled or cipher suites are inappropriate)...

ES导入导出工具elasticdump简单使用说明

ES导入导出工具elasticdump简单实用说明elasticdump是一款开源的es数据导入与导出工具。项目地址:elasticdump安装elasticdump基于npm实现,可以使用npm进行安装,官方也提供docker镜像。npm安装:npm i elasticdumpdocker安装:d...

Logstash日期格式转化

logstash的date过滤插件,支持从字段里分析日期格式,然后放入@timestamp字段里。filter { date { match => ["create_at", "yyyy-MM-dd HH:mm:ss,SSS", &quo...

大数据概述及常见技术

前言​要说最近十年最流行的互联网名词,“大数据”绝对算一个。我们生活在这个信息时代,无时不刻不在产生数据。据统计,1992 年,全人类每天只产生 100GB 数据;时至今日,全球 70 亿人,平均每人每天产生的数据高达 1.5GB。面对海量的数据,怎样采集、加工、存储,并将数据转化为价值,成为了各大...

SQL拆分列中字符串的元素为每一行

SQL拆分列中的元素为每一行...

ClouderaManager部署

概述CDH (Cloudera’s Distribution, including Apache Hadoop),是Hadoop众多分支中的一种,由Cloudera维护,基于稳定版本的Apache Hadoop构建,并集成了很多补丁,可直接用于生产环境。Cloudera Manager则是为了便于在...

Doris编译与安装

背景Apache Doris是目前新兴的OLAP数据库,前身是百度开源的PALO项目,从命名就可看出,目的是要颠覆OLAP。官方如此介绍:Apache Doris是一个现代化的MPP分析型数据库产品。仅需亚秒级响应时间即可获得查询结果,有效地支持实时数据分析。Apache Doris的分布式架构非常...

FlinkOnYarn日志对接ELK

背景Flink支持多种部署模式,其中on Yarn模式是目前最成熟也是生产环境使用最多的部署方式。但在Flink on Yarn模式下,Flink任务会在不同的NodeManager节点上执行,所以Flink的执行日志会分散在不同机器上。我们通过FlinkWeb页面和YarnHistory页面是可以...

ES远程集群设置与使用

0 背景在生产环境中,我们先后搭建了两套ES集群,一套用于系统日志的采集,包括k8s组件的日志、网关日志、服务pod日志等;另一套用于业务系统信息的存储,如埋点信息、业务日志等。现在,我们想要统一的将两套集群管理起来,使用统一的Kibana面板对外做数据展示。在网上搜索解决方案,看到了ES的远程集群...