Coder Social home page Coder Social logo

dromara / hertzbeat Goto Github PK

View Code? Open in Web Editor NEW
5.1K 60.0 897.0 280.27 MB

Apache HertzBeat(incubating) is a real-time monitoring system with agentless, performance cluster, prometheus-compatible, custom monitoring and status page building capabilities.

Home Page: https://hertzbeat.apache.org/

License: Apache License 2.0

Java 66.07% JavaScript 3.13% CSS 0.20% Shell 0.60% Dockerfile 0.09% TypeScript 13.18% HTML 8.59% Less 7.89% Batchfile 0.19% Smarty 0.05% Makefile 0.02%
monitor monitoring prometheus self-hosted status status-page uptime-monitoring alerting cloud database devops grafana linux metrics mysql notifications observability server uptime zabbix

hertzbeat's People

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

hertzbeat's Issues

希望有分组/tag功能

作为APM希望可以把不同的项目通过分组/tag汇总起来。
例如一个项目既有http监控,也有ping监控,也有tcp监控;这个项目任何一个服务出问题就可以通知某个人。
另外所有的项目最好都加上个说明字段,以便监控人员知道这个是干什么用的。

website monitor - [Metrics Collect]: Illegal character in path at index

采集器对某个website网站监控进行采集时异常,初步判断URL不规范导致
异常堆栈:
2022-03-03 23:13:56.524 [6134408644919296-website-summary-6524] ERROR com.usthe.collector.dispatch.MetricsCollect Line:132 - [Metrics Collect]: Illegal character in path at index 35: https://xxxxxxxxx.com:80/ccccccday/ .
java.lang.IllegalArgumentException: Illegal character in path at index 35: https://xxxxxxxxx.com:80/ccccccday/
at java.net.URI.create(URI.java:852)
at org.apache.http.client.methods.RequestBuilder.setUri(RequestBuilder.java:345)
at com.usthe.collector.collect.http.HttpCollectImpl.createHttpRequest(HttpCollectImpl.java:457)
at com.usthe.collector.collect.http.HttpCollectImpl.collect(HttpCollectImpl.java:81)
at com.usthe.collector.dispatch.MetricsCollect.run(MetricsCollect.java:126)
at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149)
at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624)
at java.lang.Thread.run(Thread.java:748)
Caused by: java.net.URISyntaxException: Illegal character in path at index 35: https://xxxxxxxxx.com:80/ccccccday/
at java.net.URI$Parser.fail(URI.java:2848)
at java.net.URI$Parser.checkChars(URI.java:3021)
at java.net.URI$Parser.parseHierarchical(URI.java:3105)
at java.net.URI$Parser.parse(URI.java:3053)
at java.net.URI.(URI.java:588)
at java.net.URI.create(URI.java:850)
... 7 common frames omitted

希望自定义监控的自定义权限更高些

1.很多开发人员,非专业的服务器运维人员,更多的时候是Free -h 后回去自己写正则等拼凑服务器,去用AWK 这些难度很大。希望可以将parseType 这里加个自定义,再可以用反射或者JS引擎 ,动态的解析命令,返回结果
2.采集的时候configmap 能不能写成一个配置数组或者map,协议那边直接写下标或者key去取,少点配置。
3.碰到一些综合的采集,比如先执行SSH,再执行SQL,甚至还会调一些HTTP请求的,这边能用反射拓展开放吗?

docer-compose.yaml may be has error

volumes:
- ./conf/application.yml:/opt/hertzbeat/config/application.yml
- ./conf/sureness.yml:/opt/hertzbeat/config/sureness.yml

Additional context
执行 docker-compose时
image
看起来是挂载卷的volumes ,参数不能是文件只能是目录吧

td数据库入库不全

image
配置了100个左右监控,采集日志都有。但是有一半左右没有入库。造成监控历史图表不全。

[alerter]告警转发支持指定监控类型,告警级别

Is your feature request related to a problem? Please describe.
目前告警转发是直接转发所有触发告警,常见情况是需要将指定某些告警信息转发给指定接收人。

Describe the solution you'd like
我们需要在告警转发时,支持选择配置指定转发哪些监控类型的告警,和哪个告警级别的告警信息。

[feature]JMX协议监控支持

Is your feature request related to a problem? Please describe.
支持通用JMX协议,监控JVM tomcat jetty 等监控类型

[feature]支持ElasticSearch监控类型

Is your feature request related to a problem? Please describe.
支持ElasticSearch监控类型
使用单链接直连ES,获取其性能数据指标,基本信息指标

仪表盘最近告警列表显示错误

Describe the bug
仪表盘最近告警列表未显示数据

Used Version
1.0 beta7

To Reproduce
1、使用浏览器,后退(退至非仪表盘页面)
2、然后前进到仪表盘,最近告警列表未展示。
3、查看接口,发现返回了数据,但是前端页面未展示
4、前端定时器会刷新此问题,所以只在第一次退至仪表盘会显示错误。

Expected behavior
应该展示4条报警记录

Screenshots
image

Additional context
前端BUG

增加告警恢复持续时间功能

增加告警恢复持续时间功能
描述:第一次监控发现失败后记录时间
等到监控恢复的时候,在告警内容里面加一个持续时间

「End User Registration」

Who is using Apache HertzBeat?

Thank you very much for your attention and support to hertzbeat. This is the biggest motivation for us to move forward.

The original intention of this issue

  • Learn more about the practical use scenarios of hertzbeat and listen to the community to make hertzbeat better.
  • We want to attract more partners to contribute to hertzbeat.

We look forward to your registration

You can refer to the below:

Organization: TanCloud
Location: On the Moon
Contact: [email protected]
Purpose: xxxxx

Thanks again for your participation!

[feature]支持Redis数据库监控类型

Is your feature request related to a problem? Please describe.
支持Redis数据库监控类型

考虑使用单链接直连Redis 获取性能指标数据,版本数据,容量数据指标

[script]window环境bat启动停止服务脚本

Is your feature request related to a problem? Please describe.
提供Windows环境下使用.bat脚本对hertzbeat服务进行启动和停止。

Describe the solution you'd like
需要编写对应的启动脚本startup.bat 停止脚本 shutdown.bat
脚本需要考虑到端口占用和服务是否已经启动停止状态
位于 script/assembly/server/bin 目录下

dashboard重构

  • 直观看到异常监控
  • 直观看到最近异常告警
  • 监控类别数量

[feature]监控自动发现

Is your feature request related to a problem? Please describe.
大量监控如果手动在页面上配置添加会很麻烦

Describe the solution you'd like

如果能根据IP段或者其他条件扫描自动发现存在的服务,自动将其纳管到监控系统中,会大大减少运维工作量。

此需求目前看工作量较大,需要考虑 自动扫描,监控参数配置,对端应用默认端口关联,自动新增,监控重复判断规则等。

linux, database monitors always timeout alert

Describe the bug
linux, database monitors always timeout alert.

Used Version
v1.0-beta.6

To Reproduce
Steps to reproduce the behavior:

  1. Add Linux Monitor Or Database Monitor
  2. After 1 hour, click on Alert Center
  3. The Timeout Alert Happen.

2022-04-05 16 43 51

账号登录无限过期

一段时间不登陆后,自动退出,退出后再次登录输入账号密码登不上了,必须重启
输入账号密码后一直提示“未登录或登录已过期,请重新登录”,点一次提示一次
采用的是docker部署方式,v1.0-beta.6版本
登录问题1

[bug]页面全局监控搜索结果异常

Describe the bug
页面全局监控搜索:比如我的资源名称:TELNET_10.10.10.100_随便节点服务器_8088 ,我搜索中文“随便”等,可能没有结果,搜索“8088” 也没有结果
see #18

Used Version
v1.0.beat5

Expected behavior
正确搜索监控。

系统时间存在13个小时的时差

tdengine安装

docker run -d -p 6030-6049:6030-6049 -p 6030-6049:6030-6049/udp -v /opt/taosdata:/root/hertbeat/taos --name tdengine -e TZ=Asia/Shanghai tdengine/tdengine:2.4.0.12

hertzbeat安装

docker run -d -p 7070:1157 -v /root/hertzbeat/application.yml:/opt/hertzbeat/config/application.yml -v /root/hertzbeat/sureness.yml:/opt/hertzbeat/config/sureness.yml --name hertzbeat tancloud/hertzbeat:1.0-beta.7

mysql使用系统自带
mysql时间:
image

Table does not exist

TDengine ERROR (362): sql: SELECT ts, instance, responseTime FROM telnet_summary_7014836797177856 WHERE ts >= now - 6h order by ts desc, desc: 这是怎么回事呢

[bug]tdengine 插入SQL含有特殊字符值时异常

Describe the bug
TDengine ERROR (216): sql: INSERT INTO linux_cpu_6429019847000064 USING linux_cpu_super TAGS (6429019847000064) VALUES (1647252044006, '', 'Intel(R) Xeon(R) Platinum 8358P CPU @ 2.60GHz', 2.0, NULL, '2', 3.0), desc: syntax error near ', '2', 3.0)' () expected)

Used Version
v1.0.beat5

Expected behavior
sql data insert success

标签扩展

下载本地体验了一下,还是挺不错的~本人很喜欢 👍

macOS 貌似使用 docker 算是比较好的方案, 除了 TDengine 我都在本地运行~
TDengine 不用 docker ,说实话,我在本地 macOS 环境貌似无法运行。
最终我把 TDengine 搭建在了我的私人服务器上,才得以完美运行。

建议:
关于监控维护列表里,能增加标签类的设置和过滤功能嘛?有时候一台服务器往往会部署多台应用什么的,不同的应用不同的端口~ 🥺

当然了,也能增加上其他一些查询过滤条件,比如 监控 Host、监控名称、端口 这样的条件~

[feature]网站监控支持关键字计数

Is your feature request related to a problem? Please describe.
网站监控支持关键字计数
用户设置关键字keyword,监控网页页面是否包含此关键字,此关键字数量。

升级脚本

随着版本一次次升级,新增特性功能、Bug 修复等,涉及到数据库表的调整时,能一并提供数据库表的升级脚本,像我之前刚开始使用,觉得不错,维护了大量监控数据,现在咱们的数据库表结构有变化,我需要手动迁移数据,挺费时间的。

每次数据库调整时,能一并提供数据库与上一次的变化,虽然我可以将当前的数据库表结构导出,与新的数据库脚本对比,但是导出后顺序也不一样,最终还是要从提交记录上找到之前的,也挺费时间。

如果能在一并提供数据库与上一次的变化的同时,也一并提供旧数据迁移的脚本,会更好!

假如新数据表字段是必填等信息,可以给予默认值,当然的,我们也可以自行更改默认值!

表达式计算值带有空格的问题

Describe the bug
当我自定义的yml中,别名表达式计算值的时候 如果yml带了空格会导致我的表达式在计算的时候有值也拿不到

Used Version
1.0.7

[feature]I18N国际化

Is your feature request related to a problem? Please describe.

  • 网站内容国际化,支持中文,英文
  • 开源代码国际化,代码注释需中文一遍 英文一遍
  • ISSUE国际化 使用翻译机器人翻译
  • 使用文档,README国际化

深色主题适配问题

  1. 监控详情页面深色主题未适配
  2. 右上脚告警数铃铛未适配
  3. 仪表盘字体颜色

希望可以自动建立运维采集最小权限的账号

在运维管理规范的企业中,是不允许root账户远程直接登录采集的。而像一些数据库,比如Oracle,非root需要逐个对相关表或视图赋权后才可以执行系统级别查询。类似的linux会因为环境量和用户组拒绝执行一些指令。而指令增多后,不仅要排查问题是哪个语句出问题,还要联系运维人员赋权添加权限。
希望初始化的时候录入root账号,选择自动的建立或赋权,采集账号各类权限,系统不保存root用户的信息。
并且改写采集规则时候,需要后续继续赋权。

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.