Apache DolphinScheduler 的八大能力

Task以DAG形式关联,实时监控任务的状态

支持Shell、MR、Spark、SQL、依赖等10多种任务类型

去中心化设计确保系统的稳定、高可用。

工作流优先级、任务优先级,参数及局部自定义参数全局

工作流可定时、依赖、手动、暂停/停止/恢复

完善的系统服务监控,任务超时告警/失败

支持补数、多租户、日志在线查看及资源在线管理

支持每日十万数据量级任务稳定运行

Apache DolphinScheduler 新架构图

- 数据库减压,减少极端情况下可能造成的调度延时

- Worker 去 DB 操作,职责更单一

- Master 和 Worker 直接通信,降低延时

- Master 多种策略分发任务

Apache DolphinScheduler 的四大优势

高可靠性

去中心化的多 Master和 Worker, 支持 HA 功能, , 实现超大规模任务调度,采用任务队列和自身保护机制来避免过载、不会造成机器卡死

简单易用

DAG 监控界面,所有流程定义皆为可视化,通过拖拽任务定制 DAG ,以API 与第三方系统对接、一键部署

场景丰富

支持暂停恢复操作. 支持多租户,更好的应对大数据 的使用场景,支持Spark, Hive, MR, Python, sub_process, Shell等多种任务类型

高扩展性

支持自定义任务类型,使用分布式调度器、调度能力随集群线性增长。Master 和Worker 支持动态上下线

Apache DolphinScheduler 的发展历程

Apache DolphinScheduler 的部分使用者

如何使用

开源地址

常见FAQ

加入社区

如何参与社区贡献

邮件列表

订阅邮件列表参与

报告缺陷

通过 GitHub issues 报告缺陷

文档

优化 DolphinScheduler 文档

Pull Request

提交 Pull requests 来修复问题