DataX集成可视化页面,选择数据源即可一键生成数据同步任务,支持RDBMS、Hive、HBase、ClickHouse、MongoDB等数据源,批量创建RDBMS数据同步任务,集成开源调度系统,支持分布式、增量同步数据、实时查看运行日志、监控执行器资源、KILL运行进程、数据源信息加密等。
Go to file
2019-11-26 21:11:18 +08:00
datax-admin 调度中心、执行器更新 2019-11-26 21:11:18 +08:00
datax-core 调度中心、执行器更新 2019-11-26 21:11:18 +08:00
datax-executor 调度中心、执行器更新 2019-11-26 21:11:18 +08:00
doc 调度中心、执行器更新 2019-11-26 21:11:18 +08:00
.gitignore 整合xxl-job 2019-11-18 15:42:55 +08:00
pom.xml 调度中心、执行器更新 2019-11-26 21:11:18 +08:00
README.md 文档修改 2019-11-23 15:47:31 +08:00

Java

DataX-Web

DataX阿里的开源的时候并未提供任何可视化界面我们在使用的过程中需要将Json配置文件放到Datax的job路径下随着业务的增加配置文件不方便管理和迁移并且每次执行都需要记录命令。 目前DataX只支持单机版多节点之间的协作不能控制我们希望存在一款有友好的可视化界面支持定时任务,支持分布式的数据同步利器,这也是该项目的目标。

System Requirements

  • Language: Java 8
  • Environment: MacOS, Windows,Linux
  • Database: Mysql5.7
  • Python2.7(支持Python3需要修改替换datax/bin下面的三个python文件替换文件在doc/datax源码阅读笔记/datax-python3下)

TODO

  • springboot重构项目
  • 集成swagger方便调试
  • 集成mybatis plus和Mysql数据库存放应用数据
  • 网页端修改并持久化job配置的json到数据库
  • 网页端实时查看抽取日志类似Jenkins的日志控制台输出功能
  • 实时查看抽取日志BUG功能修复
  • job运行记录展示页面操作停止datax作业开发中
  • 实现datax分布式作业开发中
  • 实现datax集成定时任务开发中
  • 网页端各种读写插件模板生成,可以在页面组装使用
  • 实现部分写插件支持自动建表功能

UI

前端github地址

Quick Start

1. 下载datax打包之后的文件或者github拉取datax代码打包配置环境变量

 DATAX_HOME=G:\learndemo\springboot-datax\datax\bin

2. 执行datax-web/db下面的sql文件并修改application.yml数据库配置信息

3. application.yml配置数据抽取日志文件保存路径

etlLogDir: D:\temp\logs\datax-web\

4. idea启动 datax-admin

5. 启动成功后打开页面

http://localhost:8080/index.html#/datax/job

6. 点击作业配置,创建作业

7. 完成创建作业之后,点击同步任务,选择任务,点击启动

8. 可以点击查看日志,实时获取日志信息

Contact us

QQ交流群 776939467