Coder Social home page Coder Social logo

codermrwei / bigdatas Goto Github PK

View Code? Open in Web Editor NEW

This project forked from bbossgroups/bigdatas

0.0 2.0 0.0 64.07 MB

this is a db-hdfs tools used to transfer big database datas to hadoop hdfs like sqoop,but bboss bigdata tool is very nice monitor and event drivered model,and high perfermance,support Distributed executor tasks Ability.

Home Page: http://www.bbossgroups.com

Batchfile 0.13% Shell 0.16% Java 51.87% CSS 22.62% HTML 0.25% JavaScript 21.81% ApacheConf 3.16%

bigdatas's Introduction

bboss group website:

http://www.bbossgroups.com

bboss group project blog:

http://yin-bp.iteye.com/

bboss大数据抽取工具功能特点如下:

1.实现db到hadoop hdfs数据导入功能,提供高效的分布式并行处理能力,可以采用数据库分区、按字段分区、数据库分区结合字段分区、分页(不建议)四种方式并行批处理抽取db数据到hdfs文件系统中;

2.能有效解决按字段分区抽取数据时,各分区数据不均匀导致作业任务处理节点负载不均衡的问题。

3.灵活的作业任务处理模式:可以增量方式执行作业任务,作业可以停止后重新执行,重新执行时只需执行未完成的作业任务,也可以全部重新执行所有作业任务;当停止作业后,可以在原有作业切分的基础进一步切分出子任务,然后再重新执行作业,提升系统处理数据效率。

4.作业处理服务器为每个作业分配独立的作业任务处理工作线程和任务执行队列,作业之间互不干扰

5.采用异步事件驱动模式来管理和分发作业指令、采集作业状态数据。

6.通过管理监控端,可以实时监控作业在各个数据处理节点作业任务的实时运行状态,查看作业的历史执行状态,方便地实现提交新的作业、重新执行作业、停止正在执行的作业、清除作业执行监控数据、同步作业任务执行状态等操作

工具架构拓扑图:

Bigdata Architecture

工具采用的技术体系:

1.Bboss ioc:轻量级ioc容器,ioc扩展属性配置语法

2.Bboss持久层:高效数据查询行处理器,灵活动态数据源管理(连接池数据源/非连接池数据源),表分区信息查询等,动态创建作业配置表和作业监控记录表

3.Bboss分布式事件框架:基于JGroups,提供异步分布式事件驱动模型,动态管理作业节点(服务节点和数据处理节点),包括作业节点的动态加入、动态离开等;在管理节点、数据处理节点之间分发和接收各种作业处理指令事件

4.Bboss mvc:实现监控管理应用模块,在监控服务节点中,通过mvc 容器启动监听器启动作业管理节点

5.Bboss序列化组件:用来将作业监控数据序列化存储到sqllite中的作业监控表,同时在查看作业执行历史时将序列化存储的作业监控数据还原为对象状态的监控对象,便于界面展示

6.Bboss 标签库,jquery等:实现监控管理应用的视图层

7.Hadoop Hdfs客户端:用来连接hadoop hdfs文件系统

8.Sqllite:在监控节点中保存作业配置,保存作业执行状态数据

9.Jetty:运行监控管理应用模块的web应用容器

10.Bboss应用执行容器:用来启动作业管理监控应用、作业数据处理应用、启动jetty容器

bboss大数据抽取工具源码github托管地址:

https://github.com/bbossgroups/bigdatas

版本源码和发布包下载地址:

https://github.com/bbossgroups/bigdatas/releases

操作使用文档

大数据抽取工具管理操作手册.docx.

bboss项目下载地址,参考文档:

http://yin-bp.iteye.com/blog/1080824

License

The BBoss Framework is released under version 2.0 of the Apache License.

bigdatas's People

Contributors

yin-bp avatar

Watchers

 avatar  avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.