Coder Social home page Coder Social logo

combine-tensorflow's Introduction

Combine-Tensorflow: an improved Algorithm of Region Extraction and Multi-Scale Feature applied in Image Detection

build author language

环境要求

  • windows
  • python(3.6+)
  • google colaboratory

依赖包

tensorflow cuda

DataSet

实证数据集为pascal voc标准数据集和kitti实际道路数据集。
因为两个数据集都很大,不能直接上传,所以提供下载地址。
pascal voc数据集下载地址: http://host.robots.ox.ac.uk/pascal/VOC/index.html
kitti数据集下载地址: http://www.cvlibs.net/datasets/kitti/

文件夹结构和功能简介

--combine_pascal.py pascal voc0712数据集训练代码 这里把pascal voc2007和2012数据集同时作为训练集。
训练时必须修改:训练数据的tfrecords格式数据所在文件夹(dataset_dir)、网络参数权重ckpt文件所在文件夹(checkpoint_path)、 网络模型作用域(checkpoint_model_scope)、模型权重文件和结果指标events文件保存地址(model_dir), 其他超参数(如学习率,迭代次数,批量大小等)根据实际情况修改。

--combine_kitti.py kitti数据集训练代码
训练时必须修改:训练数据的tfrecords格式数据所在文件夹(dataset_dir)、网络参数权重ckpt文件所在文件夹(checkpoint_path)、 网络模型作用域(checkpoint_model_scope)、模型权重文件和结果指标events文件保存地址(model_dir), 其他超参数(如学习率,迭代次数,批量大小等)根据实际情况修改。

--combine_test.py 测试代码
测试时必须修改:数据名(dataset_name,本文是pascalvoc_2007或者kitti)、类别数(pascalvoc--21,kitti--4)、 测试数据的tfrecords格式数据所在文件夹(dataset_dir)、 训练好的网络参数权重ckpt文件所在文件夹(checkpoint_path)、模型权重文件和结果指标events文件保存地址(eval_dir), 其他超参数(如学习率,非极大值抑制阈值、目标阈值等)根据实际情况修改。

--tf_utils.py 其他操作合集代码
包含模型参数更新、学习率下降方式选择、权重文件导入指定参数权重等一些小的操作模块

--tf_convert_data.py 数据集转tfrecords
需要修改:数据名(dataset_name,pascalvoc或kitti)、数据原始图片格式所在文件夹(dataset_dir)、 输出数据名(output_name,pascalvoc或kitti)、输出tfrecords数据地址(output_dir)

--datasets 数据集操作
  --dataset_factory.py 数据工厂,直接调用指定数据集的程序
  --dataset_utils.py 数据格式转换
  --pascalvoc_2007.py pascal voc 2007数据集说明(数据类别,训练集测试集划分)
  --pascalvoc_2007_2012.py pascal voc 2007和2012数据集说明(数据类别,训练集测试集划分)
  --kitti.py kitti数据集说明(数据类别,标注文件信息)
  --pascalvoc_common.py pascalvoc数据集整体说明(标注文件信息)
  --kitti_to_tfrecords.py kitti数据集转tfrecords格式
  --pascalvoc_to_tfrecords.py pascalvoc数据集转tfrecords格式
  --voc_eval.py recall,precision等指标写入文件

--nets 网络结构
  --combine_net.py 融合模型的网络架构,处理pascalvoc数据集
  --combine_net_kitti.py 融合模型的网络架构,处理kitti数据集(相比pascalvoc数据集修改了候选框的尺寸设计)
  --custom_layers.py 一些常规层的设计,不能直接由tensorflow函数定义
  --nets_factory.py 网络工厂,直接调用指定网络架构的程序
  --np_methods.py 候选框的编码、选择、求交并比等
  --ssd_common.py 对真实目标进行预处理,使ground truth与预测结果对应

--preprocessing 预处理
  --pascal_preprocessing.py pascalvoc数据集预处理,包括尺寸变换、图片翻转、色彩变换等
  --kitti_preprocessing.py kitti数据集预处理,包括尺寸变换、图片翻转、色彩变换等
  --preprocessing_factory.py 预处理工厂,直接调用给定数据集的预处理函数
  --tf_image.py 图片预处理操作的具体函数定义
  --vgg_preprocessing.py 其他的一些预处理操作

--tf_extended 候选框处理
  --bboxes.py 候选框处理函数定义,包括候选框置信度排序、非极大值抑制、尺寸变换等
  --math.py 定义网络中的一些运算
  --metrics.py 计算precision,recall,ap,map指标的函数定义,对应tensorflow模型评估模块的度量(metric)
  --tensors.py 定义其他的张量运算

Output Example

Here are two examples of successful detection outputs:

combine-tensorflow's People

Contributors

maohye avatar

Watchers

James Cloos avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.