GPU 加速的一些结果

1. 卷积模型

1.1 模型结构

模型修改成Pytorch架构如下：

class BaseModel(nn.Module):
    def __init__(self):
        super(BaseModel, self).__init__()
        self.fc1 = nn.Linear(84, 16)
        self.fc2 = nn.Linear(16, 1)
        self.conv1 = nn.Conv1d(1, 8, kernel_size=3, padding=1)
        self.conv2 = nn.Conv1d(8, 16, kernel_size=3, padding=1)
        self.pool = nn.MaxPool1d(kernel_size=3)

    def forward(self, x):
        x = F.mish(self.fc1(x))
        x = x.view(-1, 1, 16)
        x = F.mish(self.conv1(x))
        x = self.pool(x)
        x = F.mish(self.conv2(x))
        x = torch.max(x, dim=2)[0]
        x = self.fc2(x)
        return x

此处模型的结构没有改变，始终是一维的模型，由全连接层、一维卷积层、池化层组成。模型的激活函数由之前的swish改变为了mish，因为pytorch没有原生的swish函数支持。

1.2 数据生成

由于实验数据为一维数据，因此直接使用下面代码生成随机数据，可以直接生成1e6个随机数据点。

train_data = torch.randn(1000000, 84)
train_labels = torch.randn(1000000, 1)

val_data = torch.randn(2000, 84)
val_labels = torch.randn(2000, 1)

1.3 结果分析

将生成的数据放入模型中进行10个epoch的训练，结果如下：

Batch	GPU	CPU
16	1619.64	2002.33
512	170.05	237.91
1024	125.06	209.44
4096	105.79	161.89

此外如果使用的数据集大小较小（1e3~1e5），CPU的运行速度会比GPU更快。

从该模型的运行时间结果出发，对比之前使用GRU模型运行的时间我们可以得到如下两个结论：

使用较少的数据集GPU对与模型加速不明显，甚至可能降低；
一维模型的GPU提速效果远不如二维的模型。反映到结果是在一维数据集上的模型提升速度只有30%左右，但是在使用多特征GRU模型时GPU的对模型速度的提升有10000%。

2. 注意力模型TabNet

2.1 模型结构

TabNet的模型直接使用pytorch-tabnet实现，github的网址为github。模型的参数定义如下：

model = TabNetRegressor(
    n_d=17,
    n_a=17,
    n_steps=1,
    gamma=1.5,
    n_independent=2,
    n_shared=2,
    seed=0,
    device_name=device_name
)

此处使用的模型结构和原本tensorflow的模型结构稍有不同，不过对于计算的影响不大。此外数据生成过程和上面的模型一样，都是使用随机数生成数据，并且保持了数据量的一致。

2.2 结果

下面统计训练10个epoch花费的时间：

Batch	GPU	CPU
128	1947	1893
512	512	719
1024	405	531
4096	252	405

根据这个结果同样可以得到结论：

当batch_size增大之后GPU的提速效果明显提升，当batch_size为4096时提速效果约为100%；
总体来说GPU的提速效果不是非常明显（30%~100%）。结合上面实验的结果可能是输入的特征均为一维，所以难以形成大量的矩阵运算导致。

yxr620 / cnn_cuda Goto Github PK

cnn_cuda's Introduction

GPU 加速的一些结果

1. 卷积模型

1.1 模型结构

1.2 数据生成

1.3 结果分析

2. 注意力模型TabNet

2.1 模型结构

2.2 结果

cnn_cuda's People

Contributors

Watchers

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent