使用repvgg训练，然后参数deploy为true，即改成单路推理结构时，出现训练无法收敛的情况？是不是由于每一次训练都直接转成了单路结构的原因？

Question

<a target="_blank" rel="noopener noreferrer" href="https://private-user-images.githubu

Bobo-y · Answer

<a class="user-mention notranslate" data-hovercard-type="user" data-hovercard-url="/us

wjli-debug · Answer

那么对于这个的解决思路是不是应该是训练的时候要一直保持dep参数为false，那么等训练完成之后再转为推理结构，而不能在创造repvgg结构的时候直接使用deploy=Tr

wjli-debug · Answer

因为我看到repvgg官方有提供switch_to_deploy转化的代码，应该是训练的时候要保持deploy参数为false，即一直分支训练，到完成之后再单独进行conv

Bobo-y · Answer

<a class="user-mention notranslate" data-hovercard-type="user" data-hovercard-url="/us

wjli-debug · Answer

但是我在将保存使用repvgg训练保存的best.pt进行转化为推理结构时一直出现问题，无论是使用官方给出的还是自己写然后加载在调用都有下面问题的存在，作者有时间看一下这个

wjli-debug · Answer

<a target="_blank" rel="noopener noreferrer" href="https://private-user-images.githubu

Bobo-y · Answer

发个权重给我吧

wjli-debug · Answer

链接：https://pa

Bobo-y · Answer

内网无法使用百度云，邮箱吧， 16120438@bjtu.edu.cn

wjli-debug · Answer

backbone = get_RepVGG_func_by_name('RepVGG-A0')()

pretrained_dict =

Bobo-y · Answer

转换是指？

wjli-debug · Answer

呃，没有成功，还是出现了一些bug，貌似这样不太行

wjli-debug · Answer

转换是将分支改成单路结构

wjli-debug · Answer

原本训练的backbone不是分支结构的吗？想在保存之后单独将backbone转换成单路结构的权重值，再赋值给model的backbone

Bobo-y · Answer

我理解是不行的，状态字典大概率匹配不上

wjli-debug · Answer

作者有什么建议或者方法吗？

Bobo-y · Answer

我正在训练一个网络，然后会尝试转换结构

wjli-debug · Answer

好的，麻烦大佬了

Bobo-y · Answer

我刚刚训练了一下，拿保存的权重以部署的方式导出onnx 是没有问题的：先以带分支的结构构件网络，然后加载权重，然后调用重参数化接口。我会更新一下export_onnx.py

Bobo-y · Answer

还有一点，如果你想加载别人预训练的权重，需要确认他们的状态字典是怎么保存的：带分支还是不带分支。你需要以相应的模型状态去加载别人的预训练权重

from flexible-yolov5.

wjli-debug · Answer

嗯，好的，多谢作者，我去尝试一下，看看效果

wjli-debug · Answer

<a target="_blank" rel="noopener noreferrer" href="https://private-user-images.githubu

wjli-debug · Answer

它虽然导出为部署模型，但是仍然是多分支结构；但是repvgg应该在导出作为推理时是要单分支结构，上述代码发现没起到效果

Bobo-y · Answer

我知道原因了，加载预训练权重失败是他们的key 和我的命名不一样，只需要在 load_state_dict(, strict=False) 即可，不让检查名字匹配

Bobo-y · Answer

switch_to_deploy 这个函数默认没有的，我刚加上的，默认是 switch_to_pretrain, 不太符合部署命名，我加了一个函数

wjli-debug · Answer

load_state_dict(, strict=False) ，这个是在哪部分添加？是单独加载best.pt进行转换吗？

wjli-debug · Answer

不是特别懂作者说的是在哪部分，我看到你提供的代码中并没有load_state_dict部分

Bobo-y · Answer

暴力一点，在train.py 129 行，直接加上 model.backbone.load_state_dict(torch.load('下载的预训练权重')， stric

Bobo-y · Answer

加载预训练模型确实需要一点改动，需要把下载的预训练模型的 key 改成此repo 对应的才行。后续有时间我再看看吧 <a class="user-mention notra

wjli-debug · Answer

嗯，好的

使用repvgg训练，然后参数deploy为true，即改成单路推理结构时，出现训练无法收敛的情况？是不是由于每一次训练都直接转成了单路结构的原因？ about flexible-yolov5 HOT 30 CLOSED

Comments (30)

Related Issues (20)

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent