论文流程理解

Question

打算用tensorflow复现RACNN，但是中间有几步总是觉得难以实现，说一下我对全程的理解，希望能有人帮忙看看是否有误
1、用普通VGG进行分类，微调，直到分类

bluemandora · Answer

<a class="user-mention notranslate" data-hovercard-type="user" data-hovercard-url="/us

kekedan · Answer

同学，不知道不实现没有，三个定位是用于当前batch的。
有个问题想想你请教下，在论文中Mask是为了用于求导，使用tensorflow相当于是自动求导的，感觉好像

Ostnie · Answer

最后我还是没有实现，不过确实你说的batch流程之前是搞错了。
你提到的mask是指哪一步？我可能没有注意到这是一个mask，我没有看过mask rcnn的内容，不

yuleichin · Answer

我有一个疑问，就是在使用sigmoid函数crop图像区域的时候，有的代码实现是根据预测的三个坐标的位置直接用[tx-tl:tx+tl,ty-tl:ty+tl]来点选原图像

houkai · Answer

<a class="user-mention notranslate" data-hovercard-type="user" data-hovercard-url="/us

Asichurter · Answer

我的理解是，论文里面的sigmoid函数的x有个放大的系数k被设置得非常大，结果就是让sigmoid函数近似于阶梯函数，相当于使用soft attention的方式近似达到

HiIcy · Answer

<a class="user-mention notranslate" data-hovercard-type="user" data-hovercard-url="/us

Asichurter · Answer

<a class="user-mention notranslate" data-hovercard-type="user" data-hovercard-url="/us

HiIcy · Answer

<a class="user-mention notranslate" data-hovercard-type="user" data-hovercard-url="/us

anzhang-fly · Answer

我也很疑惑这一点，看的代码都是根据各个尺度做的预测结果，而原论文的意思是先把每个尺度做融合后再做预测。

论文流程理解 about recurrent-attention-cnn HOT 10 OPEN