trickygo / dive-into-dl-tensorflow2.0 Goto Github PK

View Code? Open in Web Editor NEW

3.8K 3.8K 818.0 59.81 MB

本项目将《动手学深度学习》(Dive into Deep Learning)原书中的MXNet实现改为TensorFlow 2.0实现，项目已得到李沐老师的认可

Home Page: https://trickygo.github.io/Dive-into-DL-TensorFlow2.0/#/

License: Apache License 2.0

Jupyter Notebook 99.59% Python 0.41%

book chinese-simplified cv deep-learning dive-into-deep-learning jupyter-notebook nlp python3 tensorflow2 tutorials

dive-into-dl-tensorflow2.0's Introduction

dive-into-dl-tensorflow2.0's People

Contributors

Stargazers

Watchers

Forkers

bellagao1023 liangzai951 xuweitj noahgalaxy swordfaith liangxd yangshoujian felixzhang7 shusentang wendonggan demmon-tju fw1121 bbw7561135 lionlu911 pieere 871864580 mzpmzk jaccckmaa chaoongithub leedaga frankfan007 xclu cdj0311 cdlwhm1217096231 499244188 chengmuni66 aixinneucore liangqingyuan adam1iu zhuikonger hiker-xu fenxouxiaoquan awfssv 3dimaging iloveiverson nestorlong vguanwenv koala-good zhangkehua blake2002 microw xincnnix cronaldo7531 ssgssgoku-17 tb1over zhangjiekui healieliao jxzsxsp timothyblack luckygong zeyuanzhao50 hadoop2014 huyz1117 allensmile m3dade paopaoactioner soon-tw tchigher antonizhubar csanycall chapzq77 gavinljj yutianji888 zhengtq monoloxo hhy5277 glen9527 qhapper wangdongya linyr1125 millaras dshwei yyq1609 chenpufeng tor4z liulizi zhanqiliu pnx007 zhiguo-chen tcglarry hsuanshao zhangshuai830 yfu1116 yihongyishui wjymath eanfs a-pai wildchen masterwall dyf-ai blueplus jackliaoall-ai-books-resources fancycheung fusichao tudajie liwi163 asukaj xingchen77 linessiex royzon

dive-into-dl-tensorflow2.0's Issues

第五章的小标题规范&图片缺失

第五章图片缺失，注意用多少添加多少不要又一下全部加进来了
另外小标题规范一下，按照原书小标题来

无法访问4.3 模型参数的延后初始化

https://trickygo.github.io/Dive-into-DL-TensorFlow2.0/#/chapter04_DL-computation/4.3_deferred-init

2021年2月16日 11点，提示404 - Not found

5.12 稠密连接网络 DenseNet 模型

在一开始5.12.1中代码所定义的稠密块有两层卷积，而在5.12.3的代码中

def densenet():
    return DenseNet(num_init_features=64, growth_rate=32, block_layers=[4,4,4,4], compression_rate=0.5, drop_rate=0.5)
mynet=densenet()

定义了block_layers[4,4,4,4], 所以实际上代码最后定义的模型是不是4x4x2个卷积层，而不是像上文所提到的

同ResNet一样，我们可以设置每个稠密块使用多少个卷积层。这里我们设成4，从而与上一节的ResNet-18保持一致

或者还是我理解错了啊

The funtion of colormap2label may not be effective , the converted label does not correspond.

test-rgb2label.pdf
The result for [0,0,128] should be labeled as 4, but got the 0. Hope to get your reply, thank you!
The input image from VOC2012\SegmentationClass\2007_000061.png

2.3.2 训练模式和预测模式有关键性错误

with tf.GradientTape(persistent=True) as g:
    g.watch(x)
    y = x * x
    z = y * y
    dz_dx = g.gradient(z, x)  # 108.0 (4*x^3 at x = 3)
    dy_dx = g.gradient(y, x)  # 6.0
dz_dx,dy_dx

需要改为：

with tf.GradientTape(persistent=True) as g:
    g.watch(x)
    y = x * x
    z = y * y
dz_dx = g.gradient(z, x)  # 108.0 (4*x^3 at x = 3)
dy_dx = g.gradient(y, x)  # 6.0
dz_dx,dy_dx

9.1图像增广-使用图像增广训练模型

show_images(x[0:32][0], 4, 8, scale=0.8)这行代码感觉应该修改为show_images(x[0:32], 4, 8, scale=0.8)，这样才会显示完整的照片

3.2小节最后部分代码有点小问题(网页版文档)，多输入了一个t

编写规范建议

需要将一些专有名词规范话，例如：

tensorflow or Tensorflow
tensor or Tensor

单词与汉字之间，数字与汉字之间是否要保留空格，例如：

Tensorflow是一个 or Tensorflow 是一个

行内代码是否要专门括起来，原书是括起来的，例如：

tensor or tensor

错别字“食用方法” 应为使用方法

https://trickygo.github.io/Dive-into-DL-TensorFlow2.0/#/?id=%e9%a3%9f%e7%94%a8%e6%96%b9%e6%b3%95

3.15.2有误

3.15.2还是针对PyTorch的，未针对tf作修改，可以去了解一下tf2.0的初始化策略然后更新一下

3.13节，train_ch3，params更新

        if trainer is None:

            sample_grads = grads
            params[0].assign_sub(grads[0] * lr)
            params[1].assign_sub(grads[1] * lr)

为什么params只更新0,1，不应该是
for (i,param) in enumerate(params):
params[i].assign_sub(grads[i]*lr)

动手学深度学习 tensorflow版

Hi 各位，

感谢将D2L翻译到TensorFlow。目前我们在着手在d2l.ai的英文版里面加入tensorflow和pytorch的实现。现在的pytorch版的一个demo在http://pytorch.d2l.ai.s3-website-us-west-2.amazonaws.com/chapter_preface/index.html 和 http://pytorch.d2l.ai.s3-website-us-west-2.amazonaws.com/chapter_linear-networks/linear-regression-scratch.html，代码在 https://github.com/d2l-ai/d2l-en/tree/pytorch 不知道你有没有兴趣来贡献tensorflow的实现。

（我之前发过信到各位的pku邮箱，各位可能没注意）

module 'tensorflow' has no attribute 'gradient'

线性回归的从零开始实现一节

param.assign_sub(lr * tf.gradient(l, param) / batch_size)

代码报module 'tensorflow' has no attribute 'gradient'错误，改tf.gradient为t.gradient正常

【在线书部分章节缺失】第3章-3.12权重衰减；第4章-4.3模型参数的延后初始化

3.12 权重衰减
4.3 模型参数的延后初始化

6.4 和 6.5 小结中，损失函数缺少一个参数，导致训练结果不正确

l = tf.reduce_mean(tf.losses.sparse_categorical_crossentropy(y,outputs))
该损失函数缺少参数 from_logits = True。在计算输出是没有使用激活函数softmax，因此需要在损失函数上指定，即令from_logits = True。故损失函数应该为：
l = tf.reduce_mean(tf.losses.sparse_categorical_crossentropy(y,outputs,from_logits=True))

错误结果：

epoch 50, perplexity 100.705286, time 1.76 sec
分开

分开
不分开
不分开
epoch 100, perplexity 27.005527, time 1.85 sec
分开
分开
不分开
不分开我
epoch 150, perplexity 1019.865201, time 1.80 sec
分开
分开象元元乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘
不分开
不分开元元乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘
epoch 200, perplexity 1020.654544, time 1.73 sec
分开
分开象元元乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘
不分开
不分开元元乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘
epoch 250, perplexity 1020.654544, time 1.75 sec
分开
分开象元元乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘
不分开
不分开元元乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘

建议

感觉有些地方都没改正过来新手看的一头雾水建议再好好完善一下

在线书和 docs 文件夹里面的内容是不同步的吗？

4.5.1 load and save NDarray没有save的代码，只有load的代码

3.5 读取小批量像素标准化

3.5 读取小批量
并除以255使得所有像素的数值均在0到1之间
应该加一个 map函数作映射
def data_trans(x, y):
x = tf.cast(x, tf.float32)
x = x / 255
return x, y

train_iter = tf.data.Dataset.from_tensor_slices((x_train, y_train)).map(data_trans).batch(256)

ch6.8代码不符,lstm中最后一个简单版本实现的最后一个函数train_and_predict_rnn_keras并没有device的参数

去掉device后报错：

5.1.2的Conv2D中call的返回值有一点小问题

原文中为return corr2d(inputs, self.w + self.b)，而实际上应该是return corr2d(inputs, self.w) + self.b

【3.3 线性回归的简洁实现】内容排版问题

多余代码

第一行代码多余，可以删去；
for 循环中的 x 原书为大写 X；
原书代码结尾有 break，这样只会输出一个，可以减少该代码输出后所在内容篇幅。

# dataset=tf.data.Dataset.from_tensor_slices((features,labels))
train_db = tf.data.Dataset.from_tensor_slices((features, labels)).batch(10)
for(x,y) in train_db:
    print(x,y)

为划分标题

该章节目前没有划分小标题。

章节优化器和损失函数在同一章节划分

可以和原书一致，将损失函数和优化器分别定义使用。

学习率数值

下面代码原书的学习率采取为 0.03 。

model.compile(optimizer=tf.keras.optimizers.SGD(0.01),
              loss='mse')

大部分段落没有句号

最后多余一个代码块

文章结尾多余一个代码块

章节缺失：10.7和10.8两个章节缺失

文本情感分类：使用循环神经网络和文本情感分类：使用卷积神经网络textcnn，两个章节缺失了。。。

学习路径的jpg显示不出来

7.3.3有一处笔误

简洁实现那里，train_pytorch_ch7中的pytorch应该是tensorflow2
还有函数定义中的trainer是指的trainer_name吗？

【3.2 线性回归的从零开始实现】错误内容

代码输出

将原有的 features[0], labels[0] 代码应该贴在下面代码区。

未修改内容

仍旧是 pytorch 内容。

应该为 matmul 函数

标题错误

9.4 锚框 colab地址，希望对你们有帮助

我跟着pytorch那个版本改写成了tensorflow版本，当然，可能有错误或者使用不当的函数，希望相互指教，或者能对你们有帮助。

colab地址：https://colab.research.google.com/drive/1u5EUfErT-3G76vy7CMbXs7-tbJF4els5

d2lzh_tensorflow2缺失，项目文件亦没有code目录

导入库缺失，项目代码也没有code，请问哪里可以获取，只发现utils.py含有相关代码

3.9.4代码缩进问题

IndentationError: expected an indented block

感谢作者

data数据难下载

能否发一个data的网盘链接，github下载太慢了。谢谢！

torch库在前面没有导入（3.11.4.1）

3.11.4.1 生成数据集
该小节，torch库在前面没有导入，我是在本地安装了Pytorch，然后import torch，就可以成功了。

n_train, n_test, true_w, true_b = 100, 100, [1.2, -3.4, 5.6], 5
features = torch.randn((n_train + n_test, 1))
poly_features = torch.cat((features, torch.pow(features, 2), torch.pow(features, 3)), 1)
labels = (true_w[0] * poly_features[:, 0] + true_w[1] * poly_features[:, 1]
+ true_w[2] * poly_features[:, 2] + true_b)
labels += torch.tensor(np.random.normal(0, 0.01, size=labels.size()), dtype=torch.float)

房价预测按照在线版本的写下来，为什么loss这么大呢

3.16.3 转换为nparray的时候使用的是pytorch的api

n_train = train_data.shape[0]
train_features = torch.tensor(all_features[:n_train].values, dtype=torch.float)
test_features = torch.tensor(all_features[n_train:].values, dtype=torch.float)
train_labels = torch.tensor(train_data.SalePrice.values, dtype=torch.float).view(-1, 1)