和「梯度下降」相关的文章都收在这里,方便沿着同一个主题继续读下去。
同一主题下的内容,会更容易看出思路是怎么慢慢长出来的。
梯度下降可以理解成沿着损失函数的坡度往低处走,目标是找到让模型错误更小的参数。