神经网络到底是什么?一篇给 AI 初学者的入门解释
不从公式开始,而是从“机器怎样学会判断”这件事讲起,把神经网络、神经元、参数、训练和预测串成一条清楚的线。
和「AI基础」相关的文章都收在这里,方便沿着同一个主题继续读下去。
同一主题下的内容,会更容易看出思路是怎么慢慢长出来的。
不从公式开始,而是从“机器怎样学会判断”这件事讲起,把神经网络、神经元、参数、训练和预测串成一条清楚的线。
激活函数让神经网络拥有非线性表达能力。没有它,再多层网络也可能只是一个更复杂的线性模型。
损失函数像训练过程里的成绩单,告诉模型预测结果和真实答案之间差了多少。
CrossEntropyLoss 常用于分类任务,它关注的不只是模型有没有猜对,还关注模型对正确类别有多自信。
梯度下降可以理解成沿着损失函数的坡度往低处走,目标是找到让模型错误更小的参数。
Tensor 可以理解成更通用的数组,它承载数据、参数和梯度,是 PyTorch 训练流程的基础。
这个博客会记录我从零学习 AI 的过程:把概念讲清楚,把项目跑通,也把踩坑和复盘留下来。