两种交叉熵损失函数对比

第一种

该形式交叉熵损失函数对应神经网络的输出为$softmax$,即这N个$p(x)$加和为1.

第二种

该形式交叉熵损失函数对应神经网络的输出为$sigmod$,即这N个$p(x)$加和不是1.