论文笔记:Visualizing and understanding recurrent networks

ZMonster at 
论文笔记:Visualizing and understanding recurrent networks的配图
目录作者观点数据集模型/实验/结论作者 Andrej KarpathyJustin JohnsonLi Fei-Fei 观点 LSTM 在实践中表现出了非常好的结果,但我们对其性能的来源和限制理解地都还很不够过去的一些分析都是靠最终测试集上的全局困惑度来评价 LSTM 的效果,并没有在「真实数据」上进行分析,也不够直观数据集托尔斯泰的《战争与和平》文本,共 3,258,246 字 Linux 内核代码,共 6,206,996 字模型/实验/结论 RNN,分别尝试层数为 1 层、2 层和 3 层,隐层大小分别尝试 64, 128, 256 和 512,共 12 个模型 LSTM,同 RNNGRU……