cover

73. 深度学习完成假新闻分类#

73.1. 介绍#

深度学习在自然语言处理中有十分重要的应用,实际上前面的循环神经网络内容中,已经接触过相关的知识。本次挑战需要借助前面学习过的知识,提升假新闻文本分类的准确率。

73.2. 知识点#

  • 文本分类

  • 深度神经网络

实验中,我们使用了 WSDM 假新闻分类数据学习了文本分类的过程。不过,实验的结果并不特别理想,测试集准确度基本 \(65\%\) 左右。本次挑战中,你需要利用文本分类实验中学习到的数据预处理技巧,以及前面深度学习中学过的相关知识,对假新闻数据重新分类。

Exercise 73.1

开放型挑战

挑战:利用文本分类预处理及深度学习知识,构建深度神经网络对假新闻数据进行分类。

规定:对提供的数据进行 \(8:2\) 切分,最终测试集准确度 \(>70\%\)。你可以自由选择文本预处理方法,特征提取手段,以及深度神经网络结构。

挑战需使用实验中提供的假新闻数据。

https://cdn.aibydoing.com/aibydoing/files/wsdm_mini.csv  # 假新闻数据
## 补充代码 ###

○ 推荐安装 GetVM 浏览器扩展,使用其提供的基于 Linux 操作系统的 Jupyter Notebook 在线环境进行代码实践。

○ 欢迎分享本文链接到你的社交账号、博客、论坛等。更多的外链会增加搜索引擎对本站收录的权重,从而让更多人看到这些内容。