影评情感分类(基于IMDB数据集)
发布日期:2021-07-01 02:02:24
浏览次数:2
分类:技术文章
本文共 691 字,大约阅读时间需要 2 分钟。
回顾以前的笔记
在keras中,内置了imdb电影评分数据集,来进行评价预测
安装keras
conda install keras
conda就帮依赖全部搞定,记得加源
导入imdb
from keras.datasets import imdb
数据集简要说明
- 一个长长的英文句子,有的有几千单词,有的有几十,分类成好的评价和不好的评价
在数据中不是单词,而是单词的索引
一共就5万句子import kerasfrom keras import layersimport matplotlib.pyplot as plt%matplotlib inlinedata = keras.datasets.imdbmax_word = 10000# 加载前10000个单词 最大不超过10000(x_train, y_train), (x_test, y_test) = data.load_data(num_words=max_word)
查看数据
x_train.shape, y_train.shapeOUT:((25000,), (25000,))x_train[0]y_train[0]OUT:输出的是词汇的index输出的是 array([1, 0, 0, ..., 0, 1, 0], dtype=int64)1 代表 正面评价 0 代表负面怕评价
加载index和词汇的对应关系
#加载词汇word_index = data.get_word_index()#将index和value 互换index_word = dict((value, key) for key
转载地址:https://maoli.blog.csdn.net/article/details/102257429 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!
发表评论
最新留言
路过按个爪印,很不错,赞一个!
[***.219.124.196]2024年04月26日 00时56分48秒
关于作者
喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!
推荐文章
最全的Android源码目录结构详解
2019-05-01
Linux安装JDK详细步骤
2019-05-01
repo用法详解
2019-05-01
Linux / Unix Command: packet
2019-05-01
==把VIM打造成开发C的IDE==
2019-05-01
source insight快捷键及使用技巧
2019-05-01
映 射 ALT 键
2019-05-01
vim 插件echofunc.vim 翻页问题
2019-05-01
TCP中32位序号详解
2019-05-01
数字签名和数字信封的区别
2019-05-01
Python一日一练16----折半查找
2019-05-01
Python一日一练17----哈希查找
2019-05-01
Python菜鸟学习手册15----多线程
2019-05-01
新构建QNX6.6操作系统基本功能配置步骤
2019-05-01
为QNX系统增加定制命令方法
2019-05-01
C语言:回调函数
2019-05-01
vim实用技巧
2019-05-01
vim使用快捷键F4生成文件头注释、F5生成main函数模板、F6生成.h文件框架模板
2019-05-01