hdml指的是什么接口
273
2022-08-24
python_处理文本标签_遍历目录(python遍历文本的每条数据)
python_处理文本标签_遍历目录
我们将训练评论转换成字符串列表,每个字符串对应一条评论。你也可以将评论 标签(正面 / 负面)转换成 labels 列表 遍历目录
import osimdb_dir = '/home/ubuntu/data/aclImdb'train_dir = os.path.join(imdb_dir, 'train')labels = []texts = []for label_type in ['neg', 'pos']: dir_name = os.path.join(train_dir, label_type) for fname in os.listdir(dir_name): if fname[-4:] == '.txt': f = open(os.path.join(dir_name, fname)) texts.append(f.read()) f.close() if label_type == 'neg': labels.append(0) else: labels.append(1)
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。
发表评论
暂时没有评论,来抢沙发吧~