Emotion-recognition-of-netizens-during-the-epidemic

Mindmap

Material

Paper & Tutorial

Resolution

Data Augmentation

Lexical analysis

Pretraining

Hashtag

Text Classification

文本分类综述

Time Series

Sentiment Analysis on Time-Series Data Using Weight Priority Method on Deep Learning
[Real Time Sentiment Change Detection of Twitter Data Streams](Real Time Sentiment Change Detection of Twitter Data Streams)

Misc

赛后总结

数据预处理

I/O

新增三个数据类可以快速将数据读入DataFrame中, 并格式化日期
这三个数据类为：LabeledDataset、UnlabeledDataset、Testset
将中文标题重命名为：
- 微博id -> ID(主键)
- 微博发布时间 -> datetime
- 发布人账号 -> poster
- 微博中文内容 -> content
- 微博图片 -> image
- 微博视频 -> video
- 情感倾向 -> sentiment
新增生成测试数据集的排行榜提交文件函数submit，实现了ID号后需加空格的坑人逻辑
测试集TestDataset新增fill_result函数，可以用来填充模型训练的结果
实现900K抽样并添加伪标签

数据清洗

访问数据集属性cleaned_data可以执行多进程加速的清洗步骤并获得清洗过的数据集，若cleaned_data是第二次访问，则无需执行清洗步骤，已实现的清洗步骤为：
- 去除微博末尾的无意义的文字
- 去除@回复中的微博名称及hashtag、【】中的内容
- 繁体中文转简体中文

统计

属性stat_hashtags用来提取不与微博关联的所有hashtag与该hashtag出现的次数

Name		Name	Last commit message	Last commit date
Latest commit History 88 Commits
Code		Code
Docs		Docs
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Emotion-recognition-of-netizens-during-the-epidemic

Mindmap

Material

Paper & Tutorial

Resolution

Data Augmentation

Lexical analysis

Pretraining

Hashtag

Text Classification

Time Series

Misc

赛后总结

数据预处理

I/O

数据清洗

统计

About

Releases

Packages

Contributors 2

Languages

License

FernandoZhuang/Emotion-recognition-of-netizens-during-the-epidemic

Folders and files

Latest commit

History

Repository files navigation

Emotion-recognition-of-netizens-during-the-epidemic

Mindmap

Material

Paper & Tutorial

Resolution

Data Augmentation

Lexical analysis

Pretraining

Hashtag

Text Classification

Time Series

Misc

赛后总结

数据预处理

I/O

数据清洗

统计

About

Topics

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages