Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

您好,对于平均序列长度为3,造成性能变差,您有什么好的建议嘛? #20

Open
hwlsrr opened this issue Apr 28, 2024 · 2 comments

Comments

@hwlsrr
Copy link

hwlsrr commented Apr 28, 2024

在平均序列长度为15的数据集,我使用了您的模型,提升了很多性能。但是换了平均序列长度为3的数据集,不光没有提升,还变差了。不知道这种情况下,还有没有可能把模型救活?

我将您的模型,放在了transformer输入之前。

@Zero-coder
Copy link
Owner

您好,序列变短了 效果反而下降可能是过拟合了,这个时候推荐越简单的方法越好比如,Dlinear

@ZXLabc123
Copy link

在平均序列长度为15的数据集,我使用了您的模型,提升了很多性能。但是换了平均序列长度为3的数据集,不光没有提升,还变差了。不知道这种情况下,还有没有可能把模型救活?

我将您的模型,放在了transformer输入之前。

您好,你的序列长度指的是什么

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants