| |
首页 淘股吧 股票涨跌实时统计 涨停板选股 股票入门 股票书籍 股票问答 分时图选股 跌停板选股 K线图选股 成交量选股 [平安银行] |
股市论谈 均线选股 趋势线选股 筹码理论 波浪理论 缠论 MACD指标 KDJ指标 BOLL指标 RSI指标 炒股基础知识 炒股故事 |
商业财经 科技知识 汽车百科 工程技术 自然科学 家居生活 设计艺术 财经视频 游戏-- |
天天财汇 -> 科技知识 -> 深度学习纯靠造假能发论文嘛? -> 正文阅读 |
|
[科技知识]深度学习纯靠造假能发论文嘛? |
[收藏本文] 【下载本文】 |
纯工科天坑专业,以前没有人用过深度学习的方法,最近看论文,好多论文的结果都是纯靠一张嘴说,我们自己的数据集,要是不开源的话,抄别人的代码,直接编数据,… |
靠造假毕业当然有可能,甚至发顶会都可能,例如下面这个例子 如何看待浙江大学ACL 2021论文实验数据存在问题?158 赞同 · 18 评论回答 |
|
但如果真的想有一点自己的影响力的话,千万别造假 因为如果一个工作不开源,无法复现,我是不会引用的 |
深度学习不造假就没人造假了,就我遇到的数篇论文来看: 代码不开源的论文A 代码开源就写一个coming soon放几年的论文B 代码开源一半有测试没训练的论文C 代码开源了跑不通(报错tensor形状不对)的论文D 代码能跑通但达不到声称的准确率也不给预训练模型不回issue装死的论文E 给了预训练模型但你跑出来准确率差一截,在issue的回复里明说"我们多次实验选了最好一次"的论文F 即使你能瞬间识别以上所有问题并避开这些论文,你还会有道绕不过去的坎: 想发论文吗?请和以上论文对比准确率捏 |
AOE到不少人,不点名期刊了。 我也没想到这么多发这俩顶会的会觉得我在说他们,先道个歉。 最近撞了两篇论文开源代码造假,一个拿代码发了俩顶会,一个单顶会。 我有足够的证据,但我不想去锤他。 我把他们的方法拉进对比实验,换了个数据集当sota,proposed method的效果十分显著。 深度学习90%的论文,就算是顶刊,也未必有人会去验证,顶多有俩倒霉蛋看看你的story。如果真碰到了,大多数人会骂街,剩下的也就像我一样扔对比实验水论文。真较真的少之又少,毕竟都是出来混饭吃的。 当然我建议别纯编,至少得把代码写出来看看效果,总不能太离谱了,万一碰到个试过错的审稿人很容易直接寄了。建议编的越多投的期刊水平越低,至少别太误导人,也算是为学术圈做点贡献了。 ps:毕竟代码我都抄了,要是真想搞个大新闻就直接issue里喷了,也不会在知乎谈笑风生。 |
你思考的方向不对,应该叫怎么编科幻才能发丹文。这方面acl是集大成者遥遥领先。对acl来说不是可不可靠编,而是你不编都别想进入盛大科幻狂欢。 Annual Meeting of the Association for Computational Linguistics?aclanthology.org/venues/acl/ |
可以, 自己的数据集,你就算开源了算法不开源数据集,别人也发现不了。 公开数据集,自己的 trick,不公开 trick 也发现不了。 之前我做 sot,我发现我复现不了任何一篇论文,当时我很焦虑,直到有一天我在一个群里发现了测试集的 label json,我就笑了。 也许是我卡的问题,也许是我复现的问题,但不管怎么说,这种问题在深度学习里很常见。 但是被举报就寄了,还是不要造假的好。 |
其实这事和举报餐馆消防隐患一个道理 你可以找几篇文章,要求符合以下特点 私有数据集没有开源代码引用量不高自称自己SOTA了一众模型 然后写一个简单的邮件,发到对方院校,就说对方学术不端,数据乱编,自己复现出来效果差十万八千里 当然这种做法很败人品,不建议应用到生活实际 |
不开源的都是作假 |
啊这,现在科研的版本已经这么超前了吗orz 先嗦结论,在review阶段,如果你能幸运的碰上不做这个小方向的reviewer,那确实可能可以糊弄过去,但真的问题在于发表后。 目前来说造假并且能发表的文章还挺多的,有的文章核心算法和开源代码对不上,有的文章实验效果直接一眼假,不过造假本身也是个有难度的活,在你的论文发表后肯定会有小同行来看,如果小同行的技术路线相同,那么你所给出的核心算法的靠谱程度其实是可以估出来的。因此你给出的核心算法最起码看起来是完全能行得通的,并且能保证和你相同方向的小同行也一眼暂时看不出来问题。 然后就是实验,题主提到的私有数据集不开源的问题,但是一般来说,如果你的论文中是一定要放公开数据集的效果的,即使你用不开源的私有数据集,你也需要有公开数据集上的结果,不然的话论文应该是中不了的。因此即使你编出来私有数据集上的实验结果,你得保证公开数据集上的结果是真的,不然直接就被锤了,但如果公开数据集已经能超sota了,私有数据集做个实验不就是顺带的事emmmm。 因此,如果说实验只用不开源的私有数据集,代码也不开源,然后人肉编结果,这种论文如果我审稿的话肯定reject掉,感觉能发的概率不大,虽然我会假设结果可信,但是没公开数据集结果和无开源代码本身算是硬伤。并且即使假论文成功发表,以后也有吃举报的风险,毕竟造假的话肯定也没有对应的实现代码和实验记录,造假被锤就很容易学术性死亡/学位追回了,代价很大。 突然看到是非计算机专业,上述回答是用于计算机方向的论文,综合来说建议结合自身领域现状233,毕竟某些交叉方向已经变成造假天堂了(不是 |
单单从能不能的角度,你要发差的OA的话应该没什么难度,稍微瞎搞个2个点人家看不出也许还能发个正常的期刊。 但一方面搞科研不能这么没底线,另一方面也别以为审稿人看不出。 你的论文idea肯定得有的,这玩意可不可行有没有新意那还是一目了然的事情。 |
首先,所有不开源的工作,绝大多数都可以视为造假,不需要浪费时间复现...... 其次,造假是可耻的,如果只是为了毕业,时间紧凑,数据不太好看,稍微修饰一下数据,把数据打扮的好看一些,这种无奈之举,倒是情有可原,但如果未来想混学术界,还是不要造假为好 |
发一般期刊没问题的。 浅浅的喜欢,如同天上的白云,变幻莫测,随风而行。而深沉的爱,却像连绵的长风,悠扬深远,穿越四季。浅喜似苍狗,宛若孩童戏耍时的一缕清风,稍纵即逝。而深爱如长风,是岁月的沉淀,是生活的厚重,是彼此的守护与陪伴。 |
说句题外话,哪怕开源完整代码的文章,除非有人或者自己跑出来过,否则我都不会完全相信里面的结果。 亲测一篇业界还算popular的文章,作者列表里也有一些大佬,开源了完整代码,之前和不下五个人交流过,没有一个人可以复现出来里面的结果,甚至差的很多。 |
可以,只要你不公开代码 |
in-house代码,你说啥就是啥,就看你故事写的好不好了。 当然也得自己承担万一暴雷的结果。 |
看你目的是什么? 如果单纯混毕业。无所谓后续科研的话。这个随你怎么造,懂的都懂。【当然我们不建议】 如果是想一直接触并靠这个恰饭,那你没可能。当然你提这个问题应该就不会考虑这个了。但是我们本着能帮一个是一个的原则。给你说说一些影响吧。 中国人不骗中国人! 看看我们假人怎么说: 在学术研究领域,诚信和道德是至关重要的。纯靠造假并编造数据进行学术发表是极为不道德的行为,会对科研领域的信任和声誉造成严重的损害。 科学研究的目标是为了推动知识的发展,改善我们对世界的理解。使用伪造的数据和方法会扭曲科学进展的方向,给其他研究者和学术界带来负面影响。此外,科学界通常是一个紧密相连的社区,许多研究都会接受同行评审,而伪造数据的实践通常会在这个过程中被揭露。 以下是一些建议: 道德和诚信: 严格遵守学术和研究的道德准则,保持诚信是科研工作的基本原则。尊重知识的创造和分享。 开放数据: 尽量公开、分享你的数据集和研究方法,这有助于验证和重现研究结果。开放性的科学实践有助于建立信任和合作。 |
|
同行评审: 论文通常需要通过同行评审,同行专家会对研究进行审查。虚假数据和方法通常会在同行评审过程中被揭露。 |
|
学术诚信教育: 了解学术诚信的重要性,参与学术诚信培训,并推动科研团体建设一个诚信的学术环境。 如果有人发现在学术研究中存在伪造数据和其他不当行为,会受到严重的后果,包括但不限于论文的撤销、学术声誉受损、学术处分以及在科研领域的信任丧失。 |
|
翟博士,当然你不出名的话大概率没人找你。 |
。。。 稍微做点工作也行啊 |
这是什么样的社会,学术造假都这么明目张胆了 |
我同门抄我和博士师兄论文的动机和方法,然后结果乱编,最后还中了。 |
每个人都是SOTA。 不SOTA就中不了。 |
建议还是认真写论文,毕竟要发表出去的 |
不给预训练模型,默认有问题 |
|
邀请优秀的作者投稿/参会,与教授、行业精英一起共同探讨、寻找方向。 |
|
[收藏本文] 【下载本文】 |
上一篇文章 下一篇文章 查看所有文章 |
|
|
股票涨跌实时统计 涨停板选股 分时图选股 跌停板选股 K线图选股 成交量选股 均线选股 趋势线选股 筹码理论 波浪理论 缠论 MACD指标 KDJ指标 BOLL指标 RSI指标 炒股基础知识 炒股故事 |
网站联系: qq:121756557 email:121756557@qq.com 天天财汇 |