[科技知识] 深度学习纯靠造假能发论文嘛？

天天财汇购物网址万年历小说 | 三峰软件小游戏视频

TxT小说阅读器
↓小说语音阅读,小说下载↓

一键清除系统垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

图片自动播放器
↓图片自动播放,产品展示↓

首页淘股吧股票涨跌实时统计涨停板选股股票入门股票书籍股票问答分时图选股跌停板选股 K线图选股成交量选股 [平安银行]

股市论谈均线选股趋势线选股筹码理论波浪理论缠论 MACD指标 KDJ指标 BOLL指标 RSI指标炒股基础知识炒股故事

商业财经科技知识汽车百科工程技术自然科学家居生活设计艺术财经视频游戏--

天天财汇 -> 科技知识 -> 深度学习纯靠造假能发论文嘛？ -> 正文阅读

[科技知识]深度学习纯靠造假能发论文嘛？

[收藏本文] 【下载本文】

纯工科天坑专业，以前没有人用过深度学习的方法，最近看论文，好多论文的结果都是纯靠一张嘴说，我们自己的数据集，要是不开源的话，抄别人的代码，直接编数据，…

靠造假毕业当然有可能，甚至发顶会都可能，例如下面这个例子
如何看待浙江大学ACL 2021论文实验数据存在问题？158 赞同 · 18 评论回答

但如果真的想有一点自己的影响力的话，千万别造假
因为如果一个工作不开源，无法复现，我是不会引用的

深度学习不造假就没人造假了，就我遇到的数篇论文来看：
代码不开源的论文A
代码开源就写一个coming soon放几年的论文B
代码开源一半有测试没训练的论文C
代码开源了跑不通（报错tensor形状不对）的论文D
代码能跑通但达不到声称的准确率也不给预训练模型不回issue装死的论文E
给了预训练模型但你跑出来准确率差一截，在issue的回复里明说"我们多次实验选了最好一次"的论文F
即使你能瞬间识别以上所有问题并避开这些论文，你还会有道绕不过去的坎: 想发论文吗？请和以上论文对比准确率捏

AOE到不少人，不点名期刊了。
我也没想到这么多发这俩顶会的会觉得我在说他们，先道个歉。
最近撞了两篇论文开源代码造假，一个拿代码发了俩顶会，一个单顶会。
我有足够的证据，但我不想去锤他。
我把他们的方法拉进对比实验，换了个数据集当sota，proposed method的效果十分显著。
深度学习90%的论文，就算是顶刊，也未必有人会去验证，顶多有俩倒霉蛋看看你的story。如果真碰到了，大多数人会骂街，剩下的也就像我一样扔对比实验水论文。真较真的少之又少，毕竟都是出来混饭吃的。
当然我建议别纯编，至少得把代码写出来看看效果，总不能太离谱了，万一碰到个试过错的审稿人很容易直接寄了。建议编的越多投的期刊水平越低，至少别太误导人，也算是为学术圈做点贡献了。
ps：毕竟代码我都抄了，要是真想搞个大新闻就直接issue里喷了，也不会在知乎谈笑风生。

你思考的方向不对，应该叫怎么编科幻才能发丹文。这方面acl是集大成者遥遥领先。对acl来说不是可不可靠编，而是你不编都别想进入盛大科幻狂欢。
Annual Meeting of the Association for Computational Linguistics?aclanthology.org/venues/acl/

可以，
自己的数据集，你就算开源了算法不开源数据集，别人也发现不了。
公开数据集，自己的 trick，不公开 trick 也发现不了。
之前我做 sot，我发现我复现不了任何一篇论文，当时我很焦虑，直到有一天我在一个群里发现了测试集的 label json，我就笑了。
也许是我卡的问题，也许是我复现的问题，但不管怎么说，这种问题在深度学习里很常见。
但是被举报就寄了，还是不要造假的好。

其实这事和举报餐馆消防隐患一个道理
你可以找几篇文章，要求符合以下特点
私有数据集没有开源代码引用量不高自称自己SOTA了一众模型
然后写一个简单的邮件，发到对方院校，就说对方学术不端，数据乱编，自己复现出来效果差十万八千里
当然这种做法很败人品，不建议应用到生活实际

不开源的都是作假

啊这，现在科研的版本已经这么超前了吗orz
先嗦结论，在review阶段，如果你能幸运的碰上不做这个小方向的reviewer，那确实可能可以糊弄过去，但真的问题在于发表后。
目前来说造假并且能发表的文章还挺多的，有的文章核心算法和开源代码对不上，有的文章实验效果直接一眼假，不过造假本身也是个有难度的活，在你的论文发表后肯定会有小同行来看，如果小同行的技术路线相同，那么你所给出的核心算法的靠谱程度其实是可以估出来的。因此你给出的核心算法最起码看起来是完全能行得通的，并且能保证和你相同方向的小同行也一眼暂时看不出来问题。
然后就是实验，题主提到的私有数据集不开源的问题，但是一般来说，如果你的论文中是一定要放公开数据集的效果的，即使你用不开源的私有数据集，你也需要有公开数据集上的结果，不然的话论文应该是中不了的。因此即使你编出来私有数据集上的实验结果，你得保证公开数据集上的结果是真的，不然直接就被锤了，但如果公开数据集已经能超sota了，私有数据集做个实验不就是顺带的事emmmm。
因此，如果说实验只用不开源的私有数据集，代码也不开源，然后人肉编结果，这种论文如果我审稿的话肯定reject掉，感觉能发的概率不大，虽然我会假设结果可信，但是没公开数据集结果和无开源代码本身算是硬伤。并且即使假论文成功发表，以后也有吃举报的风险，毕竟造假的话肯定也没有对应的实现代码和实验记录，造假被锤就很容易学术性死亡/学位追回了，代价很大。
突然看到是非计算机专业，上述回答是用于计算机方向的论文，综合来说建议结合自身领域现状233，毕竟某些交叉方向已经变成造假天堂了（不是

单单从能不能的角度，你要发差的OA的话应该没什么难度，稍微瞎搞个2个点人家看不出也许还能发个正常的期刊。
但一方面搞科研不能这么没底线，另一方面也别以为审稿人看不出。
你的论文idea肯定得有的，这玩意可不可行有没有新意那还是一目了然的事情。

首先，所有不开源的工作，绝大多数都可以视为造假，不需要浪费时间复现......
其次，造假是可耻的，如果只是为了毕业，时间紧凑，数据不太好看，稍微修饰一下数据，把数据打扮的好看一些，这种无奈之举，倒是情有可原，但如果未来想混学术界，还是不要造假为好

发一般期刊没问题的。
浅浅的喜欢，如同天上的白云，变幻莫测，随风而行。而深沉的爱，却像连绵的长风，悠扬深远，穿越四季。浅喜似苍狗，宛若孩童戏耍时的一缕清风，稍纵即逝。而深爱如长风，是岁月的沉淀，是生活的厚重，是彼此的守护与陪伴。

说句题外话，哪怕开源完整代码的文章，除非有人或者自己跑出来过，否则我都不会完全相信里面的结果。
亲测一篇业界还算popular的文章，作者列表里也有一些大佬，开源了完整代码，之前和不下五个人交流过，没有一个人可以复现出来里面的结果，甚至差的很多。

可以，只要你不公开代码

in-house代码，你说啥就是啥，就看你故事写的好不好了。
当然也得自己承担万一暴雷的结果。

看你目的是什么？
如果单纯混毕业。无所谓后续科研的话。这个随你怎么造，懂的都懂。【当然我们不建议】
如果是想一直接触并靠这个恰饭，那你没可能。当然你提这个问题应该就不会考虑这个了。但是我们本着能帮一个是一个的原则。给你说说一些影响吧。
中国人不骗中国人！
看看我们假人怎么说：
在学术研究领域，诚信和道德是至关重要的。纯靠造假并编造数据进行学术发表是极为不道德的行为，会对科研领域的信任和声誉造成严重的损害。
科学研究的目标是为了推动知识的发展，改善我们对世界的理解。使用伪造的数据和方法会扭曲科学进展的方向，给其他研究者和学术界带来负面影响。此外，科学界通常是一个紧密相连的社区，许多研究都会接受同行评审，而伪造数据的实践通常会在这个过程中被揭露。
以下是一些建议：
道德和诚信：严格遵守学术和研究的道德准则，保持诚信是科研工作的基本原则。尊重知识的创造和分享。
开放数据：尽量公开、分享你的数据集和研究方法，这有助于验证和重现研究结果。开放性的科学实践有助于建立信任和合作。