[科技知识] 院士称中国 90% 的大模型该被淘汰，建议中国应考虑建立一个国家级的大模型，如何看待这一观点？

天天财汇购物网址万年历小说 | 三峰软件小游戏视频

TxT小说阅读器
↓小说语音阅读,小说下载↓

一键清除系统垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

图片自动播放器
↓图片自动播放,产品展示↓

首页淘股吧股票涨跌实时统计涨停板选股股票入门股票书籍股票问答分时图选股跌停板选股 K线图选股成交量选股 [平安银行]

股市论谈均线选股趋势线选股筹码理论波浪理论缠论 MACD指标 KDJ指标 BOLL指标 RSI指标炒股基础知识炒股故事

商业财经科技知识汽车百科工程技术自然科学家居生活设计艺术财经视频游戏--

天天财汇 -> 科技知识 -> 院士称中国 90% 的大模型该被淘汰，建议中国应考虑建立一个国家级的大模型，如何看待这一观点？ -> 正文阅读

[科技知识]院士称中国 90% 的大模型该被淘汰，建议中国应考虑建立一个国家级的大模型，如何看待这一观点？

[收藏本文] 【下载本文】

“中国现在有数以百计的通用大模型，其中的90%没多大用处，也发展不起来，只会加剧资源和人力的浪费，应该被淘汰。”1月18日，在“北京CGT新势发布会”…

跟武侠小说里提倡设立武林盟主一职的那个角色一模一样。。。左冷禅？
要么是他想当武林盟主，要么是想当盟主的人让他说的。
没有武林盟主的江湖本无事，但总有人来生是非。
试问，
1.那云计算要不要各个公司停下来，统一做一个云？
2.电商平台要不要都停下，就做一个？
3.芯片是不是科研院所都合并，企业都合并，就放一起搞科研？

陈润生院士的观点有几个：
既然多数大模型会被淘汰，不如不做，免得造成资源和人力的浪费；大模型应该是纵向打造的；要建立国家级的大模型；
这里首先对陈润生院士在生物信息方面的贡献表示敬意，毕竟我也选修过一门生物信息学相关课程。不过对于大模型的这几个观点，我有不同的看法。
如果说90%的大模型都应该淘汰的，那么如果有100个大模型，那么还能留下10个。但如果只有10个模型，那就只剩下一个了。多数行业都是这样，一个快速发展的行业，必然是带有大量的行业泡沫，泡沫的破灭固然让人心痛，但一定程度上，泡沫是社会生产力前进的方式。能成功的最后肯定不到10%，但不代表另外的90%的存在就没意义。打个可能不准确的比方，你吃十个包子能饱，难道可以跳过前九个包子，直接吃第十个包子吗？中国各行各业发展之所以这么迅猛，激烈的竞争是一个重要的因素。不要用集中力量办大事的思维去对待信息行业，尤其是AI行业，因为智能的出现，大模型的涌现，并不是力量大小的问题。陈润生院士作为生物信息学的领头羊，应该听过AlphaFold吧。当然，AlphaFold和现在大语言模型的本质区别是，它压根不是语言模型，但它也属于AI模型，至于大不大，就见仁见智了。AlphaFold 2100万参数，AlphaFold2拥有9300万参数，以不到GPT-3千分之一的参数量，就能在垂直领域做到顶尖。大语言模型的出现，是为了能尽可能做更多事情，甚至实现通用智能，从来就不是为了解决垂直问题的（当然经过finetune也能用来解决垂直问题）。而且，也没有因为大模型的出现，垂直领域的模型就停止发展了吧？难道ChatGPT是国家级的模型吗？如果要实现「能解决特定的实际问题，提高社会效率」，那么这个事情就应该让社会力量自己去做。而且，「特定的问题」有无数个，那么「一个」国家级大模型，就想解决无数个「特定的问题」，这到底是「纵向打造」还是「横向打造」呢？

我觉得，国家的确应该下场，但，不是去统一大模型，而是花大钱，花大时间，花很多人，去标注语料。特别是优质的学科类中文语料。包括各种翻译海外优秀文献什么的。
集中力量办大事就应该朝着确定正确的而且一定要做的目标前进。说白了那么多大模型，哪种好哪种不好，是坐办公室的文科生可以判断的吗？但，无论哪种模型，需要大量的优质语料是一定的，多多益善，越多越好。
语料某种意义上算是人工智能的基建了，这才是力大砖飞的事情。
而且操作简单，比如每个研究生以上毕业必须翻译几篇文献，同时每翻译一片给多少奖励，小语种多给一点。
至于说侵权，我不侵权chatgpt你给我用吗，A100你给我用吗？那就不用装什么正人君子了。
再有人说中文语料库会不会有其他瑕疵或者问题，什么术语不统一啊，翻译不好啊，那是一码归一码的事，这叫做，你可以不用，但我不能没有。我标好了，你觉得不好，不用就完了嘛。但不能没有。更何况，这些问题都不是没有解法的，且不说光是翻译的好的，阅读量大，评论多，翻译得差的没人看，看一秒关，无监督学习自己天然会根据聚类自己学呢。更何况，比审核，没人能比过咋们吧。而且还可以完善标注规则，比如格式，说明标注，笔记，交叉评分什么的。
另外还有人认为，这种语料库只有大模型有用，万一没用就废了，我就这么说，光是让每个研究生多精读十篇优秀文献，十年以后就是巨大的财富，这本身就是一个全民高等教育的过程，哪怕这个数据库真的没有用。

都看不到点子上。
这发言翻译一下就是：
“私企给技术员发钱做模型我又不赚，应该禁止他们做，然后国家发钱给我们，我们再转包出去做。”
没了

一声叹息，这属实是被计划经济思维荼毒太深。
所谓的“国家层面”应该搞的，是那种比较基础、没啥技术迭代要求、大家广泛共享的东西。放到AI行业，“国家层面”适合搞的就是通用的、基础的数据集（尤其是中文数据集）。
其实有专业学者早在2021年就提出这一点了：

总结一下就是：
1、饭只要吃最后一口就饱了，前面吃的都是浪费。
2、这最后一口饭还必须得由国家队带领着才能吃到。

陈院士这个访谈大部分说的是他本专业的事，争议不大，引起热议的只是他说的这一小段跨界言论。
好的大模型要真正解决实际问题，并具有足够的准确度和效率。中国现在有上百个大模型，其中的90%没多大用处，只会加剧资源和人力的浪费，应该被淘汰。
中国应该考虑建立一个国家级的大模型，这是适应当前国际竞争的一种方式。
然后，采访者就问其他问题了，都没有接这个话题往下问，陈院士也没有继续发挥，到此为止。
我说一下我个人的观点，逐句来说——
好的大模型要真正解决实际问题，并具有足够的准确度和效率——无争议，没错！
中国现在有上百个大模型，其中的90%没多大用处——何止没有用处，就这90%的模型里还有一大半其实就是别的模型改个参数，换个皮，就拿出来忽悠了，也就是他们并没有提供多少实际价值。
只会加剧资源和人力的浪费——这话我就不爱听了，怎么就叫浪费啊？没这么多人搞这些重复劳动，哪来这么多就业机会啊？现在计算机相关的就业形势本来就不好，你要是还把大模型研发钉死成『浪费』，那不得有更大的失业率？再说了，怎么就是『人力浪费』啊，现在人力都过剩，你不『浪费』人力在大模型上，那指条明路在哪个方向才不是『浪费』吧。
应该被淘汰——我同意，优胜劣汰适者生存，不合适的大模型应该被淘汰，但是应该用市场规则让他们自然淘汰，不能拿着行政命令要求他们自杀。
中国应该考虑建立一个国家级的大模型——我同意，当然应该『考虑』，但是建不建得起来，要看疗效，前有国家队的搜索引擎做成那样，你让我无脑相信国家级大模型会更好，说服我有点难度。
这是适应当前国际竞争的一种方式——我没明白这是什么逻辑，是演绎法还是归纳法？你要说是归纳法吧，国际上并无国家队大模型成功先例；你要说是演绎法吧，以什么推理过程可以得出国家队大模型是适应国际竞争的方式呢？或者是反证法？因为如果没有国家队大模型，可能在大模型上被某些势力卡脖子？我真的很希望陈院士在这个方面展开讲一讲。
总结看来，其实大部分陈院士的话也没啥大问题，但是『应该被淘汰』和『国家级大模型』连在一起看还是有点吓人，有点让人觉得这个意思就是——淘汰掉所有其他模型，只留国家级大模型。
但是，以陈院士的学识和眼光，我相信他的本意绝不是如此。
有一个国家级大模型，不代表就不能有民间野生模型，大家不要错误引申理解为有了国家队就必须杀死其他队。

你在整篇采访中选取了最能吸引流量的一句话当标题和提问，让我怎么看？
我的看法就是以后专业人士不要接受经济观察报的采访，专业人士说一大堆，经济观察报也只会找最能引发舆论和流量的话当标题，还会把你挂到知乎提问。

这就是典型的外行权威不懂内行，然后...。
真正专业的大模型应该是纵向打造的，能解决特定的实际问题。
就这一句话就充分暴露出这位院士对于现阶段大模型的了解大概率是来源于他们自己的团队，而不是最顶尖的人工智能从来者。
我们看
Sam Altman 尽管不是一个技术型人材，但是他会说：“人类无限接近于 AGI”，
斯图尔特·罗素：AI新生：破解人机共存密码：人类最后一个大问题。在 2020 年出书讨论怎么对齐人类价值观到人工智能。
这才是最正确的于最顶尖的公司的最顶尖的管理层的声音，
这才是全球最牛的高校的人工从业者的思考。
面我们的最顶级的学者，最高级的科技帽子的院士告诉我们：90%的大模型都是没用的，真正专业的大模型应该是纵向打造的，能解决特定的实际问题。
是什么样的信息来源，促使他确信现在的大模型的世界是这样的？还是有人在误导他？
好的大模型要真正解决实际问题，并具有足够的准确度和效率。中国现在有上百个大模型，其中的90%没多大用处，只会加剧资源和人力的浪费，应该被淘汰。
中国应该考虑建立一个国家级的大模型，这是适应当前国际竞争的一种方式。
过去我们的大基金是这样的目标吧，尽可能集中资金搞几家企业来把芯片卡脖子问题搞掉，但是搞出了什么？建立一个国家级的大模型？那我问你？
谁来建？谁出钱？凭什么是他？如果不成了怎么办？
任何一件事没有竞争，就一定是坏的！
同样，如果想封闭现有的竞争方式，那更是坏的。一个基于现在的相对充分的市场化投资的竞争的大模型环境为什么不应该得到更充分的发展？
如果不懂还处于高位，请尽量保持“克制”。
现在的努力方向如果是垂直大模型，就像在 386 出现的时候，还在努力研究个“计算器”一样可笑！

我觉得有点太保守了, 不够城市化, 我认为 90% 的国家和企业都应该被淘汰
世界上现在有数以百计的国家,其中的 90% 没多大用处, 也发展不起来, 只会加剧资源和人力的浪费, 应该加速淘汰!
人类应该联合起来, 建立一个世界级的科研机构, 打破所有科技壁垒.
共享先进生产力, 分享高性能芯片设计, 统一调配计算资源, 打造超级大模型.
人类跑步进入奇点时代
啥, 你问为啥他们要听我的?
因为我是秦始皇! 打钱!!!

看了看采访的原文[1]，陈院士的团队是做生物信息、医疗领域大模型的（多模态数据智能整合计算平台「灵枢」），所以他们的数据更专业，做的业务更垂直，他的观点是从医疗大模型→垂直专业大模型→通用大模型：
希望搭建一个医学健康大模型，将转录组、表观组和蛋白组等与生物相关的信息整合在一起，利用大模型去分析，并将中医中药的知识融入进去，观察其中内部知识之间的相互作用，看中医中药信息的加入是否能改变医疗参数。真正专业的大模型应该是纵向打造的，能解决特定的实际问题，提高社会效率，在某个领域成为第一才有价值。好的大模型要真正解决实际问题，并具有足够的准确度和效率。中国现在有上百个大模型，其中的90%没多大用处，只会加剧资源和人力的浪费，应该被淘汰。中国应该考虑建立一个国家级的大模型，这是适应当前国际竞争的一种方式。

https://new.qq.com/rain/a/20230918A06X1I00
从陈院士的视角来看，他说的话是有道理的。而且他其实指出了现在大模型存在的三个问题：幻觉和准确率、垂直领域落地难、百模大战造成浪费。
先说准确率问题，陈院士做的是医疗大模型，所以当然能批评通用大模型的准确率。大语言模型现在最大的问题就是「幻觉」，而医疗领域又是最不能出错的。所以现在的 ChatGPT 拿去写东西可以，但到了比较专业的领域，还是只能作为辅助手段使用。

Dalle作图：仿生人会梦到电子羊吗
进而就会带来大模型落地应用的问题，如果想让大模型脱离娱乐，进入严肃的生产力场景，就需要补充更多的专业知识，在垂直领域想办法落地。
这两条说的都没问题，也是大家都知道的。
至于说第三条，批评国内90%的大模型没有用，造成了资源和人力浪费。这话要说也对，但有几个问题，ChatGPT 在美国也是企业搞出来的，而且美国同样有 Claude，有 Llama，有 Gemini，同样存在竞争和浪费；国内的模型看上去多，其实很多是充数的，真正能完整地从头训练的也并不多。

2023 年的大模型的确过热，但从市场角度，没有一个跟互联网、科技或者期望 AI 赋能的企业会放弃大模型的研发应用，因为大家都怕被甩下车，所以这更多是一个市场的自发行为。
至于资源和人才浪费，从资源配置的角度考虑，过多的通用大模型的确会导致资源的分散和效率的降低。更科学的做法是集中优势资源，形成规模效应，集中力量办大事。但也不能否认很多创新的工作来自少数人，技术创新是一个复杂的探索过程，要不断的试验、错误和迭代。尝试创建一个统一的「标准答案」可能反而限制创新的发展。如果举国之力有用的话…那…芯片呢？
不过不论如何，80多岁的院士，还在坚持学习最新的 AI 知识，很令人敬佩。有时间可以听一下院士去年的讲座：

0
参考^https://www.eeo.com.cn/2024/0126/631842.shtml

我是学习AI绘画的，大模型人工智能，AI已经成为我们生活中必不可少的应用了。
真的是好喜欢，这个大大的马尾，特别的飘逸，大家应该能够看出来人物皮肤也特别的白皙，这样的Ai绘画，感觉怎么样也看不厌的。
这些特别具有个性美对Ai来说，才是它真正拿手的。
这样的Ai绘画，你爱了吗？
如果你也喜欢的话可以学习下，毕竟以后的大模型AI是个主流，并不是像提问者说的90%都需要淘汰，毕竟大家都有差异，不适合你的并不代表不适合其他人。
有需要的可以领取无门槛红包，一天可以领取三次。

广告
2024京东年货节京享红包
01.17 11:06 - 02.06 00:00
领取京享红包享受更多优惠
去领取?

广告
ChatGPT风暴：大语言模型、生成式AI与AIGC颠覆创新范
京东
￥65.50
去购买?

这是妥妥的「我觉得在坐各位都是乐色」啊！
到底是实力强到没边的寂寞（无敌是多么寂寞），还是呼吁变革的理由？我倒觉得是后者。
建立一个国家级大模型，谈何容易？且不说资金、技术和人才。就单说投资动力和变现维持模式，也难比登天！
低质量、重复性的模型，确实没有实用价值。但该不该淘汰的判断，应当交给市场。
再说，低质量、重复性要如何定义？
就以 OpenAI 为例吧，那是不是不如 GPT-4 的大模型，都该被淘汰呢？难道不如 GPT-4 的大模型，就没有复刻它的权力？由这个逻辑出发，那其他不如它的 AI 大模型应用，又算什么？都只是“低质”、“重复” 、“资源浪费”的产物？
因此，在大模型发展过程中，如何平衡技术创新和实际应用之间的关系（既要鼓励创新，探索新技术和新应用场景，也要保护跟随者的创造热情），就是一个留给市场解答的玄学。
至于资源、人力有效利用的大问题，不是一股脑地推给政府、企业和学术界，就能完美解决的。
张口就来「国内 90% 的大模型低质该淘汰」，未免太过武断了吧。我想，陈教授的重点也不应该是这个。
从媒体报道来看，陈教授的观点「真正专业的大模型应该是纵向打造的，能解决特定的实际问题，提高社会效率，在某个领域成为第一才有价值。他认为，中国应该考虑建立一个国家级的大模型，这是适应当前国际竞争的一种方式。」有没有被某些媒体故意歪曲（断章取义），还未可知。
兴许，他只是在呼吁国家级的 AI 大模型，来应对科研和竞争。

其实我的心态很矛盾。
一方面我确实觉得ChatGPT这种语料库中一堆工口文甚至重口文、各种AI奴工瞎标数据的腊鸡AI应该淘汰。
另一方面，真出了个国家级的大模型，肯定没法用来写纳西妲的小凰文……

的确有国家应该立即着手做的事情，但不是国家队大模型，而是高质量中文语料库。可以说是生死存亡的关键了。
应该立即牵头成立中文语料联盟，要求以下企事业单位参加：
各大互联网平台互联网新闻门户各级政府部门报刊杂志等传统媒体出版社标准、专利等政府部门
统一一种或几种语料格式，要求以上单位将掌握的语料的至少50%以统一价格卖给语料联盟，按字数和质量等级计费。联盟中的成员可以无偿获得其他成员提供的语料。联盟将收到语料中的10%免费开源发布，供高校和个人研究者使用。其余语料分门别类进行付费下载，收取的费用由提供语料的单位和平台分成，用于支付运营成本。
训练模型各有各的做法，完全可以独立研究，但爬取数据是真正意义上的重复劳动，并且极大增加了AI研究的门槛。许多互联网公司还使用反爬机制保护自己的数据，造成更多内耗。使用这种方式，发布语料的单位可以在发布前自行去掉业务敏感数据和个人信息敏感数据，增加更丰富的元数据，还可以从数据中获得一定收入，同时还能交换其他企事业单位的语料。出版社这样的单位可以和作者签订协议，将收入进一步和作者分成。如果担心影响书的销量，可以采用同一本书中节选的方式，比如每选取10页跳过10页内容。新闻类的则可以采用延迟提供语料的方式，比如本月上传上个月的新闻。

被保留的那10%不一定是能力出众的，
但肯定是关系够硬的。

只有雨后春笋才能长出参天大树，计划的时代已经过去，市场竞争才能养出最好的答案
毕竟在学术领域钱学森式的战略科学家太少，不能总指望一个人或者一种事物成为解决万物的公式，而是千千万万的人和事物长期投入互相交流互相竞争才有了如今的成就，路线方针不能错，多不代表没用，一枝独秀也不代表完美，品品？

我敢打赌这位陈院士对LLM发展的理解还不如
@曲凯
或者
@庄明浩（rosicky311）
，因为如果说“该”的话，这90%的基座“应该”做垂直应用，或者成为算法之间的算法，而100%的大模型，包括院士口中的国家级大模型，都很难在今后的发展中跟上节奏，成为与gpt、辣妈这样的域图统领万事万物且每样都还很出色的算力竞争，成为国家的通用算力。
想法不错，领导肯定爱听，
编点排名高兴高兴还行。
建议这位院士多听听播客，减少出席行业装逼论坛。

90%的大模型的确会被淘汰，但是集中力量搞出来的那个，必定是垃圾。
现在是AI热，自然会吸引大量投资，当然有过剩，有泡沫。
最终存活下来的那个，一定是能够经受市场考验的那个。
这几乎是每一轮技术创新都会发生事情。
院士们别对产业政策发表看法了，当年集中力量搞的5G，难道忘了。
我是时代之，一个以投资为生的人，96%胜率实盘公开同名公号，祝幸福！

大模型称中国 90% 的院士该被淘汰，建议中国应考虑建立一个国家级的院士，如何看待这一观点？

这才是真话，但对于建立国家级的大模型，个人不看好，也不建议这样做。
前段时间中国的百模大战，恕我直言，多数都是技术水平低下的重复建设，其主要考量是商业因素：
一是充门面，你有我也要有，如果你有我没有，那不显得我很LOW，创新能力很弱嘛；
二是忽悠不懂技术的粉丝的消费者，一扯到大模型就好象前些年的区域链、量子和元宇宙一样，完全是为了割韭菜。
之所以出现这种乱象就是因为这个东西它不象一般的硬件和软件一样，有一个明确的标准和可以直接对照比较，所以任由这些厂家在那里胡吹胡搞，一窝蜂的上，然后就不见了下文，也没有特别显著且有影响力的应用。
建立国家级的大模型初心是好的，但是很难落地。
首先就是真正最强的AI技术团队和人员都在各民营科技企业，国字号的基本上没眼看，如果要搞，就只能抽调人员或者是分派技术，这样就很难落地，最后就是各家想方设法瓜分相关的科研资金，最后一地鸡毛；
二是各家出于自己利益的考虑，很难整合到一起，最后出来一个缝合怪，在技术上就不一定先进；
三是往往受地域和关系的影响，里面的博弈最后都会变成政治或非技术性的影响因素，比如百度在北京它说我最强，腾讯和华为在深圳说我最强，阿里说我也是最强的，上海一线城市也不能说没有代表啊，也会推出一个“我最强”。就算是北京，小米出来说我也很强啊，联想说我也不差，字节跳出来说你们都是渣渣，看看我的抖音和TIKTOK在算法在全球市场上都火成了什么样？这样就变成了一种非技术性的博弈，但这往往和先进性无关；
四是一个大模型的建立和调优，它是一个渐近且长期的过程，要维持这个过程，代价是很大的，并且随着软硬件和技术路线的变化，极有可能整成一个烂尾工程或半拉子工程，最后不了了之，但是钱花了，时间浪费了。
真正最好的办法还是由各企业自由竞争，国家给以扶持或者补贴，给以政策引导，专家院士团队给以技术支持，最后活下来的才是真英雄。
有一句话叫做：江湖上的事少管。

在科技迅速发展的当下，持续更新和优化研究基础设施成为推动创新的关键因素之一。
院士提出的观点认为中国90%的大模型已不适应现代科技发展的需求，应当被淘汰。
他还建议中国考虑建立一个国家级的大模型，以便集中资源，打造能够支撑高水平科学研究和技术发展的平台。
这样的提议无疑引发了学术界和工业界的广泛关注，它不仅触及了资源配置的效率问题，也关联到国家在全球科技竞争中的战略布局。
实质上是围绕如何高效利用科研资源、如何提升研究设施的现代化水平、以及如何在国际科技舞台上保持竞争力等多重问题的深入讨论。
如果你还有什么疑问，可以看看关于大模型的下面这本书，我想对你肯定有很大帮助。

专家已经不管用了，开始用院士了，院士用完了用什么？你们这是在给民众培养舆论抗药性吗？

从经济学的角度，动不动就国家来主导，国家来监管，举国体制，最终的结果就是低效。对于需要软件生态的信息技术领域，全世界的做法都是市场化的开放平台，向全世界开发者开放来实现生态贯通，从来都是横向适配不是纵向垂直的。哪怕是阿尔法狗，阿尔法fold，一个下围棋一个侧蛋白质，他们也是神经网络的横向适配而不是纵向适配。
AI不能由国家来搞，要靠市场，好用的AI吸引开发者，开发者适配AI开发更好的应用，让通用AI发光发热，市场淘汰9成是正常的，国家淘汰9成，那么中国就不会有AI。
另外，芯片、操作系统、EDA、甚至光刻机。请注意，这些是技术积累也是生态积累。举个例子，如果是通用软件领域，我国是可以和全世界持平的，因为开源代码环境很好，软件代码很多是分享的，要感谢程序员的极客精神，而你看见过芯片核心代码开源吗？有，但很少，各大厂都是守着代码吃饭的，无论是牙膏厂、农厂、还是小黄飞刀，这个领域生态就很难做。但如果你有一款产品，性能能够超过竞争对手，此时即便你现在兼容适配的东西很少，也会有人为了打破垄断来给你适配。打个比方说，AMD先用了3纳米先进制程，而那个时候英特尔从10纳米才开始挺近7纳米，那么当时AMD能够扩大一倍芯片性能，解决好积热问题，那么就能够反超英特尔，虽然AMD兼容性次于英特尔，当然，AMD由于是跟随策略和服务器芯片设计思路，他没有这么做。但我们可以这么做。
只不过，如今多条生态道路全被堵死，这方面原因在于国家竞争，这方面需要的是修复对外关系，因为现阶段真的是自己孤立自己，也仅仅是到2023年年底，才开始注重外资，开始对外修复，比如互免签证，对美外交。

看了下高赞几个回答都是做计算机的，没人搞垂直领域，我就讲下垂直领域的难点吧
其实我是能理解陈院士说为啥要发动国家的力量的，你搞垂直领域，做商业，你的数据来源全是商业秘密，你怎么开源把所有的数据都搞到一起做大模型？
材料基因组计划很多开源的数据库都是美国的国家机关发动大学的力量攒了十几万的结构数据，材料领域，包括陈院士做的生信领域有名的数据库都是学术界搞的，再者说生信领域要获得一个实验样品的成本非常高，所以数据量本身就是少的。对于大模型来说第一关，数据来源不依托国家，你怎么去实现大数据？
企业也非常想搞，但是根本就没有那么多的数据量。况且人工智能是近几年火的，是没有企业把以前的所有的生产数据和研发数据保存下来的，再者你做早期的研发，数据量又非常少，质量又很差，根本就达不到大模型应用的条件，选择发动国家的力量其实是无奈之举。
所以你要搞垂直领域的大模型光数据量就卡住了。
然后做生信，我想数据一般都是医院的数据吧，怎么整合起来还是个问题，然后陈院士是学术界的人啊，他说发动国家的力量不是很正常。你们要考虑陈院士的学术研究的背景啊。在学校做科研不是国家给拨款研究么？要不哪里来的经费？
再者你看企业目前能做起来的都是面向个人的，是因为消费者的数据容易收集且体量大。所以我觉得车企和消费电子领域应该是能做起来的，就只是时间问题了。
做大模型，有三点很重要，算法算力和数据，算力也是不差钱的企业搞的了，你让学术界的一个课题组买卡做么？钱够么？卡够么？

[收藏本文] 【下载本文】

科技知识最新文章

百度为什么越来越垃圾了?

为什么程序员总是发现不了自己的Bug?

出现在抖音评论区里边的算命真不真？

你认为 C++ 最不应该存在的特性是什么？

为什么 Windows 的兼容性这么强大，到底用了

如何看待Nvidia禁止使用翻译工具将cuda运行

为何苹果搞了十年的汽车还是难产，小米很快

该不该和AI说谢谢?

为什么突破性的技术总是最先发生在西方？

加:2024-01-27 10:09:24 更:2024-01-27 10:12:56

股票涨跌实时统计涨停板选股分时图选股跌停板选股 K线图选股成交量选股均线选股趋势线选股筹码理论波浪理论缠论 MACD指标 KDJ指标 BOLL指标 RSI指标炒股基础知识炒股故事

网站联系: qq:121756557 email:121756557@qq.com 天天财汇