[科技知识] 国内AI大模型已近80个，哪个最有前途？

天天财汇购物网址万年历小说 | 三峰软件小游戏视频

TxT小说阅读器
↓小说语音阅读,小说下载↓

一键清除系统垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

图片自动播放器
↓图片自动播放,产品展示↓

首页淘股吧股票涨跌实时统计涨停板选股股票入门股票书籍股票问答分时图选股跌停板选股 K线图选股成交量选股 [平安银行]

股市论谈均线选股趋势线选股筹码理论波浪理论缠论 MACD指标 KDJ指标 BOLL指标 RSI指标炒股基础知识炒股故事

商业财经科技知识汽车百科工程技术自然科学家居生活设计艺术财经视频游戏--

天天财汇 -> 科技知识 -> 国内AI大模型已近80个，哪个最有前途？ -> 正文阅读

[科技知识]国内AI大模型已近80个，哪个最有前途？

[收藏本文] 【下载本文】

找个有前途的关注，如果开源，就尝试用着，免得落后。

什么叫“有前途”？——有实力有发展前景。（最起码在功能使用上达到需求，并且有发展空间）
AI大模型一直被大家关注和使用
据统计，全球AI市场规模预计到2024年将超六千亿美元，复合增速27%。
2016-2019年，中国市场规模从329.6亿元增长至1372.4亿元，复合增长率约61%，显著高于全球整体增速水平，预计2020年到2024年将以44%的年复合增长率继续放量，并在2024年突破7993亿元。

图片来自网络
其实不难看出，国内近几年的科技发展真的非常之快
目前大模型中GPT-4一直是个传说，它确实具有不错的技术水准，分析能力、撰写能力。
但国内的AI工具也不能全都一棒子打死，很多产品实力都不错的，拿通义来讲

图片来自网络
通义分为了底层统一算法架构、中层通用算法和上层产业应用。在底层通义算法架构方面，通义基于两个基础模型，覆盖语言、文本等多种要素的编码与生成；在中层通用算法方面，通用能够实现视频处理、视觉问答、视觉算数等多种算法；在上层产业应用方面，目前通义可以在电商行业实现图像搜索和万物识别等场景应用。
国内的技术一直在进步，我也一直在探索，今天也给大家说一说我比较常用的AI产品
AI写作类一、笔灵AI写作传送门：https://ibiling.cn/推荐程度： ?????
1、智能改写和续写
改写：如果需要改写的情况下，大部分原因要不就是内容格式不符合，要不就是不能原版照抄。笔灵的改写功能就能解决这个问题。

五种语态可以选择（正式得体、严肃庄重、有说服力、轻松、热情），这五种应该就可以满足所有的情景。另外，还可以直接上传文件
续写：当你没有灵感写不下去的时候，就可以使用续写。灵感源源不断~

续写功能支持上传word，txt，markdown格式文件，对于续写来说简直不要太方便
2、站内200＋模板覆盖范围广
笔灵里面有超级多模板，而且这么多模板不会有雷同，每个模板都是独立且高效。
学生党、上班族、自媒体人...无论你是哪个领域都可以找到能辅助自己的模板。有办公类（如工作汇报）、公文类（如通用公文写作）、专业写作类（如商业计划)等近15个大类。
如果真的就没有你想要的模板，直接选择自定义，一对一定制款。

还能满足小某书、某音的需求哦~~~包含的内容还是非常详细的

3、自动保存文件
生成文件后，系统会自动保存到【我的文件】中。下次使用就可以直接访问，不需要再次生成，省时省力省字数。

二、火山写作传送门：https://writingo.net/推荐程度： ????
提供强有力的互联网“证据”
火山写作比较突出的特点就是可以给你提供互联网链接，可能对于一些AI产品它生成出来的内容，触及到我们的知识盲区，该功能就算是一个小科普。

另外，火山写作不仅仅可以用于中英文的纠错、润色、改写。
系统有一个相对完整的体系，从文本生成→主题深挖→内容打磨→全文优化，能为大家省掉很多事情。
AI聊天类一、对话鸭传送门：https://botvip.cn/推荐程度： ?????
1、集合了国内很多知名模型
AI对话鸭可是国内AI工具中的一股清流呢！它拥有超级厉害的AI大模型合集，简直就是一个AI小宝库。
里面汇聚了国内超多爆火的AI工具，像是百度的小能手（极速版、基础版）、科大讯飞的星火（1.5、2.0、3.0）、字节的云雀（极速版、增强版、专业版）等等。

输入内容，可以同时生成内容，多家模型进行对比，更具有说服力。
2、一键与AI机器人对话
对话鸭里面有很多角色机器人，这个AI会带入到你选择的那个角色。相当于，你在跟你选的角色进行聊天。
不知道大家能不能get到这个功能的乐趣，不仅能够给解决生活中的琐事（比如：女朋友的极致问题、职场上的人情世故），还能给你解决工作问题。

3、新上新的【春节】特别栏目
这是我超级无敌最喜欢的一个板块，开发团队真的有心了。
马上就要过年了，如何高情商回复长辈！！！回答非常投其所好，回答了问题还带点吉祥话

可以给大家看一下【春节】板块带有的功能，职场、家庭、亲朋好友方方面面都能照顾到。
还可以给你制定一个新年减肥计划~

二、豆包传送门：https://www.doubao.com/chat/推荐程度： ???
AI聊天对象覆盖广
豆包是新开发的项目，目前正在免费公测。里面可进行对话聊天的对象很广，覆盖也全。可以去尝试一下。
跟“豆包”进行对话过程中，非常流畅生成内容质量也不错

该网站内除了可以对话聊天之外，还可以智能生成图片、音乐电台、英语学习助手等等。
因为是新产品，如果有什么问题，大家可以多提。

AI绘画一、AIlogo传送门：https://ai.logo123.com/推荐程度： ????
1、根据品牌定制logo
AI也可以设计logo啦！输入你的【品牌名称】页面会提示你想要的风格、样式，系统会给你生成10+个品牌logo

不仅仅单一生成后就办法操作了，在AILOGO可以自由在线编辑Logo，点击你喜欢的Logo进入在线编辑器，就可以随时修改LOGO的字体、颜色、图标、排版等元素，修改完成后就能一键保存下载了。

2、套用模板预览样品
logo设计出来可能不是很直观，站内可以直接预览样品＋logo的样式，一目了然。放在哪些地方合不合适，搭不搭配等等，非常适合低预算的小老板们。

二、触手AI传送门：http://douchu.ai/warehouse/styleStore推荐程度： ???
1、一体化专业工作台
触手AI是国产AI绘画创作平台，专门为喜欢插画、漫画、设计的小伙伴们打造的！
它支持文生图、图生图、参考生图、lora在线模型训练，还有超多模型可以随意使用哦~

除了为小白设计了【极简模式】赛道，还给专业的人设置的【专业赛道】，并且搭配了详细的图文介绍。

2、绘图功能
在创作广场可以看到大家所生成的作品，用户生成的图片都是都可以的。细节刻画的地方都有照顾到，当然每个人的审美不一样，生成出自己不喜欢的图片再次生成就可以了

以上三大类，就是今天给大家概括几款AI产品，都给大家附带了传送门也做出了推荐程度，大部分的AI产品在首次登陆都会给大家相应的试用机会，大家可以都去试一试。
除了这些产品，国内还会源源不断的产出更多好用有前途的工具，如果大家有知道的也可以向我推荐。

Qwen-72B，没有短板，全面接近3.5的模型！

题主说错了，不是80个，是168个！
虽然“最有前途”不好说，但是我可以帮题主排除一些错误方向：
开源大模型一定比闭源的有前途吗？参数量大的模型一定就比小模型有前途吗？榜单排名高的大模型一定更有前途吗？168个国产大模型，都是什么来头？
1785年，瓦特改进了蒸汽机，人类从此摆脱了手工业的桎梏，迈向辉煌的蒸汽时代。
1870年，第二次工业革命光芒四溢，人类踏上了电气时代的漫长征程。
20世纪70年代后，数字化崛起，人类开始踏入互联网的无尽广阔领域。
时至今日，随着AI算法的不断演化和计算需求的迅猛增长，人工智能时代悄然降临。至于那匹引领人类前进的黑马是谁，是Chat GPT，或者是Chat GLM？我不知道。
但可预见的是，AI大型模型的影响力不亚于蒸汽机、电力、数字化对人类生产方式的影响，它们将为社会技术发展带来另一次飞跃，带来新一轮指数级信息爆炸。

图1 全球大模型发布时间节点
而我国，依然在这场革命中涌现出了强大的科技与智慧的力量。
中国本土大型模型的崛起进程始于2017年，当时中国的科研机构与企业积极投身深度学习与自然语言处理领域，默默耕耘，蓬勃至今。据不完全统计，目前国内已有AI大模型168家（数据来源：http://github.com/wgwang/LLMs-In-China），比题主提到时，足足翻了一倍。

图2 部分本土大模型信息
其中，通用模型24个，用于科研/医疗/政务/公共服务的模型40个，其他均为商业应用及服务提供。值得一提的是，其中开源模型只有几家，名列前茅的，分别是智谱AI和清华大学 KEG 实验室联合发布的ChatGLM，以及百川智能推出的Baichuan 2。
随着我们深入了解人工智能，从科幻作品中的描绘，到第一次尝试对话的新奇体验，再到探索大模型的深层架构，我们正将大模型作为自己在物理世界之外的一种智慧延伸。这些智慧触角终将揭开我们科技未来的迷雾。中国的人工智能之路虽漫长曲折，但我们正稳步走出这个序章，迈向光明的未来。
在这个人工智能大模型的浪潮中，你是否也想成为那个能驾驭这股力量的超级个体？加入知乎知学堂的【程序员的AI大模型进阶之旅】公开课，2天内你将学习到如何定制属于你自己的大模型，把握AI的前沿技术。这次公开课将为你揭示大模型的深层秘密，并教你如何在竞争激烈的AI领域中脱颖而出。
??2024大模型公开课??训练方法+应用场景+个人增收
￥0.00点击领取
2天课程结束后还会提供AI大模型资料包，助你更深入地理解和应用这些技术。想要获取更多指导和帮助，也可以添加助教微信，一起探索AI的奥秘，共同成长！
开源大模型一定比闭源的有前途吗？
如何评价一个AI模型“好不好”“有没有发展”，首先就躲不掉“开源”和“闭源”两条发展路径。
在中国，大型模型可分为两大类，一类以模型本身为核心，另一类则以服务应用为主导。首先是以Chat GLM和百川为代表的通用开源模型。它们的独特之处在于在中文语境下的出色表现。为了提升这类模型在处理中文方面的能力，开发者通常采用两种策略：一是扩大词汇表的规模，二是增加中文语料库的比例。开源模型的优势在于易于使用，只需强大的GPU即可运行。不足之处在于主观体验和论文中的数据可能存在差异，实际使用时性能可能不如宣传所示。

图4 国内主要公司可商用大模型表（图片来源：36Kr）
另一类大型模型数量较多，这些大模型通常以套壳Llama或其他类似模型为基础，在特定数据集上进行深度的个性化定制和优化。特点在于它们专注于特定市场细分领域，通过深度定制和优化以提升性能。当然，从论文角度看,某些模型通过特殊方法能够接近或甚至超越Chat GPT，在特定领域的任务上表现出色。
在8月推出的Llama 2 中可以看到，模型系列包含 70 亿、130 亿和 700 亿三种参数变体。此外还训练了 340 亿参数变体，相比于 Llama 1的训练数据多了40%，因此，基于Llama2的开源模型进行数据收集调用及调试的“再生长大模型”，也并非没有可能实现弯道超车。

在我国，目前还是以第二类大型模型主要以服务为主导，如大家比较关注的百度、讯飞等推出了通用大型模型。这些模型不开源，用户需通过其提供的服务来使用。它们不仅提供聊天服务，还需要在特定场景中应用以实现盈利。这些模型的服务模式和费用基本与Chat GPT及其他竞争对手保持一致，以在市场竞争中取得优势。
当然，开源是有一定的技术及成本优势的。
首先，庞大参数数量的开源大型模型，性能已媲美超级规模封闭模型。其次，通过极少的预算、适度的数据和低阶适应技术（LoRA）等工具，就可以使参数相对较小的开源大型模型达到令人满意的性能水平。这种技术创新降低了训练成本，为企业提供了可替代昂贵闭源模型的低成本解决方案。
自Llama2后，大模型圈风雨欲来，可商用开源成为了下一个各大厂商牟足了劲头实现的目标。可是否开源，难道就是最终评判某个大模型是否可以在这个斗兽场里存活的标准吗？

参数量大的模型一定就比小模型有前途吗？
这两天刚有一篇微软论文指出，ChatGPT的参数量只有20B（200亿），而不是以往认为的100B以上（很多人认为是175B）。
虽然微软这篇论文后来撤稿了，不过很多分析说主要是因为涉密了，并不是说真的从聊天群里取的数据。
相比单一的参数量维度，宏观来说，大模型的评价其实可以分为以下几个维度：技术维度、商业应用、伦理责任
从技术角度来讲，哪个模型在深度学习、自然语言处理、计算机视觉等方面有独特的技术优势是最底层的核心逻辑。在此之上，模型的性能通常受训练数据和计算资源的限制。哪个模型拥有更多、更多样化的数据，以及更先进的计算能力？这将直接影响模型的前途。

图5 大模型技术架构
从应用角度来说，大模型厂商自身是否制定了更具前瞻性的商业策略、合理的商业模式，是其长期存活市场的基础。而其选择的赛道是否满足了标的市场的实际需求，在细分垂直领域的适用性能做到最好，市场是否买单，就是保证它前途光明的必要条件。

图6 大模型行业应用逻辑
最后一个，也是全世界都在面临的同一个问题，就是机器伦理与合规。哪个模型在道德和伦理方面表现出更高的责任感？是否有明确的道德准则，以确保模型在使用中不会伤害社会和个体？哪个模型有更好的合规准则？更好的数据隐私保护和安全措施？一不小心，《终结者》或许就会变成未来的现实……

图7 基于大模型的社会应用实践
而对于非投资市场及终端用户的业内人士来说，评价一个大模型的是非功过则更以数据和实践见真章。

图8 大模型能力维度评价榜单排名高的大模型一定更有前途吗？
其实，内网也早已流传着一份针对于中文通用大模型的综合性测评基准（SuperCLUE），月度更新。根据SuperCLUE最新一期（2023.07）中文通用大模型榜单排名显示，目前排在前三位的分别是来自百度的文心一言（v2.2.0），来自智谱的ChatGLM-130B，以及来自科大讯飞的讯飞星火（v1.5）

图9 SuperCLUE中文大模型排行榜（2023年7月）
当然，榜单仅供参考。毕竟某厂“喜欢给自己飞小红花”的名声过于昭著。对于用户来说，开源/闭源，语料库的偏向性，应用赛道的数据需求等等问题太多了。面对着一个还没有蓄满水的鱼塘，从哪片浅滩挖蛤蜊，就是非常见仁见智的事情。
某AI大厂的架构师就曾经私下说，他们在开发自己的应用模型时，把C-Eval排行靠前的几家都试了一下，效果不好说，某个炒的比较热的模型甚至很意外的崩了。虽然他总是嚷嚷着公司抠没钱自己开源，但好处是也让他挖掘到了一些物美价廉的小LLM，发现实际体验感反而不错。
因此，排名不能完全代表“有前途”，投得热也代表不了“有前途”，甚至广泛意义上对话的人数量够多….好吧，在某种程度上来说可以代表它或许比较有前途。但在2026年高质量语库即将耗尽的预告下，人工喂养也将不再成为强壮大模型的重要决定因素。就当下来说，哪个模型使用感更好，就押宝在哪个模型，无脑傻白甜，最香。
AI大模型涌现元年，资本巨头联合科技大佬们开始一场“诸神之战”，不断扩展数据池，升级硬核算力。高昂的成本，意味着绝对高门槛。不只如此，AI 2.0的创业者们要玩得起，技术要求也跃升了一个档次。据悉，能够把基础模型打造成工程化产品的公司，在一两百个大模型中，用两只手就数的过来。也正是因为如此，招兵买马是头等大事，毕竟国内主导深度学习框架和AI框架的高手寥寥可数。
而我们流浪在这一波跨时代，跨世代，甚至跨越人类文明历史的科技变革浪潮中，能做的，只有随之进化，成为超级个体。赶快进入知乎知学堂旗下AGI课堂推出的【程序员的AI大模型进阶之旅】公开课，2天满满干货，限时全部免费！
??2024大模型公开课??训练方法+应用场景+个人增收
￥0.00点击领取
随着我们一步一步对人工智能的开发和了解，从科幻作品中的描摹，到第一次尝试对话的新奇接触，到深入大模型的底层架构，掌握它，训练它，将大模型作为自己在物理态存在之外的，前人永远无法想象的智慧之触，只用了短短几十年。这些触角最后汇聚在数据的终点，终将可以拨开我们科技未来的层层迷雾。正如现在，虽然对于中国的人工智能来说仍然是路漫漫其修远兮，但我们正慢慢走出这混沌而曲折的序章，奔向光明的前途之路。

利益无关：因为我没有在做基础大模型（做的是 infra 和应用层），目前也没有做国内市场，所以可以从相对中立的角度提供一些信息。
创业几个月，发现可以比普通大厂员工拿到多很多的信息，从投资人和全球 top AI 公司的核心成员那里可以学到很多。综合在美国三个月得到的信息，感觉大厂里面最有前途的是字节和百度，已经公开发布大模型的创业公司里面最有前途的是智谱和 moonshot。
虽然 Robin 说国内已经有上百家做基础大模型的，但由于基础大模型本身是相对同质化的产品，最后基础大模型的市场很可能像公有云一样，top 3 占据大部分的市场，其他的市场份额只能算是 others。
目前国内大多数大模型创业公司才刚开始半年，一切都还没有尘埃落定，有些隐藏的高手还在默默憋大招。大模型的时代才刚刚开始，留得青山在，不怕没柴烧。
字节
为啥觉得字节可能是最有前途的呢？
字节有最多的多模态中文私有数据。高质量数据在大模型训练中是非常关键的。中文高质量的公开数据本来就不多，现在基本上已经被爬干净了。大模型的下一站肯定是多模态，字节有最多的多模态数据。字节有 OpenAI 的研究科学家。几个月前字节就从 OpenAI 高价挖了几个科学家。4 月份业界就有传闻说字节想花上百万美金从 OpenAI 挖人，结果面试官被 OpenAI 反挖走了，成了段子。没想到字节真的从 OpenAI 挖到了人。字节有很多 GPU 资源。早在几年前，字节就开始做大规模 GPU 集群，积累了很多 GPU 资源，今年初 GPU 荒的时候，火山云靠着屯的 GPU 卡一跃成为国内第二大 GPU 云服务商。字节几年前就开始搞大规模 RoCE 网络来做 GPU 集群互联了，能搞定这个的全球就没有几家，微软是规模最大的，今年刚发了 paper。有些厂也试图效仿微软搞 RoCE 互联 GPU 集群，结果掉进坑里了。字节有落地场景。比如现在做视频生成的很多，字节暂时并没有像 Runway ML 那样做端到端的生成，而是走了更务实的路线，把 AI 能力放到剪映里面，使用户更容易创作短视频。
注意豆包用的并不是字节最新的大模型，所以豆包用的模型并不能反映字节大模型的最新进展。字节目前大模型的水平虽然还不如百度，但发展的加速度比较大。
百度
百度是大厂里面我认为也非常有前途的。
百度有先发优势。文心一言是国内第一个正式发布的中文大模型，目前仅 C 端就已经有上百万的 DAU。目前已经达到 GPT-3.5 和 GPT-4 之间的水平，部分中文能力已经达到 GPT-4。百度顶层重视程度高。在文心一言最关键的一段时间，Robin 每天都要听取文心一言团队的汇报。GPU 是唯一需要 Robin 亲自调度的计算资源。百度有很多文本数据积累。在移动互联网之前，百度是中文互联网最大的公开数据汇聚地。移动互联网的数据大部分是烟囱化的，很多甚至是私有的，腾讯也不敢用微信 QQ 的聊天记录来做大模型训练。百度的数据团队也非常强，数据采集、数据清洗都是相当专业的。单是数据增强，一个月就花几千万的 OpenAI API 调用费用。
当然，阿里、腾讯、华为也各有各的优势，比如阿里的 GPU 多、Infra 先进，腾讯有落地场景，华为有自己的 AI 芯片。但目前发布的大模型水平还不如百度和字节。
Moonshot
Moonshot 是国内大模型初创公司的代表。
Moonshot 有比较专业且和谐的团队。虽然 Moonshot 的团队相对年轻，但是有非常 sharp 的技术观点，包括前几个月比较火的 “压缩即智能” 观点。在大模型技术领域，既然大家都没做成功过大模型，年轻可能反而是优势。创始团队和谐，没有大公司病，都在专注技术。目前大模型的进展较快，已经超过 GPT-3.5 水平。在初创公司已经发布的大模型中，只有 Moonshot 的模型水平超过了 GPT-3.5。并没有直接照抄 LLaMA 的架构，而是做了很多工程上的优化。比如长上下文能力是国内最强的，在 prompt 合理的情况下，上下文各个位置上的信息提取出来的概率都超过 90%，并不是简单用 LongChat 这种方法就能扩出来的。但是不排除有其他公司正在悄悄憋大招。
现在相比 top 几家大模型创业公司，最大的缺点是融资额相对不算最大的，GPU 资源可能尚不足以训练 GPT-4。
个人认为，字节、百度、阿里、华为一定会用自己的大模型团队，腾讯虽然自己也在做大模型，但有可能收购一家大模型公司，到合适的时机，被腾讯收购其实也是不错的。
智谱
智谱是国内 to B 领域大模型创业公司的代表。
智谱有独特的商业模式。To B 市场虽然比较难以盈利，但营收比较有保障。在大多数国内大模型创业公司主要瞄准 to C 市场的时候，能够有 to B 的资源，在这个赛道上会有一个比较稳定的利基市场。因此智谱也是国内大模型创业公司里面人员规模最大的。融资额较大。在国内初创公司中，融资额应该是相对较大的。虽然投资可能没有字节、百度这些大厂多，但只要 GPU 到位，训练 GPT-4 这种级别的模型是足够了。起步较早，转型及时。智谱早期是做知识图谱的，大模型浪潮到来之后及时转型到大模型，而且在知识图谱和大模型的结合方面采取了较为务实的路线，并未强行把知识图谱加到 Transformer 里面。
不过 ChatGLM 目前公开模型的水平尚未全面达到 GPT-3.5，字节、百度和 Moonshot 的模型水平都已经超过 GPT-3.5 了。我把智谱放进来主要是因为它在 to B 方面一定会占据一席之地。
那其他公司呢？
我没有办法逐一对其他公司发表评论。没有列出的公司也有很多实力很强的，我只能看到当前的进展，没有办法预测未来。
“幸福的家庭都是相似的，不幸的家庭各有各的不幸。”
大厂最容易出现的问题：
资源碎片化，有限的 GPU 资源、人才资源分散到多个互相竞争的团队，内部赛马浪费大量资源。部门墙厚，做大模型的部门拿不到数据。不在一线的资深专家指挥一线的年轻专家，技术方案不够接地气。大模型是个新领域，除了个别顶级科学家，大家都是站在一个起跑线上的。传统 AI 上成功的 research taste 并不一定能迁移到大模型上，反而有可能成为一个阻碍。就像贾里尼克几十年前说的，每开掉一个语言学家，语音识别率就上升了。锁死在公司现有的业务场景。大模型本来是通用技术，但大厂经常会要求优先使能现有的产品。如果现有产品跟大模型的结合点比较少，就可能导致大模型落不了地。OpenAI 早期就被微软要求优先用在 Office 里面，还因此导致了人员出走，好在微软最终没有做这种杀鸡取卵的事情。只抄袭别人的架构，没有自己的创新。另一个极端，盲目追求创新，比如非要搞一个创新的非 Transformer 架构，又没有足够深入的思考，结果掉进坑里了。全线出击，结果一个都没搞成。既要搞 GPT-4，又要搞多模态，还要搞长上下文，做文本的和多模态的还是两拨人；既要搞 to B，又要搞 to C，既要国内市场，又要海外市场。买不到/租不到 GPU。
创业公司最容易出现的问题：
Founder dispute，就像 OpenAI 最近发生的事情，核心成员之间发生宫斗。这是创业公司最可怕的问题。不是大公司，却患上了大公司的病。如果公司里有很多资深大厂经验的人，出现这种问题的可能性是比较高的。某个领域招不到靠谱的专家。数据、算法、Infra 三个方向都很重要，能在三个方向上都招到靠谱的人，是很不容易的。技术不够成熟就急于发布，损害公司声誉。例如很多中文大模型都是在 LLaMA 基础上做了 continue pretraining，加上一些中文语料就变成中文大模型了；使用 LLaMA 的架构，从头开始收集和清洗数据做 pretrain 已经是 top 创业公司才能搞定的了。真正的高手是准备搞出 GPT-4 级别的模型才一击必杀的。缺少技术护城河。比如产品做一个虚拟的弗洛伊德，写一个 prompt 很简单，但是如果需要真的能理解弗洛伊德的理论，能够做一个靠谱的心理咨询师，没有一定的技术积累是做不出来的。如果一个公司总是担心自己的业务 OpenAI 做了怎么办，那就说明技术护城河还不够深。创始人不懂技术。如果创始人看不懂 paper，就很难 follow 大模型领域最新的进展，每天被各种公众号的信息轰炸得焦头烂额，很容易失去耐心。买不到/租不到 GPU。盲目扩张规模，不仅容易导致有限的资金很快被烧光，还容易导致人浮于事，患上大公司病。拉不到下一轮投资。不知道又有哪些基础大模型公司会死在明年的冬夜。

根据我的研究chatglm应该当前国内最好的大模型，我们这边有个离职员工要创业，我就自己赛了5000块钱给他跑了三个月的4090显卡。让他自己看看能跑出什么牛叉的项目。然后他就用了三周时间用chagtlm+next web 跑了一个自己的项目 www.renmorenyang.com 现在感觉还不错，起码不用梯子也可以用大模型写代码了。
但是毕竟显卡有限，效果和性能跟chatgpt和其他大厂比起来还是差一些距离的，毕竟才70亿参数。
但是针对商业领那么大概率可能是豆包，豆包的交互是当前国产大模型中最好的了。

11.16更新：没想到之前随手写的现在火了，收录的已经有188个了
有个开源项目一直在更新
GitHub - wgwang/LLMs-In-China: 中国大模型
我自己也在本地整理了一下

此外要谈能力的话，卧龙凤雏难分高下
有很多测评，这边推荐一个比较新的SuperCLUE的

BTW，李彦宏说有238个，具体不知道有哪些

回望2023上半年智能教育领域的发展，两条主线不容忽视：其一，教育智能硬件产品向大模型集中火力，人工智能成竞争核心；其二，在软件与服务供给侧，企业则以合作协同为着力点。而对各大公司而言，在接下来的探索中既要坚守用户本位，又要在激烈的市场竞争中立于不败之势，人工智能无疑仍是 2023 年下半年的发展主线。

目前，市场上参与学习硬件产品竞争的厂商有三类：一是传统学习硬件公司，如步步高、读书郎等；二是 3C，硬件消费品出身，如华为、联想、小度等；三是教育科技新贵，如科大讯飞、新东方、好未来、作业帮等。自 2023 年上半年以来，各大智能教育品牌频频推出新的硬件产品。
今年 2 月 6 日，科大讯飞推出其教育硬件新产品 AI 学习机 T20 Pro。该学习机面向 3-18 岁学生用户，提供个性化学习方案，支持中英文作文类人批改、数学类人互动辅学、英语类人口语对话等功能。据产品介绍，该学习机面向青少年儿童三个学龄段，设计了启蒙益智、自主辅学、学业提升等精准学阶段，帮助提升学生学业水平等。
对标 ChatGPT 等 AIGC 产品，5 月 6 日，科大讯飞正式发布了讯飞星火认知大模型及应用成果。在发布会上，科大讯飞现场实时展示了文本生成、语言理解、知识问答、逻辑推理、数学能力，编程能力和多模态等多项能力。据此，科大讯飞成为国内继百度、阿里、商汤、昆仑万维之后，第五家正式发布大语言模型的公司。星火认知大模型将应用于讯飞旗下的多款产品，而 AI 学习机 T20 Pro 则是首款搭载大模型的 AI 学习机。
在星火认知大模型发布后的第一个交易日，科大讯飞的股价涨停，收报 63.86 元。在 6 月 13 日，科大讯飞（002230.SZ）大涨，当日报收 74.85 元/股，涨幅 9.27%，股价再创历史新高。今年以来，科大讯飞的股价已经多次创历史新高。
股价再创新高，销量也一炮而红。在今年期待已久的的 618 大促期间，科大讯飞 AI 学习机迎来「618」开门红——5 月 31 日至 6 月 1 日期间，讯飞AI学习机荣获京东/天猫/抖音三大平台学习机品类销售额冠军，同比去年提升 247%。
7 月 6 日，科大讯飞发布的 AI 学习机 LUMIE 10 系列，以其强大功能、卓越性能和创新设计震撼亮相。这是科大讯飞推出的首款立式大屏 AI 学习机。
近日，科大讯飞发布了 2023 年半年度业绩预告。报告称，科大讯飞公司上半年预计实现营业收入 78 亿元，实现毛利 31 亿元。截至 2023 年 6 月 30 日，讯飞开放平台开发者数为 497.4 万（去年同期 343 万），近一年增长 45%。其中，讯飞星火认知大模型发布后，开发者数量在两个月内增加了 85 万家。
聊完了科大讯飞，智能教育的另一巨头——好未来旗下品牌学而思，也在上半年积极探索追寻着大模型。
5 月 5 日，学而思官宣，正在研发数学大模型，命名为「MathGPT」。该模型面向全球数学爱好者和科研机构，以数学领域的解题和讲题算法为核心。据称，MathGPT 为学而思目前的核心项目，由 CTO 田密负责，在今年春节前已启动相应的团队建设、数据、算力准备和技术研发，目前已经取得阶段性成果，并将于今年年内推出产品级应用。此外，该公司还启动了美国硅谷团队建设，将成立一支海外算法和工程团队，在全球范围内招募优秀的人工智能专家加入。
此外，学而思方面曾表示，其学习机将会于年内上线一款「AI 助手」，涵盖作文助手、口语助手、阅读助手、数学助手等相关功能。
网易有道在上半年的表现也十分耀眼。四月初，网易有道推出自研的教育场景下类 ChatGPT 模型，名为「子曰」。基于「子曰」研发的 AI 口语老师和中文作文批改 DEMO 完成后开放内测，将成为国内企业推出的首个教育场景下类 ChatGPT 模型。
百度方面，其旗下小度科技今年5月推出小度青禾学习手机，针对青少年定制系统，为用户提供免费小初课程、全面管控应用使用、实时定位安全保护以及护眼屏类纸等体验和服务。该学习机手机搭载了小度AI学习大模型，支持互动式 AI 讲题、多学科 AI 作业助手、AI 口语、AI 精准学等智能功能。
百度CEO 李彦宏于三月中旬宣布推出大语言模型生成式 AI 产品「文心一言」；而在 7 月 3 日，百度的大语言模型产品文心一言正式在苹果 App Store 上架。在以 ChatGPT 为代表的 AIGC 人工智能浪潮中，百度率先上架 ChatGPT 的对标产品，标志着中国第一款生成式大语言模型产品正式落地。
此外，其他品类的教育智能硬件也纷纷出炉，展示出各厂商在教育数字化探索中的最新成果。
年初开学季时，科大讯飞推出全新升级翻译笔。讯飞翻译笔 S10、S11 的总词库量升级至 1000 万+，P20/P20Plus 版本词汇量更是新增至 2000 万+。此外，该产品还深度打磨了口语评测、作文批改、汉语拼音学习、古诗文等功能。
4 月 21 日，在第 81 届中国教育装备展同期的「人工智能助力教育数字化转型高峰论坛」上，科大讯飞发布三大新品，包括「讯飞 AI 红外智慧黑板」、「智慧体育新品」和「AI 朗读亭」，展示了科大讯飞在教育数字化探索中的最新成果。
7 月 6 日，在最新召开的 2023 世界人工智能大会上，网易有道携旗下有道词典笔、有道听力宝、有道 AI 学习机等产品亮相，多项「黑科技产品」在大会上得到行业瞩目，其展示的未来智能学习新图景引起各界关注。
值得关注的是，在早前的 618 购物节中，有道方面的确交出了一份亮眼的销售答卷：连续四年斩获京东电子词典类目品牌销量、销售额双第一，连续两年问鼎天猫点读笔类目的品牌销量、销售额双第一，以及京东复读机类目自营品牌销量、销售额双第一。

在刚刚过去的 2023 年上半年中，各大教育机构也积极布局着智能教育的软件和服务赛道。
智能教育品牌与高校协同合作成为潮流，强强联合，共同推进技术与教育的融合发展。
今年三月初，科大讯飞与北京体育大学举行合作签约仪式。双方以「构建智慧体育评价模型、实现学生体育运动与训练精准处方、推进体育教学质量再上新台阶」为目标，探索技术与教育的深度融合。
五月中旬，学而思发布了「学而思大阅读」。据悉，该产品是学而思网校与北大中文系战略合作、与「中国阅读三十人论坛」阅读专家共同打造的，旨在通过提供全能阅读解决方案从根本上提升孩子的阅读和创作能力。
六月中旬，科大讯飞与华东师范大学心理与认知科学学院签署战略合作协议，将共同研发「基于星火认知大模型的青少年 AI 心理陪伴项目」，以期「提供更加精准高效的 AI 自助减压，呵护青少年心理健康」，探索人工智能技术与心理健康教育的深度融合应用。
不仅如此，厂商们还积极与教育部官方进行合作，为政府部门提供底层的教育技术支持。
年初，广东讯飞启明中标珠海市教育局中考管理系统维护及相关技术服务项目。作为科大讯飞全资子公司，讯飞启明将为珠海市 2023 年中考提供英语听说考试技术服务、答题卡扫描及网上评卷技术服务、中考管理系统维护服务。
今年春季，南昌师范学院附属实验小学联手好未来智慧教育打通校企合作，落地好未来课后服务解决方案，利用社会优质课程资源促进学校学生全面发展。
五月底，我国全民阅读标准建设工程启动，科大讯飞将承建全民阅读智慧评测系统。
在软件上，各品牌也积极利用旗下 AI 模型赋能新的在线产品。
今年三月，网易有道推出了系列自研 AI 课程——人工智能绘画与设计、ChatGPT从入门到精通，布局「GPT生态」。其中，前者共计32课时，分为初识人工智能绘画、进阶人工智能绘画、人工智能插画绘制、人工智能运营设计四个主体部分，涉及Stable Diffusion、ControlNet等AI绘图软件教学。
根据财报，网易有道 2023 Q1 营收 11.6 亿元，同比下降 3.1%。毛利润为 6.019 亿元，毛利率从 2022 年同期的 53.5%降至 2023 Q1 的 51.7%。网易有道 CEO 周枫表示：「有道将继续利用自身科技优势和持续创新能力，将包括 AIGC 在内的数字化赋能全线产品，不断努力提升用户的使用体验与效果，推动业务可持续增长」。
7 月 3 日，学而思网校正式宣布推出基于自研大语言模型的 AIGC 课程，名为《人工智能第一课》。好未来集团首席技术官田密透露：「好未来于今年春节起，已开始进行自研大语言模型的研发，其自研大模型初版最快将于 7 月底面市。」据介绍，本次推出的人工智能课程，正是基于自研的大语言模型，未来，好未来大模型还将支持更多的学习产品。

实践已经证明，人工智能技术可以提供个性化学习、丰富互动体验、解决教育资源不均等问题，并具有巨大的商业潜力，企业们纷纷将目光投向人工智能板块。
在今年六月初，腾讯、好未来入股公司深言科技，而这家公司北京正是最前沿的人工智能和自然语言处理技术，尤其是大规模预训练模型技术，为个人和组织系统化重塑文本信息处理全流程。
网易也把 AI 大模型的探索应用放在了首位。近期，在浙江省召开的全省平台经济高质量发展大会上，网易公司董事局主席兼 CEO 丁磊表示，当前网易的首要任务是用最快的速度探索 AI 大模型的创新应用。最近三年，网易研发总投入已接近 400 亿。
回望 2023 年上半年，智能教育赛道上各大公司的比拼可谓异彩纷呈。既要以用户为本位，又要在激烈的市场竞争中立于不败之势，对于各大智能教育公司来说，人工智能仍然是他们在2023年下半年的主要发展方向。通过引入人工智能技术，企业们推动旗下产品焕新升级，为用户提供更加个性化和丰富的学习体验，为教育领域带来革命性的变革。随着人工智能技术的不断进步和创新应用的推动，我们期待着未来智能教育领域的持续发展和进步。
早在2018年，WWEC 教育者大会就曾以「未来教育」为题命名第六届大会主题，畅想未来教育场景、科技对教育的影响和教育本质的坚守。而在今年下半年，由中国民办教育协会作为指导单位、嘉家有品主办的第九届 WWEC 教育者大会将再次召开，于 2023 年 8 月 20-22 日在上海举行。此次大会汇集各领域精英人士，围绕「教育让生活更美好」主题，助力推动教育领域的不断进步和创新，进而通过教育的力量，为人们创造更美好的生活和未来。

说实话，谁的品牌公关能力强，谁就最有前途。

当看到国内这些大模型回答屏蔽了那么多东西之后，我就知道他们中一个有前途的都没有

百模大战，实力才是硬通货！2023年不愧是被称为AI元年，国内AI大模型仿佛开启了加速键，短短几个月的时间，各大厂便争相发布自己的大模型并通过审批陆续上线，现阶段市面上的大语言模型已然多达110+个。
一直以来，GitHub也持续对国内各中文大模型的分类能力、信息抽取能力、以及阅读理解能力进行了评测，并实时发布了榜单。（评测数据截止至2023年10月11日）
?分类能力排行榜

?信息抽取能力排行榜

?阅读理解能力排行榜

根据评测的结果显示，综合上来看GPT-4在各个方面的表现依旧很出色，在各个榜单中都处于前排的位置；当然，国内的几个大模型也毫不逊色，百度文心一言、阿里通义千问、科大讯飞星火、商汤senseChat也都紧随其后、穷追不舍。
在这些AI大语言模型的背后，落到实处的则是一个个触手可得的AI应用工具，在这里银河君就顺道给大家整理了一些，感兴趣的不妨可以动手体验看看~
?对话处理——通义千问
阿里开发的一款支持实时在线对话问答的智能助手，从它的名字上就能够看出其自身的定位——通晓各类知识，回答千种问题。

所采用的大规模预训练模型和机器学习算法，支持进行多轮对话交互、文案创作、逻辑推理等操作，可以根据我们给出的提问，快速提供高效的解决方案/有用的信息。

?写文创作——迅捷AI写作
名气不大，但却十分好用的一个高效写文助手，轻轻松松就能解决各种内容创作、灵感头绪的棘手写文难题。
软件针对内容创作提供有多种写文模块，并进行了细致的分类，功能选项很是清晰，一眼即可快速找到所需使用的功能操作。

各种全文写作、新媒体标题、高赞优质回答、种草文案、工作汇报等实用常见的功能它都具备，无论是学生党还是上班族统统适配~
比如我们日常的一些文章创作，软件中最为万金油的【AI全能写作】就可以帮上大忙了~只需输入问题/写作需求后发送，稍等片刻它便会以对话的方式回复我们。

除此之外，内置的【AI Chat】更是一个实时百科全书，各种问题都可以向它寻求帮助，不管是学习上的、工作上的，还是生活上的一些问题它都能给到我们比较满意的答复。

?高效办公——WPS AI
金山办公发布的一个新型办公应用，是在原先WPS四大办公套组的基础上新增了AI大语言模型的能力，支持与我们进行多轮对话，以及对已有的文档文件进行处理等一系列操作。

具体表现在可以帮我们快速地编辑文档、自动续写文档内容，还可以生成请假条等办公文档，不用在网上搜索模板，即可直接用它生成符合需求的内容，省时又省力。

?智能翻译——DeepL
还蛮受欢迎的一款由AI技术加持的在线翻译神器，可以轻松完成各种短、长文本的翻译，在翻译内容的表现上十分优异。
支持多种语言之间的互译，并且在保持原文语义的同时，还提供了流畅自然的翻译结果，准确度和流畅度都非常高，相对其他翻译软件来说没有太重的机翻味。

总的来讲，国内各AI大模型在多个应用场景上皆有所长、各有优势，相信在不久的将来，各大模型的落地应用也将普遍应用于我们的生活之中。
话不多说啦~有用的记得要码住，也可以关注一下
@银河君
主页下次不迷路！

[收藏本文] 【下载本文】

科技知识最新文章

百度为什么越来越垃圾了?

为什么程序员总是发现不了自己的Bug?

出现在抖音评论区里边的算命真不真？

你认为 C++ 最不应该存在的特性是什么？

为什么 Windows 的兼容性这么强大，到底用了

如何看待Nvidia禁止使用翻译工具将cuda运行

为何苹果搞了十年的汽车还是难产，小米很快

该不该和AI说谢谢?

为什么突破性的技术总是最先发生在西方？

加:2024-02-02 09:29:57 更:2024-02-02 09:39:10

股票涨跌实时统计涨停板选股分时图选股跌停板选股 K线图选股成交量选股均线选股趋势线选股筹码理论波浪理论缠论 MACD指标 KDJ指标 BOLL指标 RSI指标炒股基础知识炒股故事

网站联系: qq:121756557 email:121756557@qq.com 天天财汇