天天财汇 购物 网址 万年历 小说 | 三峰软件 小游戏 视频
TxT小说阅读器
↓小说语音阅读,小说下载↓
一键清除系统垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放,产品展示↓
首页 淘股吧 股票涨跌实时统计 涨停板选股 股票入门 股票书籍 股票问答 分时图选股 跌停板选股 K线图选股 成交量选股 [平安银行]
股市论谈 均线选股 趋势线选股 筹码理论 波浪理论 缠论 MACD指标 KDJ指标 BOLL指标 RSI指标 炒股基础知识 炒股故事
商业财经 科技知识 汽车百科 工程技术 自然科学 家居生活 设计艺术 财经视频 游戏--
  天天财汇 -> 科技知识 -> 怎么理解英特尔15代大核取消超线程? -> 正文阅读

[科技知识]怎么理解英特尔15代大核取消超线程?

[收藏本文] 【下载本文】
超线程和多线程是同一个东西吗?对写线程程序没影响?运行同样的东西能更省电?
取消超线程这种做法只能说有得有失吧
对于ARL来说,取消P核超线程的正面影响是调度难度降低,同时相比带超线程的时候频率可以拉的更高,带来更强单核性能。并且在密集计算类应用下超线程的存在反而是拖后腿的。
取消P核的超线程带来的负面影响就是多核性能下降,尤其是对于传统benchmark,比如说我前段时间折腾137KF


可以看到对于这种8+8的处理器来说,P核超线程可以提供20%上下的性能,也还算不错了
如果放弃P核的超线程,意味着在这类传统benchmark里面性能直接损失掉20%左右(6+8的136K损失22%左右)。
对于8+16来说,关闭P核的性能下降预估是13%左右
这是Raptor Cove的情况,可以看到随着E核的数量增加,P核的超线程为最终性能提供越少,139K首发的时候我关掉P核的超线程,跑R23是3.5W出头
而Arrow Lake和Raptor Lake是有一些区别的,ARL的P核与E核全部更换新架构,新E核 Skymont的IPC提升幅度远远高于换P核提升的数值,SIMD翻倍,并且E核的频率明确会再次提高,反倒是P核可能会有频率下降,因为N3b现在拉高频很难拉上去
这样的改变之后,E核在整个CPU中的性能占比将会更高,所以可以稍微预估预估一下,ARL的8+16若是开启P核的超线程,那么性能提升幅度可能不会高于10%
而ARL-S还有一个8+32的存在,对于这颗CPU,开启P核的超线程也许仅仅只能提升7%左右。
对于数框框党来说,关掉P核的HT之后框框还是少了挺多的


对比关HT少了8个框
Redwood Cove相较于Golden Cove有一个改变就是超线程可以同时两个线程从译码器和uop缓存中将uop写入指令队列,这是有利于提升超线程效率的一个改变,而LNC在后端也有一些能在SSE下提升超线程效率的改变,早期甚至有规划过SMT4,然而Intel最终还是决定关掉ARL的P核超线程
只能说没了就没了吧,有也无所谓吧,只要综合性能提升了就行。
似乎没有人提到,超线程的实现代价远不是表面上看上去的竞争/平分某些资源、保存多份体系结构状态那么简单,实际上超线程还会让处理器的内存模型变得非常复杂。
由于store buffer、load queue、load forward等结构、机制的存在,同一个物理核上的两个逻辑核之间的内存一致性维护十分棘手,和
不同物理核间的一致性同一逻辑核中的一致性
都不同。
寥寥几种corner case就会让你面临人生抉择,究竟是加一堆正常情况下根本没用的机制,还是让原先好好的TSO退化为处理机一致性。x86选了后者233333。
因为有retable unit,不需要SMT这种过时的东西了。SMT本质上是同一个核心内维护两个线程上下文,分时调度。
RU是指令级调度,且线程上下文可以在多个核心之间共享,意味着CPU流水线的线程切换速度更快,流水线利用率更高,重度任务处理时理论上单线程性能更强,可以突破单核性能上限。
Intel 多线程秘密武器:详解「Rentable Units」?mp.weixin.qq.com/s/sR9aKrkAlDTWLWVV7bJWxg


Rentable Unit 会把即将等待执行的几个线程内的若干指令按照复杂度分为两个“组”,然后分别交给P核或E核执行。因此,这些线程可以跨核心并行。当其中一个核心完成全部指令时,它可以迅速接手另一个核心尚未完成的剩余,尽管该指令来自另一个线程。
最终,这些指令完成的总耗时缩短了,而无论是P核或E核,在此期间均处于激活状态,而没有出现空泡。这会大大提升相同核心数量下多线程效率。
看起来很美好,但挑战比想象中要多得多。
首先,RU的实现比SMT复杂得多。需要在多个核心之间维护这些“同时运行”的线程的状态一致性,并小心翼翼地维护这些指令队列以确保每个核心的流水线都尽可能少的出现空泡。这意味着,乱序单元、分支预测等工作的一部分,必须提前到RU部件中。
其次,RU所需要的电路或晶体管规模,可能比SMT更多。RU本身也意味着会增加一堆Buffer和寄存器,以完成对指令的调度并为核心待命。
还有一个问题:如何让操作系统兼容这个功能?
Windows操作系统通常将一个启用SMT的物理核心识别为两个逻辑核心,或者是2Threading/1Core,并以此来分配或中断执行线程。然而,RU实际上告诉操作系统:这里有一个“活跃线程池”,把它们放进来并标记优先级,操作系统无需再绑定到具体的核心。于是,调度单位可能变成了:6Threadings / 1RU (1P Core + 4E Cores)。
有一点可以确定:无论RU如何先进,它都需要操作系统的支持。我们目前仍未看到Intel上传任何相关代码到Linux Kernel的git仓库。但如果届时较旧的windows 操作系统不受支持,比如windows 10 甚至 windows 11 不被支持,也并不令人感到意外。
One More Thing...
RU还意味着目前Intel Core CPU总线架构的一次大的改变。因为RU必须将一组CPU核心“打包”调度,但可能会是P核与E核搭配,就像上文演示的那样,可能是1P Core + 2E Cores,这可能会衍生出类似AMD Compute Complex的核簇。
也许我们将来会看到1P Core + 2 E Cores 共享 L2 Cache 并挂载在ringbus上的场景。假设Ringbus最多挂载10个节点,这种搭配的上限将会是10 P Cores + 20 E Cores / 40 Threadings。
产品还没正式发布一切都不好说。
当年 p4 做超线程就是为了不让整数浮点流水线闲置。
现在如果不做超线程那么唯一的理由就是打开超线程的损失要大于收益。超线程需要平分部分资源,例如寄存器堆,cache,intel 可能评估了要同时维持今后超大指令窗口和超线程的成本太高了,所以才会有这样的决定。
还算合理,小核取代超线程,正好还能解决三种核心调度混乱的问题。
但大小核指令集不一样这件事情仍然非常恶心,希望新版的大小核心指令集是一致的,哪怕是模拟出来的高级指令集。
AMD未来几年都不会再堆核心,因为他的市场已经站稳脚跟,不需要通过加量来讨好用户了,所以未来的很长一段时间内,6核心和8核心就是消费级主力。
这说明AMD今后在消费级上的多核性能可能不会有太大进步,顶多提一提单核性能,甚至也会开始挤牙膏。
英特尔可能已经预料到这种结果,打算取消超线程弯道超车。
大核取消超线程有很多好处,首先就是英特尔能省钱,其次还能降低一点CPU功耗,某些游戏里甚至可以提升百分之10左右的帧数。
缺点是会降低30%多核性能,但是降低的这点多核性能,多加两个小核心全补回来了,压根不叫事。
所以我认为英特尔取消超线程这事很可能是真的,以后的i5就是6大核加6小核,总共12线程,i7就是8大核加8小核,总共16线程,对比隔壁AMD又不落后,挺好的。
超线程能给大核额外挖掘20%~30%的性能。但,超线程并非没有代价,它同时需要额外的晶体管数量,也就需要额外的面积。
在以前,intel因为环形总线的原因,总核心数量收到限制,所以选择用超线程的方法来提升实际线程数量,而不必增加物理核心数,超线程增加的逻辑核心数量显然不受到intel环形总线架构的核心数量限制。
但现在intel搞出了小核,小核可以大量堆核心数,于是就不再需要大核承担用于堆核心数量的功能了。
大核去掉超线程之后,可以去掉一部分晶体管数量,节省一部分面积。也可以小幅度提升单核性能,个人认为是非常合理的选择。
有部分同学顾虑到多线程性能的下降,不过我个人不担心这一点,因为节省了P核的面积之后可以用节省的面积堆更多E核来补足,所以一来一去,多线程性能并不会下降。
真正的问题其实是在核心不平衡:
目前以大核单线程性能 100% 计算的话,超线程的性能大约在20%,一个物理核心加一个超线程具备了 120%的性能,平均下来,大核的每个逻辑核心是 60% 性能。而小核心的性能恰好也是 大核心的60%,于是,在全核运行的时候,大核,超线程,小核心,性能都基本相当。取消超线程之后,小核跟大核的性能差异就很明显了,在全核调度的时候不平衡,未来可能出现新的调度问题。
其实去掉也好,这可能说明蓝厂的小核更为成熟了,这不就是好事吗?
去掉超线程也并不会损失太多
以前的赛扬不就不支持吗?影响办公了吗?
但是也有好的一方面,比如有的网友说了单核主频可以更高,这样的操作如果再配合小核输出更好,那不是单核更强,多核也强?
毕竟没了超线程蓝厂应该会堆更多小核
算起来是解决自己能效比的问题
游戏全大核高频,生产力就大小核齐发
唯一的毛病就是数框框可能比AMD少了


因为大家逐渐意识到SMT实际上是DSA,需要根据自己的用户场景思考为这些domain付出的晶体管和复杂的是否值得。
可能部分朋友会问:为什么SMT是DSA?它不是可以让访存bound的应用更充分利用计算资源吗?
在上古时代,Dean Tullsen 他们提出SMT的时候,这句话是对的。而在今天,可能不成立了。
我认为,在现代处理器上,SMT只在一类应用能获得超额收益:ILP低,MLP低,private cache竞争相对较小,且无法通过预取获得MLP。在这类应用上,一个SMT逻辑线程顶一个核,典型代表是数据库。
剩下的应用的收益,像Cinebench上15-20%性能提升,基本上和付出的面积、复杂度、性能波动的代价相匹配。
发生上述变化,是因为神一样的预取器能把低MLP应用转化为高MLP。
现在Arrow Lake的各种消息里都指出说没有超线程了,所以在想Lion Cove 会不会就开始放弃Core一直用的架构体系了?按照之前说的,Royal Cove的改革是要开始了,可能这就是第一个?
这是一个很有意思的事情。
按照现在intel的逻辑最新一代笔记本酷睿ultra,已经四个簇
P核大核
大核超线程
E核 小核
低功核超小核。
而大部分应用需求实质上用不到这么多核,加上Win开放(拉垮)的调度策略和应用场景,使得这是一笔烂账。
pc在大部分情况下满足应用对于x86通用算力其实很早就这样,现在堆核的副作用就是没有实质感知,默认关闭超线程试水就能说的通。
题外话 目前大部分pc的应用,包括生产力应用实际上是异构运算越来越多, 不管是影视工作者的使用媒体单元加快输出,还是游戏使用3d,更未来所谓本地ai使用gpu或者专有ai单元,本质上都是把cpu的通用算力卸载到指定硬件算力中。
另外,按照Intel的说法,也许未来路线会彻底放弃超线程,而选用Rentable Units技术,你可以理解为Intel有一个理想态的调度器,坏消息是要操作系统支持,甚至于可能要应用支持,当然对于当前Win11连不对称的多核都玩不明白的情况下,Rentable Units估计又是镜中花水中月。
Intel 17th Gen CPUs to Get Rentable Units: Why Hyper-Threading is Going Away?www.hardwaretimes.com/intel-15th-gen-cpus-to-get-rentable-units-why-hyper-threading-is-going-away/


当然,15代没这Rentable Units已经是确认的。
感觉随着X86市场萎缩,Intel在想尽办法和Arm对标偏个人电脑和智能设备产品方案。
看目前泄露的应该不是取消超线程,而是在bios里默认关闭,毕竟消费级大核和服务器u一样的,服务器那边不会取消超线程。


实际上英特尔上了大小核后,大核的超线程的确成摆设了,它的调度是前台优先p核后台挂E核,p核线程不够用再调用E核,还不够的话才调用超线程。
导致超线程除了cinebench cpuz这种跑分软件能跑分高外没什么用,尤其8+16这种,纯物理核心24线程消费级绰绰有余了,压根用不到超线程。
13900k关闭超线程也只是少了8个线程而已,超线程利用率最高的cpuz cinebench跑分性能损失才15%不到,但功耗也降了10%左右,减的功耗是从发热大户大核减的,烤机温度能直接降十几度。
这还只是同电压对比,实际关闭超线程后同样频率电压可以给更低一些。贴吧里说的“关超线程大雷变小雕”可不是开玩笑。
下一代15代制程大跃进,核心面积要小不少,也要积热了,直接关闭超线程的确挺合理。
很合理,毕竟超线程是核心不够用的时候有用,现在大家都打核战争动不动十几个核心上去了,那超线程就有点鸡肋了。
不如砍了换单核性能提升一点点。
通俗的讲,超线程存在的目的是:趁核心闲置的空档运行一下其他任务。一般都是在核心等待内存和缓存数据的时候,在超线程上加塞。
现代处理器最大的瓶颈就是缓存(每次我说这个都被杠,我真的求求别杠这一点了,大一IT理论基础第一课)
基于这个原因,15代如果真的去除超线程的话,我只能猜测 15代缓存瓶颈,已经降低到 超线程见缝插针的收益,已经不够显著了
或者Intel又配合微软搞了什么调度器,把超线程的任务扔给小核 (如果这种情况,就12、13代大小核的调度状况,我觉得不是很乐观,除非小核不再以簇的形式存在,单独缓存降低延时)
如果上述条件不能达成(个人觉得达成并不容易),超线程并不会直接消失。毕竟9代发布之前就传闻说9代取消超线程,事实结果是“为了解决i7、i9性能太接近的bug,我们把i7修复成了单线程”。。。。。
开了ht单核性能就比不上rpl了,不利于营销,幸好e核ok,可以支撑多线程性能。
或者开了ht就会有bug,甚至是es后期才发现的,client可以用30亿来捂嘴,server上计算密度下降就不得不delay。
反正我是不信Intel是开开心心关了ht的。
我理解的超线程,其实就是把一个物理core虚拟出两个逻辑core,这个操作放在io密集型任务上没有啥问题,因为耗时都在io上,问题在于:
1.对于计算密集型任务来说(比如低时延交易,往往需要一个线程独占一个core),超线程是个大坑,引入不必要的上下文切换。
2.增加了内存模型和缓存一致性协议带来的开销和复杂度。
就个人理解,intel小核更接近一种物理超线程。
作为一个功耗恐惧症。
我所有电脑到手都是先关睿频,笔记本的话还会关超线程
个人角度支持这个做法
不是一个东西,超线程从诞生开始就一直受到很多争议,服务器上用还好,家用电脑上HT技术的运用一直算是服务器技术廉价外溢到家用平台上,有没有的一直是商业策略(1-7代的台式机i3和i7处理器都有,但是i5就没有,8代i3,i5没有HT但是i7有,纯属商业上为了产品差异化而采取的策略),或者因为硬件漏洞不得不取消HT(9代i3,i5,i7没有HT,但是i9有,所以到底是不是因为硬件漏洞只有intel自己心里清楚),至于15代取消HT,也先别高兴的太早,没准是为了16代或者17代HT技术回归而作为涨价借口做铺垫也说不定
因为:
Intel应该不会让吞吐性能倒退硅仙人钦定过自己对 gracemont 的好感
脑洞:15代大核是 gracemont 魔改而来,让其单核性能赶上大核,同时保持单核面积优势可以堆更多的 core 刷吞吐。
没活硬整,黔驴技穷
没有就没有呗,反正超线程也不是自打首发之后一直存在于消费级平台上的东西。
从市场和商业的角度上看
首先,在同架构下,没有HT对主流测试中使用的R20和R23这类C4D跑分非常不友好。
再结合12代开始搞出的P+E架构,P刷单核E刷多核,结果调度和体验就算不说一坨,至少也和官方宣称大相径庭。
即使首发营销造势配上了PCIe5.0和DDR5也没复刻农企在Zen和Zen3的热度。
那么可以得出一个结论:没有HT的15代,要么在营销上有噱头,要么在跑分上天赋异禀(至少计划中应该是这样),面对某些“理想化”应用场景优势巨大。
而没了HT,前者显然不太可能,那就大概率是后者了。至于跑分能代表多少实际提升,那就见仁见智了。
以上种种迹象,让我不由得想起一位故人。
曾经有一款,架构革新的,官方宣称很厉害的,粉丝热衷的,没有HT的处理器
它叫FX8350
超线程(HT)是一种在同一个核心跑多个线程的硬件技术。对软件来说基本上是透明的,多线程程序该怎么写怎么写。
真要取消HT的话,算是意料之外情理之中。HT能用一个核心跑两个线程的原理,在于程序运行时CPU核心有大量的时间不是在计算而是在等待。等内存,等IO,各种等。于是一个线程等待的时候,对应核心的运算能力就闲置了,不如改造一下,让他这个时候带另一个线程跑。
但是核心毕竟只有一个,主要的运算单元都还是只有一份,两个线程如果都不是在等待而是在正经计算,那只能互相挤占算力。大致来说如果一个核心带两个满负载线程的话,每个线程大约只有60%的性能。也就是说带HT的核心比不带HT的核心能多提供大概20%的多线程性能。但是也付出了高负载下单线程性能反而会下滑的代价。实际上对单核性能有极致要求的场合,不提供/关闭HT属于常规操作。
现在换大小核了,多线程性能可以用更多小核来应付。这种情况下HT的优势已经有人代劳,砍了避免劣势也算合理。
个人zen2和zen3代滚去玩AMD yes了,13代的时候笔记本更新,第一次用回了异构时代Intel。在算蓝厂用户经典的PE同DIE问题时,24C32T我第一反应算出来的其实是16P8E。因为我下意识也觉得SMT本就是核心和内部总线性能不够的时候,变出来一个半吊子核应对多线程,那么有了E核,P核就没必要再SMT了,SMT给E核更合理。所以个人觉得15代这个变化还是很合理的,反正很多台式24C32T用户是要关掉超线程以提高性能的。
小核本来就是用来替换超线程的产物,迟早的事
更别说关闭超线程还能降温降功耗提升性能。
超线程技术一直是英特尔 CPU 的一大特色,但在不久的将来可能会发生变化。根据最近的一份报告,英特尔即将推出的第 15 代酷睿 "箭湖"台式机处理器可能会取消超线程技术。虽然早前的传言暗示了这一发展,但这对英特尔来说是一个重大决定,可能会让许多潜在客户失望


这些信息来自英特尔的机密文件,最近由爆料人@yuuki_ans(已删除)泄露,并由德国网站3DCenter重点报道。尽管最初的焦点集中在 Arrow Lake-S 芯片的规格上,但仔细观察后发现,该处理器可能会配备八个性能内核和相同数量的线程,但不支持同步多线程(SMT)。


在某些情况下,取消超线程可能会对 Arrow Lake 芯片的性能产生潜在的不利影响。虽然单线程性能可能不会因取消 HT 而受到影响,但与 Raptor Lake 和 Raptor Lake Refresh 芯片等超线程处理器相比,某些多线程应用的性能可能会略有下降。
幸运的是,对于游戏玩家来说,取消超线程功能预计不会影响 AAA 级游戏的性能。事实上,据报道,英特尔的目标是通过其 Arrow Lake 系列产品将游戏性能提高 30%。该公司很有可能通过架构改进和更高的时钟速度来实现这一目标,而无需考虑没有额外线程的问题。


超线程技术最初是英特尔公司在 2000 年代初推出的,目的是提高其单核至强和奔腾 4 处理器在多线程工作负载中的性能。然而,x86 处理器的格局自此发生了重大变化,多内核处理器的出现意味着超线程技术已不再像几十年前那么重要。尽管如此,超线程仍能为某些重线程应用提供帮助,并在某些情况下显著提升性能。


最初泄露的文件透露了即将推出的 Arrow Lake-S 芯片的许多细节。首先,它们可能采用多达 8+16+1 的核心配置,并支持 DDR5-6400 内存,这与第 14 代产品线支持的 DDR5-5600 内存相比是一个很好的改进。文件还显示,Arrow Lake-S 将支持 24 条 PCIe 通道,其中 16 条 PCIe 5.0 通道用于 GPU,8 条用于 NVMe SSD。
Intel 以后干脆放弃服务器市场好了,反正现在也快玩完了。没超线程拿头搞云服务器。云的数据库,web 之类的业务,cache miss 是很常见的。或者 Intel 可以继续多线作战,服务器和 PC 不共享大核设计。
只要大小核调度还是屎,这超线程取不取消没什么两样。
大概率只是刀法罢了,15代先砍一刀,后面再加回来。
英特尔第15代Arrow Lake处理器取消了超线程技术,个人认为可能是基于多种因素的考量:
能耗:超线程技术虽然可以提高处理器的多任务处理能力,但同时也增加了能耗。如果这项技术在性能提升方面表现不佳,那么其带来的能耗增加可能就不再值得。
技术瓶颈:随着处理器技术的不断发展,超线程技术可能已经接近其性能极限。在这种情况下,英特尔可能认为继续投资于超线程技术不再具有成本效益。
市场趋势:随着云计算和边缘计算的发展,越来越多的计算任务被分散到不同的设备上。这意味着,对于个人电脑而言,超线程技术的需求可能不再像以前那么迫切。
超线程技术发展20来年了,虽说适配进展缓慢,也还是积累了一些专门优化的软件的。
逻辑线程性能上跟物理线程差远了。
取消的话一个大核心能省出来接近3成面积,加上Intel依旧坚持环形总线,长度是固定的,单个节点越短能创造的节点就越多。
结合看实测一个大核心差不多一组四个小核心的面积,一个小核心约等于65%个大核心性能,对于臭打游戏的超线程还是负面提升,超线程对多核心性能提升大概30%几点来看。
粗略可以认为超线程的取消可以让六到八个大核心腾出来2或4组小核心的面积。
对于总的多核心性能影响一定是正面的,大概是同样的面积下,目前24C/32T(8P/16E)的I9变成8P/24E甚至8P/32E的组合,绝对的多核心性能上无疑是巨大提升,大概20%到40%。
当然功耗也起飞,这E核其实一点也不省电。
不过就目前intel能在core ultra1代上搞出两种P核心两种E核心来看。
现在压力给到了微软。
前提是intel真的是为了塞小核心。
Intel很长时间没有高主频的CPU了,提升一下主频,对很多应用是有好处的;对提振股价也有帮助。
很多网络应用本来就不用超线程,如Nginx、dperf会收益。
dperf: 100Gbps开源压力测试工具
[收藏本文] 【下载本文】
   科技知识 最新文章
《消失的问界里》为什么网传华为选择大面积
特斯拉万人大裁员涉及中国市场,销售部门是
媒体报道「特斯拉一天内失去 2 个高管和 10
去年是「大模型元年」,今年会是「AI应用落
2024 年人工智能方向的就业前景怎么样?
如何评价小米汽车SU7全球首例无故抛锚?
如何评价比亚迪与大疆合作发布的车载无人机
如何看待波音「吹哨人」遗言曝光:如果我出
电动汽车为什么一下爆发了?
怎么看待华为太空宽带计划?
上一篇文章      下一篇文章      查看所有文章
加:2024-01-29 21:40:05  更:2024-01-29 21:51:03 
 
 
股票涨跌实时统计 涨停板选股 分时图选股 跌停板选股 K线图选股 成交量选股 均线选股 趋势线选股 筹码理论 波浪理论 缠论 MACD指标 KDJ指标 BOLL指标 RSI指标 炒股基础知识 炒股故事
网站联系: qq:121756557 email:121756557@qq.com  天天财汇