码农的自我修养 - 关于ARM你需要知道的

据ARM公司的工程师说,第九代Arm处理器架构可以在这十年的剩余时间里支持所有的分布式计算。Arm的崛起是否意味着我们所知道的中央处理器的终结?

关于Arm处理器架构在任何计算或通信市场--智能手机、个人电脑、服务器或其他方面--发挥的作用,你需要了解的最重要的事情是:总部位于英国剑桥的Arm控股有限公司只负责设计处理器的组件,并不负责制造。Arm公司拥有这些设计,以及其指令集的架构,如64位ARM64。它的商业模式是将这些组件和指令集的知识产权(IP)授权给其他公司,使他们能够围绕这些组件建立系统,其中包括他们自己的设计和Arm的设计。对于围绕这些芯片构建系统的客户来说,Arm已经为他们完成了最困难的部分。

码农的自我修养 - 关于ARM你需要知道的_第1张图片

作为一家芯片公司,Arm如何在不制造芯片的情况下开展业务?

Arm Holdings, Ltd.不制造自己的芯片。它没有自己的制造设施。相反,它将这些权利授权给其他公司,Arm控股公司称之为 "合作伙伴"。他们利用Arm的架构模型作为一种模板,构建使用Arm内核作为中央处理器的系统。

码农的自我修养 - 关于ARM你需要知道的_第2张图片

高通公司的芯片

这些Arm合作伙伴有机会围绕这些处理器设计并可能制造他们的系统,或者将其生产外包给其他公司,但无论如何都会在商业市场上销售这些设计的实现。许多三星和苹果的智能手机和平板电脑,以及高通公司生产的所有设备,都采用了一些Arm的知识产权。使用基于Arm的片上系统(SoC)生产的新一波服务器已经在与x86的竞争中取得了进展,特别是低功耗或特殊用途的型号。每个采用Arm处理器的设备往往都是自己独特的系统,就像上面描述的多部件的高通骁龙845移动处理器。

(高通公司在2020年7月宣布了其865 Plus 5G移动平台)。去年1月,该芯片制造商宣布其888 5G移动平台将为三星的Galaxy S21、S21+和S21 Ultra智能手机提供动力)。

也许对Arm的商业模式以及它与自己的知识产权的关系的最好解释,可以在2002年提交给美国证券交易委员会的文件中找到。

我们非常注意建立和维护我们产品的专利完整性。我们专注于以 "cleanroom"的方式设计和实施我们的产品,不使用属于其他第三方的知识产权,除非在严格维护的程序和明确的许可权下。如果我们发现第三方拥有涵盖我们有兴趣开发的产品的知识产权保护,我们将采取措施购买使用该技术的许可,或在开发我们自己的解决方案时绕过该技术,以避免侵犯该其他公司的知识产权。尽管有这些努力,第三方仍可能提出索赔,称我们侵犯了他们的专利权,我们将对此进行辩护。

为什么x86被出售而Arm被授权?

基于英特尔或AMD的x86计算机的制造商并不设计也不拥有CPU的任何部分知识产权。它也不能为自己的目的复制x86知识产权。"Intel Inside "是一个印章,证明了设备制造商围绕英特尔的处理器制造机器的许可。基于Arm的设备可能被设计成包含该处理器,甚至可能对其架构和功能进行调整。因此,Arm处理器不是 "中央处理单元"(CPU),而是被称为系统芯片(SoC)。设备的大部分功能可能被制造到芯片本身,与Arm的独家内核共存,而不是在芯片周围建立单独的处理器、加速器或扩展。

因此,由Arm处理器(如Cortex系列)运行的设备与由英特尔至强或AMD Epyc运行的设备是不同等级的机器。成为基于Arm芯片的原始设备意味着相当不同的东西。最重要的是,从制造商的角度来看,它意味着某种程度上的不同,并希望能更容易管理的供应链。由于Arm对向终端用户推销自己没有兴趣,你通常不会听到很多关于 "Arm Inside "的消息。

然而,同样重要的是,Arm芯片不一定是一个中央处理器。根据其系统的设计,它可以是设备控制器的核心,也可以是微控制器(MCU),或者是系统中的一些其他附属部件。

ARM和苹果之间是什么关系?

苹果公司的移动设备,从推出首款 iPhone 以来,就使用的是 ARM 处理器。

Apple Silicon是苹果目前用来描述自己的处理器生产的短语,从2020年6月开始,苹果宣布更换其x86 Mac处理器生产线。取而代之的是一种名为A12Z的新系统芯片,代号为 "Bionic",由苹果公司使用Arm控股有限公司授权给它的64位组件设计来生产,据说已经在发货的Mac笔记本电脑中使用。在这种情况下,Arm不是设计者,而是指令集的生产者,苹果围绕指令集进行原始设计。2020年12月,苹果选择台湾的台积电作为其A12Z的制造者。

为了使MacOS 11继续运行为英特尔处理器编译的软件,在Arm SoC下,新系统将运行一种名为Rosetta 2的 "及时 "指令翻译器。新的操作系统不是在虚拟机中运行旧的MacOS镜像,而是运行一个实时的x86机器代码翻译器,该翻译器将x86代码重塑为苹果现在所说的Universal 2二进制代码--一种仍可在基于英特尔的旧Mac上运行的中级代码--实时运行。这些代码将在苹果公司以外的消息来源所称的 "模拟器 "中运行,但这并不是真正的模拟器,因为它并不模拟代码在实际的物理机器中的执行(没有 "Universal 2 "芯片)。

独立性能基准测试的第一个结果是,将使用A12Z芯片的iPad Pro与微软Surface机型进行比较,看起来很有希望。截至本文撰写时,Geekbench结果显示,采用Bionic的平板电脑的多核处理得分为4669(越高越好),而采用奔腾处理器的Surface Pro X为2966,采用Core i5处理器的Surface Pro 6为3033。

根据苹果公司自己的估计,它新近声称有能力为Mac生产自己的SoC,就像为iPhone和iPad生产一样,随着时间的推移,该公司可以节省多达60%的生产成本。当然,苹果通常对其如何得出这一估计,以及这种节约需要多长时间才能实现的问题讳莫如深。

苹果和Arm Holdings之间的关系可以追溯到1990年,当时英国苹果电脑公司成为Arm Holdings, Ltd.的一个创始共同股东。当时的其他合作伙伴是Arm概念的提出者Acorn计算机有限公司(关于Acorn的更多信息,见后文)和Arm控股有限公司。(关于Acorn的更多信息见后文)和定制半导体制造商VLSI技术公司(因被称为 "超大规模集成 "的常见半导体制造工艺而得名)。今天,Arm Holdings是软银的全资子公司,软银在2016年7月宣布有意收购该许可人。当时,这笔收购交易是总部位于欧洲的技术公司的最大一笔交易。

Nvidia在管理作为企业部门的Arm方面将扮演什么角色?

2020年9月13日,Nvidia宣布了一项从其母公司东京软银集团有限公司收购Arm Holdings, Ltd.的交易,现金和股票交易的价值为400亿美元。该交易正在等待欧盟、美国、日本和中国的监管部门的审查,这些程序可能在2022年结束。

在公告发布后的新闻发布会上,英伟达首席执行官黄仁勋告诉记者,他的意图是维持Arm目前的商业模式,不影响其目前的合作伙伴组合。然而,黄还表示,他打算在Arm提供给合作伙伴的IP组合中 "增加 "访问Nvidia的GPU技术,使Arm的被许可人能够访问Nvidia的设计。在宣布这项交易时,不清楚的是,除了与Nvidia竞争的机会外,潜在的合作伙伴对GPU设计有什么要求。

Arm设计的目的是根据其合作伙伴的独特需求,以不同的配置进行混合和匹配。Arm Foundry计划是Arm控股公司和半导体制造商(如台湾的台积电和美国的英特尔)之间的合作项目,为被许可人提供多种选择来生产采用Arm技术的系统。(在9月的公告之前,当Arm被考虑出售时,传闻的潜在买家包括台积电和三星)。相比之下,Nvidia生产独家GPU设计,打算在其选择的代工厂独家生产--最初是IBM,然后主要是台积电,最近是三星。Nvidia的设计是专门为这些特定的代工厂设计的--例如,利用三星的紫外线(EUV)光刻工艺。

Arm架构的价值在哪里?

截至2021年3月30日,自公司成立以来,Arm处理器架构已经有九代了。当一家公司制造自己的处理器,或将其制造权独家授权给其他代工厂,仅以被授权人的名义进行销售时,设计通常是基于一个参考实现,很容易改变以适应性能参数。例如,片上静态内存缓存被添加或不添加,只在高级型号中才实现完整的内核,而在不同级别处理器可能限制内存带宽。

在Arm的情况下,其架构就像一本功能百科全书。每一类处理器内核都会带来基本和专业的功能。每个被许可人,或 "合作伙伴",围绕核心系列建立一个设计,提供它所需要的功能。然后,合作伙伴的设计被Arm认证为遵守其准则,坚持Arm工程师的安全原则和原始设计意图,也许最重要的是,能够运行为该处理器设计的相应软件。合作伙伴引入的任何专业化都不应该使处理器无法运行Arm已经认证为可在其指定核心类别上执行的软件。

一旦通过认证,Arm就会授权其合作伙伴使用Arm的知识产权(IP)来生产其设计,可以通过其自己的代工厂,也可以通过将生产外包给富士康或台积电等商业代工厂,这种情况更为常见。

ARM公司对其最新一代架构的计划是什么?

现在被称为Armv9(arm - vee - nine)的处理器设计组合引入了一个软件架构师熟悉的概念,但对硬件工程师来说也许是陌生的:隔离执行。从概念上看,Armv9的境界与容器的原始想法相似,是孤立的执行线程,与运行操作系统或任何系统服务的任何线程都没有联系。

Realms的目标是使x86架构上最常见的处理器漏洞类型在Armv9上不可能实现:堆栈溢出。这种利用的策略是使用普通指令来触发一个错误条件,然后在处理器清理的时候,迫使原本作为数据传递的字节作为特权代码执行,而处理器是无法检查特权的。理论上,只要一个线程在离散的Armv9领域中运行,它就不能跳过任何与系统有关的寄存器,或任何支持虚拟机的管理程序,即使它为自己触发了一个错误条件。

"Arm公司的首席架构师Richard Grisenthwaite解释说:"利用这一点,例如,从标准应用商店下载的司机的共享汽车应用程序,并安装在个人设备上,"可以动态地创建一个领域,以持有和处理其秘密,一个远离操作系统和管理程序的世界。这确保了对雇主的数据的保护,即使手机的操作系统被破坏。通过防止商业上可行的算法和数据被盗,并确保雇主所需的关键任务监督控制不能被颠覆,就不再需要为司机或快递员提供专用的企业设备了"。

换句话说,如果Realms计划成功,雇主在购买独立手机时寻求的应用隔离,可以通过单一的智能手机获得,其处理器的工作方式就像两个(或更多)隔离的组件。

Realms是Arm公司在全公司范围内实施所谓的保密计算架构的倡议的一部分。但是,与竞争对手相比,仅Realms就能为Arm处理器驱动的设备带来市场优势。当其他公司可能继续推动速度和性能的领先时,Arm公司可以为有安全意识的客户提供一个替代方案,他们可能愿意为此牺牲一些性能收益。

是什么使Arm处理器架构与众不同?

缩写 "Arm "中的 "R "实际上代表了另一个缩写词。精简指令集计算机(RISC)。其目的是利用简化的效率,目的是在一个芯片上呈现处理器的所有功能。保持一个处理器的指令集小意味着它可以使用较少的比特数进行编码,从而减少内存消耗以及执行周期时间。早在1982年,加州大学伯克利分校的学生就能够通过明智地选择最常使用的功能,并只在硬件中呈现这些功能--其余的功能以软件形式呈现,从而产生了第一个工作的RISC架构。事实上,这就是具有一组小内核的SoC的可行性:将尽可能多的功能归入软件。

追溯起来,x86等架构采用的策略与RISC完全相反,被称为复杂指令集计算机(CISC),尽管英特尔历来避免为自己使用这一术语。x86的力量来自于只用一条指令就能完成这么多任务。例如,通过英特尔的矢量处理,可以同时执行16个单精度数学运算,或8个双精度运算;在这里,矢量充当了一种 "串联",如果你愿意的话,在并行运算中戳穿所有操作数,并将它们串联起来。

这使得复杂的数学运算更容易,至少在概念上是这样。在RISC系统中,数学运算被分解为基本要素。在CISC架构中会自动发生的一切--例如,当一个进程完成时,清除活动寄存器--在RISC中需要一个完整的、记录的步骤。然而,由于封装整个RISC指令集所需的位数(二进制数字)较少,最终在RISC处理器中编码一连串基本操作所需的位数,可能比所有属性和参数都堆积在一起的复杂CISC指令还要少。

英特尔可以,而且已经展示了非常复杂的指令,其性能统计数字高于Arm处理器或其他RISC芯片的相同进程。但有时这种性能的提高是以系统其他部分的整体性能为代价的,这使得RISC架构在通用任务方面比CISC更有效率一些。

然后还有一个定制的问题。英特尔以嵌入微代码的方式增强其更高级的CPU的功能,而这些功能通常由软件程序来完成。这些程序被设计成可以在机器代码层面快速执行,并且可以通过名称间接地被代码引用。例如,这样一来,一个需要调用网络上解密信息的通用方法的程序,就可以寻址到快速处理器代码,并能快速找到需要执行的代码。(方便的是,许多最终出现在微代码中的例程是那些经常被用于性能基准的例程)。 这些微代码程序被存储在靠近x86核心的只读存储器(ROM)中。

码农的自我修养 - 关于ARM你需要知道的_第3张图片

Arm Holdings, Ltd.

相比之下,Arm处理器在其片上存储器中不使用数字微代码。目前Arm的替代方案的实现是一个叫做自定义指令的概念[PDF]。它使完全可由客户定制的片上模块成为可能,其逻辑实际上是 "预编码 "的。这些模块在上面的Arm图中用绿色方框表示。程序调用这种逻辑所要做的就是为处理器核心提示一条从属指令,该指令将控制权传递给定制模块,就像它是另一个算术逻辑单元(ALU)一样。Arm要求想要实现定制模块的合作伙伴向它提供一个配置文件,并绘制出从内核到定制ALU的定制数据路径。仅仅利用这些项目,内核就可以为自己确定依赖关系和指令互锁机制。

这就是Arm公司的合作伙伴如何使用Arm公司的内核作为他们的起始成分,为自己建立一个独家设计。

虽然Arm没有创造RISC的概念,但它在实现这一概念并使其公开化方面有很大的作用。原始伯克利架构的一个分支是RISC-V,其核心规范在知识共享4.0许可下被开放源代码。Nvidia以及包括高通、三星、华为和美光科技在内的其他公司,一直是RISC-V基金会的创始成员。当被问及这个问题时,Nvidia首席执行官Jensen Huang表示,他打算让他的公司继续为RISC-V工作做出贡献,并坚持认为其生态系统与Arm的生态系统是自然分开的。

ARM处理器与X86/X64处理器有何不同?

一台基于X86的PC或服务器是按照一些通用的性能和兼容性规格建造的。此外,这样的电脑与其说是设计的,不如说是组装的。这使硬件供应商的成本保持在较低水平,但也将大部分的创新和功能级别的溢价归于软件,也许还有一些实施的细微差别。x86设备生态系统由可互换的部件组成,至少在架构方面是这样(当然,AMD和英特尔的处理器在相当长的一段时间内不兼容插座)。Arm生态系统由一些相同的部件组成,如内存、存储和接口,但除此之外,还有为它们所使用的部件设计和优化的完整系统。

这并不一定给Arm设备、设备或服务器带来任何自动超过英特尔和AMD的优势。英特尔和x86在计算处理器领域占据主导地位已有40年之久,而Arm芯片在这段时间内几乎一直以某种形式存在--自1985年以来。它的整个历史就是在x86技术尚未充分开发的市场或x86显示出弱点的市场,或者x86根本无法适应的市场中寻找成功。

对于平板电脑,最近在数据中心服务器,以及很快再次在台式电脑和笔记本电脑中表现出来,基于Arm的设备或系统的供应商不再被贬低为只是一个零件的装配商。这使得任何直接的、单位对单位的Arm与x86处理器组件的比较都显得有些无意义,因为基于其中一个的设备或系统可以很容易地、持续地超越另一个,基于该系统的设计、组装甚至包装方式。

ARM芯片与GPU有何不同?

现在被称为GPU的一类处理器起源于个人电脑的图形协处理器,并且仍然专门地用于这一目的。然而,主要由于Nvidia在人工智能领域的影响,GPU已被视为一类通用加速器,以及超级计算机的主要计算组件--与超级计算机耦合,而不是从属于超级计算机。GPU的强项是它能够并行执行许多指令集群或线程,大大加速了许多学术研究类任务。

Arm公司确实生产了一种用于图形处理的GPU参考设计,称为Mali。它向想降低成本的、基于安卓系统的平板电脑和智能电视的制造商提供这一设计的许可。据了解,低价在线电子零售商Kogan.com已经用自己的品牌转售了几个这样的型号。

2021年3月,Arm表示打算在Arm被Nvidia收购后继续生产GPU参考设计,不改变其原始架构。此前,在2020年11月,Nvidia宣布推出一个参考平台,使系统架构师能够将基于Arm的服务器设计与Nvidia自己的GPU加速器相结合。

片上系统与芯片组一样吗?(IS A SYSTEM-ON-A-CHIP THE SAME AS A CHIPSET?)

芯片组:

在计算机系统中,芯片组是集成电路中的一组电子元件,被称为 "数据流管理系统",管理处理器、存储器和外围设备之间的数据流。它通常出现在主板上。芯片组通常被设计为与特定系列的微处理器一起工作。由于它控制着处理器和外部设备之间的通信,芯片组在决定系统性能方面起着关键作用。

芯片组通常指的是主板上的一对特定芯片:北桥和南桥。北桥将CPU连接到非常高速的设备,特别是RAM和图形控制器,而南桥则连接到较低速度的外围总线(如PCI或ISA)。在许多现代芯片组中,南桥包含一些片上集成的外围设备,如以太网、USB和音频设备。

在一般的使用中,芯片组是一套由一个或多个处理器组成的系统,它们共同作为一个完整的系统发挥作用。中央处理器执行主程序,而芯片组则管理附属部件并与用户进行通信。在PC主板上,芯片组与CPU是分开的。

SoC:

从技术上讲,Arm芯片所属的处理器类别是特定应用集成电路(application-specific integrated circuit-ASIC)。可以看作是一个硬件平台,其共同元素是一组处理核心。这并不难理解,这基本上描述了有史以来制造的每一个设备。但是,将这些元件微型化,使它们都能装在一个芯片上--在同一个物理平台上--使用一个专属的网状总线相互连接。

如你所知,对于计算机来说,应用程序被称为成软件。在许多电器中,如互联网路由器、前门安全系统和 "智能 "高清电视,存储操作程序的存储器是非易失性的,所以我们通常称之为固件。在一个核心处理器是ASIC的设备中,其主要功能被呈现在芯片上,作为一个永久的组件。因此,使整个设备作为一个系统,封装在一个芯片中,就使得处理器核心和其他电子器件的功能组合在一起,而一个Arm芯片可以有几十个这样的附加的电子器件或附加功能。

一些分析公司已经开始使用广义的应用处理器(applications processor / AP)来指代ASIC,但这并没有普遍流行起来。在更随意的使用中,SoC也被称为芯片组,尽管近年来,更多时候,芯片组中的芯片数量只有一个。在一个SoC上,主处理器和系统组件合并到同一个芯片中。

今天生产的Arm处理器有哪些类别?

为了保持竞争力,Arm提供了各种处理器核心样式,或系列。有些是针对各种使用情况进行销售的;有些则是专门针对一两种情况。这里需要注意的是,英特尔使用 "微架构 "一词,有时还引申为 "架构",指的是其处理器特性和功能的具体演变阶段--例如,其最近出货的一代至强服务器处理器是英特尔代号为Cascade Lake的微架构。相比之下,Arm架构包含了Arm RISC处理器的整个历史。这种架构的每一次迭代都被称为不同品种,但最近被称为系列。综上所述,Arm处理器的指令集以自己的速度发展,每次迭代一般都使用英特尔用于x86的相同缩写:ISA。是的,这里的 "A "代表了 "架构"。

英特尔为不同类别的客户生产赛扬、酷睿和至强处理器;AMD为台式电脑和笔记本电脑生产Ryzen,为服务器生产Epyc。相比之下,Arm公司生产完整的处理器设计,可由合作伙伴按原样使用,或由这些合作伙伴为自己的目的定制。以下是Arm Holdings, Ltd.的主要设计系列,预计这些设计将持续到2020年代。

Cortex-A被作为Arm系列的主力产品进行销售,其中的 "A "在这里代表着应用。按照最初的设想,希望围绕Cortex-A建立一个系统的客户对它有一个特定的应用,如数字音频放大器、数字视频处理器、灭火系统的微控制器或复杂的心率监测器。结果,Cortex-A最终成为两类新兴设备的核心:能够为各种应用编程的单板计算机,如收银机处理;以及最重要的,智能手机。重要的是,Cortex-A处理器包括片上内存管理单元(MMU)。几十年前,正是英特尔的80286 CPU在片上加入了MMU,改变了其与摩托罗拉芯片的竞争,当时摩托罗拉芯片为Macintosh提供动力。Cortex-A的主要工具是其先进的单指令、多数据(SIMD)指令集,代号为NEON,它可以在较大的向量集上并行执行访问内存和处理数据等指令。想象一下,把车开进一个加油站,装上足够8个或16个油箱的燃料,你就会明白这个基本概念。

Cortex-R是一类使用范围更窄的处理器:主要是需要实时处理的微控制器应用。一个大的案例是4G LTE和5G调制解调器,其中时间(或音乐作曲家可能更准确地称之为 "节奏")是实现调制的一个关键因素。Cortex-R的架构是以这样一种方式定制的,它对中断--触发进程运行的关注请求--的响应不仅迅速而且可预测。这使R能够更稳定和确定地运行,这也是Arm公司正在推广其作为固态闪存的大容量存储控制器的原因之一。

Cortex-M是一个更加小型化的外形尺寸,使其更适用于狭小的空间:例如,汽车控制和制动系统,以及具有图像识别功能的高清晰度数码相机。M的一个主要用途是作为数字信号处理器(DSP),它响应并管理模拟信号,用于声音合成、语音识别和雷达等应用。自2018年以来,Arm已采取将其所有Cortex系列统称为Cosmos。

Ethos-N是一个系列的处理器,专门用于可能涉及机器学习的应用,或其他形式的神经网络处理。Arm称这个系列为神经处理器(NPU),尽管它与谷歌的张量处理单元不太一样,谷歌自己也承认它实际上是一个协处理器,而不是一个独立的控制器。Arm的NPU概念包括用于从数据中得出逻辑推论的程序,这些程序是用于图像和模式识别以及机器学习的人工智能的组成部分。

Ethos-U是Ethos-N的瘦身版,旨在更多地作为协处理器工作,特别是与Cortex-A结合使用。

Neoverse于2018年10月推出,代表了Arm在设计更适用于服务器和承载它们的数据中心的内核方面的新的和更集中的努力--特别是较小的品种。Arm在营销Neoverse时使用的术语是 "基础设施"--不需要太具体,但仍然针对驻扎在 "客户边缘 "的迷你和微型数据中心的新兴用例,更接近终端用户将实际消耗处理器功率的地方。

SecurCore是Arm设计的一类处理器,专门用于智能卡、基于USB的认证和嵌入式安全应用。

这些系列的设计被授权给其他人生产处理器和微控制器。综上所述,Arm公司还独家授权其架构的某些定制和半定制版本,使这些客户能够制造其他生产商无法获得的独特处理器。这些特殊客户包括。

苹果公司,多年来为自己的iPhone和iPad制造了各种基于Arm的设计,并在去年6月宣布为Mac制造全新的SoC。

Marvell,该公司在2017年11月收购了芯片制造商Cavium,并在此后加倍投资于最初为Cavium设计的ThunderX系列处理器。

Nvidia,该公司与Arm共同设计了两个处理器系列,其中最近的一个被称为CArmel。Nvidia一般被称为GPU生产商,它利用CArmel设计来生产其64位Tegra Xavier SoC。该芯片为该公司的小尺寸边缘计算设备提供动力,称为Jetson AGX Xavier。

三星公司,为其整个消费电子产品生产线生产各种32位和64位Arm处理器,以内部品牌Exynos命名。有些使用了三星的核心设计,称为Mongoose,而其他大多数都利用了Cortex-A的版本。值得注意的是(也许是臭名昭著的),三星制造的Galaxy Note、Galaxy S和Galaxy A系列智能手机的变体采用了其自己的Exynos SoC(美国以外)或高通Snapdragons(仅美国)。

高通公司,其最新的Snapdragon SoC型号采用了一种名为Kryo的核心设计,这是一种半定制的Cortex-A的变化。早期的骁龙型号基于一种名为Krait的核心设计,尽管它是一种纯粹的高通设计,但它仍然是官方的基于Arm的SoC。分析师估计,骁龙855、855 Plus和865一起构成了全球一半以上的5G智能手机的核心。尽管高通确实在2017年11月为数据中心服务器生产Arm芯片,有一条名为Centriq的产品线,但它在2018年12月开始逐步减少该产品线的生产,将继续生产的权利交给了中国的华芯通半导体(HXT),当时是合资伙伴。该合作关系于次年4月终止。

在服务器领域中Arm的发展前景

2020年6月,一个为富士通建造的Arm驱动的超级计算机,名为Fugaku,如下图。它是为了日本理化学研究所计算科学中心(RIKEN Center for Computational Science)建造的。在半年一度的超级计算机500强排行榜上夺得第一。在2020年11月的排名中,Fugaku保留了这个排名。

码农的自我修养 - 关于ARM你需要知道的_第4张图片

然而,在X86 CPU和Arm SoC之间的所有差异中,这可能是对数据中心的设施经理来说唯一重要的一个:在两类处理器的任何一对样本中,Arm芯片最不可能需要主动冷却系统。换句话说,如果你打开你的智能手机,你有可能找不到一个风扇。或一个液体冷却装置。

具有讽刺意味的是,5G无线技术的建设正在将光纤连接的建设扩大到 "客户边缘 "附近的位置--离网络运营中心最远的地方。这为将边缘计算设备和服务器驻扎在这些地点或附近提供了机会,但最好不要使用通常伴随x86服务器机架的热交换器。

Bamboo系统

码农的自我修养 - 关于ARM你需要知道的_第5张图片

这就是Bamboo系统等初创公司的优势所在。冷却系统的尺寸和功率要求的大幅降低使服务器设计者能够设计出新的思维方式,例如,通过缩小盒子。Bamboo的服务器节点是一张比大多数人的手掌大不了多少的卡,其中8个可以安全地安装在一个1U的盒子里,而这个盒子通常支持1个,也许2个x86服务器。Bamboo的目标是生产服务器,该公司说,在性能相当的情况下,其使用的机架空间只有五分之一,消耗的电力只有四分之一,是x86机架的五分之一。

Arm处理器如何诞生?

An Acorn。事实上,这就是 "A "的最初含义。

早在1981年,一家位于英国剑桥的名为Acorn Computers的公司正在销售一种基于摩托罗拉6502处理器的微型计算机(在IBM普及该术语之前,我们习惯称之为 "PC")--该处理器曾为古老的Apple II、Commodore 64以及Atari 400和800提供动力。尽管 "Acorn "这个名字是一个聪明的把戏,它比 "Apple "更早出现在按字母顺序排列的名单上,但它的计算机得到了BBC的部分补贴,因此在全国范围内被称为BBC Micro。

码农的自我修养 - 关于ARM你需要知道的_第6张图片

Arm Holdings, Ltd. 首席执行官Simon Segars。在他的左边,显示器下面,是一台正在工作的BBC Micro电脑,大约在1981年。

所有基于6502的机器都使用8位处理器架构,1981年,英特尔正在努力开发一个完全兼容的16位架构,以取代IBM PC/XT中使用的8086。第二年,IBM能够生产使用英特尔80286处理器的PC AT,这样,MS-DOS以及所有在DOS上运行的软件就不必改变或重新编译,就能在16位架构上运行。这是一个巨大的成功,摩托罗拉无法与之匹敌。尽管苹果公司的第一台Macintosh是基于16位的摩托罗拉68000系列,但它的结构只是受到早期8位设计的 "启发",并不与之兼容。(最终,还是生产出了基于65C816处理器的16位苹果IIGS,只在65816的制造商提供可工作测试模型的几个月后。IIGS确实有一个 "苹果II "降压模式,但在技术上并不完全兼容。)

Acorn的工程师们希望有一条前进的道路,而摩托罗拉却让他们陷入了死胡同。在试验了6502的一个令人惊讶的快速协处理器 "Tube "之后,他们选择了采用全32位流水线。继伯克利RISC项目之后,1983年,他们为一个名为Arm1的处理器建立了一个模拟器,这个模拟器非常简单,可以在BBC Micro的BASIC语言解释器上运行(尽管速度不快)。他们将与VLSI合作,并在两年后生产出他们的第一个Arm1工作模型,其时钟速度为6兆赫。它所使用的功率非常小,正如一位项目工程师所讲述的那样,有一天他们注意到该芯片在没有连接电源的情况下运行。实际上,它是由通向芯片I/O的电源轨的漏电来供电的。

在这个早期阶段,Arm1、Arm2和Arm3处理器在技术上都是CPU,而不是SoC。然而,就像今天的英特尔酷睿处理器( Intel Core processors)是其原始4004的架构继承者一样,Cortex-A是Arm1的架构继承者。

参考:

Arm processors: Everything you need to know now | ZDNethttps://www.zdnet.com/article/arm-processors-everything-you-need-to-know-now/

https://en.wikipedia.org/wiki/Chipsethttps://en.wikipedia.org/wiki/Chipset

抛弃x86的苹果,意味着什么?-InfoQhttps://www.infoq.cn/article/vnwnrzjix35xvpjjyxnh

你可能感兴趣的