正在开发新的处理器架构,可以提供两到三个数量级的性能提升。 现在的问题是系统中的性能是否接近处理器基准测试。
大多数这些处理器做得很好。它们处理特定的数据类型,并且可以通过在芯片中的多个处理元件之间分配处理来加速算法的乘法累加功能。 实际上,它们是并行化操作,同时还修剪算法并将输出调整到任何必要的精度级别,并且它们在多个方向上而不是从左到右存储和检索来自存储器的位。
但是,这些架构存在一些固有的挑战。 首先,如果您还没有减少需要在此过程中处理的数据量,那么通过芯片移动数据并不是特别节能。 虽然MAC功能可以分布在多个加速器上,但是在多个处理元件处理之后,将数据移动到芯片上并以某种连贯的形式将其重新组合在一起并不是那么简单。
数十年来,数据中心一直在努力解决这个问题,而超大规模的云已经为这种混合增加了异质性因素。 云基本上负载平衡处理并使用高速光学互连以光速传输数据。 但随着这种操作越来越接近数据,例如在汽车或边缘云中,负载平衡的能力更加有限。 在边缘云中存在有限的房地产,而在自动驾驶车辆中则少得多。 此外,这些系统中的任何一个都将始终保持足够的数据馈送并不是很清楚,许多新的处理器架构正在开发为永远在线的设计。 它们在以最大速度处理数据时效率最高。
第二个挑战是,设备在整个边缘的连接方式并不明显,这可能会产生自己的瓶颈。 设计一个运行速度为100Gbps或400Gbps的数据管道的系统在纸面上看起来非常好,但速度只有网络上最慢的组件速度。 任何拥有千兆互联网连接的人都知道数据流的速度与另一端的服务器一样快。
第三,任何不是超大规模云数据中心的计算操作的经济性都非常模糊。 由于这些新的处理器架构针对某些算法或数据类型进行了高度调整,因此它们不太可能实现规模经济,这使得这种处理首先成为可能。 此外,随着算法的更新,性能会降低,这是一个持续的过程。 这意味着芯片可能必须比过去更频繁地更换。 但如果由于体积不足而导致设计成本过高,则会改变升级的经济性。
从透视的角度来看,随着计算模型的转变,从技术和业务角度来看,存在多个潜在的瓶颈。 而这甚至没有开始解决以足够快的速度将数据输入和输出内存以跟上处理的能力。 向新处理器架构的转变伴随着许多移动部件,到目前为止,还没有很多关于所有这些部件如何协同工作的可见性。
上一篇:« « IC部门产量增长8.6%
下一篇:« « 苹果高通45亿美金和解后,这个人赚了350万美金