华为的“少年天才”攀登者,出发向智能存储的“奥林帕斯山”

毕业季和招生季里的一次次“官宣”,让华为“天才少年”彻底出圈,也展现出了华为“凶猛”的技术人才进击态势。

大家在关注百万年薪的同时,可别忘记与顶级薪酬相匹配的顶级挑战。拿到高档offer的“天才少年少女”,都选择加入的华为存储相关领域,是十分值得关注的领域。

存储究竟有多重要?随着各行各业智能化的深入,数据基础设施自然也需要跟上节奏。越来越多的企业需要高效的数据存储与管理系统,来实现海量的数据管理与保护,为业务发展与经济增长提供保障。

而2019年,华为曾以“奥林帕斯奖”为名,鼓励科研人员积极创新,解决数据基础设施领域的技术难题。而火星的奥林帕斯山,是太阳系已知最高的火山,是珠穆朗玛峰的三倍,以此来类比,难度可想而知。

攀爬“太阳系之最”的技术高峰,自然需要专业且顶级的精英人才。所以,我们不妨暂时放下金光闪闪的高薪标签,来看看这些攀登者们是如何征服存储这座“奥林帕斯山”的。

远眺,万物智能的数据风景

拒绝腾讯、阿里和美国存储巨头西部数据的邀请,在四份offer中直奔华为的“天才少女”,选择与自己在校研究方向——新型存储介质(NVM,SMR)、数据库和键值存储系统——相契合的华为存储相关工作。

而天才少年也在接受采访中表示,最终选择加入华为,是希望能够和一群志同道合的人做有意义的事,怀抱理想让世界刮目相看。

存储如同圣杯,正在成为今天和未来的数据狂潮中全社会新的避难所,也吸引了众多年轻的有志之士为之奋斗。

目前看来,我们正在经历数据三变:

量级变大:数字化、智能化产业趋势的兴起,IoT设备逐渐变得无处不在,5G即将产生的超级联接,都让传统的IT基础设施面临着数据浪潮冲击;

价值变大:数据的存储与融通,已经从互联网产业的刚需,变成了各个行业未来业务增长的生产资料,5G+AI+云时代的新一代存储商业空间已经清晰;

产业之变:数据存储从底层承载平台,开始向数据流动、分析、利用的计算产业环节延伸,对硬件创新和软件迭代提出了全新挑战。

人类的智能时代已经笃定,新一代存储就成了必须翻越的山脉。

规划,向山顶迈进

在新一代存储设施的宏大挑战中,NVMe成了所有攀登者必须抵达的一座山峰。

2010年,NVMe(Non-Volatile Memory Express非易失性内存标准)标准接口协议诞生,就注定了会让挑战者高山仰止:

传统存储中连接固态闪存SSD的最典型方式SAS,吞吐量有限,随着存储介质性能百倍级以上的提升,已经成为限制硬件性能释放的天花板。

而NVMe则革命性地用简洁、直接的轻量级技术能力,释放了新的产业机会。

NVMe协议替代了原有的AHCI规范,并且软件层面的处理命令进行了重新定义,得以规范固态硬盘访问接口,去掉了SAS系统中的IO Scheduler和SCSI等复杂的协议层,利用多核处理器,降低协议交互时延。

与单队列SAS协议相比,NVMe协议可支持多达64K个队列,实现更高的并发处理。此外,通过PCIe直连,让CPU和NVMe SSD直接通信,比传统SAS架构更精简。有数据显示,如果采用SAS后端的SCSI协议,一次完整的主机数据写入请求需要通过4次协议交互,而华为NVMe全闪存只需要2次协议交互,处理写请求的效率比SAS全闪存高1倍,显著提高了固态硬盘的读写性能。

用一个类比来说,就是将原本草木丛生、人车畜共行的林间小道铲平了,修建一个更宽、更平坦的高速公路,数据自然能在上面快速流畅地通行。

根据Gartner预测,2022年NVMe SSD在存储中占比将达到52%。

听起来,似乎只要将这个新协议用起来就好了,有什么难的?攀登者在前往大本营之前,都会提前进行线路规划、了解即将面对的地形和可能的风险,而对于NVMe技术的落地,其存在的挑战就在于,想要一路给SSD“开绿灯”,并不容易。

首先,新技术从实验室落地市场,需要达到规模化应用的高能效比。NVMe SSD全闪存阵列在合理成本上发挥出它的性能极限,从单纯的注重性能发展到真实降低单位比特成本,才能吸引客户买单;

其次,需要完整的产业链支持,比如当时的全闪存阵列控制器架构都是为了适应机械硬盘而设计的,NVMe面临着软硬件适配、运维管理的重重阻碍。

另外,只有NVMe产品能够在企业业务中可以释放出真正的商业价值,特别是在分秒必争的企业场景,这就需要产品力的加持。

这些,都推动着攀登者们全面理解、步步为营、持续发力。

攀登,华为存储的三把“神兵”

在存储领域,传统的技术话语权柄一直被美国、日本等大国巨头厂商所把持。但变局在NVMe上发生了。

2018年,华为在中国存储与数据峰会上,发布了华为OceanStor 存储 Dorado系列,率先实现了全系列支持NVMe架构。

在达到这一成绩之前,华为也早已拿下了不少小的技术“据点”,比如发布了业内唯一端到端NVMe SSD盘、NVMe闪存控制器和NVMe全闪存操作系统等等。

智能存储的产业阶段,华为NVMe全闪存阵列,锤炼出了三把披荆斩棘、无往不利的“神兵利器”:

1.全面覆盖,化繁为简,指数级性能增长

华为更进一步,从网络、服务器、存储全部采用NVMe Over RoCE全IP组网设计,使用 TCP/IP 和 RoCE 来部署NVMe 闪存存储平台,让以往需要在多种协议(FC/IP/IB/PCIe/SAS)中复杂交互的局面,用NVMe一种协议完成了整个网的管理。

这样从前端网络连接、后端硬盘框连接、scale-out的控制器互联均采用同一种网络协议,其优势也显而易见:极大降低了存储时延,极致时延可达0.1ms;避免复杂的网络协议和规划,简化了数据中心和企业网络的部署和维护成本。

2.全面创新,端到端整体护航高可靠性

作为业界率先实现全系列端到端NVMe全闪存的厂商,华为自然也抢先交付出了一整套的产业价值。

以新一代OceanStor分布式存储、OceanStor全闪存、FusionData智能数据湖解决方案等为例,就基于智能无损网络和硬件,实现了数据在“采、存、算、管、用”整个生命周期的端到端整合和优化,将新一代存储技术更全面地融入数据基础设施。

为此,华为应用了一系列创新技术。

比如针对商用NVMeSSD盘必须快速在线更换的需求,避免暴力热插拔(PCIe surprise hot plug)可能导致的系统异常、业务中断,华为打造了智能无损网络和OceanStor全闪存联合NOF+增强方案,采用前端共享大卡在系统内实现故障自动巡检、即时感知、主动修复,链路故障感知时间只有1秒,端到端时延仅为75μs。与之相比,业内通用的NOF故障感知时间长达15秒,后者显然对于极大提升系统可靠性,保障端到端的稳定时延,起到了关键作用。

再比如,存储单点的可靠性往往需要采用双控冗余技术保障,但大部分厂商会放弃技术上较难的原生双PCIe端口,而选择另辟捷径,导致系统可靠性的降低。

而华为的解决方法是十年磨一剑,攻破了双端口技术,两个PCIe 3.0X2端口独立,互相不影响,为系统修复和异常处理提供了硬件基础,保证了系统双控冗余性,提升系统的可靠性。

为了解决硬盘重构时间增长,传统RAID技术无法保障系统可靠性,容易导致盘故障、数据丢失的问题,华为采用创新的RAID-TP软件技术,基于Erasure Code算法,将校验位做到支持1、2、3位可调,容忍同一个RAID组内1-3块盘同时失效,在3块盘同时失效的情况下能够容忍数据不丢失,业务不中断。这是目前美国戴尔、IBM等厂商都做不到的。

(华为支持NVMe Over Fabric的端到端方案)

3.软硬件结合,从工作流程、工具链、产品化的全面升级

要让数据在整个生命周期内都能满足时代诉求,面对的挑战还有很多。所以除了仅在硬件产品优化上做文章之外,华为也从底层出发,从工作流程、工具链到产品进行了全方位使能。

举个例子,华为率先在NVMe全闪存领域实现免网关双活方案,基于闪存的硬件和软件优化,双活时延达到1毫秒,性能业界最高,保障业务7*24高可用,并支持从双活方案平滑升级到3DC方案。

华为OceanStor 存储 Dorado系列还开发一系列自动化部署工具,把运维工程师从复杂繁琐的网络部署工具中解放出来,全面提升从网络规划到实施的易用性。加上人工智能技术智能预测故障、定位问题、实时健康度分析、分析性能和容量趋势等等应用,大大降低存储系统运行风险和运维成本,将存储管理效率提升5倍以上。

通过这一系列组合拳,华为正在将NVMe技术不断融入到存储阵列之中,在数字化升级的时代浪潮中,让各行业都能直观地感受前沿技术带来的体验质变。

冲顶,全球存储,中国时刻

不出意外,华为的技术攀登者们成功在一个个大本营胜利会师、安营扎寨。

在技术分析机构DCIG的《DCIG 2020年-2021年全闪存阵列购买指南》中,华为OceanStor存储Dorado系列占据C位,位列最佳推荐榜首,超越其他所有竞争对手。

全球权威机构Gartner公布的最新数据显示,2019年华为存储全球增速第一,成为市场中后劲最足的厂商。

在2020年第一季度全球存储供应商普遍出现营收下滑的背景下,华为存储逆势保持24.7%的高速增长,其中华为全闪存增长率高达45.1%,远高于市场平均增长率和其他竞争对手。

从2002年起步至今,华为存储从零创业,到如今拿下NVMe的技术高地,加速向全球市场冲锋,后劲都来自哪些要素?或许可以将其总结为华为存储的“四大能量”:

1.技术信念。华为在存储和硬盘领域钻研多年,是目前业界唯一自研存储控制器、SSD盘和存储芯片的厂商,充分了解数据存储的全流程,将这些经验应用在NVMe系统中,增长迭变速度越来越快;

2.创新意识。不断将新的技术、理念、工具融入到存储领域当中,全栈采用NVMe、芯片级端到端加速、SCM+分级/缓存技术、智能AI算法FlashLink等等,每一次创新都转化为向上攀登的强劲动能;

3.尊重市场。无论是人工智能、大数据、自动驾驶、区块链等先进领域,还是在医疗、制造、金融等传统行业,华为存储对各行业的数据困境都十分尊重,全系列NVMe的产品阵列,降低了用户使用领先存储技术的门槛,提供了更灵活、经济的选择,帮助更多企业快速推进数字化转型。

4.重视人才。华为在优秀人才的吸纳上从来都不遗余力,在科研上的投入甚至超过了当年的净利润。而从任正非的只言片语中我们知道,华为至少有700多名数学家,800多名物理学家,120多名化学家,六七千名的基础研究专家,6万多名各级高级工程师。华为华为18万员工中,有将近45%的人在从事基础研究工作。

从这个角度看,华为存储在全球市场的冲锋,看似是一场短跑冲刺,其实是一场绵延将近20年、砥砺前行的马拉松。

人类不断向火星发起探索,是用梦想自我定义能力上限的过程。而华为存储的一次次技术上探,其实是源于一个伟大梦想的无限延伸。

免责声明:此文内容为第三方自媒体作者发布的观察或评论性文章,所有文字和图片版权归作者所有,且仅代表作者个人观点,与 无关。文章仅供读者参考,并请自行核实相关内容。投诉邮箱:editor@fromgeek.com。


企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2020-08-16
华为的“少年天才”攀登者,出发向智能存储的“奥林帕斯山”
有数据显示,如果采用SAS后端的SCSI协议,一次完整的主机数据写入请求需要通过4次协议交互,而华为NVMe全闪存只需要2次协议交互,处理写请求的效率比SAS全闪存高1倍,显著提高了固态硬盘的读写性能

长按扫码 阅读全文

Baidu
map