การใช้งานจริง: NVIDIA Mellanox MCX631102AN-ADAT – การขนส่ง RDMA/RoCE ที่มีความหน่วงต่ำ & การเพิ่มประสิทธิภาพการรับส่งข้อมูลเซิร์ฟเวอร์
April 27, 2026
ในระบบจองที่กระจาย, คอมพิวเตอร์ที่มีประสิทธิภาพสูง, และคลาสเตอร์การฝึกอบรม AI ความช้าของเครือข่ายและค่าใช้จ่ายส่วนกลางของ CPU ได้กลายเป็นอุปสรรคหลักที่จํากัดการทํางานของเซอร์เวอร์ผู้ให้บริการบริการเมฆล่าสุดปรับปรุง NVMe-oF ของมันNVIDIA Mellanox MCX631102AN-ADATโดยการจัดจําหน่าย RDMA ผ่าน Converged Ethernet (RoCEv2) พวกเขาได้รับการขนส่งระยะยาวต่ําจากปลายไปปลายและการเพิ่มความเร็วของเซอร์เวอร์อย่างสําคัญการศึกษากรณีนี้วิเคราะห์วิธีการปรับปรุงการทํางานในสภาพแวดล้อมการผลิต.
สถานการณ์และความท้าทาย: ปริศนาขั้นต่ําของโปรโตคอล TCP/IP
พื้นฐาน 25GbE ที่มีอยู่ของผู้ให้บริการจัดการกับการจอดข้อมูลโดยใช้ซอฟต์แวร์ TCP/IP แบบดั้งเดิมการใช้งาน CPU สําหรับการคัดกรองและถอดกรองแพคเก็ตเกิน 40%, ส่งผลให้ความช้าในการเก็บข้อมูลมากกว่า 200μs และการลดความจุในการคํานวณในเซอร์เวอร์แอพลิเคชั่นอย่างหนักลดการรบกวนของ CPUหลังจากการประเมินตัวเลือกหลายอย่าง พวกเขาเลือกMCX631102AN-ADAT ConnectX-6 Lx ท่าสอง 25GbE SFP28เป็นฮาร์ดแวร์หลักในการปรับปรุงผ้าเก็บของ
การแก้ไขและการจัดจําหน่าย: RDMA/RoCEv2 กับการลดภาระของฮาร์ดแวร์
การจัดจําหน่ายแทนเซอร์เวอร์ที่เผชิญหน้ากับการเก็บข้อมูลทั้งหมดการ์ด MCX631102AN-ADAT Ethernet, วิ่งใน RoCEv2 โหมดไร้การสูญเสีย (ใช้ ECN และ PFC) ขั้นตอนการจัดจําหน่ายหลักรวมถึง:
- การเปิด SR-IOV และมอบฟังก์ชันเสมือน (VFs) ให้กับเครื่องจักรเสมือนในการเก็บข้อมูล โดยเลี่ยงสเตคเครือข่ายไฮเปอร์วิเซอร์
- การตั้งค่า NVMe over Fabrics (NVMe-oF) ด้วย RDMA Transport, การกําจัด TCP Overhead อย่างสมบูรณ์
- ขั้นต่ําของพัฟเฟอร์การปรับเปลี่ยนสําหรับการจราจร RoCE 25GbE ที่ไม่มีการสูญเสียผ่านโทปโลยีใบ-กระดูกสันหลัง
รายการรายละเอียด MCX631102AN-ADATรวมถึงเครื่องหมายเวลาของฮาร์ดแวร์, การขนส่งการเชื่อมต่อแบบไดนามิก (DCT) และเครื่องรับเวกเตอร์.
ผลประกอบการที่ได้รับการวัด & ประโยชน์ในการดําเนินงาน
หลังจากการอพยพไปยังNVIDIA Mellanox MCX631102AN-ADAT-เนื้อเยื่อที่มาจากผ้า, เมติกรอื่น ๆ ได้ถูกจับ:
| เมทริก | ก่อน (TCP/IP 25GbE) | หลังจาก (RoCEv2 กับ MCX631102AN-ADAT) |
|---|---|---|
| NVMe-oF อ่านความช้า (P99) | 215 μs | 18 μs |
| การใช้ CPU (เส้นทาง I/O ของการเก็บข้อมูล) | 41% (เอกเดียว) | 7% (กระจายไปทั่วแกน) |
| อัตราการทํางานของเซอร์เวอร์รวม (RX+TX) | 42 Gbps (โปรแกรมจํากัด) | 49.8 Gbps (ความเร็วสาย) |
| ขนาดเล็ก (64B) | 8.1 Mpps | 37.5 Mpps (การควบคุมกระแสของฮาร์ดแวร์) |
วิศวกรสังเกตว่าMCX631102AN-ADAT โซลูชั่นการ์ดแอดป์เตอร์อีเทอร์เน็ตส่งการคาดเดาความช้าของหางที่เหมาะสมสําหรับฐานข้อมูลการวิเคราะห์ในเวลาจริง นอกจากนี้, หน่วย CPU ที่ได้รับการปลดปล่อยได้ถูกจัดสรรใหม่ให้กับภาระการทํางานของแอปพลิเคชั่น,เพิ่มความหนาแน่นของผู้เช่าโดยรวมโดยประมาณ 24% บนเซอร์ฟิสิกส์เดียวกัน.
ความเหมาะสมและการบูรณาการระบบนิเวศ
เมื่อขยายการใช้งาน ทีมปฏิบัติการตรวจสอบว่า adapterรองรับ MCX631102AN-ADATกับสวิตช์ NVIDIA Spectrum ที่มีอยู่ (โปรไฟล์ RoCE ที่ไม่มีการสูญเสีย) รวมถึงสวิตช์ ToR ของบริษัทที่สามจาก Arista และ Cisco ด้วยการตั้งค่า DCBXใบข้อมูล MCX631102AN-ADATการตรวจสอบจํานวนมากในช่วงแรกยืนยันว่าMCX631102AN-ADAT ราคายังคงมีความแข่งขันเมื่อเทียบกับ SmartNICs ในหมวดเดียวกัน โดยมีผู้จําหน่ายหลายคนMCX631102AN-ADAT สําหรับขายตามข้อตกลงปริมาณมาตรฐาน
สรุปและมุมมอง
กรณีการผลิตแสดงอย่างชัดเจนว่าMCX631102AN-ADATทําให้การเปลี่ยนแปลงพื้นฐานจากเครือข่ายเก็บข้อมูลที่ผูกพันกับ TCP ไปยังผ้าที่เร่ง RDMA โดยไม่ต้องต้องการการปรับปรุงพื้นฐาน 100GbE อย่างสมบูรณ์แบบMCX631102AN-ADAT ConnectX-6 Lx ท่าสอง 25GbE SFP28การออกแบบ, องค์กรสามารถปันผลประสิทธิภาพในการทํางานในการทํางานที่มีความรู้สึกต่อความช้า โดยการเรียกคืนทรัพยากร CPU ที่สําคัญรูปแบบการจัดจําหน่ายเดียวกันจะขยายไปยังกรอบการเรียนรู้เครื่องจักรกระจาย (NCCL ผ่าน RoCE) และแอปพลิเคชั่นที่มีสภาวะที่ใช้บริการไมโครสําหรับสถาปนิกประเมินการปรับปรุง 25GbENVIDIA Mellanox MCX631102AN-ADATถือว่าเป็นก้อนสร้างที่ผ่านการพิสูจน์และแข็งแกร่งในการผลิต สําหรับเครือข่ายศูนย์ข้อมูลที่มีประสิทธิภาพสูงและความช้าต่ํา

