Xây dựng một nền tảng có thể lập trình cho các ứng dụng của tương lai
Trí tuệ nhân tạo (AI) và máy học (ML) đang phát triển rất nhanh, khả năng mà chúng có thể đạt được dường như là vô hạn. Các nhà máy thông minh liên tục tự tối ưu hóa, phân tích video theo thời gian thực, chẩn đoán y tế tự động, tất cả đều sẵn sàng. Hoặc ít nhất, nó nên như vậy. Nhưng một rào cản kỹ thuật lờ mờ có thể ngăn các ứng dụng ML sáng tạo nhất—và nhiều khối lượng công việc đòi hỏi tính toán chuyên sâu khác—phát huy hết tiềm năng của chúng: các mạng không linh hoạt.
Nhiều trường hợp sử dụng ML hoạt động tốt nhất dưới dạng các ứng dụng trong mạng, thu thập dữ liệu từ nhiều điểm cuối được kết nối, phân tích và hành động trên dữ liệu đó trong thời gian thực—cục bộ, nơi dữ liệu được tạo. Vấn đề: mô hình này tạo ra các mẫu lưu lượng rất khác so với các mẫu mà bộ chuyển mạch Ethernet thương mại thông thường được thiết kế. Bởi vì hầu hết các bộ chuyển mạch Ethernet của thương gia không thể thích ứng để đáp ứng các yêu cầu thay đổi—và vì phần cứng mạng thường ở nguyên vị trí trong nhiều năm—những bộ chuyển mạch này có thể đặt ra giới hạn khó khăn cho tốc độ đổi mới ở vùng biên. Ít nhất, điều đó có thể xảy ra trong các mạng không sử dụng silicon Trio 6 của Juniper.
Juniper Networks dẫn đầu ngành về định tuyến truy cập hiệu suất cao, với hàng trăm nghìn nền tảng Định tuyến phổ quát MX được triển khai trên toàn thế giới. Sử dụng Trio ASIC được thiết kế tùy chỉnh của chúng tôi—silicon mạng duy nhất được xây dựng cho biên đa dịch vụ—các hệ thống này mang lại khả năng lập trình, khả năng thích ứng và quy mô hàng đầu trong ngành. Khách hàng của chúng tôi biết rằng khi họ sử dụng Trio, họ có thể đáp ứng nhu cầu của ngày mai chứ không chỉ hôm nay, hỗ trợ các giao thức và tính năng mới nhiều năm sau khi nền tảng của họ được triển khai. Khi mạng trở nên thiết yếu hơn đối với mọi doanh nghiệp và các yêu cầu về mạng ngày càng khó đoán hơn, thì tính linh hoạt đó sẽ càng trở nên quan trọng hơn.
Nhưng chính xác thì cách tiếp cận của Juniper đối với mạng silicon chuyển thành kết quả trong thế giới thực như thế nào? Điều gì thực sự có thể được thực hiện với bộ xử lý Trio và chúng tạo ra sự khác biệt lớn như thế nào? Gần đây, các kỹ sư của Juniper đã hợp tác với Giáo sư Manya Ghobadi và những người khác tại Viện Công nghệ Massachusetts (MIT) để tìm hiểu. Nhóm Juniper-MIT chung đã trình bày công việc này tại ACM SIGCOMM 2022. Kết quả? Bộ ba nhiều hơn là sống theo hóa đơn của nó.
Những thách thức ngày càng tăng ở rìa
Những tiến bộ trong AI/ML, Internet vạn vật (IoT), metaverse và các ứng dụng mới nổi khác làm tăng đáng kể yêu cầu về độ phức tạp và băng thông của các mạng biên. Để tận dụng những đổi mới này, các tổ chức cần hiệu suất, quy mô, trí thông minh, bảo mật và khả năng quan sát ngày càng cao trên các thiết bị mạng. Và họ cần silicon kết nối mạng có thể đáp ứng lưu lượng truy cập khổng lồ chảy theo những cách không thể đoán trước.
Hãy xem xét một trường hợp sử dụng ML cho một nhà máy thông minh “Công nghiệp 4.0”, nơi hàng trăm “thứ” được kết nối giao tiếp và tương tác ở rìa. Một nhà sản xuất muốn đào tạo các thuật toán ML trên khối lượng dữ liệu khổng lồ được tạo ra trong nhà máy, với mục tiêu xác định các điểm bất thường và thực hiện các hành động tự động để tối ưu hóa chất lượng và năng suất trong thời gian thực. Để làm điều đó, họ sẽ cần tổng hợp dữ liệu từ nhiều điểm cuối khác nhau theo những cách khác nhau và điều chỉnh lưu lượng truy cập Đông-Tây tăng đột biến khi thuật toán tối ưu hóa.
Juniper’s Trio 6 và các hệ thống cạnh đa dịch vụ MX dựa trên nó, được thiết kế cho chính xác những loại thách thức này. Trio ASIC cung cấp 160 công cụ xử lý gói hiệu suất cao được tối ưu hóa đặc biệt cho khối lượng công việc mạng. Chúng có thể hỗ trợ phần mềm chạy trong hàng nghìn luồng, dung lượng lưu trữ Gigabyte, công cụ tính toán hiệu suất cao, bộ lọc gói dung lượng cao và công cụ mã hóa MACSec và IPSec nhúng cho mỗi ASIC. Họ kết hợp hiệu suất đó với mặt phẳng dữ liệu có thể lập trình để có thể tiếp tục hỗ trợ chức năng mới trong suốt vòng đời của nền tảng MX.
Loại mạng linh hoạt, hiệu suất cao này đang trở nên cần thiết cho các công việc ML mới nổi, nhiều công việc trong số đó đã trở nên quá lớn, các tổ chức cần nhiều máy làm việc song song, thường trong nhiều ngày, để hoàn thành một chu trình đào tạo. Do đó, các nhà nghiên cứu đang khám phá các chiến lược tổng hợp trong mạng mới để cải thiện thời gian học tập. Kiến trúc Trio 6 phải hoàn hảo cho nhiệm vụ này và sẽ hoạt động tốt hơn các hệ thống được thiết kế cho luồng giao thông hai chiều truyền thống. Nhóm nghiên cứu của MIT đã quyết định đưa giả thuyết đó vào thử nghiệm.
Bộ ba thử nghiệm
Các nhà khoa học máy tính đã xây dựng hai thử nghiệm để mô phỏng các hoạt động ML rất nặng trong môi trường đám mây quy mô lớn. Một do Trio điều khiển và một do công tắc có thể lập trình Tofino—một nền tảng đã mang lại những cải tiến đáng kể về thời gian học tập so với các công tắc và máy chủ thông thường. Mục tiêu của nhóm là so sánh hiệu suất tổng hợp trong mạng và xác định xem Trio có thể giảm thời gian đạt độ chính xác trong khối lượng công việc đào tạo ML phân tán hay không. Cụ thể, họ muốn đánh giá khả năng của Trio trong việc tối ưu hóa các khối lượng công việc này ngay cả khi có sự hiện diện của "máy chủ rời rạc"—các máy chủ cụ thể trong một cụm hoạt động chậm hơn các máy chủ khác.
Trong các cụm được chia sẻ hoạt động trên nhiều công việc, các máy chủ khác nhau thường gặp phải tình trạng giật hiệu suất do tắc nghẽn, mất cân bằng tải, tranh chấp tài nguyên và các vấn đề khác. Do đó, các máy chủ đang thực hiện cùng một công việc phải đợi máy chậm nhất, làm giảm hiệu suất tổng thể của ứng dụng. “Sự cố chậm trễ” này có thể có tác động lớn đến hiệu suất của khối lượng công việc ML—cùng với nhiều ứng dụng phân tán khác, bao gồm MapReduce, Spark, truy vấn cơ sở dữ liệu và kho lưu trữ khóa-giá trị. Google trích dẫn các trình phân tách chậm là nguyên nhân chính dẫn đến hiệu suất kém trong các công việc xử lý dữ liệu và dữ liệu từ Facebook và Microsoft chỉ ra rằng chúng có thể khiến các công việc ML hoạt động chậm hơn tới 8 lần.
Để xem kiến trúc Trio có thể giải quyết vấn đề này tốt như thế nào, nhóm chung MIT-Juniper đã áp dụng ASIC để tổng hợp các trọng số đào tạo trong các công việc đào tạo ML phân tán nhằm phát hiện và giảm thiểu tác động của các yếu tố làm chậm hiệu suất. Kết quả: trong khi công tắc Tofino tiếp tục cần thêm thời gian để chờ những người đi chậm, hệ thống MX có thể giảm thiểu sự cố và duy trì thời gian đào tạo gần với mức lý tưởng. Trên thực tế, nhóm đã chỉ ra rằng đối với một số tập huấn luyện nhất định, Trio đã cải thiện thời gian hội tụ lên tới 1,8 lần.
Loại tăng tốc đó có thể có tác động đáng kể đến những gì các tổ chức có thể làm với ML và các khối lượng công việc phân tán khác ở biên. Điều quan trọng không kém: nhóm đã đạt được mức độ cải tiến đó đối với một ứng dụng không tồn tại khi chipset Trio được tạo ra—một minh chứng cho giá trị của mặt phẳng dữ liệu có thể lập trình.
Nhìn Về Phía Trước
Các trường hợp sử dụng tiềm năng cho các mạng hiệu suất cao với các mặt phẳng dữ liệu có thể lập trình là gần như vô hạn. Chỉ trong vài năm tới, chúng ta có thể mong đợi thấy các ứng dụng điện toán trong mạng tiên tiến hơn, phép đo từ xa thông minh hơn, khả năng phát hiện và giảm thiểu bất thường nhanh hơn, v.v. Juniper cam kết đảm bảo khách hàng của chúng tôi có thể tận dụng tối đa tiềm năng này.
Với khả năng cập nhật vi mã cho Trio 6, chúng tôi có thể liên tục thêm hỗ trợ cho các tính năng, giao thức và phần mở rộng giao thức mới—tất cả mà không yêu cầu khách hàng trao đổi phần cứng, như yêu cầu với các nhà cung cấp khác. Trên thực tế, chúng tôi đã làm điều này nhiều lần. Ví dụ: khi phát hiện định tuyến phân khúc và chuyển tiếp hai chiều xuất hiện, khách hàng của Juniper MX Series có thể triển khai các giao thức này trên phần cứng hiện tại của họ, thông qua các bản cập nhật phần mềm mà không bị phạt về hiệu suất.
Trong khi phần lớn ngành di chuyển theo hướng ngược lại—cung cấp ít tùy chọn kết nối mạng hơn, chung chung hơn—Juniper sẽ tiếp tục đầu tư vào silicon có thể liên tục thích ứng để đáp ứng các nhu cầu mới. Chúng tôi sẽ tiếp tục phát triển Trio ASIC và các hệ thống MX cũng như phần mềm để kích hoạt mặt phẳng dữ liệu có thể lập trình được với dung lượng cao hơn, hiệu quả hơn và hiệu suất cao hơn.
Kết luận
Với rất nhiều tiềm năng cho các ứng dụng biên đa dịch vụ mới và còn rất nhiều điều chưa biết, điều đó hoàn toàn hợp lý. Hơn nữa, chúng tôi rất nóng lòng muốn xem các nhà nghiên cứu, đối tác và khách hàng tham gia cùng chúng tôi trên hành trình này sẽ đưa mạng lưới của họ đi đâu tiếp theo.
CÔNG TY CỔ PHẦN DỊCH VỤ CÔNG NGHỆ DATECH
• Địa chỉ: Số 23E4 KĐT Cầu Diễn, Tổ 7, Phú Diễn, Bắc Từ Liêm, Hà Nội
• Điện thoại: 02432012368
• Hotline: 098 115 6699
• Email: info@datech.vn
• Website: https://datech.vn