المعايير المشتركة على بنية تحتية من وحدات المعالجة الرسومية (H100 10) على منصة (OCI) أظهرت زيادة 10 أضعاف في عدد المستخدمين المتزامنين ، وزيادة 10 أضعاف في معدل معالجة الرموز ، وزيادة 7 أضعاف في عدد الرموز التي يتم تقديمها دون إضافة وحدات معالجة رسومية
كامبل ، كاليفورنيا, 9 يونيو / حزيران 2026 /PRNewswire/ — أعلنت اليوم “ويكا” (WEKA)، شركة البنية التحتية للذاكرة وبيانات الذكاء الاصطناعي ، عن معايير على نطاق الإنتاج تُظهر كيف يمكن للمنظمات تحسين اقتصاديات استدلال الذكاء الاصطناعي للسياق طويل من خلال خدمة المزيد من المستخدمين والرموز على نفس بصمة وحدات المعالجة الرسومية. تُظهر المعايير أن منصة NeuralMesh التابعة لشركة “ويكا” مع تقنية Augmented Memory Grid™ على منصة خدمة بنية Oracle Cloud Infrastructure (OCI) تخدم 10 أضعاف عدد المستخدمين المتزامنين ، وتوفر سرعة مرور أعلى بمقدار 10 أضعاف ، وتنتج 7 أضعاف عدد الرموز لكل وحدة من وحدات المعالجة الرسومية مقارنةً بالتكوينات المعتمدة على ذاكرة DRAM فقط دون إضافة بنية تحتية. تم التحقق من صحة النتائج على مجموعة عنقودية من وحدات المعالجة الرسومية (H100) من تسع عقد على خادم مادي مخصص على منصة (OCI) مع نوافذ سياق بسعة 100,000 رمز.
قال “بابلو سليم”، كبير المديرين، قسم تطوير البرمجيات ، منصة Oracle Cloud Infrastructure: “إن أعباء العمل الذكية للشركات تدفع نوافذ السياق واستخدام وحدات المعالجة الرسومية إلى حدود جديدة”. “تُظهر هذه المعايير كيف تساعد منصة NeuralMesh من “ويكا” مع تقنية Augmented Memory Grid™ على منصة (OCI) في إزالة حواجز الذاكرة حتى يتمكن العملاء من دعم أعباء العمل الاستدلالية الأكبر حجمًا والأكثر تطلبًا دون إضافة المزيد من وحدات المعالجة الرسومية ببساطة”.
ثلاث نتائج تغير رياضيات الاستدلال
مع التحقق من صحة النتائج على نطاق الإنتاج على مجموعة عنقودية من وحدات المعالجة الرسومية (H100) على خادم مادي مخصص (تسع عقد ، 72 وحدة معالجة رسومية ، 100,000 نافذة سياق، آلاف المستخدمين المتزامنين) ، وفرت منصة NeuralMesh مع تقنية Augmented Memory Grid™ على منصة (OCI) النتائج التالية:
- زيادة 10 أضعاف في خدمة المستخدمين المتزامنين ، دون إضافة بنية تحتية. تمكنت منصة NeuralMesh مع تقنية Augmented Memory Grid™ من توسيع نطاق العمل لأكثر من 5000 مستخدم متزامن مقابل حوالي 600 مستخدم متزامن للتكوينات المعتمدة على ذاكرة DRAM فقط. هذا يزيل منحدر الفشل الذي يضرب سير العمل عند تشبع ذاكرة التخزين المؤقت عن طريق توسيع نطاق مجموعة عمل ذاكرة التخزين المؤقت النشطة من 8.64 تيرابايت من ذاكرة DRAM إلى 287 تيرابايت من بروتوكول NVMe القابل للاستخدام. بالإضافة إلى ذلك ، فإن خدمة المزيد من المستخدمين لكل وحدة من وحدات المعالجة الرسومية يعني توسيع نطاق الاستثمار نفسه.
- معالجة رموز أعلى 10 أضعاف. المزيد من المخرجات من كل وحدة من وحدات المعالجة الرسومية في المجموعة العنقودية. على منصة (OCI) ، وصلت منصة NeuralMesh مع تقنية Augmented Memory Grid™ إلى حوالي. مليوني رمز في الثانية ، مقارنةً بأقل من 200،000 رمز للخط الأساسي لذاكرة DRAM فقط. بالنسبة لفرق المنتجات التي تدير ميزات الذكاء الاصطناعي في الوقت الفعلي ، بما في ذلك البحث، والتلخيص، والمساعدة البرمجية، والوكلاء متعددي الأدوار، تحدد إنتاجية المعالجة السقف لعدد المستخدمين الذين يمكن خدمتهم ، وسرعة استجابة الميزات ، ومقدار الإيرادات التي يمكن للبنية التحتية دعمها.
- تقديم زيادة في الرموز 7 أضعاف. تكلفة أقل لكل رمز على نطاق واسع. وفرت منصة NeuralMesh مع تقنية Augmented Memory Grid™ خمسة مليارات رمز ، مقارنةً بـ 700 مليون رمز للخط الأساسي لذاكرة DRAM فقط ، في اختبار واحد لمدة ساعة واحدة ، مع 2400 مستخدم. بالنسبة للمنظمات التي تعمل على تدفقات العمل الوكيلة، يستنزف تشبع ذاكرة DRAM سعة وحدات المعالجة الرسومية بهدوء من خلال إعادة الحساب المستمرة ، مما يؤدي إلى تأثير مباشر على التكلفة لكل رمز وعلى العائد على الاستثمار.
قال “لييران زفايبل”، الرئيس التنفيذي لشركة “ويكا”: “يحدث الاختناق في الاستدلال من خلال نسبة الذاكرة الفعالة المتاحة لوحدات المعالجة الرسومية”. “تثبت هذه النتائج أن اقتصاديات الرموز للذكاء الاصطناعي لا يتم حلها بواسطة الأجهزة وحدها ؛ بل يتم حلها عن طريق القضاء على جدار الذاكرة الذي كان السقف الحقيقي لما يمكن أن تفعله الأجهزة الحالية. منصة NeuralMesh مع تقنية Augmented Memory Grid™ التي تعمل على منصة (OCI) تجلب أوامر كبيرة الحجم من الرموز للعملاء بطريقة فعالة للغاية من حيث التكلفة.”
تحويل اقتصادات الذكاء الاصطناعي باستخدام بنية تحتية للذاكرة السياقية
مع نمو الطلب على الاستدلال ، تتضاعف نسب عدم كفاءة البنية التحتية للذكاء الاصطناعي. كل عملية إخلاء لذاكرة التخزين المؤقت ذات قيمة رئيسية هي ضريبة؛ وذلك على دورات وحدات المعالجة الرسومية ، والتأخير ، وتجربة المستخدم ، وتكلفة كل رمز يتم تقديمه. بالنسبة لأحمال العمل ذات السياق الطويل وأحمال العمل الوكيلة، حيث يتم تشغيل المدخلات بشكل روتيني على 100000 رمز أو أكثر ، فإن هذه الضريبة ليست خطأ في التقريب. إنها ضربة مباشرة على اقتصادات الوحدات لكل منظمة تعمل في الإنتاج الذكي.
تعمل تقنية Augmented Memory Grid™، وهي إمكانية متوفرة على منصة NeuralMesh ، على حل المشكلة على مستوى البنية من خلال فصل ذاكرة التخزين المؤقت ذات القيمة الرئيسية من ذاكرة وحدات المعالجة الرسومية المحلية وتخزينها في مستودع رموز عالي الأداء يمكن الوصول إليه عبر المجموعة العنقودية. يمكن لأي مضيف أن يخدم أي جلسة مع المحافظة على مستوى حالات الوصول إلى ذاكرة التخزين المؤقت، مما يزيل الصلابة الصارمة للجلسة مع توفير أداء متفوق لذاكرة DRAM ، وتحسين توازن الحمولة ، وتمكين التوسع الأفقي النظيف مع نمو التزامن. والنتيجة هي ذاكرة سياقية مستمرة لوكلاء الذكاء الاصطناعي ورافعة تكلفة تجعل استدلال السياق الطويل اقتصاديًا للتشغيل على نطاق واسع.
إثبات على مستوى الإنتاج
نشرت منصة (OCI) منهجية المعايير الكاملة، وتكوين النظام، والنتائج على مدونة الذكاء الاصطناعي وعلوم البيانات في 13 مايو 2026. تتجاوز المعايير ، التي تم تنفيذها على مجموعة عنقودية من وحدات المعالجة الرسومية (H100) من تسع عقد على خادم مادي مخصص على منصة (OCI)، المرحلة السابقة من التحقق من الصحة ، والتي أظهرت قدرة التخزين المؤقت ذات القيمة الرئيسية زيادة 1000 أضعاف ووقت أسرع بنسبة 20 ضعفًا إلى أول رمز عند 128000 رمز. تختبر هذه المرحلة الأخيرة الاقتصادات الكاملة للاستدلال في الإنتاج؛ من حيث كثافة التزامن ، والإنتاجية المستدامة ، واستمرارية التخزين المؤقت ، واستقرار “هدف مستوى الخدمة” عندما يرتفع الطلب تحت حمل عالٍ.
متوفرة على متجر Oracle Marketplace
تتوفر منصة NeuralMesh مع تقنية Augmented Memory Grid™ بشكل عام لعملاء “ويكا” وعلى متجر Oracle Marketplace ، مع منصة (OCI) كشريك إطلاق الخدمات السحابية الحصري لشركة “ويكا”. يمكن للمنظمات التي تعمل على استدلال للسياق الطويل على منصة (OCI) نشر بنية معتمدة جاهزة للإنتاج اليوم. لمزيد من المعلومات حول معيار منصة (OCI) وتقنية Augmented Memory Grid™، يمكن الاطلاع على مدونة منصة (OCI): https://blogs.oracle.com/ai-and-datascience/scaling-long-context-inference-on-oci-with-wekas-augmented-memory-grid.
نبذة عن WEKA
“ويكا” هي شركة البنية التحتية للذاكرة وبيانات الذكاء الاصطناعي التي تُحدث ثورة في اقتصاديات الذكاء الاصطناعي الوكيل. توحّد منصة NeuralMesh™ الخاصة بها إمكانيات تخزين البيانات عالية الأداء مع ذاكرة وحدات المعالجة الرسومية الموسعة ، مما يمنح الشركات، ومزودي الخدمات السحابية للذكاء الاصطناعي، وبناة الذكاء الاصطناعي أساسًا واحدًا للتدريب، والاستدلال، وأحمال عمل الوكلاء. مع تقنية Augmented Memory Grid™، تقوم منصة NeuralMesh بتوسيع نطاق سعة ذاكرة وحدات المعالجة الرسومية بمقدار 1000 ضعفًا ، وتسريع الوقت إلى أول رمز بما يصل إلى 20 ضعفًا ، وتوفر زيادة 10 أضعاف في عدد المستخدمين المتزامنين من نفس بصمة وحدات المعالجة الرسومية ، والذي تم إثباته في مؤشرات الإنتاج. تمكِّن “ويكا”، التي تحظى بثقة 30٪ من الشركات المدرجة ضمن قائمة (Fortune 50)، المنظمات من توسيع نطاق الذكاء الاصطناعي بشكل أسرع ، وتحسين استخدام وحدات المعالجة الرسومية ، وتقليل تكلفة كل رمز يتم تقديمه. يمكنكم التعرف على المزيد على موقع الويب www.weka.io أو التواصل معنا عبر لينكد إن وإكس (تويتر).
WEKA وشعار W هما علامتان تجاريتان مسجلتان لشركة WekaIO, Inc. وقد تكون الأسماء التجارية الأخرى المستخدمة هنا علامات تجارية خاصةً بأصحابها.
View original content to download multimedia:https://www.prnewswire.com/ae/ar/news-releases/u0077u0065u006Bu0061u002Du0648u002Du006Fu0072u0061u0063u006Cu0065u002Du0063u006Cu006Fu0075u0064u002Du0069u006Eu0066u0072u0061u0073u0074u0072-302794903.html
