اهو چيو ويو آهي ته ٽيڪنالاجي ڪمپنيون يا ته GPUs لاءِ ڇڪي رهيون آهن يا انهن کي حاصل ڪرڻ جي رستي تي. اپريل ۾، ٽسلا سي اي او ايلون مسڪ 10,000 GPUs خريد ڪيو ۽ چيو ته ڪمپني NVIDIA کان وڏي مقدار ۾ GPUs خريد ڪندي. انٽرپرائز جي پاسي، آئي ٽي اهلڪار پڻ زور ڏئي رهيا آهن انهي کي يقيني بڻائڻ لاءِ ته GPUs مسلسل استعمال ڪيا ويندا آهن سيڙپڪاري تي واپسي کي وڌائڻ لاءِ. بهرحال، ڪجهه ڪمپنيون شايد اهو ڳولي سگھن ٿيون جڏهن ته GPU جو تعداد وڌي ٿو، GPU جي بيڪاري وڌيڪ سخت ٿي ويندي آهي.
جيڪڏهن تاريخ اسان کي اعلي ڪارڪردگي ڪمپيوٽنگ (HPC) بابت ڪجهه سيکاريو آهي، اهو آهي ته اسٽوريج ۽ نيٽ ورڪنگ کي قربان نه ڪيو وڃي حساب تي تمام گهڻو ڌيان ڏيڻ جي خرچ تي. جيڪڏهن اسٽوريج ڊيٽا کي ڪمپيوٽنگ يونٽن ڏانهن موثر طريقي سان منتقل نه ڪري سگهي، جيتوڻيڪ توهان وٽ دنيا ۾ سڀ کان وڌيڪ GPUs آهن، توهان کي بهتر ڪارڪردگي حاصل نه ٿيندي.
مائڪ ميچيٽ جي مطابق، سمال ورلڊ بگ ڊيٽا جي هڪ تجزيه نگار، ننڍڙا ماڊل ميموري (ريم) ۾ ڪم ڪري سگهجن ٿا، جنهن سان حسابن تي وڌيڪ ڌيان ڏنو وڃي. جڏهن ته، وڏن ماڊلز جهڙوڪ ChatGPT بلين نوڊس سان ميموري ۾ محفوظ نه ٿي ڪري سگھجي ڇاڪاڻ ته وڏي قيمت جي ڪري.
"توهان ميموري ۾ اربين نوڊس کي مناسب نه ٿا ڪري سگهو، تنهنڪري اسٽوريج اڃا به وڌيڪ اهم ٿي ويندو آهي،" ميچٽ چوي ٿو. بدقسمتي سان، ڊيٽا اسٽوريج اڪثر ڪري پلاننگ جي عمل دوران نظر انداز ڪيو ويندو آهي.
عام طور تي، استعمال جي صورت کان سواء، ماڊل ٽريننگ جي عمل ۾ چار عام نقطا آهن:
1. ماڊل ٽريننگ
2. انفرنس ايپليڪيشن
3. ڊيٽا اسٽوريج
4. تيز ڪمپيوٽنگ
جڏهن ماڊل ٺاهڻ ۽ ترتيب ڏيڻ، گهڻيون گهرجون تڪڙي ثبوت جي تصور (POC) کي ترجيح ڏين ٿيون يا ماڊل ٽريننگ شروع ڪرڻ لاءِ ماحول جي جانچ ڪن ٿيون، ڊيٽا اسٽوريج جي ضرورتن سان گڏ مٿي ڌيان نه ڏنو ويو آهي.
بهرحال، چيلنج ان حقيقت ۾ آهي ته ٽريننگ يا انفرنس جي تعیناتي مهينن يا ان کان به سالن تائين رهي سگهي ٿي. ڪيتريون ئي ڪمپنيون تيزيء سان انهن جي ماڊل جي سائيز کي تيزيء سان ماپ ڪري رهيا آهن هن وقت دوران، ۽ انفراسٹرڪچر کي وڌائڻ گهرجي ته وڌندڙ ماڊل ۽ ڊيٽا سيٽ کي ترتيب ڏيڻ لاء.
گوگل کان لکين ايم ايل ٽريننگ ڪم لوڊ تي تحقيق ظاهر ڪري ٿي ته تربيتي وقت جو سراسري 30٪ ان پٽ ڊيٽا پائپ لائن تي خرچ ڪيو ويندو آهي. جڏهن ته ماضي جي تحقيق تي ڌيان ڏنو ويو آهي GPUs کي بهتر ڪرڻ لاءِ ٽريننگ کي تيز ڪرڻ لاءِ ، ڪيترائي چئلينج اڃا تائين ڊيٽا پائپ لائن جي مختلف حصن کي بهتر ڪرڻ ۾ رهن ٿا. جڏهن توهان وٽ اهم ڪمپيوٽيشنل طاقت آهي، حقيقي رڪاوٽ بڻجي وڃي ٿي ته توهان نتيجا حاصل ڪرڻ لاءِ ڪمپيوٽرن ۾ ڊيٽا کي ڪيترو جلدي فيڊ ڪري سگهو ٿا.
خاص طور تي، ڊيٽا اسٽوريج ۽ انتظام ۾ چيلنجز ڊيٽا جي ترقي جي منصوبابندي جي ضرورت هونديون آهن، توهان کي ڊيٽا جي قيمت کي مسلسل ڪڍڻ جي اجازت ڏئي ٿي جيئن توهان ترقي ڪري رهيا آهيو، خاص طور تي جڏهن توهان وڌيڪ ترقي يافته استعمال جي ڪيسن جهڙوڪ ڊيپ لرننگ ۽ نيورل نيٽ ورڪ، جيڪي اعلي مطالبن تي رکيا آهن. ظرفيت، ڪارڪردگي، ۽ اسپيبلٽي جي لحاظ کان اسٽوريج.
خاص طور تي:
اسڪاليبلٽي
مشين لرننگ کي ڊيٽا جي وڏي مقدار کي سنڀالڻ جي ضرورت آهي، ۽ جيئن ڊيٽا جي مقدار ۾ اضافو ٿئي ٿو، ماڊل جي درستگي پڻ بهتر ٿي. ان جو مطلب اهو آهي ته ڪاروبار کي هر روز وڌيڪ ڊيٽا گڏ ڪرڻ ۽ ذخيرو ڪرڻ گهرجي. جڏهن اسٽوريج پيماني تي نه ٿي سگهي، ڊيٽا-گھڻي ڪم لوڊ رڪاوٽون پيدا ڪري ٿي، ڪارڪردگي کي محدود ڪري ٿو ۽ نتيجي ۾ قيمتي GPU بيڪار وقت.
لچڪدار
گھڻن پروٽوڪول لاء لچڪدار سپورٽ (بشمول NFS، SMB، HTTP، FTP، HDFS، ۽ S3) مختلف سسٽم جي ضرورتن کي پورو ڪرڻ لاء ضروري آھي، بلڪه ھڪڙي قسم جي ماحول تائين محدود ٿيڻ جي.
دير
I/O ليٽيسي ماڊل ٺاهڻ ۽ استعمال ڪرڻ لاءِ نازڪ آهي جيئن ڊيٽا کي ڪيترائي ڀيرا پڙهيو ۽ ٻيهر پڙهيو وڃي. I/O جي ويڪرائي کي گھٽائڻ سان ماڊلز جي ٽريننگ جو وقت گھٽجي سگھي ٿو ڏينھن يا مھينن تائين. تيز ماڊل ڊولپمينٽ سڌو سنئون وڌيڪ ڪاروباري فائدن ڏانهن ترجمو ڪري ٿو.
ذريعي
اسٽوريج سسٽم جو طريقو موثر ماڊل ٽريننگ لاءِ اهم آهي. تربيتي عملن ۾ ڊيٽا جي وڏي مقدار شامل آهي، عام طور تي في ڪلاڪ ٽيرا بائيٽس ۾.
متوازي رسائي
اعليٰ ذريعي حاصل ڪرڻ لاءِ، تربيتي ماڊل سرگرمين کي ڪيترن ئي متوازي ڪمن ۾ ورهائيندا آهن. هن جو مطلب اڪثر اهو آهي ته مشين لرننگ الگورٿمس ساڳئي فائلن تائين رسائي ڪيترن ئي عملن کان (ممڪن طور تي ڪيترن ئي جسماني سرورن تي) هڪ ئي وقت ۾. اسٽوريج سسٽم کي ڪارڪردگي سان سمجهوتو ڪرڻ کان سواء سمورو مطالبن کي سنڀالڻ گهرجي.
ان جي شاندار صلاحيتن سان گھٽ ويڪرائي، اعليٰ ذريعي، ۽ وڏي پيماني تي متوازي I/O ۾، ڊيل پاور اسڪيل هڪ مثالي اسٽوريج مڪمل ڪرڻ آهي GPU-تيز رفتار ڪمپيوٽنگ لاءِ. PowerScale مؤثر طريقي سان گھٽائي ٿو وقت گھٽائي ٿو گھربل تجزيو ماڊلز لاءِ جيڪي ٽريننگ ۽ ٽيسٽ ملٽي ٽيرا بائيٽ ڊيٽاسٽس. پاور اسڪيل آل فليش اسٽوريج ۾، بينڊوڊٿ 18 ڀيرا وڌي ٿي، I/O رڪاوٽن کي ختم ڪندي، ۽ موجوده Isilon ڪلسٽرز ۾ شامل ڪري سگھجي ٿي ته جيئن وڏي مقدار ۾ غير منظم ٿيل ڊيٽا جي قدر کي تيز ڪرڻ ۽ ان لاڪ ڪرڻ لاءِ.
ان کان علاوه، PowerScale جي ملٽي پروٽوڪول رسائي صلاحيتون ڪم لوڊ هلائڻ لاءِ لامحدود لچڪ فراهم ڪن ٿيون، ڊيٽا کي هڪ پروٽوڪول استعمال ڪندي ذخيرو ڪرڻ جي اجازت ڏئي ٿي ۽ ٻئي کي استعمال ڪندي رسائي حاصل ڪري ٿي. خاص طور تي، پاور اسڪيل پليٽ فارم جي طاقتور خاصيتون، لچڪدار، اسڪيليبلٽي، ۽ انٽرنيشنل-گريڊ ڪارڪردگي هيٺ ڏنل چئلينج کي منهن ڏيڻ ۾ مدد ڪن ٿا:
- جدت کي تيز ڪريو 2.7 ڀيرا تائين، ماڊل ٽريننگ چڪر کي گھٽائڻ.
- I/O جي رڪاوٽن کي ختم ڪريو ۽ تيز ماڊل ٽريننگ ۽ تصديق فراهم ڪريو، ماڊل جي درستگي، بهتر ڪيل ڊيٽا سائنس جي پيداوار، ۽ ڪمپيوٽنگ سيڙپڪاري تي وڌ کان وڌ واپسي انٽرپرائز-گريڊ فيچرز، اعليٰ ڪارڪردگي، اتفاق، ۽ اسڪاليبلٽي کي استعمال ڪندي. ھڪڙي ھڪڙي ڪلستر ۾ 119 PB تائين موثر اسٽوريج جي گنجائش کي استعمال ڪندي وڌيڪ گہرے، اعلي ريزوليوشن ڊيٽا سيٽن سان ماڊل جي درستگي کي وڌايو.
- ننڍي ۽ آزاديءَ سان ڪمپيوٽنگ ۽ اسٽوريج جي اسڪيلنگ شروع ڪندي، مضبوط ڊيٽا جي تحفظ ۽ حفاظتي آپشنز کي پهچائڻ سان پيماني تي مقرري حاصل ڪريو.
- ڊيٽا سائنس جي پيداوار کي بهتر ڪريو جڳهه اينالائيٽڪس سان گڏ ۽ تيز، گهٽ خطري جي ترتيبن لاءِ اڳ-تصديق ٿيل حل.
- بهترين نسل جي ٽيڪنالاجيز جي بنياد تي ثابت ٿيل ڊيزائن کي استعمال ڪندي، بشمول NVIDIA GPU تيز رفتار ۽ حوالو آرڪيٽيڪچر NVIDIA DGX سسٽم سان. پاور اسڪيل جي اعليٰ ڪارڪردگي ۽ هم وقت سازي مشين لرننگ جي هر مرحلي تي اسٽوريج ڪارڪردگي جي گهرج پوري ڪري ٿي، ڊيٽا جي حصول ۽ تياري کان وٺي ماڊل ٽريننگ ۽ انفرنس تائين. OneFS آپريٽنگ سسٽم سان گڏ، سڀئي نوڊس هڪ ئي OneFS-هلائيندڙ ڪلستر جي اندر بغير ڪم ڪري سگهن ٿا، انٽرپرائز-سطح جي خاصيتن سان گڏ جيئن ته ڪارڪردگي جو انتظام، ڊيٽا مينيجمينٽ، سيڪيورٽي، ۽ ڊيٽا تحفظ، ماڊل ٽريننگ جي تيزيءَ سان مڪمل ڪرڻ ۽ ڪاروبار لاءِ توثيق ڪرڻ.
پوسٽ جو وقت: جولاء-03-2023