نماد اعتماد
در این جادر مورد بسیاری از پردازنده های گرافیکی که ممکن هست در طول زمان کاری خود با ان روبرو شوید صبحت خواهیم کرد و خواهیم گفت چرا پردازنده های گرافیکی مهم هستند.
آموزش یادگیری عمیق عموماً به محاسبات زیادی نیاز دارد. در حال حاضر پردازندههای گرافیکی مقرونبهصرفهترین شتابدهندههای سختافزاری برای یادگیری عمیق هستند. به طور خاص، در مقایسه با پردازندههای مرکزی، پردازندههای گرافیکی ارزانتر هستند و عملکرد بالاتری را ارائه میدهند، که اغلب با یک مرتبه بزرگی بیشتر است. علاوه بر این، یک سرور منفرد میتواند از چندین GPU پشتیبانی کند، تا 8 تا برای سرورهای پیشرفته.
اعداد معمولی تر تا 4 GPU برای یک ایستگاه کاری مهندسی هستند، زیرا نیاز به گرما، سرمایش و برق به سرعت فراتر از آنچه یک ساختمان اداری می تواند پشتیبانی کند افزایش می یابد. برای استقرارهای بزرگتر، رایانش ابری (به عنوان مثال، نمونه های P3 و G4 آمازون) راه حل بسیار عملی تری است.
معمولاً نیازی به خرید CPU های سطح بالا با رشته های زیاد نیست زیرا بیشتر محاسبات روی GPU ها انجام می شود. با توجه به قفل مفسر جهانی (GIL) در پایتون، عملکرد تک رشتهای یک CPU میتواند در شرایطی که 4 تا 8 GPU داریم مهم باشد. همه چیز برابر این نشان می دهد که CPU هایی با تعداد هسته کمتر اما فرکانس کلاک بالاتر ممکن است انتخاب اقتصادی تری باشد.
به عنوان مثال، هنگام انتخاب بین یک CPU 6 هسته ای 4 گیگاهرتزی و یک پردازنده 8 هسته ای 3.5 گیگاهرتزی، اولی بسیار ارجح است، حتی اگر سرعت کل آن کمتر باشد. یک نکته مهم این است که GPU ها انرژی زیادی مصرف می کنند و در نتیجه گرمای زیادی را دفع می کنند. این نیاز به خنک کننده بسیار خوب و یک شاسی به اندازه کافی بزرگ برای استفاده از GPU دارد. در صورت امکان دستورالعمل های زیر را دنبال کنید:
منبع تغذیه. پردازندههای گرافیکی مقدار قابل توجهی انرژی مصرف میکنند. بودجه با حداکثر 350 وات برای هر دستگاه (به جای تقاضای معمولی، اوج تقاضای کارت گرافیک را بررسی کنید، زیرا کد کارآمد می تواند انرژی زیادی مصرف کند). اگر منبع تغذیه شما مطابق با تقاضا نباشد، متوجه خواهید شد که سیستم شما ناپایدار می شود.
اندازه شاسی. پردازندههای گرافیکی بزرگ هستند و کانکتورهای برق کمکی اغلب به فضای اضافی نیاز دارند. همچنین شاسی های بزرگ راحت تر خنک می شوند.
خنک کننده GPU. اگر تعداد پردازنده های گرافیکی زیادی دارید، ممکن است بخواهید روی خنک کننده آبی سرمایه گذاری کنید. همچنین، طراحیهای مرجع را هدف قرار دهید، حتی اگر فنهای کمتری داشته باشند، زیرا به اندازه کافی نازک هستند که اجازه ورود هوا بین دستگاهها را میدهند. اگر یک پردازنده گرافیکی چند فن بخرید، ممکن است در هنگام نصب چندین پردازنده گرافیکی برای دریافت هوای کافی ضخیم تر از آن باشد و با دریچه گاز حرارتی مواجه شوید.
مبتدی. یک پردازنده گرافیکی ارزان قیمت با مصرف انرژی پایین بخرید (GPU های ارزان قیمت بازی مناسب برای یادگیری عمیق از 150 تا 200 وات). اگر خوش شانس هستید رایانه فعلی شما از آن پشتیبانی می کند.
1 GPU. یک CPU پایین رده با 4 هسته کافی خواهد بود و اکثر مادربردها کافی هستند. حداقل 32 گیگابایت DRAM را هدف قرار دهید و برای دسترسی به داده های محلی روی یک SSD سرمایه گذاری کنید. یک منبع تغذیه با 600 وات باید کافی باشد. یک پردازنده گرافیکی با طرفداران زیاد بخرید.
2 پردازنده گرافیکی یک CPU پایین رده با 4-6 هسته کافی است. 64 گیگابایت DRAM را در نظر بگیرید و روی یک SSD سرمایه گذاری کنید. برای دو پردازنده گرافیکی سطح بالا به 1000 وات نیاز دارید. در مورد مین بردها، مطمئن شوید که دارای دو اسلات PCIe 3.0 x16 هستند. اگر می توانید، یک مین برد با دو فضای خالی (فاصله 60 میلی متر) بین اسلات PCIe 3.0 x16 برای هوای اضافی تهیه کنید. در این صورت، دو پردازنده گرافیکی با طرفداران زیاد خریداری کنید.
4 پردازنده گرافیکی مطمئن شوید که یک CPU با سرعت تک رشته ای نسبتاً سریع (یعنی فرکانس کلاک بالا) خریداری می کنید. احتمالاً به یک CPU با تعداد بیشتری از خطوط PCIe مانند AMD Threadripper نیاز خواهید داشت. احتمالاً برای دریافت 4 اسلات PCIe 3.0 x16 به مادربردهای نسبتاً گران قیمت نیاز خواهید داشت زیرا آنها احتمالاً به یک PLX برای مالتیپلکس کردن خطوط PCIe نیاز دارند. پردازندههای گرافیکی با طراحی مرجع خریداری کنید که باریک هستند و اجازه میدهند هوا بین پردازندههای گرافیکی وارد شود.
شما به یک منبع تغذیه 1600-2000 وات نیاز دارید و ممکن است پریز در دفتر شما از آن پشتیبانی نکند. این سرور احتمالا با صدای بلند و داغ اجرا خواهد شد. شما نمی خواهید آن را زیر میز خود قرار دهید. 128 گیگابایت DRAM توصیه می شود. یک SSD (1-2 ترابایت NVMe) برای ذخیره سازی محلی و یک دسته هارد دیسک در پیکربندی RAID برای ذخیره داده های خود دریافت کنید.
8 پردازنده گرافیکی شما باید یک شاسی سرور اختصاصی چند GPU با چندین منبع تغذیه اضافی بخرید (به عنوان مثال، 2+1 برای 1600 وات در هر منبع تغذیه). این به پردازندههای سرور دو سوکت، 256 گیگابایت DRAM ECC، یک کارت شبکه سریع (10 GBE توصیه میشود) نیاز دارد و باید بررسی کنید که آیا سرورها از فاکتور فرم فیزیکی پردازندههای گرافیکی پشتیبانی میکنند یا خیر. جریان هوا و محل سیمکشی بین پردازندههای گرافیکی مصرفکننده و سرور بهطور قابلتوجهی متفاوت است (به عنوان مثال، RTX 2080 در مقابل Tesla V100). این بدان معناست که ممکن است نتوانید GPU مصرف کننده را در یک سرور به دلیل فاصله کافی برای کابل برق یا نداشتن دسته سیم مناسب (همانطور که یکی از نویسندگان همکار به طرز دردناکی کشف کرد) نصب کنید.
در حال حاضر AMD و NVIDIA دو سازنده اصلی پردازندههای گرافیکی اختصاصی هستند. NVIDIA اولین شرکتی بود که وارد حوزه یادگیری عمیق شد و از طریق CUDA پشتیبانی بهتری از چارچوب های یادگیری عمیق ارائه کرد. بنابراین، اکثر خریداران پردازنده های گرافیکی NVIDIA را انتخاب می کنند.
NVIDIA دو نوع GPU را ارائه میکند که کاربران فردی (به عنوان مثال، از طریق سری GTX و RTX) و کاربران سازمانی (از طریق سری Tesla خود) را هدف قرار میدهد. دو نوع GPU قدرت محاسباتی قابل مقایسه ای را ارائه می دهند. با این حال، GPUهای کاربر سازمانی معمولاً از خنک کننده اجباری (غیرفعال)، حافظه بیشتر و حافظه ECC (تصحیح خطا) استفاده می کنند. این پردازندههای گرافیکی برای مراکز داده مناسبتر هستند و معمولاً ده برابر بیشتر از پردازندههای گرافیکی مصرفکننده قیمت دارند.
اگر یک شرکت بزرگ با بیش از 100 سرور هستید، باید سری NVIDIA Tesla را در نظر بگیرید یا از سرورهای GPU در فضای ابری استفاده کنید. برای یک آزمایشگاه یا یک شرکت کوچک و متوسط با بیش از 10 سرور، سری NVIDIA RTX احتمالاً مقرون به صرفه ترین است. میتوانید سرورهای از پیش پیکربندیشده با شاسی سوپرمیکرو یا ایسوس بخرید که 4 تا 8 پردازنده گرافیکی را بهطور کارآمد نگه میدارند.
فروشندگان پردازنده گرافیکی معمولاً هر یک تا دو سال یک بار نسل جدیدی را عرضه می کنند، مانند سری GTX 1000 (پاسکال) که در سال 2017 منتشر شد و سری RTX 2000 (تورینگ) که در سال 2019 منتشر شد. هر سری چندین مدل مختلف ارائه می دهد که سطوح عملکرد متفاوتی را ارائه می دهند. عملکرد GPU در درجه اول ترکیبی از سه پارامتر زیر است:
توان محاسباتی به طور کلی ما به دنبال قدرت محاسباتی 32 بیتی ممیز شناور هستیم. آموزش ممیز شناور 16 بیتی (FP16) نیز در حال ورود به جریان اصلی است. اگر فقط به پیش بینی علاقه دارید، می توانید از عدد صحیح 8 بیتی نیز استفاده کنید. آخرین نسل از پردازنده های گرافیکی تورینگ شتاب 4 بیتی را ارائه می دهد. متأسفانه در زمان نگارش الگوریتمهای آموزش شبکههای با دقت پایین هنوز فراگیر نشدهاند.
اندازه حافظه همانطور که مدل های شما بزرگتر می شوند یا دسته های استفاده شده در طول آموزش بزرگتر می شوند، به حافظه GPU بیشتری نیاز خواهید داشت. حافظه HBM2 (حافظه با پهنای باند بالا) در مقابل حافظه GDDR6 (Graphics DDR) را بررسی کنید. HBM2 سریعتر اما بسیار گرانتر است.
پهنای باند حافظه. تنها زمانی می توانید بیشترین بهره را از توان محاسباتی خود ببرید که پهنای باند حافظه کافی داشته باشید. اگر از GDDR6 استفاده می کنید، به دنبال گذرگاه های حافظه گسترده باشید.
برای اکثر کاربران کافی است به توان محاسباتی نگاهی بیندازید. توجه داشته باشید که بسیاری از GPU ها انواع مختلفی از شتاب را ارائه می دهند. برای مثال، TensorCores های NVIDIA زیرمجموعه ای از اپراتورها را 5 شتاب می دهند
. اطمینان حاصل کنید که کتابخانه های شما از این پشتیبانی می کنند. حافظه GPU نباید کمتر از 4 گیگابایت باشد (8 گیگابایت بسیار بهتر است). سعی کنید از GPU برای نمایش رابط کاربری گرافیکی نیز استفاده نکنید (به جای آن از گرافیک داخلی استفاده کنید). اگر نمی توانید از آن اجتناب کنید، برای ایمنی 2 گیگابایت رم اضافی اضافه کنید.
شکل 23.5.1 قدرت محاسبه ممیز شناور 32 بیتی و قیمت مدل های مختلف سری GTX 900، GTX 1000 و RTX 2000 را مقایسه می کند. قیمتهای پیشنهادی همان قیمتهایی هستند که در زمان نگارش مقاله در ویکیپدیا یافت میشوند.
برای خرید سرور hp اینجا کلیک کنید.