

بررسی سلامت سرور استوک (بهویژه سرورهای HP) پیش از خرید یا هنگام راهاندازی مجدد در محیط کاری، یک اقدام بسیار ضروری و هوشمندانه است. چون سرورها استوک هستند و قبلاً در محیطهای دیتاسنتری یا سازمانی کار کردهاند، باید حتماً از نظر سختافزاری، نرمافزاری و لاگهای سیستم بررسی شوند. در این مقاله توضیح میدهم که چگونه مرحلهبهمرحله سلامت یک سرور استوک را بررسی کنید:
مرحله ۱: بررسی فیزیکی و ظاهری سرور
بررسی بدنه فیزیکی:
مطمئن شوید که شاسی، اسلاتها، پنلها، پورتها و فنها سالم هستند، آثار ضربه یا خوردگی نداشته باشند.
فنها و پاورها:
همه فنها باید بهدرستی بچرخند و نویز غیرعادی نداشته باشند. پاورها (PSU) نیز باید بدون هشدار یا نقص روشن شوند.
پورتهای I/O:
تمام پورتهای USB، VGA، کارت شبکه، و اسلاتهای PCIe را چک کنید که کار میکنند.
مرحله ۲: تست سختافزار با ابزارهای HPE
1. استفاده از Intelligent Provisioning (F10)
با روشن کردن سرور HP، با زدن کلید F10 وارد محیط Intelligent Provisioning شوید:
Insight Diagnostics: ابزاری از HP برای بررسی کامل قطعات مانند RAM، CPU، هارد، RAID Controller و فنها.
Smart Storage Administrator (SSA): برای بررسی وضعیت هاردها، RAID و سلامت کنترلرها.
2. استفاده از HPE iLO (Integrated Lights-Out):
اگر سرور دارای iLO است (اکثر سرورهای نسل 8 به بعد دارند):
با آیپی iLO وارد پنل شوید.
وضعیت سلامت سرور، دمای قطعات، خطاهای فن یا پاور و لاگهای سیستم را ببینید.
از طریق iLO میتوانید سیستم را ریموت ریاستارت کنید یا حتی ISO بوت کنید.
مرحله ۳: بررسی لاگها و سیستمعامل
System Event Log (SEL):
داخل iLO یا BIOS، بخش لاگ را بررسی کنید. اگر پیغامهایی مانند Thermal Error, Memory ECC Error, Drive Failure دیدید، باید دقیقتر بررسی شود.
Event Viewer در ویندوز یا dmesg در لینوکس:
اگر سیستمعامل نصب شده است، لاگهای داخلی سیستم را برای خطاهای سختافزاری بررسی کنید.
بررسی وضعیت RAID و هاردها:
از نرمافزار HP Smart Storage Administrator یا RAID BIOS Utility استفاده کنید تا ببینید هاردها سالم، در حال rebuild یا degraded هستند.
مرحله ۴: تست عملکرد پردازنده و رم
از ابزارهای استاندارد تست سختافزاری میتوانید استفاده کنید:
MemTest86+ برای تست رم (قابل بوت از فلش)
Prime95 یا AIDA64 برای تست پردازنده و دما در ویندوز
Stress-ng یا Sysbench برای لینوکس
مرحله ۵: بررسی فریمور و آپدیتها
با نرمافزار HPE SUM (Smart Update Manager) یا HPE SPP:
BIOS، iLO، RAID Controller و NICها را بررسی و در صورت نیاز آپدیت کنید.
آپدیت فریمورها میتواند باعث رفع باگهای سختافزاری یا افزایش پایداری شود.
مرحله ۶: استفاده از ابزارهای سومشخص (Third-Party)
برای بررسی سلامت هارد یا دما و قطعات:
CrystalDiskInfo یا Hard Disk Sentinel برای هارد SATA/SSD
HWMonitor یا Speccy برای نمایش دمای قطعات
Open Hardware Monitor برای نظارت در ویندوز
خلاصهسازی
مورد بررسی ابزار پیشنهادی
سلامت فیزیکی بازدید چشمی + تست فن و پاور
تست سختافزار HPE Insight Diagnostics + iLO
سلامت هارد و RAID HP SSA + CrystalDiskInfo
لاگهای سیستم iLO Logs + Event Viewer + dmesg
دمای سیستم HWMonitor / iLO
فریمور HPE SUM یا SPP Bootable ISO
اگر قصد خرید سرور استوک دارید یا همین حالا یکی خریدید، این بررسیها میتونن کمک کنن تا مطمئن بشید سیستم بدون نقص آماده بهکار است.
برای بررسی سلامت سختافزار سرور استوک، باید ترکیبی از تستهای سختافزاری دقیق و بررسی لاگهای سیستمی را انجام دهید. این فرآیند به شما کمک میکند تا از خرابیهای پنهان، قطعات فرسوده یا مشکلات پنهانی جلوگیری کنید. در ادامه، یک راهنمای کامل و کاربردی برای انجام این بررسیها آوردهام:
۱. بررسی اولیه سختافزار سرور استوک
الف) بازدید فیزیکی:
ظاهر کلی: بررسی برای شکستگی، خوردگی، گرد و خاک زیاد، یا قطعات گمشده (مانند کاور هارد یا ریلها)
اتصالات: پورتهای USB، شبکه، VGA، و اسلاتهای PCIe را بررسی کنید.
فن و پاور: همه فنها باید کار کنند، نویز غیرعادی نداشته باشند. پاورها نباید خطا یا چراغ قرمز نشان دهند.
ب) روشن شدن کامل سرور:
اگر سرور بدون هشدار و صدای غیرطبیعی روشن شد و وارد BIOS یا Intelligent Provisioning شد، نشانه خوبی است.
۲. ورود به Intelligent Provisioning و ابزارهای تست HP
در سرورهای HPE از نسل 8 به بعد، هنگام بوت کلید F10 را بزنید تا وارد Intelligent Provisioning شوید:
ابزارهای داخلی:
Insight Diagnostics: تست سلامت CPU، رم، فن، پاور و سایر بخشها. پیشنهاد میشود تست کامل (Full Test) را اجرا کنید.
Smart Storage Administrator (SSA): مشاهده وضعیت هاردها، RAID، سلامت دیسکها (Drive Status: OK / Rebuilding / Failed).
HPE System Utilities: نمایش دما، وضعیت فنها، برق و سنسورها.
۳. استفاده از iLO برای بررسی سلامت
اگر سرور مجهز به iLO (Integrated Lights-Out) است:
وارد پنل iLO شوید (از طریق IP اختصاصی).
در بخش System Information یا IML (Integrated Management Log):
هشدارهای سختافزاری مانند “Memory ECC Error”، “Fan Failure”، “Temperature Threshold Exceeded” را بررسی کنید.
از راه دور میتوانید دمای CPU، ولتاژها، سلامت پاورها و لاگهای قبلی را ببینید.
۴. تست مستقل قطعات سختافزاری
الف) تست رم:
با MemTest86+ (قابل بوت از فلش) میتوانید رم را تست کنید. چند ساعت اجرا شود.
ب) تست CPU و دما:
ابزارهایی مانند:
Prime95 یا AIDA64 در ویندوز
stress-ng یا Sysbench در لینوکس
پ) تست دیسک (SSD/SAS):
Hard Disk Sentinel یا CrystalDiskInfo برای بررسی SMART دیسکها.
در سرورهای HPE، نرمافزار SSA یا iLO نیز سلامت دیسک را نشان میدهد.
۵. بررسی لاگها و خطاهای ثبتشده
در ویندوز:
Event Viewer > System Logs: دنبال Event IDهای مربوط به disk, kernel-power, memory باشید.
در لینوکس:
دستور dmesg و فایلهای /var/log/syslog و /var/log/messages وضعیت بوت و خطاها را مشخص میکنند.
در BIOS یا iLO:
لاگهای قبلی سیستم را از طریق IML یا System Event Log ببینید. اگر خطاهای مکرر داشتید، آن را جدی بگیرید.
۶. بررسی نسخه فریمور و آپدیتها
با HPE SPP (Service Pack for ProLiant) یا Smart Update Manager (SUM) میتوانید:
BIOS، iLO، RAID Controller و کارت شبکه را بهروز کنید.
این آپدیتها ممکن است برخی ایرادات سختافزاری را حل کنند یا سازگاری را بالا ببرند.
بخش ابزار یا روش پیشنهادی
تست رم MemTest86+
تست CPU Prime95 / stress-ng
تست دیسک HPE SSA / CrystalDiskInfo
تست کلی سختافزار Insight Diagnostics
لاگها iLO / Event Viewer / dmesg
سلامت عمومی iLO Dashboard / HPE SUM
اگر قصد خرید یا راهاندازی سرور استوک را دارید، اجرای این مراحل میتواند ریسک را به حداقل برساند و اطمینان دهد که سرور برای محیط کاری یا دیتاسنتری شما آماده است.
در صورت نیاز به فایلهای ISO ابزارهای HP یا راهنمای تصویری هر مرحله، خرید و فروش قطعات سرور دست دوم خوشحال میشوم تماس بگییرد.
تماس با ما دکتر اچ پی
سبد خرید شما خالی است.