

خطاهای سرور HP یکی از چالشهایی هستند که بسیاری از مدیران شبکه و کارشناسان فناوری اطلاعات در محیطهای کاری با آن مواجه میشوند. با وجود اینکه سرورهای HP به دلیل کیفیت ساخت بالا و قابلیت اطمینانشان در بسیاری از سازمانها مورد استفاده قرار میگیرند، اما بروز خطا در آنها، چه از نوع سختافزاری و چه نرمافزاری، امری اجتنابناپذیر است. شناخت این خطاها و نحوه برخورد صحیح با آنها میتواند نقش مهمی در جلوگیری از توقف سرویسها، حفظ امنیت دادهها و بهبود عملکرد سیستم داشته باشد. در این مقاله به بررسی انواع خطاهای رایج در سرورهای HP، دلایل بروز آنها و راهکارهای مؤثر برای شناسایی و رفع مشکل میپردازیم.
در سرورهای HPE، ارورها و مشکلات مختلفی ممکن است رخ دهند که بهوسیله ابزارها و سیستمهای مدیریتی سرور، مانند HPE iLO (Integrated Lights-Out)، HPE System Insight Manager یا پیامهای BIOS، تشخیص داده میشوند. این ارورها معمولاً به کمک کدهای خطا (Error Codes) یا پیغامهای هشدار نمایش داده میشوند و برای حل آنها میتوان اقداماتی را انجام داد.
خطای 500 سرور داخلی همانطور که از نامش پیداست یک مشکل کلی در سرور وب سایت است. به احتمال زیاد، این بدان معنی است که یک مشکل یا نقص موقت در برنامه نویسی وب سایت وجود دارد.
چگونه یک خطای سرور را برطرف کنم؟
اگرچه محتمل نیست، اما ممکن است مشکلی در انتهای شما وجود داشته باشد، در این صورت مواردی وجود دارد که می توانید امتحان کنید:
یک خطای سرور می تواند ناشی از موارد مختلفی باشد، از آپلود فایل نادرست تا اشکال در یک قطعه کد. این پاسخ خطا یک پاسخ کلی «گیر همه» است. سرور به شما می گوید که مشکلی پیش آمده است، اما دقیقاً مطمئن نیست که آن چیست.
این اشتباه معمولاً به مشکلات داخلی سرور اشاره دارد. ممکن است به دلایل نرمافزاری، مشکلات پایگاه داده، یا مشکلات سختافزاری ایجاد شود.
این خطا به موقعیتی اشاره دارد که سرور نمیتواند پردازش کند و خدمات را در یک محیط انجام دهد. این ممکن است دلیل بار زیاد بر روی سرور یا مشکلات تعمیر و نگهداری باشد.
این خطا به این معناست که سرور درخواست شده را پیدا نمی کند. ممکن است به دلیل نادرست بودن URL یا حذف یا جابهجایی منابع باشد.
این خطا به این معناست که کاربر (یا کلاینت) مجوز لازم برای دسترسی به منابع مورد نظر را ندارد.
این خطا اتفاق میافتد که سرور به عنوان یک دروازه بین دو سیستم (مثلاً سرور و یک سرور دیگر یا سیستم ابری) عمل میکند و از آن سیستم خطایی میکند.برای رفع یا تشخیص خطاهای، معمولاً لازم است به لاگهای سرور (Server Logs) نگاه کنید تا جزئیات بیشتری را در مورد علت خطا بدست آورید. توسعهدهندگان و مدیران سیستمها به کمک این لاگها میتوانند بهترین راهحلها را برای رفع مشکل ارائهدهنده ارائه دهند.
منظور ما در اینجا خطاهای سخت افزاری سرور اچ پی ای میباشد و در مورد خطاهای نرم افزاری باید با قسمت انفورماتیک شرکت خود صحبت کنید ولی در مودر خطاهای سخت افزاری و قطعه ای این مقاله برای شما مناسب میباشد.
سرور های مختلف اچ پی بسته به نوع مشکلاتی که دارند مراحل رفع مشکل ها مختلف ی را دارند و می توات گفت که عملا هیچ سرور اج پی ای بصورت اتوماتیک خراب نمیشود یکی از عوامل اصلی خرابی سرور اچ پی قطع و وصل شدن برق سیستم هست که متاسفانه می توان گفت که 90 درصد مشکلات سرور های اچ پی ای در قطعی برق یک دقعه ای هست و مشکل دوم نصب قطعات فیک یا چینی یا OEM بد میبشاد که با گذشت زمان روی سرور شما خرابی به بار می اورد .
توضیح: این ارور در زمان بوت سرور و بعد از روشن شدن رخ میدهد و نشاندهنده یک مشکل سختافزاری است.
راهحل:
توضیح: اگر یکی از LEDهای قرمز روی سرور روشن شود، نشاندهنده یک مشکل سختافزاری است که ممکن است به دلیل خرابی منبع تغذیه، فنها، حافظه یا درایوهای ذخیرهسازی باشد.
راهحل:
توضیح: این ارور نشاندهنده خرابی یکی از هارد دیسکهای سرور است. این اتفاق ممکن است در هنگام استفاده از RAID بهطور خاص نگرانکننده باشد.
راهحل:
توضیح: ارورهای مربوط به حافظه معمولاً به دلیل خرابی ماژولهای RAM یا عدم سازگاری حافظه با سرور رخ میدهد.
راهحل:
توضیح: این ارور نشاندهنده خرابی یا عدم نصب صحیح پردازنده است.
راهحل:
توضیح: خرابی یکی از فنهای سرور ممکن است منجر به افزایش دما و خاموش شدن سرور شود.
راهحل:
توضیح: اگر یکی از منابع تغذیه (PSU) سرور دچار مشکل شود، ممکن است با این ارور مواجه شوید.
راهحل:
توضیح: این ارور زمانی رخ میدهد که HPE iLO به شبکه متصل نباشد یا به درستی کار نکند.
راهحل:
توضیح: خرابی یا اختلال در کنترلر RAID میتواند باعث از دست رفتن دسترسی به درایوهای ذخیرهسازی شود.
راهحل:
توضیح: دمای بالای سیستم میتواند باعث خاموش شدن سرور یا کاهش کارایی آن شود.
راهحل:
در هنگام مواجهه با ارورهای سرورهای HPE، بررسی دقیق پیامها و کدهای خطا از طریق ابزارهای مدیریتی مانند iLO و System Insight Manager کمک بزرگی به شناسایی و رفع مشکل خواهد کرد. همچنین، در صورت نیاز، بروزرسانی نرمافزارها و فریمورها یا تعویض قطعات معیوب، میتواند به حل مشکلات کمک کند.
اگر در شبکه تلفن همراه هستید، حالت هواپیما را برای حدود 30 ثانیه روشن کنید. سپس دوباره آن را خاموش کنید و داده های تلفن همراه خود را فعال کنید. اگر به یک شبکه Wi-Fi متصل هستید، می توانید روتر را مجددا راه اندازی کنید. سپس، دستگاه خود را مجددا راه اندازی کنید تا ببینید آیا مشکل برطرف شده است یا خیر.
اگر با «خطای سرور» وحشتناک در تلفن اندرویدی خود مواجه شده اید، احتمالاً سعی کرده اید تلفن خود را مجددا راه اندازی کنید و با حساب Google خود وارد شوید. اگر با این کار باز هم مشکل برطرف نشد، سعی کنید حافظه پنهان را پاک کنید، تلفن خود را به اجبار متوقف کنید یا تلفن خود را از داده تلفن همراه و Wi-Fi جدا کنید. اگر هیچ یک از این مراحل کار نکرد، سعی کنید مستقیماً با وب سایت تماس بگیرید.
در مرحله بعد، باید تاریخ و زمان موبایل خود را بررسی کنید. تغییر تاریخ و ساعت در تلفن شما می تواند بر گواهی شبکه شما و در نتیجه بر ارتباط با برنامه های Google تأثیر بگذارد. «استفاده از زمان ارائه شده از شبکه» را خاموش کنید و سعی کنید دوباره برنامه را دانلود کنید. در نهایت، شما باید راه حل های فنی بیشتری را اعمال کنید. اگر این راه حل ها کار نمی کنند، اتصال شبکه خود را بررسی کنید. اگر باز هم کار نمی کند، سعی کنید تنظیمات تاریخ و زمان گوشی خود را بازنشانی کنید.
در مرحله دوم، می توانید فایل های میزبان را به روز کنید. این روش به یک گوشی اندروید روت شده نیاز دارد، بنابراین مطمئن شوید که این کار را با دقت انجام داده اید. فرآیند انجام این کار ممکن است گارانتی شما را باطل کند یا گوشی شما را آجر کند. پس از انجام این کار، باید اپلیکیشنی به نام ES File Explorer را دانلود کنید و به آن اجازه دسترسی به فایل های داخلی گوشی خود را بدهید. در نهایت، پوشه “etc” را باز کنید و فایلی به نام “hosts” را در آن پیدا کنید.
با این کارهای ممکن هست خطای سرور درست شود اگر نشد گوشی را روشن و خاموش کنید و اپدیت و بروزرسانی دستگاه خود را استارت بزنید اگر بازهم درست نشد به نزدیک ترین تعمیر کار مبایل مراحعه کنید.
وقتی سرور خاموش می شود چه اتفاقی می افتد؟خاموش شدن سیستم یا سرور به طور کلی به فرآیند متوقف کردن تمام پردازش های سیستم به روشی کنترل شده اشاره دارد. اگر mvBase به صورت کنترلشده خاموش نشود، اگر فریمهای مورد نیاز برای نوشتن از حافظه پاک نشده و بر روی دیسک نوشته نشده باشند، ممکن است دادهها از بین بروند.
در قطع شبکه، سرور نمی تواند با رایانه های دیگر ارتباط برقرار کند و باعث توقف کار می شود. مشکل در مورد قطعی شبکه این است که می تواند ناشی از هر چیزی باشد، از خرابی روتر گرفته تا قطع کابل و مشکلات ارائه دهنده خدمات اینترنت.
ما اخیراً در موقعیتی قرار گرفتیم که مجبور شدیم سرورهای خود را در طول پنجره های تعمیر و نگهداری ساختمان خاموش کنیم. این به دلیل ارتعاشات بیش از حد در سراسر ساختار ساختمان بود، و ما احساس کردیم که این امر بر دیسک های موجود در سرورها تأثیر می گذارد. خاموش کردن خودکار سرورها بخش آسانی بود که کمتر از آنها نسخه پشتیبان شروع می شد. ما میتوانستیم تنظیمات BIOS را برای انجام این کار تغییر دهیم، اما برای انجام این تغییر نیاز به خرابی است، و همچنین هیچ تضمینی وجود نداشت که بایوس یک گزینه راهاندازی برنامهریزی شده داشته باشد. بنابراین، به جای آن به HP iLO روی آوردیم. من این یادداشتها را در ویکی آثار نوشتم، بنابراین ممکن است گاهی اوقات زبان به طور معقولی جریان نداشته باشد.
ابزارهای مختلفی برای راه اندازی خودکار سرور استفاده می شود.برای خودکار شدن آن، باید با استفاده از کلیدهای SSH، امکان ورود به iLO وجود داشته باشد. این احراز هویت مبتنی بر کلید به جای مبتنی بر رمز عبور است، بنابراین امنیت را حفظ می کند اما اجازه ورود غیر تعاملی بر اساس اعتماد را می دهد.
برای راهاندازی احراز هویت مبتنی بر کلید، عاقلانه است که کاربری را راهاندازی کنید که فقط توابع مورد نیاز شما فعال باشد. در این حالت، کاربری به نام ilouser ایجاد کنید که فقط در مقابل گزینه «توان مجازی و بازنشانی» امتیاز دارد. رمز عبور را یادداشت کنید، اما توجه داشته باشید که پس از این مرحله نیازی به آن نیست.
هنگامی که کاربر در iLO راه اندازی شد، یک جفت کلید با نام کاربری یکسان باید تولید شود. در خط فرمان در یک ماشین لینوکس، جفت کلید را با… ssh-keygen -b 1024 -f ilouser -C ilouser
عبارت عبور را وارد نکنید (از این می توان برای ایمن کردن بیشتر کلید استفاده کرد، اما احراز هویت را مجبور می کند تا تعاملی شود.) این دو فایل ایجاد می کند.
حالت های مجوز روی فایل ها را تغییر ندهید، زیرا SSH آنها را در هنگام استفاده بررسی می کند. از فایل هایی با مجوزهای ضعیف استفاده نمی کند.
دوباره وارد iLO شوید و منوی SSH Key Authorization را انتخاب کنید. به ilouser.pub خود بروید و آن را در iLO آپلود کنید. همه چیز خوب است، iLO آن را در برابر حساب ilouser (یا حسابی با جزئیات مشابه در قسمت نظر در کلید عمومی – ilouser.pub) می پذیرد.
تست کنید که سیستم میتواند با تعیین مکان کلید خصوصی (فایل بدون pub.)، نام کاربری برای ورود به سیستم و نام میزبان وارد شود. ssh -i /home/KyleG/ilouser/ilo-user ilouser@chsr0001-ilo.nes.scot.nhs.uk
همه چیز خوب است، پس از یک تاخیر کوتاه با رابط iLO SSH به شما ارائه خواهد شد. اگر با خطای dispatch_protocol_error مواجه شدید، سیستم عامل iLO شما باید به روز شود. اگرچه همچنان به شما امکان می دهد دستورات را به صورت غیر تعاملی اجرا کنید.
اجرای یک دستور به صورت غیر تعاملی پیچیده به نظر می رسد، اما در واقع از دستور بالا استفاده کنید و دستوری را که می خواهید اجرا کنید، در گیومه های تکی به انتهای آن اضافه کنید. KyleG@WMWS0001:/tmp> ssh -i /tmp/ilouser ilouser@chsr0001-ilo.nes.scot.nhs.uk «روشن» dispatch_protocol_error: نوع 100 seq 8 روشن کردن
برق سرور از قبل روشن است
hpiLO> KyleG@WMWS0001:/tmp>
dispatch_protocol_error یک اشکال در سیستم عامل iLO در CHSR0001 است.
اتوماسیون آن برای خودکار کردن آن، از crontab در دستگاه دیگری استفاده کنید و از دستور بالا استفاده کنید. یک مثال خط کرونتاب می تواند باشد 30 2 * * * /usr/bin/ssh -i /home/KyleG/ilouser/ilouser ilouser@chsr0001-ilo.nes.scot.nhs.uk «روشن کردن»
این دستور هر روز در 0230 اجرا می شود. فرمان از طریق SSH به دستگاه راه دور وارد می شود و به سادگی فرمان “روشن روشن” را اجرا می کند.
از صفحه ابزارهای سیستم، پیکربندی سیستم > پیکربندی BIOS/Platform (RBSU) > در دسترس بودن سرور > روشن کردن خودکار را انتخاب کنید و Enter را فشار دهید. یک تنظیم را انتخاب کنید و Enter را فشار دهید.
همیشه روشن – سیستم به طور خودکار به حالت روشن باز می گردد. این دلایل متداول و راههای رفع خطای سرور داخلی 500 و راهاندازی مجدد و راهاندازی در کمترین زمان را بررسی کنید.
نحوه راه اندازی مجدد سرور HP از رابط iLO. • Windows™ را تعمیر کنید دکمه Reset مجازی عملکردی مشابه دستور Restart در سیستم عامل (راه اندازی گرم) دارد. دکمه مجازی Cold Boot عملکردی مشابه دستور Shutdown در سیستم عامل دارد. اگر دکمه “Cold Boot” را فشار دهید، سرور خاموش می شود و پس از تقریباً 8 ثانیه مجدداً راه اندازی می شود.
در دنیای فناوری اطلاعات، سرورها نقشی حیاتی در اجرای خدمات و نگهداری دادهها ایفا میکنند. اما گاهی اوقات، به دلایل مختلف سختافزاری یا نرمافزاری، ممکن است با پیغامهایی غیرمعمول روبهرو شویم که یکی از رایجترین آنها، صدای بیپ (beep) از سوی سرور است. این صداها درواقع نوعی سیستم هشدار داخلی هستند که برای اعلام خطا یا مشکل خاصی در سرور طراحی شدهاند. شناخت دقیق نوع بیپها و تفسیر درست آنها میتواند گامی مهم در عیبیابی سریع و مؤثر سیستم باشد. در این مقاله به بررسی دلایل مختلف بیپ زدن سرور، نحوه تشخیص انواع آن، و راهکارهای رفع این مشکلات خواهیم پرداخت.
بوق در بایوس به چه معناست؟
یک بوق واحد به معنای “تمام سیستم ها پاک هستند”. این یعنی شما در واقع مشکلی ندارید! یک بوق طولانی، دو بوق کوتاه به این معنی است که یک خطای چک جمع رخ داده است. این نشان دهنده مشکل مادربرد شما است. کد بوق 1-2-2-3 به شما می گوید که یک خطای BIOS ROM checksum وجود داشته است.
یک کد بوق سیگنال صوتی از یک کامپیوتر است که برای اولین بار روشن می شود تا نتیجه خودآزمایی روشن (POST) را بدهد. به طور معمول، یک بوق کوتاه به این معنی است که آزمایش را با موفقیت پشت سر گذاشته است یا یک سری بوق به این معنی است که مشکلی در سخت افزار رایانه وجود دارد.
صدای بوق طولانی در سرور من چیست؟
یک بوق طولانی و مداوم به طور کلی به این معنی است که یک مشکل سخت افزاری – اغلب مربوط به حافظه – وجود دارد که می تواند از راه اندازی کامپیوتر شما جلوگیری کند. اگر نمی توانید رایانه خود را به درستی راه اندازی کنید، باید به سخت افزار فیزیکی داخل دستگاه خود نگاهی بیندازید.
کد بیپ رم چیست؟
4 بوق کوتاه، 1 بلند، 1 بوق کوتاه. مدار تازه کردن رم کار نمی کند. 4 بوق کوتاه و 2 بوق کوتاه. بایوس رام چک جمع خراب شد
کد خطای 3 بوق چیست؟
معمولاً خطای 3 بوق نشان دهنده خطای حافظه سیستم است. اگر اینطور است، لطفاً ماژول رم خود را بررسی کنید که آیا به درستی قرار گرفته است.
سه بوق که پس از مکث تکرار میشوند و هنگام روشن کردن سرور اچ پی رخ میدهند، نشاندهنده مشکل در حافظه سیستم سرور اچ پی است. سه بوق که پخش می شود و با شروع موفقیت آمیز رایانه متوقف می شود به این معنی است که BIOS بازیابی شده است.
ابزار ADU (Array Diagnostic Utility) یکی از مهمترین ابزارهای عیبیابی در سرورهای HPE محسوب میشود. این ابزار اطلاعات دقیقی از وضعیت کنترلر RAID، وضعیت دیسکها، تنظیمات آرایهها و لاگهای سیستم ذخیرهسازی ارائه میدهد. در صورت بروز مشکل در عملکرد دیسکها یا کنترلر، ADU پیامهای خطایی تولید میکند که میتوانند راهنمای بسیار خوبی برای رفع مشکلات باشند. فهم این پیامها برای مدیران سیستم و تکنسینهای پشتیبانی ضروری است تا بتوانند بهدرستی وضعیت سختافزار ذخیرهسازی را بررسی و اقدامات لازم را انجام دهند.
1. PhysicalDrive x: S.M.A.R.T. predictive failure
هارد دیسک مربوطه طبق اطلاعات SMART احتمال خرابی قریبالوقوع داره؛ بهتره هر چه سریعتر تعویض بشه تا از دست رفتن اطلاعات جلوگیری شه.
2. Logical Drive x is operating in interim recovery mode
آرایه در وضعیت بازیابی موقت قرار گرفته. یکی از دیسکها دچار مشکل شده و در حال بازسازی اطلاعات هست؛ توی این حالت کارایی کاهش پیدا میکنه و باید فوراً بررسی بشه.
3. Controller x is not responding
کنترلر RAID شناسایی نمیشه یا ارتباط برقرار نمیکنه. ممکنه کنترلر خراب شده باشه یا مشکلی در اتصالش به مادربرد یا برق باشه.
4. Drive x has been removed or is missing
یکی از دیسکها ناپدید شده؛ یا از سیستم جدا شده یا دیگه شناسایی نمیشه. باید اتصال فیزیکی بررسی بشه و در صورت نیاز دیسک جایگزین بشه.
5. Array x - Configuration mismatch detected
بین تنظیمات فعلی آرایه و تنظیماتی که توی NVRAM ذخیره شده، مغایرت وجود داره. این ممکنه به خاطر جابجایی دیسکها بین کنترلرها یا ریست شدن اطلاعات باشه.
برای خطاهای رم (RAM) در سرورهای HPE، پیامهای مختلفی میتواند از طریق ابزارهای مدیریتی مثل iLO (Integrated Lights-Out) یا ADU (Array Diagnostic Utility) به نمایش درآید. این پیامها معمولاً به مشکلات سختافزاری مربوط به ماژولهای حافظه، ارتباطات یا تنظیمات نادرست اشاره دارند.
در اینجا چند نمونه رایج از پیامهای خطای مربوط به رم در سرورهای HPE آورده شده که میتواند به شما کمک کنه تا مشکلات را شناسایی و رفع کنید:
1. Memory Module x has been removed
ماژول حافظهی مشخصی از سیستم جدا شده یا شناسایی نمیشود. این میتواند به دلیل خراب بودن ماژول یا اتصال ضعیف باشد.
2. Memory error detected on DIMM x
خطای حافظه در DIMM خاص شناسایی شده. این خطا معمولاً نشاندهنده یک مشکل سختافزاری در ماژول حافظه است که ممکن است نیاز به تعویض داشته باشد.
3. Correctable Memory Error on DIMM x
خطای قابل تصحیح در DIMM مشخصشده شناسایی شده. این خطا ممکن است بهصورت موقت رخ دهد و در نهایت ممکن است به خطای غیرقابل تصحیح تبدیل شود.
4. Uncorrectable Memory Error on DIMM x
خطای غیرقابل تصحیح در DIMM شناسایی شده. این خطا معمولاً نشاندهنده خرابی سختافزاری جدی در ماژول حافظه است که نیاز به تعویض دارد.
5. Memory Mirroring or Sparing Configuration Error
خطا در پیکربندی حافظهی مرآة (Mirroring) یا پیکربندی حافظهی پشتیبان (Sparing). این پیام معمولاً بهدلیل تنظیمات نادرست یا پیکربندی ناصحیح حافظه است.
6. ECC Memory Error Detected
خطای حافظه ECC (Error-Correcting Code) شناسایی شده. در صورت بروز این خطا، احتمالاً مشکلی در حافظه ECC وجود دارد که نیاز به بررسی و رفع مشکل دارد.
7. System Event Log contains Memory Errors
گزارش رویداد سیستم حاوی خطاهای حافظه است. این پیام میتواند شامل انواع مختلف خطاهای رم باشد و به شما کمک میکند تا مشکلات را سریعتر شناسایی کنید.
8. DIMM x is not properly seated
ماژول حافظه به درستی نصب نشده است. این خطا معمولاً بهدلیل نصب نادرست ماژول حافظه بهوجود میآید و با باز و بستن صحیح آن قابل رفع است.
هشدار: یک دستگاه PCI هدر نوع 2 شناسایی شده است…
هشدار – iLO 2 پاسخ نمی دهد. نظارت بر سلامت سیستم غیرفعال شده است.
هشدار – پردازنده های پله ای مختلط شناسایی شدند. سیستم نمی تواند ادامه دهد.
هشدار: مدیریت توان مبتنی بر تقاضای ProLiant را نمی توان با پیکربندی پردازنده زیر پشتیبانی کرد. سیستم در حالت Full Performance اجرا خواهد شد.
حالت حفاظت از حافظه پیشرفته: ECC پیشرفته
حالت حفاظت از حافظه پیشرفته: حافظه آینه ای چند بردی با ECC پیشرفته Xxxx MB حافظه سیستم و xxxx MB حافظه برای Mirroring رزرو شده است.
حالت حفاظت از حافظه پیشرفته: یدکی آنلاین با ECC پیشرفته Xxxx MB حافظه سیستم و حافظه xxxx MB برای Online Spare رزرو شده است.
خطای ROM FATAL: رام سیستم به درستی برنامه ریزی نشده است. بوق های شنیدنی: 1 بلند، 1 کوتاه
خطای پیوند هاب مرگبار
خطای پروتکل جهانی مرگبار
اقدام: Insight Diagnostics را اجرا کنید و اجزای خراب را همانطور که نشان داده شد جایگزین کنید. خطای اتوبوس سمت جلو کشنده بوق های قابل شنیدن: ندارد
خطای بندر اکسپرس Fatal بوق های قابل شنیدن: ندارد علت احتمالی: یک پورت PCI Express با یک خطای مرگبار مواجه شده است که باعث NMI شده است. اقدام: Insight Diagnostics را اجرا کنید و بردهای PCI Express خراب را جایگزین کنید یا بردهای شل PCI Express را مجدداً قرار دهید. خطای مرگبار DMA
خراب فن سرور کافی نیست
راه حل فن کاملاً زائد نیست
قبل از روشن کردن، خاموشی غیرمنتظره رخ داد
خطای بحرانی قبل از این پاور آپ رخ داده است
پیامهای خطای POST (Power-On Self-Test) و کدهای بیپ در سرورهای HPE یکی از روشهای شناسایی مشکلات سختافزاری هنگام بوت شدن سیستم هستند. هر کد بیپ یا پیام خطا به نوع خاصی از مشکل اشاره میکند که در هنگام اجرای تستهای اولیه سیستم (POST) در زمان روشن شدن سرور بروز میکند.
سرورهای HPE از سیستمهای POST برای بررسی وضعیت سختافزار استفاده میکنند. در صورتی که مشکلی در یکی از قطعات (مثل رم، پردازنده، کارت گرافیک، یا حافظه) وجود داشته باشد، سرور با ارسال یک یا چند صدای بیپ به کاربر اعلام میکند که به بررسی و رفع مشکل نیاز است.
کدهای بیپ ممکن است به صورت کوتاه یا بلند باشند و تعداد و طول بیپها معنادار هستند. هر نوع بیپ یا ترکیب آن به نوع خاصی از مشکل اشاره دارد. در اینجا تعدادی از رایجترین کدهای بیپ را آوردهایم:
1 بیپ کوتاه
توضیح: بوت معمولی، هیچ مشکلی وجود ندارد.
علت: سیستم به درستی بوت شده است.
2 بیپ کوتاه
توضیح: خطای حافظه (RAM).
علت: احتمالاً مشکل در ماژولهای حافظه وجود دارد. باید حافظهها را چک کنید یا تعویض کنید.
3 بیپ کوتاه
توضیح: مشکل در پیکربندی RAM یا خرابی در یکی از DIMMها.
علت: احتمالاً مشکل در نصب صحیح حافظه یا خرابی یکی از ماژولها.
4 بیپ کوتاه
توضیح: مشکل در کارت گرافیک.
علت: کارت گرافیک شناسایی نشده یا خرابی در آن.
5 بیپ کوتاه
توضیح: خطای پردازنده (CPU).
علت: پردازنده خراب یا به درستی نصب نشده است.
6 بیپ کوتاه
توضیح: خطای کنترلر کیبورد.
علت: مشکل در اتصال کیبورد یا خرابی در کنترلر آن.
7 بیپ کوتاه
توضیح: خطای مادربورد.
علت: مشکل در مادربورد یا یکی از اجزای آن (مثل چیپست).
8 بیپ کوتاه
توضیح: مشکل در کارت ویدیو.
علت: کارت ویدیوی سیستم خراب است یا به درستی شناسایی نمیشود.
9 بیپ کوتاه
توضیح: خطای مادربورد یا حافظه.
علت: مشکلات سختافزاری جدی در سیستم (مادربورد یا حافظه).
1 بیپ بلند + 2 بیپ کوتاه
توضیح: خطای سختافزار در DIMM (ماژول حافظه).
علت: احتمالا مشکلی در حافظه است که نیاز به تعویض یا نصب مجدد دارد.
بیپ طولانی متناوب (با فاصلههای زمانی منظم)
توضیح: خطای مادربورد.
علت: ممکن است مشکل سختافزاری در مادربورد وجود داشته باشد.
پیامهای خطای POST میتوانند از طریق نمایشگرهای iLO یا صفحه نمایش روی سرور مشاهده شوند. برخی از این پیامها به صورت زیر هستند:
توضیح: خطای حافظه شناسایی شده است. این پیام معمولاً به دلیل مشکل در ماژولهای حافظه یا پیکربندی نادرست حافظه ظاهر میشود.
توضیح: پردازنده شناسایی نشده یا مشکلی در ارتباط آن با مادربورد وجود دارد.
توضیح: دستگاه بوت (هارد دیسک یا SSD) شناسایی نمیشود. این پیام ممکن است به دلیل پیکربندی اشتباه بوت یا مشکل در دستگاه ذخیرهسازی باشد.
توضیح: کارت گرافیک یا اتصال آن به صفحه نمایش مشکل دارد.
توضیح: منبع تغذیه سرور دچار مشکل شده و نمیتواند به درستی کار کند.
توضیح: باتری CMOS یا باتری ذخیرهسازی اطلاعات دچار مشکل شده است.
توضیح: پیکربندی سیستم اشتباه است یا تغییراتی در سختافزار ایجاد شده که با تنظیمات قبلی همخوانی ندارد.
این پیامها و کدهای بیپ در زمان راهاندازی سرور میتوانند به شما کمک کنند تا مشکلات سختافزاری را سریعتر شناسایی و رفع کنید. در صورت مواجهه با هرکدام از این خطاها، ابتدا باید سختافزار را چک کنید و در صورت لزوم قطعات معیوب را تعویض یا تعمیر کنید
در نهایت، هنگام خرید سرور اچ پی یا خرید سروردست دوم، مهم است که به سلامت قطعات کلیدی مانند سیستم خنککننده، هارد دیسک، منبع تغذیه، کارت شبکه و پردازنده توجه ویژهای داشته باشید. بررسی دقیق این قطعات میتواند از بروز مشکلات احتمالی در آینده جلوگیری کرده و عمر مفید سرور را افزایش دهد. بنابراین، خرید از فروشندگان معتبر و انجام آزمایشات قبل از خرید، میتواند از مشکلات هزینهبر جلوگیری کند.
مطالب مرتبط:
تماس با ما دکتر اچ پی
سبد خرید شما خالی است.