مدیریت حوادث ITIL

مدیریت حوادث ITIL  یا همان IT incident management از مهم ترین فرآیندهای کسب و کار است. در این محتوا ما شما را با اصول مدیریت حوادث، مسئولیت های آن، عملکرد و تمام مولفه های آن آشنا میکنیم.

دوران آکادمی یکی از معتبرترین مراکز آموزشی در حوزه ITIL است که دوره‌های ITIL متنوعی را در این زمینه ارائه می‌دهد. این دوره‌ها توسط اساتید مجرب و با استفاده از محتوای به‌روز و متناسب با نیازهای بازار کار تدریس می‌شوند.

حوادث IT چیست؟

حوادث ITIL به هر مدل اختلالی که در خدمات فناوری اطلاعات روی دهد، گفته میشود؛ این اختلالات روی کاربر و یا کل کسب و کار تاثیر میگذارد. در کل هر حادثه ه‎ای که استمرار کسب و کار را قطع یا مختل کند جز حوادت فناوری اطلاعات محسوب میشود.

جهت دریافت اطلاعات بیشتر درمورد دوره‌ها و اساتید با مشاورین دوران آکادمی در ارتباط باشید.

مدیریت حوادث آی تی یعنی چه؟

مدیریت حوادث آی تی، همان فرآیند مدیریت اختلالات خدمات آی تی و بازاریابی خدمات در توافق نامه های خدملت SLA است. دامنه مدیریت حوادث با گزارش دادن یک مسئله توسط کاربران شروع میشود و در نهایت با حل یک مسئله توسط اعضای میز خدمات پایان می یابد.

مراحل مدیریت حوادث ITIL

مدیریت حوادث ITIL

جمع آوری دیتا

برای جمع آوری دیتا در مورد حوادث به صورت ساده و منظم باید مدیریت حوادث به صورت صحیح صورت بگیرد. تیم های میز خدمات فرم ها را در پورتال سلف سرویس کاربر انتشار میدهند و مطمئن میشوند تا تمامی اطلاعات مهم و مربوطه در زمان درستی جمع آوری شود.

اولویت بندی حادثه

طبقه بندی حوادث مرحله بعدی این فرآیند است که نه تنها باعث مرتب سازی تیکت های ورودی میشود، بلکه آن ها را به تکنسین هایی که بیشترین صلاحیت را برای انجام این کار دارند، منتقل میشوند. اولیت بندی حوادث به سیستم میز خذدمات در اعمال مناسب ترین SLAها کمک میکند و این طبقه بندی ها را به کاربران اعلام میکند. زمانی که یک حادثه اولویت بندی شد، تکنسین ها آن ها را تشخیص میدهند و راه حل به کاربران ارائه میدهند.

فعال بودن فرآیند با اتوماسیون مربوطه

زمانی که فرآیند مدیریت حوادث با اتوماسیون مربوطه فعال باشد، به تیم میزهای خدمات در مراقبت از انطباق با SLA امکان میدهد. و وقتی به تخلف SLA نزدیک میشوند، نوتیف ها را برای تکنسین ها میفرستند. تکنسین ها این گزینه را هم دارند که با راه اندازی تشدیدهای خودکار متناسب با حادثه، تخلفات SLA را افزایش دهند. زمانی که تکنسین این مسئله را تشخیص داد، یک قطعنامه ارائه میکند که کاربر میتواند آن را تایید کمد. این عملیات چند مرحله را برای کسب اطمینان رد میکند که هر مسئله فناوری اطلاعاتی که بر استمرار کسب و کار تاثیر دارد در کوتاهترین زمان حل شود.

با دوران آکادمی مدیریت خدمات فناوری اطلاعات ITIL را حرفه‌ای آموزش ببینید و متخصص شوید.

اهمیت مدیریت حوادث چیست؟

مدیریت حوادث تمامی حوانب یک حادثه را در طول چرخه حیات گوشش میدهد. این کار مسیر حل مسئله را سریع تر کرده و باعث شفاف سازی مدیریت تیکت ها میشود. اگر مدیریت حوادث نبود، رسیدگی به تیکت ها دردسرساز میشد. دردسرهایی مثل :

چرخه حیات مدیریت حادثه

مسیر مدیریت حادثه را میتوان به چند مرحله خلاصه کرد :

  • مرحله 1

    ثبت وقایع

  • مرحله 2

    طبقه بندی حوادث

  • مرحله 3

    اولویت بندی حوادث

  • مرحله 4

    تعیین تکلیف

  • مرحله 5

    ایجاد و مدیریت وظایف

  • مرحله 6

    مدیریت و تشدید SLA

  • مرحله 7

    ارائه راه حل برای حوادث

  • مرحله 8

    بستن حوادث

     

این عملیات طبق نوع حادثه میتوانند ساده و پیچیده باشند. آن ها ممکن است گردش کار و وظایف دیگر علاوه بر روند اصلی داشته باشند.

ثبت حادثه

حادثه‌ها را می‌توان از طریق کانال‌های مختلفی همچون تماس تلفنی، ایمیل، پیامک، فرم‌های وب‌سایت در پورتال سلف‌سرویس یا پیام‌های چت زنده ثبت کرد.

طبقه‌بندی حادثه

حوادث معمولاً بر اساس حوزه‌های فناوری اطلاعات یا کسب‌وکار و نوع اختلال ایجاد شده (مانند شبکه، سخت‌افزار و غیره) دسته‌بندی می‌شوند.

اولویت‌بندی حادثه

اولویت حادثه به کمک ماتریس اولویت، که تابعی از تأثیر و فوریت آن است، تعیین می‌شود. تأثیر حادثه میزان خسارت وارده به کاربر یا کسب‌وکار را نشان می‌دهد و فوریت به زمان لازم برای رفع حادثه اشاره دارد. بر اساس این دو پارامتر، حوادث به دسته‌های زیر تقسیم می‌شوند: - بحرانی - بالا - متوسط - کم

ارجاع حادثه

پس از طبقه‌بندی و اولویت‌بندی، حادثه به طور خودکار به تکنسین مربوطه با تخصص مناسب ارجاع داده می‌شود.

ایجاد و مدیریت وظایف

بسته به پیچیدگی حادثه، ممکن است به فعالیت‌های فرعی یا وظایفی تقسیم شود. این وظایف زمانی ایجاد می‌شوند که رفع حادثه نیاز به همکاری چندین تکنسین از بخش‌های مختلف داشته باشد.

مدیریت و نظارت بر SLA

در حین پردازش حادثه، تکنسین باید اطمینان حاصل کند که SLA نقض نمی‌شود. SLA زمان مشخصی است که برای پاسخگویی به حادثه در نظر گرفته شده است. حوادث می‌توانند بر اساس پارامترهای مختلف مانند طبقه‌بندی، درخواست‌کننده، تأثیر و فوریت، SLA خاصی داشته باشند. اگر SLA نقض شود، حادثه می‌تواند از نظر عملکردی یا سلسله‌مراتبی تشدید شود تا حل آن تضمین گردد.

ارائه راه‌حل

حادثه زمانی حل شده تلقی می‌شود که تکنسین راه‌حلی موقت یا دائمی برای آن ارائه داده باشد.

بستن حادثه

وقتی مشکل حل شد و کاربر از راه‌حل ارائه شده رضایت داشت، حادثه به پایان رسیده و بسته می‌شود.

بررسی پس از وقوع حادثه

بعد از بسته شدن کامل یک حادثه، بهتر است تمامی اقدامات اجرایی آن را ثبت کنید. این فرآیند در آماده سازی بهتر تیم ها برای حوادث کمک میکند و مسیر کارآمدتری برای مدیریت حوادث ایجاد میکند. در ادامه روند بررسی اتفاقات بعد از حادثه را میبینیم که به جوانب مختلف تقسیم بندی میشود.

شناسایی حادثه

  • چه کسی و چگونه این حادثه را کشف کرد؟
  • چه مدت بعد از وقوع، حادثه کشف شد؟
  • آیا حادثه می‌توانست زودتر شناسایی شود؟
  • آیا ابزارها یا فناوری‌هایی می‌توانند در تشخیص سریع یا پیشگیرانه حادثه کمک کنند؟

جریان اطلاعات و ارتباطات

  • سهامداران با چه سرعتی از حادثه مطلع شدند؟
  • برای پخش مجدد اعلان‌ها از چه کانالی استفاده شده است؟
  • آیا کلیه ذی‌نفعان مربوطه بلافاصله از آخرین اطلاعات باخبر شده‌اند؟
  • برقراری ارتباط با کاربر برای جمع‌آوری اطلاعات و آگاهی دادن از وضعیت تیکت چقدر آسان بود؟

مدیریت حوادث ITIL فرآیندی است که به شناسایی، اولویت‌بندی، حل و مستندسازی اختلالات خدمات فناوری اطلاعات می‌پردازد تا تأثیر آن‌ها بر کسب‌وکار کاهش یابد. این فرآیند شامل مراحل ثبت، طبقه‌بندی، ارجاع به تکنسین، مدیریت SLA، ارائه راه‌حل و بستن حادثه است. با استفاده از این چارچوب، کسب‌وکارها می‌توانند خدمات IT را سریع‌تر و مؤثرتر بازگردانند، از مشکلات مکرر جلوگیری کنند و رضایت کاربران را افزایش دهند.