مدیریت حوادث ITIL
مدیریت حوادث ITIL یا همان IT incident management از مهم ترین فرآیندهای کسب و کار است. در این محتوا ما شما را با اصول مدیریت حوادث، مسئولیت های آن، عملکرد و تمام مولفه های آن آشنا میکنیم.
دوران آکادمی یکی از معتبرترین مراکز آموزشی در حوزه ITIL است که دورههای ITIL متنوعی را در این زمینه ارائه میدهد. این دورهها توسط اساتید مجرب و با استفاده از محتوای بهروز و متناسب با نیازهای بازار کار تدریس میشوند.
حوادث IT چیست؟
حوادث ITIL به هر مدل اختلالی که در خدمات فناوری اطلاعات روی دهد، گفته میشود؛ این اختلالات روی کاربر و یا کل کسب و کار تاثیر میگذارد. در کل هر حادثه های که استمرار کسب و کار را قطع یا مختل کند جز حوادت فناوری اطلاعات محسوب میشود.
جهت دریافت اطلاعات بیشتر درمورد دورهها و اساتید با مشاورین دوران آکادمی در ارتباط باشید.
مدیریت حوادث آی تی یعنی چه؟
مدیریت حوادث آی تی، همان فرآیند مدیریت اختلالات خدمات آی تی و بازاریابی خدمات در توافق نامه های خدملت SLA است. دامنه مدیریت حوادث با گزارش دادن یک مسئله توسط کاربران شروع میشود و در نهایت با حل یک مسئله توسط اعضای میز خدمات پایان می یابد.
مراحل مدیریت حوادث ITIL
- جمع آوری دیتا
- اولویت بندی حادثه
- فعال بودن فرآیند با اتوماسیون مربوطه

جمع آوری دیتا
برای جمع آوری دیتا در مورد حوادث به صورت ساده و منظم باید مدیریت حوادث به صورت صحیح صورت بگیرد. تیم های میز خدمات فرم ها را در پورتال سلف سرویس کاربر انتشار میدهند و مطمئن میشوند تا تمامی اطلاعات مهم و مربوطه در زمان درستی جمع آوری شود.

اولویت بندی حادثه
طبقه بندی حوادث مرحله بعدی این فرآیند است که نه تنها باعث مرتب سازی تیکت های ورودی میشود، بلکه آن ها را به تکنسین هایی که بیشترین صلاحیت را برای انجام این کار دارند، منتقل میشوند. اولیت بندی حوادث به سیستم میز خذدمات در اعمال مناسب ترین SLAها کمک میکند و این طبقه بندی ها را به کاربران اعلام میکند. زمانی که یک حادثه اولویت بندی شد، تکنسین ها آن ها را تشخیص میدهند و راه حل به کاربران ارائه میدهند.

فعال بودن فرآیند با اتوماسیون مربوطه
زمانی که فرآیند مدیریت حوادث با اتوماسیون مربوطه فعال باشد، به تیم میزهای خدمات در مراقبت از انطباق با SLA امکان میدهد. و وقتی به تخلف SLA نزدیک میشوند، نوتیف ها را برای تکنسین ها میفرستند. تکنسین ها این گزینه را هم دارند که با راه اندازی تشدیدهای خودکار متناسب با حادثه، تخلفات SLA را افزایش دهند. زمانی که تکنسین این مسئله را تشخیص داد، یک قطعنامه ارائه میکند که کاربر میتواند آن را تایید کمد. این عملیات چند مرحله را برای کسب اطمینان رد میکند که هر مسئله فناوری اطلاعاتی که بر استمرار کسب و کار تاثیر دارد در کوتاهترین زمان حل شود.
با دوران آکادمی مدیریت خدمات فناوری اطلاعات ITIL را حرفهای آموزش ببینید و متخصص شوید.
اهمیت مدیریت حوادث چیست؟
مدیریت حوادث تمامی حوانب یک حادثه را در طول چرخه حیات گوشش میدهد. این کار مسیر حل مسئله را سریع تر کرده و باعث شفاف سازی مدیریت تیکت ها میشود. اگر مدیریت حوادث نبود، رسیدگی به تیکت ها دردسرساز میشد. دردسرهایی مثل :
- عدم توانایی گزارش دهی
- کاهش رضایتمندی مشتری ها
- عدم وجود هیچ گونه ثبتی از حوادث اخیر
- افزایش ریسک وقفه های کسب و کار با حوادث بزرگ
- نداشتن توانایی برای مستندسازی راه حل ها برای مسائل مکرر
- شفاف نبودن وضعیت تیکت ها و همچنین جدول زمانی مورد نظر برای کاربران
چرخه حیات مدیریت حادثه
مسیر مدیریت حادثه را میتوان به چند مرحله خلاصه کرد :
این عملیات طبق نوع حادثه میتوانند ساده و پیچیده باشند. آن ها ممکن است گردش کار و وظایف دیگر علاوه بر روند اصلی داشته باشند.

ثبت حادثه
حادثهها را میتوان از طریق کانالهای مختلفی همچون تماس تلفنی، ایمیل، پیامک، فرمهای وبسایت در پورتال سلفسرویس یا پیامهای چت زنده ثبت کرد.

طبقهبندی حادثه
حوادث معمولاً بر اساس حوزههای فناوری اطلاعات یا کسبوکار و نوع اختلال ایجاد شده (مانند شبکه، سختافزار و غیره) دستهبندی میشوند.

اولویتبندی حادثه
اولویت حادثه به کمک ماتریس اولویت، که تابعی از تأثیر و فوریت آن است، تعیین میشود. تأثیر حادثه میزان خسارت وارده به کاربر یا کسبوکار را نشان میدهد و فوریت به زمان لازم برای رفع حادثه اشاره دارد. بر اساس این دو پارامتر، حوادث به دستههای زیر تقسیم میشوند: - بحرانی - بالا - متوسط - کم

ارجاع حادثه
پس از طبقهبندی و اولویتبندی، حادثه به طور خودکار به تکنسین مربوطه با تخصص مناسب ارجاع داده میشود.

ایجاد و مدیریت وظایف
بسته به پیچیدگی حادثه، ممکن است به فعالیتهای فرعی یا وظایفی تقسیم شود. این وظایف زمانی ایجاد میشوند که رفع حادثه نیاز به همکاری چندین تکنسین از بخشهای مختلف داشته باشد.

مدیریت و نظارت بر SLA
در حین پردازش حادثه، تکنسین باید اطمینان حاصل کند که SLA نقض نمیشود. SLA زمان مشخصی است که برای پاسخگویی به حادثه در نظر گرفته شده است. حوادث میتوانند بر اساس پارامترهای مختلف مانند طبقهبندی، درخواستکننده، تأثیر و فوریت، SLA خاصی داشته باشند. اگر SLA نقض شود، حادثه میتواند از نظر عملکردی یا سلسلهمراتبی تشدید شود تا حل آن تضمین گردد.

ارائه راهحل
حادثه زمانی حل شده تلقی میشود که تکنسین راهحلی موقت یا دائمی برای آن ارائه داده باشد.

بستن حادثه
وقتی مشکل حل شد و کاربر از راهحل ارائه شده رضایت داشت، حادثه به پایان رسیده و بسته میشود.
بررسی پس از وقوع حادثه
بعد از بسته شدن کامل یک حادثه، بهتر است تمامی اقدامات اجرایی آن را ثبت کنید. این فرآیند در آماده سازی بهتر تیم ها برای حوادث کمک میکند و مسیر کارآمدتری برای مدیریت حوادث ایجاد میکند. در ادامه روند بررسی اتفاقات بعد از حادثه را میبینیم که به جوانب مختلف تقسیم بندی میشود.
شناسایی حادثه
- چه کسی و چگونه این حادثه را کشف کرد؟
- چه مدت بعد از وقوع، حادثه کشف شد؟
- آیا حادثه میتوانست زودتر شناسایی شود؟
- آیا ابزارها یا فناوریهایی میتوانند در تشخیص سریع یا پیشگیرانه حادثه کمک کنند؟
جریان اطلاعات و ارتباطات
- سهامداران با چه سرعتی از حادثه مطلع شدند؟
- برای پخش مجدد اعلانها از چه کانالی استفاده شده است؟
- آیا کلیه ذینفعان مربوطه بلافاصله از آخرین اطلاعات باخبر شدهاند؟
- برقراری ارتباط با کاربر برای جمعآوری اطلاعات و آگاهی دادن از وضعیت تیکت چقدر آسان بود؟
مدیریت حوادث ITIL فرآیندی است که به شناسایی، اولویتبندی، حل و مستندسازی اختلالات خدمات فناوری اطلاعات میپردازد تا تأثیر آنها بر کسبوکار کاهش یابد. این فرآیند شامل مراحل ثبت، طبقهبندی، ارجاع به تکنسین، مدیریت SLA، ارائه راهحل و بستن حادثه است. با استفاده از این چارچوب، کسبوکارها میتوانند خدمات IT را سریعتر و مؤثرتر بازگردانند، از مشکلات مکرر جلوگیری کنند و رضایت کاربران را افزایش دهند.