جزئیات ساختار ITIL v2 - بخش اول « پشتیبانی سرویس -1- مدیریت درخواست سرویس »
2. مدیریت رخداد - IcM - Incident Management
هدف مدیریت رخداد ، بازگرداندن عملیات سرویس دهی به شکل معمول و نرمال ، در کمترین زمان ممکن و به حداقل رساندن اثرگذاری مضرات ( ناسازگاری ها )در عملیات تجاری است . بنابراین تضمین می شود که بهترین سطوح کیفیت سرویس و در دسترس بودنِ ( Availability ) ممکن ، برقرار می باشد . ٰ عملیات معمول سرویس ( Normal Service Operation ) ٰ در اینجا به عنوان یک عملیات سرویس در محدودیت های توافقنامه سطح سرویس ( SLA ) تعریف می شود .
به زبان دیگر مدیریت رخداد ( IcM ) یک بخش فرآیند از مدیریت سرویس فنآوری اطلاعات ( ITSM - IT Service Management ) است . هدف اول این فرآیند ، بازگرداندن عملیات به شکل سرویس دهی طبیعی و نرمال در کمترین زمان ممکن و به حداقل رسانیدن تاثیرات منفی آن (عدم سرویس دهی ) در عملیات تجاری است . بنابراین بهترین کیفیت عملیات سرویس ممکن و موجودیها را تضمین می کند . ٰ سرویس دهی نرمال ٰ به شکل یک بند از عملیات سرویس در توافقنامه سطح سرویس ( SLA ) بیان می شود .
مشکل رخدادهایی که توسط برنامه سریعا رفع نمی شوند ، به یک گروه پشتیبانی مخصوص، جهت رفع مشکل ، نسبت داده می شود . به منظور بازگرداندن سریع سرویس دهی نرمال ، مشکل باید سریعا توسط این گروه برطرف شود .
تعریف
فرهنگ لغات ITIL رخداد ( Incident ) را به این شکل تعریف می کند :
هر رخدادی که جزیی از یک عملیات استاندارد سرویس نیست و به بروز وقفه یا کاهش کیفیت سرویس دهی منجر شده یا می شود.
هدف ITIL رسیدن به عملیات عادی و طبیعی در کمترین و کوتاه ترین زمان ممکن ، با کمترین میزان تاثیر در تجارت یا کاربر ، با صرف یک هزینه مقرون به صرفه است . رخدادها ممکن است به دلایل مشخص و یا نامشخصی به وقوع بپیوندند ونهایتا به منظور کنترل کردن مدیریت مشکلات ( problem management ) در Known Error Database - KeDB ثبت میشوند.
در جایی که محیط پیرامون کارِ از پیش تعریف شده , توسعه پیدا کرده است , پیشنهاد میشود که service desk یک محیط سریع را برای برطرف کردن مشکل, در اولین مرحله فراهم کند .
در جایی که یک رخداد نتیجه یک مشکل شناخته شده و یا خطای شناخته شده نباشد, میتواند یک محیط ایزوله شده یا یک پیش آمد منحصر بفرد یا ممکن است که مشکل ریشه ای مشخص شده باشد , نیاز است که مدیریت مشکلات درگیر شود , در صورت امکان باید یک مشکل جدید, با مشخصات رخداد ایجاد شود.
رخدادها و تغییرات
رخدادها نتایج مشکلات و خطاهای زیربناهای فنآوری اطلاعات هستند. علت بروز رخداد ممکن است پیدا و روشن باشد و نیازی به سرمایه گذاری ( از نظر زمانی و هزینهای ) برای شناسایی علت بروز رخداد نباشد و منجر به درخواست برای یک تعمیر , یک حضور فیزیکی در محل یا یک درخواست تغییر برای حذف خطا باشد .
جایی که یک رخداد مطرح میشود تا بصورت جدی و قاطعانه پیگیری شود, و یا چند پیشامد مشابه یک رخداد مشاهده میشود , یک مشکل میتواند به عنوان پاسخی برای حل همه موارد در سیستم ثبت شود ( همچنین ممکن است تا چند مشکل مشابه گزارش نشد, اصلا مشکلی هم ثبت نشود ). مدیریت یک مشکل از فرآیند مدیریت یک رخداد ( می تواند ) متفاوت است و معمولا توسط کارمندان متفاوت انجام میشود و به همین دلیل توسط فرآیند مدیریت مشکلات کنترل میشود. وقتی که یک مشکل شناسایی میشود و محیط مشکل پیدا میشود , مشکل یک ٰمشکل شناخته شدهٰ می شود. هنگامیکه ریشه و علت بروز رخداد شناسایی می شود تبدیل به یک ٰخطای شناسایی شدهٰ می شود و نهایتا یک درخواست تغییر ( Request For Change - RFC ) ممکن است برای تغییر ( اصلاح ) سیستم با رفع خطای شناسایی شده ایجاد شود. این فرآیند توسط فرایند مدیریت تغییرات ( Change Management ) تحت پوشش قرار گرفته است.
توجه داشته باشید که درخواست یک سرویس اضافی به عنوان یک رخداد شناخته نمی شود و آن را یک درخواست تغییر ( RFC ) می نامند .
فرآیند مدیریت رخداد
فرآیندهای اصلی مدیریت رخداد در زیر آورده شدهاند :
- شناسایی و ثبت رخداد - Incident detection and recording
- طبقه بندی و پشتیبانی اولیه - Classification and initial support
- تحقیق و تشخیص - Investigation and diagnosis
- رفع مشکل و بازیابی - Resolution and recovery
- بستن رخداد - Incident closure
- مالکیت رخداد , بازدید, پیگیری و ارتباطات - Incident ownership, monitoring, tracking and communication
مثال و نمونه
رخدادها باید طبقه بندی بشوند همانطور که ثبت می شوند, نمونه های برای طبقه بندی رخدادها در زیر آورده شده است :
- Application
- service not available
- application bug
- disk-usage threshold exceeded
- Hardware
- system-down
- automatic alert
- printer not printing