۱۳۸۷ آذر ۳, یکشنبه

جزئیات ساختار ITIL v2 - بخش دوم « پشتیبانی سرویس -2- مدیریت رخداد »



جزئیات ساختار ITIL v2 - بخش اول « پشتیبانی سرویس -1- مدیریت درخواست سرویس »


2. مدیریت رخداد - IcM - Incident Management


هدف مدیریت رخداد ، بازگرداندن عملیات سرویس دهی به شکل معمول و نرمال ، در کمترین زمان ممکن و به حداقل رساندن اثرگذاری مضرات ( ناسازگاری ها )‌در عملیات تجاری است . بنابراین تضمین می شود که بهترین سطوح کیفیت سرویس و در دسترس بودنِ ( Availability ) ممکن ، ‌برقرار می باشد . ٰ عملیات معمول سرویس ( Normal Service Operation ) ٰ در اینجا به عنوان یک عملیات سرویس در محدودیت های توافق‌نامه سطح سرویس ( SLA ) تعریف می شود .

به زبان دیگر مدیریت رخداد ( IcM ) یک بخش فرآیند از مدیریت سرویس فن‌آوری اطلاعات ( ITSM - IT Service Management ) است . هدف اول این فرآیند ، بازگرداندن عملیات به شکل سرویس دهی طبیعی و نرمال در کمترین زمان ممکن و به حداقل رسانیدن تاثیرات منفی آن (‌عدم سرویس دهی ) در عملیات تجاری است . بنابراین بهترین کیفیت عملیات سرویس ممکن و موجودی‌ها را تضمین می کند . ٰ سرویس دهی نرمال ٰ به شکل یک بند از عملیات سرویس در توافق‌نامه سطح سرویس ( SLA ) بیان می شود .

مشکل رخدادهایی که توسط برنامه سریعا رفع نمی شوند ، به یک گروه پشتیبانی مخصوص، جهت رفع مشکل ، نسبت داده می شود . به منظور بازگرداندن سریع سرویس دهی نرمال ، مشکل باید سریعا توسط این گروه برطرف شود .

تعریف


فرهنگ لغات ITIL رخداد ( Incident ) را به این شکل تعریف می کند :

هر رخدادی که جزیی از یک عملیات استاندارد سرویس نیست و به بروز وقفه یا کاهش کیفیت سرویس دهی منجر شده یا می شود.

هدف ITIL رسیدن به عملیات عادی و طبیعی در کمترین و کوتاه ترین زمان ممکن ، با کمترین میزان تاثیر در تجارت یا کاربر ، با صرف یک هزینه مقرون به صرفه است . رخدادها ممکن است به دلایل مشخص و یا نامشخصی به وقوع بپیوندند ونهایتا به منظور کنترل کردن مدیریت مشکلات ( problem management ) در Known Error Database - KeDB ثبت می‌شوند.

در جایی که محیط ‍پیرامون کارِ از پ‍یش تعریف شده , توسعه پیدا کرده است , پیشنهاد می‌شود که service desk یک محیط سریع را برای برطرف کردن مشکل, در اولین مرحله فراهم کند .

در جایی که یک رخداد نتیجه یک مشکل شناخته شده و یا خطای شناخته شده نباشد, می‌تواند یک محیط ایزوله شده یا یک پیش آمد منحصر بفرد یا ممکن است که مشکل ریشه ای مشخص شده باشد , نیاز است که مدیریت مشکلات درگیر شود , در صورت امکان باید یک مشکل جدید, با مشخصات رخداد ایجاد شود.

رخدادها و تغییرات


رخدادها نتایج مشکلات و خطاهای زیربناهای فن‌آوری اطلاعات هستند. علت بروز رخداد ممکن است پیدا و روشن باشد و نیازی به سرمایه گذاری ( از نظر زمانی و هزینه‌ای ) برای شناسایی علت بروز رخداد نباشد و منجر به درخواست برای یک تعمیر , یک حضور فیزیکی در محل یا یک درخواست تغییر برای حذف خطا باشد .

جایی که یک رخداد مطرح می‌شود تا بصورت جدی و قاطعانه پیگیری شود, و یا چند پیشامد مشابه یک رخداد مشاهده می‌شود , یک مشکل می‌تواند به عنوان پاسخی برای حل همه موارد در سیستم ثبت شود ( همچنین ممکن است تا چند مشکل مشابه گزارش نشد, اصلا مشکلی هم ثبت نشود ). مدیریت یک مشکل از فرآیند مدیریت یک رخداد ( می تواند ) متفاوت است و معمولا توسط کارمندان متفاوت انجام می‌شود و به همین دلیل توسط فرآیند مدیریت مشکلات کنترل می‌شود. وقتی که یک مشکل شناسایی می‌شود و محیط مشکل پیدا می‌شود , مشکل یک ‍ ٰمشکل شناخته شدهٰ می شود. هنگامیکه ریشه و علت بروز رخداد شناسایی می شود تبدیل به یک ٰخطای شناسایی شدهٰ می شود و نهایتا یک درخواست تغییر ( Request For Change - RFC ) ممکن است برای تغییر ( اصلاح ) سیستم با رفع خطای شناسایی شده ایجاد شود. این فرآیند توسط فرایند مدیریت تغییرات ( Change Management ) تحت پوشش قرار گرفته است.

توجه داشته باشید که درخواست یک سرویس اضافی به عنوان یک رخداد شناخته نمی شود و آن را یک درخواست تغییر ( RFC ) می نامند .

فرآیند مدیریت رخداد


فرآیندهای اصلی مدیریت رخداد در زیر آورده شده‌اند :

  • شناسایی و ثبت رخداد - Incident detection and recording

  • طبقه بندی و پشتیبانی اولیه - Classification and initial support

  • تحقیق و تشخیص - Investigation and diagnosis

  • رفع مشکل و بازیابی - Resolution and recovery

  • بستن رخداد - Incident closure

  • مالکیت رخداد , بازدید, پیگیری و ارتباطات - Incident ownership, monitoring, tracking and communication


مثال و نمونه


رخدادها باید طبقه بندی بشوند همانطور که ثبت می شوند, نمونه های برای طبقه بندی رخدادها در زیر آورده شده است :

  • Application

    • service not available

    • application bug

    • disk-usage threshold exceeded



  • Hardware

    • system-down

    • automatic alert

    • printer not printing




منابع :‌


هیچ نظری موجود نیست: