1-2 اهمیت و ضرورت تحقیق
امروزه علم داده کاوی در هر جایی که داده وجود داشته باشد کاربرد پیدا کرده است و روش ترکیب روشهای مختلف آن برای حصول نتیجه بهتر را میتوان کاری جدید دانست. همانطور که در بیان مسأله نیز شرح داده شد، شرکت ملی گاز قادر به تشخیص کنتورهای خراب از پایگاه داده بدون حضور در محل و همچنین کشف الگوهای مرتبط با مسأله که در پایگاه داده شرکت موجود است، نمیباشد. از این رو این پروژ با استفاده از علم داده کاوی و با ترکیب الگوریتمهای موجود، سعی در حل مسأله تشخیص میکند.
داده کاوی به عنوان یک ابزار مهم برای کسب دانش از پایگاه داده های حجیم میباشد]5[ و با توجه به حجیم بودن پایگاه داده شرکت ملی گاز میتوان فهمید که کار تجزیه و تحلیل پایگاه داده بدون استفاده از علم داده کاوی و بصورت دستی امری محال میباشد. به این ترتیب با توجه به موارد مطرح شده در بیان مسأله میتوان به اهمیت موضوع کاملا پی برد.
1-3 جنبه نوآوری تحقیق
داده کاوی به تازگی وارد صنعت ملی گاز شده[9]، با توجه به این مسأله و همچنین تحقیقات و بررسیهای انجام شده در ادارات گاز استان کرمانشاه و ارومیه انجام این پروژه در این ادارات بی سابقه بوده است. امروزه روشها و الگوریتمهای داده کاوی در زمینههای مختلف وارد میشوند و روش ترکیبی جدیدی که در این پروژه طراحی و تست و ارزیابی میشود میتواند راهنمایی برای کارهای مشابه باشد.
1-4 اهداف تحقیق
از نتایج و کارهای انجام شده در آن بطور خلاصه و نکتهای میتوان به موارد زیر اشاره کرد:
ارائه یک روش ترکیبی و یک مدل قابل قبول از درخت تصمیم و شبکه عصبی برای حل مشکل تشخیص کنتور خراب
تحلیل دادههای شرکت ملی گاز برای کاهش هزینه تشخیص و تعویض کنتور خراب
مقایسه الگوریتمهای مختلف موجود در روشهای درخت تصمیم
1-5 سوالات پروژه
مهم‌ترین سؤالات این تحقیق در پنج مورد زیر خلاصه می‌شود.
برای تحلیل دادههای شرکت گاز کدام ترکیب از الگوریتمهای گفته شده مناسبتر است؟
معیارهای مناسب جهت تشخیص کنتور خراب چیست؟
کدام ساختار برای شبکه عصبی پیشنهادی مناسبتر است؟
مدل حاصله چگونه آموزش داده میشود؟
آیا میتوان احتمال خرابی یک کنتور را با مدل تصمیم گیری ارائه شده با دقت قابل قبول تشخیص داد؟
1-6 فرضیه‌ها
در این پروژه موارد زیر به عنوان فرضیه جهت حل مسأله و پاسخ به سوالات پروژه در نظر گرفته شده است:
الگوریتم ترکیبی از درخت تصمبم و شبکه عصبی راهکار مناسبی برای حل مسأله است.
معیارها و فاکتورهای ارزیابی خرابی کنتور در جریان اجرای الگوریتم از پایگاه دادهها قابل دسترسی و محاسبه است.
تعداد ورودیها بستگی به تعداد متغیرها داشته و نتیجهی حاصله شامل کنتورهای خراب میباشد. پس ساختار مورد استفاده شامل چندین ورودی و یک خروجی میباشد.