نمودار (4-1): پیشبینی حاصل از الگوهای درخت تصمیم با تابع هدف نسبت بهره اطلاعاتی 77
نمودار(4-2): پیشبینی حاصل از الگوهای درخت تصمیم با تابع هدف آنتروپی 77
نمودار(4-3): پیشبینی حاصل از الگوهای درخت تصمیم با تابع هدف پراکندگی جمعیت(جینی) 78
شکل (4-15): اتصالات عملگرها جهت تشکیل مدل شبکه عصبی 79
شکل(4-16): ساختار شبکه عصبی 80
نمودار (4-4): نتیجه تشخیص شبکه عصبی 80
نمودار(4-6): نتایج حاصل از اجرای شبکه عصبی بر دادههای خرابی پیشبینی شده توسط درخت تصمیم 82
فهرست جداول
جدول (2-1): مقایسه آنالیز آماری و داده کاوی ………………………………………………………………….. 53
جدول (2-2) کلاس های پیش بینی . ………………………………………………………………………………69
جدول (2-3): ماتریس تداخل…………………………………………………………………………………………… 70
جدول(2-4): مجموعه اعتبار سنجی…………………………………………………………………………………… 74
جدول) 3-1(: دادههای مورد استفاده در تشخیص کنتورخراب……………………………………………….. 68
جدول (4-3): نتایج حاصل از ارزیابی نتایج درختهای تصمیم ایجاد شده………………………………… 78
جدول (4-3): مقادیر پارامترهای عملگر شبکه عصبی………………………………………………………….. 79
فصل اول
کلیات تحقیق
این فصل به تعریف مسأله و راهکار کلی می‌پردازد. در ابتدا سعی می‌شود که مسأله تعریف شود. سپس اهمیت و ضرورت مسأله، اهداف و فرضیه‌ها شرح داده می‌شود و در نهایت ساختار این پژوهش، توضیح داده می‌شود.
1-1 بیان مسأله
ظرفیت ذخیره سازی داده های دیجیتال در سراسر جهان هر نه ماه برای حداقل یک دهه دو برابر شده است، در صورتی که در دو برابر مدت مشابه طبق پیش بینی قانون مور قدرت محاسباتی و سرعت رشد میکند]1[. داده کاوی نشان دهنده یک گام در فرایند کشف دانش در پایگاه دادهها میباشد]2[ که میتوان آن را یک نیاز اساسی در دنیای امروز دانست. بنا بر اعلام دانشگاه MIT امروزه مرز و محدودیتی برای دانش داده کاوی در نظر گرفته نشده و دامنه کاربرد آن را از اعماق اقبانوسها تا بی کران فضا میدانند]3[. تلاش برای الگوهای موجود در دادهها مدت زمان طولانی در بسیاری از زمینه ها، از جمله آمار، الگوشناسی ، و تجزیه و تحلیل دادههای اکتشافی مورد مطالعه قرار گرفته شده است]4[.
داده کاوی به عنوان یک ابزار مهم برای کسب دانش از پایگاه داده های پدید آمده است]5[ از این رو میتوان به اهمیت الگوریتمهای داده کاوی پی برد که شبکههای عصبی و درخت تصمیم از جملهی این الگوریتمها میباشد. درخت تصمیم یک راه طبیعی برای ارائه یک فرآیند تصمیم گیری میباشد، چرا که درک آنها برای هر کسی ساده و آسان است]6[ همچنین محبوبیت شبکههای عصبی با دست اندرکاران داده کاوی در حال افزایش چشم گیر است زیرا آنها خود را، از طریق مقایسهی قدرت پیش بینی خود با تکنیکهای آماری با استفاده از مجموعه دادههای واقعی اثبات کردهاند]7[. تحقیقات جدید نمایانگر این است که الگوریتمهای ترکیبی دقت بیشتر و عملکرد بهتری را به نسبت به استفادهی مجزا و مستقل آنها در دادهکاوی از خود نشان میدهند]8[.
با توجه به آنکه تشخیص کنتورهای خراب توسط خود شرکت گاز با استفاده از دادههای موجود مقدور نمیباشد، این شرکت برای تعویض و شناسایی کنتورهای خراب میبایست مأمورینی داشته باشد که در محل حضور داشته و بصورت فیزیکی اقدام به تست کنتور نماید تا اگر احتمالا خراب بود اقدامات لازم را انجام دهند که با توجه به وجود تعداد زیاد مشترکین این عمل یک فرایند زمان بر، پرهزینه و سخت خواهد بود. نوع تحقیق حاضر براساس هدف طراحی و کاربردی می باشد. هدف از طراحی، طراحی یک روش ترکیبی از شبکه عصبی و درخت تصمیم برای کاوش دادههای شرکت شرکت ملی گاز در راستای کاهش هزینه پروژهی تعویض کنتورهای خراب میباشد که شرکت مذکور هر 7 سال یکبار باید اقدام به انجام آن در حوزه مربوطه مینماید. پروژه حاضر سعی دارد تا با طراحی روش ترکیبی از شبکه عصبی و درخت تصمیم فرآیند دادهکاوی را جهت تحلیل دادههای حوزه کرمانشاه استفاده کرده و کنتورهایی با احتمال بالای خرابی را شناسایی و به شرکت نام برده ارائه دهد تا در حد توان جهت کمینه کردن هزینه تشخیص و تعویض کنتورها کمک نماید.