3-6-4 ساخت مدل
برای ساخت مدلها از نرم افزار دادهکاوی Rapid Miner استفاده شده است. در این بخش به اجرای مرحله به مرحله تولید مدلها میپردازیم. در این بخش برای تشخیص و پیش بینی کنتور خراب از درخت تصمیم و شبکه عصبی بصورت جداگانه استفاده شده و نهایتا بهترین نتایج باهم ترکیب میشوند و دو روش ترکیبی با دقت قابل قبول ارائه میشوند. در این مرحله برای اندازه گیری خلوص ارزیابی تقسیمات در متغیر تابع هدف درخت تصمیم از سه روش نسبت بهره اطلاعاتی ، آنتروپی ، پراکندگی جمعیت (جینی) استفاده شده است. ساخت شبکه عصبی نیز در طی تستهای انواع مختلف توپولوژیهای شبکه عصبی صورت گرفته است.
3-6-4-1 افزودن انبارهای داده به نرم افزار
بعنوان انجام اولین گام در نرم افزار Rapid Miner 5، بایستی از منوی انباردادهها، دادههای مورد نظر را وارد نرم افزار نمود. فایل دادهای مورد نظر ممکن است در پسوندهای مختلف باشد که نحوه انتخاب در شکل (4-2) نمایش داده شده است. فایلهای اطلاعاتی پروژه حاضر از نوع صفحه گسترده ایکسل میباشد.

شکل (4-2): نحوه افزودن فایل دادهای به برنامه
سپس مسیر فایل مورد نظر را پیدا کرده و با انتخاب فایل به مرحله بعد میرویم. در این مرحله صفحهای را که شامل دادههای مورد نظر است را از تبهای موجود انتخاب میکنیم. در مرحله بعد میتوان برای سطرها نوع انتخاب کرد. منظور از نوع این است که سطر مورد نظر میتواند رکورد یا عنوان باشد. شکل (4-3) نحوه انتخاب نوع سطر را نشان میدهد.

مطلب مرتبط :   دانلود پایان نامه ارشد درمورد عوامل موثر بر خلاقیت و دیدگاه فروید

شکل (4-3): نحوه انتخاب نوع سطر
بعد از انتخاب نوع سطر، انواع دادهای را تعیین میکنیم. سپس نام و آدرس محلی که انبار داده در آن قرار خواهد گرفت را مشخص و انبارداده را به سیستم اضافه میکنیم.
3-6-4-2 درخت تصمیم
برای تشکیل درخت تصمیم از تب عملیات و پنجره پردازش بهره گیری میکنیم. عملگر درخت تصمیم را از زیر شاخه نشان داده شده در شکل (4-4) به پنجره پردازش اضافه میکنیم.

شکل(4-4): آدرس عملگر درخت تصمیم
سپس برای انتخاب فیلد مورد نظر برای پیشبینی از عملگر set Role واقع در آدرس نشان داده شده در شکل (4-5) استفاده میکنیم.

شکل(4-5): آدرس عملگر Set Role
بعد از افزودن عملگرهای ذکر شده نیاز به انتخاب فیلدهایی که در تصمیم گیری مأثر هستند داریم. برای مثال فیلد شناسه هیچ نقشی در خرابی کنتور ندارد و فقط برای شناسایی مشترک میباشد. برای انجام عمل انتخاب فیلدها از عملگر Select Attributes استفاده میکنیم که آدرس آن در شکل (4-6) نشان داده شده است.

شکل(4-6): آدرس عملگر Select Attribute
از آنجایی که تابع درخت تصمیم از دادههای عددی پشتیبانی نمیکند از عملگر Discretize by Frequency استفاده میکنیم که عمل جداسازی دادهها را بر اساس تکرار انجام میدهد. آدرس این عملگر در شکل (4-7) نمایش داده شده است.

شکل(4-7): آدرس عملگر Discretize by Frequency
بعد از افزودن عملگرهای ذکر شده، نوبت به اتصال عملگرها میرسد. نحوه اتصال عملگرها در شکل (4-8) نشان داده شده است.