مهندسی نرم افزار

دانلود پاورپوينت داده کاویی جریان داده ها با درخت های تصمیم گیری

پاورپوینت داده کاوی جریان داده ها
پاورپوینت جریان داده ها
پاورپوینت جریان داده ها با درخت های تصمیم گیری
پاورپوينت داده کاویی جریان داده ها با درخت های تصمیم گیری
دانلود پاورپوینت جریان داده ها
دانلود پاورپوینت داده کاوی جریان داده ها
پاورپوینت در مورد داده کاوی جریان داده ها با درخت های تصمیم گیری

دانلود پاورپوينت داده کاویی جریان داده ها با درخت های تصمیم گیری جهت رشته مهندسی نرم افزار در قالب 18 اسلايد و با فرمت pptx بصورت کامل و جامع و با قابليت ويرايش

 

 

 فرايندی دو مرحله ای است :
ساخت مدل :
تحليل يک مجموعه آموزشی که مجموعه‌ای از تاپل‌های پايگاه است و مشخص کردن برچسب کلاس‌های مربوط به اين تاپل‌ها .
 يک تاپل X با يک بردار صفت X=(x1,x2,…,xn) نمايش داده می‌شود . فرض می شود که هر تاپل به يک کلاس از پيش تعريف شده متعلق است .
هرکلاس با يک صفت که به آن صفت برچسب کلاس می‌گوييم مشخص می‌شود .
 مجموعه آموزشی به صورت تصادفی از پايگاه انتخاب می شود .
به اين مرحله ، مرحله يادگيری نيز می گويند .
استفاده از مدل :
از طريق يک تابع y=f(X) برچسب  کلاس هر تاپل X از پايگاه را پيش بينی می شود .
اين تابع به صورت قواعد کلاسه‌بندی ، درخت‌های تصميم گيری يا فرمول‌های رياضی است .

 

 

يکی از روش های کارآمد و با کاربرد گسترده کلاسه بندی است .
مدل حاصل از اين روش به صورت درختهای تصميم گيری است :
هر گره در اين درخت نشان دهنده يک آزمون بر روی يک صفت است .
هر شاخه خارج شونده از يک گره نشان دهنده خروجی های ممکن آزمون است .
هر برگ نشان دهنده يک برچسب کلاس است .
نحوه استفاده از درخت تصميم گيری :
اگر تاپلی چون X که برچسب کلاس آن نامشخص است داشته باشيم صفات اين تاپل در درخت مورد آزمون قرار می گيرند و يک مسير از ريشه به سمت يک برگ که برچسب يک کلاس را دارد ايجاد می شود .

 

 

برابری‌‌ها :
وقتی که دو يا بيشتر صفت در G بسيار شبيه هستند نمونه‌های زيادی برای تصميم‌گيری بين آنها ، با اطمينان بالا نياز است .
در اين مورد ، اينکه چه صفتی انتخاب می شود اختلاف اندکی را بوجود می‌آورد .VFDT  بصورت انتخابی تصميم می‌گيرد که يک برابری وجود دارد و شکاف را روی يکی از بهترين صفت‌های جاری انجام می‌دهد .
محاسبه G:
بخش قابل توجهی از زمان به ازای هر نمونه برای محاسبه G صرف می شود .
محاسبه دوباره G برای هر نمونه جديد ناکارا است ، چون احتمال تصميم برای شکاف در آن نقطه مشخص غير محتمل است .
 بنابراين VFDT به کاربر اجازه می‌دهد تا يک حداقل تعداد برای نمونه های جديد يا nmin  را مشخص کند که بايد در هر برگ انباشته شود قبل از اينکه G دوباره محاسبه شود .

 

 

فهرست مطالب
کلاسه بندی
درخت های تصميم گيری
مجموعه داده های آموزشی
درخت تصميم گيری برای buys_computer
الگوريتم برای درخت های تصميم گيری
چالش ها
نکات کليدی
چه تعداد نمونه کافی است ؟
الگوريتم Hoeffding Tree
درختان تصميم گيری بسيار سريع VFDT
مقايسه‌ای بين VFDT وC4.5
منابع (1)
منابع (2)

دانلود پاورپوينت داده کاویی جریان داده ها با درخت های تصمیم گیری

دریافت و دانلود فایل”پاورپوينت داده کاویی جریان داده ها با درخت های تصمیم گیری”