پشتیبانی: 09131253620
ارتباط با ما
تلگرام: 09131253620

برجسته ترین ها
گروه های مقاله ها
HyperLink


داده کاوی در تجارت الکترونیک بخش دوم تاریخ درج: ١٣٩٣/٠٩/٢٩

 مدلها و الگوريتمهاي داده كاوي

شبكه هاي عصبي
شبكه هاي عصبي به طور خاصي مورد استفاده اند چرا كه آنها ابزاري موثر براي مدلسازي مسائل بزرگ و پيچيده كه ممكن است در آنها صدها متغير پيش بيني كننده كه فعل و انفعالات زيادي دارند وجود داشته باشد. شبكه هاي عصبي مي توانند در مسائل طبقه بندي يا حدسهاي بازگشتي(كه در آنها متغير خروجي پيوسته است) استفاده شوند. يك شبكه عصبي با يك لايه داخلي شروع مي شود كه در آن هر گره به يك متغير پيشگو منسوب مي گردد.  اين گره هاي ورودي به يك تعداد از گره ها در لايه پنهان متصل مي شوند.گره ها در لايه پنهان مي توانند به گره هايي در يك لايه پنهان ديگر يا به يك لايه خروجي متصل شود. لايه خروجي خود شامل يك يا بيشتر متغيرهاي جواب مي باشد.

درخت هاي انتخاب
درخت هاي انتخاب راهي براي نمايش يك سري از قوانين كه به يك كلاس يا مقدار منجر مي شود مي باشند.  براي مثال شما ممكن است بخواهيد درخواستهاي وام را برحسب ريسك اعتبار خوب يا بد طبقه بندي كنيد.

درختهای انتخاب در داده کاوی datamining
 
استنتاج قانون
استنتاج قانون روشي براي بدست آوردن يك سري از قوانين براي طبقه بندي موارد مي باشد.  اگرچه درختهاي تصميم مي توانند يك سري قوانين توليد كنند روشهاي استنتاج قانون يك مجموعه از قوانين وابسته كه ضرورتا درختي تشكيل نمي دهند را توليد مي نمايد. چون استنتاج كننده قوانين لزوما انشعابي در هر سطح قرار نمي دهد و مي تواند گام بعدي را تشخيص دهد گاهي اوقات مي تواند الگوهاي مختلف و بهتري را براي طبقه بندي بيابد.  برخلاف درختان قوانين توليدي ممكن است تمام حالتهاي ممكن را پوشش ندهند.

الگوريتمهاي ژنتيك
الگوريتمهاي ژنتيك براي يافت الگوها استفاده نمي شود بلكه بيشتر به منظور راهنمايي در مورد فرآيند يادگيري الگوريتمهاي داده كاوي مانند شبكه هاي عصبي مورد استفاده قرار مي گيرد. 
الگوريتمهاي ژنتيك به عنوان يك متد جهت انجام يك جستجوي هدايت شده براي مدلهاي خوب در فضاي حل مساله عمل مي كند. اين الگوريتمها, الگوريتمهاي ژنتيك ناميده مي شوند چون بطور بي قاعده اي الگوي تكامل زيستي كه در آن اعضاي يك نسل بر سر انتقال خصوصيات خود به نسل بعد رقابت مي كنند تا نهايتا بهترين مدل يافت شود را دنبال مي كنند. 
اطلاعاتي كه بايد انتقال داده شود در قالب كروموزمها كه شامل پارامترهايي براي ساختن مدل مي باشد قرار مي گيرد.
عملیات داده کاوی در چند بخش انجام می شود که به شرح ذیل می باشند:
مدلسازي پيشگويي کننده
تقطيع پايگاه داده ها 
تحليل پيوند 
تشخيص انحراف

معیارهای انتخاب عملیات داده کاوی
تناسب با نوع داده هاي ورودي 
شفافيت خروجي داده کاوي 
مقاومت در مقابل اشتباه در مقادير داده ها 
ميزان صحت خروجي
توانايي کار کردن با حجم بالاي داده ها

عملياتها و تکنيکهاي داده کاوي
o مدلسازي پيشگويي کننده 
o رده بندي ، پيشگويي مقدار 
o تقطيع پايگاه داده ها
o خوشه بندي آماري ، خوشه بندي 
o تحليل پيوند
o کشف بستگي ، کشف الگوهاي متوالي ، کشف دنباله هاي زماني مشابه 
o تشخيص انحراف
o آمار ، تجسم مدل
 
داده كاوي كاربرد سطح بالاي فنون و ابزار بكار برده شده براي معرفي و تحليل داده ها ي تصميم گيرندگان است.  اصطلاح داده کاوي را آمار شناسان، تحليل گران داده ها و انجمن سيستم هاي اطلاعات مديريت به کار برده اند، در حالي که پژوهشگران يادگيري ماشين و هوش مصنوعي از KDD (اکتشاف علوم) بيشتر استفاده مي کنند. برنامه هاي كاربردي داده کاوی مي توانند ازپارامتر‌هاي متنوعي براي رسيدگي به داده ها استفاده كنند. برخي از اين پارامتر ها براي رسيدگي به داده ها بشرح زير مي باشند:
تركيبيات: نمونه هايي كه در آنها يك رويداد به رويداد ديگري وابسته است، همچون خريد يك خودكار و خريد كاغذ.
تحليل ترتيب يا روش: نمونه هايي كه در آنها انجام يك رويداد منجر به رويداد ديگري ميشود، همچون تولد يك نوزاد و خريد مايحتاج مورد نياز او.
طبقه بندي: شناسايي نمونه هاي جديد، مثل تطابق بين لوله هاي خريداري شده و درپوش هاي پلاستيكي آنها.
دسته بندي: يافتن و مستند سازي بصري گروههايي از حقايق ناشناخته ي قبلي، مثل موقعيت جغرافيايي و نشان هاي تبليغاتي.
پيش بيني: كشف و يافتن نمونه هايي كه بتوان از آنها پيش‌بيني هاي منطقي بعمل آورد، مثلا افرادي كه در يك كلوپ ورزشي سرمايه گذاري مي كنند ممكن است در كلاسها و برنامه هاي ورزشي شركت كنند.
برنامه هاي كاربردي داده کاوی در مقايسه با ساير برنامه هاي كاربردي تحليل داده همچون Structured Query كه در اكثر بانكهاي اطلاعاتي تجاري بكار ميرود، يا نسبت به نرم افزارهاي آماري، تفاوتهاي قابل ملاحظه اي دارد. در دسترسي بر پايه ي اثبات، جايي كه كاربر يك فرضيه را بسط ميدهد و سپس داده ها را از جهت پوشش يا عدم پوشش فرضيه مورد آزمون قرار مي دهد، ابزارهاي تحليلي بسيار ساده تري مورد استفاده قرار مي گيرند; مثلا كاربر ممكن است فرض كند مشتري خريدار يك چكش، ممكن است نيازمند يك جعبه ابزار صنعتي نيز باشد. تاثير اين رويكرد ميتواند با خلاقيت كاربر در توسعه ي فرضيات مختلف، محدود شود. در واقع داده کاوی يك رويكرد اكتشافي بكار مي‌برد كه در آن مي توان از الگوريتمها براي بررسي و تجزيه‌‌ي چندين رابطه ي داده اي چند بعدي، بصورت همزمان و با شناسايي موارد منحصر بفرد، استفاده كرد. براي مثال يك فروشگاه قطعات سخت افزاري ممكن است قدرت خريد مشتريان خود را با ابزارهايي از قبيل مالكيت خانه، نوع اتومبيلي كه سوار مي شوند، سن، حرفه، درآمد و يا فاصله ي محل اقامت تا فروشگاه بسنجد. 

 نتيجتا دو مهم در اعمال داده کاوی موفق دخيل هستند: 
فرمولاسيون واضح و مشخص براي حل مساله.
دسترسي به داده هاي مناسب و درست.        
در بازتاب مفهوم سازي عمومي داده کاوی در تجارت الکترونیک ، برخي مشاهدات انجام شده، داده کاوی را بعنوان تنها يك مرحله از يك پردازش وسيعتر با نام اكتشافات علوم در پايگاه هاي داده اي شناخته شده، مورد توجه قرار مي دهند.
زيربناي داده كاوي
تكنيكهاي داده کاوی نتيجه ي تحقيقات گسترده و بلند مدتي است كه در طول سالها براي افزايش بازدهي تجاري موسسات بكار برده مي‌شدند. تحقيقات در اين زمينه از زماني آغاز شد كه براي نخستين بار اطلاعات تجاري هر سازمان، بر روی سيستمهاي ذخيره سازي آن زمان كه از نوع مغناطيسي بودند، ذخيره شدند. اين رشته تحقيقات با توسعه و پيشرفت سيستمهاي اطلاعات كه قابليت ذخيره ي حجم بيشتري از داده ها را فراهم مي‌كردند و همچنين از سرعت بسيار بالاتري در ذخيره سازي و بازيابي اطلاعات برخوردار بودند، اهميت بيشتري يافت. روشهاي دسترسي تصادفي يا رندم به اطلاعات و پيدايش روشهاي حركت يا navigation در ميان داده ها، خصوصا بصورت بلادرنگ، فناوري داده کاوی را متحول ساخت. 

 روشهاي داده کاوی در تجارت الکترونیک بر پايه هاي زير استوار هستند:
1- گردآوري حجم عظيمي داده.
2- كامپيوترهاي چند پردازنده ي قدرتمند.
3- الگوريتمهاي داده كاوي.
در سالهاي 1960 صنعت گرداوري اطلاعات و امكان ذخيره ي داده ها در تجهيزاتي نظير نوار و ديسك توسط شركتهايي كه IBM و CDC  از پيشگامان آنها بودند، شكل تجاري به خود گرفت. با رواج چنين مكانيسمهايي تبادل استاتيك اطلاعات امكانپذير شده ، پرسشهاي تجاري از قبيل آنكه ”سود خالص شركت در پنج سال آخر فعاليت چقدر بوده است؟ ” پاسخ داده ميشود.
20 سال بعد از فناوري فوق ، با پيشرفتهاي نرم افزاري و استفاده از بانكهاي اطلاعاتي رابطه اي (RBDMS) و زبان جستجوي ساخت يافته (SQL)  توسط شركتهاي موفقي همچون MICROSOFT, IBM, INFORMIX, SYBASE, ORACLE  ، ...  اطلاعات در همان لحظه ي ثبت شدن قابل تبادل بودند. بعبارت ديگر تبادل اطلاعات بصورت ديناميك امكانپذير شده بود. نمونه اي از سوالات تجاري كه اين سيستم پاسخگوي آن است چنين بود: ”مقدار فروش شعب ]كشور يا شهر مورد نظر [ در ماه مارس گذشته چه ميزان بوده است؟”. در سالهاي دهه ي نود نوبت به تكنولوژي هایي همچون DATAWARE HOUSING و امكانات تصميم گيري نرم افزاري رسيد.

تكنولوژي ها ي مرتبط با داده کاوی در تجارت الکترونیک 
1- پردازش تحلیل روی خط - (ONLINE ANALITICAL PROCESS) OLAP
2- بانكهاي اطلاعاتي چند بعدي(MULTIDIMENSIONAL DATABASES)                  
3- انبار داده ها - DATAWARE HOUSING        
پيشگامان ابزارهاي نرم افزاري چنين تكنولوژيهايي شركتهايي نظيرPilot, Comshare, Arbor, Cognos, Microstrategy بودند. البته بلافاصله در همان زمان شركتهايي نظير  ORACLE, IBM, MICROSOFT، كه امروزه نام آنها را در همه جا مشاهده مي كنيم نيز كنترل جريان را بدست گرفته و نرم افزارهاي آنها بازار را تسخير كرد. هسته ي فناوري داده كاوي شامل علوم آمار، هوش مصنوعي، آموزش ماشين و علوم نوين ديگري است كه در طول سالهاي گذشته پيشرفت قابل توجهي داشته است.

تگها: الگوریتم   داده کاوی   ژنتیک   شبکه عصبی   
 

HyperLink

ارسال نظر در مورد این مطلب
نام :  
آدرس ایمیل :  
متن پیام :  
کد امنیتی :  
   
   
نظری برای نمایش وجود ندارد
 
این مطلب را به اشتراک بگذارید: