پشتیبانی: 09131253620
ارتباط با ما
تلگرام: 09131253620

برجسته ترین ها
گروه های مقاله ها
HyperLink


داده کاوی بخش هشتم تاریخ درج: ١٣٩۴/٠۵/١٣

 

 OLAP و اطلاعات چند بعدي

به ساختار OLAP مثل يك مكعب روبيك از داده ها نگاه كنيد كه مي توانيد آنرا در جهات مختلف بچرخانيد تا بتوانيد سناريو هاي "قبلا چه شده" و "چه مي شد اگر ..." را بررسي كنيد. اين ابزارها ديدگاههاي چند بعدي از داده ها را توسط بانكهاي اطلاعاتي دو بعدي (و يا بانكهاي خاص چند بعدي) توليد كرده و در اختيارما مي گذارند. توان دسترسي چند بعدي به داده ها در OLAP قدرت فرموله كردن خواسته هاي پيچيده تر را بما مي دهد.
براي سادگي فرض كنيد OLAP يك صفحه گسترده با چند محور است (در صفحات گسترده  متعارف فقط دو محور افقي با اختصار A, B, C, … و عمودي با ايندكس هاي 1و2و3,…  داريم) در اين صورت مثلا مي توانيم اطلاعات فروش يك سازمان را از ديدگاه هاي منطقه فروش،  تاريخ، مشتري، فروشگاه،  قيمت و ميزان فروش بررسي كنيم. و پاسخ سولاتي نظير ميزان فروش به ازائ يك محصول و فروشگاه در يك ماه مشخص را خواهيم داشت.
مدل چند بعدي OLAP طريقه نمايش دادن داده ها را در مقايسه با بانك هاي اطلاعاتي رابطه اي تسهيل مي كند.ROLAP با ايجاد يك لايه محافط روي يك بانك اطلاعاتي رابطه اي سرويس فوق را ارائه ميدهد. از ديدگاه فني OLAP فقط راهي براي ذخيره سازي و محاسبه اطلاعات چند بعدي براي پاسخوگويي به سناريوهاي كاربر است. يك خادم OLAP، داده ها را از پيش روي چندين محور جمع مي زند. توجه كنيد كه اطلاعات قبل از وارد شدن به OLAP بايستي پاك سازي شوند . غالبا OLAP داده ها را از يك انباره داده استخراج مي كند.
 
OLAP

 

ابزارهاي OLAP را به چند دسته تقسيم مي كنند:

OLAP رو ميزي:
ابزارهاي ساده و مستقل كه روي كامپيوتر هاي شخصي نصب شده و مكعب هاي كوچكي مي سازند و آنها را نيز بر روي سيستم به شكل فايل ذخيره مي كنند. بيشتر اين ابزارها با صفحات گسترده اي نظير Excel كار مي كنند.به اين ترتيب كساني كه در سفر هستند قادر به استفاده از اين دسته از محصولات هستند.(در حال حاضر Web OLAP در حال جايگزين كردن اين محصولات است)

 

MOLAP چند بعدي

بجاي  ذخيره كردن اطلاعات در ركورد هاي كليد دار،  اين دسته از ابزارهاي بانكهاي اطلاعاتي خاصي را براي خود طراحي كرده اند بطوريكه داده ها را به شكل آرايه هاي مرتب شده بر اساس ابعاد داده ذخيره مي كنند (Hypercube) در حال حاضر نيز دو استاندارد براي اين تيپ ابزار وجود دارد. سرعت اين ابزار بالا ولي سايز بانك اطلاعاتي آن نسبتا كوچك است. 

 

OLAP رابطه اي (ROLAP)

اين ابزار ها با ايجاد يك بستر روي بانكهاي رابطه اي اطلاعات را ذخيره و بازيابي مي كنند. بطوريكه اساس بهينه سازي برخي بانكهاي اطلاعاتي رابطه اي مانند  Red Brick, Micro Strategyبر همين اساس استوار است.
اندازه بانك اطلاعاتي اين ابزار قابل توجه مي باشد.

 

Hybrid OLAP (HOLAP)

در اينجا منظور از hybrid تركيبي از ROLAP  و MDBMS (طرح شده در MOLAP) است. ابزار داراي بانك اطلاعاتي بزرگ و رادمان بالاتر نسبت به ROLAP مي باشد.

 

استانداردهاي OLAP

جامعه OLAP با دو استاندارد مواجه است، از يك طرف گروه OLAP با استاندارد MD-API و از طرف ديگر Microsoft با استاندارد OLE DB for OLAP (Tensor) اولي از حمايت Oracle  و دومي از حمايت فروشندگان كوچكتري برخوردار است كه اميدوارند فروش MS-SQL7 برنامه هاي آنان را در ابعاد فروش ويندوز مطرح كند.

 

داده كاوي(Data Mining)

ابزارهاي داده كاوي با جستجوي حجم عظيم داده هاي ما مي توانند تكه طلاي كوچكي را كه در گوشه اي پنهان شده بيابند. بازگشت هزينه صرف شده در اين ابزارها غالبا بسيار سريع است. مثلا در بررسي داده هاي يك واحد از يك فروشگاه متوجه شدند كه ميزان سرقت حين فروش از باتريها و فيلمها و قلم هاي با قيمت متوسط ماهانه حدود 60000 دلار براي فروشگاه هزينه داشته است كه به اين ترتيب با جابجاكردن اقلام و قرار دادن در قسمتهاي با ديد بهتر سالانه حدود 700000 دلار صرفه جويي بدنبال داشته است.
ابزارهاي داده كاوي بدنبال طرحها و گروه بندي هايي  در داده ها مي گردد كه ممكن است از ديد ما پنهان مانده باشد. ابزار تقريبا از كاربر هيچ كمكي نمي گيرد. بر خلاف ابزارهاي OLAP كه استفاده كنندگان راهنما و سازمان دهنده اطلاعات هستند در داده كاوي اين ابزار است كه استفاده كننده را هدايت مي كند. ابزار فرض مي كند كه شما خود نيز دقيقا نمي دانيد كه چه مي خواهيد. 

 

بيشتر اين ابزار ها از روش هاي جستجوي زير استفاده ميكنند:

1- ارتباطات كه اصطلاحا تحليل سبد بازار خوانده مي شود. ابزار  بدنبال اثبات اين موضوع است كه وجود چيزي بمعني وجود چيز ديگريست. مثلا بيشتر خريداران لوازم غواصي به تعطيلات تابستاني در استراليا مي روند. يا مصرف كننده يك كالاي مشخص مصرف كرده خريدار كا لاي ديگري نيز هست.
2- ارتباطات متوالي ابزار بدنبال روابط متوالي بين موضوعات مي گردد مثلا وقتي قيمت طلا 10 درصد بالا مي رود يك هفته بعد قيمت سهام 15 درصد پايين مي آيد.
3- دسته بندي بدنبال دسته بندي و طبقه بندي سطح بالاي اطلاعات هستند. مثلا 70 درصد راي دهندگاني كه تصميم نگرفته اند به كه راي دهند درآمدي بالاي 60000 دلار دارند بين 40 تا 50  سال سن دارند و در منطقه X اقامت دارند. 
اگر اطلاعات جدول زير در يك گراف دو بعدي به تصوير در آيد متوجه مي شويم كه بنظر مي رسيد افراد بين 23 تا 29 به مكزيك و بين 30 تا 51 به كانادا سفر مي كنند.
سن                    مشتري كشوري كه به آن سفر كرده

23                       مكزيك
45                       كانادا
32                       كانادا
47                       كانادا
46                       كانادا
34                       كانادا
51                       كانادا
28                       مكزيك
49                       كانادا
29                       مكزيك
26                       مكزيك
31                       كانادا
يك نكته جالب ديگر كه بسادگي قابل ديدن نيست آنستكه افراد بين 35 تا 44 اصلا سفر نمي كنند بعبارت ديگر دو دسته آدم به كانادا سفر مي كنند آنها كه بين 30 تا 34 و آنها كه بين 45 تا 51 سال سن دارند. گروه بندي در اين مجموعه اطلاعات كوچك و دو بعدي بسادگي قابل رويت است . چنانچه ابعاد اطلاعات و حجم آن افزايش يابد موضوع به سادگي گذشته نخواهد بود. گفتني است  تعداد نمونه ها، تعداد ستونهاي اطلاعاتي و مقاديري كه هر يك از ستونها مي گيرند در سرعت پردازش داده كاوي موثر هستند. مثلا براي پردازش 1000000 نمونه با 200 ستون اطلاعاتي كه هر يك مي توانند 25 مقدار مختلف به خود بگيرند  به حدود 2 ساعت وقت نيازاست .
اين ابزار ها در زمينه هاي مختلف كاربرد يافته اند.از جمله محققين بهداشت براي كشف ميزان موفقيت جراحيها . بانكها براي ارزيابي اعتبار مشتريان،  بورس بازان براي تشخيص جابجايي قيمتهاي سهام و تشخيص طرحهاي تجاري ، شركتهاي بيمه براي تشخيص ريسك مشتريان و رفتارهايشان و هتل ها براي تشخيص مشتريان بازگشتي خود از آن استفاده ميكنند. همانطوريكه بنظر مي آيد ابزارهاي داده كاوي از مجمئعه ابزارهاي  يك رده بالاتر هستند كه استفاده هاي قابل توجهي براي آنها در صنعت قابل تصور است.
 

برخي از انواع تجاري اين ابزار عبارتند از :

 

Intelligent Miner

 

Darwin, MineSet

 

KnowledgeStudio

 

DataMind

 

Clementine


 

كارآگاهان شخصي

اين مامورين برنامه هاي قابل حملي هستند كه با اتصال به انباره هاي داده اطلاعات مورد نياز را استخراح كرده و به كارفرمايان خود اطلاع مي دهند. در حال حاضر اين ابزارها بر اساس قوانين تعريف شده از طرف كارفرماي خود به جستجوي تغييرات در اطلاعات رفته و در صورت مشاهده تغيير پيغام مناسب را مي دهند. 
 

هنوز كار هاي زيادي در اين قسمت بايستي صورت پذيرد كه از آن جمله اند :

  • درك داده ها بر اساس دانش درون ابزار (هوشمند شدن)، درك علائق كارفرما و جستجو دربانكهاي اطلاعاتي مختلف براي اعلام تغييرات به كارفرما.
  •  برنامه هاي كاريابي روي اينترنت با توجه به رزومه كاربر و  يا برنامه هاي همسر يابي با توجه به مشخصات. برنامه هايي كه تغييرات را در سايتهاي Microsoft  و ساير شركتها اعلام مي كنند و  .... مثالهاي ساده اي از اين نوع برنامه ها هستند.

 


تگها: OLAP   داده های چند بعدی   داده کاوی     

HyperLink

ارسال نظر در مورد این مطلب
نام :  
آدرس ایمیل :  
متن پیام :  
کد امنیتی :  
   
   
نظری برای نمایش وجود ندارد
 
این مطلب را به اشتراک بگذارید: