डेटा खनन आणि ओएलएपी दरम्यान फरक
डेटा खनन वि OLAP
डेटा खाण आणि ओएलएपी दोन्ही सामान्य व्यवसाय बुद्धिमत्ता (बीआय) तंत्रज्ञानातील दोन आहेत व्यावसायिक बुद्धिमत्ता म्हणजे व्यवसाय डेटावरून उपयुक्त माहिती ओळखण्यासाठी आणि काढण्यासाठी संगणक-आधारित पद्धती. डेटा खाण संगणक विज्ञानाचे क्षेत्र आहे, जे मोठ्या प्रमाणावरील डेटावरून आकर्षक नमुन्या काढण्याशी संबंधित आहे. हे कृत्रिम बुद्धीमत्ता, आकडेवारी आणि डेटाबेस व्यवस्थापन यांच्या अनेक पद्धती एकत्र करते. ओएलएपी (ऑनलाइन विश्लेषणात्मक प्रक्रिया) नावाप्रमाणेच मल्टी-डायमेंसिक डेटाबेसची चौकशी करण्याच्या पद्धतींचे संकलन आहे.
डेटा खाण याला माहितीतील ज्ञान डिस्कवरी (केडीडी) म्हणून देखील ओळखले जाते. वर नमूद केल्याप्रमाणे, हे संगणक विज्ञानाचे क्षेत्र आहे, जे कच्च्या डेटावरून पूर्वी अज्ञात आणि मनोरंजक माहिती काढून टाकते. डेटाच्या घातांकीय वाढीमुळे, विशेषत: व्यवसाय, डेटा खाण हे मोठ्या बुडीत संपत्तीचे व्यावसायिक बुद्धिमत्तेमध्ये रूपांतर करण्यास फार महत्वाचे साधन बनले आहे, कारण गेल्या काही दशकांत नमुन्यांची हस्तपुस्तिका उशिर होत आहे. उदाहरणार्थ, सध्या तो सोशल नेटवर्किंग विश्लेषण, फोरम डिटेक्शन आणि मार्केटिंग यासारख्या विविध अनुप्रयोगांसाठी वापरला जात आहे. डेटा खाण सामान्यतः खालील चार कार्यांशी संबंधित आहे: क्लस्टरिंग, वर्गीकरण, प्रतिगमन, आणि संघटना. क्लस्टरिंग हे असंघटित डेटावरून समान गट ओळखते आहे. वर्गीकरण हे नियम शिकत आहे जे नवीन डेटावर लागू केले जाऊ शकतात आणि त्यात पुढील चरणांचा समावेश असेल: डेटाची पूर्वप्रक्रिया, मॉडेलिंग डिझाइन, शिकणे / वैशिष्ट्य निवड आणि मूल्यमापन / प्रमाणीकरण. प्रतिगमन मॉडेल डेटावर किमान त्रुटी कार्ये शोधत आहे. आणि असोसिएशन वेरिएबल्स मध्ये संबंध शोधत आहे डेटा खाण साधारणतः मुख्य उत्पादने आहेत जे वाल-मार्ट मध्ये पुढच्या वर्षी उच्च नफा प्राप्त करण्यास मदत करू शकतात अशा प्रश्नांना उत्तरे देण्यासाठी वापरले जाते.
ओएलएपी ही एक प्रणाली आहे, ज्यामुळे मल्टि-डीमेनिअल क्वेरींची उत्तरे दिली जातात. सामान्यत: OLAP चा विपणन, अंदाजपत्रक, अंदाज आणि तत्सम अनुप्रयोगांसाठी वापरले जाते. हे असे न म्हणता असे सांगते की ओएलएपी साठी वापरल्या जाणा-या डेटाबेस जटिल आणि ऍड-हॉक प्रश्नांसाठी जलद कामगिरीसह कॉन्फिगर केल्या जातात. थोडक्यात एक मॅट्रिक्स OLAP चे आउटपुट प्रदर्शित करण्यासाठी वापरले जाते. पंक्ती आणि स्तंभ क्वेरीच्या परिमाणानुसार तयार केले जातात. सारांश निवडण्यासाठी ते बर्याच सारण्यांवर एकत्रित करण्याच्या पद्धती वापरतात उदाहरणार्थ, गेल्या वर्षीच्या तुलनेत वॉल-मार्टमध्ये या वर्षाची विक्री कशी करायची याचा विचार केला जाऊ शकतो? पुढील तिमाहीत विक्रीवरील अंदाज काय आहे? टक्केवारीतील बदल पाहून या कलबद्दल काय म्हणता येईल?
हे उघड आहे की डेटा खाण आणि ओएलएपी समान आहेत कारण ते डेटा प्राप्त करण्यासाठी माहितीवर कार्य करतात, मुख्य फरक ते डेटावर कार्य कसे करतात त्यावरून येते.ओएलएपी साधने बहुआयामी डेटा विश्लेषण प्रदान करते आणि ते डेटाचे सारांश देतात परंतु तीव्रता, डेटा खाण डेटाच्या संचातील प्रमाण, नमुन्यांची आणि प्रभावांवर केंद्रित करते. तो एक असा एक ओएलएपी करार आहे जो "ऍडिशन" द्वारे डेटाच्या ऑपरेशनमध्ये उकळते परंतु डेटा खाण "डिव्हीजन" शी संबंधित आहे. इतर लक्षणीय फरक असा आहे की डेटा खाण साधणे मॉडेल डेटा आणि परताव्याच्या कारणास्तव नियम असताना, ओअलॅप वास्तविक वेळेत व्यवसाय आयामांशी तुलना आणि भिन्नता तंत्रांचा अवलंब करेल.