डेटा खाण आणि डेटा वेदरिंग दरम्यान फरक

Anonim

ज्या आकडेवारीकडे आकर्षित आहेत ते डेटा माइनिंग वापरतात. डेटामध्ये छद्ल नमुने शोधण्याकरिता ते सांख्यिकीय मॉडेलचा वापर करतात. डेटा खाण कामगार विविध डेटा घटकांमधील उपयुक्त नाते शोधण्यास इच्छुक आहेत, जे व्यवसायांसाठी शेवटी फायदेशीर आहे. पण दुसरीकडे, माहितीचा तज्ञ जो व्यवसाय विस्तारावर विसंबून करू शकतात ते थेट डेटा वेअरहाऊसचा वापर करतात.

डेटा खाण याला माहितीतील ज्ञान डिस्कवरी (केडीडी) म्हणून देखील ओळखले जाते. वर नमूद केल्याप्रमाणे, हे संगणक विज्ञानाचे क्षेत्र आहे, जे कच्च्या डेटावरून पूर्वी अज्ञात आणि मनोरंजक माहिती काढून टाकते. डेटाच्या घातांकीय वाढीमुळे, विशेषत: व्यवसाय, डेटा खाण हे मोठ्या बुडीत संपत्तीचे व्यावसायिक बुद्धिमत्तेमध्ये रूपांतर करण्यास फार महत्वाचे साधन बनले आहे, कारण गेल्या काही दशकांत नमुन्यांची हस्तपुस्तिका उशिर होत आहे. उदाहरणार्थ, सध्या तो सोशल नेटवर्किंग विश्लेषण, फोरम डिटेक्शन आणि मार्केटिंग यासारख्या विविध अनुप्रयोगांसाठी वापरला जात आहे. डेटा खाण सामान्यतः खालील चार कार्यांशी संबंधित आहे: क्लस्टरिंग, वर्गीकरण, प्रतिगमन, आणि संघटना. क्लस्टरिंग हे असंघटित डेटावरून समान गट ओळखते आहे. वर्गीकरण हे नियम शिकत आहे जे नवीन डेटावर लागू केले जाऊ शकतात आणि त्यामध्ये विशेषतः पुढील चरणांचा समावेश असेल: डेटाची पूर्वप्रक्रिया, मॉडेलिंगची रचना करणे, शिकणे / वैशिष्ट्य निवड आणि मूल्यमापन / प्रमाणीकरण. प्रतिगमन मॉडेल डेटावर किमान त्रुटी कार्ये शोधत आहे. आणि असोसिएशन वेरिएबल्स मध्ये संबंध शोधत आहे डेटा खाण सामान्यतः मुख्य उत्पादने आहेत जे वाल-मार्ट मध्ये पुढच्या वर्षी उच्च नफा मिळविण्यात मदत करू शकतात अशा प्रश्नांची उत्तरे देण्यासाठी वापरली जातात.

वर उल्लेख केल्याप्रमाणे, डेटा वेअरहाउसिंगचा उपयोग डेटाचे विश्लेषण करण्यासाठी केला जातो, परंतु वापरकर्त्यांच्या वेगवेगळ्या सेटमुळे आणि थोड्या वेगळ्या ध्येयाची आठवण ठेवून. उदाहरणार्थ, किरकोळ क्षेत्रास येते तेव्हा, डेटा वेअरहाउसिंग वापरकर्ते ग्राहकांशी कोणत्या प्रकारचे खरेदी लोकप्रिय असतात याबद्दल अधिक काळजी घेतात, त्यामुळे विश्लेषणांचे परिणाम ग्राहकांना अनुभव सुधारून ग्राहकांना मदत करू शकतात. परंतु डेटा खनिजे प्रथम एक गृहित कल्पना मांडतात जसे की ग्राहक विशिष्ट प्रकारची उत्पादने खरेदी करतात आणि गृहीतके तपासण्यासाठी डेटाचे विश्लेषण करतात. डेटा वेअरहाउसिंग मुख्य किरकोळ विक्रेता द्वारे केली जाऊ शकते, ज्याने सुरुवातीला स्टोअरमध्ये त्याच आकाराच्या उत्पादनांसह स्टॉकची खरेदी केली, नंतर हे शोधले की न्यूयॉर्क स्टोअर लहान आकाराचे इन्व्हेन्टरी शिकागो दुकानापेक्षा अधिक वेगाने विक्री करते. तर या परिणामाकडे पाहून रिटेलर शिकागो स्टोअरच्या तुलनेत न्यू यॉर्क स्टोअर लहान आकारात साठवू शकतो.

म्हणून, जशी स्पष्टपणे आपण पाहू शकता, विश्लेषण या दोन प्रकारांची एकसारख्या निसर्ग डोळ्याला दिसतात. दोन्ही ऐतिहासिक डेटावर आधारित नफा वाढत करण्याबद्दल चिंता करतात. पण अर्थातच, मुख्य फरक आहेत सोप्या भाषेत, डेटा खनन आणि डेटा वेअरहाउसिंग विविध प्रकारचे विश्लेषणे सादर करण्यासाठी समर्पित आहेत, परंतु निश्चितपणे वेगवेगळ्या प्रकारच्या वापरकर्त्यांसाठी दुसऱ्या शब्दांत, डेटा खनन सहसंबंधांसाठी शोधतो, मोजमाप एक संख्याशास्त्रीय गृहीते समर्थन करण्यासाठी. परंतु डेटा वेअरहाउसिंगला तुलनेने विस्तृत प्रश्नाचे उत्तर आहे आणि ते भविष्यात सुधारणा करण्याचे मार्ग ओळखण्यासाठी तेथून ते कापून आणि डाइस डेटा.