सेमी सामील व्हा आणि ब्लूम सामील होणे

Anonim

अर्ध सामील व्हा ब्ल्यूम सामील व्हा

अर्ध सहभागी आणि ब्लूम सामील दोन उपायांसाठी वापरल्या जाणार्या व्युत्पन्न डेटाबेससाठी क्वेरी प्रोसेसिंगसाठी वापरलेल्या पद्धतींमध्ये प्रक्रिया करताना वितररत डाटाबेसमध्ये प्रश्नांची प्रक्रिया करताना, वेगवेगळ्या साइट्सवर असलेल्या डाटाबेस दरम्यान डेटाला स्थानांतरित करणे आवश्यक आहे. हस्तांतरित करणे आवश्यक असलेल्या डेटाच्या प्रमाणावर अवलंबून हे एक महाग ऑपरेशन असू शकते. म्हणून जेव्हा वितरित डेटाबेस पर्यावरणात प्रश्नांची प्रक्रिया करता तेव्हा साइट्स दरम्यान स्थानांतरित केलेल्या डेटाची संख्या कमी करण्यासाठी क्वेरी अनुकूलित करणे महत्त्वाचे असते. अर्धवागरावरील आणि Bloom join दोन पद्धती आहेत ज्याचा वापर डेटा ट्रान्सफर कमी करण्यासाठी आणि कार्यक्षम क्वेरी प्रोसेसिंग करण्यासाठी केला जाऊ शकतो.

सेमी सेनमध्ये सामील काय आहे?

अर्धवेशन एक वितरित डेटाबेस पर्यावरणात प्रभावी क्वेरी प्रक्रियेसाठी वापरली जाणारी एक पद्धत आहे साइट 1 येथे असलेल्या एखाद्या कर्मचा-या डेटाबेस (कर्मचारी नाव, डिपार्टमेंट नंबरसाठी काम करत आहे इत्यादी) आणि साइटवर स्थित डिपार्टमेंट डाटाबेस (डिपार्टमेन्ट नंबर, डिपार्टमेंटचे नाव, स्थान इत्यादि) धारण करणार्या परिस्थितीचा विचार करा. 2. जर आपल्याला साइट 3 वर स्थित क्वेरी प्रोसेसरमध्ये क्वेरी कार्यान्वित करून त्यास कर्मचारी नाव आणि विभाग नाव (फक्त "न्यू यॉर्क" मध्ये स्थित असलेले विभाग) साठी काम करायचे असेल तर बरेच मार्ग आहेत हे काम साध्य करण्यासाठी तीन साइट्स दरम्यान डेटा हस्तांतरीत केला जाऊ शकतो. परंतु डेटा स्थानांतरीत करतांना हे लक्षात घेणे महत्वाचे आहे की साइट्स दरम्यान संपूर्ण डेटाबेस स्थानांतरित करणे आवश्यक नाही. केवळ काही वैशिष्ट्ये (किंवा ट्यूप्ले) ज्यात सामील होण्यासाठी आवश्यक आहेत ती क्वेरी प्रभावीपणे वापरण्यासाठी साइट्स दरम्यान हस्तांतरित करणे आवश्यक आहे. अर्धवापराची एक अशी पद्धत आहे ज्याचा वापर साइट्स दरम्यान पाठवलेल्या डेटाची संख्या कमी करण्यासाठी केला जाऊ शकतो. अर्ध सामील मध्ये, केवळ सामील कॉलम एका साइटवरून दुस-याकडे हस्तांतरित केला जातो आणि त्यानंतर स्थानांतरित केलेल्या स्तंभाचा उपयोग अन्य साइट्सच्या दरम्यान केलेल्या जोडलेल्या संबंधांचे आकार कमी करण्यासाठी केला जातो. वरील उदाहरणासाठी, आपण फक्त विभाग क्रमांक आणि विभागाचे नाव ट्यूपलेचे स्थान = "न्यू यॉर्क" साईट 2 वरून 1 साईटवर बदलू शकता आणि साइट 1 वर सामील होणे आणि शेवटचा संबंध 3 ते 3 साइटवर स्थानांतरित करू शकता.

ब्लूम जॉइन काय आहे?

आधी नमूद केल्याप्रमाणे, वितरीत डेटाबेस वातावरणात क्वेरी निष्पादित करताना साईट्स दरम्यान अनावश्यक डेटा स्थानांतरित करणे टाळण्यासाठी दुसरी पद्धत वापरली जाते. ब्लूम जॉइन मध्ये, कॉलममध्ये स्वतःच हस्तांतरीत करण्याऐवजी, जोडलेल्या स्तंभाचे कॉम्पॅक्ट प्रतिनिधित्व साइट्स दरम्यान हस्तांतरित केले जाते. ब्लूम जॉइनमध्ये एक ब्लूम फिल्टरचा वापर केला जातो जो सदस्यता प्रश्नांची अंमलबजावणी करण्यासाठी थोडा व्हेक्टर वापरतो. प्रथम, जोडणी स्तंभ वापरून एक फुल फिल्टर तयार करण्यात आला आहे आणि तो साइट दरम्यान हस्तांतरित केला जातो आणि नंतर सामील होण्याची कार्यवाही केली जाते.

सेमी सामील व्हा आणि ब्लूम यांच्यात काय फरक आहे?

जरी वितरित डाटाबेस वातावरणात क्वेरी निष्पादित करताना साइट्स दरम्यान स्थानांतरित केलेल्या डेटाची संख्या कमी करण्यासाठी दोन्ही अर्ध सामील व्हा आणि ब्लूम जॉब पद्धती वापरल्या गेल्या आहेत, तरीही Bloom join सहसा अर्ध-सामील होण्याशी तुलना करण्यात आलेल्या डेटाची संख्या (ट्यूपल संख्या) कमी करते. ब्लूम फिल्टरची संकल्पना वापरुन, जे सेट सदस्यता निश्चित करण्यासाठी थोडी सदिश वापरतात. म्हणूनच ब्लूम जॉब वापरून अर्ध जोडून वापरण्यापेक्षा अधिक प्रभावी होईल.