डेटा साइंस क्या है.
डेटा साइंस क्या है? (data science kya hai)
डेटा साइंस डेटा से सम्बंधित स्टडी का नाम है, जिसमें डेटा को एकत्रित करके उसका अध्ययन और विश्लेषण किया जाता है और भविष्य की योजना बनायी जाती है। इसका इस्तेमाल करते हुए बहुत-सी कंपनियों ने अपने ग्राहक सम्बन्धी डेटा का संग्रह और विश्लेषण करके कम्पनी के नतीजों में काफी सकारात्मक सुधार किये हैं।
ऐसी बहुत-सी इंडस्ट्रीज है जो डेटा साइंस का इस्तेमाल करती हैं जैसे बैंकिंग, फाइनेंस, मैन्युफैक्चरिंग, ट्रांसपोर्ट, ई-कॉमर्स, एजुकेशन।
डेटा साइंस का लक्ष्य किसी भी डेटा से सही नॉलेज प्राप्त करना होता है, चाहे डेटा संरचित हो या असंरचित।
डेटा साइंस में डेटा के विश्लेषण को तीन भागों में बांटा जाता है-
- सबसे पहले डेटा एकत्रित किया जाता है और स्टोर किया जाता है।
- उसके बाद डेटा को अलग – अलग कैटेगरी में छांटा जाता है।
- आखिर में डेटा की डिलीवरी की जाती है।
डेटा साइंस की जरुरत क्यों है?
जिस तरह का डेटा पहले इस्तेमाल किया जाता था, वो ज्यादातर संरचित और साइज में छोटा हुआ करता था जिसे आसानी से BI टूल्स की मदद से एनालाइज किया जा सकता था लेकिन आजकल जो डेटा इस्तेमाल होता है वो ज्यादातर असंरचित या अर्ध-संरचित होता है। ये डेटा बहुत से अलग-अलग सोर्सेज से कलेक्ट किया जाता है जैसे फाइनेंशियल लॉग्स, टेक्स्ट फाइल्स, मल्टीमीडिया फॉर्म्स, सेंसर्स और इंस्ट्रूमेंट्स।
सिंपल BI टूल्स इस तरह के डेटा की प्रोसेसिंग नहीं कर पाते हैं इसलिए हमें डेटा को प्रोसेस और एनालाइज करने के लिए ज्यादा कॉम्प्लेक्स और एडवांस एनालिटिकल टूल्स और एल्गोरिथम्स की जरुरत होती है।
डेटा साइंस कॉन्सेप्ट का इस्तेमाल इन एप्लीकेशन्स में होता है-
- फ्रॉड एंड रिस्क डिटेक्शन
- हेल्थ केयर
- इंटरनेट सर्च
- ट्रांसपोर्ट
- ई-कॉमर्स
- वेबसाइट रिकमेंडेशन्स
- टार्गेटेड एडवरटाइजिंग
- स्पीच रिकग्निशन
- गेमिंग
- एयरलाइन रूट प्लानिंग