طبق تعریف گارتنر کلانداده یا بیگدیتا، داراییهای اطلاعاتی یک مجموعه یا سازمان است که، حجم بالا و تنوع زیادی دارند، با سرعت زیاد تولید میشوند، نیازمند شیوههای پردازش نوآورانه با هزینهی مناسب هستند تا بتوان از آنها برای اتوماسیون فرآیندها، انواع تصمیمگیریها و بهبود شهود و بینش در سازمان بهره گرفت. سازمانهایی که قصد رهسپاری در سفر تحول دیجیتال را دارند، داده را به عنوان یک دارایی استراتژیک میبینند و به همین دلیل، نیاز به تحلیل، درک و هدایت دارایی داده سازمان به عنوان یک هدف، افزایش مییابد. برای تبدیل داده سازمانی به یک داده ارزشمند، نیاز است تا استراتژی داده تدوین گردد. صنعت بانکی در حال حاضر یکی از سرمایهگذاران برتر در زمینه کلاندادهها و تجزیه و تحلیل کسبوکار در بین صنایع است. میزان دادههای تولیدشده توسط صنعت مالی بسیار زیاد است. قابلیت استفاده از این دادهها برای تصمیمگیری در مورد کسبوکار و پردازش آن به طور مؤثر برای جمعآوری بینشهای عملی، جهت پیروزی در رقابتهای آینده بسیار مهم است.
حجم اطلاعات در جهان با سرعت نمايي رشد ميکند. نرخ رشد اطلاعات نيز روز به روز سريعتر ميگردد. مهمترين علت اين موضوع توليد اطلاعات از طريق منابع مختلف اطلاعاتي جديد ميباشد. در گذشته منابع توليد اطلاعات سيستمهاي پردازش تراکنش[1] (TPS) بودند. سپس اين سيستمها به سيستمهاي مديريت اطلاعات[2] (MIS) تبديل شدند و حجم بيشتري از اطلاعات توليد نمودند. با ظهور سيستمهاي هوش تجاري[3] (BI) و نياز به نگهداري اطلاعات بر مبناي زمان، باز هم نياز به حجم بيشتر فضاي نگهداري اطلاعات وجود داشت. اين حجم اطلاعات رفته رفته به حدي رسيد که بيشتر از تواناييهاي پردازشي يک گره[4] گرديد.
توليد روز افزون اطلاعات تنها مربوط سيستمهاي پردازش تراکنش (TPS)، سيستمهاي مديريت اطلاعات (MIS) و سيستمهاي هوش تجاري (BI)، نميباشد. حجم روزافزون اطلاعات دلايل ديگري نيز دارد. دليل اول ظهور ابزارهايي[5] است که با سرعت زيادي توليد اطلاعات مينمايند. از مهمترين اين ابزارها ميتوان به حسگر[6] ها، ابزارهاي علمي مانند ميکروسکوپها، ابزارهاي هواشناسي نوين و … اشاره نمود. اين ابزارها دادههايي با ابعاد وسيع توليد مينمايند و با سرعت زياد ارسال ميکنند. حجم زياد اطلاعات ارسالي توسط اين ابزارها که تعداد آنها معمولاً زياد است باعث ايجاد گلوگاه در ذخيرهسازي اين اطلاعات ميگردد. همچنين بازيابي اين اطلاعات خود ميتواند معضل بزرگي را ايجاد نمايد.
اخيرا نيز رشد شبکههاي تبادل و اشتراکگذاري ديتا و محتوا مانند شبکههاي اجتماعي[7] (SN) بر ابعاد و پيچيدگي پشتيباني از پردازشي اطلاعات افزود. لذا علاوه بر ابزارهايي که با حجم زياد اطلاعات توليد ميکنند، سيستمهايي مانند شبکههاي اجتماعي با امکان توليد و تبادل اطلاعات توسط تمام اعضاي شبکه، گردش انبوهي از اطلاعات را شکل داده است. مدل توليد اطلاعات در گذشته به اين نحو بود که يک منبع داده، مثلاً سايت خبري، اطلاعاتي را منتشر مينمود و بقيه کاربران از اين اطلاعات استفاده ميکردند. اما در مدلهاي شبکه اجتماعي تمامي کاربران محتوا ايجاد و تمامي آنها نيز از اطلاعات استفاده مينمايند، لذا سرعت توليد اطلاعات بسيار بالاتر از گذشته شد. بنابر توضيحات فوق جهان با انفجار اطلاعاتي مواجه گرديده است به نحوي که سيستمهاي قبلي ذخيرهسازي و بازيابي اطلاعات توان مديريت اين سطح از اطلاعات و داده را ندارد. به عبارت ديگر سمپاد (DBMS) موجود، پاسخگوي نياز ذخيرهسازي و بازيابي اطلاعات نبودند.
به اين نوع از دادهها که توسط سمپادهاي موجود قابل مديريت نبودند، کلان داده[8] اطلاق ميگردد. تعريف ديگري که در مورد کلان داده وجود دارد عبارت است از دادهاي که داراي سه خصوصيت حجم، سرعت و تنوع در دادهها باشد. البته بعضاً خصوصيات ديگري مانند ابهام در دادهها نيز به خصوصيات قبلي اضافه شده است که لزوماً قابل اعتماد و اتکا نيستند و از نظر مفهومي ممکن است صحيح نباشد. معناي هر کدام از خصوصيات در ادامه بيان شده است.
- حجم: منظور از اين خصوصيت آن است که حجم دادهها به قدري زياد باشد که با سيستمهاي مديريت داده کنوني قابل مديريت نباشد.
- سرعت: منظور از اين خصوصيت آن است که اطلاعات با سرعت زيادي توليد شده و اگر در زمان مقتضي مورد پردازش قرار نگيرند ارزش خود را از دست ميدهند.
- تنوع: منظور از اين خصوصيت کلان داده آن است که دادهها با قالبهاي گوناگون وجود دارد. (عدد، رشته، فايل و …) و سيستم مديريت کلان داده بايد بتواند اين گونه اطلاعات را مديريت نمايد.
[1] Transaction Processing System
[2] Management Information System
[3] Business Intelligence
[4] Node
[5] Device
[6] Sensor
[7] Social Networks
[8] Big Data
مطالب مرتبط :
- مدل بلوغ داده در بانک با رویکرد یک سازمان داده محور
- مدیریت داده
- انبار داده جامع سازمانی
- پیادهسازی راهکار هوش تجاری