Data Deduplicaton چیست؟

Data Deduplicaton چیست؟

Data Deduplicaton به معنای حذف داده های ثبت شده ی تکراری از یک دیتا یا اطلاعات ثبت شده است که می تواند تا حد زیادی باعث گسترش فضای ذخیره سازی سیستم است.

اگر در زمینه ی ای تی فعالیت کرده باشید، یا مسئول بک آپ گرفتن و انتقال حجم زیادی از اطلاعات باشید، به احتمال زیاد تا به حال کلمه ی Data Deduplication یا حذف داده های تکراری را شنیده اید. در این مقاله از سی ار ام سنا، قصد داریم تا یک دید واضح از این کلمه به شما عزیزان ارائه کنیم.

اول از همه، مفاهیم پایه

در ساده ترین تعریف، Data deduplication به روشی برای حذف اطلاعات تکراری و آزاد کردن فضای ذخیره سازی در سیستم گفته می شود. در این روش، تمامی کپی های اضافه از یک نوع دیتا حذف می شود و تنها یک نسخه از آن در سیستم باقی می ماند.

در این روش دیتا ها تجزیه و تحلیل می شوند تا الگو ها چندگانگی اطلاعات شناسایی شوند و سیستم مطمئن شود که نسخه ی باقی مانده تنها نسخه از آن اطلاعات است. پس از آن، کپی های مختلف از دیتا با یک مرجع که به نسخه ی باقی مانده اشاره می کند جایگزین می شود.

حالا که تا اینجای کار همراه ما بودید، پیشنهاد میکنیم حتما نگاهی هم به مقاله مدیریت مزایا در یک شرکت هم بندازید، حتما به دردتون میخوره!

با توجه به اینکه الگو های تکرار ممکن است ده ها، صد ها یا هزاران بار تکرار شوند، فکر کنید هر بار که تغییر جزئی در فایل اکسل یا پاور پوینت مربوط به دیتا ایجاد می کنید می تواند تا چه حد از فضای ذخیره سازی شما را اشغال کند.

در برخی از شرکت ها، 80 درصد از اطلاعات شرکت در سر تا سر سازمان چندین بار ذخیره یا Duplicate شده اند. کاهش نرخ انتقال اطلاعات در شبکه می تواند باعث افزایش هزینه های مربوط به ذخیره سازی و سرعت پشتیبان (Back-Up) گیری شود.

یک مثال واقعی

سرور ایمیلی را در نظر بگیرید که یک فایل 1 مگابایتی، که مثلا یک فایل معرفی محصول دارای عکس است و به همه ی افراد تیم فروش فرستاده شده است را در خود ذخیره کرده باشد، و مدیر فروش این فایل را به همه ی اعضای تیم فروش فرستاده باشد.

اگر حتی فرض کنیم که این فایل چندین بار ذخیره نمی شود یا به اصطلاح duplicate نمی شود، اگر همه ی افراد یک بک آپ از این فایل بگیرند، 100 عدد کپی از این فایل ذخیره می شود که این امر حداقل باعث اشغال 100 مگابایت در سرور خواهد شد.

برطرف کردن دیتای تکراری

اما با استفاده از قابلیت deduplication تنها یک نسخه از این فایل در سرور ذخیره خواهد شد، و باقی بک آپ ها به فایل اصلی ارجاع داده می شوند و هر زمان که کاربری قصد استفاده از این دیتا را داشته باشد می تواند نسخه ی اصلی را مشاهده کند. این کار باعث می شود که 99 مگابایت در سرور صرف جویی شود.

Deduplicaton سخت افزاری و نرم افزاری

حذف دیتا های تکراری یا دی داپلیکیشن از دو روش سخت افزاری و نرم افزاری انجام می شود.

روش سخت افزاری می تواند به خوبی دیتا های تکراری را در منبع خود حذف کند، اما روش های سخت افزاری می توانند حذف دیتا را در سطح فضای ذخیره سازی اولویت بندی کنند. این امر باعث می شود که روش سخت افزاری نتواند باعث صرفه جویی در پهنای باند در سرور شود، اما می توان به دلیل سرعت بالای کار از این مشکل چشم پوشی کرد.  

روش های مختلف Deduplication

حذف اطلاعات تکراری از روش سخت افزاری می تواند عملکرد بالا، مقیاس پذیری و قابلیت گسترش خوبی به شما ارائه کند. این روش برای سازمان ها و شرکت های بزرگ می تواند گزینه ی بهتری نسبت به روش نرم افزاری باشد، و شرکت های کوچک تا متوسط بهتر است از روش نرم افزاری استفاده کنند.

روش نرم افزاری از این جهت که هزینه راه اندازی آنها کمتر است و نیازی به تغییرات گسترده در ساختار های فیزیکی شبکه در آنها نیست می توانند گزینه بهتری داشته باشند. با این حال، نصب و استفاده از روش نرم افزاری می تواند گاها سخت تر باشد.

راهکار سنا برای جلوگیری از دوگانگی اطلاعات

دوگانگی یا چندگانگی اطلاعات در هر نوع سیستمی ممکن است اتفاق بیافتد. با این حال، سنا راهکاری برای سیستم مدیریت کسب و کار هوشمند خود طراحی کرده است که کاربران خود را از استفاده از سرویس های deduplicate بی نیاز کند.

راهکار سنا این است که اجازه ی ثبت هیچ نوع اطلاعات مشابه مانند ثبت مشتریان یا کاربران را در خود نمی دهد که این کار باعث می شود که اطلاعات مشابه جایی در سیستم نداشته باشند.

این کار باعث می شود که کاربران و مشتریان سنا نیازی به صرف هزینه های اضافی بابت استفاده از سیستم های حذف اطلاعات اضافی نپردازند، و حتی وقت خود را بابت حذف دستی این اطلاعات (اگر حجم اطلاعات این اجازه را بدهد) تلف نکنند.

تلگرام

پیشنهاد میکنیم در تلگرام

با ما ارتباط برقرار کنید.

اینستاگرام

پیشنهاد میکنیم در اینستاگرام

با ما ارتباط برقرار کنید.