نوشته‌ها

database backup plans

آموزش بکاپ گیری از دیتابیس MySQL

درباره اهمیت بکاپ گیری و ویژگی‌های یک پلن بکاپ گیری از دیتابیس مفصلا صحبت کردیم. اما بطور خلاصه، با توجه به اهمیت اطلاعات پایگاه داده و سرعت بالای تغییرات در آن، لازم است بطور دوره‌ای از دیتابیس خود نسخه پشتیبان تهیه کنیم. در این مقاله به انواع روش‌های بکاپ گیری از دیتابیس (به خصوص MySQL)، نحوه برگرداندن بکاپ دیتابیس، نحوه بکاپ گرفتن از دیتابیس در فضای ابری و بکاپ گیری اتوماتیک از دیتابیس خواهیم پرداخت.

روش‌های بکاپ گیری از دیتابیس MySQL

روش‌های مختلفی برای بکاپ گیری (Backup) از پایگاه داده MySQL وجود دارد که براساس نحوه پیاده سازی سرویس شما و زیرساختی که از آن استفاده می‌کنید متفاوت است. چنانچه سایت یا اپلیکیشن خود را بطور مستقیم روی سرور مجازی پیاده سازی کرده‌اید، باید از ابزار mysqldump برای بکاپ استفاده کنید. اگر در کنار سرویس‌های سایت یا اپلیکیشن خود، ابزار phpMyAdmin را هم نصب کرده‌اید، می‌توانید از رابط گرافیکی آن برای دانلود نسخه پشتیبان از پایگاه داده خود استفاده کنید. همچنین در صورتی که سرویس دهنده شما پنل دایرکت ادمین یا cpanel در اختیار شما قرار داده یا از ارائه دهندگان دیتابیس ابری خدمت می‌گیرید، می‌توانید به راحتی از پرتال آن‌ها برای زمان‌بندی و بک آپ گیری دیتابیس خود استفاده کنید. در ادامه هر کدام از این روش‌ها را با جزئیات بیشتر شرح می‌دهیم.

نحوه بکاپ گیری از دیتابیس با استفاده از خط فرمان CLI سرور

اگر سایت یا نرم افزار شما بدون واسطه روی سرور لینوکسی نصب شده که مدیریت آن بر عهده‌ی خود شماست، می‌توانید براحتی با استفاده از ابزار  mysqldump (که بصورت پیش‌فرض با دیتابیس mysql نصب می‌شود) از دیتایس بکاپ بگیرید. برای این کار به سرور خود ssh زده و دستور زیر را با دسترسی روت اجرا کنید:

$ sudo mysqldump -u [user] -p [database_name] > [filename].sql

فراموش نکنید که باید نام کاربری دیتابیس، نام دیتابیس و نام فایل را در دستور بالا جایگزین کنید. اگر می‌خواهید از همه دیتابیس‌های سیستم بکاپ بگیرید می‌توانید دستور مذکور را با آپشن‌های زیر اجرا کنید. این دستور تاریخ روز را هم به اسم فایل بکاپ اضافه می‌کند:

$ mysqldump --all-databases --single-transaction --quick --lock-tables=false > full-backup-$(date +%F).sql -u root -p

نحوه برگرداندن بکاپ دیتابیس با استفاده از خط فرمان CLI سرور

بازگردانی (Restore) بکاپ دیتابیسی که با استفاده از خط فرمان گرفته‌اید هم به اندازه بکاپ گیری آن ساده بوده و با یک خط انجام می‌شود. فقط به خاطر داشته باشید که برای برگرداندن بکاپ باید بجای mysqldump از دستور mysql استفاده کنید:

$ mysql -u [user] -p [database_name] < [filename].sql

نحوه بکاپ گیری از MySQL با استفاده از phpMyAdmin

یکی از ابزارهای اختیاری که مدیریت پایگاه داده MySQL را تسهیل می کند phpMyAdmin است. اگر این ابزار را روی سرور دیتابیس خود نصب کرده‌اید، می‌توانید از آن برای بکاپ گیری دیتابیس خود استفاده کنید.

برای این کار ابتدا وارد پنل phpMyAdmin شده و از ستون سمت چپ دیتابیس مورد نظر خود را انتخاب کنید.

سپس از نوار بالا روی لینک Export کلیک کنید. برای سرعت بیشتر متد بکاپ quick و فرمت sql را انتخاب کرده و دکمه Go را بزنید تا فایل بکاپ شما دانلود شود.

phpmyadmin database backup

نحوه برگرداندن بکاپ دیتابیس MySQL با استفاده از phpMyAdmin

بازگردانی بکاپ دیتابیس را هم می‌توانید بوسیله پنل phpMyAdmin انجام دهید. تنها نکته‌ای که هنگام برگرداندن بک آپ دیتابیس باید به آن توجه کنید خالی بودن دیتابیس فعلی است؛ چراکه اطلاعات بازگردانی شده با اطلاعات قبلی جایگزین (overwrite) نمی‌شود. بنابراین اگر داده‌ای از قبل در دیتابیس وجود داشته باشد، بازگردانی بک آپ ممکن است باعث ایجاد ردیف‌های تکراری یا اختلال و خطا شود.

بنابراین همیشه قبل از بازگردانی فایل پکاپ دیتابیس، دیتابیس فعلی را پاک کنید. برای این کار از ستون سمت چپ phpMyAdmin پایگاه داده مورد نظر خود را انتخاب کنید. سپس در انتهای لیست جدول‌ها گزینه Check All را انتخاب کرده و در لیست مقابل آن Drop را بزنید. برای تایید دکمه Yes را بزنید.

حالا برای بازگردانی بک آپ دیتابیس همانند ساخت بکاپ، روی دیتابیس مورد نظر کلیک کنید، فقط این بار بجای گزینه Export گزینه Import را انتخاب کنید. فایل بکاپ پایگاه داده را انتخاب کرده و دکمه Go را بزنید.

نحوه بکاپ گرفتن از دیتابیس در فضای ابری

اصولا نگهداری بکاپ روی فضای محلی سرور یا دانلود آن روی کامپیوتر شخصی کار درستی نیست. این کار دو ایراد اساسی دارد: اول اینکه در صورت خرابی سخت افزار سرور اصلی (هارد یا SSD) یا از دسترس خارج شدن آن (مشکل شبکه) شما دسترسی به بکاپ‌های دیتابیس خود را هم از دست می‌دهید؛ که در بدترین حالت ممکن است منجر به از دست رفتن همه اطلاعات دیتابیس شما شود و بازگردانی اطلاعات پایگاه داده در سروری دیگر را غیرممکن کند. دانلود بک آپ‌های دیتابیس هم خیلی کاربردی نیست چراکه در صورت بروز خرابی، زمان بازگردانی دیتابیس و به طبع آن سرویس شما را به شدت افزایش می‌دهد.

یکی از روش‌های بهینه برای ذخیره سازی و نگهداری بک آپ های دیتابیس استفاده از فضای ابری است. فضای ذخیره سازی ابری که پرکاربردترین نوع آن آبجکت استوریج (object storage) است، به شما این امکان را می‌دهد تا فایل‌های خود را بصورت آبجکت در فضای امن و همیشه در دسترس ذخیره و نگهداری کنید. شرکت‌های ارائه‌ دهنده فضای ابری معمولا پلن‌های مختلفی متناسب با نیازهای شما ارائه می‌دهند که ذخیره‌سازی بکاپ‌های شما در فضای ابری را بسیار مقرون به صرفه می‌کند. برای مثال آمازون AWS پلن آبجکت استوریج با عنوان S3 IA (Infrequently Accessed) ارائه می‌کند؛ S3 IA یک آبجکیت استوریج برای فایل‌هایی است که به ندرت به آن‌ها نیاز خواهید داشت، دقیقا مثل فایل‌های بکاپ پایگاه داده. با استفاده از این پلن، هزینه نگهداری بکاپ‌های شما در فضای ابری بسیار پایین خواهد بود اما به ازای هر دانلود هزینه‌ای به فاکتور شما اضافه می‌شود. در ادامه نحوه بکاپ گیری از دیتابیس MySQL در فضای ابری AWS و همچنین آبجکت استوریج ابر آروان (که از استاندارد S3 آمازون AWS استفاده می‌کند) را آموزش خواهیم داد.

آموزش بک آپ گیری از دیتابیس روی آبجکت استوریج آمازون AWS

بهترین گزینه برای فضای ابری، سرویس S3 آمازون AWS است. آمازون S3 نه تنها ماندگاری داده‌های شما را با درصد ۹۹.۹۹۹۹۹۹۹۹۹۹۹ تضمین می‌کند، بلکه ۵ گیگابایت فضای ذخیره سازی رایگان ابری در اختیار شما قرار می‌دهد. پلن فضای ذخیره سازی ابری رایگان AWS یک ساله بوده و شما علاوه بر ۵ گیگابایت فضای رایگان، تا ۲۰۰۰ ریکوئست آپلود و ۲۰۰۰۰ ریکوئست دانلود رایگان خواهید داشت.

ابتدا یک باکت (Bucket) در کنسول آمازون AWS ایجاد کنید (دقت کنید که پلن 5GB Standard Free Tier را انتخاب کرده باشید). این قسمت در بخش S3 (زیر مجموعه Storage) قرار دارد. دقت کنید که قبل از ساخت باکت، region یا ناحیه مورد نظر خود را درست انتخاب کرده باشید. برای تغییر ناحیه از لیستی که سمت راست نوار بالای کنسول قرار دارد استفاده کنید.

حتما بعد از ساخت باکت یک حساب کاربری جدید با سطح دسترسی به باکت‌های S3 ایجاد کنید. برای این کار به بخش IAM در کنسول AWS وارد شده و از قسمت Users یک حساب کاربری جدید بسازید. هنگام ساخت یوزر جدید این موارد را رعایت کنید: اول اینکه نوع دسترسی کاربر (Access Type) را Programmatic Access انتخاب کنید تا کاربر شما امکان دسترسی با aws cli را داشته باشد. مورد دوم که باید رعایت کنید نوع permission انتخابی برای کاربر است که حتما باید شامل policy ادمین یا S3 باشد. در مرحله آخر هم حتما کلیدهای access و secret را ذخیره کنید زیرا فقط یک بار برای شما نمایش داده می‌شوند.

در نهایت شما باید موارد زیر را در اختیار داشته باشید که هنگام ذخیره سازی بکاپ به آن‌ها نیاز خواهیم داشت.

AWS Bucket Name

AWS Access Key ID

AWS Secret Access Key

بعد از ساخت باکت به ترمینال SSH سرور مجازی خود برگردید. برای اینکه امکان ذخیره سازی بکاپ دیتابیس روی فضای ابری AWS را داشته باشید باید AWS CLI را روی ماشین مجازی خود نصب کرده و Access key  و Secret Key خود را روی آن تنظیم کنید. در صورتی که از سرور مجازی AWS یا همان اینستنس EC2 استفاده می‌کنید این ابزار به صورت پیشفرض روی سرور شما نصب است.

$ apt install unzip curl
$ curl "https://awscli.amazonaws.com/awscli-exe-linux-x86_64.zip" -o "awscliv2.zip"
$ unzip awscliv2.zip
$ ./aws/install
$ aws configure

بعد از زدن دستور آخر، ترمینال Access Key و Secret Key اکانت AWS شما را خواهد پرسید. اطلاعات خود را وارد کرده و اینتر کنید. از این به بعد به راحتی و تنها با یک خط می‌توانید بک آپ های دیتابیس خود را به فضای ابری AWS منتقل کنید:

$ aws s3 cp [filename].sql s3://[bucket-name]

با استفاده از دستور زیر می‌توانید لیست بکاپ‌های دیتابیس My SQL روی فضای ابری را مشاهده کنید:

$ aws s3 ls s3://[bucket-name]/

آموزش بک آپ گیری از دیتابیس روی آبجکت استوریج ابر آروان

چنانچه تمایل دارید از فضای ذخیره سازی ابری ایرانی برای نگهداری بک آپ پایگاه داده خود استفاده کنید، آبجکت استوریج ابر آروان و ایرانسل گزینه‌های مناسبی هستند. با توجه به اینکه ابر آروان دارای پلن فضای ذخیره سازی رایگان ۵ گیگابایتی (با محدودیت پهنای باند ۲۰ گیگابایت) است، ما هم در ادامه نحوه پشتیبان گیری دیتابیس روی این فضای ابری را شرح می‌دهیم. قیمت فضای ذخیره سازی آبجکت با همین مشخصات در خدمات ابری ایرانسل ماهیانه حدودا ۱۱۸۸۰ تومان است.

نحوه ذخیره سازی بکاپ دیتبایس روی فضای ابری ابر آروان بسیار شبیه به آمازون AWS است، با این تفاوت که به جای ابزار aws باید از rclone استفاده کنید. rclone قابلیت انتقال فایل به اکثر ارائه دهندگان فضای ابری، مخصوصا آن‌هایی که از استاندارد S3 آمازون استفاده می‌کنند را داراست. برای این منظور ابتدا پکیج rclone را نصب کرده و تنظیمات آن را به صورت زیر انجام دهید:

$ apt install rclone
$ rclone config

بعد از زدن آخرین دستور، لیست استوریج‌هایی که به rclone اضافه کرده‌اید را مشاهده خواهید کرد. قاعدتا این لیست باید خالی باشد. کاراکتر n  را برای اضافه کردن استوریج جدید وارد کنید. سپس یک اسم دلخواه برای سرویس دهنده خود وارد کنید، مثلا arvan. در مراحل بعدی نوع آبجکت استوریج را s3 انتخاب کرده و other را برای provider وارد کنید.

در مرحله بعدی false را انتخاب کنید تا بتوانید access key و secret key آروان را به صورت دستی وارد کنید. سپس گزینه ۱ را برای ریجن انتخاب کرده و در آخر آدرس endpoint که از ابر آروان دریافت کرده‌اید را وارد کنید.

از این پس می‌توانید با دستور زیر بک اپ های خود را به فضای ابری آروان منتقل کنید:

$ rclone copy [filename].sql arvan:[bucket-name]/[filename].sql

بکاپ گیری و بازگردانی اتوماتیک دیتابیس MySQL

راهکارهایی که تا الان بررسی کردیم مزایا و معایب متفاوتی دارند. اما مشکل یا عیب اصلی که بین همه‌ی این روش‌ها مشترک است، مدت زمان زیاد بازیابی یا ریستور دیتابیس است که Disaster Recovery Plan شما را بسیار کند می‌کند.  در صورتی که سرور عملیاتی شما دچار خرابی شده یا از دسترس خارج شود، شما نسخه‌ای از دیتابیس خود را در فضای ابری خواهید داشت، اما برگرداندن دیتابیس از فضای ابری و راه اندازی آن در سرور عملیاتی جدید زمان زیادی نیاز دارد که صدمه زیادی به سایت یا سرویس شما می‌رساند.

مشکل دوم روش‌های مذکور، دستی بودن آن‌هاست. البته شما براحتی می‌توانید یک اسکریپت بنویسید تا عملیات بکاپ گیری از دیتابیس‌های شما بصورت اتوماتیک انجام شود. اما تاثیر بک آپ گیری روی کارایی سرور شما به اندازه کافی زیاد است که شما را مجبور کند در فاصله‌های زمانی طولانی اسکریپت بکاپ را اجرا کنید. در اکثر موارد کسب و کارها و استارتاپ‌ها مجبور می‌شوند زمان بکاپ گیری را به نیمه شب موکول کنند.

استفاده از سرویس دیتابیس ابری مدیریت شده به شما این امکان را می‌دهد تا در کنار مزایای همه روش‌های مذکور، این ۲ چالش برزگ را هم حل کنید.

بکاپ گیری و بازگردانی اتوماتیک دیتابیس با استفاده از دیتابیس ابری مدیریت شده

استفاده از دیتابیس ابری مدیریت شده به شما این توانایی را می‌دهد تا:

بکاپ اتوماتیک با فاصله زمانی کوتاه روی سرورهای عملیاتی جاری و ثالث ایجاد کنید.

هشدار کارایی و سلامت برای دیتابیس‌های خود داشته باشید.

تنها با یک کلیک و در عرض چند ثانیه بک آپ دیتابیس را روی سرور عملیاتی بازگردانید.

برای دسترسی به لیست بکاپ‌های دیتابیس ابتدا وارد پنل مدیریت پنکیک شوید. در صورتی که قبلا دیتابیس خود را ایجاد کرده باشید، سکوی ابری پنکیک بصورت خودکار هر ساعت از دیتابیس شما فول بکاپ می‌گیرد. برای مشاهده لیست بکاپ‌ها، کافی است دیتابیس مورد نظر خود را از ستون سمت راست انتخاب کرده و وارد تب Fork Database شوید. لیست نسخه‌های بکاپ دیتابیس شامل ۴۸ فول بکاپِ ساعتی از ۴۸ ساعت گذشته و همچنین ۲۸ فول بکاپِ روزانه از ۳۰ روز گذشته است.

pancake DBaaS backup

برای برگرداندن هر کدام از بکاپ‌ها کافی است روی آیکون کنار ردیف مورد نظر کلیک کرده تا در کمتر از یک دقیقه دیتابیس مورد نظر روی سرور عملیاتی ریستور شود. بک آپ گیری اتوماتیک از دیتابیس و بازگردانی آن در دیتابیس‌های ابری پنکیک منحصر به پایگاه داده ی خاصی نیست و به صورت پیش‌فرض برای همه‌ی دیتابیس‌های پنکیک شامل MySQL، PostgreSQL، MongoDB و SQL Server فعال است.

MongoDB یا MySQL؟

در جامعه‌ی الکترونیکی امروز که ذخیره‌سازی داده‌ها اهمیت زیادی دارند، جدال میان MongoDB و MySQL بیشتر از هر زمان دیگری شدت پیدا کرده است. در یک طرف یک دیتابیس رابطه‌ای و در سمت دیگر یک دیتابیس غیر رابطه‌ای یا همان NoSQL ایستاده است. هر دو دیتابیس متن‌باز هستند و تحت لایسنس GNU GPL توزیع یافته‌اند. هر دو نیز به صورت نسخه‌های تجاری در دسترس هستند و ویژگی‌های بسیاری را ارائه می‌دهند.

بررسی اجمالی

در دنیای دیتابیس‌ها به طور کلی با دو نوع دیتابیس سر و کار داریم، دیتابیس‌های رابطه‌ای و غیر رابطه‌ای. تفاوت این دو دیتابیس علاوه بر این که در ریشه‌ی طراحی آن‌ها نهفته شده است، در نوع داده‌ای که پشتیبانی می‌کنند و نحوه ذخیره‌سازی آن‌ها نیز مشهود است.

سیستم مدیریت دیتابیس رابطه‌ای (RDMS)

RDBMS زبان استاندارد برای مدیریت دیتابیس‌های رابطه‌ای است. در RDBMS داده‌ها به شکل ردیف و ستون ذخیره می‌شوند. روابط بین جداول نیز توسط Table SQL ذخیره می‌شوند. SQL یک زبان برنامه نویسی است که برای اموری مثل بازیابی داده‌ها در یک پایگاه داده و به روز رسانی داده‌ها در یک پایگاه داده استفاده می‌شود. برخی از سیستم‌های مشهور رابطه‌ای که از SQL استفاده می‌کنند عبارت‌اند از: Oracle، Sybase، Microsoft SQL، Server،Access .

ویژگی‎‏های RDBMS

1. دیتابیس‌های SQL بر پایه جداول هستند.
2. داده‌ها بر روی ردیف‌ها و ستون‌ها ذخیره می‌شوند.
3. هر سطر شامل نمونه‌ای منحصر به فرد از داده‌ها، برای دسته‌های تعریف شده از ستون‌ها است.
4. برای شناسایی منحصر به فرد ردیف‌ها می‌توانید از Primary Key استفاده کنید.

محدودیت‌های دیتابیس‌های بر پایه SQL

• مقیاس پذیری: کاربران برای افزایش مقایس پایگاه داده‌های بر پایه SQL مجبور به استفاده از سرورهای قدرتمندی هستند که گران بوده و کار با آن‌ها نیز دشوار است. برای اینکه قادر باشیم یک پایگاه داده این چنینی را مقیاس پذیر کنیم بایستی آن را بر روی تعداد زیادی از سرورها توزیع دهیم، به همین خاطر استفاده از جداول بر روی سرورهای مختلف آسان نخواهد بود.
• پیچیدگی: در SQL داده های سرور همگی باید به نحوی در جداول ذخیره شوند. اگر داده‌های شما در جداول قرار نمی‌گیرند در نتیجه باید ساختار دیتابیس را خودتان از پایه درست کنید که پیچیده و مشکل خواهد بود.

دیتابیس‌های محبوب بر پایه SQL

• MySQL: محبوب‌ترین پایگاه داده منبع‌باز و مناسب برای برنامه‌های سازمانی.

• Oracle: یک سیستم مدیریت دیتابیس رابطه‌ای که بر پایه زبان C++ نوشته شده است. Oracle همچنین یک سیستم دیتابیس No-SQL نیز روانه بازار کرده است.

• IMB DB2: خانواده‌ای از محصولات سرور پایگاه داده که IBM برای تجزیه و تحلیل کلان داده (Big Data) آن را معرفی کرده است.

• Sybase: یک سرور پایگاه داده که در ابتدا در سطح سیستم‌عامل لینوکس استفاده می‌شد و اولین DBMS سازمانی برای سیستم‌عامل لینوکس بود.

• MS SQL Server: سیستم مدیریت پایگاه داده که توسط مایکروسافت توسعه یافته است و عمدتا برای پایگاه داده‌های سازمانی که از معماری SQL و No-SQL تشکیل شده‌اند، استفاده می‌شود.

NoSQL:

NoSQL در واقع مخففی برای عبارت «Not only SQL» است. با استفاده از NoSQL می‌توان داده‌ها را در مجموعه‌هایی گرد هم آورد و دیگر نیازی به ساختار جداول نیست. از کوئری join استفاده می‌کند و می‌توانیم آن را مقیاس‌گذاری کنیم.

مزایای NoSQL:

• مقیاس پذیری آسان: در پایگاه داده‌های RDBMS با افزایش بار در دیتابیس، دیتابیس به صورت vertical مقیاس گذاری می‌شود و در نتیجه نیاز به سرور های گران قیمت‌تر و قدرتمند‌تر داریم. در NoSQL دیتابیس‌ها به صورتی طراحی شده‌اند که به صورت افقی (Horizontal) گسترش پیدا کنند و در نتیجه با افزایش منابع می‌توانیم مقیاس گذاری را انجام دهیم.

• نگهداری سرورها ارزان است: نگهداری از دیتابیس‌های RDBMS هزینه‌بر بوده و برای آن به نیروی انسانی متخصص نیاز داریم. در سوی دیگر دیتابیس‌های NoSQL به مدیریت و نظارت کمتری احتیاج دارند و از ویژگی‌های بسیاری مانند ترمیم اتوماتیک (automatic repair)، توزیع آسان داده‌ها، مدل‌های ساده‌ی داده و ویژگی‌های از این قبیل، نیازهای مدیریتی را کمتر خواهد کرد.

• هزینه پایین سرورها و متن‌باز بودن: دیتابیس‌های NoSQL ارزان و Open-Source هستند. پیاده‌سازی این دیتابیس‌ها آسان بوده و به طور معمول هزینه چندانی برای سرور دیتابیس‌ها پرداخت نخواهید کرد. این در حالی است که در RDBMS ها بایستی از سرورهای بزرگ و گران قیمت استفاده کنید. بنابراین هزینه ذخیره و پردازش داده‌ها در NoSQL بسیار کمتر از سیستم‌های RDBMS است.

• عدم وجود Schema یا مدل داده‌ای ثابت: NoSQL از مدل داده‌ای خاصی استفاده نمی‌کند بنابراین داده‌ها بدون تعریف طرح یا الگوی قبلی در دیتابیس قرار می‌گیرند. در نتیجه می‌توانید فرمت داده‌ها را هر زمان که خواستید تغییر دهید.

محدودیت ها و معایب NoSQL:

• همانطور که گفتیم بزرگترین مزیت دیتابیس‌های NoSQL متن‌باز بودن آن‌ها است؛ در عین حال این متن باز بودن می‌تواند تبدیل به نقطه ضعف نیز بشود، چرا که استانداردهای تعریف شده خاصی برای NoSQL وجود ندارند.
• رویه خاصی برای ذخیره وجود ندارد.

دیتابیس های NoSQL محبوب در بازار:

• MongoDB: محبوب‌ترین پایگاه داده که از NoSQL استفاده می‌کند. یک پایگاه داده بر پایه اسناد.
• Apache’s Couch DB: دیتابیسی مناسب برای وب که از داده‌های با فرمت JSON برای ذخیره اطلاعات و از جاوااسکریپت برای indexing و از HTTP برای API خود استفاده می‌کند.

SQL یا NoSQL: MySQL یا MongoDB

حالا که متوجه تفاوت‌های ساختاری بین SQL و NoSQL شدیم، بیایید به تفاوت‌های عملکردی اصلی بین این دو بپردازیم.

MySQL چیست؟

MySQL یکی از محبوب‌ترین RDBMS های موجود در بازار است که توسط شرکت Oracle توسعه داده شده و پشتیبانی می‌شود. همانند دیگر سیستم‌های رابطه‌ای، MySQL با استفاده از زبان SQL داده‌ها را در جداول ذخیره می‌کند. در MySQL طرح اولیه دیتابیس توسط شما و بر اساس نیازتان تعیین شده و از آن برای تعیین قواعد بین جداول استفاده می‌شود. برای هر تغییری در این طرح‌واره (schema) نیازمند تغییرات در دیتابیس خواهید بود و ممکن است برای لحظاتی دیتابیس خود را از دست بدهید.

مزایای MySQL:

• سازگاری: MySQL برای تمام پلتفرم‌های معروف مثل لینوکس، ویندوز، مک، BSD و سولاریس موجود است. هم چنین با زبان‌های Ruby، Node.js، Perl، Java، C++، Python و Php ارتباط برقرار می‌کند و فقط به SQL محدود نیست.

• همانندسازی (افزونگی): دیتابیس MySQL می‌تواند بر روی چندین Node مختلف همانندسازی شوند، این به این معنی است که مقیاس پذیری دیتابیس را می‌توان به راحتی تغییر داد.

MongoDB چیست؟

MongoDB دیتابیس متن باز و غیر رابطه‌ای است که توسط کمپانی MongoDB توسعه یافته است. MongoDB داده ها را به صورت BSON نمایش می‌دهد که نمایشی باینری از JSON است. اگر بخواهید به یکی از اسناد فیلد اضافه کنید، بدون اینکه سیستم از دسترس خارج شود و یا نیاز به آپدیت کردن کل اسناد داشته باشید می‌توانید این کار را انجام دهید.

در زیر به بعضی از مزایای MongoDB اشاره می‌کنیم:
• مقیاس‌پذیری: MongoDB به صورت افقی مقیاس پذیر بوده و به شما کمک می‌کند از حجم workload خود بکاهید و کسب و کار خود را به راحتی افزایش مقیاس دهید.

• مدیریت: MongoDB به ادمین سیستم نیازی ندارد و به خاطر سهولت استفاده و یوزر فرندلی بودن، هم توسط توسعه دهندگان و هم ادمین ها قابل مدیریت است.

• انعطاف پذیری: می‌توانید بدون تاثیرگذاری بر روی عملکرد برنامه و یا ردیف‌های موجود، ستون‌ها و ردیف‌های مختلفی را اضافه کنید.

چه زمان از دیتابیس NoSQL استفاده کنیم؟

برای جلوگیری از تبدیل شدن نقاطی از دیتابیس به bottleneck، خصوصا در فضاهای با حجم بالا، دیتابیس‌های NoSQL مزیت‌هایی دارند که در دیتابیس‌های رابطه‌ای وجود ندارند:
1. ذخیره‌سازی مقادیر حجیمی از دیتا بدون نیاز به یک ساختار ویژه: دیتابیس NoSQL ذخیره سازی انواع مختلف داده را محدود نمی‌کند، به علاوه با بروز تغییرات در ساختار کسب و کار شما، می‌توانید تغییرات را به راحتی در دیتابیس اعمال کنید.

2. استفاده از Cloud Computing: استفاده از فضای ذخیره‌سازی مبتنی بر Cloud یک راه حل عالی است. استفاده از سخت افزار مقرون به صرفه برای گسترش داده های این فضا، همان چیزی است که دیتابیس‌های NoSQL برای آن طراحی شده‌اند.

در پایان برای جواب دادن به این سوال که «چه زمان از MongoDB به جای MySQL استفاده کنیم؟» باید بگوییم که بایستی اهداف بلندمدت و نیازمندی‌های پروژه را مد نظر قرار دهید.

MySQL همواره به خاطر عملکرد عالی، منعطف بودن، حفاظت از اطلاعات و مدیریت آسان شهرت داشته است. اما اگر داده های شما پیچیده هستند و ساختار مشخصی ندارند، اگر طرح اولیه پروژه برایتان واضح نیست و مهم‌تر از همه، اگر با حجم عظیمی از داده‌ها سر و کار دارید MongoDB احتمالا پاسخگوی چالش‌های شما است.

سرویس دیتابیس

SQL یا NoSQL

در انتخاب بین SQL و NoSQL، باید به این فکر کنید که داده‌های شما چه شکلی هستند، چگونه می‌خواهید آن‌ها را جستجو کنید و چه مقیاس‌پذیری احتیاج دارید. عوامل اصلی که باید هنگام انتخاب پایگاه داده SQL یا NoSQL به آن‌ها توجه کنید:

ساختار داده‌ها

اولین و اصلی‌ترین عامل در تصمیم‌گیری بین این ۲ پایگاه داده، شکل داده‌های شماست. اگر داده‌های شما در درجه اول ساختار یافته باشند احتمالاً SQL انتخاب مناسبی است.

پایگاه‌داده‌ی SQL برای سیستم‌های تراکنشی مانند ابزارهای ارتباط با مشتری، نرم افزارهای حسابداری و سیستم‌های تجارت الکترونیکی انتخاب مناسبی است. در دیتابیس SQL هر ردیف یک موجودیت مجزا و هر ستون توصیف کننده آن موجودیت است (مانند مشتری و آدرس آن).

به دلیل روابط متمایز و ساختاریافته بین ردیف‌ها و ستون‌ها در یک جدول، پایگاه‌های داده‌ی SQL در انطباق با خاصیت‌های ACID بهتر عمل می‌کنند.

ACID مخفف ویژگی‌های زیر است:

  • Atomicity یا تجزیه ناپذیری: هر تراکنش یا کاملاً موفق می‌شود یا کاملاً شکست می‌خورد.
  • Consistency یا همخوانی (سازگاری) : داده‌هایی که به یک پایگاه داده نوشته می‌شوند باید طبق کلیه قوانین تعریف شده معتبر باشند.
  • Isolation یا انزوا: هنگامی که تراکنش‌ها به طور همزمان انجام می‌شوند، با یکدیگرتقابل نداشته و به صورت پی در پی انجام می‌شوند و عمل می‌کنند.
  • Durability یا پایایی: پس از انجام تراکنش در بانک اطلاعاتی، حتی در صورت خرابی سیستم، دائمی تلقی می‌شود.

انطباق با ویژگی‌های ACID، با تعیین دقیق تراکنش و نحوه تعامل آن با دیتابیس شما، از تمامیت و یکپارچگی داده‌های شما محافظت می‌کند و از ناهمگام بودن جداول پایگاه داده، که برای تراکنش‌های مالی حیاتی است، جلوگیری می‌کند. همچنین رعایت ACID اعتبار تراکنش‌ها را، حتی در صورت بروز خطا ، خرابی تجهیزات ، وقایع فاجعه بار و موارد دیگر، تضمین می‌کند.

بنابراین اگر داده‌های شما ساختار یافته‌اند و رعایت ACID ضروری است، SQL یک انتخاب عالی است.

از طرف دیگر، اگر الزامات داده شما روشن نیستند یا داده‌های شما بدون ساختار است، NoSQL ممکن است انتخاب بهتری برای شما باشد.

داده‌های ذخیره شده در پایگاه داده‌های NoSQL نیازی به ساختارهای از پیش تعیین شده نداشته و می‌توانند شامل داده‌های جفتی کلیدمقدار، داده‌های گرافی یا داده‌های داکیومنتی باشد. این روش انعطاف‌پذیری بیشتری داشته و نیاز کمتری به طرح‌های از پیش تعیین شده برای مدیریت پایگاه داده دارد.

با NoSQL می‌توانید:

  • مستندات بسیاری درست کنید بدون اینکه ساختار دقیق آن‌ها را از قبل تعیین کنید.

  • بدون تغییر فیلدهای مستندات موجود، فیلدهای جدیدی به دیتابیس خود اضافه کنید.

  • اسناد و مدارکی را ذخیره کنید که ساختار منحصر به فرد خود را دارند.

  • چندین پایگاه داده با ساختار و سینتکس مختلف داشته باشید.

پایگاه داده‌های NoSQL انتخاب بهتری برای ذخیره داده‌های محتوایی، پست ها، داده‌های سنسوری و دیگر داده‌های بدون ساختاری که داخل جدول نمی‌گنجند، هستند. دیتابیس های بدون ساختار با فرض انعطاف پذیری و مقیاس پذیری طراحی شده اند، به طوری که با مدل پایه همخوانی (Consistency) سازگار باشند. این مدل دارای ویژگی‌های زیر است:

دسترسی پایه:

به این معنی که، گرچه پایگاه داده دسترسی به داده‌ها را تضمین میکند، در مواردی ممکن است درخواست دریافت داده با خطا روبرو شود. مثلاً مواردی که داده در حال تغییر است، یا در حالت ناسازگار قرار دارد.

حالت نرم:

حالت پایگاه داده ممکن است به مرور زمان تغییر کند.

سازگاری نهایی:

در نهایت، پایگاه داده سازگاری خود را بازیافته و داده‌ها در آینده در دسترس خواهند بود.

گرچه مدل پایه برای انعطاف پذیری بالا طراحی شده اند، بعضی پایگاه داده های NoSQL هم وجود دارند که با ACID سازگاری کامل دارند.

قابلیت جستجوی (کوئری) داده‌ها

عامل بعدی که باید در نظر بگیرید این است که در چه فواصلی از داده‌های خود کوئری می‌گیرید، چه سرعتی برای اجرای کوئری‌ها نیاز دارید و چه کسی مسئول اجرای این کوئری‌ها خواهد بود.

از آنجا که داده‌های شما کاملاً ساختار یافته است، جستجو کردن داده‌های خود با یک پایگاه داده SQL می‌تواند بسیار کارآمد باشد.

SQL یک زبان برنامه نویسی محبوب، بسیار باسابقه و شناخته شده است که عمری نزدیک به ۴۵ سال دارد، به صورت بسیار کارآمد کوئری ها را اجرا کرده و داده‌ها را بازیابی و ویرایش می‌کند. هیمنطور بسیار سبک و قابل فهم است و یادگیری آن نیز مشکل نیست، بنابراین کوئری‌ها می‌توانند توسط افراد غیرفنی، مثل تحلیلگران اجرا شوند.

در عوض یک پایگاه داده NoSQL انعطاف پذیری بیشتری در تنوع داده‌هایی که می‌خواهید ذخیره کنید فراهم می‌کند، اما به دلیل اختلافات بسیار زیاد در ساختار داده‌ها به اندازه یک پایگاه داده SQL در کوئری کردن کارآمد نخواهد بود.

در‌واقع هنگامی که تکنولوژی پایگاه داده NoSQL طراحی می‌شد، توسعه‌دهندگان بیشتر روی مقیاس‌پذیری و انعطاف‌پذیری آن تمرکز کرده بودند و نه کارایی کوئری‌ها.

 بنابراین برای اجرای کوئری های NoSQL باید پردازش بیشتری روی داده‌ها انجام دهید. حتی بسیاری از توسعه‌دهندگان قابلیت کوئری را در لایه اپلیکیشن پیاده‌سازی می‌کنند تا نگران لایه دیتابیس نباشند. تلاش هایی هم برای استانداردسازی کوئری های NoSQL انجام شده است (مانند XQuery یا JSONiq)، اما استفاده از این ابزارها آنچنان همه گیر نشد. بنابراین برای کوئری پایگاه‌های داده NoSQL به طور معمول به توسعه‌دهندگان یا متخصصین داده احتیاج است که امری پرهزینه و به نسبت ناکارآمد خواهد بود.

شما هرچند وقت از داده‌ها کوئری می‌گیرید؟ چه کسی این درخواست‌ها را اجرا می‌کند؟ پاسخ این سؤالات بر انتخاب شما بین SQL و NoSQL تأثیر خواهد گذاشت!

مقیاس‌پذیری

همیشه باید میزان رشد اطلاعات خود را در نظر داشته باشید، چرا که مقیاس‌پذیری SQL و NoSQL متفاوت است.

دیتابیس‌های بر پایه SQL رشد اصطلاحاً عمودی دارند،‌ به این معنی که شما برای افزایش مقیاس پایگاه داده بایستی منابع سرور (رم، پردازشگر یا SSD) را افزایش دهید. دیتابیس‌های SQL برای پیاده‌سازی روی یک سرور طراحی شده‌اند تا بتوانند یکپارچگی داده‌ها را حفظ کنند، لذا به مقیاس‌پذیری راحتی ندارند.

یکی از بزرگ‌ترین مزایای NoSQL نسبت به SQL مقیاس‌پذیری است، بدین معنی که می‌توانید با اضافه کردن سرورهای بیشتر، قدرت دیتابیس خود را افزایش دهید. قابلیت رشد افقی پایگاه داده های NoSQL به علت ساختار نیافته بودن داده های آن است، به این صورت که اشیاء ذخیره شده تقریبا مستقل هستند. بنابراین اشیا میتوانند بدون ارتباط با یکدیگر روی سرورهای مختلفی ذخیره شوند.

یک مثال جالب برای مقایسه بین SQL وNoSQL کیک عروسی است، در SQL برای آنکه بتوانید به افراد بیشتری کیک بدهید باید لایه‌های بیشتری به کیک اضافه کنید اما در NoSQL می‌توانید هرچه می‌خواهید کاپ‌کیک درست کنید!

همینطور که کسب و کارتان رشد می‌کند باید به فکر دیتابیس بزرگ‌تر هم باشید، پس مقیاس‌پذیری فراموش نکنید!

مشترکات

هردو بانک اطلاعتی SQL و NoSQL داری جوانب منفی و مثبت هستند،‌ برای همین حرکاتی صورت گرفته تا بتوان از بهترین مشخصات هردو دیتابیس بهره گرفته و آن‌ها را ادغام کنند تا کاربران بتوانند ۲ دنیای مختلف را به خوبی درک کنند.

به عنوان مثال MySQL که معروف‌ترین پایگاه‌داده‌ی رابطه‌ای متن باز است، MYSQL Document Store را ارائه داده است، که ساختار یک دیتابیس MySQL را به همراه قابلیت انعطاف‌پذیری و در دسترس بودن NoSQL پوشش می‌دهد، بدون اینکه نیاز به پیاده‌سازی یک NoSQL به صورت جداگانه داشته باشید.

MongoDB هم به عنوان معروف‌ترین دیتابیس NoSQL، تراکنش های multi-document با قابلیت های ACID ارائه می‌کند. پایگاه داده NoSql مدیریت شده ی AWS، به نام DynamoDB هم ویژگی های ACID را ارائه می‌دهد.

با راه اندازی آسان پایگاه داده‌های پنکیک، که دیتابیس‌ها را به صورت سرویس ارایه می‌دهد، شما می‌توانید از ۲ پایگاه داده ی SQL و NoSQL در معماری اپلیکیشن خود بهره بگیرید تا نیازهای ذخیره داده‌های خود را برآورده سازید.

حالا شما انعطاف پذیری بیشتری خواهید داشت، چه از SQL استفاده کنید یا NoSQL و حتماً قابلیت‌های بیشتری هم در آینده اضافه خواهند شد.

پایگاه‌داده‌های پنکیک

چه از SQL استفاده کنید یا NoSQL پنکیک آپشن‌های زیر را برای انتخاب ارائه می‌کند:

  • MYSQL – همانطور که اشاره شد وسیع‌ترین و محبوب‌ترین پایگاه داده رابطه‌ای.

  •  PostgreSQL – پایگاه داده متن باز در سطح سازمانی و مبتنی بر توسعه پذیری

  •  MongoDB – محبوب‌ترین نرم‌افزار پایگاه داده ی NOSQL.

نتیجه‌گیری

وقتی به دیتابیس خود فکر می‌کنید تصمیم‌های زیادی به ذهن می‌رسند،‌ یکی از مهم‌ترین تصمیمات این است که به عنوان پایگاه داده اصلی خود کدام را انتخاب کنید؟ SQL یا NoSQL و اینکه آیا برای رفع نیازهای خود ممکن است به هر دو نیاز داشته باشید یا خیر.

بایستی به این فکر کنید که داده‌ی شما چه شکلی است و همینطور نحوه‌ی کوئری اطلاعات و مقیاس پذیری را در نظر بگیرید.

پایگاه داده‌های SQL مزایای بزرگی را برای داده‌های تراکنشی ارایه می‌دهند که ساختار آن‌ها به صورت مکرر تغییر نمی‌کند یا یکپارچگی داده در آن‌ها اهمیت زیادی دارد. همچنین برای جستجوی های سریع تحلیلی هم پایگاه داده‌های SQL مناسب‌تر هستند.

در عوض بانک‌های اطلاعاتی NoSQL انعطاف‌پذیری و مقیاس‌پذیری بسیار بیشتری را ارائه می‌دهند و این خود باعث توسعه سریع و مکرر آن می‌شود.

 امیدواریم این مطب راه تصمیم‌گیری را هنگام انتخاب دیتابیس و آپشن‌هایی که با آن‌ها رو به رو هستید، آسان‌تر کرده باشد.