در دنیای امروزی که استفاده از اینترنت بیش از پیش بیشتر شده است، داده های زیادی وجود خواهد داشت که باید مدیریت شود. تا در زمان مناسب بتوانیم به آن ها دسترسی داشته باشیم. پایگاه داده بازیگری مهم است که بخشی از زندگی روزمره ما به حساب می آید. پایگاه های داده ستون فقرات (Backbone) همه سیستم های اطلاعاتی مدرن هستند. در پایگاه های داده مدرن، داده می تواند در هر اندازه و پیچیدگی باشد. روش های زیادی برای جمع آوری و ترتیب داده ها وجود دارد که بستگی به نوع استفاده و نوع داده دارد.
داده ها مجموعه ای از یک واحد کوچک مجزا از اطلاعات هستند و در قالب های مختلفی مانند متنی،اعداد،رسانهه ها،بایت ها و غیره مورد استفاده قرار می گیرند. می توان آن را در تکه های کاغذ یا حافظه الکترونیکی ذخیره کرد.
بخشی از تعریف ویکی پدیا : به اعداد، حروف و علائم که جهت درک و فهم مشترک از انسانها یا رایانه سرچشمه میگیرند داده میگویند. دادهها معمولاً از سوی انسانها به صورت حروف، اعداد، علائم و در رایانه به صورت نمادهایی (همان رمزهای صفر و یک) قراردادی ارائه میشوند. اصطلاح داده یک عبارت نسبی است یعنی اگر موجب درک و فهم لازم و کامل در این مرحله شدهاست. به عنوان آگاهی یا اطلاعات از آن نام میبرند و چنانچه موجب درک و فهم کامل نگردد به عنوان همان داده بهشمار میآیند. و چون هدف نهایی آگاهی و اطلاعات است باید از سوی دستاندرکاران (انسان یا رایانه) دستکاری یا پردازش شوند.
در تعریفی ساده تر داده ها (Data) طبق پردازشی (Processing) تبدیل به اطلاعات (Information) قابل فهم برای انسان می شود. نمونه از داده ها می تواند تصاویر، فایل pdf یا یک فایل متنی باشد.
پایگاه داده مجموعه ای سیستماتیک از داده ها است. آنها از ذخیره سازی الکترونیکی و دستکاری داده ها پشتیبانی می کنند. پایگاه داده ها مدیریت داده های جمع آوری شده را آسان می کند. ما در زمان های مختلف از database در فعالیت روزمره خود استفاده می کنیم. برای مثال در بانک ها در مدرسه یا دانشگاه ها یا حتی فروشگاه های اینترنتی و غیره. اینها مواردی است که نشان می دهد که ما نیاز به ذخیره حجم انبوهی از داده هارا در یک مکان داریم تا این داده ها را به راحتی واکشی کنیم.
پایگاه داده مجموعه ای از داده های سازماندهی شده است که به آن داده های ساختاریافته نیز می گویند. می توان به آن دسترسی پیدا کرد یا در یک سیستم کامپیوتری ذخیره کرد. که می توان از طریق سیستم مدیریت پایگاه داده (DBMS) داده هارا مدیریت کرد. نرم افزاری که برای مدیریت داده ها استفاده می شود. database مجموعه ای سازمان یافته از داده های مرتبط منطقی است. در یک database، داده ها در جداول متشکل از سطرها(rows) و ستون ها(columns) سازماندهی می شوند و ایندکس می شوند تا بتوان داده ها را به راحتی به روز کرد، گسترش داد و حذف کرد. پایگاههای اطلاعاتی رایانه معمولاً حاوی دادههای سوابق فایل مانند تراکنشهای پول در یک حساب بانکی به حساب بانکی دیگر، جزئیات فروش و مشتری، جزئیات هزینههای دانشآموزان و جزئیات محصول هستند.
پایگاه های داده طیف کاربردی گسترده ای دارند. نمونه های معمولی آن عبارتند از :
فهرست بالا نشان می دهد که database ها برای هر نوع کسب و کاری چقدر حیاتی هستند. با رابط های کاربری مدرن، هنگام دسترسی به یک database، تمامی فرایند در سمت سرور اتفاق می افتد. بنابراین بسیاری از کاربران از استفاده روزانه از یک پایگاه اطلاع ندارند.
در حال حاضر انواع مختلفی از پایگاه داده موجود است که هر کدام مزایا و معایبی دارند. هر نوع database یک محیط خاص برای ذخیره داده ها و رابطه بین اطلاعات ایجاد می کند.
رابطهای \ Relational databases
توزیعشده \ Distributed databases
پایگاه داده NoSQL
نمودار \ Graph databases
ابر \ Cloud databases
در این قسمت ما رابطه ای، NoSQL، ابری را توضیع خواهیم داد.
پایگاه داده رابطه ای :یک database رابطه ای از مجموعه ای از جداول با داده هایی که در یک دسته از پیش تعریف شده قرار می گیرند، تشکیل شده است.
این نوع database روابط پایگاه داده را در قالب جداول تعریف می کند. به آن DBMS رابطه ای نیز می گویند. که محبوب ترین نوع DBMS در بازار است. نمونه پایگاه داده سیستم RDBMS شامل پایگاه داده MySQL، Oracle و Microsoft SQL Server است.
پایگاه داده NoSQL : پایگاه داده NoSQL برای مجموعه های بزرگی از داده های توزیع شده استفاده می شود. چند مشکل عملکرد داده های بزرگ وجود دارد که به طور موثر توسط پایگاه داده های رابطه ای مدیریت می شوند. این نوع database کامپیوتری در تجزیه و تحلیل داده های بدون ساختار با اندازه بزرگ بسیار کارآمد است. از نظر ساختاری انواع مختلفی از database با تمرکز بر در دسترس بودن بالا هستند. سیستم های NoSQL برای حجم زیادی از داده های بدون ساختار مناسب هستند.
چند نمونه از سیستم پایگاه داده NoSQL با دسته بندی آنها عبارتند از :
پایگاه داده ابری : پایگاه داده ابری پایگاه داده ای است که برای محیط مجازی بهینه شده یا ساخته شده است. مزایای بسیاری از پایگاه داده ابری وجود دارد که برخی از آنها می توانند برای ظرفیت ذخیره سازی و پهنای باند هزینه کنند که انعطاف پذیری بالایی دارد. همچنین مقیاس پذیری بر حسب تقاضا، همراه با در دسترس بودن بالا را ارائه می دهد.
پنج جزء اصلی یک سیستم database را تشکیل می دهند.
سخت افزار (Hardware) : سخت افزار شامل دستگاه های فیزیکی است که رایانه ها را با دنیای واقعی متصل می کند. وقتی صحبت از database ها می شود، سرورها، دیسک های ذخیره سازی و دستگاه های مختلف جمع آوری داده ها شامل سخت افزار مورد نیاز برای اجرا و پر کردن پایگاه داده می شود.سختافزار شامل دستگاههای فیزیکی، الکترونیکی مانند رایانه، دستگاههای ورودی/خروجی، دستگاههای ذخیرهسازی و غیره است. این رابط بین رایانهها و سیستمهای دنیای واقعی را ارائه میدهد.
نرم افزار (Software) : این مجموعه ای از برنامه هایی است که برای مدیریت و کنترل database استفاده می شود. این شامل خود نرم افزار database، سیستم عامل، نرم افزار شبکه ای است که برای اشتراک گذاری داده ها بین کاربران و برنامه های کاربردی برای دسترسی به داده ها در database استفاده می شود. این نرم افزار شامل مجموعه وسیعی از برنامه های مورد استفاده برای دسترسی، دستکاری و کنترل database است. در سطوح پایینتر، نرمافزار شامل سیستمعاملهایی است که پایگاههای اطلاعاتی روی آنها قرار دارند، شبکه ارتباطی با پایگاههای اطلاعاتی و نرمافزاری برای دسترسی به دادهها.
داده (Data) : داده ها یک قالب خام و سازمان نیافته هستند که برای معنا دار شدن آن ها باید پردازش شوند. داده ها می توانند ساده و در عین حال سازماندهی نشده باشند مگر اینکه سازماندهی شده باشند که تبدیل به اطلاعات می شوند. به طور کلی داده ها شامل حقایق، مشاهدات، ادراکات، اعداد، کاراکترها، نمادها، تصاویر و غیره است. داده ها واقعیت اساسی در مورد یک آیتم یا رویداد است که پایگاه داده می تواند ذخیره کند. داده ها برای به دست آوردن معنا و تبدیل شدن به اطلاعات نیاز به پردازش دارند. علاوه بر این، پردازش جزئیات از داده ها استخراج می کند و به رویه های تصمیم گیری کمک می کند.
روش ها (Procedure) : رویه مجموعه ای از دستورالعمل ها و قوانینی است که به شما در استفاده از DBMS کمک می کند. این پایگاه داده را با استفاده از روش های مستند طراحی و اجرا می کند که به شما امکان می دهد تا کاربرانی که آن را اداره و مدیریت می کنند راهنمایی کنید. رویه های پایگاه داده شامل تمام عملکردهایی است که در یک فضای ذخیره سازی کار می کنند. خواه پشتیبانگیری معمولی، تولید گزارشها و سایر عملیاتهای روزمره باشد، رویهها مجموعه دستورالعملهایی هستند که در سیستم مدیریت پایگاه داده اجرا میشوند.
زبان دسترسی به پایگاه داده (Database Access Language) : زبان دسترسی به پایگاه داده زبان برنامه نویسی است که برای درج، به روز رسانی، حذف و اصلاح داده های ذخیره شده در پایگاه داده استفاده می شود.
سیستم مدیریت پایگاه داده (DBMS) مجموعه ای از برنامه هاست که کاربران خود را قادر می سازد به database دسترسی داشته باشند. دستکاری داده ها، گزارش و نمایش داده ها. همچنین به کنترل دسترسی به database کمک می کند. سیستم های مدیریت پایگاه داده مفهوم جدیدی نیستند و برای اولین بار در دهه 1960 پیاده سازی شدند. گفته می شود که فروشگاه داده های یکپارچه (IDS) چارلز باخمن اولین DBMS در تاریخ است. با پایگاه داده زمان، فناوری ها بسیار تکامل یافتند، در حالی که استفاده و عملکردهای مورد انتظار database ها به شدت افزایش یافت.
یک سیستم مدیریت پایگاه داده (DBMS) به عنوان رابط بین کاربر (یا برنامه های کاربردی) و پایگاه داده عمل می کند. این برنامه امکان ارتباط مستقیم با پایگاه داده، امکان بازیابی داده ها، به روز رسانی، بهینه سازی و مدیریت کلی اطلاعات ذخیره شده در database را فراهم می کند.