تصویر حسین نائیجی
حسین نائیجی

غرق در دنیای صفر و یک

معرفی

در دنیای امروزی که استفاده از اینترنت بیش از پیش بیشتر شده است، داده های زیادی وجود خواهد داشت که باید مدیریت شود. تا در زمان مناسب بتوانیم به آن ها دسترسی داشته باشیم. پایگاه داده بازیگری مهم است که بخشی از زندگی روزمره ما به حساب می آید. پایگاه های داده ستون فقرات (Backbone) همه سیستم های اطلاعاتی مدرن هستند. در پایگاه های داده مدرن، داده می تواند در هر اندازه و پیچیدگی باشد. روش های زیادی برای جمع آوری و ترتیب داده ها وجود دارد که بستگی به نوع استفاده و نوع داده دارد. 

داده یا Data در رایانه چیست؟

داده ها مجموعه ای از یک واحد کوچک مجزا از اطلاعات هستند و در قالب های مختلفی مانند متنی،اعداد،رسانهه ها،بایت ها و غیره مورد استفاده قرار می گیرند. می توان آن را در تکه های کاغذ یا حافظه الکترونیکی ذخیره کرد.

بخشی از تعریف ویکی پدیا : به اعداد، حروف و علائم که جهت درک و فهم مشترک از انسان‌ها یا رایانه سرچشمه می‌گیرند داده می‌گویند. داده‌ها معمولاً از سوی انسان‌ها به صورت حروف، اعداد، علائم و در رایانه به صورت نمادهایی (همان رمزهای صفر و یک) قراردادی ارائه می‌شوند. اصطلاح داده یک عبارت نسبی است یعنی اگر موجب درک و فهم لازم و کامل در این مرحله شده‌است. به عنوان آگاهی یا اطلاعات از آن نام می‌برند و چنانچه موجب درک و فهم کامل نگردد به عنوان همان داده به‌شمار می‌آیند. و چون هدف نهایی آگاهی و اطلاعات است باید از سوی دست‌اندرکاران (انسان یا رایانه) دستکاری یا پردازش شوند.

در تعریفی ساده تر داده ها (Data) طبق پردازشی (Processing) تبدیل به اطلاعات (Information) قابل فهم برای انسان می شود. نمونه از داده ها می تواند تصاویر، فایل pdf یا یک فایل متنی باشد.

تعریف Database

پایگاه داده مجموعه ای سیستماتیک از داده ها است. آنها از ذخیره سازی الکترونیکی و دستکاری داده ها پشتیبانی می کنند. پایگاه داده ها مدیریت داده های جمع آوری شده را آسان می کند. ما در زمان های مختلف از database در فعالیت روزمره خود استفاده می کنیم. برای مثال در بانک ها در مدرسه یا دانشگاه ها یا حتی فروشگاه های اینترنتی و غیره. اینها مواردی است که نشان می دهد که ما نیاز به ذخیره حجم انبوهی از داده هارا در یک مکان داریم تا این داده ها را به راحتی واکشی کنیم.
پایگاه داده مجموعه ای از داده های سازماندهی شده است که به آن داده های ساختاریافته نیز می گویند. می توان به آن دسترسی پیدا کرد یا در یک سیستم کامپیوتری ذخیره کرد. که می توان از طریق سیستم مدیریت پایگاه داده (DBMS) داده هارا مدیریت کرد. نرم افزاری که برای مدیریت داده ها استفاده می شود. database مجموعه ای سازمان یافته از داده های مرتبط منطقی است. در یک database، داده ها در جداول متشکل از سطرها(rows) و ستون ها(columns) سازماندهی می شوند و ایندکس می شوند تا بتوان داده ها را به راحتی به روز کرد، گسترش داد و حذف کرد. پایگاه‌های اطلاعاتی رایانه معمولاً حاوی داده‌های سوابق فایل مانند تراکنش‌های پول در یک حساب بانکی به حساب بانکی دیگر، جزئیات فروش و مشتری، جزئیات هزینه‌های دانش‌آموزان و جزئیات محصول هستند.

پایگاه های داده برای چه مواردی استفاده می شود؟

پایگاه های داده طیف کاربردی گسترده ای دارند. نمونه های معمولی آن عبارتند از : 

  • سیستم های بانکی : بانک های اطلاعاتی برای مشتریان، حساب های بانکی، اعتبارات، تراکنش ها استفاده می شود.
  • ترافیک خطوط هوایی : اطلاعات مربوط به پروازها، رزرو بلیط و موارد مشابه را حفظ می کند. شرکت های هواپیمایی اولین بخشی هستند که از پایگاه های اطلاعاتی توزیع شده جغرافیایی استفاده می کنند.
  • دانشگاه ها : استفاده از پایگاه های داده برای ثبت اطلاعات در مورد دانش آموزان، برنامه ها، نمرات، دوره ها و غیره.
  • تراکنش های کارت اعتباری : تراکنش های کارت اعتباری حاوی برگه هایی در مورد پرداخت ها هستند و گزارش های ماهانه تولید می کنند.
  • شرکت های مخابراتی : ذخیره اطلاعات در مورد تماس ها، تولید صورتحساب های ماهانه، ردیابی خط ارتباطی و غیره.
  • بخش مالی  : فروش و خرید ابزارهای مالی مانند اوراق قرضه و سهام را ردیابی می کند.
  • مشاغل تولیدی : مدیریت زنجیره تامین، خطوط تولید، انبارها، تولید فاکتورها
  • منابع انسانی : اطلاعات مربوط به کارمندان، چک حقوق، مالیات، مزایا را ذخیره می کند.

فهرست بالا نشان می دهد که database ها برای هر نوع کسب و کاری چقدر حیاتی هستند. با رابط های کاربری مدرن، هنگام دسترسی به یک database، تمامی فرایند در سمت سرور اتفاق می افتد. بنابراین بسیاری از کاربران از استفاده روزانه از یک پایگاه اطلاع ندارند.

 

انواع مختلف پایگاه داده

در حال حاضر انواع مختلفی از پایگاه داده موجود است که هر کدام مزایا و معایبی دارند. هر نوع database یک محیط خاص برای ذخیره داده ها و رابطه بین اطلاعات ایجاد می کند.

  • رابطه‌ای \ Relational databases

  • شی‌گرا \ Object-oriented databases
  • توزیع‌شده \ Distributed databases

  • پایگاه داده NoSQL

  • نمودار \ Graph databases

  • ابر \ Cloud databases

  • متمرکز \ Centralized database

در این قسمت ما رابطه ای، NoSQL، ابری را توضیع خواهیم داد.

پایگاه داده رابطه ای :یک database رابطه ای از مجموعه ای از جداول با داده هایی که در یک دسته از پیش تعریف شده قرار می گیرند، تشکیل شده است.
این نوع database روابط پایگاه داده را در قالب جداول تعریف می کند. به آن  DBMS رابطه ای نیز می گویند. که محبوب ترین نوع DBMS در بازار است. نمونه پایگاه داده سیستم RDBMS شامل پایگاه داده MySQL، Oracle و Microsoft SQL Server است.

پایگاه داده NoSQL : پایگاه داده NoSQL برای مجموعه های بزرگی از داده های توزیع شده استفاده می شود. چند مشکل عملکرد داده های بزرگ وجود دارد که به طور موثر توسط پایگاه داده های رابطه ای مدیریت می شوند. این نوع database کامپیوتری در تجزیه و تحلیل داده های بدون ساختار با اندازه بزرگ بسیار کارآمد است.  از نظر ساختاری انواع مختلفی از database با تمرکز بر در دسترس بودن بالا هستند. سیستم های NoSQL برای حجم زیادی از داده های بدون ساختار مناسب هستند.

چند نمونه از سیستم پایگاه داده NoSQL با دسته بندی آنها عبارتند از :

  • MongoDB, CouchDB, Cloudant (Document-based)
  • Memcached, Redis, Coherence (key-value store)
  • HBase, Big Table, Accumulo (Tabular)

پایگاه داده ابری : پایگاه داده ابری پایگاه داده ای است که برای محیط مجازی بهینه شده یا ساخته شده است. مزایای بسیاری از پایگاه داده ابری وجود دارد که برخی از آنها می توانند برای ظرفیت ذخیره سازی و پهنای باند هزینه کنند که انعطاف پذیری بالایی دارد. همچنین مقیاس پذیری بر حسب تقاضا، همراه با در دسترس بودن بالا را ارائه می دهد.

اجزای پایگاه داده

پنج جزء اصلی یک سیستم database را تشکیل می دهند.

سخت افزار (Hardware) : سخت افزار شامل دستگاه های فیزیکی است که رایانه ها را با دنیای واقعی متصل می کند. وقتی صحبت از database ها می شود، سرورها، دیسک های ذخیره سازی و دستگاه های مختلف جمع آوری داده ها شامل سخت افزار مورد نیاز برای اجرا و پر کردن پایگاه داده می شود.سخت‌افزار شامل دستگاه‌های فیزیکی، الکترونیکی مانند رایانه، دستگاه‌های ورودی/خروجی، دستگاه‌های ذخیره‌سازی و غیره است. این رابط بین رایانه‌ها و سیستم‌های دنیای واقعی را ارائه می‌دهد.

نرم افزار (Software) : این مجموعه ای از برنامه هایی است که برای مدیریت و کنترل database استفاده می شود. این شامل خود نرم افزار database، سیستم عامل، نرم افزار شبکه ای است که برای اشتراک گذاری داده ها بین کاربران و برنامه های کاربردی برای دسترسی به داده ها در database استفاده می شود. این نرم افزار شامل مجموعه وسیعی از برنامه های مورد استفاده برای دسترسی، دستکاری و کنترل database است. در سطوح پایین‌تر، نرم‌افزار شامل سیستم‌عامل‌هایی است که پایگاه‌های اطلاعاتی روی آن‌ها قرار دارند، شبکه ارتباطی با پایگاه‌های اطلاعاتی و نرم‌افزاری برای دسترسی به داده‌ها.

داده (Data) : داده ها یک قالب خام و سازمان نیافته هستند که برای معنا دار شدن آن ها باید پردازش شوند. داده ها می توانند ساده و در عین حال سازماندهی نشده باشند مگر اینکه سازماندهی شده باشند که تبدیل به اطلاعات می شوند. به طور کلی داده ها شامل حقایق، مشاهدات، ادراکات، اعداد، کاراکترها، نمادها، تصاویر و غیره است. داده ها واقعیت اساسی در مورد یک آیتم یا رویداد است که پایگاه داده می تواند ذخیره کند. داده ها برای به دست آوردن معنا و تبدیل شدن به اطلاعات نیاز به پردازش دارند. علاوه بر این، پردازش جزئیات از داده ها استخراج می کند و به رویه های تصمیم گیری کمک می کند.

روش ها (Procedure) : رویه مجموعه ای از دستورالعمل ها و قوانینی است که به شما در استفاده از DBMS کمک می کند. این پایگاه داده را با استفاده از روش های مستند طراحی و اجرا می کند که به شما امکان می دهد تا کاربرانی که آن را اداره و مدیریت می کنند راهنمایی کنید. رویه های پایگاه داده شامل تمام عملکردهایی است که در یک فضای ذخیره سازی کار می کنند. خواه پشتیبان‌گیری معمولی، تولید گزارش‌ها و سایر عملیات‌های روزمره باشد، رویه‌ها مجموعه دستورالعمل‌هایی هستند که در سیستم مدیریت پایگاه داده اجرا می‌شوند.

زبان دسترسی به پایگاه داده (Database Access Language) : زبان دسترسی به پایگاه داده زبان برنامه نویسی است که برای درج، به روز رسانی، حذف و اصلاح داده های ذخیره شده در پایگاه داده استفاده می شود.

سیستم مدیریت پایگاه داده چیست؟ (DBMS)

سیستم مدیریت پایگاه داده (DBMS) مجموعه ای از برنامه هاست که کاربران خود را قادر می سازد به database دسترسی داشته باشند. دستکاری داده ها، گزارش و نمایش داده ها. همچنین به کنترل دسترسی به database کمک می کند. سیستم های مدیریت پایگاه داده مفهوم جدیدی نیستند و برای اولین بار در دهه 1960 پیاده سازی شدند. گفته می شود که فروشگاه داده های یکپارچه (IDS) چارلز باخمن اولین DBMS در تاریخ است. با پایگاه داده زمان، فناوری ها بسیار تکامل یافتند، در حالی که استفاده و عملکردهای مورد انتظار database ها به شدت افزایش یافت.

یک سیستم مدیریت پایگاه داده (DBMS) به عنوان رابط بین کاربر (یا برنامه های کاربردی) و پایگاه داده عمل می کند. این برنامه امکان ارتباط مستقیم با پایگاه داده، امکان بازیابی داده ها، به روز رسانی، بهینه سازی و مدیریت کلی اطلاعات ذخیره شده در database را فراهم می کند.