انبار داده

انبار داده چیست؟

انبار داده ها ذخیره سازی الکترونیکی یک مقدار زیادی از اطلاعات یک کسب و کار است. انبار داده ها جزء حیاتی هوش تجاری است که تکنیک های تحلیلی را بر روی داده های کسب و کار استفاده می کند.

مفهوم انبارداری داده ها در سال 1988 توسط محققان IBM بری دلوین و پل مورفی معرفی شد. نیاز به داده های انبار تکامل یافته است به عنوان سیستم های کامپیوتری پیچیده تر شده و مقادیر بیشتری داده ها را مدیریت می کنند.

انبار داده ها برای مقایسه بین داده های ادغام شده از منابع ناهمگن چندگانه به منظور افزایش بینش کارکنان شرکت استفاده می شود. یک انبار داده برای اجرای پرس و جو و تجزیه و تحلیل بر روی داده های تاریخی مشتق شده از منابع تراکنش طراحی شده است. هنگامی که داده ها در انبار درج شده اند، تغییر نمی کند و نمی تواند تغییر یابد زیرا یک انبار داده ها تجزیه و تحلیل را در حوادثی که قبلا با تمرکز بر تغییرات داده ها در طول زمان انجام می شود، انجام می دهد. داده های ذخیره شده باید به شیوه ای امن، قابل اعتماد، آسان برای بازیابی و مدیریت آسان ذخیره شوند.

انبار داده

یک انبار داده لزوما مفهوم مشابه با یک پایگاه داده استاندارد نیست. یک پایگاه داده یک سیستم معاملاتی است که برای نظارت و به روز رسانی داده های زمان واقعی تنظیم شده است تا تنها آخرین اطلاعات موجود در دسترس باشد. یک انبار داده برای جمع آوری داده های ساخت یافته در طول یک دوره برنامه ریزی شده است. به عنوان مثال، یک پایگاه داده تنها ممکن است جدیدترین آدرس یک مشتری را داشته باشد، در حالی که یک انبار داده ممکن است تمام آدرس هایی را که مشتری در 10 سال گذشته داشته است داشته باد.

گام های خاصی برای ایجاد یک انبار داده وجود دارد. اولین مرحله استخراج اطلاعات است که جمع آوری مقادیر زیادی از داده ها از نقاط منبع مختلف است. پس از جمع آوری داده ها، از طریق تمیز کردن داده ها، فرایند ترکیب از طریق داده ها برای اشتباهات و اصلاح و یا حذف هر گونه خطا یافت می شود. داده های پاک شده از یک فرمت پایگاه داده به فرمت انبار تبدیل می شود. هنگامی که در انبار نگهداری می شود، داده ها از طریق مرتب سازی، تدوین، خلاصه سازی و غیره به دست می آیند تا بیشتر هماهنگ و آسان تر از آن استفاده شود. با گذشت زمان، اطلاعات بیشتر به انبار اضافه می شود به عنوان منابع داده های متعدد به روز شده است.

ممکن است داده های انبار برای استفاده در اکتشاف و داده کاوی، به دنبال الگوهای اطلاعاتی کسب و کار که به آنها کمک می کند تا فرآیندهای کسب و کار خود را بهبود بخشد. یک سیستم ذخیره سازی داده نیز می تواند برای بخش های مختلف در یک شرکت آسان تر شود تا به اطلاعات دسترسی پیدا کند. به عنوان مثال، یک انبار داده ممکن است به یک شرکت امکان دهد که به راحتی داده های تیم فروش را ارزیابی کند و به تصمیم گیری در مورد نحوه بهبود فروش یا ساده سازی بخش تصمیم گیری کمک کند. کسب و کار ممکن است تصمیم بگیرد که عادت های مصرف کنندگان مشتریان خود را در جهت بهتر کردن موقعیت محصولات خود و افزایش فروش قرار دهد. با انبارداری داده ها، این شرکت می توانند اطلاعات تاریخی هزینه های مشتریان خود در گذشته را به 20 سال برساند و تجزیه و تحلیل را بر روی این داده ها اجرا کند. اطلاعات حاصل می تواند بیننده را به ترجیحات مصرف کنندگان خود ارائه دهد؛ زمان، روز، ماه، یا سال با فروش بیشتر؛ بالاترین هزینه مشتری برای سال؛ و غیره. 

Data warehousing is the electronic storage of a large amount of information by a business. Data warehousing is a vital component of business intelligence that employs analytical techniques on business data.

The concept of data warehousing was introduced in 1988 by IBM researchers Barry Devlin and Paul Murphy. The need to warehouse data evolved as computer systems became more complex and handled increasing amounts of data.

Data warehousing is used to provide greater insight into the performance of a company by comparing data consolidated from multiple heterogeneous sources. A data warehouse is designed to run query and analysis on historical data derived from transactional sources. Once the data has been incorporated into the warehouse, it does not change and cannot be altered since a data warehouse runs analytics on events that have already occurred by focusing on the changes in data over time. Warehoused data must be stored in a manner that is secure, reliable, easy to retrieve and easy to manage.