واضح است که دادهها از ارزش بالایی برخوردار هستند و واقعا هم همینطور است. سازمانها از دادهها برای انجام کارهای خارق العاده استفاده میکنند؛ واژه مهم ” استفاده کردن” است و نه تنها “جمعآوری”.
فرآیند جمعآوری دادهها کاملا اثبات شده است؛ در حقیقت؛ سازمانهای آیندهنگر حتی قبل از اینکه بدانند که چگونه میخواهند از دادهها استفاده کنند؛ شروع به جمعآوری آنها میکنند. حتی اگر هنوز نمیدانند که چگونه میتوان اطلاعات ارزشمند را از دادهها استخراج کرد؛ آنها تشخیص میدهند که دادهها از ارزش بالایی برخوردار هستند. حالا چالش این است که چگونه از این دادهها برای بدست آوردن بینشی ارزشمند برای کسب و کار خود استفاده کنیم.
تلاشهای متخصصان هوش تجاری و علم داده حالا روی نحوه استفاده از همه این دادهها متمرکز شده است. حجم؛ سرعت و تنوع دادهها در حال افزایش است و در نتیجه پیچیدگی را افزایش پیدا میکند. منابع داده جدید؛ ساختاریافته و بدونساختار؛ در فضای ابری و از برنامههای SaaS باید با انبار دادههای محلی موجود ادغام شوند. تصمیمگیری در زمان واقعی مستلزم مصرف سریعتر و پردازش سریعتر دادهها است.
هوش تجاری و علوم داده برای بررسی این چالشها باید در کنار هم کار کنند. برای استفاده موثر از هوش تجاری و علم داده؛ شما نیاز به ابزارهایی دارید که بتوانند هر دوی آنها را مدیریت کنند و به طور یکپارچه با دادههای مشابه کار کنند.
هوش تجاری (Business Intelligence) چیست؟
Business Intelligence (BI) برای انجام تجزیه و تحلیل توصیفی دادهها با استفاده از فناوری و مهارتهایی برای تصمیمگیری آگاهانه تجاری در نظر گرفته شده است. مجموعهای از ابزارهای مورد استفاده BI برای جمعآوری دادهها؛ تبدیل داده و کنترل است. با امکان اشتراکگذاری دادهها بین سهامداران داخلی و خارجی, تصمیمگیری سادهتر می شود. هدف هوش تجاری استخراج هوش قابل رسیدگی (عملی) از دادهها است. برخی از اقدامات BI ممکن است شامل موارد زیر باشد:
- رسیدن به درک بهتری از بازار
- کشف فرصتهای جدید کسب درآمد
- بهبود فرآیندهای تجاری
- جلوتر از رقبا بودن
تاثیرگذارترین عامل هوش تجاری در سالهای اخیر؛ رایانش ابری بوده است. ابر امکان پردازش دادههای بیشتر (از منابع بیشتر) را میهد و بهرهوری را نسبت به هر زمان دیگری (که از فناوریهای ابر استفاده نمیشد) افزایش میدهد.
علم داده (Data science) چیست؟
علم داده یک مطالعه میان رشتهای است که در آن از دادهها برای استخراج بینشهای آیندهنگرانه و معنادار استفاده میشود. این علم از آمار؛ ریاضیات؛ علوم کامپیوتر و هر آنچه که به تجزیه و تحلیل مربوط میشود استفاده میکند. هدف علم داده؛ غالبا پاسخ به سوالاتی است مانند ” اگر …. چه اتفاقی میافتد؟” است.
همانند اکثر علوم؛ فناوری و ابزارها بخش اصلی علم داده را تشکیل دادهاند. یادگیری ماشین و هوش مصنوعی همگی نقش مهمی در این موضوع ایفا میکنند. فناوری رایانش ابری؛ سرعت، کشش و قدرت پردازش مورد نیاز راه حلهای علم داده را فراهم میآورد.
مقایسه هوش تجاری و علم داده
درک تفاوت بین علم داده و هوش تجاری مفید است. درک نحوه کار این دو در کنار هم , به همان اندازه مفید است. مسئله انتخاب یکی و کنار گذاشتن دیگری نیست. بلکه انتخاب راه حل مناسب برای بدست آوردن بینش مورد انتظار شما است و این غالبا به معنای استفاده از علم داده و هوش تجاری در کنار هم است.
شاید سادهرین روش برای تمایز این است که به علم داده به دید آینده و به هوش تجاری به دید گذشته و حال فکر کنیم. علوم داده به تجزیه و تحلیل پیشبینی و تجزیه و تحلیل دیدگاه ها میپردازد؛ در حالی که هوش تجاری به تجزیه و تحلیل توصیفی میپردازد. سایر عواملی که تفاوت ایجاد میکنند شامل دامنه، یکپارچهسازی دادهها و مجموعه مهارتها هستند.
هوش تجاری |
علم داده |
|
توصیفی
چه اتفاقی افتاده است؟ |
پیشبینی؛ دیدگاه
چه اتفاقی خواهد افتاد؟ |
نوع تجزیه و تحلیل |
عمومی | خاص |
دامنه (محدوده) |
ETL | ELT |
یکپارچهسازی دادهها |
تحلیلگر تجاری؛ کاربر تجاری | دانشمند داده |
مجموعه مهارتها |
نوع تجزیه و تحلیل
علم داده احتمال وقایع و شرایط آینده را بررسی میکند. تجزیه و تحلیل پیشبینی از دادههای هیستوری (تاریخچه) برای پیشبینی ترندهای تجاری، رفتار مشتری و موفقیت محصول استفاده میکند. علم داده میخواهد به سوالاتی که در مورد آنچه که در آینده اتفاق خواهد افتاد پاسخ دهد. تجزیه و تحلیل توصیفی به دنبال پیدا کردن راهحلی برای یک مشکل خاص تجاری است.
هوش تجاری به آنچه که تا کنون اتفاق افتاده است نگاه میکند. هوش تجاری از تحلیل توصیفی برای ارائه دادههای تاریخی به واحدهای تجاری به گونهای استفاده میکند که تجسم و درک آنها را ساده کند. هوش تجاری اغلب برای تولید گزارشهایی استفاده میشود که وضعیت فعلی کسب و کار را به طور واضح و دقیق بیان میکند.
دامنه یا محدوده
با توجه به اینکه هدف علم داده پیشبینی وقایع یا شرایط است؛ فرآیند با یک ایده یا فرضیه خاص شروع میشود. بعد برای تعیین صحت فرضیه اقدام میشود، به هر حال این یک علم است. تحلیل پیشبینی روی این فرضیه خاص انجام می شود. بالعکس؛ هوش تجاری باید عمومی باشد. تجزیه و تحلیل توصیفی باید به هر واحد کسب و کار امکان تولید هر نوع گزارش مورد نیاز را بدهد. به عنوان مثال، دادهها باید در ارزیابی موفقیت آخرین پروژه از یک مدیر محصول پشتیبانی کنند یا از یک مدیر فروش که نتایج سه ماهه خود را بررسی میکند پشتیبانی کنند.
یکپارچهسازی دادهها
فرآیند یکپارچهسازی دادههای استخراج شده، انتقال داده شده؛ بارگذاری شده (ETL) برای هوش تجاری به خوبی کار می کند. دادهها را قبل از بارگذاری در انبار دادهها، انتقال میدهند. این بدان معناست که شمای انبار داده شناخته شده است و این استفاده از ابزار تجزیه و تحلیل را برای تولید گزارش (برای کاربران تجاری) را ساده میکند.
گزینه دیگر؛ بارگذاری دادهها در انبار دادهها قبل از تغییر شکل، استخراج؛ بارگذاری و انتقال داده (ELT) است. با استفاده از این روش یکپارچهسازی دادهها؛ دادهها میتوانند در هر زمانی که درخواست میشوند انتقال داده شوند. از آنجا که کویری یا درخواست میتواند متناسب با نیازهای تجزیه و تحلیل خاص باشد؛ بدون اینکه در یک شمای خاص قفل شود؛ ELT برای برنامههای کاربردی علوم داده مناسب است.
مجموعه مهارت
بدیهی است که علم داده حوزه کاری دانشمندان داده است. با این حال علم داده در خلاء انجام نمیشود. در حالی که دانشمندان داده باید مجموعهای کامل از مهارتها را داشته باشند؛ اما آنها همچنان به کمک واحد IT؛ عملیات؛ واحدهای تجاری؛ امور مالی و سایر سرویسها نیاز دارند.
تحلیگران تجاری با هوش تجاری در ارتباط هستند و مطمئنا مهارتهای اولیه را دارند. با این حال؛ این کاربران تجاری هستند که بیشترین سود را میبرند و بیشترین نیاز را به هوش تجاری دارند. به همین دلیل؛ اکثر ابزارهای هوش تجاری از قابلیتهای سلف سرویس موثری برخوردار هستند؛ بدون این ویژگی, بینش کسب و کار به راحتی در دسترس کاربران تجاری قرار نمیگیرد.
]
شباهت علم داده و هوش تجاری
حتی با وجوت تفاوتهایی که بین علم داده و هوش تجاری وجود دارد، یک شباهت آشکار وجود دارد: هر دو از دادهها برای ارائه بینش معنادار و عملی برای یک سازمان استفاده میکنند. شباهت های دیگر عبارتند از:
ورودی زباله، خروجی زباله – کیفیت دادهها وارد شده به سیستم, تاثیر مستقیمی روی معنادار بودن نتایج دارد.
همکاری ضروری است – هیچ کدام از علم داده یا هوش تجاری در خلاء یا در فرهنگ سیلوها کار نمیکنند.
بهتر شدن با هم – در صورت استفاده از هر دو، بینشهای مفیدتری ایجاد میشود.
ابر عامل مهمی است – اگر چه استفاده از علم داده هوش تجاری با استفاده از فناوری داخلی امکانپذیر است؛ اما استفاده از امر معمولا باعث سهولت؛ سرعت؛ چابکی و هزینه های کمتر میشود و بینش بهتری را فراهم میآورد.
سادهتر – تهیه سرورها و فضای ذخیرهسازی در سرویسهای ابری عمومی دردسرهای سفارش و نصب سخت افزار را به همراه ندارد.
سریعتر – یک سرور جدید میتواند در عرض چند دقیقه در ابر فعال شود این در حالی است که برای دریافت یک سرور پیشفرض و فضای ذخیرهسازی فعال باید هفتهها (و حتی بیشتر) صبر کرد.
چابکتر – همانطور که باید برای رشد بلند مدت یا برای پروژه های کوتاه مدت بالا و پایین کنید؛ منابع ابری به انداه کافی چابک هستند تا در هر زمان مشخص با نیازهای شما مطابقت پیدا کنند.
هزینه کمتر – در حالی که این به شرایط خاصی بستگی دارد؛ اما تهیه منابع ابری نسبت به خرید سخت افزار داخلی هزینه کمتری را به همراه دارد. همچنین از ارتقاء سختافزار و هزینههای بروزرسانی جلوگیری میکند.
بینش بهتر – همکاری عامل اصلی دستیابی به بینش بهتر است. قرار دادن ابزارهای داده در فضای ابری به تیمهایی که از نظر جغرافیایی پراکنده هستند امکان دسترسی بهتر به انبارهای داده و ابزارهای تجزیه و تحلیل را میدهد.
ابزارهای مناسب برای یک کار مناسب – مجموعهای از ابزارها به طور یکپارچه با هم کار میکنند و قابلیتهایی را برای اطمینان از کیفیت مناسب دادهها، ادغام دادهها و مدیریت کلی دادهها را فراهم میآورند.
چگونه علم داده و هوش تجاری میتوانند با هم کار کنند؟
اگر چه سازمانها میتوانند از طریق علم داده یا هوش تجاری به بینش معناداری دست پیدا کنند؛ اما استفاده از هر دوی اینها با هم، بیشترین بینش را برای هدایت تصمیمات استراتژیک فراهم میآورد. شرایطی را در نظر بگیرید که در آن یک شرکت خدمات حرفهای برای دستیابی به اهداف موفق؛ پیشنهاداتی را ارائه میدهد. آنها منابع محدودی برای پاسخگویی به RFPها دارند؛ بنابراین تصمیم میگیرند با استفاده از یک فرآیند داده محور؛ تصمیم بگیرند که کدام RFP به احتمال زیاد برنده میشود.
این شرکت برای بررسی نتایج RFP قبلی و ایجاد پروفایل مشتریان و پروژههایی که نرخ برد بالایی دارد؛ استفاده از هوش تجاری را انتخاب میکنند. بعد؛ با استفاده از این بینش؛ شرکت میتواند فرضیهها و سناریوهای مختلفی را ایجاد کند و با استفاده از علم داده و یادگیری ماشین؛ احتمال برنده شدن در پروژههای بعدی را پیشبینی میکند. بنابراین، با استفاده از هوش تجاری و علم داده در کنار هم؛ این شرکت حالا اطلاعاتی در مورد مشتریان و پروژههایی دارد که برای کسب و کار مفید واقع میشود.
به راحتی میتوان فهمید که هوش تجاری و علم داده؛ هر کدام در کمک به بینش چگونه کمک خواهند کرد؛ اما ترکیب این دو؛ چیزی است که بیشترین مزایا را به همراه دارد.
ابر و آینده علم داده و هوش تجاری
دانشمندان داده (که شاید با نام آمارشناسان هم توصیف شوند) و تحلیلگران هوش تجاری از مدتها قبل از به وجود آمدن رایانش ابری؛ وجود داشتهاند. فقط در چند سال گذشته؛ رشد دادهها انفجاری بوده است که ممکن است یک سیستم واحد، قدرت ذخیرهسازی و پردازش لازم برای مدیریت این همه داده را نداشته باشد. این امر باعث شده تا ذخیره و پردازش به ابر منتقل شود.
فناوری ابر؛ مزایای زیر را هم به همراه دارد:
- ذخیرهسازی ارزان
- پردازش سریع
- مقیاسپذیری برای پاسخگویی به تقاضا
- پرداخت به اندازه مصرف
- بدون در نظر گرفتن موقعیت مکانی؛ از قابلیت جمعآوری داده از منابع مختلف استفاده میکند.
- دسترسی ساده سازمان
- ابزارهای بصری سلف سرویس که دموکراتیزاسیون دادهها را ساده میکنند.
در سالهای اخیر، بیشتر تلاشها برای مدیریت دادهها در فضای ابری بوده است که به منابع داده متصل میشود و دادهها را جمعآوری میکند. سازمانها دو چیز را می دانند:
- ما میتوانیم حجم زیادی از دادهها را جمعآوری کنیم
- این دادهها میتوانند منجر به نتایج بهتر کسب و کار شوند.
اما هر سازمانی نمیداند که چگونه از مرحله 1 به مرحله 2 دست پیدا کند. سازمانها به روشی نیاز دارند تا از اتصال و جمعآوری به تجزیه و تحلیل و عمل دست پیدا کنند. بنابراین آینده علم داده و هوش تجاری در ابر باید به جای فناوری، به عملیکردن بپردازد. این بدان معناست که زیرساختهای بهتری برای استفاده از قدرت بالقوه یادگیری ماشین و هوش مصنوعی مورد نیاز است. که به نوبه خود از تجزیه و تحلیل بهتر دادهها پشتیبانی میکند.
ارائهدهندگان ابر روی این تغییر کار کردهاند. Project Brainwave مایکروسافت از معماری سخت افزاری برای سرعت بخشیدن به محاسبات هوش مصنوعی در زمان واقعی استفاده میکند. معماری Project Brainwave دارای آرایههایی از گیتهای قابل برنامهریزی میدانی (FPGA) است تا محاسبات هوش مصنوعی را در زمان واقعی با هزینههای رقابتی و کمترین تاخیر در صنعت انجام دهد. این پلت فرم روی رایانش ابری مایکروسافت است. سرویسهای وب آمازون؛ همچنین FPGA را در نمونههای EC2 F1 خود ارائه میدهند. این با Infrastructure 3.0 در سطح صنعت همسو است که میخواهد ما را از اتصال و جمعآوری به سمت تجزیه و تحلیل و عمل کردن سوق دهد.
شروع کار با علم داده و هوش تجاری بهتر
در این مرحله واضح است که علم داده و هوش تجاری رابطه بسیار جالبی دارند و خواهند داشت. آنها هدف کلی یکسانی دارند که این هدف ارائه بینش معنادار داده محور میباشد؛ اما در حالی که هوش تجاری به گذشته نگاه میکند، علم داده به آینده چشم دارد. این بدان معنا نیست که یکی از دیگری بهتر است. هر یک از آنها جایگاهی دارند و مشکلات مختلفی را برطرف میکنند.
علی رغم تفاوتهایی که وجود دارد؛ یک شباهت بین علم داده و هوش تجاری وجود دارد که میتواند بینشی جامع را ایجاد کند. با پیشرفت در محاسبات ابری؛ یادگیری ماشین و هوش مصنوعی؛ این بینش در آینده رشد خواهد کرد. در حال حاضر، شما به ابزاری نیاز دارید که بتواند مزایای هر دوی علم داده و هوش تجاری را در کنار هم ارائه دهد.
سه ویژگی مهم و مورد نیاز برای علم داده و هوش تجاری
برای استفاده از مزایای علم داده و هوش تجاری؛ شما به ابزاری نیاز دارید که حداقل کیفیت داده استثنایی؛ یکپارچهسازی دادهها و قابلیتهای سلف سرویس را در یک راه حل واحد SaaS ارائه دهد. این ویژگیها چه در محیط، چه در فضای ابری (تک یا چند ابری) و یا در یک ساختار ترکیبی مورد نیاز هستند.
کیفیت داده بسیار مهم است – دادهها باید دقیق؛ کامل و بهروز باشند تا اطمینان حاصل شود که تصمیماتی که بر اساس این داده اتخاذ میشوند؛ معتبر هستند. قابلیتهای کیفیت داده یک راه حل باید شامل مشخصات؛ پاک سازی و غنی سازی دادهها باشد.
قابلیتهای یکپارچهسازی دادهها که میتواند تعداد فزایندهای از منابع داده و مقادیر فزاینده داده را کنترل کند. شما به یک راه حل نیاز دارید که بتواند دادهها را از همه منابع جمعآوری و یکپارچهسازی کند تا تجزیه و تحلیل کامل و دقیق امکانپذیر شود. یک راه حل SaaS میتواند این امکان را فراهم آورد و مقیاس پذیری؛ متمرکزشدن و مزایای هزینهای که از یک سرویس ابر انتظار دارید را فراهم آورد.
دسترسی سلف سرویس به دادههایی که توسط کاربران غیرفنی زیاد تقاضا میشوند. راه حلهای داده باید دسترسی سلف سرویس را فراهم آورند که بدون در نظر گرفتن مهارتهای فنی، استفاده از آن ساده باشد و به کاربران اجازه دهد دادهها را کشف، مجسمسازی و تجزیه و تحلیل کنند. همچنین برخی از کارهایی که تیمهای فنی داده باید برای پشتیبانی از این کاربران انجام دهند؛ بارگیری ابزارهای سلف سرویس (در صورت عدم استفاده) است.