اشاره

تغییر روند توجه سازمان‌ها از منابع مالی به سرمایه‌های انسانی، فراهم آمدن زمینه‌های تراکم و حتی انفجار اطلاعات از طریق فناوری اطلاعات و ارتباطات در سازمان‌ها، الزام و اهمیت مدیریت دانش را بیش از گذشته به رخ کشیده است. استخراج اطلاعات مناسب از میان انبوه داده‌ها و تبدیل آنها به دانش مورد نیاز سازمان، بویژه در تصمیم‌گیری‌های سازمانی، نیازمند استفاده از روش‌های نوین در این حوزه است. داده‌کاوی1 یکی از این ابزار و رویکردهاست که در فضای مدیریت دانش سازمان‌ها به کشف دانش از پایگاه داده‌ها کمک می‌کند.

مدیریت دانش1
امروزه در عصر یادگیری، کارکنان را ارزشمندترین منبع سازمان به‌شمارمی‌آورند. کارکنان، حجم عظیم داده‌ها، اطلاعات و دانش سازمان را تولید کرده و به‌کار می‌بندند. از این‌رو در سازمان‌های نوین، هم‌کناری مدیریت دانش و مدیریت منابع انسانی، به امری ضروری تبدیل شده است. مدیریت دانش، رویکردی سیستمی و یکپارچه است که تمامی دارایی‌های اطلاعاتی سازمان، اعم از: مستندات، پایگاه داده‌ها، خطی‌مشی‌ها، رویه‌ها و تجربیات کارکنان و سازمان را در برمی‌گیرد و به اشتراک می‌گذارد. مدیریت دانش، سکوی تسهیل کننده استخراج، ذخیره‌سازی، یکپارچه سازی، انتقال، مشاهده، تجزیه و تحلیل و استفاده از دانش در سازمان است. مدیریت دانش به منظور حفظ، تجزیه و تحلیل، سازماندهی، بهبود و تسهیم تجارب کسب و کار، به‏عنوان ابزار، روش و راهبرد در سازمان به‏کارمی‏رود. در واقع، مدیریت دانش متدلوژی استخراج سیستمی و استفاده از دانش در سازمان است که از طریق همین دانش و سرمایه فکری، ثروت و ارزش می‏آفریند. در نگرش سیستمی به مدیریت دانش، سه مؤلفه اصلی: منابع انسانی، فرایندها و فناوری دخالت و با یکدیگر همپوشانی دارند (شکل 1).

 

شکل 1



نسبت مدیریت دانش و داده‌کاوی2
برای به‌کارگیری مدیریت دانش در سازمان، از ابزار متفاوتی استفاده می‌شود که یکی از مهم‌ترین آنها، داده‌کاوی است. هنگامی که طراحی مجدد فرایندهای کسب و کار (BRP) مورد نظر است، داده‌کاوی به عنوان تکنیک، در خدمت مدیریت دانش قرار می‌گیرد. در هر بنگاه صنعتی، اقتصادی و تجاری نیز دانش با ارزش در مورد مشتری، محصول و بازار را می‌توان از طریق داده‌کاوی به‌دست آورد. با بزرگ‌تر شدن حجم داده‌ها و اطلاعات سازمان‌ها، اهمیت این مسئله روزبه‌روز بیشتر می‌شود. هنگامی که حجم داده‌ها زیاد است، برای مدیریت آنها از سیستم‌های پایگاه داده‌ها (DBS/DBMS) استفاده می‌شود. در حالت زیاد بودن حجم داده‌ها، داده‌کاوی برای استخراج و به دست آوردن دانش به‌کار می‌آید. هنگامی که حجم دانش زیاد است، از سیستم مدیریت دانش (KMS) استفاده می‌شود.


داده‌کاوی
پیشینه طرح موضوع داده‌کاوی به دهه 1980 و به صورت جدی، به دهه 1990 برمی‌گردد. پیش از آن از سیستم‌های جمع‌آوری و مدیریت داده‌ها و اصطلاحاً لایروبی داده‌ها استفاده می‌شد، اما به مرور زمان، استخراج و کشف سریع و دقیق اطلاعات با ارزش و پنهان از پایگاه داده‌ها، به عنوان داده‌کاوی مورد توجه قرار گرفت. به این شکل بود که فرایند داده‌کاوی به عنوان فرایند آماری و تجزیه و تحلیل در فرایند کشف دانش در پایگاه داده‌ها (KDD)3 پررنگ شد، به حدی که گاه، داده‌کاوی (DM) به عنوان مترادف کشف دانش در پایگاه داده‌ها (KDD) مورد استفاده قرار می‌گرفت.
امروزه فرایند استخراج اطلاعات معتبر، از پیش ناشناخته، قابل فهم و قابل اعتماد از پایگاه داده‌های بزرگ و استفاده از آن در تصمیم‌گیری و در فعالیت‌های تجاری داده‌کاوی نامیده می‌شود. در تعاریف متعدد و متنوع برای داده‌کاوی بر موضوعاتی نظیر: استخراج دانش کلان، کاوش در داده‌ها، تجزیه و تحلیل داده‌ها و یافتن روابط و الگوهای مطمئن بین داده‌ها تأکید می‌شود. هدف نهایی داده‌کاوی، ایجاد سیستم‌های پشتیبانی تصمیم‌گیری سازمانی است. داده‌کاوی، به استخراج اطلاعات مفید و دانش ا ز حجم زیاد داده‌ها می‌پردازد. داده‌کاوی، الگوهای حاوی اطلاعات را در داده‌های موجود جست‌وجو می‌کند. این الگوها و الگوریتم‌ها، می‌توانند توصیفی باشند، یعنی داده‌ها را توصیف کنند و یا جنبه پیش‌بینی داشته باشند، یعنی متغیرها برای پیش‌بینی ارزش‌های ناشناخته سایر متغیرها به‌کار روند. داده‌کاوی توصیفی، به دنبال یافتن اگرها در فعالیت‌ها یا اقدامات گذشته است و داده‌کاوی پیش بینانه با نگاه به سابقه، رفتار آینده را پیش‌بینی می‌کند.


داده‌کاوی چیست وچه نیست
موارد زیر در حوزه داده‌کاوی قرار می‌گیرند:
* استخراج یا کاوش دانش از میان حجم عظیم داده‌ها
* استخراج اطلاعات و مدل کردن الگوهای پنهانی در میان انبوه داده‌ها
* استخراج اطلاعات غیر منتظره، ناشناخته و بالقوه مفید از داده‌ها
* استخراج اطلاعات یا الگوهای مفید و جالب از داده‌ها در پایگاه داده‌های بزرگ
موارد زیر در محدوده داده‌کاوی قرار نمی‌گیرند:
* انبارش داده‌ها
* پردازش قیاسی داده‌ها
* سیستم‌های خبره (ES)
* فرایند تجزیه و تحلیل مستقیم
* ابزار تجزیه و تحلیل آماری
* مشاهده‌گری داده‌ها


حوزه‌های داده‌کاوی
داده‌کاوی در سه حوزه مستقل به‌کار می‌رود و در آنها ریشه دوانده است:
1. آمار کلاسیک و الگوهای آماری
2. هوش مصنوعی
3. یادگیری خودکار و شبکه‌های عصبی
در داده‌کاوی، هوش مصنوعی، یادگیری خودکار، تئوری پایگاه داده‌ها و علم آمار در هم آمیخته شده است. برای انجام داده‌کاوی از ابزار مختلف نظیر: تفکیک کردن، دسته‌بندی، درخت تصمیم‌گیری، تحلیل قواعد وابستگی، تحلیل خوشه‌ها و الگوریتم‌های عمومی استفاده می‌شود (شکل 2).

 

شکل 2


مراحل فرایند
هدف داده‌کاوی، تجزیه و تحلیل اکتشافی داده‌ها، کشف الگوها و قواعد و الگوریتم‌ها، مدل‌سازی پیش‌بینانه و جست‌وجوی انحرافات است. برای انجام این هدف، فرایند داده‌کاوی در جهت کشف دانش در مراحل مختلف انجام می‌شود (شکل3) که عبارت است از:
1. اولین گام در داده‌کاوی، شناسایی هدف و فهم حوزه کاربرد آن است و مشخص می‌کند که چه کاری، در چه حوزه‌ای انجام خواهد شد.
2 . انتخاب داده‌ها یعنی تعیین اهداف برای تجزیه و تحلیل و کشف آن
3 . آماده‌سازی داده‌ها شامل تمیز‌سازی داده‌ها
4 . اتخاذ بهترین روش داده‌کاوی برای دست‌یابی به اهداف
5 . اجرای داده‌کاوی یعنی به کارگیری الگوریتم
6 . ارزیابی و اعتبارسنجی یافته‌ها
7 . استفاده از نتایج و تثبیت و تحکیم دانش کشف شده
8 . تصمیم‌گیری براساس دانش کشف شده

شکل 3


طراحی سیستم داده‌کاوی
اگر از داده‌کاوی برای مهندسی مجدد کسب و کار استفاده شود، مراحلی که ذکر شد به صورت زیر قابل استفاده خواهند شد:
1. فهم و درک کسب و کار شامل تعیین اهداف کسب و کار، ارزیابی موقعیت، تعیین هدف داده‌کاوی و طرح پروژه.
2. فهم و درک داده شامل جمع‌آوری داده‌ها، توصیف داده‌ها، کیفیت داده و صحه‌گذاری، آنالیز اکتشافی داده‌ها.
3. آماده‌سازی داده شامل انتخاب، ساخت و انتقال متغیرها، یکپارچه‌سازی و فرمت‌دهی داده‌ها
4. ساختن مدل و صحه‌گذاری شامل طرح اولیه، ساخت مدل و ارزیابی مدل
5 . ارزیابی و تغییر شامل ارزیابی نتایج، فرایند بازنگری و تعیین مراحل بعدی
6 . جاری‌سازی شامل اجرای طرح، تدوین گزارش نهایی، پایش و نگهداری طرح و بازنگری آن

موانع و چالش‌ها
با وجود مزایای فراوان که داده‌کاوی برای مدیریت دانش سازمان‌ها و دست‌یابی به دانش برای تصمیم‌گیری سازمانی دارد، این حوزه با موانع و چالش‌هایی روبه‌روست که عبارتند از:
1. فقدان داده برای پشتیبانی تجزیه و تحلیل
2. قدرت محدود محاسبه برای به دست آوردن محاسبات ریاضی مورد نیاز الگوریتم‌های داده‌کاوی
3. عدم مطلوبیت و جذابیت بیشتر الگوها
4. خطر وجود داده‌های آلوده و کسب نتایج کاملاً غلط
5 . تمرکز بیش از حد بر الگوریتم‌ها
6 . هزینه نسبتاً گران سرمایه‌گذاری در همه حوزه‌ها
7 . عدم پوشش کامل همه حوزه‌ها

کاربرد داده‌کاوی
امروزه داده‌کاوی در حوزه‌های بسیار متنوع و متفاوت استفاده می‌شود:
حوزه علم: شیمی، فیزیک، داروسازی، تجزیه و تحلیل تصاویر پزشکی، تعیین نوع رفتار با بیماران و پیشگویی میزان موفقیت‌های اعمال پزشکی، تعیین میزان موفقیت روش‌های درمانی در برخورد با بیماری‌های سخت، بیوشیمی، حسگرهای کنترل در اقمار مصنوعی، بیوعلم شامل توصیف ژن‌ها و تقسیم‌بندی گروه پروتئین‌ها و توسعه داروها.
خرده فروشی: تجزیه و تحلیل سبد خرید بازار، تعیین الگوهای خرید مشتریان
بانکداری: پیش‌بینی الگوهای کلاهبرداری از طریق کارت‌های اعتباری، تعیین میزان استفاده از کارت‌های اعتباری براساس گروه‌های اجتماعی
فروش و بازاریابی: تجزیه و تحلیل سهام و سرمایه، تعیین مشتریان وفادار، مدیریت ریسک و پیش‌بینی فروش
بیمه: تجزیه و تحلیل دعاوی و پیشگویی میزان جریمه بیمه نامه‌های جدید توسط مشتریان
دیگر حوزه‌ها: ورزش و سرگرمی، فضانوردی و دیگر حوزه‌های علم.


پانوشت‌ها:
1. Knowledge management
2. Data mining
3. Knowledge discovery in databases


منابع:
1. O. Folorunso, A. Ogunde; "The electronic journal of K.M.", vol. 2, 2004.
2. B. Fernandez/et. Al., "Knowledge management"; cho.12, 2004.
3. N. Balac; "Introduction to data mining", 2006






تاریخ : چهارشنبه 89/7/28 | 8:0 صبح | نویسنده : مهندس سجاد شفیعی | نظرات ()
.: Weblog Themes By BlackSkin :.