میزگرد

مهمان عزیز شما حق دیدن لینک ها را ندارید

عضویت


امروزه با گسترش ذخیره داده ها در بانک‏های اطلاعاتی شرکت ‏های توزیع، با انبوهی از داده ها روبرو هستیم که اغلب آنها به طور مستقیم قابل استفاده نیستند، بلکه اطلاعات و دانش نهفته در این داده‏ ها می تواند نقش ارزنده ای در بهبود کارآمدی و بهره وری داشته باشد. بنابراین، بهره‏ گیری از قدرت داده‏ کاوی جهت شناسایی الگوها و مدل ‏ها و نیز ارتباط عناصر مختلف در پایگاه داده جهت کشف دانش نهفته در داده ‏ها روز به روز ضروری ‏تر می شود. بر این مبنا، شرکت های توزیع می‏ توانند با بکارگیری روش‏ های داده ‏کاوی مناسب، روابط و الگوهای موجود در پدیده‏ های مختلف را شناسایی و شبکه توزیع را بصورت بهینه ‏تری مدیریت کنند.
در دومین سال برگزاری نشست داده‏ کاوی در صنعت برق در کنفرانس سیرد، ۵۵ مقاله تسلیم شده که از این تعداد ۱۹ مقاله مورد پذیرش قرار گرفته است. موضوع قابل توجه در نشست سال جاری، تنوع موضوعی کارها نسبت به سال گذشته بوده است. طوری که، در سال گذشته عمده تمرکز روی تلفات غیر فنی و دستکاری کنتور بوده، در حالیکه در سال جاری، علاوه بر موضوع مهم تلفات غیرفنی، زمینه‏ های مختلف بهره‏ برداری و امور مشترکین شرکت های توزیع از جمله تحلیل و مدل سازی خاموشی ‏ها، مدل سازی و پیش‏ بینی رفتار مشترکین، بهبود مدیریت منابع انسانی شرکت توزیع، کیفیت توان و ولتاژ شبکه، و توسعه شبکه توزیع ارائه شده است. گزارش حاضر خلاصه‏‏ای از مقالات پذیرفته شده را ارائه می‏ نماید. میزگرد داده کاوی در صنعت توزیع، به عنوان بخشی از محوری به همین نام (که با شماره ۱+۶ شناخته می شود) در کنفرانس منطقه ای سیرد ایران، در ساعت ۱۱ تا ۱۲:۳۰ روز چهارشنبه مورخ سوم بهمن ماه ۱۳۹۷، با حضور کارشناسان و متخصصان صنعت برق از سراسر ایران در سالن بزرگ خلیج فارس پژوهشگاه نیرو برگزار گردید.
شرکت کنندگان میزگرد:
دکتر علیرضا فریدونیان عضو هیأت علمی دانشکده مهندسی برق دانشگاه صنعتی خواجه نصیرالدین طوسی (دبیر میزگرد)؛
دکتر هادی مرادی عضو هیأت علمی دانشکده مهندسی برق و کامپیوتر دانشگاه تهران؛
دکتر علی احمدی عضو هیأت علمی دانشکده مهندسی کامپیوتر دانشگاه صنعتی خواجه نصیرالدین طوسی؛
دکتر سمیه علیزاده عضو هیأت علمی دانشکده مهندسی صنایع دانشگاه صنعتی خواجه نصیرالدین طوسی؛
دکتر مجتبی خدرزاده عضو هیأت علمی دانشکده مهندسی برق دانشگاه شهید بهشتی و مدیر سابق دفتر مهندسی معاونت توزیع توانیر؛
مهندس امین رییس زاده مدیر دفتر تحقیقات شرکت توزیع شهر شیراز (شرکت ارایه کننده بیشترین مقاله در این نشست).
در ابتدای این جلسه، دکتر علیرضا فریدونیان دبیر میزگرد طی توضیحاتی در مورد تاریخچه و وضعیت داده کاوی در شرکت های توزیع، سه سؤال برای بحث در میزگرد طرح کرد: زمینه های مستعد داده کاوی در شرکت های توزیع چیست؟ الزامات فنی برای ثبت داده های لازم چیست و یا چه داده هایی باید در شرکت های توزیع گردآوری شود و چه راهکارهایی برای بهبود دقت داده ها می توان اتخاذ نمود؟ چالش ها و مشکلاتی که بر سر راه ثبت، نگهداری، تحلیل و کاوش داده ها وجود دارد چیست؟ میزگرد به صورت طرح پرسش حاضرین در سالن ادامه یافت: پرسش حاضران: با توجه به اقداماتی که در شرکت های توزیع در حال انجام است و باعث ایجاد داده های انبوه می گردد، قبل از آن، فرهنگ استفاده از داده ها ایجاد نمی شود. در رابطه با کنتورهای فهام، از چند سال قبل، استارت این موضوع زده شد و این خوب نیست که بگوییم کنتور هوشمند جایگزین مأمور برق شده است و فقط کنترل از راه دور در حال انجام است.
شاید این چالش وجود دارد که دیدگاهی برای استفاده از این داده ها وجود ندارد. از سال پیش نیز بحث رؤیت پذیری اطلاعات و موضوع فیلد های فشار متوسط انرژی ورودی شرکت های توزیع مطرح است. امید که برای شرکت های توزیع، برق منطقه ای و به طور کلی مجموعه صنعت برق روشن بشود که اگر قرار بر نصب کنتورهای فهام و در دست داشتن دیتاهای با رزولوشن ۱۵ دقیقه است و یا در بحث رؤیت پذیری اطلاعات، چه استفاده ای قرار است از این داده ها داشته باشیم. فریدونیان: در طرح فهام همه ی این مواردی که در سؤال مطرح بود دیده شده است. زمانی هست که ما افق آینده را می بینیم ولی بستر را از حالا آماده می نماییم که می توان با برنامه ریزی به آنها رسید. مشاور اصلی فهام که شرکت موننکو است تمام این موارد را دسته بندی کرده است که می تواند در سمیناری، کاربردهای کنتورهای فهام را توضیح دهد. رییس زاده: از مواردی که در مقاله های ارایه شده خیلی به آن اشاره شد، کاربردهای داده کاوی است. کاری که ما از سال گذشته در شرکت شروع کردیم، تدوین نقشه راه برای کاربردهای داده کاوی است.

این پروژه تقریباً ۴ ماه است که شروع شده و با توجه به طرح ویژه ای که از طرف توانیر ابلاغ شد به ما، تدوین روش های داده کاوی در حوزه ی خدمات مشترکین، به دلیل پیشینه قبلی واگذار شد. تحقیقات گسترده ای انجام دادیم تا ببینیم که در معاونت ها و در بخش های دیگر شرکت، چه کاری با داده کاوی می توانیم انجام دهیم.
نتایجی هم حاصل شد که از اهم آنها می توان به بحث منابع انسانی در موضوع بیمه همکاران اشاره نمود که از طریق داده کاوی و خسارت هایی که هر ساله همکاران ما از شرکت های بیمه گر طرف قرارداد دریافت می کنند، آماری پنج ساله را استخراج کنیم و ببینیم هزینه هایی که همکاران ما پرداخت نمودند چه میزان بوده تا از این طریق برای قراردادهایی که در سال های آینده با شرکت های بیمه منعقد می نماییم و یا در موضوع آموزش، بر این اساس که با تعیین شاخص هایی، تناسبی میان دوره ها و همکارانی که برای دوره های آموزشی معرفی می شوند برقرار نماییم و به عنوان مثال بتوانیم برای دوره ای که ۴۰ نفر ظرفیت دارد ولی ۱۰۰ نفر متقاضی حضور در آن دوره هستند، نفرات دارای اولویت را مشخص نماییم. در بحث انبارداری هم می توانیم از داده کاوی استفاده نماییم.
در جایی که هزینه های زیادی برای خرید تجهیزات انبارداری داریم، می توانیم با داده کاوی، وضعیت انبار را بررسی نماییم و ببینیم به واسطه طرح هایی که داریم، چه زمانی، هزینه ای برای سرمایه گذاری داشته باشیم، چه زمانی جنس بخریم برای انبار و این که اجناس چه زمانی وارد انبار و یا از آن خارج بشوند. مورد دیگر موضوع بازبینی مرز جغرافیای نواحی مان است که می توانیم با استخراج یک سری شاخص مانند، تعداد مشترک، تعداد فیدرها، و طول فیدرها، بازبینی در مرز جفرافیایی مان انجام دهیم. فریدونیان (پرسش حاضران): حداقل مقدار داده ها برای پیاده سازی روش های داده کاوی چیست و آیا شاخص هایی وجود دارد که بتوانیم به نتایج داده کاوی اعتماد کنیم؟ علیزاده: در بحث داده کاوی همان طور که مطلع هستید، دو بحث توصیفی و پیش بینی داریم. برای حوزه ی توصیفی خیلی سخت گیری نمی کنیم که تعداد داده ها زیاد باشد. ما در تعریف داده کاوی می گوییم پایگاه داده های بسیار بزرگ، ولی در حوزه ی پیش بینی، سخت گیری خیلی جدی نداریم. هر چقدر تعداد داده ها کم باشد، در واقع داریم در فضایی به پیش بینی می پردازیم که این فضا قابل تعمیم نیست.
در اصل ما داریم روی داده های مان مدلی می سازیم که این مدل قرار است در محیط واقعی قابل استفاده باشد، این در حالی است که ما از داده ی کوچکی که در حال استفاده هستیم، مدلی می سازیم که خطای قابل قبولی هم دارد، اما سؤال این جاست که آیا می توانیم از این مدل برای پیش بینی کل جامعه استفاده نماییم؟ بنابراین هر چقدر داده ها بیشتر باشد، در مدلی که می سازیم، بخصوص در روش های پیش بینی، قابل قبول تر خواهد بود. ما نمی-توانیم در پاسخ به سؤال شما بگوییم چقدر داده لازم است. به عنوان مثال در حوزه های سلامت و در موضوع سرطان، داده هزار برای ما عدد مناسبی است اما در حوزه بانکداری و خدمات الکترونیک، داده میلیونی هم ممکن است راضی کننده نباشد.
موضوع برمی گردد به نوع مسأله ای که تعریف می نماییم که پیش بینی است یا توصیفی، کاربردی که از آن انتظار داریم و در نهایت ابزارهایی که در اختیار داریم تا داده ها را نگهداری کنیم و در بحث داده کاوی از آنها استفاده نماییم. بنابراین از نظر اینجانب به صورت کلی نمی توان جواب دقیقی داشته باشیم. احمدی: در پاسخ به سؤال طرح شده نمی توان جواب قطعی داد. شما برای داده کاوی، در قالب تعیین مدل، آموزش و پذیرش خطای مجاز، هزینه پرداخت می نمایید. زمانی به سمت داده کاوی می رویم که این هزینه کرد مقرون به صرفه باشد. ممکن است در شهرستانی مشغول به کار باشیم که Port مشترکان آن ۵۰ هزار تاست، در این صورت با داشتن داده ای ۵ هزارتایی، با توجه به واریانس داده ها، داده خوبی خواهید داشت. اصل تنوع داده، انتظاری که دارید، میزان هزینه ای که برای مدل سازی و ذخیره سازی داده ها پرداخت می نمایید، پارامترهای تعیین کننده برای حجم داده ها خواهند بود. مرادی: با توجه به توضیحات همکاران، از زبان دیگر، تعداد داده ها، بسته به تعداد ویژگی هایی دارد که مسأله را مشخص می نماید، در مواردی مسأله با چند ویژگی محدود ۱۰ یا ۱۵ تایی مشخص خواهد شد، اما اگر تعداد ویژگی ها زیاد شود، داده ی بیشتری را می طلبد. تعداد داده ها خیلی مواقع مهم نیست. رفتارها بسیار مهم است. باید با تجربه کافی بتوان موضوع را مشخص نمود. خدرزاده: با زبان همکاران توزیع و با توجه به اهمیت موضوع می توان به مسأله پرداخت. به عنوان مثال ما یک میلیون مشترک داریم که در بازه های ۱۵ دقیقه ای اطلاعاتشان را هم یادداشت کرده ایم، ولی در میان این یک میلیون مشترک ممکن است حدود یک یا دو درصد متهم به برق دزدی باشند. شما با داده های خوب شبکه را آموزش می دهید و جواب خوب هم می گیرید. ما در حال حاضر دنبال الگوهای نامتعارف رفتاری هستیم. بنابراین اگر افرادی که در این زمینه تخصص دارند به ما بگویند که باید غربالگری انجام دهیم و یا در بحث آموزش داده ها، سبد داده ها را چگونه انتخاب نماییم که ما را به سمت درست هدایت نماید. مرادی: ما یک بحث نمونه برداری از داده ها داریم، درواقع باید نمونه ها، نمونه ای از دنیای واقعی باشد. اگر نمونه ها در مورد برق دزدی است، باید از نواحی مختلف نمونه برداری صورت گیرد. هر چقدر قسمت پردازش داده را بهتر انجام دهیم، در قسمت های بعدی کار راحت تری خواهیم داشت. در بحث خوشه بندی و طبقه بندی، کار دقیق تر خواهد بود. خدرزاده: نکته ای که آقای دکتر مرادی اشاره کردند نکته ی مهمی است. شما مشکل را می شناسید، پس باید نمونه ها را براساس همان دودرصد برداریم نه یک میلیون مشترکی که داریم. اما اگر نمی دانیم با چه مدلی طرف هستیم ولی می خواهیم یک رفتار غیرمتعارف را ارزیابی کنیم، روشی که به طور عادی انجام می دهند این است که از گراف ها استفاده می نمایند. باید یاد گرفت چطور داده ها را نمایش دهیم که در آن موقع می توانیم از یک نمایش خوب متوجه شویم که کجا رفتار نامتعارفی دیده می شود. خیلی وقت ها استخراج از گراف های زیاد کار ساده ای نیست.
در این موارد از خوشه بندی ها استفاده می شود. باید ببینیم که خوشه ها معنادار هستند یا خیر. در نتیجه می دانیم دنبال چه هستیم، پس باید نمونه های مشکل یا الگو را داشته باشیم در غیر این صورت باید از روش های اکتشافی استفاده کنیم که در ابتدا روش های انسانی و طبیعی است و بخش دوم، روش های خوشه بندی است که می توانیم از آن استفاده نماییم. علیزاده: موضوع مهمی که در صحبت های همکاران مستتر بود این بود که داده های ما بالانس نیست و بر همین اساس دچار مشکل می شویم که از طریق راه کارهایی که اشاره شد می توان به حل مسأله رسید. نرم افزارها هم امکانی به ما می دهند که می توانیم داده ها را بالانس نماییم. نرم افزار، توزیع شدگی را طوری برای ما مشخص می نماید که داده ها را بالانس نماید. به عنوان مثال بگوید که ۲ درصد رفتار نامتعارفی دارند و ۹۸ درصد رفتارشان متعارف است. فریدونیان (پرسش حاضران): آیا داده کاوی، مجموعه ابزار آماده دارد و یا برای هر کاربرد، ابزار جداگانه باید خلق شود و سمت و سوی حرکت دنیا آیا به سمت تولید راهکارهای عمومی برای داده کاوی است یا خیر؟ احمدی: اینجانب سال گذشته هم در نشست حضور داشتم. اتفاق خوشحال کننده این است که شرکت های برق منطقه ای شهرستان ها، وارد حوزه داده کاوی شده اند و این زنجیره را می شناسند و با داشتن نیروی متخصص و فراگیری دانش به همراه فراهم آوردن اطلاعات مرتبط، به حوزه ی داده کاوی ورود کرده اند.
بهتر بود اگر هر کدام از برق منطقه ای شهرستان ها، تجربیات و اطلاعاتشان را در اختیار یکدیگر قرار می دادند تا کار تکراری انجام نشود و در نهایت اطلاعات، منتهی به نرم افزار کاربردی شود که از طریق وزارت نیرو در اختیار بخش های مختلف قرار بگیرد.
در این زنجیره، هر چقدر بالاتر می رود کار پیچیده تر می شود و قسمتی مربوط می شود به وزارت نیرو و کار گسترده تر خواهد شد مانند تعیین الگوی مصرف و پایین آوردن هزینه ها. اگر از این منظر دسته بندی نماییم، جواب این می شود که داده کاوی در حال حاضر در حوزه های مختلف به سمتی می رود که اگر حجم داده ها در یک سروری قرار گیرد، به دلیل داشتن داده های زیاد و پردازنده های قوی که می توانند اطلاعات پیچیده تری را نزدیک به خواسته های مغز انسان پردازش کنند، در اختیار دارید و با هزینه های قابل قبول، این جاست که می توان کارهای هوشمندانه تری انجام داد و گرایش داده کاوی به سمت داده کاوی هوشمندانه خواهد رفت.
در حال حاضر موضوع دیگری مطرح است تحت عنوان نظرکاوی که خود ما هم پروژه ای در این زمینه داریم، که از این طریق می توان از طریق نظرات کاربران متوجه شد که در ذهن آنها چه می گذرد یا تحلیل احساسات در شرایطی که ابزارها قوی تر شده است موجب شده تا ما به سمت داده کاوی معنایی حرکت نماییم. فریدونیان (پرسش حاضران): روش تعیین ویژگی ها برای یک مسأله ی خاص چگونه است؟ آیا روش یا راهنمایی در این زمینه وجود دارد؟ علیزاده: ما در بحث انتخاب روش ها، روش های خاص ریاضی داریم، قبل از این که وارد این روش های ریاضی شویم، در هنگامی که پروژه های کاربردی در صنعت داریم، با افرادی که در آن صنعت مشغول کار هستند صحبت می کنیم و براساس نظرات آنها، استخراج می نماییم که چه ویژگی هایی برای آن حوزه مهم است و آنها را لیست می نماییم.
بعد از مشخص شدن ویژگی ها، داده هایی که مربوط به آن ویژگی هاست را در اختیار داریم. روش هایی وجود دارد که بر اساس داده هایی که در آن فیلدها وجود دارد، وزن داده ها را هم به ما می دهد و درصد اهمیت آن ویژگی نیز مشخص می شود. ما از روش هایی مانند PCA یا روش هایی که در کاهش بعد است استفاده می کنیم تا بتوانیم از تعداد ویژگی هایی که کمتر هستند ولی همان اطلاعات را به ما می دهند، استفاده کنیم. بنابراین همه ی آنچه که به ما می تواند کمک کند اعم از فرد خبره تا پیچیده ترین روش های ریاضی که به ما کمک می کند چه ویژگی هایی برای کاری که ما انجام می دهیم مناسب است، برای ما قابل قبول خواهد بود. مرادی: اینجانب عضو کمیته ی رباتیک توانیر هستم. یکی از مسایلی که در دکل ها داریم تشخیص آسیب ها مانند لب پریدگی مقره ها و شل بودن پیچ ها است. از طریق پهپاد از زنجیره ی مقره ها عکس گرفته می شود و تکنسین ها از عکس ها به اشکالات پی می برند. در حال حاضر از طریق Deep Learning ، آموزش ها را عمیق تر کردند به طوری که عکسی که پهپاد می گیرد به برنامه می دهند و برنامه اعلام می کند که کدام پیچ یا مقره اشکال دارد، در حالی که شاید با چشم غیرمصلح امکان تشخیص و رؤیت آن وجود نداشته باشد. تلاش داریم تا این روش را در توزیع هم پیاده نماییم. فریدونیان (پرسش حاضران): آیا هر اندازه از الگوهای پیچیده تری در داده کاوی استفاده کنیم، الزامأ دقت جواب ها نیز بیشتر است؟ فرق تحلیل آماری با داده کاوی چیست؟ خدرزاده: در بازار بسته های مختلفی چه در سطح تحقیقاتی و چه در سطح صنعتی موجود است. یکی از ایرادات آن جاست که معمولأ دانشجویان، تمام روش ها را تحلیل می کنند و روشی را که دقت بیشتری دارد بر می دارند، اما در بسیاری از موارد دلیلش را نمی دانند. اگر دلیل، کمی جابجا شود، شاید روشی که دارای دقت بیشتری بود، خطایش بیشتر از دیگر روش ها باشد. نکته ی حایز اهمیت آن که هنوز تکنولوژی به آن سطح نرسیده است که بگوییم یک هوش مصنوعی جنرال داریم، برای همین، معمولاً هر روشی برای نوعی داده کاوی جواب مناسب می دهد در نتیجه برای انجام کار باید در کنار تیمی قرار گرفت که از نظر پردازش داده قوی باشند و تخصص شما در کنار آنها قرار بگیرد.
علیزاده: خیلی وقت ها تصور می کنیم که در بحث داده کاوی باید سراغ الگوهای پیچیده برویم اما در بسیاری موارد در سازمان ها با یک الگوریتم ساده به جواب می رسیم. در تعریف داده کاوی می گوییم: داده کاوی علم جدیدی نیست، تلفیقی است از علوم مختلف. وقتی از داده کاوی حرف می زنیم می گوییم ماشین لرنینگ است، آمار است، بخش های بهینه سازی و … است. بنابراین آمار و داده کاوی از هم جدا نیست. احمدی: فرآیند داده کاوی یک زنجیره است که در کنار هم چیده می شود. در قسمت اول که شناسایی تابع هدف هست و بعد شناسایی داده ها، جمع آوری، پردازش و در نهایت تعیین مدل خواهد بود. در هر قسمت پیشرفت های زیادی صورت گرفته است و هر مرحله باید به درستی انجام شود.