تاریخ بهروزرسانی: 1404/10/29
هاشم پروین
مهندسی / مهندسی نرم افزار کامپیوتر
پایاننامههای کارشناسیارشد
-
یک چارچوب سیستم مدیریت انرژی برای زمانبندی لوازم خانه های هوشمند با استفاده از الگوریتم های یادگیری تقویتی عمیق
1404با توجه به روند فزاینده مصرف انرژی الکتریکی در بخش خانگی و تاثیر مستقیم آن بر هزینههای خانوار و پایداری شبکه برق، توسعه چارچوبهای نوین مدیریت انرژی در خانههای هوشمند به ضرورتی اجتنابناپذیر تبدیل شده است. همچنین گسترش روزافزون فناوریهای خانه هوشمند و قیمتگذاری پویای برق، مستلزم توجه به بهینهسازی مصرف انرژی خانگی از طریق زمانبندی هوشمند لوازم میباشد. سیستم های مدیریت انرژی خانگی (HEMS)سنتی اغلب برای رسیدگی به پیچیدگی های قیمت گذاری پویا برق و تغییر نیازهای کاربران مجهز نیستند. این پیچیدگی نیازمند راه حل های پیشرفتهای است که می توانند به طور هوشمندانه استفاده از دستگاه را برای بهینه سازی برای اهداف متعدد و اغلب متناقض برنامه ریزی کنند. الگوریتمهای پیشرفته یادگیری تقویتی مانند شبکه Q عمیق با امکان یادگیری سیاستهای بهینه از طریق تعامل با محیط، راهحلهای امیدوار کنندهای ارائه می دهند. این سیستم ها می توانند به صورت پویا برنامه های دستگاه را بر اساس داده های زمان واقعی، مانند قیمت انرژی و الگوهای رفتار کاربر، بدون نیاز به برنامه نویسی صریح برای هر سناریو تنظیم کنند. در این پژوهش، یک مدل شبکه Q عمیق برای سیستم مدیریت انرژی خانگی ارائه گردیده است که هدف آن بهینهسازی زمانبندی لوازم خانگی با بهرهگیری از الگوریتمهای یادگیری تقویتی عمیق و مقایسه کارایی آنها با روشهای پایه است. بدین منظور، مجموعهای از دادههای تعرفه برق در بازه ده هفتهای، همراه با یک دیتاست از ترجیحات کاربر به عنوان ورودی به محیط شبیهسازی شده داده میشود. چهار الگوریتم متفاوت برای زمانبندی لوازم طراحی و پیادهسازی شد: انتخاب تصادفی اسلات از میان اولویتهای کاربر، انتخاب ثابت نخستین اولویت، الگوریتم حریصانه مبتنی بر انتخاب کمهزینهترین اسلات، و یک روش مبتنی بر یادگیری تقویتی عمیق به نام الگوریتم شبکه Q عمیق بهینهسازیشده بر اساس راحتی–هزینه(CCO-DQN) که با بهرهگیری از شبکههای عصبی و سیاستهای پاداش، امکان یادگیری پویا و تطبیقی را فراهم میسازد. مشارکتهای اصلی این پایاننامه در ارتباط با طراحی مدل شبکه عصبی الگوریتم پیشنهادی عبارت است از طراحی معماری اختصاصی یک شبکه عصبی Q عمیق که قادر است بهطور همزمان تاثیر تعرفههای متغیر انرژی و اولویتهای کاربر را مدلسازی کند. در این معماری، بردارهای ورودی چندبعدی شامل تعرفههای پویا، امتیاز اولویت زمانی و محدودیتهای عملکردی دستگاهها لحاظ شده است. دومین مورد، طراحی پاداش دوهدفه (هزینه–آسایش) است . این تابع با وزندهی تطبیقی، توازن پایداری بین اهداف متضاد برقرار میکند. سومین مورد، میتوان به بهینهسازی نمایش حالت–عمل اشاره کرد طوری که فضای حالت به گونهای مدلسازی شده که شامل قیمتهای لحظهای انرژی و بردار ترجیحات کاربر باشد و فضای عمل نیز منعکسکنندهی انعطافپذیری زمانبندی دستگاهها است. این طراحی منجر به کاوش کارآمدتر و همگرایی سریعتر مدل شدهاست. این مشارکتها با ترکیب بهینهسازی چندهدفه، سفارشیسازی معماری شبکه و تکنیکهای افزایش پایداری یادگیری، الگوریتم CCO-DQN را به عنوان جایگزینی کارآمدتر نسبت به روشهای پایهای تصادفی و حریصانه در مدیریت انرژی خانگی مطرح میکند.
-
سنتز متن به تصویر با استفاده از شبکه های مولد تخاصمی بر اساس مکانیسم توجه
1403سنتز متن به تصویر که یک عملکرد اساسی در هوش مصنوعی مولد بحساب می آید به دنبال تولید تصاویر واقعی است که با توصیف های زبان طبیعی مطابقت داشته باشد. این مطالعه یک شبکه مولد متخاصم توجه دوگانه را پیشنهاد می دهد که از یک معماری نوآورانه ی چند مرحله ای برای تقویت مسائل مربوط به واقع گرایی بصری، هماهنگی معنایی و تولید جزئیات ریز دانه استفاده می کند. مدل GAN2DA از دو فاز مجزا بهره می گیرد که یک فاز خود هدایت شونده برای تولید پیش نویس های با وضوح پایین و یک فاز همترازسازی برای افزایش این پیش نویس ها به خروجی هایی با وضوح بالا بهره می گیرد. تکنیک توجه دوگانه به GAN2DA اجازه می دهد تا بر روی ویژگی های متنی و بصری تمرکز داشته و تصویر دقیق عناصر توصیفی را تضمین کرده و تصاویر منسجم و با کیفیت بالا را تولید کند. ما GAN2DA را با استفاده از مجموعه داده های CUB و -102Oxford ارزیابی کرده و نتایج رقابتی را در معیارهای شناخته شده مانند IS، FID و RP ارزیابی می کنیم. مدل پیشنهادی از مدل های ارائه شده قبلی از لحاظ مقایسه های کیفی و کمی پیشی می گیرد. مقایسه های کیفی بیشتر بر ظرفیت این مدل برای تولید تصاویر واضح تر و واقع بینانه تر با هماهنگی بیشتر با توصیف های متنی تاکید می کند. نوآوری هایی که در GAN2DA نشان داده شده است، توانایی آن را به عنوان یک چارچوب پیشرفته برای سنتز متن به تصویر نشان می دهد که در توسعه محتوای خلاق، طراحی خودکار مناسب و افزایش وضوح تصاویر قابل استفاده است.
-
Multi-objective Manifold Representation for Opinion Mining
1403Sentiment analysis is an essential task in numerous domains, necessitating effective dimensionality reduction and feature extraction techniques. This study introduces MultiObjective Manifold Representation for Opinion Mining (MOMR). This novel approach combines deep global and local manifold feature extraction to reduce dimensions while capturing intricate data patterns efficiently. Additionally, incorporating a self-attention mechanism further enhances MOMR's capability to focus on relevant parts of the text, resulting in improved performance in sentiment analysis tasks. MOMR was evaluated against established techniques such as Long Short-Term Memory (LSTM), Naive Bayes (NB), Support Vector Machines (SVM), Recurrent Neural Networks (RNN), and Convolutional Neural Networks (CNN), as well as recent state-of-the-art models across multiple datasets including IMDB, Fake News, Twitter, and Yelp. Therefore, our comparative analysis underscores MOMR's efficacy in sentiment analysis tasks across diverse datasets, highlighting its potential and applicability in real-world sentiment analysis applications. On the IMDB dataset, MOMR achieved an accuracy of 99.7% and an F1 score of 99.6%, outperforming other methods such as LSTM, NB, SMSR, and various SVM and CNN models. For the Twitter dataset, MOMR attained an accuracy of 88.0% and an F1 score of 88.0%, surpassing other models, including LSTM, CNN, BiLSTM, Bi-GRU, NB, and RNN. In the Fake News dataset, MOMR demonstrated superior performance with an accuracy of 97.0% and an F1 score of 97.6%, compared to techniques like RF, RNN, BiLSTM+CNN, and NB. For the Yelp dataset, MOMR achieved an accuracy of 80.0% and an F1 score of 80.0%, proving its effectiveness alongside other models such as Bidirectional Encoder Representations from Transformers (BERT), aspect-sentence graph convolutional neural network (ASGCN), Multi-layer Neural Network, LSTM, and bidirectional recurrent convolutional neural network attention (BRCAN).
-
روش یادگیری عمیق چندوجهی مبتنیبر توجه برای شرح تصویر
1403مغز ما قادر است تصاویری که در برابرمان ظاهر میشوند را توصیف و یا دستهبندی کند. اما چگونه یک کامپیوتر میتواند تصویر را پردازش کرده و آن را با یک شرح مناسب و دقیق شناسایی کند؟ این امر چند سال پیش غیرقابل دستیابی به نظر میرسید، اما با پیشرفت الگوریتمهای بینایی ماشین و یادگیری عمیق، همچنین در دسترس بودن مجموعه دادهها و مدلهای هوش مصنوعی مناسب، ساخت یک تولیدکننده شرح مناسب برای یک تصویر آسانتر شده است. تولید شرح تصویر همچنین یک صنعت رو به رشد در سراسر جهان است. فرایند تولید شرح تصویر برای تبدیل تصاویر به یک سری کلمات با استفاده از یک سری پیکسلها استفاده میشود. میتوان تصور کرد که تولید شرح تصاویر چالشی از ابتدا تا انتها در قالب یک چالش توالی به توالی است. برای دستیابی به این هدف، لازم است هم کلمات و هم تصاویر را پردازش کرد. در این پایان نامه، ابتدا، توضیحی از شرح تصویر و کاربردهای آن در حوزههای مختلف ارائه شده است و سپس، به بررسی سیر تکاملی روشهای شرح تصویر پرداخته شده است. روشهای مختلفی که در گذر زمان برای شرح تصویر پیشنهاد شدهاند، بهطور جامع مورد بررسی قرار گرفتهاند. این دستهبندی منسجم به ما کمک میکند تا به فهم عمیقتری از تکنیکها و روشهای موجود در شرح تصویر برسیم. همچنین، در این پایان نامه مقالات اخیر در حوزه شرح تصویر مورد بررسی قرار گرفتهاند. با توجه به نتایج بدست آمده از بررسی مقالات اخیر، ضرورت ادامه پژوهشها در حوزه شرح تصویر مورد تاکید قرار گرفته است. این پژوهشها میتوانند بهبودهای مهمی در روشهای موجود برای شرح تصویر و نیز کشف روشهای نوین و پیشرفتهتر منجر شوند. در این پایان نامه از روش رمزگذار-رمزگشا مبتنیبر توجه استفاده شده است که برخلاف روشهای پیشین که توجه فقط برروی یکی از بخشها اعمال میشد، مکانیسم توجه هم برروی تصویر و هم برروی متن اعمال شده است که این یک ایده جدید در این حوزه میباشد و همچنین شیوه تولید شرح نهایی لغت به لغت است. از مجموعه داده FLICKR8K استفاده شده است و همچنین از معیار های ارزیابیBLEU (1,2,3,4) ، ROUGE، METEOR استفاده شده است.که این نتایج به ترتیب، 51_49_48_44_52_37.5 است. این نتایج به دست آمده حاکی از بهبود روشهای قبلی است.
-
طبقهبندی و تشخیص سرطان سینه براساس تصاویر سه بعدی سونوگرافی
1402یکی از شایعترین سرطانها در بین زنان سرطان سینه میباشد که در صورت عدم تشخیص و پیشبینی به هنگام آن موجب به خطر افتادن جان بیمار میشود. انواع روشهای تصویربرداری پزشکی و همچنین نمونهبرداری به پزشکان در تشخیص این بیماری کمک میکنند. از آنجایی که نمونهبرداری روشی تهاجمی به شمار میآید، استفاده از روشهای تصویربرداری گزینه بهتری میباشد. پزشک متخصص با بررسی تصاویر سینه میتواند وجود تومور را تشخیص دهد. از علوم کامپیوتر نیز میتوان در پردازش تصاویر پزشکی و تشخیص بیماریها نیز استفاده نمود. یادگیری عمیق زیر مجموعهای از هوش مصنوعی است که در پردازش انواع تصاویر و بالاخص تصاویر پزشکی نتایج امیدوار کنندهای را به دست آورده است. در این پژوهش از چهار شبکه عصبی یادگیری عمیق کانولوشن، خودرمزگذار کانولوشنی، رس نت 50 در دو حالت پیش آموزش دیده و آموزش از ابتدا و شبکه اینسپن وی 3 نیز در دو حالت پیش آموزشدیده و آموزش از ابتدا، برای طبقهبندی تصاویر سونوگرافی ضبط شده از سینه در دو سناریو استفاده شده است. در سناریوی اول طبقهبندی در دو کلاس سرطان خوشخیم وسرطان بدخیم انجام شده و در سناریوی دوم طبقهبندی در سه کلاس سرطان خوشخیم، سرطان بدخیم و افراد سالم انجام شده است. مجموعه داده مورد استفاده در این پژوهش شامل 780 تصویر در سه کلاس سالم یا نرمال (133 تصویر)، سرطان بدخیم (210 تصویر) و سرطان خوشخیم (487 تصویر) بود. تعداد این تصاویر با استفاده از روشهای افزایش داده مانند چرخش 5 درجه، انعکاس در جهت افقی و عمودی به 6413 تصویر شامل 2185 تصویر سرطان خوشخیم، 2100 تصویر سرطان بدخیم و 2128 تصویر افراد سالم رسید. در مرحله بعد برای داشتن تصاویر هم اندازه، ابعاد تصاویر به 150*125 پیکسل تغییر پیدا کرده و برای آموزش شبکهها مورد استفاده قرار گرفتند. در طبقهبندی دو کلاسه بالاترین صحت توسط شبکه اینسپشن وی 3آموزش دیده با مقدار 97% به دست آمد. بالاترین دقت در کلاس سرطان خوشخیم با مقدار 100% توسط شبکههای خودرمزگذار کانولوشنی و رس نت 50 آموزش از ابتدا حاصل شد. این معیار در کلاس سرطان بدخیم با مقدار 98% توسط شبکه اینسپشن وی 3آموزش دیده به دست آمد. حساسیت 98% در کلاس خوشخیم توسط شبکه اینسپشن آموزش از ابتدا و 99% در کلاس بدخیم توسط شبکههای خودرمزگذار کانولوشنی و رس نت آموزش از ابتدا حاصل شد. معیار F در هر دو کلاس توسط شبکه اینسپشن وی 3 آموزش دیده با مقدار 99% و 98% به دست آمده است.در طبقهبندی سه کلاسه شبکه اینسپشن وی 3 آموزش دیده به بالاترین صحت با مقدار 96% رسید. بالاترین دقت، حساسیت و معیار F به ترتیب با مقدار 100%، 96%و 98% توسط شبکه اینسپشن وی 3آموزش دیده، در گروه خوشخیم حاصل شد. در گروه بدخیم برای این معیارها 98%، 100% و 98% توسط شبکههای کانولوشن و اینسپشن وی 3آموزش دیده به دست آمده است. در گروه افراد سالم، مقادیر 98%، 99% و 98% توسط شبکههای کانولوشن، خودرمزگذار کانولوشنی و اینسپشن وی 3 آموزش دیده به دست آمده است.
-
سیتم های توصیه گر مبتنی بر اعتماد با استفاده از راهکارهای تجزیه ماتریسی و الگوریتم های فرا ابتکاری
1397سیستم های توصیه گر یکی از موفق ترین ابزارها برای مقابله با سرریز داده ها شناخته می شوند که روزبه روز استفاده از آن ها گسترده تر می شود. این سیستم ها یک نوع ویژه از سیستم های پالایش اطلاعات هستند که آیتم ها را بر اساس جذابیت آن ها برای کاربر از یک مجموعه بزرگ از آیتم ها پالایش می کنند. این سیستم ها سعی دارند، بر اساس عملکرد، سلیقه های شخصی، رفتارهای کاربر و بسته به زمینه ای که در آن مورد استفاده قرار می گیرند به هر کاربر پیشنهادهایی را ارائه دهند که با تمایلات شخصی وی تطابق داشته و کاربر را در فرایند تصمیم گیری یاری نمایند. سیستم های توصیه گر پالایش گروهی یکی از پرکاربردترین و موثرترین روش های توصیه محسوب می شوند که با بررسی انتخاب های کاربران در گذشته، الگوهایی را در داده ها پیدا می کنند که با توجه به آن الگوهای رفتاری برای هر کاربر توصیه مناسب را ارائه می دهند. روش های مبتنی بر پالایش گروهی معمولاً از سه مشکل اصلی رنج می برند که شامل: شروع سرد، پراکندگی داده ها و مقیاس پذیری کم می باشند. در راستای برطرف نمودن چالش های گفته شده، این پایان نامه، دو روش جدید مبتنی بر تجزیه نامنفی ماتریس و اطلاعات اعتماد کاربران در شبکه های اجتماعی، ارائه می شود. چون روش تجزیه نامنفی ماتریس یکی از کاراترین روش های مبتنی بر مدل برای سیستم های توصیه پالایش گروهی است، لذا از اطلاعات اعتماد و عدم اعتماد بین کاربران برای کمک به تجزیه درست و دقیق ماتریس رتبه بندی، استفاده می کنیم تا رتبه های نامشخص برای کاربران و آیتم هایی که شروع سرد دارند با دقت مناسبی پیش بینی شود و در برخورد با داده های پراکنده، بتوان با دقت مناسبی سلیقه کاربر هدف را تخمین زد. همچنین برای افزایش مقیاس پذیری و کاهش پیچیدگی الگوریتم ها از روش های بهینه سازی کارآمد برای حل تابع هدف نهایی استفاده می شود. بعلاوه، سیستم های توصیه گر به دلیل پویا بودن محیط و افزایش سریع اطلاعات، روزبه روز فضای مسئله آن ها بزرگ تر می شود، لذا الگوریتم های دقیق (ریاضی) در حالات مختلفی نمی توانند جواب بهینه را تولید کنند و دنبال کردن جواب دقیق در اکثر مواقع خیلی سخت و پرهزینه است. بعلاوه، در اکثر موارد جواب تقریبی و نزدیک به جواب واقعی، می تواند برای ما رضایت بخش باشد. بنابرین، دو روش پیشنهادی جدید مبتنی بر الگوریتم های فراابتکاری ارائه می شود که