هاشم پروین
تاریخ به‌روزرسانی: 1404/10/29

هاشم پروین

مهندسی / مهندسی نرم افزار کامپیوتر

پایان‌نامه‌های کارشناسی‌ارشد

  1. یک چارچوب سیستم مدیریت انرژی برای زمانبندی لوازم خانه های هوشمند با استفاده از الگوریتم های یادگیری تقویتی عمیق
    1404
    با توجه به روند فزاینده مصرف انرژی الکتریکی در بخش خانگی و تاثیر مستقیم آن بر هزینه‌های خانوار و پایداری شبکه برق، توسعه چارچوب‌های نوین مدیریت انرژی در خانه‌های هوشمند به ضرورتی اجتناب‌ناپذیر تبدیل شده است. همچنین گسترش روزافزون فناوری‌های خانه هوشمند و قیمت‌گذاری پویای برق، مستلزم توجه به بهینه‌سازی مصرف انرژی خانگی از طریق زمانبندی هوشمند لوازم می‌باشد. سیستم های مدیریت انرژی خانگی (HEMS)سنتی اغلب برای رسیدگی به پیچیدگی های قیمت گذاری پویا برق و تغییر نیازهای کاربران مجهز نیستند. این پیچیدگی نیازمند راه حل های پیشرفته‌ای است که می توانند به طور هوشمندانه استفاده از دستگاه را برای بهینه سازی برای اهداف متعدد و اغلب متناقض برنامه ریزی کنند. الگوریتم‌های پیشرفته یادگیری تقویتی مانند شبکه Q عمیق با امکان یادگیری سیاست‌های بهینه از طریق تعامل با محیط، راه‌حل‌های امیدوار کننده‌ای ارائه می دهند. این سیستم ها می توانند به صورت پویا برنامه های دستگاه را بر اساس داده های زمان واقعی، مانند قیمت انرژی و الگوهای رفتار کاربر، بدون نیاز به برنامه نویسی صریح برای هر سناریو تنظیم کنند. در این پژوهش، یک مدل شبکه Q عمیق برای سیستم مدیریت انرژی خانگی ارائه گردیده است که هدف آن بهینه‌سازی زمان‌بندی لوازم خانگی با بهره‌گیری از الگوریتم‌های یادگیری تقویتی عمیق و مقایسه کارایی آن‌ها با روش‌های پایه است. بدین منظور، مجموعه‌ای از داده‌های تعرفه برق در بازه ده هفته‌ای، همراه با یک دیتاست از ترجیحات کاربر به عنوان ورودی به محیط شبیه‌سازی شده داده می‌شود. چهار الگوریتم متفاوت برای زمان‌بندی لوازم طراحی و پیاده‌سازی شد: انتخاب تصادفی اسلات از میان اولویت‌های کاربر، انتخاب ثابت نخستین اولویت، الگوریتم حریصانه مبتنی بر انتخاب کم‌هزینه‌ترین اسلات، و یک روش مبتنی بر یادگیری تقویتی عمیق به نام الگوریتم شبکه Q عمیق بهینه‌سازی‌شده بر اساس راحتی–هزینه(CCO-DQN) که با بهره‌گیری از شبکه‌های عصبی و سیاست‌های پاداش، امکان یادگیری پویا و تطبیقی را فراهم می‌سازد. مشارکت‌های اصلی این پایان‌نامه در ارتباط با طراحی مدل شبکه عصبی الگوریتم پیشنهادی عبارت است از طراحی معماری اختصاصی یک شبکه عصبی Q عمیق که قادر است به‌طور همزمان تاثیر تعرفه‌های متغیر انرژی و اولویت‌های کاربر را مدل‌سازی کند. در این معماری، بردارهای ورودی چندبعدی شامل تعرفه‌های پویا، امتیاز اولویت زمانی و محدودیت‌های عملکردی دستگاه‌ها لحاظ شده است. دومین مورد، طراحی پاداش دوهدفه (هزینه–آسایش) است . این تابع با وزن‌دهی تطبیقی، توازن پایداری بین اهداف متضاد برقرار می‌کند. سومین مورد، می‌توان به بهینه‌سازی نمایش حالت–عمل اشاره کرد طوری که فضای حالت به گونه‌ای مدل‌سازی شده که شامل قیمت‌های لحظه‌ای انرژی و بردار ترجیحات کاربر باشد و فضای عمل نیز منعکس‌کننده‌ی انعطاف‌پذیری زمان‌بندی دستگاه‌ها است. این طراحی منجر به کاوش کارآمدتر و همگرایی سریع‌تر مدل شده‌است. این مشارکت‌ها با ترکیب بهینه‌سازی چندهدفه، سفارشی‌سازی معماری شبکه و تکنیک‌های افزایش پایداری یادگیری، الگوریتم CCO-DQN را به عنوان جایگزینی کارآمدتر نسبت به روش‌های پایه‌ای تصادفی و حریصانه در مدیریت انرژی خانگی مطرح می‌کند.
  2. سنتز متن به تصویر با استفاده از شبکه های مولد تخاصمی بر اساس مکانیسم توجه
    1403
    سنتز متن به تصویر که یک عملکرد اساسی در هوش مصنوعی مولد بحساب می آید به دنبال تولید تصاویر واقعی است که با توصیف های زبان طبیعی مطابقت داشته باشد. این مطالعه یک شبکه مولد متخاصم توجه دوگانه را پیشنهاد می دهد که از یک معماری نوآورانه ی چند مرحله ای برای تقویت مسائل مربوط به واقع گرایی بصری، هماهنگی معنایی و تولید جزئیات ریز دانه استفاده می کند. مدل GAN2DA از دو فاز مجزا بهره می گیرد که یک فاز خود هدایت شونده برای تولید پیش نویس های با وضوح پایین و یک فاز همترازسازی برای افزایش این پیش نویس ها به خروجی هایی با وضوح بالا بهره می گیرد. تکنیک توجه دوگانه به GAN2DA اجازه می دهد تا بر روی ویژگی های متنی و بصری تمرکز داشته و تصویر دقیق عناصر توصیفی را تضمین کرده و تصاویر منسجم و با کیفیت بالا را تولید کند. ما GAN2DA را با استفاده از مجموعه داده های CUB و -102Oxford ارزیابی کرده و نتایج رقابتی را در معیارهای شناخته شده مانند IS، FID و RP ارزیابی می کنیم. مدل پیشنهادی از مدل های ارائه شده قبلی از لحاظ مقایسه های کیفی و کمی پیشی می گیرد. مقایسه های کیفی بیشتر بر ظرفیت این مدل برای تولید تصاویر واضح تر و واقع بینانه تر با هماهنگی بیشتر با توصیف های متنی تاکید می کند. نوآوری هایی که در GAN2DA نشان داده شده است، توانایی آن را به عنوان یک چارچوب پیشرفته برای سنتز متن به تصویر نشان می دهد که در توسعه محتوای خلاق، طراحی خودکار مناسب و افزایش وضوح تصاویر قابل استفاده است.
  3. Multi-objective Manifold Representation for Opinion Mining
    1403
    Sentiment analysis is an essential task in numerous domains, necessitating effective dimensionality reduction and feature extraction techniques. This study introduces MultiObjective Manifold Representation for Opinion Mining (MOMR). This novel approach combines deep global and local manifold feature extraction to reduce dimensions while capturing intricate data patterns efficiently. Additionally, incorporating a self-attention mechanism further enhances MOMR's capability to focus on relevant parts of the text, resulting in improved performance in sentiment analysis tasks. MOMR was evaluated against established techniques such as Long Short-Term Memory (LSTM), Naive Bayes (NB), Support Vector Machines (SVM), Recurrent Neural Networks (RNN), and Convolutional Neural Networks (CNN), as well as recent state-of-the-art models across multiple datasets including IMDB, Fake News, Twitter, and Yelp. Therefore, our comparative analysis underscores MOMR's efficacy in sentiment analysis tasks across diverse datasets, highlighting its potential and applicability in real-world sentiment analysis applications. On the IMDB dataset, MOMR achieved an accuracy of 99.7% and an F1 score of 99.6%, outperforming other methods such as LSTM, NB, SMSR, and various SVM and CNN models. For the Twitter dataset, MOMR attained an accuracy of 88.0% and an F1 score of 88.0%, surpassing other models, including LSTM, CNN, BiLSTM, Bi-GRU, NB, and RNN. In the Fake News dataset, MOMR demonstrated superior performance with an accuracy of 97.0% and an F1 score of 97.6%, compared to techniques like RF, RNN, BiLSTM+CNN, and NB. For the Yelp dataset, MOMR achieved an accuracy of 80.0% and an F1 score of 80.0%, proving its effectiveness alongside other models such as Bidirectional Encoder Representations from Transformers (BERT), aspect-sentence graph convolutional neural network (ASGCN), Multi-layer Neural Network, LSTM, and bidirectional recurrent convolutional neural network attention (BRCAN).
  4. روش یادگیری عمیق چندوجهی مبتنی‌بر توجه برای شرح تصویر
    1403
    مغز ما قادر است تصاویری که در برابرمان ظاهر می‌شوند را توصیف و یا دسته‌بندی کند. اما چگونه یک کامپیوتر می‌تواند تصویر را پردازش کرده و آن را با یک شرح مناسب و دقیق شناسایی کند؟ این امر چند سال پیش غیرقابل دستیابی به نظر می‌رسید، اما با پیشرفت الگوریتم‌های بینایی ماشین و یادگیری عمیق، همچنین در دسترس بودن مجموعه داده‌ها و مدل‌های هوش مصنوعی مناسب، ساخت یک تولیدکننده شرح مناسب برای یک تصویر آسان‌تر شده است. تولید شرح تصویر همچنین یک صنعت رو به رشد در سراسر جهان است. فرایند تولید شرح تصویر برای تبدیل تصاویر به یک سری کلمات با استفاده از یک سری پیکسل‌ها استفاده می‌شود. می‌توان تصور کرد که تولید شرح تصاویر چالشی از ابتدا تا انتها در قالب یک چالش توالی به توالی است. برای دستیابی به این هدف، لازم است هم کلمات و هم تصاویر را پردازش کرد. در این پایان نامه، ابتدا، توضیحی از شرح تصویر و کاربردهای آن در حوزه‌های مختلف ارائه شده است و سپس، به بررسی سیر تکاملی روش‌های شرح تصویر پرداخته شده است. روش‌های مختلفی که در گذر زمان برای شرح تصویر پیشنهاد شده‌اند، به‌طور جامع مورد بررسی قرار گرفته‌اند. این دسته‌بندی منسجم به ما کمک می‌کند تا به فهم عمیق‌تری از تکنیک‌ها و روش‌های موجود در شرح تصویر برسیم. همچنین، در این پایان نامه مقالات اخیر در حوزه شرح تصویر مورد بررسی قرار گرفته‌اند. با توجه به نتایج بدست آمده از بررسی مقالات اخیر، ضرورت ادامه پژوهش‌ها در حوزه شرح تصویر مورد تاکید قرار گرفته است. این پژوهش‌ها می‌توانند بهبودهای مهمی در روش‌های موجود برای شرح تصویر و نیز کشف روش‌های نوین و پیشرفته‌تر منجر شوند. در این پایان نامه از روش رمزگذار-رمزگشا مبتنی‌بر توجه استفاده شده است که برخلاف روش‌های پیشین که توجه فقط برروی یکی از بخش‌ها اعمال می‌شد، مکانیسم توجه هم برروی تصویر و هم برروی متن اعمال شده است که این یک ایده جدید در این حوزه می‌باشد و همچنین شیوه تولید شرح نهایی لغت به لغت است. از مجموعه داده FLICKR8K استفاده شده است و همچنین از معیار های ارزیابیBLEU (1,2,3,4) ، ROUGE، METEOR استفاده شده است.که این نتایج به ترتیب، 51_49_48_44_52_37.5 است. این نتایج به دست آمده حاکی از بهبود روش‌های قبلی است.
  5. طبقه‌بندی و تشخیص سرطان سینه براساس تصاویر سه بعدی سونوگرافی
    1402
    یکی از شایع‌ترین سرطان‌ها در بین زنان سرطان سینه می‌باشد که در صورت عدم تشخیص و پیش‌بینی به هنگام آن موجب به خطر افتادن جان بیمار می‌شود. انواع روش‌های تصویربرداری پزشکی و همچنین نمونه‌برداری به پزشکان در تشخیص این بیماری کمک می‌کنند. از آن‌جایی که نمونه‌برداری روشی تهاجمی به شمار می‌آید، استفاده از روش‌های تصویربرداری گزینه بهتری می‌باشد. پزشک متخصص با بررسی تصاویر سینه می‌تواند وجود تومور را تشخیص دهد. از علوم کامپیوتر نیز می‌توان در پردازش تصاویر پزشکی و تشخیص بیماری‌ها نیز استفاده نمود. یادگیری عمیق زیر مجموعه‌ای از هوش مصنوعی است که در پردازش انواع تصاویر و بالاخص تصاویر پزشکی نتایج امیدوار کننده‌ای را به دست آورده است. در این پژوهش از چهار شبکه عصبی یادگیری عمیق کانولوشن، خودرمزگذار کانولوشنی، رس نت 50 در دو حالت پیش آموزش دیده و آموزش از ابتدا و شبکه اینسپن وی 3 نیز در دو حالت پیش آموزش‌دیده و آموزش از ابتدا، برای طبقه‌بندی تصاویر سونوگرافی ضبط شده از سینه در دو سناریو استفاده شده است. در سناریوی اول طبقه‌بندی در دو کلاس سرطان خوش‌خیم وسرطان بدخیم انجام شده و در سناریوی دوم طبقه‌بندی در سه کلاس سرطان خوش‌خیم، سرطان بدخیم و افراد سالم انجام شده است. مجموعه داده مورد استفاده در این پژوهش شامل 780 تصویر در سه کلاس سالم یا نرمال (133 تصویر)، سرطان بدخیم (210 تصویر) و سرطان خوش‌خیم (487 تصویر) بود. تعداد این تصاویر با استفاده از روش‌های افزایش داده مانند چرخش 5 درجه، انعکاس در جهت افقی و عمودی به 6413 تصویر شامل 2185 تصویر سرطان خوش‌خیم، 2100 تصویر سرطان بدخیم و 2128 تصویر افراد سالم رسید. در مرحله بعد برای داشتن تصاویر هم اندازه، ابعاد تصاویر به 150*125 پیکسل تغییر پیدا کرده و برای آموزش شبکه‌ها مورد استفاده قرار گرفتند. در طبقه‌بندی دو کلاسه بالاترین صحت توسط شبکه اینسپشن وی 3آموزش دیده با مقدار 97% به دست آمد. بالاترین دقت در کلاس سرطان خوش‌خیم با مقدار 100% توسط شبکه‌های خودرمزگذار کانولوشنی و رس نت 50 آموزش از ابتدا حاصل شد. این معیار در کلاس سرطان بدخیم با مقدار 98% توسط شبکه اینسپشن وی 3آموزش دیده به دست آمد. حساسیت 98% در کلاس خوش‌خیم توسط شبکه اینسپشن آموزش از ابتدا و 99% در کلاس بدخیم توسط شبکه‌های خودرمزگذار کانولوشنی و رس نت آموزش از ابتدا حاصل شد. معیار F در هر دو کلاس توسط شبکه اینسپشن وی 3 آموزش دیده با مقدار 99% و 98% به دست آمده است.در طبقه‌بندی سه کلاسه شبکه اینسپشن وی 3 آموزش دیده به بالاترین صحت با مقدار 96% رسید. بالاترین دقت، حساسیت و معیار F به ترتیب با مقدار 100%، 96%و 98% توسط شبکه‌ اینسپشن وی 3آموزش دیده، در گروه خوش‌خیم حاصل شد. در گروه بدخیم برای این معیارها 98%، 100% و 98% توسط شبکه‌های کانولوشن و اینسپشن وی 3آموزش دیده به دست آمده است. در گروه افراد سالم، مقادیر 98%، 99% و 98% توسط شبکه‌های کانولوشن، خودرمزگذار کانولوشنی و اینسپشن وی 3 آموزش دیده به دست آمده است.
  6. سیتم های توصیه گر مبتنی بر اعتماد با استفاده از راهکارهای تجزیه ماتریسی و الگوریتم های فرا ابتکاری
    1397
    سیستم های توصیه گر یکی از موفق ترین ابزارها برای مقابله با سرریز داده ها شناخته می شوند که روزبه روز استفاده از آن ها گسترده تر می شود. این سیستم ها یک نوع ویژه از سیستم های پالایش اطلاعات هستند که آیتم ها را بر اساس جذابیت آن ها برای کاربر از یک مجموعه بزرگ از آیتم ها پالایش می کنند. این سیستم ها سعی دارند، بر اساس عملکرد، سلیقه های شخصی، رفتارهای کاربر و بسته به زمینه ای که در آن مورد استفاده قرار می گیرند به هر کاربر پیشنهادهایی را ارائه دهند که با تمایلات شخصی وی تطابق داشته و کاربر را در فرایند تصمیم گیری یاری نمایند. سیستم های توصیه گر پالایش گروهی یکی از پرکاربردترین و موثرترین روش های توصیه محسوب می شوند که با بررسی انتخاب های کاربران در گذشته، الگوهایی را در داده ها پیدا می کنند که با توجه به آن الگوهای رفتاری برای هر کاربر توصیه مناسب را ارائه می دهند. روش های مبتنی بر پالایش گروهی معمولاً از سه مشکل اصلی رنج می برند که شامل: شروع سرد، پراکندگی داده ها و مقیاس پذیری کم می باشند. در راستای برطرف نمودن چالش های گفته شده، این پایان نامه، دو روش جدید مبتنی بر تجزیه نامنفی ماتریس و اطلاعات اعتماد کاربران در شبکه های اجتماعی، ارائه می شود. چون روش تجزیه نامنفی ماتریس یکی از کاراترین روش های مبتنی بر مدل برای سیستم های توصیه پالایش گروهی است، لذا از اطلاعات اعتماد و عدم اعتماد بین کاربران برای کمک به تجزیه درست و دقیق ماتریس رتبه بندی، استفاده می کنیم تا رتبه های نامشخص برای کاربران و آیتم هایی که شروع سرد دارند با دقت مناسبی پیش بینی شود و در برخورد با داده های پراکنده، بتوان با دقت مناسبی سلیقه کاربر هدف را تخمین زد. همچنین برای افزایش مقیاس پذیری و کاهش پیچیدگی الگوریتم ها از روش های بهینه سازی کارآمد برای حل تابع هدف نهایی استفاده می شود. بعلاوه، سیستم های توصیه گر به دلیل پویا بودن محیط و افزایش سریع اطلاعات، روزبه روز فضای مسئله آن ها بزرگ تر می شود، لذا الگوریتم های دقیق (ریاضی) در حالات مختلفی نمی توانند جواب بهینه را تولید کنند و دنبال کردن جواب دقیق در اکثر مواقع خیلی سخت و پرهزینه است. بعلاوه، در اکثر موارد جواب تقریبی و نزدیک به جواب واقعی، می تواند برای ما رضایت بخش باشد. بنابرین، دو روش پیشنهادی جدید مبتنی بر الگوریتم های فراابتکاری ارائه می شود که