تاریخ بهروزرسانی: 1403/06/29
فاطمه دانشفر
دانشکده مهندسی / گروه مهندسی کامپیوتر و فناوری اطلاعات
پایاننامههای کارشناسیارشد
-
Multi-objective Manifold Representation for Opinion Mining
1403Sentiment analysis is an essential task in numerous domains, necessitating effective dimensionality reduction and feature extraction techniques. This study introduces MultiObjective Manifold Representation for Opinion Mining (MOMR). This novel approach combines deep global and local manifold feature extraction to reduce dimensions while capturing intricate data patterns efficiently. Additionally, incorporating a self-attention mechanism further enhances MOMR's capability to focus on relevant parts of the text, resulting in improved performance in sentiment analysis tasks. MOMR was evaluated against established techniques such as Long Short-Term Memory (LSTM), Naive Bayes (NB), Support Vector Machines (SVM), Recurrent Neural Networks (RNN), and Convolutional Neural Networks (CNN), as well as recent state-of-the-art models across multiple datasets including IMDB, Fake News, Twitter, and Yelp. Therefore, our comparative analysis underscores MOMR's efficacy in sentiment analysis tasks across diverse datasets, highlighting its potential and applicability in real-world sentiment analysis applications. On the IMDB dataset, MOMR achieved an accuracy of 99.7% and an F1 score of 99.6%, outperforming other methods such as LSTM, NB, SMSR, and various SVM and CNN models. For the Twitter dataset, MOMR attained an accuracy of 88.0% and an F1 score of 88.0%, surpassing other models, including LSTM, CNN, BiLSTM, Bi-GRU, NB, and RNN. In the Fake News dataset, MOMR demonstrated superior performance with an accuracy of 97.0% and an F1 score of 97.6%, compared to techniques like RF, RNN, BiLSTM+CNN, and NB. For the Yelp dataset, MOMR achieved an accuracy of 80.0% and an F1 score of 80.0%, proving its effectiveness alongside other models such as Bidirectional Encoder Representations from Transformers (BERT), aspect-sentence graph convolutional neural network (ASGCN), Multi-layer Neural Network, LSTM, and bidirectional recurrent convolutional neural network attention (BRCAN).
-
تجزیه خودبازنما برای یادگیری بازنمایی تعمیم پذیر
1403تجزیه ماتریس نامنفی، به عنوان یک مدل یادگیری بازنمایی گروهی، بازنمایی مبتنی بر جزء را با ویژگی های قابل تفسیر تولید می کند و می تواند برای مسائل مختلف مانند خوشه بندی داده ها به کار گرفته شود. یافته ها نشان می دهد که مدل تجزیه ماتریس نامنفی با واگرایی کولبک-لیبلر و واگرایی β عملکرد امیدوارکننده ای را در کار خوشه بندی متن و انواع داده های مختلف نشان می دهند. با این حال، روش های خوشه بندی متن مبتنی بر تجزیه ماتریس موجود در یک مدل رمزگشا، فاقد چارچوب تایید تعریف شده اند. اخیرا،ً روش های خود بازنمایی برای طیف گسترده ای از وظایف به کار گرفته شده اند، و مدل ها را برای یادگیری مستقل و تایید بازنمایی هایی که به طور کامل پیچیدگی ها و تفاوت های ذاتی در داده های ورودی آن ها را منعکس می کنند، توانمند می سازد. در این پژوهش، ما دو روش تجزیه ماتریس خودبازنمایی را برای خوشه بندی داده ها پیشنهاد می کنیم که اطلاعات معنایی و منظم ساز گراف را به ترتیب در روش های پیشنهادی در فرآیند یادگیری آن مشارکت می دهد. مدل تجزیه ماتریس نامنفی رمزگذار-رمزگشای معنایی مبتنی بر واگرایی کولبک-لیبلر (SEDNMFk (و تجزیه ماتریس رمزگذار-رمزگشا مبتنی بر واگرایی β REDNMF-β ، تجزیه های رمزگذار و رمزگشا را در یک تابع هزینه یکپارچه ادغام می کنند که به طور متقابل یکدیگر را تایید و اصلاح می کنند، و در نتیجه خوشه های متمایزتری تشکیل می شوند. ما الگوریتم های بهینه سازی کارآمد و موثر براساس قوانین به روزرسانی ضربی برای حل مدل یکپارچه روش های پیشنهادی ارائه می کنیم. نتایج تجربی روی ده مجموعه داده شناخته شده نشان می دهد که روش های پیشنهادی ما از سایر روش های خوشه بندی نوین عملکرد بهتری دارد.
-
Automatic Colorectal Cancer Detection Using Machine Learning and Deep Learning Based on Feature Selection
1403Colorectal cancer (CRC), accounting for 10% of global cancer cases and being the third most prevalent type, is expected to see a significant increase in the coming years. This surge underscores the need for precise diagnostics. Effective treatment relies on accurate histopathological analysis of hematoxylin and eosin (H&E) stained biopsies, which is critical for recommending minimally invasive treatments. However, manual evaluations of these biopsies are labor-intensive and error-prone due to staining variations and inconsistencies, complicating the tasks of pathologists. To address these challenges, advanced automated image analysis, including deep learning with convolutional neural networks (CNNs) and machine learning (ML) techniques, has significantly enhanced computer-aided diagnosis systems. Consequently, this paper proposes a composite model that combines deep learning and machine learning to improve colorectal cancer diagnosis accuracy. Specifically, the model aims to increase diagnostic precision, reduce complexity and computing demands, and effectively prevent overfitting for reliable performance. Therefore, the proposed cascaded design includes feature extraction using MobileNetV2 and DenseNet121 via transfer learning (TL), data distribution balancing in the Extended Bioimaging Histopathological Image Segmentation (EBHI-Seg) dataset using the Synthetic Minority Over-sampling Technique (SMOTE), key feature selection using a Chisquare test, classification by machine learning algorithms, and improving classification accuracy through hyperparameter tuning. Finally, the results evaluated on the available EBHI-Seg dataset achieve 97.28% accuracy, 97.29% precision, 97.27% recall, 96.27% F1- score, and 99.4% area under the curve (AUC), demonstrating that the suggested model is superior to other methods already in use.
-
Hybrid Deep Learning Approach: CNN-ViT Fusion for Breast Cancer Diagnosis in Ultrasound Images
1403Breast cancer represents one of the leading cancer diagnoses in women around the world. Early detection and accurate classification of breast cancer from medical images are crucial, as they enable timely treatment, which can significantly improve patient outcomes. Ultrasound imaging is a popular diagnostic method in radiology for evaluating breast health. Over the past ten years, deep learning approaches, especially Convolutional Neural Networks (CNNs), have been used to develop comprehensive systems for recognizing image patterns. More recently, the Vision Transformer (ViT) has gained attention as a novel deep learning architecture, largely because of its self-attention mechanisms, which have greatly improved the field of image processing. These models have exhibited strong performance across a wide range of image-related applications. Computer-Aided Diagnosis (CAD) systems in medical field have increasingly adopted deep learning methodologies, recognized for their superior ability to extract essential features from medical images. This study proposes a hybrid deep learning approach that integrates CNNs with ViTs to enhance breast cancer diagnosis in ultrasound images. This method capitalizes on the beneficial attributes of CNNs and ViTs to boost the accuracy of breast cancer diagnosis. By combining the powerful local feature extraction ability of CNNs with ViTs focus on long-range dependencies and global features, the hybrid network, integrating multiple vision architectures, optimizes the utilization of information, enabling a more thorough and nuanced interpretation of medical imaging data. The methodology was assessed using two publicly accessible datasets, revealing superior performance compared to current state-of-the-art techniques. This indicates that our method has the potential to generalize across various datasets. The high accuracy achieved by this hybrid deep learning model suggests that it can play a significant role in improving breast cancer diagnosis.
-
روش یادگیری عمیق چندوجهی مبتنیبر توجه برای شرح تصویر
1403مغز ما قادر است تصاویری که در برابرمان ظاهر میشوند را توصیف و یا دستهبندی کند. اما چگونه یک کامپیوتر میتواند تصویر را پردازش کرده و آن را با یک شرح مناسب و دقیق شناسایی کند؟ این امر چند سال پیش غیرقابل دستیابی به نظر میرسید، اما با پیشرفت الگوریتمهای بینایی ماشین و یادگیری عمیق، همچنین در دسترس بودن مجموعه دادهها و مدلهای هوش مصنوعی مناسب، ساخت یک تولیدکننده شرح مناسب برای یک تصویر آسانتر شده است. تولید شرح تصویر همچنین یک صنعت رو به رشد در سراسر جهان است. فرایند تولید شرح تصویر برای تبدیل تصاویر به یک سری کلمات با استفاده از یک سری پیکسلها استفاده میشود. میتوان تصور کرد که تولید شرح تصاویر چالشی از ابتدا تا انتها در قالب یک چالش توالی به توالی است. برای دستیابی به این هدف، لازم است هم کلمات و هم تصاویر را پردازش کرد. در این پایان نامه، ابتدا، توضیحی از شرح تصویر و کاربردهای آن در حوزههای مختلف ارائه شده است و سپس، به بررسی سیر تکاملی روشهای شرح تصویر پرداخته شده است. روشهای مختلفی که در گذر زمان برای شرح تصویر پیشنهاد شدهاند، بهطور جامع مورد بررسی قرار گرفتهاند. این دستهبندی منسجم به ما کمک میکند تا به فهم عمیقتری از تکنیکها و روشهای موجود در شرح تصویر برسیم. همچنین، در این پایان نامه مقالات اخیر در حوزه شرح تصویر مورد بررسی قرار گرفتهاند. با توجه به نتایج بدست آمده از بررسی مقالات اخیر، ضرورت ادامه پژوهشها در حوزه شرح تصویر مورد تاکید قرار گرفته است. این پژوهشها میتوانند بهبودهای مهمی در روشهای موجود برای شرح تصویر و نیز کشف روشهای نوین و پیشرفتهتر منجر شوند. در این پایان نامه از روش رمزگذار-رمزگشا مبتنیبر توجه استفاده شده است که برخلاف روشهای پیشین که توجه فقط برروی یکی از بخشها اعمال میشد، مکانیسم توجه هم برروی تصویر و هم برروی متن اعمال شده است که این یک ایده جدید در این حوزه میباشد و همچنین شیوه تولید شرح نهایی لغت به لغت است. از مجموعه داده FLICKR8K استفاده شده است و همچنین از معیار های ارزیابیBLEU (1,2,3,4) ، ROUGE، METEOR استفاده شده است.که این نتایج به ترتیب، 51_49_48_44_52_37.5 است. این نتایج به دست آمده حاکی از بهبود روشهای قبلی است.
-
طبقه بندی متن کردی با استفاده از یک الگوریتم بهینه سازی
1402امروزه با افزایش روزافزون اطلاعات و گستردگی موضوعات، طبقهبندی متون یکی از چالشهای هوش مصنوعی است. طبقهبندی متون شاخهایی از پردازش زبان طبیعی است که در آنها متون در دستهها یا گروههایی قرار میگیرند. طبقهبندی متون یکی از مواردی است که اخیرا مورد توجه قرارگرفته است و کاربردهای بسیاری دارد، از جمله مهمترین آنها، دستهبندی اسناد، بازیابی اطلاعات، پرسش و پاسخ، قطبیتسنجی و ... میباشد. زبان کردی یکی از شاخههای هندو-ایرانی زبانهای هندو-اروپایی است که بیش از 30 میلیون نفر در آسیای غربی، عمدتاً در عراق، ترکیه، ایران، سوریه، ارمنستان و آذربایجان به آن صحبت میکنند. زبان کردی دارای گویش های متنوعی است و دارای سیستم دستوری و واژگان غنی مختص به خود است. اکثر سیستمهای طبقهبندی متن را میتوان به چهار مرحله خلاصه کرد: استخراج ویژگی، کاهش ابعاد، انتخاب طبقهبندی کننده و ارزیابی. در ابتدا از یک متن، استخراج ویژگی (با استفاده از کد کردن کلمات) به روشهای مختلف صورت میگیرد. ازآنجا که اغلب ویژگیهای استخراج شده اضافی و بیربط هستند، میتوانند باعث خطا در طبقهبندیکننده شوند. سپس انتخاب ویژگیهای مهمتر، بهعنوان یک مشکل اساسی در طبقهبندی متون، مطرح است. انتخاب ویژگیهای مهم از تمام ویژگیها، نقش به سزایی درافزایش کارایی دقت طبقهبندی دارد. در این مرحله ما با استفاده از روشهای یادگیری ماشین سعی در انتخاب بهترین ویژگیها داریم که این امر، بر روی مجموعه دادگان متنی زبان کردی صورت میپذیرد. از جمله روشهای یادگیری ماشین در مسئلههای بهینهسازی، استفاده از الگوریتمهای فراابتکاری است. الگوریتمهای فراابتکاری بسیاری تا امروز معرفی شدهاند که هرکدام الهام گرفته از طبیعت هستند. این الگوریتمها فرضیات کمی در مورد یک مسئله ایجاد میکنند و یا میتوانند فضاهای بسیار بزرگی از راهحلهای کاندید را جستجو کنند. الگوریتم مرغ تخمگذار از جمله یکی از بهترین الگوریتمهای فراابتکاری در حل مسائل بهینهسازی در فضای پیوسته است. با استفاده از الگوریتم فراابتکاری مرغ تخمگذار ویژگیهای استخراج شده از متن طوری انتخاب میگردند که دقت طبقهبندی کننده افزایش یابد. بدین منظور ابتدا نسخهای پیشرفته از این الگوریتم در فضای گسسته ارائه میشود و سپس در فضای نمونه تمام حالات انتخاب ویژگی، جایگذاری میشوند. الگوریتم با پیمایش فضای نمونه و ارزیابی نقطه به نقطهی حالات، از نقطهای به نقطهی بهتر حرکت میکند. چالش اصلی این کار انتخاب نقطهای خوب برای شروع و انتخاب درست محدوده تغییر برای هر نقطه است. ما در این پژوهش به یکی از بهترین روشها برای بهبود انتخاب ویژگی در وظیفهی طبقهبندی متن دست یافتهایم که روشی جدید است. از طرفی با پیادهسازی این روش بر روی زبان کردی (که جزو زبانهای کم منبع در پردازش زبان طبیعی محسوب میشود) پژوهش خود را غنیتر ساختهایم. نتایج این پژوهش در مقیاس کم (با توجه به کمبود منابع پردازشی) بهبود یک درصدی در دقت طبقهبندی کننده را نشان میدهد که نشان از کارایی رویکرد ارائه شده دارد و دری تازه بر روی پژوهشگران عزیز باز میکند.
-
کنترل اتوماتیک تولید با استفاده از سیستمهای چند عامله
1388در این پایان نامه، از کنترل کننده های هوشمندی استفاده شده است که در ساختار آن ها، از استانداردهای عملکرد کنترل بهره گرفته شده است تا علاوه بر کنترل مناسب بار-فرکانس، از این استانداردها پیروی کنند. نتایج نشان داد با به کارگیری استانداردهای عملکرد در ساختار کنترل کننده، عملکرد کنترل کننده در برآوردن اهداف کنترلی از جمله کاهش زمان نشست و فراجهش بهبود می یابد. در این پایان نامه، علاوه بر استفاده از الگوریتم های کلاسیک، از کنترل کننده مبتنی بر سیستمهای چندعامله و با لحاظ کردن استانداردهای عملکرد استفاده شد تا هم از فرسودگی تجهیزات گاورنر کم کند و هم از استانداردهای عملکرد NERC پیروی کرده تا قابلیت اطمینان را افزایش دهد. نتایج نشان می دهد که کنترل کننده هایی که از استانداردهای NERC پیروی می کنند، عملکرد مناسب تری داشته و پاسخ فرکانسی آن ها بهبود یافته است.