تاریخ بهروزرسانی: 1403/09/01
محسن رمضانی
دانشکده مهندسی / گروه مهندسی کامپیوتر و فناوری اطلاعات
پایاننامههای کارشناسیارشد
-
طراحی و پیادهسازی یک سامانه برخط سرعت بالا، مبتنی بر یادگیری عمیق، به منظور درجهبندی میوه سنجد
1402بخش کشاورزی و صنایع مربوط به آن از جمله شالودههای اصلی اقتصاد کشورهای مختلف بهخصوص جوامع درحال توسعه به شمار میرود. یکی از زیر مجموعههای بخش کشاورزی که به طور چشمگیری در دنیا در حال توسعه است، فناوری پس از برداشت محصولات کشاورزی میباشد. در این میان سنجد یک میوه با خواص غذایی و دارویی بالا میباشد که بیشتر با استفاده از روشهای سنتی و دستی درجهبندی میشود. خصوصیات رنگی و ظاهری سنجد یکی از مهمترین عوامل مرتبط با کیفیت آن بهشمار میرود. با توجه به افزایش روز افزون مصرف این محصول در جهان و با توسعه فناوریهای جدید، نیاز به روش نوین با بازدهی بالا و بدون دخالت انسان جهت درجهبندی میوه سنجد وجود دارد. برای این امر تکنیکهای بینایی ماشین مبتنی بر یادگیری عمیق برای تعیین درجه کیفی سنجد با دقت قابل قبول میتواند مورد استفاده قرار گیرند. از این رو هدف از انجام این پژوهش توسعه یک سامانه درجهبندی مبتنی بر بینایی ماشین به منظور درجهبندی میوه سنجد در سطوح مختلف سرعت درجهبندی میباشد. تصاویر دادهبرداریشده در سرعتهای مختلف خطی تسمه نقاله توسط یک سامانه بینایی ماشین و با استفاده از محیط برنامه نویسیPython تحلیل شد و فریمهای حاوی نمونههای سنجد استخراج گردید. از الگوریتم Mask R-CNN بهمنظور قطعهبندی فریمهای خروجی برای به دست آوردن مرز(لبه) نمونهها استفاده شد. بالاترین میانگین صحت مرزبندی در سطح سرعت اول (82/4 سانتی متر بر ثانیه) به مقدار 11/104درصد به دست آمد. با توجه به اهمیت سرعت و صحت برای درجهبندی، از شبکه YOLO جهت ایجاد شبکه طبقهبند استفاده گردید. به منظور مقایسه نتایج صحت طبقهبندی در سرعتهای مختلف، از دو شبکه YOLOv8x و YOLOv8n استفاده شد. ارزیابی مدل های طبقهبند جهت درجهبندی میوه سنجد با استفاده از شاخصهای آماری نظیر حساسیت، اختصاصی بودن، دقت و صحت کل انجام گردید. میزان صحت کل طبقهبندی مدل برتر شبکه YOLOv8x در مرحله صحتسنجی 25/91 درصد و برای شبکه YOLOv8n، 88/88 درصد در سرعت خطی تسمه نقاله برابر با 18/15 سانتی متر بر ثانیه به دست آمد. نتایج این بررسی نشان داد که سامانه پیشنهادی پتانسیل لازم به عنوان یک روش سریع و با صحت مناسب را برای تعیین کلاس کیفی میوه سنجد را دارا است.
-
انتخاب ویژگی چندهدفه چندبرچسبی فیلتر-رپر
1402به عنوان یک روش مهم پیشپردازش دادهها، انتخاب ویژگی یک مرحله برجسته قبل از طبقهبندی و سایر الگوریتمهای یادگیری ماشین است. روشهای انتخاب ویژگی عمدتا به روشهای فیلتر و پوششی تقسیم میشوند که هر کدام مزایای خاص خود را دارند و برای استفاده از نقاط قوت هر دو روش، روشهای فیلتر-پوششی معرفی شدهاند. با این حال، ادغام و همکاری روشهای فیلتر و پوششی میتواند یک فرآیند چالشبرانگیز باشد، زیرا نیاز به هماهنگ کردن معیارها و الگوریتمهای مختلف و طراحی روشی برای یک همکاری سازگار بین این روشها وجود دارد. از سوی دیگر، الگوریتمهای بهینهسازی چند-هدفه برای مقابله با مشکلات انتخاب ویژگی چند-برچسبه بسیار کارآمد هستند. با این وجود، مطالعات نسبتا کمی در مورد انتخاب ویژگی چند-هدفه فیلتر-پوششی برای دادههای چند-برچسبه انجام شده است. در این پژوهش، ما ابتدا یک روش جدید برای همکاری بین اجزای فیلتر و پوششی با استفاده از تکنیک نوآورانهای به نام مدلهای احتمال اهمیت (Importance Probability Models) با اختصار IPMs ارائه میدهیم و سپس با استفاده از این تکنیک، یک رویکرد انتخاب ویژگی فیلتر-پوششی چند-هدفه برای دادههای چند-برچسبه به نام FWMMFS-IPMs معرفی میکنیم. این رویکرد از یک مولفهی فیلترِ سریعِ اصلاح شده برای تنظیم IPMs اولیه استفاده میکند که سپس جهت ایجاد جمعیت اولیه مطلوب در یک الگوریتم پوششی استفاده میشوند. IPM ها به طور مداوم با استفاده از راهحلهای بهینه حاصل از تکامل روش پوششی بهروز میشوند و با بهرهگیری از این موضوع، یک رویکرد جدید برای فرایند جهش در این الگوریتم نیز ارائه میشود. این فرایند نرخ همگرایی الگوریتم را بهبود میبخشد، از گیر کردن آن در بهینه محلی جلوگیری میکند و تعادل بین جستجو محلی و سراسری را برقرار میکند. IPMs نهایی که حاصل یک همکاری سازگار بین روشهای فیلتر و پوششی هستند همگرا میشوند و مرتب سازی آنها به ترتیب نزولی، رتبهبندی نهایی ویژگیها را ایجاد میکند. برای نشان دادن اثربخشی روش پیشنهادی، ما از چندین معیار شناخته شده برای ارزیابی طبقهبندی چند-برچسبه استفاده کردهایم و آزمایشهای متنوعی را روی مجموعه دادههای چند-برچسبه مختلف انجام دادهایم. FWMMFS-IMPs با الگوریتمهای انتخاب ویژگی چند-برچسبه مشابه مقایسه شده است، و نتایج تجربی اثربخشی آن را در جنبههای مختلف ارزیابی، از جمله معیارهای پایداری و عملکرد نشان میدهد. FWMMFS-IMPs به طور موثر ابعاد دادههای چند-برچسبه را در حوزههای مختلف از جمله متن، موسیقی، زیست شناسی و تصاویر کاهش میدهد و به طور مداوم از سایر رویکردها در معیارهای ارزیابی مختلف بهتر عمل میکند.
-
اثر بازاریابی محتوا بر جذب مخاطب در شبکه اجتماعی اینستاگرام
1401این پژوهش به منظور یافتن اثر بازاریابی محتوا بر جذب مخاطب در شبکه اینستاگرام با بررسی بخشهای مختلف پاسخگویی محتوا به نیاز مخاطب، جذابیت قالبهای محتوا، اعتمادسازی محتوا، پشتیبانی بر خط و ضریب انتشار در فرایند اعتمادسازی و جذب مخاطب در شبکه اینستاگرام صورت گرفته است. جامعه آماری تحقیق شامل 30 شبکهی فروش اینستاگرامی در ایران است که با استفاده از فرمول کوکران نمونهی 384 نفری بهدست آمد. بهمنظور جمعآوری دادههای مورد نظر پژوهش و پاسخگویی به فرضیات تحقیق اطلاعات مورد نیاز توسط پرسشنامه محقق ساخته جمعآوری شد. سپس با استفاده از رویکرد مدلسازی معادلات ساختاری توسط نرم افزار اسمارت پی ال سی و اس پی اس اس تحلیل گردید. در بخش کیفی رضایت و یا عدم رضایت از این پیجها به وسیلهی متن کاوی تحلیل و بررسی شد سپس به وسیلهی هوش مصنوعی و نرمافزار پایتون و با استفاده از کدگزاری کلمات و جملات استفاده شده در کامنتها نتایج بدست آمد که به 4 دستهی راضی، ناراضی، تردید و بیتفاوت تقسیم شد. همچنین به روش مصاحبه عمیق با ده متخصص مشاوره شبکهی اینستاگرامی جهت بررسی میزان عملکرد این شبکهها مصاحبه صورت گرفت. سپس با استفاده از الگوریتم کلنی مورچه عوامل موثر بر میزان رضایت یا نارضایتی از هر شبکه اینستاگرامی محاسبه گردید. نتیجتا فرضیههای عوامل موثر در بازاریابی محتوا بر جذب مخاطب تایید شد. در بخش کیفی این نتیجه حاصل شد که برای رضایت از شبکه فروشگاهی انتخاب شده، اول اعتمادسازی سپس ضریب انتشار و نهایتا جذب مخاطب بیشترین درصد را داشتهاند و دلیل نارضایتی آنها ضعیف بودن در ویژگیهای پشتیبانی آنلاین، قالب محتوا و نیاز مخاطب است.
-
ارائه یک روش دو جریانه مبتنی بر ویژگیهای مکمل سنتی و عمیق برای تشخیص فعالیت انسان در ویدئو
1401امروزه تشخیص رفتار انسان که بهعنوان یک زمینه مهم در کاربردهای مختلفی مورداستفاده قرار گرفته است، موردتوجه بسیاری از محققان حوزه بینایی ماشین است. در مطالعات انجام شده در این حوزه ابتدا مدلی از رفتار انسان ایجاد میشود که از آن مدل برای انجام پیشبینی برچسب و یا جستجوی ویدئو بهصورت مبتنی بر محتوا استفاده میشود. ایجاد مدل میتواند با استفاده از ویژگیهای سنتی و عمیق انجام شود. ویژگیهای سنتی شامل ویژگیهای سنتی سراسری و محلی میشوند که ویژگیهای سنتی سراسری و سنتی محلی خود به ترتیب با چالشهای مهمی از قبیل حساسیت به نویز و عدم درنظرگرفتن ژستهای کلی بدن مواجه هستند که روشها را برای استفاده در کاربردهای واقعی محدود میکنند. روشهای جدید از ویژگیهای حاصل از شبکههای عمیق برای طبقهبندی رفتارها استفاده میکنند. ویژگیهای عمیق از مدلکردن معنایی که در ویژگیهای دستساز مستتر است ناتوان است؛ لذا در روشهایی از استخراج دو ویژگی در دو جریان مستقل و ترکیب ویژگی و یا نتایج نهایی طبقهبندی برای پیشبینی رفتار استفاده میشود که به روشهای دو جریانه شناخته میشوند. در این تحقیق دو نوع ویژگی مکانی در دو جریان مورداستفاده قرار میگیرد به گونهای که این ویژگیها بتوانند با پوشش نقاط ضعف همدیگر به پیشبینی برچسب رفتاری دقیقتری برسند. در جریان اول ضرایب موجک از قابها استخراج میشوند که چند ریزگی مناسبی دارند و در جریان دیگر به استخراج ویژگیهای عمیق از قابها پرداخته میشود تا بازنمایی مکانی مناسبی از تغییرات محلی و سراسری داشته باشیم. این ویژگیهای حاصل از قابها در دو نقشه ویژگیهای مکانی قرار میگیرند که در نهایت با استفاده از یک شبکه عمیق جدید، با فیلدهای پذیرنده فراگیرتر، ویژگیهای زمانی مناسبی را حاصل نمایند. در این شبکه با استفاده از مدل مکانی - زمانی نهایی ایجاد شده پیشبینی برچسب رفتار انجام میشود و نتایج طبقهبندی در دو جریان نهایتاً با هم ترکیب خواهند شد تا به برچسبی با اطمینان بیشتر برسیم. دقت روش پیشنهادی روی 3 مجموعهداده واقعی UCFYT، UCF-Sport و JHMDB برابر با 98.7، 99.83 و 92.86 بوده که عملکرد روش به طور میانگین نسبت به بهترین روش معرفی شده قبلی 4.6 درصد بهتر است.
-
بازسازی تصویر مبتنی بر شبکه متخاصم مولد هدایت شده توسط اطلاعات اضافه تعریف شده توسط کاربر
1400بازگرداندن ناحیه آسیب دیده در تصاویر دیجیتال (بازسازی تصویر) می تواند به عنوان یک مشکل دشوار در نظر گرفته شود که بر اساس شدت آسیب به نسبت سخت تر می شود. در چند سال اخیر پیشرفت هایی در مقابله با این موضوع از طریق استفاده از مدل های یادگیری عمیق صورت گرفته است. در این مطالعه با توجه به کاربردهای موفق GAN ها در زمینه های مختلف، رویکرد جدیدی برای بازسازی تصویر ارائه شده است. الگوریتم پیشنهادی شامل یک مولد و یک تمایز عمومی است. ژنراتور مسئول بازیابی ناحیه از دست رفته است و تمایزکننده عمومی به تشخیص درست بودن یا نبودن ناحیه تعمیر مربوط می شود. معماری ژنراتور از دو انکودر خودکار تشکیل شده است. علاوه بر این، Wasserstein GAN برای اطمینان از ثبات تمرین استفاده می شود. به عنوان تصویر ورودی، یک تصویر نماد 32 در 32 نیز برای هدایت معنایی ژنراتور استفاده می شود و سپس با تصویر خراب برای پر کردن قسمت یا مناطق از دست رفته بدون از دست دادن برخی اشیاء موجود یا پیش بینی اشیاء یا اشکال ناخواسته، الحاق می شود. تصویر راهنما می تواند توسط کاربر برنامه پیشنهاد شود یا موارد دیگری مانند واترمارک در نظر گرفته شود. این روش از نظر کمی و کیفی با مدل های پیشرفته ای که از شبکه متخاصم مولد استفاده می کنند مقایسه می شود. این رویکردها می توانند ساختارها و بافت های بصری قانع کننده ای ایجاد کنند، اما اغلب ساختارهای تغییر شکل یافته، بافت های تار یا اشیایی از دست می دهند که با مناطق اطراف همگام نیستند. نتایج ارائه شده روی مجموعه داده CelebA-HQ نشان می دهد که مدل پیشنهادی می تواند با پیکسل های از دست رفته در مقیاس بزرگ مقابله کند و نتایج واقعی ایجاد کند.
-
GAN-Based Guided Image Inpainting By User-defined Side Information
1400Restoring damaged region in digital images (i.e., image inpainting) can be considered as a difficult problem which gets proportionally harder based on the severity of the damage. In the last few years, there is a progress in tackling this issue through using deep learning models. In this study, according to the successful applications of GANs in different fields, a new approach is presented for image inpainting. The proposed algorithm contains a generator and a global discriminator. The generator is responsible for recovering the missing area, and the global discriminator relates to identifying whether the repair area is correct or not. The architecture of the generator consists of two auto-encoder. Moreover, Wasserstein GAN loss is used to ensure the stability of training. As input image a 32 by 32 icon image is also used to semantically guide the generator, and then concatenating with the corrupted image for filling the lost part or regions without losing some existing objects or predicting unwanted objects or shapes. The guide image can be proposed by the user of application or some other cases such as watermarking can be considered. This method is qualitatively and quantitatively compared to the state-of-the-art models which use a Generative Adversarial Network. These approaches can produce convincing visual structures and textures, but they frequently produce deformed structures, blurry textures or loss objects that are out of sync with the surrounding areas. The presented results on CelebA-HQ dataset demonstrate that the proposed model can deal with large-scale missing pixels and generate realistic results.
-
استفاده از ویژگیهای معنایی برای بهبود تشخیص رفتارهای حرکتی انسان
1400امروزه آنالیز رفتار انسان در سیستم های برخط ویدئویی مانند جستجو، دوربین نظارتی و تعامل انسان و ماشین بسیار مورد توجه قرار گرفته است. با ورود هوش مصنوعی به این حوزه سعی شده تا ماشین در تحلیل و بررسی رفتارها جایگزین عامل انسانی گردد. مهمترین گام برای این کار بازنمایی رفتار است به طوری که حاوی جزئیات رفتار برای انجام عملیات طبقه بندی باشد. بازنمایی رفتار می تواند بر اساس مدل یا داده های حاصل از رفتار باشد که منتج به معرفی روش های مدل محور و داده محور گشته است. روش های مدل محور با ایجاد مدل هایی دو یا سه بعدی از بدن انسان بازنمایی را انجام می دهد در حالی که روش های داده محور با پیچیدگی زمانی و حافظه مورد نیاز کمتر تغییرات در قاب ها را بررسی می کنند. روش های داده محور با استفاده از ویژگی های سراسری و محلی به بازنمایی رفتار انسان می پردازند. ویژگی های سراسری با بررسی تغییرات کلی قاب ها و ویژگی های محلی با بررسی حرکت های اجرا شده در یک یا چند ناحیه محلی از ویدئو به بازنمایی رفتار انسان می پردازد. در کارهای صورت گرفته تاکنون معنای رفتار که به یک توالی از زیررفتارها تعبیر شود مورد توجه قرار نگرفته است. لذا در این پایان نامه برای تشخیص و بازیابی رفتار انسان در ویدئو، بازنمایی رفتار انسان با استفاده از معنای حرکات بوسیله شبکه های عمیق انجام می شود. برای تعریف معنا در این کار، هر رفتار به زیررفتارهایی از حرکت های تشکیل دهنده آن تبدیل شده و بعد از مدل کردن حرکت ها، رفتار انسان بر اساس ترکیب این مدل ها بازنمایی می شود. بدین منظور ابتدا حرکت های تشکیل دهنده رفتار با استفاده از ویژگی های محلی استخراج شده از روش Dollar و انتقال بردارهای این ویژگی ها به فضای فرکانس با استفاده از روش CWT، برای پردازش های آتی به منظور تفکیک ساده حرکت ها، بدست می آیند. سپس با استفاده از شبکه های عصبی عمیق هر کدام حرکت های بدست آمده مدل شده و نهایتا با ترکیب مدل های حرکت های تشکیل دهنده هر رفتار، بازنمایی نهایی آن انجام می شود که برای تفکیک رفتارها مورد استفاده قرار گرفته اند. به منظور ارزیابی مدل پیشنهادی از مجموعه داده های ویدئویی HMDB، UCF Sport، UCFYT و UCF50 استفاده شده است که همه آنها شامل ویدئوهای واقعی ضبط شده در شرایط گوناگون هستند. روش معرفی شده با استفاده از زبان برنامه نویسی پایتون، کتابخانه های krase و Tensorfllow پیاده سازی شده تا به بخش بندی ویدئو، بازنمایی رفتار و طبقه بندی بپردازد. عملکرد روش پیشنهادی با سایر روش های معرفی شده در حوزه تشخیص و بازیابی رفتار مقایسه شده است. روش های مورد بررسی از شبکه های عصبی عمیق و یا ترکیبی از روش های داده محور، مدل محور و شبکه های عصبی عمیق برای بازنمایی و طبقه بندی رفتار استفاده کرده اند. ارزیابی نتایج بدست آمده نشان می دهد که روش پیشنهادی در کاربردهای شناسایی و بازیابی در مقایسه با سایر روش ها به دلیل توجه به حرکت های تشکیل دهنده رفتار و توالی آنها و بازنمایی مناسب، به ترتیب از 02/0 درصد تا 5/1 درصد و از 7/0 درصد تا 4 درصد دقت بالاتری داشته است.
-
بهبود کارایی سیستم های پالایش گروهی با استفاده از تکنیک های خوشه بندی
1392سیستم های توصیه گر، سیستم هایی هستند که برای پیشنهاد کردن آیتم هایی بکار برده می شوند که انتظار می رود این آیتم ها مورد علاقه کاربر قرار گیرند. در سیستم های توصیه گر یک تکنیک پر کاربرد به نام سیستم های پالایش گروهی وجود دارد. این سیستم ها بر این فرضیه استوارند که می-توان اولویت های تعریف شده برای آیتم ها از سوی تعدادی از کاربران را برای سایر کاربران هم به اشتراک گذاشت. بنابراین، در این سیستم ها، هدف اصلی، یافتن یک گروه از شبیه ترین کاربران به کاربر فعال است. معیارهای شباهت، یکی از رایج ترین روش ها برای یافتن کاربران مشابه به کاربر فعال است. با استفاده از این روش، میزان شباهت کاربران نسبت به هم اندازه گیری شده و نهایتاً بر اساس این معیار ها، شبیه ترین کاربران به کاربر فعال به عنوان کاربران همسایه انتخاب می شوند. در این روش ها، برای انتخاب کاربران همسایه، محاسبات بر اساس ماتریس امتیازات کاربران به آیتم ها انجام می شود. اما این روش با چالش هایی مانند خلوت بودن ماتریس امتیازات، مقیاس پذیری و همچنین مشخص نبودن تعداد بهینه کاربران همسایه روبرو است. بعلاوه، در توصیه کردن آیتم ها روش هایی وجود دارند که خیلی از اطلاعات آماری امتیازات استفاده نمی کنند. یک راهکار دیگر برای یافتن کاربران مشابه به کاربر فعال، استفاده از روش های خوشه بندی است. از روش های خوشه بندی برای دسته بندی کردن کاربران در قالب خوشه هایی استفاده می شود که کاربران یک خوشه دارای بیشترین شباهت به هم هستند. در این پایان نامه دو راهکار مبتنی بر خوشه بندی، برای یافتن کاربران شبیه به هم در سیستم های پالایش گروهی پیشنهاد شده است. در راهکار اول، سعی شده است که با استفاده از روش های پیش پردازش مانند انتخاب ویژگی، تعدادی از آیتم های غیر موثر از مجموعه آیتم ها قبل از اعمال روش های خوشه بندی جهت یافتن کاربران همسایه، حذف شوند. نتایج آزمایشات نشان دهنده بهبود کارایی این روش است. در راهکار پیشنهادی دوم، یک روش جدید برای یافتن کاربران ارائه شده است که در این روش نیاز به مشخص نمودن تعداد خوشه ها برای خوشه بندی نیست. در این روش با استفاده از زیر مجموعه ای از آیتم های مورد علاقه کاربران که توسط چند کاربر امتیاز بالایی دریافت کرده اند، کاربران شبیه بدون در نظر گرفتن اینکه دارای امتیازات داده شده به آیتم های مشترکی باشند، در یک