ترجمه فارسی مقاله NAH BANTIT: مدل سازی عدم رعایت کاربر در سیستم های توصیه

480,000 تومان

عنوان مقاله به انگلیسی The Nah Bandit: Modeling User Non-compliance in Recommendation Systems
عنوان مقاله به فارسی ترجمه فارسی مقاله NAH BANTIT: مدل سازی عدم رعایت کاربر در سیستم های توصیه
نویسندگان Tianyue Zhou, Jung-Hoon Cho, Cathy Wu
فرمت مقاله انگلیسی PDF
زبان مقاله تحویلی ترجمه فارسی
فرمت مقاله ترجمه شده به صورت فایل ورد
نحوه تحویل ترجمه دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی)
تعداد صفحات 12
لینک دانلود رایگان مقاله انگلیسی دانلود مقاله
دسته بندی موضوعات Machine Learning,Information Retrieval,Multiagent Systems,Systems and Control,یادگیری ماشین , بازیابی اطلاعات , سیستم های چند منظوره , سیستم ها و کنترل ,
توضیحات Submitted 14 August, 2024; originally announced August 2024. , Comments: 12 pages, 8 figures, under review
توضیحات به فارسی ارسال شده در 14 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد. ، نظرات: 12 صفحه ، 8 شکل ، تحت بررسی
اطلاعات بیشتر از این مقاله در پایگاه های علمی INSPIRE HEP

NASA ADS

Google Scholar

Semantic Scholar

فرمت ارائه ترجمه مقاله تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

چکیده

Recommendation systems now pervade the digital world, ranging from advertising to entertainment. However, it remains challenging to implement effective recommendation systems in the physical world, such as in mobility or health. This work focuses on a key challenge: in the physical world, it is often easy for the user to opt out of taking any recommendation if they are not to her liking, and to fall back to her baseline behavior. It is thus crucial in cyber-physical recommendation systems to operate with an interaction model that is aware of such user behavior, lest the user abandon the recommendations altogether. This paper thus introduces the Nah Bandit, a tongue-in-cheek reference to describe a Bandit problem where users can say `nah’ to the recommendation and opt for their preferred option instead. As such, this problem lies in between a typical bandit setup and supervised learning. We model the user non-compliance by parameterizing an anchoring effect of recommendations on users. We then propose the Expert with Clustering (EWC) algorithm, a hierarchical approach that incorporates feedback from both recommended and non-recommended options to accelerate user preference learning. In a recommendation scenario with $N$ users, $T$ rounds per user, and $K$ clusters, EWC achieves a regret bound of $O(N\sqrt{T\log K} + NT)$, achieving superior theoretical performance in the short term compared to LinUCB algorithm. Experimental results also highlight that EWC outperforms both supervised learning and traditional contextual bandit approaches. This advancement reveals that effective use of non-compliance feedback can accelerate preference learning and improve recommendation accuracy. This work lays the foundation for future research in Nah Bandit, providing a robust framework for more effective recommendation systems.

چکیده به فارسی (ترجمه ماشینی)

سیستم های توصیه اکنون دنیای دیجیتال را فرا گرفته اند ، از تبلیغات تا سرگرمی.با این حال ، اجرای سیستم های توصیه های مؤثر در دنیای فیزیکی ، مانند تحرک یا سلامت ، چالش برانگیز است.این کار بر روی یک چالش کلیدی متمرکز است: در دنیای فیزیکی ، اغلب برای کاربر آسان است که اگر به دلخواه او نباشد ، از هرگونه توصیه ای خودداری کند و به رفتار اولیه خود برگردد.بنابراین در سیستم های توصیه های فیزیکی سایبری بسیار مهم است که با یک مدل تعامل که از چنین رفتار کاربر آگاه است ، کار کند ، مبادا کاربر توصیه ها را به طور کلی رها کند.بدین ترتیب در این مقاله ، راهزن NAH ، یک مرجع زبان به گونه ای برای توصیف یک مشکل راهزن در جایی که کاربران می توانند به توصیه خود بگویند “نه” می گویند و به جای آن گزینه مورد نظر خود را انتخاب می کنند.به همین ترتیب ، این مشکل بین یک راهزن معمولی و یادگیری نظارت شده است.ما با پارامتر کردن اثر لنگر انداختن توصیه ها در مورد کاربران ، عدم رعایت کاربر را مدل می کنیم.ما سپس متخصص را با الگوریتم خوشه بندی (EWC) پیشنهاد می کنیم ، یک رویکرد سلسله مراتبی که شامل بازخورد از گزینه های توصیه شده و غیر توصیه شده برای تسریع در یادگیری ترجیح کاربر است.در یک سناریوی توصیه با کاربران $ $ $ ، $ t $ برای هر کاربر و خوشه $ $ ، EWC با پشیمانی از $ O (n \ sqrt {t \ log k} + nt) $ دست پیدا می کند ، و دستیابی به عملکرد برتر تئوریکی برتردر کوتاه مدت در مقایسه با الگوریتم LINUCB.نتایج تجربی همچنین تأکید می کند که EWC از هر دو رویکرد تحت نظارت یادگیری و رویکردهای سنتی راهزن متنی پیشی می گیرد.این پیشرفت نشان می دهد که استفاده مؤثر از بازخورد عدم انطباق می تواند یادگیری اولویت را تسریع کرده و دقت توصیه را بهبود بخشد.این کار پایه و اساس تحقیقات آینده در NAH Bandit را ارائه می دهد و چارچوبی قوی برای سیستم های توصیه ای مؤثرتر فراهم می کند.

فرمت ارائه ترجمه مقاله تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

نقد و بررسی‌ها

هنوز بررسی‌ای ثبت نشده است.

اولین کسی باشید که دیدگاهی می نویسد “ترجمه فارسی مقاله NAH BANTIT: مدل سازی عدم رعایت کاربر در سیستم های توصیه”

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

پیمایش به بالا