| عنوان مقاله به انگلیسی | Efficient Solutions For An Intriguing Failure of LLMs: Long Context Window Does Not Mean LLMs Can Analyze Long Sequences Flawlessly |
| عنوان مقاله به فارسی | ترجمه فارسی مقاله راهحلهای کارآمد برای یک شکست جذاب LLMها: پنجرهی زمینهی طولانی به این معنی نیست که LLMها میتوانند توالیهای طولانی را بینقص تجزیه و تحلیل کنند |
| نویسندگان | Peyman Hosseini, Ignacio Castro, Iacopo Ghinassi, Matthew Purver |
| فرمت مقاله انگلیسی | |
| زبان مقاله تحویلی | ترجمه فارسی |
| فرمت مقاله ترجمه شده | به صورت فایل ورد |
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) |
| تعداد صفحات | 11 |
| دسته بندی موضوعات | Computation and Language,Machine Learning,محاسبه و زبان , یادگیری ماشین , |
| توضیحات | Submitted 3 August, 2024; originally announced August 2024. , Comments: 11 pages, 5 figures, 6 tables , ACM Class: I.2.7 |
| توضیحات به فارسی | ارسال شده در 3 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد ، نظرات: 11 صفحه ، 5 شکل ، 6 جدول ، کلاس ACM: I.2.7 |
توضیحات گزینههای خرید
دانلود مقاله اصل انگلیسی
با انتخاب این گزینه، میتوانید فایل PDF مقاله اصلی را به زبان انگلیسی دانلود کنید.
قیمت: 19,000 تومان
دانلود مقاله اصل انگلیسی + خلاصه دو صفحه ای مقاله + پادکست صوتی فارسی خلاصه مقاله
با انتخاب این گزینه، علاوه بر دریافت مقاله اصلی، یک خلاصه دو صفحهای فارسی و پادکست صوتی فارسی خلاصه مقاله را نیز دریافت خواهید کرد.
قیمت: 99,000 تومان
سفارش ترجمه فارسی مقاله + خلاصه دو صفحه ای مقاله + پادکست صوتی فارسی خلاصه مقاله
با انتخاب این گزینه، علاوه بر دریافت مقاله اصلی و ترجمه کامل آن، یک خلاصه دو صفحهای فارسی و پادکست صوتی فارسی خلاصه مقاله را نیز دریافت خواهید کرد.
قیمت: 440,000 تومان
زمان تحویل: 2 تا 3 روز کاری
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
چکیده
Large Language Models (LLMs) have demonstrated remarkable capabilities in comprehending and analyzing lengthy sequential inputs, owing to their extensive context windows that allow processing millions of tokens in a single forward pass. However, this paper uncovers a surprising limitation: LLMs fall short when handling long input sequences. We investigate this issue using three datasets and two tasks (sentiment analysis and news categorization) across various LLMs, including Claude 3, Gemini Pro, GPT 3.5 Turbo, Llama 3 Instruct, and Mistral Instruct models. To address this limitation, we propose and evaluate ad-hoc solutions that substantially enhance LLMs’ performance on long input sequences by up to 50%, while reducing API cost and latency by up to 93% and 50%, respectively.
چکیده به فارسی (ترجمه ماشینی)
مدل های بزرگ زبان (LLMS) قابلیت های قابل توجهی را در درک و تجزیه و تحلیل ورودی های متوالی طولانی نشان داده اند ، به دلیل ویندوزهای متن گسترده آنها که امکان پردازش میلیون ها نشانه را در یک پاس به جلو می گذارد.با این حال ، این مقاله محدودیت شگفت آور را کشف می کند: LLMS هنگام کار با توالی های ورودی طولانی ، کوتاه می آید.ما این موضوع را با استفاده از سه مجموعه داده و دو کار (تجزیه و تحلیل احساسات و طبقه بندی اخبار) در LLM های مختلف ، از جمله Claude 3 ، Gemini Pro ، GPT 3.5 Turbo ، Llama 3 آموزش و مدلهای آموزش میساط بررسی می کنیم.برای پرداختن به این محدودیت ، ما راه حل های موقت را پیشنهاد می کنیم که عملکرد LLMS را در توالی های ورودی طولانی تا 50 ٪ افزایش می دهد ، در حالی که به ترتیب هزینه API و تأخیر را تا 93 ٪ و 50 ٪ کاهش می دهد.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |


نقد و بررسیها
هنوز بررسیای ثبت نشده است.