,

ترجمه فارسی مقاله مدل‌سازی موضوع با LLM های تنظیم دقیق و مجموعه جملات

19,000 تومان640,000 تومان

شناسه محصول: نامعلوم دسته: ,
عنوان مقاله به انگلیسی Topic Modeling with Fine-tuning LLMs and Bag of Sentences
عنوان مقاله به فارسی ترجمه فارسی مقاله مدل‌سازی موضوع با LLM های تنظیم دقیق و مجموعه جملات
نویسندگان Johannes Schneider
فرمت مقاله انگلیسی PDF
زبان مقاله تحویلی ترجمه فارسی
فرمت مقاله ترجمه شده به صورت فایل ورد
نحوه تحویل ترجمه دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی)
تعداد صفحات 16
دسته بندی موضوعات Computation and Language,Machine Learning,محاسبه و زبان , یادگیری ماشین ,
توضیحات Submitted 6 August, 2024; originally announced August 2024. , Comments: This is the submitted journal version of enhanced with the novel fine-tuning part of “Efficient and Flexible Topic Modeling using Pretrained Embeddings and Bag of Sentences” which appeared at the International Conference on Agents and Artificial Intelligence(ICAART) in 2024
توضیحات به فارسی ارائه شده در 6 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد. ، نظرات: این نسخه ژورنال ارسال شده با بخش جدید تنظیم شده از “مدل سازی موضوعی کارآمد و انعطاف پذیر با استفاده از تعبیه شده و کیف جملات” است که در کنفرانس بین المللی نمایندگان و هوش مصنوعی ظاهر شد.(ICAART) در سال 2024

توضیحات گزینه‌های خرید

دانلود مقاله اصل انگلیسی

با انتخاب این گزینه، می‌توانید فایل PDF مقاله اصلی را به زبان انگلیسی دانلود کنید.

قیمت: 19,000 تومان

سفارش ترجمه فارسی مقاله

با انتخاب این گزینه، علاوه بر دریافت مقاله اصلی، ترجمه فارسی مقاله را نیز سفارش می‌دهید.

قیمت: 640,000 تومان

زمان تحویل: 2 تا 3 روز کاری

فرمت ارائه ترجمه مقاله تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

چکیده

Large language models (LLM)’s are increasingly used for topic modeling outperforming classical topic models such as LDA. Commonly, pre-trained LLM encoders such as BERT are used out-of-the-box despite the fact that fine-tuning is known to improve LLMs considerably. The challenge lies in obtaining a suitable (labeled) dataset for fine-tuning. In this paper, we use the recent idea to use bag of sentences as the elementary unit in computing topics. In turn, we derive an approach FT-Topic to perform unsupervised fine-tuning relying primarily on two steps for constructing a training dataset in an automatic fashion. First, a heuristic method to identifies pairs of sentence groups that are either assumed to be of the same or different topics. Second, we remove sentence pairs that are likely labeled incorrectly. The dataset is then used to fine-tune an encoder LLM, which can be leveraged by any topic modeling approach using embeddings. However, in this work, we demonstrate its effectiveness by deriving a novel state-of-the-art topic modeling method called SenClu, which achieves fast inference through an expectation-maximization algorithm and hard assignments of sentence groups to a single topic, while giving users the possibility to encode prior knowledge on the topic-document distribution. Code is at url{https://github.com/JohnTailor/FT-Topic}

چکیده به فارسی (ترجمه ماشینی)

مدل های بزرگ زبان (LLM) به طور فزاینده ای برای مدل سازی موضوع از مدل های موضوعی کلاسیک مانند LDA استفاده می شود.معمولاً ، رمزگذارهای LLM از قبل آموزش دیده مانند BERT با وجود این واقعیت که تنظیم دقیق برای بهبود چشمگیر LLM ها شناخته شده است ، از خارج از جعبه استفاده می شود.این چالش در به دست آوردن یک مجموعه داده مناسب (برچسب) برای تنظیم دقیق است.در این مقاله ، ما از ایده اخیر برای استفاده از کیسه جملات به عنوان واحد ابتدایی در موضوعات محاسبات استفاده می کنیم.به نوبه خود ، ما یک رویکرد FT-Topic را برای انجام تنظیم دقیق بدون کنترل در درجه اول به دو مرحله برای ساخت یک مجموعه داده آموزشی به صورت خودکار انجام می دهیم.اول ، یک روش اکتشافی برای شناسایی جفت گروه های جمله ای که فرض می شود از موضوعات یکسان یا متفاوت برخوردار هستند.دوم ، ما جفت جمله ها را حذف می کنیم که احتمالاً نادرست برچسب خورده اند.سپس از مجموعه داده ها برای تنظیم دقیق یک رمزگذار LLM استفاده می شود ، که می تواند با استفاده از هر روش مدل سازی موضوع با استفاده از تعبیه ها ، از آن استفاده شود.با این حال ، در این کار ، ما اثربخشی آن را با به دست آوردن یک روش جدید مدل سازی موضوعی جدید به نام Senclu نشان می دهیم ، که از طریق الگوریتم انتظار حداکثر انتظار و تکالیف سخت گروه های جمله به یک موضوع واحد ، در حالی که ارائه می دهد ، به استنتاج سریع می رسد.کاربران امکان رمزگذاری دانش قبلی را در مورد توزیع موضوعاتی دارند.کد در url {https://github.com/johntailor/ft-topic} است

فرمت ارائه ترجمه مقاله تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.
نوع دانلود

دانلود مقاله اصل انگلیسی, سفارش ترجمه فارسی مقاله

نقد و بررسی‌ها

هنوز بررسی‌ای ثبت نشده است.

اولین کسی باشید که دیدگاهی می نویسد “ترجمه فارسی مقاله مدل‌سازی موضوع با LLM های تنظیم دقیق و مجموعه جملات”

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

پیمایش به بالا