,

ترجمه فارسی مقاله ToolSandbox: یک معیار ارزیابی تعاملی، محاوره‌ای و مبتنی بر وضعیت برای قابلیت‌های استفاده از ابزار LLM

19,000 تومان840,000 تومان

شناسه محصول: نامعلوم دسته: ,
عنوان مقاله به انگلیسی ToolSandbox: A Stateful, Conversational, Interactive Evaluation Benchmark for LLM Tool Use Capabilities
عنوان مقاله به فارسی ترجمه فارسی مقاله ToolSandbox: یک معیار ارزیابی تعاملی، محاوره‌ای و مبتنی بر وضعیت برای قابلیت‌های استفاده از ابزار LLM
نویسندگان Jiarui Lu, Thomas Holleis, Yizhe Zhang, Bernhard Aumayer, Feng Nan, Felix Bai, Shuang Ma, Shen Ma, Mengyu Li, Guoli Yin, Zirui Wang, Ruoming Pang
فرمت مقاله انگلیسی PDF
زبان مقاله تحویلی ترجمه فارسی
فرمت مقاله ترجمه شده به صورت فایل ورد
نحوه تحویل ترجمه دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی)
تعداد صفحات 21
دسته بندی موضوعات Computation and Language,Artificial Intelligence,Machine Learning,محاسبه و زبان , هوش مصنوعی , یادگیری ماشین ,
توضیحات Submitted 8 August, 2024; originally announced August 2024.
توضیحات به فارسی ارسال شده در 8 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد.

توضیحات گزینه‌های خرید

دانلود مقاله اصل انگلیسی

با انتخاب این گزینه، می‌توانید فایل PDF مقاله اصلی را به زبان انگلیسی دانلود کنید.

قیمت: 19,000 تومان

سفارش ترجمه فارسی مقاله

با انتخاب این گزینه، علاوه بر دریافت مقاله اصلی، ترجمه فارسی مقاله را نیز سفارش می‌دهید.

قیمت: 840,000 تومان

زمان تحویل: 2 تا 3 روز کاری

فرمت ارائه ترجمه مقاله تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

چکیده

Recent large language models (LLMs) advancements sparked a growing research interest in tool assisted LLMs solving real-world challenges, which calls for comprehensive evaluation of tool-use capabilities. While previous works focused on either evaluating over stateless web services (RESTful API), based on a single turn user prompt, or an off-policy dialog trajectory, ToolSandbox includes stateful tool execution, implicit state dependencies between tools, a built-in user simulator supporting on-policy conversational evaluation and a dynamic evaluation strategy for intermediate and final milestones over an arbitrary trajectory. We show that open source and proprietary models have a significant performance gap, and complex tasks like State Dependency, Canonicalization and Insufficient Information defined in ToolSandbox are challenging even the most capable SOTA LLMs, providing brand-new insights into tool-use LLM capabilities. ToolSandbox evaluation framework is released at https://github.com/apple/ToolSandbox

چکیده به فارسی (ترجمه ماشینی)

پیشرفت های اخیر مدل های بزرگ زبان (LLMS) باعث افزایش علاقه تحقیق در ابزار LLMS با کمک ابزار برای حل چالش های دنیای واقعی شد ، که خواستار ارزیابی جامع از قابلیت های استفاده از ابزار است.در حالی که آثار قبلی بر روی ارزیابی بیش از خدمات وب بدون تابعیت (API RESTFUL) ، بر اساس یک سریع کاربر به نوبه خود یا یک مسیر گفتگوی خارج از سیاست متمرکز شده است ، Toolsand Box شامل اجرای ابزار مطبوع ، وابستگی های ضمنی بین ابزارها ، یک شبیه ساز کاربر داخلی است.حمایت از ارزیابی مکالمه در سیاست و یک استراتژی ارزیابی پویا برای نقاط عطف میانی و نهایی در یک مسیر دلخواه.ما نشان می دهیم که مدلهای منبع باز و اختصاصی از شکاف عملکرد قابل توجهی برخوردار هستند و کارهای پیچیده ای مانند وابستگی به دولت ، متعارف سازی و اطلاعات ناکافی تعریف شده در ToolsandBox حتی با توانایی ترین LLMS SOTA به چالش کشیده می شوند و بینش های تجاری جدید را در قابلیت های LLM با استفاده از ابزار ارائه می دهند.چارچوب ارزیابی Toolsand و جعبه در https://github.com/apple/toolsandbox منتشر می شود

فرمت ارائه ترجمه مقاله تحویل به صورت فایل ورد
زمان تحویل ترجمه مقاله بین 2 تا 3 روز پس از ثبت سفارش
کیفیت ترجمه بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
جداول و فرمول ها کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.
نوع دانلود

دانلود مقاله اصل انگلیسی, سفارش ترجمه فارسی مقاله

نقد و بررسی‌ها

هنوز بررسی‌ای ثبت نشده است.

اولین کسی باشید که دیدگاهی می نویسد “ترجمه فارسی مقاله ToolSandbox: یک معیار ارزیابی تعاملی، محاوره‌ای و مبتنی بر وضعیت برای قابلیت‌های استفاده از ابزار LLM”

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

پیمایش به بالا