| عنوان مقاله به انگلیسی | A First Look at License Compliance Capability of LLMs in Code Generation |
| عنوان مقاله به فارسی | ترجمه فارسی مقاله نگاهی اولیه به قابلیت انطباق با مجوز LLM ها در تولید کد |
| نویسندگان | Weiwei Xu, Kai Gao, Hao He, Minghui Zhou |
| فرمت مقاله انگلیسی | |
| زبان مقاله تحویلی | ترجمه فارسی |
| فرمت مقاله ترجمه شده | به صورت فایل ورد |
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) |
| تعداد صفحات | 13 |
| دسته بندی موضوعات | Software Engineering,Artificial Intelligence,Machine Learning,مهندسی نرم افزار , هوش مصنوعی , یادگیری ماشین , |
| توضیحات | Submitted 5 August, 2024; originally announced August 2024. |
| توضیحات به فارسی | ارسال شده در 5 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد. |
توضیحات گزینههای خرید
دانلود مقاله اصل انگلیسی
با انتخاب این گزینه، میتوانید فایل PDF مقاله اصلی را به زبان انگلیسی دانلود کنید.
قیمت: 19,000 تومان
سفارش ترجمه فارسی مقاله
با انتخاب این گزینه، علاوه بر دریافت مقاله اصلی، ترجمه فارسی مقاله را نیز سفارش میدهید.
قیمت: 520,000 تومان
زمان تحویل: 2 تا 3 روز کاری
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
چکیده
Recent advances in Large Language Models (LLMs) have revolutionized code generation, leading to widespread adoption of AI coding tools by developers. However, LLMs can generate license-protected code without providing the necessary license information, leading to potential intellectual property violations during software production. This paper addresses the critical, yet underexplored, issue of license compliance in LLM-generated code by establishing a benchmark to evaluate the ability of LLMs to provide accurate license information for their generated code. To establish this benchmark, we conduct an empirical study to identify a reasonable standard for “striking similarity” that excludes the possibility of independent creation, indicating a copy relationship between the LLM output and certain open-source code. Based on this standard, we propose an evaluation benchmark LiCoEval, to evaluate the license compliance capabilities of LLMs. Using LiCoEval, we evaluate 14 popular LLMs, finding that even top-performing LLMs produce a non-negligible proportion (0.88% to 2.01%) of code strikingly similar to existing open-source implementations. Notably, most LLMs fail to provide accurate license information, particularly for code under copyleft licenses. These findings underscore the urgent need to enhance LLM compliance capabilities in code generation tasks. Our study provides a foundation for future research and development to improve license compliance in AI-assisted software development, contributing to both the protection of open-source software copyrights and the mitigation of legal risks for LLM users.
چکیده به فارسی (ترجمه ماشینی)
پیشرفت های اخیر در مدل های بزرگ زبان (LLMS) باعث ایجاد انقلابی در تولید کد شده است و منجر به اتخاذ گسترده ابزارهای کدگذاری هوش مصنوعی توسط توسعه دهندگان می شود.با این حال ، LLMS می تواند بدون ارائه اطلاعات مجوز لازم ، کد محافظت از مجوز را ایجاد کند و منجر به نقض بالقوه مالکیت معنوی در هنگام تولید نرم افزار شود.در این مقاله با ایجاد یک معیار برای ارزیابی توانایی LLMS در ارائه اطلاعات دقیق مجوز برای کد تولید شده خود ، مسئله انطباق مجوز در کد تولید LLM می پردازد.برای ایجاد این معیار ، ما یک مطالعه تجربی را برای شناسایی یک استاندارد معقول برای “شباهت چشمگیر” انجام می دهیم که امکان ایجاد مستقل را حذف می کند ، و این نشانگر یک رابطه کپی بین خروجی LLM و کد منبع باز است.براساس این استاندارد ، ما یک معیار ارزیابی LicoEval را برای ارزیابی قابلیت های انطباق مجوز LLMS پیشنهاد می کنیم.با استفاده از licoeval ، ما 14 LLM محبوب را ارزیابی می کنیم ، و می دانیم که حتی LLM های با عملکرد برتر نیز نسبت غیر قابل اغماض (0.88 ٪ تا 2.01 ٪) از کد به طرز چشمگیری شبیه به پیاده سازی های موجود در منبع باز تولید می کنند.نکته قابل توجه ، بیشتر LLM ها در ارائه اطلاعات مجوز دقیق ، به ویژه برای کد تحت مجوزهای COPYLEFT ، ناکام هستند.این یافته ها حاکی از نیاز فوری برای افزایش قابلیت های انطباق LLM در کارهای تولید کد است.مطالعه ما پایه و اساس تحقیقات و توسعه آینده را برای بهبود انطباق مجوز در توسعه نرم افزار AI با کمک AI فراهم می کند ، که هم به حمایت از کپی رایت نرم افزار منبع باز و هم کاهش خطرات قانونی برای کاربران LLM کمک می کند.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |


نقد و بررسیها
هنوز بررسیای ثبت نشده است.