| عنوان مقاله به انگلیسی | Generating Synthetic Fair Syntax-agnostic Data by Learning and Distilling Fair Representation | ||||||||
| عنوان مقاله به فارسی | ترجمه فارسی مقاله تولید داده های نحوی مصنوعی عادلانه با یادگیری و تقطیر نمایشگاه نمایشگاه | ||||||||
| نویسندگان | Md Fahim Sikder, Resmi Ramachandranpillai, Daniel de Leng, Fredrik Heintz | ||||||||
| فرمت مقاله انگلیسی | |||||||||
| زبان مقاله تحویلی | ترجمه فارسی | ||||||||
| فرمت مقاله ترجمه شده | به صورت فایل ورد | ||||||||
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) | ||||||||
| تعداد صفحات | 9 | ||||||||
| لینک دانلود رایگان مقاله انگلیسی | دانلود مقاله | ||||||||
| دسته بندی موضوعات | Machine Learning,Artificial Intelligence,یادگیری ماشین , هوش مصنوعی , | ||||||||
| توضیحات | Submitted 20 August, 2024; originally announced August 2024. | ||||||||
| توضیحات به فارسی | 20 اوت 2024 ارسال شد.در ابتدا اوت 2024 اعلام شد. | ||||||||
| اطلاعات بیشتر از این مقاله در پایگاه های علمی |
INSPIRE HEP NASA ADS Google Scholar Semantic Scholar فرمت ارائه ترجمه مقاله |
تحویل به صورت فایل ورد |
زمان تحویل ترجمه مقاله |
بین 2 تا 3 روز پس از ثبت سفارش |
کیفیت ترجمه |
بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
جداول و فرمول ها |
کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
|
چکیده
Data Fairness is a crucial topic due to the recent wide usage of AI powered applications. Most of the real-world data is filled with human or machine biases and when those data are being used to train AI models, there is a chance that the model will reflect the bias in the training data. Existing bias-mitigating generative methods based on GANs, Diffusion models need in-processing fairness objectives and fail to consider computational overhead while choosing computationally-heavy architectures, which may lead to high computational demands, instability and poor optimization performance. To mitigate this issue, in this work, we present a fair data generation technique based on knowledge distillation, where we use a small architecture to distill the fair representation in the latent space. The idea of fair latent space distillation enables more flexible and stable training of Fair Generative Models (FGMs). We first learn a syntax-agnostic (for any data type) fair representation of the data, followed by distillation in the latent space into a smaller model. After distillation, we use the distilled fair latent space to generate high-fidelity fair synthetic data. While distilling, we employ quality loss (for fair distillation) and utility loss (for data utility) to ensure that the fairness and data utility characteristics remain in the distilled latent space. Our approaches show a 5%, 5% and 10% rise in performance in fairness, synthetic sample quality and data utility, respectively, than the state-of-the-art fair generative model.
چکیده به فارسی (ترجمه ماشینی)
انصاف داده ها به دلیل استفاده گسترده از برنامه های کاربردی AI ، موضوع مهمی است.بسیاری از داده های دنیای واقعی پر از تعصبات انسانی یا دستگاه هستند و وقتی از این داده ها برای آموزش مدل های AI استفاده می شود ، این احتمال وجود دارد که این مدل تعصب را در داده های آموزش منعکس کند.روشهای تولیدی تعصب موجود بر اساس GAN ها ، مدل های انتشار نیاز به اهداف انصاف در پردازش دارند و ضمن انتخاب معماری های محاسباتی سنگین ، در نظر گرفتن سربار محاسباتی ، که ممکن است منجر به تقاضای محاسباتی بالا ، بی ثباتی و عملکرد بهینه سازی ضعیف شود.برای کاهش این مسئله ، در این کار ، ما یک تکنیک تولید داده عادلانه را بر اساس تقطیر دانش ارائه می دهیم ، جایی که ما از یک معماری کوچک برای تقطیر نمایشگاه منصفانه در فضای نهفته استفاده می کنیم.ایده تقطیر فضایی نهفته منصفانه ، آموزش انعطاف پذیر و پایدارتر از مدلهای تولیدی منصفانه (FGM) را امکان پذیر می کند.ما ابتدا یک نمایشگاه عادلانه از داده ها (برای هر نوع داده) از داده ها را یاد می گیریم و به دنبال آن تقطیر در فضای نهفته به یک مدل کوچکتر می پردازیم.پس از تقطیر ، ما از فضای عادلانه تقطیر شده برای تولید داده های مصنوعی عادلانه با وفاداری بالا استفاده می کنیم.در حین تقطیر ، ما از دست دادن کیفیت (برای تقطیر منصفانه) و از دست دادن ابزار (برای داده های داده) استفاده می کنیم تا اطمینان حاصل شود که انصاف و ویژگی های ابزار داده در فضای نهفته مقطر باقی می مانند.رویکردهای ما نشان می دهد که 5 ٪ ، 5 ٪ و 10 ٪ افزایش عملکرد در انصاف ، کیفیت نمونه مصنوعی و ابزار داده ها به ترتیب نسبت به مدل تولیدی عادلانه از هنر.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |


نقد و بررسیها
هنوز بررسیای ثبت نشده است.