| عنوان مقاله به انگلیسی | On Synthetic Texture Datasets: Challenges, Creation, and Curation | ||||||||
| عنوان مقاله به فارسی | ترجمه فارسی مقاله مجموعه دادههای بافت مصنوعی: چالشها، ایجاد و مدیریت | ||||||||
| نویسندگان | Blaine Hoak, Patrick McDaniel | ||||||||
| فرمت مقاله انگلیسی | |||||||||
| زبان مقاله تحویلی | ترجمه فارسی | ||||||||
| فرمت مقاله ترجمه شده | به صورت فایل ورد | ||||||||
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) | ||||||||
| تعداد صفحات | 8 | ||||||||
| لینک دانلود رایگان مقاله انگلیسی | دانلود مقاله | ||||||||
| دسته بندی موضوعات | Computer Vision and Pattern Recognition,Artificial Intelligence,چشم انداز رایانه و تشخیص الگوی , هوش مصنوعی , | ||||||||
| توضیحات | Submitted 16 September, 2024; originally announced September 2024. | ||||||||
| توضیحات به فارسی | ارائه شده 16 سپتامبر 2024 ؛در ابتدا سپتامبر 2024 اعلام شد. | ||||||||
| اطلاعات بیشتر از این مقاله در پایگاه های علمی |
INSPIRE HEP NASA ADS Google Scholar Semantic Scholar فرمت ارائه ترجمه مقاله |
تحویل به صورت فایل ورد |
زمان تحویل ترجمه مقاله |
بین 2 تا 3 روز پس از ثبت سفارش |
کیفیت ترجمه |
بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
جداول و فرمول ها |
کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
|
چکیده
The influence of textures on machine learning models has been an ongoing investigation, specifically in texture bias/learning, interpretability, and robustness. However, due to the lack of large and diverse texture data available, the findings in these works have been limited, as more comprehensive evaluations have not been feasible. Image generative models are able to provide data creation at scale, but utilizing these models for texture synthesis has been unexplored and poses additional challenges both in creating accurate texture images and validating those images. In this work, we introduce an extensible methodology and corresponding new dataset for generating high-quality, diverse texture images capable of supporting a broad set of texture-based tasks. Our pipeline consists of: (1) developing prompts from a range of descriptors to serve as input to text-to-image models, (2) adopting and adapting Stable Diffusion pipelines to generate and filter the corresponding images, and (3) further filtering down to the highest quality images. Through this, we create the Prompted Textures Dataset (PTD), a dataset of 362,880 texture images that span 56 textures. During the process of generating images, we find that NSFW safety filters in image generation pipelines are highly sensitive to texture (and flag up to 60\% of our texture images), uncovering a potential bias in these models and presenting unique challenges when working with texture data. Through both standard metrics and a human evaluation, we find that our dataset is high quality and diverse.
چکیده به فارسی (ترجمه ماشینی)
تأثیر بافت ها در مدل های یادگیری ماشین یک تحقیق مداوم بوده است ، به طور خاص در تعصب/یادگیری بافت ، تفسیر و استحکام.با این حال ، به دلیل عدم وجود داده های بافت بزرگ و متنوع در دسترس ، یافته های این آثار محدود شده است ، زیرا ارزیابی های جامع تر امکان پذیر نبوده است.مدل های تولید کننده تصویر قادر به ایجاد داده ها در مقیاس هستند ، اما استفاده از این مدل ها برای سنتز بافت ناشناخته است و هم در ایجاد تصاویر بافت دقیق و هم اعتبار سنجی آن تصاویر ، چالش های دیگری را ایجاد می کند.در این کار ، ما یک روش شناسی گسترده و مجموعه داده های جدید مربوط به تولید تصاویر با کیفیت و متنوع با کیفیت بالا را که قادر به پشتیبانی از مجموعه گسترده ای از کارهای مبتنی بر بافت هستند ، معرفی می کنیم.خط لوله ما از: (1) توسعه از طیف وسیعی از توصیف کنندگان برای ارائه به عنوان ورودی به مدل های متن به تصویر ، (2) اتخاذ و سازگاری خطوط لوله انتشار پایدار برای تولید و فیلتر کردن تصاویر مربوطه ، و (3) فیلتر بیشترپایین به بالاترین کیفیت تصاویر.از این طریق ، ما مجموعه داده های Textures (PTD) را ایجاد می کنیم ، یک مجموعه داده از 362.880 تصویر بافت که 56 بافت دارد.در طی فرآیند تولید تصاویر ، می فهمیم که فیلترهای ایمنی NSFW در خطوط لوله تولید تصویر نسبت به بافت بسیار حساس هستند (و تا 60 ٪ از تصاویر بافت ما پرچم گذاری می کنند) ، پرده برداری از تعصب بالقوه در این مدل ها و ارائه چالش های منحصر به فرد هنگام کار با آنهاداده های بافتاز طریق معیارهای استاندارد و یک ارزیابی انسانی ، می فهمیم که مجموعه داده ما با کیفیت و متنوع است.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |


نقد و بررسیها
هنوز بررسیای ثبت نشده است.