مقاله آزمایش توزیع با یک کلکتور مغشوش

10,000 تومان

دسته: دسته-بندی-نشده, مقاله علمی برچسب: Data Structures and Algorithms, ساختار داده ها و الگوریتم ها

توضیحات
نظرات (0)

عنوان مقاله به انگلیسی	Distribution Testing with a Confused Collector
عنوان مقاله به فارسی	مقاله آزمایش توزیع با یک کلکتور مغشوش
نویسندگان	Renato Ferreira Pinto Jr., Nathaniel Harms
زبان مقاله	انگلیسی
فرمت مقاله:	PDF
تعداد صفحات	64
دسته بندی موضوعات	Data Structures and Algorithms,ساختار داده ها و الگوریتم ها ,
توضیحات	Submitted 23 November, 2023; originally announced November 2023. , Comments: 64 pages. Full version of paper to appear at ITCS 2024. arXiv admin note: text overlap with arXiv:2304.01374
توضیحات به فارسی	ارسال شده 23 نوامبر 2023 ؛در ابتدا نوامبر 2023 اعلام شد ، نظرات: 64 صفحه.نسخه کامل کاغذ برای نمایش در ITCS 2024. Arxiv Admin توجه: متن همپوشانی با ARXIV: 2304.01374

چکیده

We are interested in testing properties of distributions with systematically mislabeled samples. Our goal is to make decisions about unknown probability distributions, using a sample that has been collected by a confused collector, such as a machine-learning classifier that has not learned to distinguish all elements of the domain. The confused collector holds an unknown clustering of the domain and an input distribution $μ$, and provides two oracles: a sample oracle which produces a sample from $μ$ that has been labeled according to the clustering; and a label-query oracle which returns the label of a query point $x$ according to the clustering. Our first set of results shows that identity, uniformity, and equivalence of distributions can be tested efficiently, under the earth-mover distance, with remarkably weak conditions on the confused collector, even when the unknown clustering is adversarial. This requires defining a variant of the distribution testing task (inspired by the recent testable learning framework of Rubinfeld & Vasilyan), where the algorithm should test a joint property of the distribution and its clustering. As an example, we get efficient testers when the distribution tester is allowed to reject if it detects that the confused collector clustering is “far” from being a decision tree. The second set of results shows that we can sometimes do significantly better when the clustering is random instead of adversarial. For certain one-dimensional random clusterings, we show that uniformity can be tested under the TV distance using $\widetilde O\left(\frac{\sqrt n}{ρ^{3/2} ε^2}\right)$ samples and zero queries, where $ρ\in (0,1]$ controls the “resolution” of the clustering. We improve this to $O\left(\frac{\sqrt n}{ρε^2}\right)$ when queries are allowed.

چکیده به فارسی (ترجمه ماشینی)

ما علاقه مند به آزمایش خواص توزیع با نمونه های بطور منظم گمراه شده هستیم.هدف ما تصمیم گیری در مورد توزیع احتمال ناشناخته ، با استفاده از نمونه ای است که توسط یک جمع کننده سردرگم جمع آوری شده است ، مانند طبقه بندی کننده یادگیری ماشین که آموخته است که همه عناصر دامنه را متمایز کند.جمع کننده سردرگم یک خوشه بندی ناشناخته از دامنه و توزیع ورودی $ μ $ $ دارد و دو اوراکل را فراهم می کند: یک نمونه اوراکل که نمونه ای را از $ $ $ تولید می کند که مطابق با خوشه بندی برچسب گذاری شده است.و یک اوراکل برچسب برچسب که برچسب یک نقطه پرس و جو $ x $ را مطابق با خوشه بندی باز می گرداند.اولین مجموعه از نتایج ما نشان می دهد که هویت ، یکنواختی و هم ارزی توزیع ها می توانند به طور مؤثر ، در فاصله زمین-حرکت ، با شرایط قابل ملاحظه ای ضعیف بر روی جمع کننده سردرگم ، آزمایش شوند ، حتی اگر خوشه بندی ناشناخته مخالف باشد.این امر مستلزم تعریف نوع از کار تست توزیع (با الهام از چارچوب یادگیری قابل آزمایش اخیر Rubinfeld & Vasilyan) است ، جایی که الگوریتم باید یک خاصیت مشترک توزیع و خوشه بندی آن را آزمایش کند.به عنوان نمونه ، وقتی آزمایش کننده توزیع اجازه می دهد رد شود اگر تشخیص دهد که خوشه بندی جمع کننده سردرگم “از یک درخت تصمیم گیری” دور است ، آزمایش کنندگان کارآمد می گیریم.مجموعه دوم نتایج نشان می دهد که ما گاهی اوقات می توانیم به طور قابل توجهی بهتر عمل کنیم وقتی خوشه بندی به جای مخالفان تصادفی باشد.برای برخی از خوشه های تصادفی یک بعدی ، ما نشان می دهیم که یکنواختی را می توان در فاصله تلویزیون با استفاده از $ wideTilde o سمت چپ ( frac { sqrt n} {ρ^{3/2} ε^2} راست) $ آزمایش کرد.نمونه ها و نمایش داده های صفر ، که در آن $ ρ in (0،1] $ “وضوح” خوشه بندی را کنترل می کند. ما این را به $ o سمت چپ ( frac { sqrt n} {ρε^2} Right) $ بهبود می بخشیم.هنگامی که نمایش داده شد مجاز است.

توجه کنید این مقاله به زبان انگلیسی است.

برای سفارش ترجمه این مقاله می توانید به یکی از روش های تماس، پیامک، تلگرام و یا واتس اپ با شماره زیر تماس بگیرید:

09395106248

توجه کنید که شرایط ترجمه به صورت زیر است:

قیمت هر صفحه ترجمه در حال حاضر 40 هزار تومان می باشد.
تحویل مقاله ترجمه شده به صورت فایل ورد می باشد.
زمان تحویل ترجمه مقاله در صورت داشتن تعداد صفحات عادی بین 3 تا 5 روز خواهد بود.
کیفیت ترجمه بسیار بالا می باشد. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

نقد و بررسی‌ها

هنوز بررسی‌ای ثبت نشده است.

اولین کسی باشید که دیدگاهی می نویسد “مقاله آزمایش توزیع با یک کلکتور مغشوش”

مقاله آزمایش توزیع با یک کلکتور مغشوش

چکیده

چکیده به فارسی (ترجمه ماشینی)

نقد و بررسی‌ها

محصولات مرتبط

مقاله فراتر از محیط های کنترل شده ارزیابی قابلیت انتقال مدل های ASROBUST NLU به کاربردهای دنیای واقعی

مقاله همجوشی استریو چند طیفی برای بازسازی صحنه 3D hyperspectral

3DMASC: طبقه بندی ابرهای نقطه 3D قابل توضیح و قابل دسترس.کاربردی برای داده های Bi-spectral Topo-bathymetric lidar

مقاله 4D-ONIX: یک رویکرد یادگیری عمیق برای بازسازی فیلم های سه بعدی از تصاویر پرتونگاری (X-ray) پراکنده