,

مقاله پیش‌بینی‌کننده غیرخطی آموخته‌شده برای فشرده‌سازی ویژگی‌های ابر نقطه سه‌بعدی نمونه‌گیری انتقادی

10.000 تومان

عنوان مقاله به انگلیسی Learned Nonlinear Predictor for Critically Sampled 3D Point Cloud Attribute Compression
عنوان مقاله به فارسی مقاله پیش‌بینی‌کننده غیرخطی آموخته‌شده برای فشرده‌سازی ویژگی‌های ابر نقطه ای سه‌بعدی نمونه‌گیری شده انتقادی
نویسندگان Tam Thuc Do, Philip A. Chou, Gene Cheung
زبان مقاله انگلیسی
فرمت مقاله: PDF
تعداد صفحات 0
دسته بندی موضوعات Image and Video Processing,Machine Learning,Signal Processing,پردازش تصویر و فیلم , یادگیری ماشین , پردازش سیگنال ,
توضیحات Submitted 22 November, 2023; originally announced November 2023.
توضیحات به فارسی ارسال شده 22 نوامبر 2023 ؛در ابتدا نوامبر 2023 اعلام شد.

چکیده

We study 3D point cloud attribute compression via a volumetric approach: assuming point cloud geometry is known at both encoder and decoder, parameters $θ$ of a continuous attribute function $f: \mathbb{R}^3 \mapsto \mathbb{R}$ are quantized to $\hatθ$ and encoded, so that discrete samples $f_{\hatθ}(\mathbf{x}_i)$ can be recovered at known 3D points $\mathbf{x}_i \in \mathbb{R}^3$ at the decoder. Specifically, we consider a nested sequences of function subspaces $\mathcal{F}^{(p)}_{l_0} \subseteq \cdots \subseteq \mathcal{F}^{(p)}_L$, where $\mathcal{F}_l^{(p)}$ is a family of functions spanned by B-spline basis functions of order $p$, $f_l^*$ is the projection of $f$ on $\mathcal{F}_l^{(p)}$ and encoded as low-pass coefficients $F_l^*$, and $g_l^*$ is the residual function in orthogonal subspace $\mathcal{G}_l^{(p)}$ (where $\mathcal{G}_l^{(p)} \oplus \mathcal{F}_l^{(p)} = \mathcal{F}_{l+1}^{(p)}$) and encoded as high-pass coefficients $G_l^*$. In this paper, to improve coding performance over [1], we study predicting $f_{l+1}^*$ at level $l+1$ given $f_l^*$ at level $l$ and encoding of $G_l^*$ for the $p=1$ case (RAHT($1$)). For the prediction, we formalize RAHT(1) linear prediction in MPEG-PCC in a theoretical framework, and propose a new nonlinear predictor using a polynomial of bilateral filter. We derive equations to efficiently compute the critically sampled high-pass coefficients $G_l^*$ amenable to encoding. We optimize parameters in our resulting feed-forward network on a large training set of point clouds by minimizing a rate-distortion Lagrangian. Experimental results show that our improved framework outperformed the MPEG G-PCC predictor by $11$ to $12\%$ in bit rate reduction.

چکیده به فارسی (ترجمه ماشینی)

ما فشرده سازی ویژگی ابر 3D نقطه را از طریق یک رویکرد حجمی مطالعه می کنیم: با فرض اینکه هندسه ابر نقطه در هر دو رمزگذار و رمزگشایی شناخته شده است ، پارامترهای $ θ $ یک تابع ویژگی مداوم $ f: \ mathbb {r}^3 \ mapsto \ mathbb {r}$ به $ \ hatθ $ و رمزگذاری شده است ، به طوری که نمونه های گسسته $ f _ {\ hatθ} (\ mathbf {x} _i) $ را می توان در نقاط 3D شناخته شده $ \ mathbf {x} _i \ در \ mathbb {r بازیابی کرد.}^3 $ در رمزگشایی.به طور خاص ، ما توالی تو در تو در تو در تو در نظر می گیریم \ mathcal \ mathcal {f}^{(p)} _ {l_0} \ subseteq \ cdots \ subseteq \ mathcal {f}^{(p)} _ l $ ، جایی که $ \ mathcalal{f} _l^{(p)} $ خانواده ای از توابع است که توسط توابع پایه b-spline سفارش $ p $ ، $ f_l^*$ پیش بینی $ f $ در $ \ mathcal {f} _l^است.{(p)} $ و به عنوان ضرایب کم گذر $ f_l^*$ ، و $ g_l^*$ رمزگذاری شده است.Mathcal {g} _l^{(p)} \ oplus \ mathcal {f} _l^{(p)} = \ mathcal {f} _ {l+1}^{(p)} $) و به صورت بالا رمزگذاری شده استضرایب عبور $ g_l^*$.در این مقاله ، برای بهبود عملکرد برنامه نویسی بیش از [1] ، ما پیش بینی می کنیم $ f_ {l+1}^*$ در سطح $ l+1 $ با داده $ f_l^*$ در سطح $ l $ و رمزگذاری $ g_l^*$ برای پرونده $ p = 1 $ (RAHT (1 $ $)).برای پیش بینی ، ما پیش بینی خطی RAHT (1) در MPEG-PCC را در یک چارچوب نظری رسمی می کنیم و یک پیش بینی کننده غیرخطی جدید را با استفاده از چند جمله ای از فیلتر دو جانبه پیشنهاد می کنیم.ما معادلات را برای محاسبه کارآمد ضرایب با گذشت زمان از نظر نقدی از $ g_l^*$ قابل رمزگذاری برای رمزگذاری می کنیم.ما پارامترها را در شبکه فید فیدر حاصل در یک مجموعه آموزش بزرگ از ابرهای نقطه با به حداقل رساندن یک Lagrangian با سرعت تخریب بهینه می کنیم.نتایج تجربی نشان می دهد که چارچوب بهبود یافته ما از پیش بینی کننده MPEG G-PCC با 11 دلار تا 12 $ \ $ $ در کاهش نرخ بیت عمل کرده است.

توجه کنید این مقاله به زبان انگلیسی است.
برای سفارش ترجمه این مقاله می توانید به یکی از روش های تماس، پیامک، تلگرام و یا واتس اپ با شماره زیر تماس بگیرید:

09395106248

توجه کنید که شرایط ترجمه به صورت زیر است:
  • قیمت هر صفحه ترجمه در حال حاضر 40 هزار تومان می باشد.
  • تحویل مقاله ترجمه شده به صورت فایل ورد می باشد.
  • زمان تحویل ترجمه مقاله در صورت داشتن تعداد صفحات عادی بین 3 تا 5 روز خواهد بود.
  • کیفیت ترجمه بسیار بالا می باشد. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه می‌شود.
  • کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج می‌شوند.

نقد و بررسی‌ها

هنوز بررسی‌ای ثبت نشده است.

اولین کسی باشید که دیدگاهی می نویسد “مقاله پیش‌بینی‌کننده غیرخطی آموخته‌شده برای فشرده‌سازی ویژگی‌های ابر نقطه سه‌بعدی نمونه‌گیری انتقادی”

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

پیمایش به بالا