| عنوان مقاله به انگلیسی | Latent Diffusion Models for Controllable RNA Sequence Generation | ||||||||
| عنوان مقاله به فارسی | ترجمه فارسی مقاله مدلهای انتشار پنهان برای تولید توالی RNA قابل کنترل | ||||||||
| نویسندگان | Kaixuan Huang, Yukang Yang, Kaidi Fu, Yanyi Chu, Le Cong, Mengdi Wang | ||||||||
| فرمت مقاله انگلیسی | |||||||||
| زبان مقاله تحویلی | ترجمه فارسی | ||||||||
| فرمت مقاله ترجمه شده | به صورت فایل ورد | ||||||||
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) | ||||||||
| تعداد صفحات | 27 | ||||||||
| لینک دانلود رایگان مقاله انگلیسی | دانلود مقاله | ||||||||
| دسته بندی موضوعات | Machine Learning,Artificial Intelligence,Quantitative Methods,یادگیری ماشین , هوش مصنوعی , روشهای کمی | ||||||||
| توضیحات | Submitted 15 September, 2024; originally announced September 2024. | ||||||||
| توضیحات به فارسی | ارسال شده در 15 سپتامبر 2024 ؛در ابتدا سپتامبر 2024 اعلام شد. | ||||||||
| اطلاعات بیشتر از این مقاله در پایگاه های علمی |
INSPIRE HEP NASA ADS Google Scholar Semantic Scholar فرمت ارائه ترجمه مقاله |
تحویل به صورت فایل ورد |
زمان تحویل ترجمه مقاله |
بین 2 تا 3 روز پس از ثبت سفارش |
کیفیت ترجمه |
بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
جداول و فرمول ها |
کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
|
چکیده
This paper presents RNAdiffusion, a latent diffusion model for generating and optimizing discrete RNA sequences. RNA is a particularly dynamic and versatile molecule in biological processes. RNA sequences exhibit high variability and diversity, characterized by their variable lengths, flexible three-dimensional structures, and diverse functions. We utilize pretrained BERT-type models to encode raw RNAs into token-level biologically meaningful representations. A Q-Former is employed to compress these representations into a fixed-length set of latent vectors, with an autoregressive decoder trained to reconstruct RNA sequences from these latent variables. We then develop a continuous diffusion model within this latent space. To enable optimization, we train reward networks to estimate functional properties of RNA from the latent variables. We employ gradient-based guidance during the backward diffusion process, aiming to generate RNA sequences that are optimized for higher rewards. Empirical experiments confirm that RNAdiffusion generates non-coding RNAs that align with natural distributions across various biological indicators. We fine-tuned the diffusion model on untranslated regions (UTRs) of mRNA and optimize sample sequences for protein translation efficiencies. Our guided diffusion model effectively generates diverse UTR sequences with high Mean Ribosome Loading (MRL) and Translation Efficiency (TE), surpassing baselines. These results hold promise for studies on RNA sequence-function relationships, protein synthesis, and enhancing therapeutic RNA design.
چکیده به فارسی (ترجمه ماشینی)
در این مقاله RNAdiffusion ، یک مدل انتشار نهان برای تولید و بهینه سازی توالی های RNA گسسته ارائه شده است.RNA یک مولکول مخصوصاً پویا و همه کاره در فرآیندهای بیولوژیکی است.توالی RNA تنوع و تنوع بالایی را نشان می دهد ، که با طول متغیر آنها ، ساختارهای سه بعدی انعطاف پذیر و عملکردهای متنوع مشخص می شود.ما از مدل های از نوع BERT از پیش تنظیم شده برای رمزگذاری RNA های خام در نمایش های بیولوژیکی معنی دار در سطح توکن استفاده می کنیم.یک Former برای فشرده سازی این بازنمایی ها به یک مجموعه ثابت از بردارهای نهفته استفاده می شود ، با یک رمزگذار خودکار که برای بازسازی توالی های RNA از این متغیرهای نهفته آموزش دیده است.سپس ما یک مدل انتشار مداوم در این فضای نهفته ایجاد می کنیم.برای فعال کردن بهینه سازی ، ما به شبکه های پاداش آموزش می دهیم تا خصوصیات عملکردی RNA را از متغیرهای نهفته تخمین بزنیم.ما از راهنمایی های مبتنی بر گرادیان در طی فرآیند انتشار به عقب استفاده می کنیم ، با هدف تولید توالی RNA که برای پاداش های بالاتر بهینه شده اند.آزمایش های تجربی تأیید می کنند که RNAdiffusion RNA های غیر کد کننده ای را ایجاد می کند که با توزیع های طبیعی در شاخص های مختلف بیولوژیکی مطابقت دارند.ما مدل انتشار را در مناطق غیرقابل ترجمه (UTR) mRNA تنظیم کردیم و توالی نمونه را برای کارآیی ترجمه پروتئین بهینه کردیم.مدل انتشار هدایت شده ما به طور موثری توالی های UTR متنوعی را با میانگین بارگذاری ریبوزوم (MRL) و راندمان ترجمه (TE) ایجاد می کند و از خط مقدماتی پیشی می گیرد.این نتایج نوید برای مطالعات در مورد روابط توالی RNA ، سنتز پروتئین و تقویت طراحی RNA درمانی.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |


نقد و بررسیها
هنوز بررسیای ثبت نشده است.