| عنوان مقاله به انگلیسی | Peptide Sequencing Via Protein Language Models |
| عنوان مقاله به فارسی | ترجمه فارسی مقاله توالییابی پپتید از طریق مدلهای زبان پروتئین |
| نویسندگان | Thuong Le Hoai Pham, Jillur Rahman Saurav, Aisosa A. Omere, Calvin J. Heyl, Mohammad Sadegh Nasr, Cody Tyler Reynolds, Jai Prakash Yadav Veerla, Helen H Shang, Justyn Jaworski, Alison Ravenscraft, Joseph Anthony Buonomo, Jacob M. Luber |
| فرمت مقاله انگلیسی | |
| زبان مقاله تحویلی | ترجمه فارسی |
| فرمت مقاله ترجمه شده | به صورت فایل ورد |
| نحوه تحویل ترجمه | دو تا سه روز پس از ثبت سفارش (به صورت فایل دانلودی) |
| تعداد صفحات | 18 |
| دسته بندی موضوعات | Biomolecules,Machine Learning,زیست مولکول , یادگیری ماشین , |
| توضیحات | Submitted 1 August, 2024; originally announced August 2024. |
| توضیحات به فارسی | ارسال شده در 1 اوت 2024 ؛در ابتدا اوت 2024 اعلام شد. |
توضیحات گزینههای خرید
دانلود مقاله اصل انگلیسی
با انتخاب این گزینه، میتوانید فایل PDF مقاله اصلی را به زبان انگلیسی دانلود کنید.
قیمت: 19,000 تومان
دانلود مقاله اصل انگلیسی + خلاصه دو صفحه ای مقاله + پادکست صوتی فارسی خلاصه مقاله
با انتخاب این گزینه، علاوه بر دریافت مقاله اصلی، یک خلاصه دو صفحهای فارسی و پادکست صوتی فارسی خلاصه مقاله را نیز دریافت خواهید کرد.
قیمت: 99,000 تومان
سفارش ترجمه فارسی مقاله + خلاصه دو صفحه ای مقاله + پادکست صوتی فارسی خلاصه مقاله
با انتخاب این گزینه، علاوه بر دریافت مقاله اصلی و ترجمه کامل آن، یک خلاصه دو صفحهای فارسی و پادکست صوتی فارسی خلاصه مقاله را نیز دریافت خواهید کرد.
قیمت: 720,000 تومان
زمان تحویل: 2 تا 3 روز کاری
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |
چکیده
We introduce a protein language model for determining the complete sequence of a peptide based on measurement of a limited set of amino acids. To date, protein sequencing relies on mass spectrometry, with some novel edman degregation based platforms able to sequence non-native peptides. Current protein sequencing techniques face limitations in accurately identifying all amino acids, hindering comprehensive proteome analysis. Our method simulates partial sequencing data by selectively masking amino acids that are experimentally difficult to identify in protein sequences from the UniRef database. This targeted masking mimics real-world sequencing limitations. We then modify and finetune a ProtBert derived transformer-based model, for a new downstream task predicting these masked residues, providing an approximation of the complete sequence. Evaluating on three bacterial Escherichia species, we achieve per-amino-acid accuracy up to 90.5% when only four amino acids ([KCYM]) are known. Structural assessment using AlphaFold and TM-score validates the biological relevance of our predictions. The model also demonstrates potential for evolutionary analysis through cross-species performance. This integration of simulated experimental constraints with computational predictions offers a promising avenue for enhancing protein sequence analysis, potentially accelerating advancements in proteomics and structural biology by providing a probabilistic reconstruction of the complete protein sequence from limited experimental data.
چکیده به فارسی (ترجمه ماشینی)
ما یک مدل زبان پروتئین را برای تعیین توالی کامل یک پپتید بر اساس اندازه گیری مجموعه محدودی از اسیدهای آمینه معرفی می کنیم.تا به امروز ، توالی پروتئین به طیف سنجی جرمی متکی است ، با برخی از سیستم عامل های مبتنی بر ادن جدید که قادر به توالی پپتیدهای غیر بومی هستند.تکنیک های توالی پروتئین فعلی در شناسایی دقیق تمام اسیدهای آمینه محدودیت هایی دارند و مانع تجزیه و تحلیل پروتئوم جامع می شوند.روش ما داده های توالی جزئی را با نقاب زدن اسیدهای آمینه انتخابی که از نظر تجربی در توالی پروتئین از پایگاه داده UNIREF دشوار است ، شبیه سازی می کند.این ماسک هدفمند محدودیت های توالی در دنیای واقعی را تقلید می کند.ما سپس یک مدل مبتنی بر ترانسفورماتور مشتق شده از پروتئین را برای یک کار جدید در پایین دست پیش بینی می کنیم که این باقیمانده های نقاب دار را پیش بینی می کنیم و تقریب توالی کامل را ارائه می دهیم.با ارزیابی در سه گونه اشرشیاکیا باکتریایی ، ما به دقت در هر اسید اسید تا 90.5 ٪ می رسیم که تنها چهار اسید آمینه ([KCYM]) شناخته شده اند.ارزیابی ساختاری با استفاده از Alphafold و TM-Score اهمیت بیولوژیکی پیش بینی های ما را تأیید می کند.این مدل همچنین پتانسیل تجزیه و تحلیل تکاملی را از طریق عملکرد گونه های متقابل نشان می دهد.این ادغام محدودیت های تجربی شبیه سازی شده با پیش بینی های محاسباتی ، یک خیابان امیدوار کننده برای تقویت تجزیه و تحلیل توالی پروتئین ، پیشرفت های بالقوه سرعت بخش در پروتئومیکس و زیست شناسی ساختاری را با ارائه بازسازی احتمالی توالی پروتئین کامل از داده های تجربی محدود ارائه می دهد.
| فرمت ارائه ترجمه مقاله | تحویل به صورت فایل ورد |
| زمان تحویل ترجمه مقاله | بین 2 تا 3 روز پس از ثبت سفارش |
| کیفیت ترجمه | بسیار بالا. مقاله فقط توسط مترجمین با مدرک دانشگاهی مترجمی ترجمه میشود. |
| جداول و فرمول ها | کلیه جداول و فرمول ها نیز در فایل تحویلی ورد درج میشوند. |



نقد و بررسیها
هنوز بررسیای ثبت نشده است.