📚 مقاله علمی

عنوان فارسی مقاله	حذف نویز و بخش‌بندی حروف در تصاویر کتیبه‌های باستانی
نویسندگان	P Preethi, Hrishikesh Viswanath
دسته‌بندی علمی	Computer Vision and Pattern Recognition,Machine Learning,Image and Video Processing

📘 محتوای این مقاله آموزشی

شامل فایل اصلی مقاله (PDF انگلیسی)
به همراه فایل PDF توضیح فارسی با بیان ساده و روان
دارای پادکست صوتی فارسی توضیح کامل مقاله
به همراه ویدیو آموزشی فارسی برای درک عمیق‌تر مفاهیم مقاله

🎯 همه‌ی فایل‌ها با هدف درک آسان و سریع مفاهیم علمی این مقاله تهیه شده‌اند.

چنانچه در دانلود فایل‌ها با مشکلی مواجه شدید، لطفاً از طریق واتس‌اپ با شماره 09395106248 یا از طریق آیدی تلگرام @ma_limbs پیام دهید تا لینک‌ها فوراً برایتان مجدداً ارسال شوند.

حذف نویز و بخش‌بندی حروف در تصاویر کتیبه‌های باستانی: رویکردی نوین با استفاده از ویژگی‌های هارالیک و شبکه‌های عصبی

Name: مقاله حذف نویز و بخشبندی حروف در تصاویر کتیبههای باستانی به همراه PDF فارسی + پادکست صوتی فارسی + ویدیو آموزشی فارسی
SKU: PAPER-2107.11801
Price: 150000 IRT
Availability: InStock

مقدمه و اهمیت تحقیق

در دنیای امروز، داده‌های بصری نقش حیاتی در انتقال اطلاعات ایفا می‌کنند. از میان انواع مختلف داده‌های بصری، تصاویر کتیبه‌های باستانی جایگاه ویژه‌ای دارند. این کتیبه‌ها، گنجینه‌هایی از دانش و تاریخ بشری هستند که حاوی اطلاعات ارزشمندی در مورد فرهنگ، زبان و تمدن‌های گذشته می‌باشند. با این حال، بازیابی این اطلاعات با چالش‌های متعددی روبروست. یکی از مهم‌ترین این چالش‌ها، وجود نویز و کیفیت پایین تصاویر کتیبه‌ها است. علاوه بر این، بخش‌بندی دقیق حروف و کاراکترها برای پردازش‌های بعدی نظیر شناسایی متن و ترجمه، امری ضروری به شمار می‌رود.

این مقاله به بررسی یک روش نوین برای حذف نویز و بخش‌بندی حروف در تصاویر کتیبه‌های باستانی می‌پردازد. این روش، با بهره‌گیری از ویژگی‌های آماری بافت هارالیک و شبکه‌های عصبی مصنوعی (ANN)، سعی در بهبود دقت و کارایی فرآیند پردازش تصاویر کتیبه‌ها دارد. اهمیت این تحقیق از آن جهت است که می‌تواند به بهبود دسترسی به اطلاعات تاریخی، تسهیل فرآیند مطالعات باستان‌شناسی، و حفظ میراث فرهنگی کمک شایانی نماید.

نویسندگان و زمینه تحقیق

مقاله حاضر توسط P Preethi و Hrishikesh Viswanath به رشته تحریر درآمده است. این پژوهش در حوزه‌ی بینایی ماشین و تشخیص الگو انجام شده است که خود زیرشاخه‌ای از هوش مصنوعی (AI) است. نویسندگان با بهره‌گیری از دانش خود در زمینه پردازش تصویر و یادگیری ماشین، به طراحی و پیاده‌سازی این روش پرداخته‌اند. زمینه تحقیقاتی این مقاله، تقاطع علوم کامپیوتر، باستان‌شناسی و زبان‌شناسی را شامل می‌شود و به دنبال ارائه راه‌حل‌هایی برای استخراج اطلاعات از منابع تاریخی تصویری است.

شناخت دقیق این زمینه تحقیقاتی به ما کمک می‌کند تا درک بهتری از نوآوری‌های ارائه شده در این مقاله داشته باشیم. به عنوان مثال، درک مفاهیم کلیدی مانند ویژگی‌های هارالیک، ماتریس هم‌رخدادی سطوح خاکستری (GLCM)، و شبکه‌های عصبی، برای فهم عمیق‌تر رویکرد پیشنهادی ضروری است.

چکیده و خلاصه محتوا

این مقاله یک روش جدید برای کاهش نویز در تصاویر با استفاده از ویژگی‌های هارالیک و بخش‌بندی کاراکترها با استفاده از شبکه‌های عصبی مصنوعی را معرفی می‌کند. در این روش، تصویر به بخش‌های کوچکی (kernels) تقسیم می‌شود. هر بخش به یک ماتریس هم‌رخدادی سطوح خاکستری (GLCM) تبدیل می‌شود و سپس یک تابع تولید ویژگی‌های هارالیک بر روی آن اعمال می‌شود. این تابع، آرایه‌ای با ۱۴ عنصر (متناظر با ۱۴ ویژگی هارالیک) را تولید می‌کند.

نتایج حاصل از این فرآیند، همراه با برچسب‌های نویز/متن، یک دیکشنری را تشکیل می‌دهند. این دیکشنری برای حذف نویز از تصویر با مقایسه بخش‌های مختلف تصویر با عناصر موجود در دیکشنری، استفاده می‌شود. بخش‌بندی، فرآیند استخراج کاراکترها از یک سند است و زمانی مفید است که حروف با فاصله‌های سفید از هم جدا شده باشند. این فرآیند، اولین گام در بسیاری از مسائل پردازش زبان طبیعی است. این مقاله، فرآیند بخش‌بندی را با استفاده از شبکه‌های عصبی بررسی می‌کند. با وجود روش‌های متعددی برای بخش‌بندی کاراکترها، این مقاله تنها بر دقت بخش‌بندی با استفاده از شبکه‌های عصبی تمرکز دارد. بخش‌بندی صحیح کاراکترها ضروری است، زیرا در صورت نادرست بودن، منجر به شناسایی اشتباه توسط ابزارهای پردازش زبان طبیعی می‌شود. شبکه‌های عصبی مصنوعی برای دستیابی به دقت تا ۸۹٪ استفاده شده‌اند. این روش برای زبان‌هایی که کاراکترها با فاصله‌های سفید از هم جدا شده‌اند، مناسب است. با این حال، این روش در زبان‌هایی که از حروف پیوسته به طور گسترده استفاده می‌کنند، نتیجه قابل قبولی نخواهد داشت. به عنوان مثال، خط دواناگری که عمدتاً در شمال هند استفاده می‌شود.

روش‌شناسی تحقیق

روش‌شناسی این تحقیق بر پایه دو مرحله اصلی استوار است: کاهش نویز و بخش‌بندی کاراکترها.

کاهش نویز

در مرحله کاهش نویز، ابتدا تصویر ورودی به قطعات کوچکی به نام kernels تقسیم می‌شود. هر kernel به یک ماتریس هم‌رخدادی سطوح خاکستری (GLCM) تبدیل می‌شود. GLCM، یک ماتریس آماری است که اطلاعاتی در مورد توزیع سطوح خاکستری و روابط فضایی بین پیکسل‌ها در یک تصویر ارائه می‌دهد. سپس، ۱۴ ویژگی هارالیک از هر GLCM استخراج می‌شود. ویژگی‌های هارالیک، مجموعه‌ای از ویژگی‌های آماری هستند که اطلاعاتی در مورد بافت تصویر ارائه می‌دهند. این ویژگی‌ها شامل مواردی نظیر انرژی، کنتراست، همگنی، همبستگی و غیره هستند.

در مرحله بعد، یک دیکشنری از داده‌ها ایجاد می‌شود. این دیکشنری شامل مقادیر ویژگی‌های هارالیک و برچسب‌های متناظر با آن‌ها (نویز یا متن) است. برای ایجاد این دیکشنری، از یک مجموعه داده آموزشی استفاده می‌شود. این مجموعه داده آموزشی شامل تصاویری است که به صورت دستی برچسب‌گذاری شده‌اند (یعنی نواحی نویز و متن در آن‌ها مشخص شده‌اند). با استفاده از این دیکشنری، فرآیند حذف نویز انجام می‌شود. برای هر kernel در تصویر، ویژگی‌های هارالیک محاسبه می‌شود و با مقادیر موجود در دیکشنری مقایسه می‌شود. kernel به عنوان نویز یا متن شناسایی می‌شود و بر اساس آن، فرآیند حذف نویز انجام می‌شود.

بخش‌بندی کاراکترها

در مرحله بخش‌بندی کاراکترها، از شبکه‌های عصبی مصنوعی (ANN) استفاده می‌شود. ANNها، مدل‌های محاسباتی هستند که از ساختار مغز انسان الهام گرفته شده‌اند. این شبکه‌ها قادر به یادگیری الگوهای پیچیده از داده‌ها هستند. برای آموزش ANN، از یک مجموعه داده آموزشی استفاده می‌شود. این مجموعه داده آموزشی شامل تصاویری از کاراکترها است که به صورت دستی بخش‌بندی شده‌اند. شبکه‌های عصبی با استفاده از این داده‌های آموزشی، یاد می‌گیرند که چگونه کاراکترها را از یکدیگر جدا کنند.

پس از آموزش ANN، می‌توان از آن برای بخش‌بندی کاراکترها در تصاویر جدید استفاده کرد. ANN، ویژگی‌های استخراج شده از تصویر را دریافت می‌کند و سپس با توجه به الگوهای آموخته شده در طول آموزش، محل قرارگیری مرزهای بین کاراکترها را مشخص می‌کند. این روش به ویژه برای زبان‌هایی که کاراکترها با فاصله‌های سفید از هم جدا شده‌اند (مانند لاتین یا سیریلیک) مناسب است. با این حال، در زبان‌هایی که کاراکترها به هم متصل هستند (مانند زبان‌های هندی) عملکرد این روش کاهش می‌یابد.

یافته‌های کلیدی

نتایج این تحقیق نشان می‌دهد که این روش قادر به کاهش موثر نویز در تصاویر کتیبه‌ها است. استفاده از ویژگی‌های هارالیک و دیکشنری مبتنی بر آن‌ها، به شناسایی و حذف نواحی نویزی کمک شایانی می‌کند. همچنین، استفاده از شبکه‌های عصبی مصنوعی برای بخش‌بندی کاراکترها، دقت قابل قبولی (تا ۸۹٪) را در این فرآیند به ارمغان می‌آورد.

از دیگر یافته‌های کلیدی می‌توان به موارد زیر اشاره کرد:

اثربخشی روش در زبان‌هایی با حروف جدا از هم: این روش برای زبان‌هایی که کاراکترها با فاصله‌های سفید از هم جدا شده‌اند، عملکرد خوبی دارد.
محدودیت‌ها در زبان‌های متصل‌الاحرف: عملکرد این روش در زبان‌هایی که حروف به یکدیگر متصل هستند، به دلیل پیچیدگی بیشتر در بخش‌بندی، با محدودیت‌هایی مواجه می‌شود.
اهمیت دقت در بخش‌بندی: دقت در بخش‌بندی کاراکترها، تاثیر مستقیمی بر دقت شناسایی متن و ترجمه دارد.

کاربردها و دستاوردها

این تحقیق، کاربردهای گسترده‌ای در زمینه‌های مختلف دارد. برخی از مهم‌ترین کاربردهای این روش عبارتند از:

مطالعات باستان‌شناسی: تسهیل فرآیند خواندن و تحلیل کتیبه‌ها، کمک به کشف اطلاعات جدید تاریخی و فرهنگی.
حفظ میراث فرهنگی: دیجیتالی کردن و بازیابی اطلاعات از کتیبه‌های باستانی، حفاظت از این گنجینه‌های ارزشمند.
پردازش زبان طبیعی: بهبود دقت و کارایی سیستم‌های تشخیص متن (OCR) و ترجمه ماشینی برای متون باستانی.
علوم کامپیوتر: توسعه الگوریتم‌های پردازش تصویر و یادگیری ماشین برای کاربردهای مشابه در سایر حوزه‌ها (مانند پزشکی، صنعت، و غیره).

از جمله دستاوردهای این تحقیق می‌توان به موارد زیر اشاره کرد:

ارائه یک روش نوین برای پردازش تصاویر کتیبه‌های باستانی.
بهبود دقت و کارایی فرآیند حذف نویز و بخش‌بندی کاراکترها.
ایجاد یک چارچوب برای تحقیقات بیشتر در این زمینه.
کمک به حفظ و بازیابی اطلاعات از میراث فرهنگی بشری.

نتیجه‌گیری

این مقاله، یک روش موثر برای حذف نویز و بخش‌بندی حروف در تصاویر کتیبه‌های باستانی را معرفی کرد. استفاده از ویژگی‌های هارالیک و شبکه‌های عصبی مصنوعی، نتایج قابل قبولی را در این فرآیند به همراه داشت. این روش به ویژه برای زبان‌هایی که کاراکترها با فاصله‌های سفید از هم جدا شده‌اند، مناسب است. با وجود محدودیت‌هایی در زبان‌های متصل‌الاحرف، این تحقیق گامی مهم در جهت بهبود فرآیند پردازش تصاویر کتیبه‌ها و دسترسی به اطلاعات تاریخی برداشت.

در نهایت، این تحقیق نشان می‌دهد که ترکیب تکنیک‌های پردازش تصویر و یادگیری ماشین، می‌تواند ابزارهای قدرتمندی را برای مطالعه و حفظ میراث فرهنگی فراهم کند. تحقیقات آتی می‌توانند بر روی بهبود دقت و کارایی این روش، به ویژه برای زبان‌های متصل‌الاحرف، و همچنین توسعه آن برای کاربردهای بیشتر در سایر حوزه‌های پردازش تصویر، متمرکز شوند.

نقد و بررسی‌ها

هنوز بررسی‌ای ثبت نشده است.

اولین کسی باشید که دیدگاهی می نویسد “مقاله حذف نویز و بخش‌بندی حروف در تصاویر کتیبه‌های باستانی به همراه PDF فارسی + پادکست صوتی فارسی + ویدیو آموزشی فارسی”

مقاله حذف نویز و بخش‌بندی حروف در تصاویر کتیبه‌های باستانی به همراه PDF فارسی + پادکست صوتی فارسی + ویدیو آموزشی فارسی