مشاهده خبر بازگشت به لیست اخبار

تشخیص کاراکتر نوری (OCR)

نوشته شده توسط: فروزان
در تاریخ:

آیا تا به حال برای خواندن دستخط دوستتان به تقلا افتاده اید؟ فکر می کنید خیلی خوش شانسید که در سرویس پست امارات متحده کار نکرده اید، که باید در حدود ۳۰ ملیون پاکت دست نویس را رمزگشایی و ارائه کنند، آن هم فقط در یک روز. هدف اصلی OCR این است که یک مستند که چاپ شده است یا متنی که تبدیل به تصویر یا عکس شده است را از درون آن بیرون کشیده و تبدیل به کاراکترهای متنی کند. همانطور که می دانید اگر شما یک متن را تبدیل به عکس کنید دیگر چیزی به نام کاراکتر وجود نخواهد داشت و همه آنها تبدیل به پیکسل های عکس می شوند و دیگر قابل ویرایش نخواهند بود. در OCR نرم افزار مربوطه تلاش می کند که از داخل این عکس پرینت شده یا تصویر موجود در کامپیوتر، کاراکترهای متنی را شناسایی کند و این کاراکترها را در کنار هم قرار داده و تبدیل به متن قابل ویرایش در انواع نرم افزارهای پردازش کلمات کند ، در چنین حالتی معمولا کل مستند اولیه یا همان عکس تبدیل به یک ساختار جدید می شود. اما دقت کنید که با توجه به اینکه ساختار کاری OCR بر اساس الگوریتم ها و الگوهایی است که از قبل برای شناسایی کاراکترها در عکس ها طراحی شده است و با توجه به اینکه در زبان های مختلف ساختار کلمات و حروف و در کنار هم قراردادن آنها و حتی فونت های مختلف باعث می شوند که ساختار OCR یک ساختار کاملا و 100 درصد دقیق نداشته باشد و در نهایت خروجی فایل متنی به احتمال زیاد نیاز به ویرایش و بازنگری خواهد داشت اما به هر حال OCR باعث می شود که نیاز شما به ایجاد کردن مجدد کل مستند کاهش پیدا کند. با توجه به اینکه زندگی خیلی از ماها کامپیوتری شده است، مهمترین موضوع این است که انسان ها و ماشین ها بتوانند همدیگر را بفهمند و اطلاعات را به راحتی به یکدیگر انتقال دهند. بیشتر کامپیوتر ها به همراه خود یکسری دستگاه برا تعامل با انسان دارند مانند کیبورد موس و یا مانیتورها، زمانی که می خواهند یک نوع اطلاعات انسانی پردازش کنند همانند یک کتاب قدیمی از مد افتاده یا یک برگ نوشته با قلم خودنویس، آنگاه کار کامپیوتر ها خیلی سخت می شود. که در اینجا تکنولوژی OCR که مخفف optical character recognition و به معنی تشخیص کاراکتر نوری می باشد وارد عمل می شود. این تکنولوژی یک نوع از برنامه است که می تواند به صورت خودکار یک متن چاپی را تحلیل کند و آنرا به فرمی در آورد که کامپیوتر ها بتوانند آنرا به راحتی تحلیل کنند.

واژه OCR ابتدا تنها در مورد بازشناسی ارقام و حروف چاپی بکار گرفته می‌شد. پسوند نوری در این عبارت در مقابل عبارت مرکب مغناطیسی قرار داده شد تا این روش را از روش قدیمی‌تر بازشناسی نویسه‌ها با مرکب مغناطیسی ،MICR، متمایز کند. با گذشت زمان و پیشرفت قابل توجه در این زمینه، روش‌های بازشناسی دست نوشته و متون چاپی مطرح شدند که دامنه کار را به کلمات و عبارات رساندند. با وجود عدم تطبیق دقیق OCR با این موارد، این نام برای این روش‌ها و تا حدی برای بازشناسی دست‌نوشته‌های برخط هم استفاده شد و رواج پیدا کرد. هم‌اکنون OCR را بیشتر برای بازشناسی مستندات چاپی مثل صفحات کتاب‌ها، مجله‌ها و نامه‌های چاپی به کار می‌برند.

سامانه نویسه‌خوان مثل یک نفر ماشین‌نویس، متن سند را می‌خواند و آن را به قالب مناسب برای ذخیره در رایانه تبدیل می‌کند. معمولاً یک فرد، تصویر سند را برای OCR فراهم می‌کند. سامانه نویسه‌خوان، اشیاء موجود در تصویر سند را که ارقام، حروف، علائم و کلمات هستند، بازشناسی کرده و رشته‌ی متناظر با آن‌ها را در قالب مناسب ذخیره می‌کند. یک فایل تصویری، حجم زیادی دارد و جستجوی متنی در آن ممکن نیست. این در حالی است که فایل خروجی سامانه نویسه‌خوان بسیار کم حجم و قابل جستجو است.

سامانه‌های نویسه‌خوان مثل بسیاری از سامانه‌های هوشمند دیگر، پیچیدگی زیادی دارد. پردازش تصویر و بازشناسی الگو دو پایه اصلی این سامانه‌ها هستند. پیچیدگی این سامانه‌ها برای زبانهای گوناگون، متفاوت است. به عنوان مثال نوشتن OCR برای زبانهای لاتین به دلیل اینکه حروف آنها به طور مجزا نوشته می‌شود آسانتر است از زبانهایی مثل فارسی و عربی که حروف یک کلمه به یکدیگر می‌چسبند. این موضوع به علاوه جمعیت کم کاربران زبان فارسی، سبب شده سامانه‌های نویسه‌خوان قدرتمندی برای زبان فارسی نداشته باشیم. البته در سالهای اخیر تلاشهای قابل تقدیری از سوی برخی شرکتهای فعال در زمینه پردازش تصویر انجام شده که برخی از آنها منجر به محصولات قابل قبولی شده است.

OCR در قلب هر برنامه ای که مربوط به تحلیل دست خط می باشد جا دارد، از تلفن گرفته تا ماشین های غول پیکر مرتب سازی نامه که اطمینان حاصل میکنند که تمام آن چند میلیون نامه به مقصد درستی فرستاده می شوند. حال این ماشین ها چگونه کار میکنند؟

OCR چیست؟

زمانیکه شما این متن را از روی صفحه کامپیوترتان می خوانید چشم و مغز شما به طور ناخودآگاه و همزمان در حال تشخیص کاراکتر های نوری هستند. چشمان شما در حال تشخیص الگو هایی که به صورت تاریکی و روشنی قسمت های مختلف صفحه می باشد و یک کاراکتر را تشکیل می دهند هستند.

کامپیوتر ها میتوانند این کار را انجام دهند اما این کار برای آنها خیلی سخت می باشد. مشکل اول این است که کامپیوتر ها چشم ندارند به همین دلیل اگر آنها چیزی بخواهند بخوانند مانند یک صفحه از یک کتاب قدیمی ، شما باید یک فایل عکس از آن صفحه برایشان آماده کنید که این فایل میتواند با اسکنر یا با دوربین عکاسی گرفته شود و معمولا به فرمت JPG در می آید.

مزیت های استفاده از OCR چیست؟

زمانی که شما تعداد زیادی صفحه قابل خواندن برای ماشین دارید به راحتی می توانید میان آن متن ها سرچ کنید یا متن ها را ویرایش کنید و در صفحات وب قرار دهید یا حتی می توان آن متن ها را با حجم کمتر در کامپیوتر آرشیو کرد. البته استفاده از OCR تنها براي تبديل تصوير متون تايپ شده به متن تايپي نيست. بلكه هر جا شما عكسي داسته باشيد كه در قسمتي از آن حرف يا شماره اي وجود داشته باشد، نرم افزار OCR آن را تشخيص مي دهد. به عنوان مثال می توان از آن در دوربين هاي هوشمند سرعت سنج جاده ها استفاده کرد. دوربین سرعت سنج؛ به صورت مستمر؛ سرعت خودرو ها را اندازه گیری می کند و بعد از شناسائي خودروی متخلف، از پلاك خودرو عكس مي گيرد و حالا با استفاده از همين نرم افزار OCR و بدون دخالت انسان می توان شماره پلاك ماشين را شناسايي كرده و در سیستم ذخیره نمود و یا آن را به مركز پليس اطلاع داد. 

چگونه کار میکند؟

اگر ما فقط یک فونت و دستخط داشتیم کار بسیار ساده بود اما حالا که مثلا کلمه A به چندین روش مختلف نوشته می شود کار سخت می شود، چون هر شخص یا هر فونتی ویژگی های مخصوص به خود دارند. ولی در حالت کلی مرحله اول اسکن کردن تصاویر و تبدیل آنها به فایل تصویری می باشد. بعد در مرحله بعد برنامه با الگوریتم های مشخص سعی به جدا کردن کاراکتر ها می کند در این مرحله یک جمله به آرایه ای از کاراکتر های تشکیل دهنده تقسیم می شود حال این کاراکتر ها به وسیله ی الگوریتم های شبکه عصبی و دیگر الگوریتم های پیشتاز به شبیه ترین کاراکتر نگاشت می شوند و در مرحله آخر نتیجه های مرحله قبل به یک رشته متنی تبدیل می شود و پایان کار.

 


منبع: Optical character recognition (OCR)
برچسب ها: -

هیچ دیدگاهی تاکنون برای این خبر ثبت نشده است.

اولین نفر باشید!
دیدگاه خود را ثبت کنید: