تشخيص شخصيت نوری (OCR) چیست؟

تشخیص شخصیت نوری (OCR) به نرم افزاری اشاره دارد که یک نسخه دیجیتالی از یک سند چاپی، تایپ شده یا دست نوشته ای ایجاد می کند که کامپیوترها بدون نیاز به تایپ یا وارد کردن متن دستی می توانند بخوانند. OCR به طور کلی در اسناد اسکن شده در قالب PDF استفاده می شود، اما همچنین می تواند نسخه قابل خواندن کامپوننت متن را در یک فایل تصویر ایجاد کند.

OCR چیست؟

OCR، همچنین به عنوان شناخت متن شناخته می شود، فناوری نرمافزار است که شخصیت هایی مانند اعداد، حروف و نشانه گذاری (همچنین گلیف ها) را از اسناد چاپ شده یا کتبی به شکل الکترونیکی تبدیل می کند که به راحتی قابل تشخیص و خواندن توسط رایانه ها و سایر برنامه های نرم افزاری می باشد. بعضی از برنامه های OCR این کار را به عنوان یک سند انجام می دهند و با دوربین دیجیتال اسکن می شوند و دیگران می توانند این پروسه را برای اسنادی که قبلا بدون OCR اسکن شده یا عکس گرفته اند اعمال کنند. OCR به کاربران اجازه می دهد تا در اسناد PDF جستجو، ویرایش متن و دوباره فرمت اسناد.

OCR مورد استفاده برای چیست؟

برای سریع، هر روز اسکن نیاز، OCR ممکن است یک معامله بزرگ باشد. اگر مقدار زیادی از اسکن را انجام دهید، قادر به جستجو در PDF ها برای پیدا کردن دقیق مورد نیاز شما می توانید زمان بسیار کمی را ذخیره کنید و قابلیت های OCR در برنامه اسکنر شما مهم تر است. در اینجا برخی از چیزهای دیگر OCR کمک می کند تا با:

چرا استفاده از OCR؟

چرا نه فقط یک عکس بگیرید، درست است؟ از آنجا که شما نمیتوانید چیزی را ویرایش کنید یا متن را جستجو کنید زیرا فقط یک تصویر است. اسکن سند و اجرای نرم افزار OCR می تواند این فایل را به چیزی که می توانید ویرایش کنید و قادر به جستجو باشد.

تاریخچه OCR

در حالی که اولین کاربرد استفاده از شناخت متن تا سال 1914، گسترش گسترده و استفاده از فن آوری های مرتبط با OCR در دهه 1950 به طور جدی آغاز شد، به ویژه با ایجاد فونت بسیار ساده که تبدیل به متن دیجیتال قابل خواندن آسان تر بود. اولین از این فونت های ساده شده توسط دیوید شپارد ساخته شده و معمولا به عنوان OCR-7B شناخته می شود. OCR-7B امروز در صنعت مالی برای استفاده از فونت استاندارد مورد استفاده در کارت های اعتباری و کارت های اعتباری استفاده می شود. در دهه 1960، خدمات پستی در چندین کشور از تکنولوژی OCR برای سرعت بخشیدن به مرتب سازی ایمیل، از جمله ایالات متحده، بریتانیا، کانادا و آلمان استفاده کردند. OCR هنوز فن آوری هسته ای است که برای مرتب سازی ایمیل برای خدمات پستی در سراسر جهان استفاده می شود. در سال 2000، دانش کلیدی از محدودیت ها و توانایی های تکنولوژی OCR برای توسعه برنامه های CAPTCHA مورد استفاده برای متوقف کردن ربات ها و اسپم ها مورد استفاده قرار گرفت.

در طول دهه، OCR با توجه به پیشرفت هایی در زمینه های فناوری مرتبط مانند هوش مصنوعی ، یادگیری ماشین و دید رایانه، دقیق تر و پیچیده تر شده است. امروزه نرم افزار OCR از تشخیص الگو، شناسایی ویژگی ها و استخراج متن برای تبدیل اسناد سریع تر و دقیق تر از همیشه استفاده می کند.