အွန်လိုင်း PDF ဖိုင်တွင်စာသားကိုအသိအမှတ်ပြုပါ

Pin
Send
Share
Send


ပုံမှန်ကူးယူခြင်းဖြင့် PDF ဖိုင်မှစာသားကိုထုတ်ယူရန်အမြဲတမ်းမဖြစ်နိုင်ပါ။ မကြာခဏထိုကဲ့သို့သောစာရွက်စာတမ်းများ၏စာမျက်နှာများကိုသူတို့စက္ကူဗားရှင်းရဲ့ contents တွေကို scan ဖတ်နေကြသည်။ ထိုကဲ့သို့သောဖိုင်များကိုအပြည့်အ ၀ တည်းဖြတ်နိုင်သောစာသားဒေတာများအဖြစ်ပြောင်းလဲရန် Optical Character Recognition (OCR) လုပ်ဆောင်သောအထူးအစီအစဉ်များကိုအသုံးပြုသည်။

ထိုကဲ့သို့သောဆုံးဖြတ်ချက်များကိုအကောင်အထည်ဖော်ရန်အလွန်ခက်ခဲပြီးငွေများစွာကုန်ကျသည်။ PDF မှစာသားများကိုပုံမှန်အသိအမှတ်ပြုရန်လိုအပ်ပါကသင့်လျော်သောပရိုဂရမ်တစ်ခုကို ၀ ယ်ယူရန်အကြံပြုလိုပါသည်။ ရှားပါးသောကိစ္စရပ်များအတွက်အလားတူလုပ်ငန်းဆောင်တာများရှိသောရရှိနိုင်သည့်အွန်လိုင်းဝန်ဆောင်မှုများကိုအသုံးပြုခြင်းသည် ပို၍ ယုတ္တိရှိသည်။

အွန်လိုင်းမှ PDF မှစာသားများကိုမည်သို့ခွဲခြားသိနိုင်သနည်း

ဟုတ်ပါတယ်၊ OCR အွန်လိုင်း ၀ န်ဆောင်မှုအင်္ဂါရပ်များ၊ ပြည့်စုံသော desktop ဖြေရှင်းနည်းများနှင့်နှိုင်းယှဉ်လျှင် ပို၍ ကန့်သတ်ချက်ရှိသည် သို့သော်၎င်းအရင်းအမြစ်များကိုသင်အခမဲ့ဖြစ်စေ၊ အခကြေးငွေဖြင့်ဖြစ်စေအလုပ်လုပ်နိုင်သည်။ အဓိကအချက်ကတော့သူတို့ရဲ့အဓိကတာ ၀ န်ဖြစ်တဲ့စာသားအသိအမှတ်ပြုခြင်းနှင့်သက်ဆိုင်တဲ့ web applications များသည်လည်းအတူတူပင်။

နည်းလမ်း ၁ - ABBYY FineReader အွန်လိုင်း

၀ န်ဆောင်မှုဖွံ့ဖြိုးတိုးတက်မှုကုမ္ပဏီသည် optical document အသိအမှတ်ပြုမှုနယ်ပယ်တွင်ခေါင်းဆောင်တစ် ဦး ဖြစ်သည်။ ABBYY Windows နှင့် Mac အတွက် FineReader သည် PDF ကိုစာသားအဖြစ်ပြောင်းလဲရန်နှင့်၎င်းနှင့်ဆက်လက်အလုပ်လုပ်ရန်အတွက်အစွမ်းထက်သောဖြေရှင်းချက်ဖြစ်သည်။

ပရိုဂရမ်၏ web-based analogue, သင်တန်း, ကလုပ်ဆောင်နိုင်စွမ်းအတွက်ကယုတ်ညံ့သည်။ မည်သို့ပင်ဆိုစေကာမူ ၀ န်ဆောင်မှုသည်စကင်ဖတ်စစ်ဆေးမှုနှင့်ဓာတ်ပုံများမှစာသားများကိုဘာသာစကားပေါင်း ၁၉၀ ကျော်ဖြင့်အသိအမှတ်ပြုနိုင်သည်။ PDF ဖိုင်များကို Word, Excel စသဖြင့်ပြောင်းလဲနိုင်သည်။

ABBYY FineReader အွန်လိုင်းအွန်လိုင်းဝန်ဆောင်မှု

  1. ဤကိရိယာနှင့်သင်စတင်အလုပ်လုပ်ခြင်းမပြုမီ၊ ဆိုက်တွင်အကောင့်တစ်ခုဖွင့်ပါ၊ သင်၏ Facebook, Google သို့မဟုတ် Microsoft အကောင့်ကို သုံး၍ လော့ဂ်အင်လုပ်ပါ။

    ခွင့်ပြုချက် ၀ င်းဒိုးကိုသွားရန်ခလုတ်ကိုနှိပ်ပါ "ဝင်ပေါက်" ထိပ်မီနူးဘား၌တည်၏။
  2. logged in ဝင်ပြီးပါကသင်အလိုရှိသော PDF-document ကို FineReader ထဲသို့ခလုတ်ကိုသုံးပါ ဖိုင်များကိုတင်ပါ.

    ထို့နောက်ကိုနှိပ်ပါ "စာမျက်နှာနံပါတ်များကိုရွေးပါ" နှင့်စာသားအသိအမှတ်ပြုမှုများအတွက်လိုချင်သောကြားကာလသတ်မှတ်။
  3. ထို့နောက်စာရွက်စာတမ်းရှိဘာသာစကားများ၊ ရလဒ်ဖိုင်၏ပုံစံကိုရွေးပြီးခလုတ်ကိုနှိပ်ပါ “ အသိအမှတ်ပြု”.
  4. ပြုပြင်ပြီးနောက်၊ ကြာချိန်သည်စာရွက်စာတမ်း၏ပမာဏအပေါ်လုံးလုံးမူတည်သည်။ သင်ပြီးဆုံးသွားသောဖိုင်ကိုစာသားဒေတာနှင့်တကွ၎င်း၏အမည်ပေါ်တွင်နှိပ်ခြင်းဖြင့်ဒေါင်းလုပ်ဆွဲနိုင်သည်။

    သို့သော်၎င်းကိုရရှိနိုင်သည့် cloud service များသို့တင်ပို့ပါ။

ဤ ၀ န်ဆောင်မှုကိုပုံများနှင့် PDF ဖိုင်များပေါ်တွင်တိကျသောစာသားအသိအမှတ်ပြုမှုဆိုင်ရာ algorithms များဖြင့်ခွဲခြားနိုင်သည်။ သို့သော်ကံမကောင်းအကြောင်းမလှစွာဖြင့်၎င်းကိုတစ်လလျှင်စာမျက်နှာ ၅ မျက်နှာသာအခမဲ့အသုံးပြုသည်။ ပိုများပြားသောစာရွက်စာတမ်းများနှင့်အလုပ်လုပ်ရန်နှစ်စဉ်ကြေးပေးသွင်းရပါမည်။

သို့သော် OCR မရှိသလောက်ဖြစ်ပါက ABBYY FineReader Online သည် PDF ဖိုင်ငယ်များမှစာသားများကိုထုတ်ယူရန်အကောင်းဆုံးနည်းလမ်းဖြစ်သည်။

နည်းလမ်း 2: အခမဲ့အွန်လိုင်း OCR

ဒီဂျစ်တယ်စာသားအတွက်ရိုးရှင်းပြီးအဆင်ပြေသောဝန်ဆောင်မှု။ မှတ်ပုံတင်ခြင်းမရှိပဲရင်းမြစ်ကတစ်နာရီကို PDF စာမျက်နှာ ၁၅ မျက်နှာကိုအသိအမှတ်ပြုသည်။ အခမဲ့ Online OCR သည်စာရွက်စာတမ်းများကိုဘာသာစကား ၄၆ ဘာသာဖြင့်အပြည့်အဝအလုပ်လုပ်ပြီးခွင့်ပြုချက်မရှိဘဲစာသားတင်ပို့မှုပုံစံသုံးမျိုးဖြစ်သော DOCX, XLSX နှင့် TXT ကိုအထောက်အပံ့ပေးသည်။

မှတ်ပုံတင်သည့်အခါအသုံးပြုသူသည်စာမျက်နှာများစွာရှိသောစာရွက်စာတမ်းများကိုလုပ်ဆောင်ရန်အခွင့်အလမ်းရရှိသည်၊ သို့သော်ထိုစာမျက်နှာများ၏အခမဲ့နံပါတ်သည်ယူနစ် ၅၀ သာရှိသည်။

အခမဲ့အွန်လိုင်း OCR အွန်လိုင်းဝန်ဆောင်မှု

  1. PDF မှစာသားကို“ guest ည့်သည်” အဖြစ်အသိအမှတ်ပြုရန်အရင်းအမြစ်အပေါ်ခွင့်ပြုချက်မရှိပဲဆိုက်၏ပင်မစာမျက်နှာရှိသင့်လျော်သောပုံစံကိုသုံးပါ။

    ခလုတ်ကို သုံး၍ သင်လိုချင်သောစာရွက်စာတမ်းကိုရွေးချယ်ပါ ဖိုင်စာသား၏အဓိကဘာသာစကား၊ ထွက်ရှိမည့်ပုံစံကိုသတ်မှတ်ပါ၊ ပြီးနောက်ဖိုင်ကိုဖွင့်ပြီးစောင့်ပါ ပြောင်းပါ.
  2. ဒီဂျစ်တယ်ပြောင်းခြင်းဖြစ်စဉ်အဆုံးမှာကိုနှိပ်ပါ "output ဖိုင်ကို download လုပ်ပါ" ပြီးပြီစာရွက်စာတမ်းနှင့်ကွန်ပျူတာပေါ်တွင်စာသားနှင့်အတူသိမ်းဆည်းရန်။

ခွင့်ပြုထားသောအသုံးပြုသူများအတွက်လုပ်ဆောင်မှုအစီအစဉ်သည်အနည်းငယ်ကွဲပြားသည်။

  1. ခလုတ်ကိုသုံးပါ "မှတ်ပုံတင်ခြင်း" ဒါမှမဟုတ် "ဝင်ပေါက်" ထိပ်ပိုင်း menu bar မှာ၊ အခမဲ့ Online OCR အကောင့်တခုဖွင့်ပါ၊ သို့ဝင်ပါ။
  2. အသိအမှတ်ပြုဘောင်ကွက်၌ခွင့်ပြုချက်ရယူပြီးလျှင်သော့ကိုဖိထားပါ CTRL, ထောက်ပံ့ပေးစာရင်းမှအရင်းအမြစ်စာရွက်စာတမ်း၏ဘာသာစကားနှစ်ခုအထိရွေးချယ်ပါ။
  3. PDF မှစာသားများဖြန့်ချိရန်အတွက်နောက်ထပ်ရွေးချယ်စရာများကို သတ်မှတ်၍ နှိပ်ပါ ဖိုင်ရွေးပါ ဝန်ဆောင်မှုသို့စာရွက်စာတမ်းတင်ရန်။

    ထို့နောက်အသိအမှတ်ပြုခြင်းစတင်ရန်ကိုနှိပ်ပါ ပြောင်းပါ.
  4. စာရွက်စာတမ်းအပြောင်းအလဲအဆုံးတွင်သက်ဆိုင်ရာကော်လံရှိ output ဖိုင်အမည်နှင့်လင့်ခ်ကိုနှိပ်ပါ။

    အသိအမှတ်ပြုရလဒ်ကိုသင်၏ကွန်ပျူတာမှတ်ဉာဏ်တွင်ချက်ချင်းသိမ်းဆည်းပေးလိမ့်မည်။

PDF စာရွက်စာတမ်းသေးသေးလေးမှစာသားကိုသင်ထုတ်ယူရန်လိုအပ်ပါကအထက်ဖော်ပြပါကိရိယာကို အသုံးပြု၍ လုံခြုံစွာအသုံးပြုနိုင်သည်။ voluminous files များနှင့်အလုပ်လုပ်ရန်သင်သည် Free Online OCR တွင်နောက်ထပ်စာလုံးများကိုဝယ်ယူရန်သို့မဟုတ်အခြားဖြေရှင်းချက်တစ်ခုကိုအသုံးပြုရန်လိုအပ်သည်။

နည်းလမ်း 3: NewOCR

DjVu နှင့် PDF ကဲ့သို့သောမည်သည့်ဂရပ်ဖစ်နှင့်အီလက်ထရောနစ်စာရွက်စာတမ်းများမှမဆိုစာသားကိုထုတ်ယူနိုင်သည့်လုံးဝအခမဲ့ဖြစ်သော OCR-service ကို။ အရင်းအမြစ်သည်အသိအမှတ်ပြုဖိုင်များ၏အရွယ်အစားနှင့်အရေအတွက်ကိုကန့်သတ်ထားသည်မဟုတ်ပါ။ မှတ်ပုံတင်စရာမလိုပါ။

NewOCR သည်ဘာသာစကား ၁၀၆ ခုကိုအထောက်အပံ့ပေးပြီးအရည်အသွေးနိမ့်သောစာရွက်စာတမ်းကိုပင်မှန်ကန်စွာစီမံနိုင်သည်။ ဖိုင်စာမျက်နှာပေါ်တွင်စာသားအသိအမှတ်ပြုခြင်းအတွက်theရိယာကိုကိုယ်တိုင်ရွေးချယ်နိုင်သည်။

NewOCR အွန်လိုင်းဝန်ဆောင်မှု

  1. ထို့ကြောင့်မလိုအပ်သောလုပ်ဆောင်မှုများပြုလုပ်စရာမလိုပဲအရင်းအမြစ်တစ်ခုနှင့်ချက်ချင်းအလုပ်လုပ်နိုင်သည်။

    ပင်မစာမျက်နှာ၏ညာဘက်စာမျက်နှာပေါ်တွင်စာရွက်စာတမ်းတင်သွင်းရန်ပုံစံတစ်ခုရှိသည်။ ဖိုင်တစ်ခုကို NewOCR သို့ upload လုပ်ရန် button ကိုအသုံးပြုပါ "ဖိုင်ရွေးရန်" အပိုင်း၌ "သင်၏ဖိုင်ကိုရွေးချယ်ပါ"။ ထိုအခါလယ်ပြင်၌ "အသိအမှတ်ပြုဘာသာစကား (များ)" မူရင်းစာရွက်စာတမ်း၏ဘာသာစကားတစ်မျိုးသို့မဟုတ်ထိုထက်မကကိုသတ်မှတ်ပြီးကိုနှိပ်ပါ "OCR တင်ပါ".
  2. သင်နှစ်သက်သောအသိအမှတ်ပြုမှုချိန်ညှိချက်များကိုသတ်မှတ်ပါ၊ သင်ထုတ်ယူလိုသောစာမျက်နှာကို ရွေးချယ်၍ ခလုတ်ကိုနှိပ်ပါ OCR.
  3. စာမျက်နှာကိုနည်းနည်းလှိမ့်ချပြီးခလုတ်ကိုရှာပါ "ဒေါင်းလုပ်".

    ၎င်းကို နှိပ်၍ ဒေါင်းလုပ်ဆွဲရန်လိုအပ်သည့်စာရွက်စာတမ်းပုံစံကိုရွေးချယ်ပါ။ ထို့နောက်သင်ဖြည်ထားသောစာသားပါသောဖိုင်ပြီးဆုံးသွားသောဖိုင်ကိုသင်၏ကွန်ပျူတာထဲသို့ကူးယူလိမ့်မည်။

ဒီကိရိယာကအဆင်ပြေပြီးအရည်အသွေးကောင်းတဲ့ဇာတ်ကောင်တွေအားလုံးကိုအသိအမှတ်ပြုထားတယ်။ သို့သော်၊ တင်သွင်းထားသော PDF စာရွက်စာတမ်းတစ်ခုစီ၏စာမျက်နှာတိုင်းကိုသီးခြားစီဖွင့ ်၍ သီးခြားဖိုင်ဖြင့်ပြသရမည်။ သင်, အသိအမှတ်ပြုမှုရလဒ်များကိုချက်ချင်းကူးယူနိုင်ပြီးအခြားသူများနှင့်ပေါင်းစပ်နိုင်သည်။

မည်သို့ပင်ဆိုစေကာမူအထက်တွင်ဖော်ပြခဲ့သောကွဲပြားခြားနားမှုများကြောင့် NewOCR ကို အသုံးပြု၍ စာသားအမြောက်အများကိုထုတ်ယူရန်အလွန်ခက်ခဲသည်။ ဖိုင်သေးသေးလေးများဖြင့် ၀ န်ဆောင်မှုသည်ပေါက်ကွဲသံကြီးတစ်ခုနှင့်ရင်ဆိုင်သည်

နည်းလမ်း 4: OCR.Space

ဒီဂျစ်တယ်စာသားအတွက်ရိုးရှင်း။ နားလည်လွယ်သည့်အရင်းအမြစ်တစ်ခုဖြစ်ပြီး၎င်းသည်သင့်အား PDF စာရွက်စာတမ်းများကိုအသိအမှတ်ပြုပြီးရလဒ်ကို TXT ဖိုင်သို့ထုတ်ပေးသည်။ စာမျက်နှာအရေအတွက်အပေါ်ကန့်သတ်ချက်များမရှိပါ။ တစ်ခုတည်းသောကန့်သတ်ချက်က input document ရဲ့အရွယ်အစားဟာ 5 megabytes ထက်မကျော်သင့်ဘူး။

OCR.Space အွန်လိုင်းဝန်ဆောင်မှု

  1. ဒီကိရိယာဖြင့်အလုပ်လုပ်ရန်မှတ်ပုံတင်ရန်မလိုအပ်ပါ။

    အပေါ်က link ကိုနှိပ်ပြီး PDF document ကိုကွန်ရက်စာမျက်နှာပေါ်သို့ button ကိုသုံးပြီး upload လုပ်ပါ "ဖိုင်ရွေးရန်" သို့မဟုတ်ကွန်ယက်မှ - ရည်ညွှန်းခြင်းဖြင့်။
  2. Drop down စာရင်းထဲမှာ "OCR ဘာသာစကားရွေးချယ်ပါ" တင်သွင်းစာရွက်စာတမ်း၏ဘာသာစကားကိုရွေးချယ်ပါ။

    ထိုအခါခလုတ်ကိုနှိပ်ခြင်းအားဖြင့်စာသားကိုအသိအမှတ်ပြုခြင်းလုပ်ငန်းစဉ်ကိုစတင်ပါ "OCR စတင်ပါ!".
  3. ဖိုင်အပြောင်းအလဲအပြီးတွင်ရလဒ်ကိုလယ်ပြင်၌ဖတ်ပါ ရလဒ် OCR'ed ကိုနှိပ်ပါ "ဒေါင်းလုပ်"အချော TXT စာရွက်စာတမ်းကို download လုပ်ပါရန်။

စာသားများကို PDF မှထုတ်ယူရန်လိုအပ်ပြီးတစ်ချိန်တည်းတွင်၎င်း၏နောက်ဆုံးပုံစံချခြင်းမှာအရေးမကြီးပါက OCR.Space သည်ရွေးချယ်မှုကောင်းတစ်ခုဖြစ်သည်။ တစ်ခုတည်းသောအရာမှာစာရွက်စာတမ်းသည်“ ဘာသာခြားတစ်မျိုးတည်း” ဖြစ်သင့်သည်၊ အဘယ်ကြောင့်ဆိုသော် ၀ န်ဆောင်မှုတွင်ဘာသာစကားနှစ်မျိုးသို့မဟုတ်ထို့ထက်မကကိုအသိအမှတ်ပြုခြင်းကြောင့်ဖြစ်သည်။

FineReader ၏အခမဲ့ analogues များကိုလည်းကြည့်ပါ

ဆောင်းပါးတွင်ဖော်ပြထားသောအွန်လိုင်းကိရိယာများကိုအကဲဖြတ်ရန်၊ ABBYY မှ FineReader Online သည် OCR လုပ်ဆောင်ချက်ကိုတိကျမှန်ကန်စွာနှင့်ထိရောက်စွာကိုင်တွယ်ကြောင်းသတိပြုသင့်သည်။ အကယ်၍ စာသားအသိအမှတ်ပြုမှု၏အမြင့်ဆုံးတိကျမှုသည်သင့်အတွက်အရေးကြီးသည်ဆိုပါကဤရွေးချယ်မှုကိုအထူးစဉ်းစားသင့်သည်။ ဒါပေမယ့်များသောအားဖြင့်မင်းတို့လည်းအဲဒါကိုပေးရမယ်။

သင်သည်စာရွက်စာတမ်းများအသေးစားကိုဒစ်ဂျစ်တယ်နည်းဖြင့်ပြုပြင်ရန်နှင့် ၀ န်ဆောင်မှုမှအမှားများကိုအမှီအခိုကင်းစွာပြင်ဆင်ရန်အဆင်သင့်ဖြစ်ပါက NewOCR, OCR.Space သို့မဟုတ် Free Online OCR ကိုအသုံးပြုရန်အကြံပြုလိုသည်။

Pin
Send
Share
Send