Ҳосил кардани матн аз як файли PDF бо истифодаи нусхабардории муқаррарӣ ҳамеша имконпазир аст. Аксар вақт саҳифаҳои ин гуна ҳуҷҷатҳо мундариҷаи нусхаҳои коғазии худро скан мекунанд. Барои табдил додани ин файлҳо ба маълумоти матнии таҳриршаванда барномаҳои махсус бо функсияи оптикии шинохтани аломатҳо (OCR) истифода мешаванд.
Иҷрои ин гуна қарорҳо душвор аст ва аз ин рӯ арзиши зиёде ба даст меорад. Агар ба шумо лозим аст, ки матнро аз PDF мунтазам эътироф кунед, тавсия медиҳед, ки барномаи мувофиқро харед. Дар баъзе ҳолатҳо, истифодаи яке аз хадамоти мавҷудаи онлайнӣ бо вазифаҳои шабеҳ аз рӯи мантиқ аст.
Чӣ тавр матнро аз PDF онлайн шинохтан мумкин аст
Албатта, доираи хидматҳои онлайнии OCR, дар муқоиса бо ҳалли пурраи мизи корӣ, маҳдудтар аст. Аммо шумо инчунин метавонед бо чунин захираҳо пулакӣ ва ё пардохти номиналӣ кор кунед. Хӯроки асосӣ дар он аст, ки вазифаи асосии онҳо, яъне шинохти матн, барномаҳои дахлдори веб низ қодиранд.
Усули 1: ABBYY FineReader Online
Ширкати рушди хизматрасонӣ яке аз пешвоён дар соҳаи эътирофи оптикии ҳуҷҷатҳо мебошад. ABBYY FineReader барои Windows ва Mac ҳалли пуриқтидори табдил додани PDF ба матн ва кори минбаъда бо он мебошад.
Аналоги веб-барнома, албатта, аз функсионалӣ аз он пасттар аст. Бо вуҷуди ин, хидмат метавонад матнҳоро аз сканҳо ва аксҳо ба зиёда аз 190 забон шинохт. Табдил додани файлҳои PDF ба ҳуҷҷатҳои Word, Excel ва ғайра дастгирӣ карда мешавад.
ABBYY FineReader Online хидмати онлайн
- Пеш аз оғози кор бо ин асбоб, дар сайт ҳисоби шумо эҷод кунед ё бо истифодаи Facebook, Google ё Microsoft ҳисоби худ ворид шавед.
Барои рафтан ба равзанаи авторизатсия тугмаро клик кунед "Даромад" дар сатри менюи боло. - Пас аз ворид шудан, ҳуҷҷати лозимаи PDF-ро ба тугмаи FineReader ворид кунед "Файлҳоро бор кунед".
Пас клик кунед "Рақамҳои саҳифаро интихоб кунед" ва фосилаи дилхоҳро барои шинохтани матн таъин намоед. - Баъд, забонҳои дар ҳуҷҷат буда формати файли натиҷаро интихоб кунед ва тугмаро пахш кунед Эътироф кардан.
- Пас аз коркард, ки мӯҳлати он пурра ба ҳаҷми ҳуҷҷат вобаста аст, шумо метавонед файли тайёрро бо маълумоти матнӣ танҳо бо пахш кардани номи он зеркашӣ кунед.
Ё ин ки онро ба яке аз хадамоти мавҷудаи содирот содир кунед.
Эҳтимол, хидмат бо алгоритмҳои дақиқи шинохти матн дар тасвирҳо ва файлҳои PDF фарқ мекунад. Аммо, мутаассифона, истифодаи ройгон бо панҷ саҳифа дар як моҳ коркард мешавад. Барои кор бо ҳуҷҷатҳои ҳаҷман бештар шумо бояд обунаи солона харед.
Аммо, агар OCR хеле кам талаб карда шавад, ABBYY FineReader Online як интихоби олӣ барои гирифтани матн аз файлҳои хурди PDF мебошад.
Усули 2: OCR-и ройгони онлайн
Хидмати содда ва қулай барои рақамӣ кардани матн. Бе қайд, манбаъ ба шумо имкон медиҳад, ки дар як соат 15 саҳифаи пурраи PDF-ро бидонед. OCR-и ройгон дар онлайн бо ҳуҷҷатҳо бо 46 забон пурра кор мекунад ва бидуни иҷозат се формати содироти матн - DOCX, XLSX ва TXT -ро дастгирӣ мекунад.
Ҳангоми бақайдгирӣ корбар имкони коркарди ҳуҷҷатҳои бисёр саҳифаро пайдо мекунад, аммо шумораи бепули ин саҳифаҳо то 50 адад маҳдуд аст.
Хадамоти ройгони онлайн OCR
- Барои шинохтани матн аз PDF ҳамчун «меҳмон» бидуни иҷозати манбаъ, шакли лозимаро дар сафҳаи асосии сайт истифода баред.
Бо истифодаи тугма ҳуҷҷати дилхоҳро интихоб кунед Файл, забони асосии матн, формати баромадро муайян кунед, ва интизор шавед, ки файл бор карда шавад ва клик кунед Табдил дода шавад. - Дар охири раванди рақамисозӣ клик кунед Msgstr "Файли бароришро зеркашӣ кунед." барои сабти ҳуҷҷати тайёр бо матн дар компютер.
Барои корбарони ваколатдор пайдарҳамии амалҳо каме фарқ мекунад.
- Тугмаро истифода баред "Сабти ном" ё "Даромад" дар сатри менюи болоӣ, мувофиқан, ҳисоби Free Online OCR эҷод кунед ё ба он ворид шавед.
- Пас аз тасдиқ дар панели шинохтан, тугмаро пахш карда нигоҳ доред CTRL, аз рӯйхати додашуда то ду забони ҳуҷҷати асосиро интихоб кунед.
- Параметри дигареро барои дарёфт кардани матн аз PDF муайян кунед ва клик кунед Файлро интихоб кунед барои хидмат бор кардани ҳуҷҷат.
Пас, барои оғози шинохтан клик кунед Табдил дода шавад. - Дар охири коркарди ҳуҷҷат, пайвандро бо номи файли баромад дар сутуни мувофиқ пахш кунед.
Натиҷаи шинохтан дарҳол дар хотираи компютери шумо ҳифз карда мешавад.
Агар ба шумо матни ҳуҷҷати хурди PDF ҳуҷҷатӣ лозим бошад, шумо метавонед бо истифодаи асбоби дар боло буда, истифода баред. Барои кор бо файлҳои калонҳаҷм, шумо бояд рамзҳои иловагиро дар Free Online OCR харед ё ҳалли дигареро истифода баред.
Усули 3: NewOCR
Хидмати OCR комилан ройгон, ки ба шумо имкон медиҳад матнро аз ҳама гуна ҳуҷҷатҳои графикӣ ва электронӣ ба монанди DjVu ва PDF гиред. Манбаъ ба андоза ва шумораи файлҳои эътирофшуда маҳдудият эҷод намекунад, сабти номро талаб намекунад ва доираи васеи вазифаҳои алоқамандро пешкаш мекунад.
NewOCR 106 забонро дастгирӣ мекунад ва метавонад ҳатто сканҳои дорои сифати пастро дуруст коркард кунад. Метавонед дастгоҳро барои шинохти матн дар саҳифаи файл интихоб кунед.
Хадамоти онлайнии NewOCR
- Ҳамин тавр, шумо метавонед фавран бо як манбаъ ба кор сар кунед, бе иҷрои амалҳои нолозим.
Дар тарафи рости сафҳа шакли барои ворид кардани ҳуҷҷат ба сайт мавҷуд аст. Барои бор кардани файл ба NewOCR, тугмаро истифода баред "Файлро интихоб кунед" дар фасли "Файли худро интихоб кунед". Баъд дар майдон "Забони шинохтан" як ё якчанд забони ҳуҷҷати манбаъро интихоб кунед, пас клик кунед "Боргузорӣ + OCR". - Танзимоти маъруфи шинохтани худро таъин кунед, сафҳае, ки мехоҳед матнро истихроҷ кунед ва тугмаро пахш кунед OCR.
- Саҳифаро каме ба поён ҳаракат кунед ва тугмаро ёбед "Download".
Онро клик кунед ва дар рӯйхати афтанда формати лозимаро барои зеркашӣ интихоб кунед. Пас аз он, файли тайёр бо матни хориҷшуда ба компютери шумо бор карда мешавад.
Восита қулай аст ва сифати хеле баланд ҳамаи аломатҳоро эътироф мекунад. Аммо, коркарди ҳар як саҳифаи ҳуҷҷати PDF воридшуда бояд мустақилона оғоз карда шавад ва он дар парвандаи алоҳида нишон дода мешавад. Шумо метавонед, албатта, фавран натиҷаҳои шинохтаро ба силули мухобиротӣ нусхабардорӣ кунед ва онҳоро бо дигарон якҷоя кунед.
Бо вуҷуди ин, бо назардошти нозукиҳои дар боло тавсифшуда, истифодаи NewOCR миқдори зиёди матнро гирифтан душвор аст. Бо файлҳои хурд, хидмат бо таркиш пур мекунад.
Усули 4: OCR.Space
Манбаи оддӣ ва фаҳмо барои рақамисозии матн, он ба шумо имкон медиҳад ҳуҷҷатҳои PDF-ро шинохта, натиҷаро ба файли TXT барорад. Ҳеҷ гуна маҳдудият дар шумораи саҳифаҳо пешбинӣ нашудааст. Маҳдудияти ягона дар он аст, ки андозаи ҳуҷҷати вуруд набояд аз 5 мегабайт зиёд бошад.
Хадамоти OCR.Space Online
- Сабти ном барои кор бо асбоб зарур нест.
Танҳо истиноди дар боло зикршударо пайгирӣ кунед ва бо истифодаи тугма ҳуҷҷати PDF-ро ба вебсайт ба компютер бор кунед "Файлро интихоб кунед" ё аз шабака - бо истинод. - Дар рӯйхати афтанда "Забони OCR -ро интихоб кунед" Забони ҳуҷҷати воридшударо интихоб кунед.
Пас ҷараёни шинохти матнро бо пахш кардани тугма оғоз кунед "OCR оғоз кунед!". - Дар охири коркарди файл натиҷаро дар майдон хонед Натиҷаи OCR'ed ва клик кунед "Download"барои зеркашии ҳуҷҷати тайёршудаи TXT.
Агар ба шумо лозим аст, ки матнро аз PDF бигиред ва ҳамзамон форматкунии ниҳоии он аҳамият надорад, OCR.Space интихоби хуб аст. Ягона чизе ин аст, ки санад бояд "якхела" бошад, зеро дар хидмат эътироф кардани ду ё зиёда забон дар як вақт пешбинӣ нашудааст.
Инчунин нигаред: Аналогҳои ройгони FineReader
Воситаҳои онлайни дар мақола пешниҳодшударо баҳо дода, қайд кардан лозим аст, ки FineReader Online аз ABBYY функсияи OCR-ро дақиқ ва самаранок иҷро мекунад. Агар барои шумо дақиқии ҳадди аксар муайян кардани матн муҳим бошад, беҳтараш ин вариантро ба назар гиред. Аммо эҳтимолан, шумо бояд онро низ пардохт кунед.
Агар ба шумо рақамӣ кардани ҳуҷҷатҳои хурд лозим ояд ва шумо омодаед, ки хатогиҳоро дар хидмат мустақилона ислоҳ кунед, истифодаи NewOCR, OCR.Space ё Free Online OCR тавсия дода мешавад.