Хуб
Эҳтимол, ҳар яки мо ҳангоми иҷрои тарҷумаи як ҳуҷҷати коғазӣ ба шакли электронӣ, бо он кор рӯбарӯ шудем. Ин кор махсусан барои онҳое, ки таҳсил мекунанд, бо ҳуҷҷатгузорӣ кор мекунанд, матнҳоро бо истифода аз луғатҳои электронӣ ва ғайра тарҷума мекунанд, муҳим аст.
Дар ин мақола, ман мехостам баъзе аз асосҳои ин равандро мубодила кунам. Умуман, скан ва шинохтани матн вақти зиёдро талаб мекунад, зеро бештари амалиётро дастӣ анҷом додан лозим аст. Мо кӯшиш мекунем бифаҳмем, ки чӣ гуна, чӣ тавр ва чаро.
На ҳама дарҳол як чизро мефаҳманд. Пас аз сканкунӣ (мувофиқ кардани ҳамаи варақҳо дар сканер) шумо тасвирҳо дар формати BMP, JPG, PNG, GIF дошта метавонед (форматҳои дигар низ дошта бошанд). Ҳамин тавр, аз ин расм ба шумо матн гирифтан лозим аст - ин тартиб эътирофкунӣ номида мешавад. Бо ин тартиб, баёнияи зер хоҳад буд.
Мундариҷа
- 1. Барои ташхис ва шинохтан чӣ лозим аст?
- 2. Имконоти сканкунии матн
- 3. Эътирофи матни ҳуҷҷат
- 3.1 Матн
- 3.2 расмҳо
- 3.3 Ҷадвалҳо
- 3.4 Маводҳои нолозим
- 4. Шинохтани файлҳои PDF / DJVU
- 5. Тафтиши хатогиҳо ва сарфа кардани натиҷаҳои кор
1. Барои ташхис ва шинохтан чӣ лозим аст?
1) Сканер
Барои табдил додани ҳуҷҷатҳои чопшуда ба матн, пеш аз ҳама сканер ва ба ин васила, барномаҳои "модарӣ" ва драйверҳое, ки бо он омадаанд, лозим аст. Бо истифодаи онҳо, шумо метавонед ҳуҷҷатро скан кунед ва барои коркарди минбаъда захира кунед.
Шумо метавонед аналогҳои дигарро истифода баред, аммо нармафзоре, ки бо сканер дар маҷмӯа омадааст, одатан тезтар кор мекунад ва имконоти бештар дорад.
Вобаста аз намуди сканер шумо суръати кор метавонад хеле фарқ кунад. Сканнерҳо ҳастанд, ки метавонанд дар варақ дар 10 сония акс гиранд ва дар 30 сония онҳо метавонанд ба даст оварда шаванд. Агар шумо як китобро барои 200-300 варақ скан кунед - фикр мекунам, ки фарқияти вақт чанд маротиба мешавад?
2) Барномаи шинохтан
Дар мақолаи мо ман ба шумо дар яке аз беҳтарин барномаҳо барои скан ва эътирофи ҳама ҳуҷҷатҳо - ABBYY FineReader нишон медиҳам. Зеро Азбаски барнома пулакӣ аст, ман фавран пайванди дигареро хоҳам дод - аналоги ройгони Cunei Form. Дуруст аст, ки ман онҳоро муқоиса намекардам, азбаски FineReader дар ҳама ҷиҳатҳо ғолиб аст, ман ба ҳар ҳол тавсия медиҳам, ки инро санҷам.
ABBYY FineReader 11
Вебсайти расмӣ: //www.abbyy.ru/
Яке аз беҳтарин барномаҳои он. Он барои шинохтани матн дар расм тарроҳӣ шудааст. Бисёр вариантҳо ва вазифаҳои дохилӣ. Он метавонад як миқдори ҳуруфҳоро таҳлил кунад, ҳатто имконоти дастнависро дастгирӣ мекунад (гарчанде ки ман шахсан онро санҷида нашудам, гумон мекунам, ки нусхаи дастнависро шинохта наметавонанд, магар он ки шумо дастнависи комилан каллиграфӣ дошта бошед). Тафсилоти бештар дар бораи кор бо он дар зер тавсиф мешавад. Ин ҷо мо инчунин қайд мекунем, ки мақола дар бораи кор дар версияи 11 сӯҳбат хоҳад кард.
Одатан, версияҳои гуногуни ABBYY FineReader аз ҳамдигар хеле фарқ надоранд. Шумо метавонед инро ба осонӣ дар дигаре иҷро кунед. Фарқиятҳои асосӣ метавонанд дар роҳатӣ, суръати барнома ва имкониятҳои он бошанд. Масалан, версияҳои қаблӣ кушодани PDF ва DJVU-ро рад мекунанд ...
3) Ҳуҷҷатҳо барои скан
Бале, ба ин монанд, ман қарор додам, ки ҳуҷҷатҳоро як сутуни алоҳида созам. Дар аксар ҳолатҳо, баъзе китобҳои дарсӣ, рӯзнома, мақолаҳо, маҷаллаҳо ва ғайра скан карда мешаванд. он китобҳо ва адабиёти зарурӣ. Ман ба чӣ роҳнамоӣ мекунам? Аз таҷрибаи шахсии худ, ман гуфта метавонам, ки он чизе, ки шумо мехоҳед скан карданӣ бошед, аллакай дар шабака аст! Чанд маротиба ман шахсан вақти худро сарфа кардам, вақте ки як китоби махсусро дар шабака сканер ёфтам. Ман бояд кардам, ки матнро ба ҳуҷҷат нусхабардорӣ карда, кор карданро идома диҳед.
Аз ин лиҳоз, як нӯги оддӣ - пеш аз скан кардани чизе, санҷед, ки оё касе аллакай сканер кардааст ва ба шумо лозим нест, ки вақтатонро сарф кунед.
2. Имконоти сканкунии матн
Дар ин ҷо ман дар бораи драйверҳои шумо барои сканер, барномаҳое, ки бо он рафтаанд, сӯҳбат нахоҳам кард, зеро ҳамаи моделҳои сканер гуногунанд, нармафзор низ дар ҳама ҷо фарқ мекунад ва фаҳмидани чӣ гуна иҷро кардани амал ғайривоқеӣ аст.
Аммо ҳама сканерҳо танзимоти якхела доранд, ки метавонанд ба суръат ва сифати кори шумо хеле таъсир расонанд. Мо дар бораи онҳо танҳо дар ин ҷо нақл хоҳем кард. Ман бо тартиби фармоишӣ хоҳам номид.
1) Сканкунии сифат - DPI
Аввалан, имконоти сифати сканро дар ҳадди аққал 300 DPI насб кунед. Агар имконпазир бошад, ҳатто бештар таъин карда мешавад. Нишондиҳандаи DPI баландтар бошад, тасвири шумо ҳамон қадар равшантар мешавад ва бинобарин коркарди минбаъда тезтар мешавад. Илова бар ин, сифати сканер баландтар аст, ҳамон қадар хатогиҳои шумо дертар ислоҳ мешаванд.
Варианти беҳтарин одатан 300-400 DPI -ро таъмин мекунад.
2) Ранг
Ин параметр ба вақти сканкунӣ сахт таъсир мерасонад (бо роҳи, DPI низ таъсир мерасонад, аммо онҳо он қадар қавӣ ҳастанд ва танҳо вақте ки корбар арзишҳои баланд мегузорад).
Одатан се режим вуҷуд дорад:
- сиёҳ ва сафед (комил барои матни оддӣ);
- хокистаранг (барои матн бо ҷадвалҳо ва расмҳо мувофиқ аст);
- ранг (барои маҷаллаҳои ранга, китобҳо, дар маҷмӯъ, ҳуҷҷатҳо, ки ранг муҳим аст).
Одатан, вақти скан ба интихоби ранг вобаста аст. Воқеан, агар шумо ҳуҷҷати калон дошта бошед, пас ҳатто 5-10 сонияи иловагӣ дар маҷмӯъ дар вақти арзанда раҳо хоҳанд шуд ...
3) Суратҳо
Шумо метавонед ҳуҷҷатро на танҳо бо роҳи сканкунӣ, балки бо аксбардории он гиред. Одатан, дар ин ҳолат шумо як қатор мушкилоти дигарро хоҳед дошт: таҳрифи тасвир, номуайянӣ. Бинобар ин, таҳрир ва коркарди минбаъдаи матни қабулшуда талаб карда мешавад. Шахсан, ман истифодаи камераро барои ин тиҷорат тавсия намедиҳам.
Қайд кардан муҳим аст, ки на ҳама гуна чунин санадро эътироф кардан мумкин нест, зеро сифати скан метавонад хеле паст бошад ...
3. Эътирофи матни ҳуҷҷат
Мо гумон мекунем, ки шумо саҳифаҳои пурарзишро скан гирифтаед. Аксар вақт ин форматҳо мебошанд: tif, bmb, jpg, png. Умуман, барои ABBYY FineReader - ин он қадар муҳим нест ...
Пас аз кушодани тасвир дар ABBYY FineReader, барнома, чун қоида, ба таври худкор минтақаҳоро интихоб мекунад ва онҳоро дар мошин шинохтааст. Аммо баъзан вай ин корро мекунад. Барои ин, мо интихоби минтақаҳои заруриро ба таври дастӣ баррасӣ хоҳем кард.
Муҳим! На ҳама фавран мефаҳманд, ки пас аз кушодани ҳуҷҷат дар барнома, ҳуҷҷати манбаъ дар равзанаи чап нишон дода мешавад, ки дар он шумо соҳаҳои гуногунро интихоб мекунед. Пас аз зер кардани тугмаи "шинохтан", барнома дар равзанаи рост ба шумо матни тайёрро нишон медиҳад. Пас аз шинохтан, бо роҳи, тавсия дода мешавад, ки матнро дар хатогиҳои ҳамон FineReader тафтиш кунед.
3.1 Матн
Ин қитъа барои равшан кардани матн истифода мешавад. Суратҳо ва мизҳо бояд аз он истисно карда шаванд. Ҳуруфҳои нодир ва ғайриоддӣ бояд дастӣ ворид карда шаванд ...
Барои интихоби майдони матн ба панели дар боло будаи FineReader диққат диҳед. Як тугмаи "T" мавҷуд аст (ниг. Скриншотро дар поён нишон диҳед, нишоннамои муш танҳо дар ин тугма ҷойгир аст). Ба он клик кунед, ва баъд дар тасвири дар поён, майдони тозаи росткунҷаеро, ки дар он матн ҷойгир аст, интихоб кунед. Бо роҳи, дар баъзе ҳолатҳо, шумо бояд блокҳои матнии 2-3 ва баъзан 10-12 саҳифаро эҷод кунед, зеро форматкунии матн метавонад гуногун бошад ва як росткунҷа тамоми майдонро интихоб намекунад.
Қайд кардан муҳим аст, ки тасвирҳо набояд ба майдони матн дохил шаванд! Дар оянда, ин ба шумо вақти зиёдро сарфа мекунад ...
3.2 расмҳо
Барои тасвири тасвирҳо ва минтақаҳое истифода мешавад, ки бинобар сифати паст ё ҳуруфи ғайриоддӣ шинохтанашон мушкил аст.
Дар скриншот дар зер, нишоннамои муш дар тугмае, ки барои интихоби минтақаи "тасвир" истифода мешавад, ҷойгир аст. Ба ҳар ҳол, дар ин самт шумо метавонед комилан ҳар як қисми саҳифаро интихоб кунед ва пас FineReader онро ба ҳуҷҷат ҳамчун тасвири муқаррарӣ дохил мекунад. I.e. танҳо "беақл" нусхабардорӣ ...
Одатан, ин қитъа барои ҷудо кардани ҷадвалҳои ба кам сканшуда, барои ҷудо кардани матн ва ҳуруфи ғайристандартӣ аз ҷониби худи расмҳо истифода мешавад.
3.3 Ҷадвалҳо
Скриншот дар зер тугмача барои равшансозии ҷадвал нишон дода шудааст. Умуман, ман шахсан онро хеле кам истифода мекунам. Дар асл он аст, ки шумо бояд ҳар як сатрро дар сари суфра кашед ва нишон диҳед, ки чӣ гуна ва чӣ гуна барномаро. Агар ҷадвал хурд ва бо сифати начандон хуб бошад, ман тавсия медиҳам, ки майдони "расм" -ро барои ин мақсадҳо истифода барам. Ҳамин тариқ, вақти зиёдро сарфа кунед ва ҷадвалро дар асоси расм ба зудӣ дар Word тартиб додан мумкин аст.
3.4 Маводҳои нолозим
Кайд кардан зарур аст. Баъзан дар саҳифа унсурҳои нодаркоре мавҷуданд, ки ба шинохти матн халал мерасонанд ва ё ҳатто ба шумо равшан шудани майдони дилхоҳро халал мерасонанд. Онҳоро пурра бо истифода аз хаткӯркунак нест кардан мумкин аст.
Барои ин, ба ҳолати таҳриркунии тасвир гузаред.
Асбоби бартарафкунандаро интихоб кунед ва минтақаи нолозимро интихоб кунед. Он тоза карда мешавад ва варақи сафед дар ҷои худ хоҳад буд.
Бо роҳи шумо, ман тавсия медиҳам, ки шумо ин имконотро ҳарчи зудтар истифода баред. Ҳама майдонҳои матни интихобшударо санҷед, ва дар он ҷо ба шумо матн лозим нест ё нуқтаҳои нолозим, каҷӣ, таҳрифҳо мавҷуданд - бо хаткӯркунак нест кунед. Ба шарофати ин, эътироф зудтар хоҳад шуд!
4. Шинохтани файлҳои PDF / DJVU
Умуман, ин формати шинохтан аз дигарон фарқе нахоҳад дошт - яъне. шумо метавонед бо он кор кунед, ба монанди тасвирҳо. Ягона чизе ин аст, ки барнома набояд кӯҳна шавад, агар файлҳои PDF / DJVU барои шумо кушода нашаванд - ба версияи 11 навсозӣ кунед.
Маслиҳат каме. Пас аз кушодани ҳуҷҷат дар FineReader - он ба таври худкор ба шинохтани ҳуҷҷат шурӯъ мекунад. Аксар вақт дар файлҳои PDF / DJVU, як минтақаи муайяни саҳифа дар тамоми ҳуҷҷат лозим нест! Барои нест кардани чунин майдон дар ҳама саҳифаҳо, амалҳои зеринро иҷро кунед:
1. Ба бахши таҳриркунии тасвир гузаред.
2. Оғози "зироат" -ро интихоб кунед.
3. Ҳама саҳифаҳоро интихоб кунед.
4. Ба ҳама саҳифаҳо ва зироат муроҷиат кунед.
5. Тафтиши хатогиҳо ва сарфа кардани натиҷаҳои кор
Чунин ба назар мерасад, ки ҳанӯз ҳам мушкилот вуҷуд дорад, вақте ки ҳама ҷойҳо равшан карда шуданд, сипас эътироф шуданд - онро бигиред ва захира кунед ... Он ҷо буд!
Якум, ба шумо чеки ҳуҷҷат лозим аст!
Баъд аз шинохтан, дар равзанаи рост тугмаи "санҷиш" мавҷуд аст, скриншоти дар поёнбударо бубинед. Пас аз пахш кардани он, барномаи FineReader ба таври худкор ба шумо соҳаҳоеро нишон медиҳад, ки барнома хато кардааст ва хусусияти муайянро боэътимод муайян карда натавонист. Шумо танҳо бояд интихоб кунед, ё шумо бо андешаи барнома розӣ ҳастед ё хислати худро ворид кунед.
Ба ҳар ҳол, дар нисфи ҳолатҳо, тақрибан, барнома ба шумо калимаи дурусти тайёрро пешниҳод мекунад - шумо танҳо имконоти заруриро бо муш интихоб кунед.
Дуюм, пас аз санҷиш, шумо бояд форматеро интихоб намоед, ки дар он натиҷаи кори худро сарфа кунед.
Дар ин ҷо FineReader ба шумо имкон медиҳад, ки ба пуррагии он муроҷиат кунед: шумо танҳо метавонед маълумотро ба Word ба як кас интиқол диҳед ё шумо метавонед онро дар даҳҳо формат нигоҳ доред. Аммо ман мехостам як ҷанбаи дигари муҳимро қайд кунам. Ҳар формате, ки шумо интихоб кунед, интихоб кардани нусхабардорӣ муҳимтар аст! Вариантҳои ҷолибтаринро баррасӣ кунед ...
Нусхаи дақиқ
Ҳама соҳаҳое, ки шумо дар саҳифаи ҳуҷҷати шинохта қайд кардаед, ба ҳуҷҷати аслӣ мувофиқат мекунанд. Опсияи хеле қулай вақте ки барои шумо муҳим аст, ки форматро аз матн гум накунед. Ба ҳар ҳол, ҳуруфот низ ба асл хеле монанд хоҳанд буд. Бо ин интихоб, ман тавсия медиҳам, ки ҳуҷҷатро ба Word интиқол диҳед, то кори минбаъда дар он ҷо идома ёбад.
Нусхаи таҳриршаванда
Ин хосият хуб аст, зеро шумо версияи форматшудаи матнро мегиред. I.e. гузоштан бо "километри", ки мумкин аст дар ҳуҷҷати манбаъ мавҷуд бошад - шумо пешвоз нахоҳед гирифт. Опсияи муфид вақте ки шумо иттилоотро таҳрир мекунед.
Дуруст аст, ки шумо набояд интихоб кунед, ки барои нигоҳ доштани услуби ороиш, ҳуруфот муҳим аст. Баъзан, агар шинохтан он қадар номуваффақ аст, ҳуҷҷати шумо бинобар тағирдиҳии тағирёбанда метавонад "часад". Дар ин ҳолат, тавсия дода мешавад, ки нусхаи дақиқро интихоб кунед.
Матни оддӣ
Опсия барои касоне, ки танҳо матнро аз як саҳифа бе ҳама чизи дигар ниёз доранд. Он барои ҳуҷҷатҳо бе тасвирҳо ва ҷадвалҳо мувофиқ аст.
Дар ин мақола оид ба сканкунӣ ва эътирофи ҳуҷҷат хотима ёфт. Умедворам, ки бо ин маслиҳатҳои оддӣ шумо мушкилоти худро ҳал карда метавонед ...
Барори кор