Pöytäskannerien suosio on laskenut kuluttajien valitessa yhä useammin monitoimilaitteen. Edullisten monitoimilaitteiden, jotka hankitaan usein kopiointi- ja tulostustoiminnan tähden, mukana ei tule ocr-tekstintunnistusohjelmistoa, vaan ainoastaan perusskannausohjelmisto, jolla paperiset asiakirjat ja kuvat saadaan digitoitua. Tavallisesti tämä tarkoittaa tallennusta joko jpg- tai kuvapohjaiseen pdf-muotoon.
Myös työpaikoilla käyttäjäkohtaiset skannerit ovat historiaa, kun kopiokoneet skannaavat yhä useammin dokumentit myös kuvatiedostoksi. Pdf-tiedostoja on mukava lähetellä eteenpäin, mutta tekstin kopioiminen kuvasta on vaikeaa.
Kuvapohjaisesta pdf-dokumentista tekstin valinta ei onnistu. Esimerkiksi Adobe Readerin ruudulla tekstirivin kohdalla näkyy sarkaimen sijaan tähtäin, jolla voidaan kaapata vapaita alueita kuvasta. Tekstiä ei pysty kopioimaan tekstinkäsittelyohjelmaan saatikka muokata.
Ocr-ohjelmistojen tehtävänä on poimia kuvista tekstit ja saattaa ne käsiteltävään muotoon. Valitettavan usein ocr-ohjelmisto puuttuu nykyisin myös kalliimmasta skanneripaketista, mikä johtunee myynnin laskusta. Jos ohjelma tulee mukana, se ei välttämättä tue lainkaan suomen kieltä, jolloin ääkköset eivät tunnistu ja ohjelma tulkitsee sanat täysin väärin. Kalliissa toimistokopiokoneissakaan tunnistus ei aina toimi odotetusti.
Muistiosta tai taulukosta ei ole iloa, jos tekstiä ei saa valittua tai muokattua. Suurin esimerkiksi skannaavissa kopiokoneissa on se, että asiakirja voidaan toimittaa vastaanottajalle sähköisesti perinteisen patikkapostin sijaan.
Pitkän dokumentin uudelleenkirjoittaminen ei ole hauskaa, ei myöskään taulukon siirtäminen paperilta solu solulta taulukkolaskentaohjelmaan. Kunnollinen tekstintunnistin olisi tässä varmasti avuksi, varsinkin, jos paperien siirto sähköiseen muotoon on toistuvaa. Säästö työtunnit euroiksi muutettuna voi olla merkittävä.
Ainakin Canon toimittaa skannereittensa mukana varsin hyvän tekstintunnistusohjelman, jolla saa skannattua dokumentteja teksti-pdf-dokumenteiksi. Sellainen tulee mukana vain 200 euroakin maksavissa Canonin skannereissa ja myös monitoimilaitteissa.
http://www.verkkokauppa.com/popups/prodinfo.php?id=25651
(aiempi 4400 malli tuosta maksoi jopa alle 100 euroa, mutta sitä ei ole enää yleisesti saatavilla)
Nykyäänkin on useimmiten edullisin ja monikäyttöisin ratkaisu ostaa hyvä värilasertulostin ja erillinen diatarkkuusskanneri. Tuollaisen laserin saa 150 eurolla ja skannerin aika lailla samaan hintaan. Erillislaitteita voi käyttää sitten erikseenkin, toinen voi skannata ja toinen voi tulostaa samalla - yhdistelmälaitteella se on joskus vähän hankalampaa.
Skannereitten kanssa käytettäviä erillisiä tekstintunnistusohjelmiakin on saatavilla ihan kohtuuhintaan. Esim.
http://www.verkkokauppa.com/popups/prodinfo.php?id=21486
Tuo osaa skannata kyllä ihan skandi-tekstiäkin pdf-dokumenteiksi tai suoraan vaikkapa sähköpostiin, vaikka itse ohjelmisto ei suomenkielinen olekaan.
Ovatkos ajat tuosta sitten nyt huonontuneet?
KOMMENTTI
Kari Ahokas, 27.1.2012 15:26Sovelluskaupan lähtölaskenta alkoi
Mobiilit sovelluskaupat ovat välivaiheen ratkaisu, joka ei voi kestää kauan. »
KOMMENTTI
Antti Oksanen, Tietoviikko, 6.10.2011 12:54Yksi mies ja Apple
Mikään yritys ei ole yhden miehen show, mutta Apple on totisesti lähellä sitä. »



Yleensä kannattaa jättää vain pelkkä tekstin tunnistus OCR:n tehtäväksi ja ääkköset opettaen. Muotoilujen "tunnistamisen" yrittäminen aiheuttaa vain ikävää lisätyötä verrattuna muotoilujen uudelleentekemiseen (jos sekään on tarpeellista).
Etenkin oppilaitoksissa OCR:llä voi olla käyttöä...
Ilmoituksesi käsitellään seuraavan työpäivän kuluessa.