Iškraipyti žodžiai, angliškai dar vadinami „Captchas“, kuriuos naudoja įvairios interneto paslaugų svetainės apsaugai nuo automatiškai vykdomų registracijų, pasitelkiamos ir verčiant senovines knygas ar laikraščius, rašo „Times Online“.
Iškraipytų raidžių apsauga buvo sugalvota prieš aštuonerius metus. Jos pagrindinis tikslas – apsauga nuo automatiniu būdu registruojamų e. pašto dėžių. Tačiau dabar ji naudojama ir kitiems dalykams.
Vietoje to, kad rodytų atsitiktinį simbolių rinkinį, naujoji apsauga parenka žodį iš senovinio rankraščio, kurio nepavyksta iššifruoti kompiuteriui.
Kai trys žmonės įveda tokį patį žodį, sistema jį laiko teisingu ir nusiunčia jį rankraščius verčiančiam kompiuteriui.
DELFI (D.Augūnaitės nuotr.) |
---|
Tokį vertimo būdą sugalvojo 29-erių doktorantas, padedantis ne pelno siekiančiai organizacijai suskaitmeninti knygas iš 70 universitetų ir bibliotekų.
Luisas von Ahnas, sukūręs pirmąją sistemos „Captcha“ versiją, teigė, kad atnaujinta sistema „ReCaptcha“, kuri pasirodys kitą mėnesį, galės padėti į skaitmeninį formatą paversti apie 160 knygų per dieną.
Vis dėlto masiniuose turinio skaitmeninimo projektuose reikalingi ir žmonės, kurie patikrina kompiuterinės skenavimo technologijos, žinomos kaip optinis simbolių atpažinimas, paliktas klaidas.
Optinė simbolių atpažinimo technologija tekstą popieriuje paverčia skaitmeniniais dokumentais, tačiau ne be trūkumų. Skenuojant prieš 1900 metus išleistas knygas, šios technologijos tikslumas siekia tik apie 80 procentų. Šioje vietoje ir gali praversti žmogiška akis.
Per dieną žmonės visame pasaulyje įveda apie 60 mln. iškraipytų simbolių, kiekvienam jų teisingai iššifruoti prireikia daugmaž 10 sekundžių. Nors vienam žmogui tai nėra daug, iš viso tai sudaro 150 tūkst. darbo valandų per dieną.
Sistemą „ReCaptcha“ šiuo metu naudoja apie 45 tūkst. svetainių, bet jų skaičius nėra ribojamas. Kuo jis didesnis – tuo greičiau gali būti verčiamos knygos. Su dabartiniais pajėgumais „ReCaptcha“ kūrėjai vieną senovinės knygos puslapį gali išversti per 9 minutes.