Google legger til OCR-støtte for 34 språk
Google har vært i den o ptiske C haracter R ecognition-virksomheten ( OCR ) for en tid nå, og i dag har de oppdatert denne funksjonen for å støtte 29 nye språk. I september 2009 kjøpte Google reCAPTCHA, og siden da har de samtidig bekjempet spam mens de forbedret oversettelsen via ordene folk skriver inn. Oppdateringen vi ser i dag, er frukt av det arbeidet de har gjort siden å bringe inn teknologi.
Hva er OCR?
Hvis du bare blir med oss, er Optisk tegngjenkjenning et automatisert system som oversetter et bilde av tekst til kodet valgbar tekst. Google bruker OCR til å skanne bildene og PDF-filene, og deretter blir skanningen til et redigerbart Google Doc-format. I løpet av de siste 2 årene har Google brukt menneskelig innspilling fra reCAPTCHA-puslespill for å øke sin suksess når det gjelder å identifisere komplekse ord.
Hvilke språk ble lagt til?
Sammen med de ekstra språkene forbedret Google også OCR-kvalitet for de fem tidligere implementerte språkene: engelsk, italiensk, tysk, spansk og fransk. De 29 nye språkene som er lagt til er følgende:
1. bulgarsk 2. katalansk 3. Kinesisk (forenklet Han) 4. kroatisk 5. tsjekkisk 6. Dansk 7. nederlandsk 8. filippinsk 9. finsk 10. Gresk 11. Ungarsk 12. indonesisk 13. japansk 14. Koreansk 15. Lettisk | 16. Litauisk 17. Norsk 18. Polsk 19. Portugisisk 20. rumensk 21. russisk 22. serbisk 23. Slovak 24. slovensk 25. svensk 26. Thai 27. Tyrkisk 28. Ukrainsk 29. Vietnamesisk |
Når du laster opp bilder eller PDF-filer til Google Dokumenter, må du sørge for å velge språket som teksten i filen din er skrevet inn! For å gjøre det, legg filen din i kø for å bli lastet opp, og merk av i boksen for Konverter tekst fra PDF- eller bildefiler til Google Docs-dokumenter . En rullegardinmeny for Dokumentsprog vises, der du kan velge språk.
Har du prøvd Googles OCR-teknologi for å skanne gamle familiejournaler, bøker eller hva annet du legger deg rundt i huset? Du kan også prøve den ut på iPhone- eller Android-telefonen din hvis du har Google Goggles-appen!