Jak robimy korektę?¶
Tekst powstały w wyniku użycia programów komputerowych rozpoznających tekst z plików graficznych (ze skanów), jest często pełen błędów.
Przy korekcie wersji bibliotecznej należy te błędy usuwać automatycznie lub ręcznie, by wyeliminować dużą ilość błędów na dalszych etapach pracy.
Niektóre błędy OCR są typowe i częste, należy do nich np. odczytywanie wielkiej litery „O” jako zero: 0, czy małej litery „l” jako jedynki: 1. Również niedokładności druku bywają rozmaicie interpretowane przez OCR - w miejscu zanieczyszczenia strony mechanizm może wstawić kropkę lub przecinek, a przecinek za słowem kończącym się na „e” może spowodować odczytanie tej litery jako „ę”.
Błędy takie oczywiście zmieniają znaczenie tekstu.
W celu ich wychwycenia i poprawienia należy bardzo uważnie i ze zrozumieniem przeczytać tekst, porównując go jednocześnie ze skanami źródła, co umożliwia dzięki swoim dwóm panelom platforma redakcyjna (na jednym panelu można przeglądać tekst, na drugim synchronicznie skany utworu).
Przy okazji tak dokładnej lektury można wychwycić domniemane błędy źródła - miejsca, w których tekst również w skanach jest nielogiczny, zawiera nieprawidłowości zapisu itp. Należy przypadki te sprawdzić z innym wydaniem utworu (zalecane są tu wzorcowe wydania BN) i jeżeli domniemany błąd okaże się rzeczywistym błędem źródła - poprawić, a następnie przy zapisywaniu opisać dokonaną zmianę. Informację o dokonanych błędach źródła należy opisać w nocie redaktorskiej.
Przykłady typowych częstych błędów OCR-u:
tern -> tem (zaimek)
aię -> się
cli -> ch
cłi -> ch
cb -> ch
UWAGA! Na etapie korekty nie wprowadzamy uwspółcześnień - nie zmieniamy interpunkcji i ortografii. Jedyne zmiany, jakie możemy wprowadzić, to poprawienie tzw. błędów źródła.