Projekt

Ogólne

Profil

Jak robimy korektę » Historia » Wersja 7

Paulina Choromańska, 2015-07-16 09:37

1 2 Marta Niedziałkowska
h1. Jak robimy korektę?
2 1 Marta Niedziałkowska
3 6 Paulina Choromańska
Tekst powstały w wyniku użycia programów komputerowych rozpoznających tekst z plików graficznych (ze skanów), jest często pełen błędów. 
4 6 Paulina Choromańska
Przy korekcie wersji bibliotecznej należy te błędy usuwać automatycznie lub ręcznie, by wyeliminować dużą ilość błędów na dalszych etapach pracy.
5 1 Marta Niedziałkowska
6 1 Marta Niedziałkowska
Niektóre błędy OCR są *typowe* i częste, należy do nich np. odczytywanie wielkiej litery „O” jako zero: 0, czy małej litery „l” jako jedynki: 1. Również niedokładności druku bywają rozmaicie interpretowane przez OCR - w miejscu zanieczyszczenia strony mechanizm może wstawić kropkę lub przecinek, a przecinek za słowem kończącym się na „e” może spowodować odczytanie tej litery jako „ę”. 
7 1 Marta Niedziałkowska
8 1 Marta Niedziałkowska
Błędy takie oczywiście zmieniają znaczenie tekstu. 
9 1 Marta Niedziałkowska
10 3 Marta Niedziałkowska
W celu ich wychwycenia i poprawienia należy *bardzo uważnie i ze zrozumieniem przeczytać tekst*, porównując go jednocześnie ze *skanami źródła*, co umożliwia dzięki swoim dwóm panelom "platforma redakcyjna":http://redmine.nowoczesnapolska.org.pl/projects/wl-publikacje/wiki/Praca_na_platformie (na jednym panelu można przeglądać tekst, na drugim synchronicznie skany utworu).
11 1 Marta Niedziałkowska
12 5 Paulina Choromańska
Przy okazji tak dokładnej lektury można wychwycić domniemane *błędy źródła* - miejsca, w których tekst również w skanach jest nielogiczny, zawiera nieprawidłowości zapisu itp. Należy przypadki te *sprawdzić z innym wydaniem utworu* (zalecane są tu wzorcowe wydania BN) i jeżeli domniemany błąd okaże się rzeczywistym błędem źródła - poprawić, a następnie przy zapisywaniu *opisać dokonaną zmianę*. Informację o dokonanych błędach źródła należy opisać w "nocie redaktorskiej":http://redmine.nowoczesnapolska.org.pl/projects/wl-publikacje/wiki/Nota_redaktorska.
13 4 Aleksandra Sekuła
14 4 Aleksandra Sekuła
Przykłady typowych częstych błędów OCR-u: 
15 4 Aleksandra Sekuła
tern -> tem (zaimek)
16 4 Aleksandra Sekuła
aię -> się
17 4 Aleksandra Sekuła
cli -> ch
18 4 Aleksandra Sekuła
cłi -> ch
19 4 Aleksandra Sekuła
cb -> ch
20 7 Paulina Choromańska
21 7 Paulina Choromańska
*UWAGA!* Na etapie korekty *nie wprowadzamy uwspółcześnień* - nie zmieniamy interpunkcji i ortografii. Jedyne zmiany, jakie możemy wprowadzić, to poprawienie tzw. błędów źródła.