Jak robimy korektę » Historia » Wersja 7
Paulina Choromańska, 2015-07-16 09:37
1 | 2 | Marta Niedziałkowska | h1. Jak robimy korektę? |
---|---|---|---|
2 | 1 | Marta Niedziałkowska | |
3 | 6 | Paulina Choromańska | Tekst powstały w wyniku użycia programów komputerowych rozpoznających tekst z plików graficznych (ze skanów), jest często pełen błędów. |
4 | 6 | Paulina Choromańska | Przy korekcie wersji bibliotecznej należy te błędy usuwać automatycznie lub ręcznie, by wyeliminować dużą ilość błędów na dalszych etapach pracy. |
5 | 1 | Marta Niedziałkowska | |
6 | 1 | Marta Niedziałkowska | Niektóre błędy OCR są *typowe* i częste, należy do nich np. odczytywanie wielkiej litery „O” jako zero: 0, czy małej litery „l” jako jedynki: 1. Również niedokładności druku bywają rozmaicie interpretowane przez OCR - w miejscu zanieczyszczenia strony mechanizm może wstawić kropkę lub przecinek, a przecinek za słowem kończącym się na „e” może spowodować odczytanie tej litery jako „ę”. |
7 | 1 | Marta Niedziałkowska | |
8 | 1 | Marta Niedziałkowska | Błędy takie oczywiście zmieniają znaczenie tekstu. |
9 | 1 | Marta Niedziałkowska | |
10 | 3 | Marta Niedziałkowska | W celu ich wychwycenia i poprawienia należy *bardzo uważnie i ze zrozumieniem przeczytać tekst*, porównując go jednocześnie ze *skanami źródła*, co umożliwia dzięki swoim dwóm panelom "platforma redakcyjna":http://redmine.nowoczesnapolska.org.pl/projects/wl-publikacje/wiki/Praca_na_platformie (na jednym panelu można przeglądać tekst, na drugim synchronicznie skany utworu). |
11 | 1 | Marta Niedziałkowska | |
12 | 5 | Paulina Choromańska | Przy okazji tak dokładnej lektury można wychwycić domniemane *błędy źródła* - miejsca, w których tekst również w skanach jest nielogiczny, zawiera nieprawidłowości zapisu itp. Należy przypadki te *sprawdzić z innym wydaniem utworu* (zalecane są tu wzorcowe wydania BN) i jeżeli domniemany błąd okaże się rzeczywistym błędem źródła - poprawić, a następnie przy zapisywaniu *opisać dokonaną zmianę*. Informację o dokonanych błędach źródła należy opisać w "nocie redaktorskiej":http://redmine.nowoczesnapolska.org.pl/projects/wl-publikacje/wiki/Nota_redaktorska. |
13 | 4 | Aleksandra Sekuła | |
14 | 4 | Aleksandra Sekuła | Przykłady typowych częstych błędów OCR-u: |
15 | 4 | Aleksandra Sekuła | tern -> tem (zaimek) |
16 | 4 | Aleksandra Sekuła | aię -> się |
17 | 4 | Aleksandra Sekuła | cli -> ch |
18 | 4 | Aleksandra Sekuła | cłi -> ch |
19 | 4 | Aleksandra Sekuła | cb -> ch |
20 | 7 | Paulina Choromańska | |
21 | 7 | Paulina Choromańska | *UWAGA!* Na etapie korekty *nie wprowadzamy uwspółcześnień* - nie zmieniamy interpunkcji i ortografii. Jedyne zmiany, jakie możemy wprowadzić, to poprawienie tzw. błędów źródła. |