Skany i OCR'y¶
Zadanie¶
Celem jest uzyskanie elektronicznej postaci dzieła nadającej się do:
- Publikacji w formie elektronicznej i drukowanej
- Twórczego opracowania w innej formie
Biblioteka Narodowa¶
- Materiał źródłowy jest skanowany w Zakładzie Reprografii i Digitalizacji Zbiorów Biblioteki Narodowej.
- Dla potrzeb OCR stosowane będą pliki w formacie jpg.
- Obrazy JPG są OCR'owane na pliki tekstowe
- Pliki tekstowe poddawane są wstępnej korekcie i wstępnemu otagowaniu (zakres prac do szczegółowego dopracowania).
- Teksty lektur wraz ze skanami są importowane na platformę redakcyjną.
Platforma redakcyjna¶
- Na plarformie następuje etap edycji. Nauczyciele i edytorzy tagują przypisy (edytorskie) i motywy
- Etap składu. Tekst jest semantycznie tagowany.
- Teksty lektur wraz z tagami eskportowane są jako XML do serwisu webowego
- Etap łamania. Tekst jest przygotowywany w odpowiednich formatach do umieszczenia na stronie