Pomoc:Idea proofreadingu

Proofreading to rozszerzenie oprogramowania mediawiki umożliwiające opracowywanie tekstów opierając się na skanach. Jest to nasze podstawowe narzędzie pracy i można powiedzieć, że całe Wikiźródła opierają się na tej koncepcji.[1]
Opracowując teksty opieramy się na lokalnych kopiach – tj. skanach czy zdjęciach tekstów zamieszczonych na Commons. Z opracowywaniem tekstów w ramach proofreadingu związane są następujące kroki:

  1. umieszczenie pliku lub plików w repozytorium Commons
  2. utworzenie specjalnej strony w przestrzeni nazw Indeks:
  3. dla każdej ze stron tekstu utworzenie odpowiedniej strony w przestrzeni Strona:
  4. sprawdzenie każdej takiej strony z tekstem na skanie
  5. kolejne (trzecie co najmniej) sprawdzenie każdej takiej strony z tekstem na skanie
  6. utworzenie na podstawie tak opracowanych stron w przestrzeni Strona: całego tekstu w przestrzeni głównej
  7. formalne zamknięcie projektu

Reguły naszej pracy mówią, że kroki 3, 4, 5 muszą być (dla każdej ze stron) wykonywane przez innego użytkownika.
Krok 6 często jest robiony po kroku 3 lub nawet w trakcie.

Poniżej zostaną omówione bardziej szczegółowo poszczególne aspekty.


Umieszczenie plików na commons

edytuj

Rozszerzenie proofread wymaga dostępności skanu/zdjęć opracowywanego tekstu. Plik taki jest umieszczany w naszym repozytorium tj. na Commons. Preferowanym formatem jest djvu.
Więcej informacji można znaleźć w poradniku Publikacja plików na Commons.

Indeks

edytuj
 

Wygląd typowego indeksu
(W szczegółach może strona indeksowa wyglądać inaczej - zależy to od tak zwanej skórki.)
Zaznaczone strzałką pola to linki do poszczególnych stron tekstów – opracowywanych w następnych etapach.

Sercem projektu, lub mniej przenośnie temat ujmując, centrum projektu (czyli danego tekstu) jest indeks. Jest to strona w przestrzeni Indeks: w specjalnym formacie spajająca z jednej strony plik na commons, z drugiej zaś przepisany tekst. Zawiera ona też (lub będzie zawierać) link do tekstu w przestrzeni głównej – choć technicznie nie jest to konieczne. Więcej informacji o zależnościach między poszczególnymi stronami można znaleźć w poradniku Indeks jako centralny element na Wikźródłach
Najlepiej jest, gdy indeks jest tworzony dla pojedynczego utworu, jakiejś całości w stosunku 1 : 1.
Więcej informacji dotyczących tworzenia indeksów można znaleźć w poradniku Indeksy Z tym krokiem związane są też czynności porządkowe jak:

Tworzenie pojedynczej strony

edytuj
 

Typowy wygląd strony w przestrzeni Strona:.
Marker wskazuje pole umożliwiające edycję.

W naszym żargonie to „przepisywanie” – choć przepisywanie w dosłownym tego słowa znaczeniu jest na szczęście rzadko konieczne.
Gdy otwieramy pustą stronę (tj. „czerwony” link) czy to ze strony indeksu, czy z poprzedniej (lub następnej) strony przez strzałki służące do nawigacji.
Często mamy już na stronie surową wersję tekstu (surowy OCR), jeśli nie, możemy skorzystać z któregoś z gadżetów umożliwiających maszynowe odczytanie tekstu znajdującego się po prawej. Można wreszcie skorzystać z jakiegoś innego programu na własnym komputerze a uzyskany tekst wkleić do okna edycji.
Jednak taki tekst musi zostać sprawdzony (czyli porównany starannie z tekstem skanu) – dopiero wtedy strona może zostać uznana za Przepisaną. Sam OCR kwalifikuje do statusu Problemy. Może się też zdarzyć, że strona nie zawiera tekstu – wtedy właściwy status to Bez tekstu. Jeśli zawiera tylko reklamy dajemy ten sam status i z reguły tej strony nie przepisujemy (chyba że mamy ochotę, lub mamy nadzieję dane z tej strony jakoś wykorzystać). Jeśli na stronie nie ma tekstu ale jest grafika (związana z opracowywanym utworem) również dajemy status Bez tekstu ale wstawiamy ilustrację lub ewentualnie szablon {{Skan zawiera grafikę}}.
Gdy wszystkie strony indeksu są przepisane (lub oznaczone jako bez tekstu) należy zaznaczyć to w polu postęp.

Ogólnie celem niniejszej strony pomocy nie jest całkowite omówienie np. sposobów formatowania. Niemniej jednak z tematem „przepisywania” stron wiąże się ściśle problem przenoszonych wyrazów na granicy stron. Zazwyczaj wystarczające jest umieszczenie tekstu tak jak się widzi, czyli z dywizem na końcu. Mechanizm proofread przy transkluzji połączy te strony. Więcej informacji można znaleźć na stronie Przenoszenie wyrazów.

Korygowanie

edytuj

Inny użytkownik wchodząc na stronę o statusie Przepisana po porównaniu naszej wersji ze skanem zmienia status strony na Skorygowana. Jeśli tylko poprawia jakieś zauważone błędy i nie sprawdza całości, nie zmienia statusu strony. Podobnie dzieje się, gdy robi tak dużo poprawek, że jego działanie jest bliższe przepisywaniu – choć jest to już bardziej sprawa indywidualnego osądu niż reguł pracy.
Gdy wszystkie strony indeksu są skorygowane należy zaznaczyć to w polu postęp.

Uwierzytelnienie

edytuj
Bez treści
brak strony Przepisana Skorygowana Uwierzytelniona
Problemy

Typowy przebieg pracy związany z kolejnym
porównywaniem testu z oryginałem.

Kolejny użytkownik inny niż przepisujący i sprawdzający po kolejnym (zatem trzecim już co najmniej) porównaniu naszej wersji tekstu ze skanem zmienia status strony na Uwierzytelniona.
Gdy wszystkie strony indeksu są uwierzytelnione należy zaznaczyć to w polu postęp.

Status Problemy otrzymują jak wskazano wyżej strony, które mają już wstawiony tekst, lecz nie kwalifikują się do statusu Przepisana. Otrzymują go także strony uszkodzone, nieczytelne – status może zostać zmieniony dopiero po naprawieniu problemu.

Tworzenie tekstów w przestrzeni głównej

edytuj

Teksty tworzone w przestrzeni Strona: mają charakter roboczy – w tym sensie, że właściwie nie są przeznaczone do czytania przez szersze grono czytelników. Nasze teksty udostępniamy przez transkluzję[3]. Jest to stosunkowo skomplikowana materia – poświęcony jest jej cykl poradników – patrz Części tekstu i kolejne z cyklu.

Zamknięcie projektu

edytuj

Gdy tekst w przestrzeni głównej jest trzykrotnie sprawdzony (z reguły jest to związane z całkowitym uwierzytelnieniem indeksu – z wyjątkiem stron bez tekstu i ewentualnie z problemami). Projekt jest zamykany. Wykonywane są przy tym pewne rutynowe czynności porządkowe. Kroki z tym związane są wymienione w poradniku Zamknięcie projektu.

Niniejsza strona pomocy ma jedynie wskazać ideę proofreadingu i poszczególne etapy. Szczegółowe informacje można znaleźć w zalinkowanych stronach pomocy i ewentualnie opisach szablonów.





  1. Istnieją pewne starsze teksty nie oparte na skanach, nie utworzone przy pomocy proofread. Staramy się je sukcesywnie eliminować.
  2. Nie są to obowiązkowe kroki, jednak zaniedbanie ich wprowadza nieporządek w projekcie. Nawet jeśli nie jest to robione natychmiast przy tworzeniu indeksu powinno być uzupełnione później.
  3. W pewnych rzadkich wypadkach również przez inne mechanizmy – patrz poradnik ...