Pomoc:Archiwum 2023/Zamieszczanie skanów na Commons

Archive

Ta strona ma charakter historyczny bądź archiwalny. Prosimy nie modyfikować tej strony.

Przygotowanie skanów

Należy zeskanować książkę umieszczając każdą stronę lub najlepiej szpaltę w osobnym pliku. Pliki muszą mieć identyczne nazwy, a różnić się jedynie umieszczonym na końcu nazwy numerem kolejnym. Numer kolejny musi mieć zera nieznaczące. W numeracji nie powinno być luk.

PL Autor-Tytuł 001.jpg
PL Autor-Tytuł 002.jpg
PL Autor-Tytuł 003.jpg
...

Ilustracje z książki można zeskanować, ale pod warunkiem, że do nich również wygasły prawa autorskie. Pomimo tego, że prawa do tekstu już wygasły należy upewnić się, że do ilustracji również, ponieważ zazwyczaj kto inny był autorem tekstów, a kto inny autorem grafik. Jeśli autor grafik jest nieznany (brak informacji w książce) istotna jest nie jego data śmierci, a data publikacji. Należy również pamiętać o prawach autorskich do samego składu o ile ma charakter artystyczny - np. układ wierszy, podział na szpalty, dobór czcionki. Jeśli autor składu jest nieznany (brak informacji w książce) istotna jest nie jego data śmierci, a data publikacji.

Biblioteki internetowe

Zamiast skanować samodzielnie stare książki, do których dostęp jest bardzo ograniczony, można wykorzystać zeskanowaną książkę z jednej z bibliotek elektronicznych. Skanowanie trudno uznać za działanie twórcze, jednak z pewnością wymaga sporego nakładu pracy, który należy uszanować podając źródło pochodzenia skanów. Jest to również ukłon w stronę samej biblioteki, która opiekuje się starodrukami.

Grafiki chyba najwygodniej pobierać darmowym programem wget, dla którego np tworzymy skrypt o treści

wget "http://serwer.pl/obrazki/plik001.jpg" -O "Nowa nazwa 001.jpg"
wget "http://serwer.pl/obrazki/plik002.jpg" -O "Nowa nazwa 002.jpg"
wget "http://serwer.pl/obrazki/plik003.jpg" -O "Nowa nazwa 003.jpg"
wget "http://serwer.pl/obrazki/plik004.jpg" -O "Nowa nazwa 004.jpg"

W systemach rodziny Unix wystarczy zapisać plik tekstowy, który będzie skryptem, ustawić mu atrybut x przy pomocy polecenia

chmod +x skrypt

W systemach Windows plik tekstowy, utworzony np. notatnikiem, zawierający treść skryptu należy nazwać skrypt.bat. Te trzy litery umieszczone po kropce na końcu nazwy są sygnałem dla systemu operacyjnego, że plik zawiera skrypt.

W systemach Windows można użyć skryptu, w którym wystarczy zamiast 423 wpisać liczbę grafik do pobrania oraz poprawić ścieżkę źródłową oraz wzorzec nazwy powstających plików.

@echo off 
for /L %%1 in (0,1,9) do (
  for /L %%2 in (0,1,9) do (
    for /L %%3 in (0,1,9) do (
      if "1%%1%%2%%3"=="423" goto koniec
      wget "http://serwer.pl/obrazki/plik000%%1%%2%%3.jpg" -O "PL Autor-Tytuł %%1%%2%%3.jpg"
      )
    )
  )
:koniec

Poniżej skrypt wykonujący to samo, ale dla systemów rodziny Unix.

#!/bin/sh
for i in 0 1 2 3 4 5 6 7 8 9
do
  for j in 0 1 2 3 4 5 6 7 8 9
  do
    for k in 0 1 2 3 4 5 6 7 8 9
    do
      if [ "$i$j$k" = "423" ]
      then
        exit
      fi
      wget "http://serwer.pl/obrazki/plik000$i$j$k.jpg" -O "PL Autor-Tytuł $i$j$k.jpg"
    done
  done
done

Rozcinanie podwójnych stron i nie tylko

Windows

Jeśli strony zostały zeskanowane po dwie na jednym obrazku należy przed wgraniem podzielić je jakimś program służącym do obróbki grafiki. Można do tego użyć np darmowego programu irfanview (Oficjalna strona; program; spolszczenie). Można strony również wykadrować, obcinając zbędne obrzeże. Ułatwi to później przepisywanie tekstu. Należy zwrócić baczną uwagę aby przy wstępnej obróbce grafiki nie utracić istotnych elementów na stronie.

Warto zwrócić uwagę na fakt, że wiele operacji w Irfanview można wykonać posługując się wyłącznie klawiaturą. Bardzo przyspiesza to obróbkę wielu plików. Wystarczy sprawdzić w pomocy jaki skrót klawiaturowy powoduje wykonanie określonej operacji na pliku.

Unix

Do obróbki grafiki można użyć darmowego narzędzia wsadowego ImageMagick. Dostępne jest zarówno w wersji dla Unix, Mac OS X jak i Windows. To narzędzie ma tę zaletę, że nie wymaga mozolnego obrabiania pojedynczych plików, a dzięki utworzeniu prostych skryptów można wykonać żmudną operację na setkach plików w ciągu kilku minut. Polecenie wycięcia fragmentu obrazka jest stosunkowo proste

convert -crop "1x2+3+4" "we.jpg" "wy.jpg"
# 1 - jest to wyrażona w pikselach szerokość obrazka wynikowego
# 2 - jest to wyrażona w pikselach wysokość obrazka wynikowego
# 3 - jest to wyrażona w pikselach odległość od lewego marginesu wycinanego fragmentu
# 4 - jest to wyrażona w pikselach odległość od górnego marginesu wycinanego fragmentu
# Przykładowe użycie
convert -crop "200x800+0+0" "we.jpg" "wy.jpg"

Rozcięcie pliku we.jpg na dwa wy-l.jpg i wy-p.jpg w systemie Unix z wykorzystaniem convert, jpeginfo i awk.

#!/bin/bash
# na początek odczytujemy z obrazka jego wymiary w pikselach
x=`jpeginfo -q -l "we.jpg" | awk '{print $1}'`
y=`jpeginfo -q -l "we.jpg" | awk '{print $3}'`

# margines wewnętrzny - zakładka - szerokość paska, który zostanie
# umieszczony zarówno na lewej i prawej stronie wynikowej
# jeśli margines ma mieć 10% szerokości całej strony
xm=$[ $x/10+1 ]
# jeśli margines ma mieć 0
#xm=0

# szerokość obrazków
xl=$[ $x/2+$xm ]

# oczekiwana wysokość strony
# jeśli oczekiwana wysokość strony ma być taka sama jak oryginalna
yl=$y
# wpisać wartość na sztywno w pikselach wtedy zostanie zapisana strona o takiej wysokości wycięta ze środka
#yl=1100

convert -crop "$[ $xl ]x$yl+0+$[ ($y-$yl)/2 ]" "we.jpg" "we-l.jpg"
convert -crop "$[ $xl ]x$yl+$[ $x-$xl ]+$[ ($y-$yl)/2 ]" "we.jpg" "wy-p.jpg"

Przesyłanie skanów

Strona autora

Przesyłanie skanów należy rozpocząć od upewnienia się, że na Commons została już utworzona specjalna strona autora. Powinna ona znajdować się w przestrzeni Creator, a nazwę mieć utworzoną z imienia i nazwiska autora. Na przykład dla Cypriana Norwida strona autora znajduje się pod nazwą Creator:Cyprian Kamil Norwid. Jeśli strona autora nie istnieje należy ją oczywiście utworzyć. Powinna ona zawierać w treści:

{{Creator
 | Option    = {{{1|}}} <!-- Do not modify -->
 | Wikidata  = Q340122
}}

W parametrze Wikidata należy wprowadzić numer elementu Wikidanych (Q+numer). W powyższym przykładzie numer należy do elementu Cyprian Kamil Norwid. Jeżeli autor nie ma swojego elementu w Wikidanych, należy go utworzyć.

Kategoria dla utworu

Jeśli książka jest w formie osobnego pliku dla każdej strony to wszystkie strony książki należy dodać do jednej kategorii. Nazwa kategorii powinna zawierać imię autora i tytuł. Czasami także zawiera rok wydania. Przykłady:


[[Category:Tytuł utworu (Autor utworu)]]

Kategoria powinna zawsze znaleźć się w kategorii Polish Wikisource books, w kategorii autora (czy autorów), w kategoriach lat (np. 1901 books) co pozwoli zachować porządek.

[[Category:Polish Wikisource books]]
[[Category:Autor utworu]]
[[Category:YYYY books]]

Można kategorię utworzyć po przesłaniu całej książki, ale najpraktyczniejszym rozwiązaniem jest zazwyczaj próbne przesłanie jednej strony oraz utworzenie kategorii przed przesyłaniem następnych stron. Pozwala to na wczesne wykrycie literówek w deklaracji szablonu powtarzanego dla każdej ze stron. Można dzięki temu uniknąć konieczności mozolnego poprawiania wielu stron.

W treści strony kategorii należy umieścić szablon Book tak samo jak dla każdej strony książki. Opis jak to zrobić znajduje się poniżej w sekcji Przesyłanie właściwych plików.

Przesyłanie właściwych plików

Skany należy wgrać na serwer commons dbając o to by nazwy grafik były zgodne z przykładem:

PL Nazwisko autora-Tytuł książki 001.jpg

Oczywiście 001 należy zastąpić kolejnym numerem strony. Jeśli stron w książce jest więcej niż 999, to oczywiście należy użyć odpowiednio więcej zer wiodących np. 0001 lub 000000001. Grafiki z uwagi na ich zazwyczaj dużą liczbę najwygodniej wgrywać programem Commonist (opis po angielsku).

Opisując plik należy użyć szablonu Book. Po zapisaniu obrazka należy oczywiście utworzyć również kategorię [[Category:Tytuł utworu]] umieszczając w jej treści ten sam szablon.

W nazwach plików i kategorii nie należy używać prostych cudzysłowów ("), ponieważ może to powodować problemy w działaniu indeksu.

{{Book
|Author={{LangSwitch
|pl=
|en=}}
|Translator=
|Editor=
|Title=
|Subtitle=
|Series title=
|Volume=
|Edition=
|Publisher=
|Printer=
|Date={{date|}}
|City=
|Language={{Language|pl}}
|Description={{LangSwitch
|pl=
|en=}}
|Source=
|Image=
}}
{{PD-old}}
Nazwa parametru Opis
Author={{LangSwitch|pl=??? imię i nazwisko autora po polsku; należy linkować do Wikipedii;
Author=[[w:pl:Adam Mickiewicz|Adam Mickiewicz]]

jeśli wielu autorów wpisać wszystkich;

Author=[[w:pl:Adam Mickiewicz|Adam Mickiewicz]] [[w:pl:Adam Asnyk|Adam Asnyk]]

jeśli utwór został opublikowany jako anonimowy wystarczy nie wpisać autora;

Author=

bardzo dobrym rozwiązaniem jest użycie dodatkowego szablonu Creator, którego przykład można zobaczyć tutaj;

Author={{Creator:Adam Chmielowski}}
en=???}} imię i nazwisko autora po angielsku - sprawdzić dokąd prowadzi interwiki w polskiej Wikipedii; jeśli brak autora wpisać anonymous
Translator=??? Imię i nazwisko tłumacza lub imiona i nazwiska tłumaczy; jeśli jest artykuł o tłumaczu w Wikipedii należy do niej linkować; można zastosować szablon LangSwitch jak dla pola Author
Editor=??? Imię i nazwisko edytora, jeśli oryginalny tekst został zmieniony przez edytora na potrzeby druku; można jak dla Author użyć LangSwitch
Title=??? Tytuł książki; powinien być krótki
Subtitle=??? Podtytuł
Series title=??? Tytuł serii jeśli książka jest wydawana w serii
Volume=??? Numer tomu zwyczajowo zapisany cyframi rzymskimi
Edition=??? Numer lub nazwa edycji; zwyczajowo zapisane cyframi rzymskimi; w książkach zazwyczaj zapisane jest w formie "wydanie III skorygowane"
Publisher=??? Wydawca
Printer=??? Drukarnia
Date={{date|???}} Rok publikacji książki; w razie wątpliwości powinna to być to data uwidoczniona w książce lub najwcześniejsza z tych dat
City=??? Miasto lub miasta w którym pozycja została wydana; należy spróbować użyć szablonu {{Kraków}} umożliwiającego automatyczne tłumaczenie nazw miejscowości
City={{Kraków}}
Language=??? język publikacji; dla publikacji wielojęzycznych należy podać wszystkie języki; nazwy języków należy podawać w formie
Language={{Language|pl}} {{Language|fr}}
Description={{LangSwitch|pl=??? opis po polsku
en=???}} opis po angielsku
Source=??? źródło pochodzenia skanów; powinien to być link do strony biblioteki internetowej z zeskanowaną publikacją opisany nazwą tej biblioteki internetowej
Source=[http://pbi.edu.pl/xxx.php?publ=23 PBI]
Image=??? Odwołanie do pliku ze stroną okładki; bez File: ani nawiasów kwadratowych;
Image=???.jpeg

dla plików DjVu stronę wybiera się poprzez doklejenie do nazwy pliku parametru

Image=???.djvu{{!}}page=???

Przesyłanie plików programem Commonist z użyciem szablonu Book

Żeby zmusić Commonist do wpisania szablonu Book należy utworzyć plik o nazwie image_commons.bpp znajdujący się w systemach rodziny Unix w katalogu

~/.commonist

natomiast w systemach Windows

%HOMEPATH%\.commonist

W systemach Windows HOMEPATH zazwyczaj wskazuje na katalog "C:\Document and settings\Nazwa użytkownika".

Nowa treść

#// encoding: UTF-8
#// in: Upload upload
#
#// HACK: prevent nested information-templates
#if (upload.individualDescription.trim().startsWith("{{Information")) {
$(upload.individualDescription)	
#} else {
$(upload.description)
#}

Przykład oryginalnej treści

#// encoding: UTF-8
#// in: Upload upload
#
#// HACK: prevent nested information-templates
#if (upload.individualDescription.trim().startsWith("{{Information")) {
$(upload.individualDescription)	
#} else {
{{Information
|Description=$(upload.description)
|Source=$(upload.source)
|Date=$(upload.date)
|Author=$(upload.author)
|Permission=$(upload.license.wikiText)
|other_versions=
}}
$(upload.license.template)

$(upload.categories)
#}

Przesłane w ten sposób książki można, dla ułatwienia, połączyć w jeden plik PDF za pomocą narzędzia Merge2PDF.

Wgrywanie plików w formacie DjVu lub PDF

Plik w formacie DjVu czy PDF zazwyczaj zawiera wszystkie strony książki zebrane w jednym pliku. Oprócz obrazu graficznego często w pliku jest również przetworzona na znaki treść książki. Może to ułatwić pracę z tekstem na Wikiźródłach, ponieważ taka treść zostanie automatycznie zaimportowana przy tworzeniu strony.

W przypadku bardzo obszernych książek może wystąpić problem z załadowaniem takiego pliku z uwagi na ograniczenie wielkości pojedynczego pliku na serwerach Wikimedia do stu megabajtów. W 2013 ograniczenie to zostało zwiększone w niektórych wypadkach do 1 Gb (przeczytaj Commons:Commons:Maksymalny rozmiar pliku).

Korzystając z serwisu zbudowanego w oparciu o oprogramowanie dLibra (np. kpbc.umk.pl) należy wejść w treść książki (tak aby widzieć treść książki) korzystając z wtyczki dla systemu Windows; zapisać treść poprzez wciśnięcie przycisku z dyskietką - polecenie zapisz dokument i wybranie opcji "Scalony". Pobranie treści linkiem umieszczonym w panelu wydanie na przykład z okna opisu publikacji powoduje zapisanie każdej strony w osobnym pliku spakowanych w jednym archiwum.

W systemach Unix nie można pobrać książki w jednym pliku. Po pobraniu książki podzielonej na strony należy ją odpakować z archiwum, a następnie wywołać polecenie (zobacz pomoc dotyczącą edytowania plików w formacie DjVu)

djvm -c nowy.djvu plik_indeksu.djvu

powodujące zapisanie wszystkich stron w jednym pliku. Plik indeksu łatwo odnaleźć, gdyż ma on rozszerzenie djvu oraz zazwyczaj ma krótszą nazwę niż pliki stron ponieważ nie ma w nazwie numeru strony.

Plik w formacie DjVu należy wgrać na serwer commons dbając o to by nazwa była zgodna z wzorcem

PL Nazwisko autora - Tytuł książki.djvu
PL Nazwisko autora - Tytuł książki.pdf

Plik w formacie DjVu należy wgrać na serwer Commons dokładnie tak samo jakby wgrywało się książkę, ale złożoną z jednej strony, opisując ją tym samym szablonem, którym opisuje się pliki graficzne w innych formatach. Po wgraniu opis powinien zostać zmieniony na szablon Book.

Jeżeli plik, który został wgrany, nie wygenerował miniatury lub nie wyświetlają się strony skanu, to pomocnym będzie skompresowanie pliku, na przykład poprzez narzędzie dostępne z poziomu przeglądarki internetowej.

Szablony licencji na Commons

Aby plik nie został (często w trybie natychmiastowym) skasowany z Commons ważne jest podanie przy zamieszczaniu pliku właściwego szablonu licencji.

  • W przypadku gdy zamieszczony tekst nie znajduje się jeszcze w domenie publicznej, ale został opublikowany na wolnej licencji (innej niż GFDL) należy podać na commons dokładnie tę sama licencję, na jakiej został opublikowany u źródła (zwykle wybierając licencję z listy).
  • W przypadku gdy zamieszczony tekst znajduje się w domenie publicznej, niestety, trzeba najczęściej wpisać szablon licencji ręcznie, gdyż szablony dostępne na liście na ogół nie są właściwe. Zatem:
    • jeśli autor lub tłumacz zmarł przed 1.1.1954, a tekst opublikowano przed 1923 rokiem
      {{PD-old-auto-1923|deathyear=rok śmierci autora}}
    • jeśli autor lub tłumacz zmarł przed 1.1.1946, a tekst opublikowano w latach 1923-1953 na terenie Polski, Królestwa Kongresowego lub Galicji
      {{PD-old-auto-1996|deathyear=rok śmierci autora|country=Poland}}
      (podobnie dla Francji, Włoch, ZSRR)
    • jeśli autor lub tłumacz zmarł przed 1.1.1926, a tekst opublikowano w latach 1923-1953 na terenie Cesarstwa Niemieckiego, Republiki Weimarskiej lub III Rzeszy
      {{PD-old-auto-1996|deathyear=rok śmierci autora|country=Germany}}
      (podobnie dla Austrii, Wielkiej Brytanii)
    • jeśli autor lub tłumacz zmarł przed 1.1.1954, a tekst opublikowano w Stanach Zjednoczonych latach 1923-1977 bez zastrzeżenia praw autorskich
      {{PD-US-no notice}}
    • jeśli autor lub tłumacz zmarł przed 1.1.1954, a tekst opublikowano w Stanach Zjednoczonych latach 1923-1963 z zastrzeżeniem praw autorskich, ale praw autorskich nie odnowiono
      {{PD-US-not renewed}}
    • jeśli tekst opublikowano anonimowo przed 1923 rokiem
      {{PD-anon-1923}}
    • jeśli tekst opublikowano anonimowo w latach 1923-1946 na terenie Polski, Królestwa Kongresowego, Galicji, Francji, Włoch lub ZSRR
      {{PD-anon-1996|publication=rok publikacji}}
    • jeśli tekst opublikowano anonimowo w latach 1923-1926 na terenie Niemiec, Austrii lub Wielkiej Brytanii
      {{PD-anon-1996|publication=rok publikacji}}