Wikiźródła:Narzędzia/Popraw tekst OCR
Gadżet dodaje przycisk ( w standardowym pasku narzędzi edycyjnych) do paska narzędzi edycyjnych, który poprawia format tekstu oraz typowe błędy OCR w oknie edycji proofread.
Gadżet posiada także wersję przystosowaną do poprawy tekstów wierszowanych (<poem>
). Aby ją włączyć należy w swoich Preferencjach zaznaczyć opcję opisaną:
W tej wersji gadżet poprawia błędy OCR, lecz nie usuwa podziałów wierszy; opcjonalnie dodaje na początku i końcu strony, znaczniki <poem></poem>
(dodawanie znaczników w tym trybie można włączyć w sposób opisany w sekcji Instalacja).
Instalacja
edytujAby skorzystać ze skryptu wystarczy w preferencjach w sekcji Gadżety zaznaczyć pole obok nazwy skryptu.
Jeżeli chcesz, aby w wersji dla Poezji dodatkowo dodawał na początku i końcu strony znaczniki <poem></poem>
wklej, w swojej przestrzeni użytkownika, na stronie common.js (lub na stronie globalnej meta:Special:MyPage/global.js, jeżeli używasz), następujący kod:
/* Dodawaj znaczniki <poem> w trybie dla poezji */ jQuery(document).ready(function($) { if ( mw.user.options.get( 'gadget-Typo-pl-poem', 0) == 1 ) { $.typo.add(function(str,poem) { if ( poem === "poem" ) { str = '<poem>\n' + str + '\n</poem>'; } return str; }); } });
Funkcje
edytujObecnie skrypt realizuje następujące poprawki:
- usuwa łączniki opcjonalne,
- usuwa podziały wiersza, (nieaktywne w trybie dla Poezji)
- usuwa zbędne odstępy przed i po akapicie,
- usuwa znaki
■
,•
,_
,·
, - zamienia wiele spacji na jedną
- zamienia
"tekst"
na„tekst“
(poza tagami html i mw), - zamienia
-
na—
(jeżeli znak "-" nie łączy wyrazów), - usuwa zbędne odstępy przy znakach
„“
,,
,.
,…
, - zamienia
{{tab}}—_1_
na{{tab}}—_I_
- zamienia
_tern
na_tem
. - zamienia
/.
naz
- zamienia
_011_
na_on_
- zamienia
cb
nach
(poza wyrazami kończącymi się na...cby
) - zamienia
ćh
nach
- zamienia
c[lł]i
nach
- zamienia
ź[eaoąęiuóy]
naż[eaoąęiuóy]
- zamienia
_iź
na_iż
- zamienia
iź_
naiż_
- zamienia
_teź
na_też
- zamienia
_[bB][yv][lł]_
na_był_
- zamienia
_[\iv]v_
na_w_
- zamienia
_v[/]_
na_w_
- zamienia
_\\’_
na_w_
- zamienia
czvm
naczym
- zamienia
[0-9]O
na[0-9]0
- zamienia
_0[a-z]
na_O[a-z]
- zamienia
_aui_
na_ani_
- zamienia
_si[ąo]_
na_się_
- zamienia
_juz_
na_już_
- zamienia
ó_
nać_
- zamienia
ćj
naéj
- zamienia
tć
naté
- zamienia
slde
naskie
- zamienia
_oc[lł]
na_od
- zamienia
_dła_
na_dla_
- zamienia
[a-z]6[a-z]
na[z-a]ó[a-z]
- zamienia
[a-z]1[a-z]
na[z-a]l[a-z]
- zamienia
_[!?.,:;]
na[!?.,:;]
- zamienia
'
na’
- zamienia
_<br />
na<br />
- zamienia
—
na_—_
- zamienia
{{tab}}_
na{{tab}}
- zamienia
n. p.
nan. p.
- zamienia
i_t._[pd].
nai t. [pd].
- zamienia
t._zw.
nat. zw.
- zamienia
t._j.
nat. j.
- zamienia
p._t.
nap. t.
- zamienia
ś. p.
naś. p.
- zamienia
n. p. m.
nan. p. m.
- dodaje znaczniki
<poem></poem>
na początku i końcu strony (jedynie w trybie dla Poezji)
Autor
edytujSkrypt jest zmodyfikowaną przez Zdzislawa wersją Skryptu fr:MediaWiki:Gadget-Typo.js, którego Autorem jest Marc oraz Tpt, jeśli masz jakieś uwagi co do działania skryptu, zostaw wiadomość na stronie dyskusji.