User:Czupirek/resources/zabytki
Uwaga - w przykładach występuje czasem występuje konkretne województwo, najczęściej Pomorskie - Q54180.
Patrz też: moje notatki na plwiki
Przydasie
[edit]
Problemy
[edit]Braki w bazie
[edit]- elementy brakujące w ogóle:powinno takich nie być, gdyż osobiście załatwiam to poprzez OpenRefine. Powinno być w miarę kompletne w stosunku do ostatnio opublikowanego pliku CSV na stronie nid.pl. Przy czym zdarzają się różnice miedzy csv i pdfami, np. w csv nie ma wszystkich pozycji pt. "zespół dworu w", ale z drugiej strony w csv bywają bardziej rozpisane pozycje typu "ogrodzenie z 4 kapliczkami", gdzie każda ze składowych ma swoje oddzielne inspire id.
CZYLI: braków nie powinno być, prędzej duplikaty, te są na pewno.
Duplikaty
[edit]Różne pomysły na szukanie.
- Założenie: duplikaty nie mają INSPIRE id (P4115), tj. jedno ma, a drugie nie ma. Sposoby na szukanie tych, które nie mają:
- zapytanie SPARQL: istnieje status dobra kultury: zabytek nieruchomy, brak inspire id
- sparql: istnieje nr zabytku, brak inspire id - >6k wyników, ale dużo wielokrotnych. Uwaga: z tego w zasadzie nie ma sensu nic brać, to bardziej lista informacyjna pt. "ile zostało".
- petscan istnieje artykuł na plwiki, brak inspire id - blisko 3000 pozycji, część false positives. Duży potencjał listy. ożna to sobie ograniczać, np:
- Artykuły na plwiki, które mają podstawowe braki w WD
- w ogóle puste elementy Q
- brak country (P17)
- brak located in the administrative territorial entity (P131)
- brak numeru zabytku
współrzędne
[edit]- podwójne współrzędne sparql:
- różnica we współrzędnych między Commons a Wikidanymi
Powiązania z Commons
[edit]Żeby było powiązanie, to:
- kategoria na Commons musi zawierać szablon {{Wikidata infobox}} (jest w wybieraczkach nad okienkiem do opisu zmian)
- na wikidanych element Q musi mieć w powiązanych linkach - sekcja "Inne projekty" - link do kategorii, zaczynający się od "Category:"
- alternatywnie - ale jest to bardzo rzadko spotykana wersja, wiec można o niej nie myśleć - kategoria commons mogłaby mieć swoje odrębne Q i wtedy byłoby ono wstawiane jako wartość dla własności "kategoria commons - P625. ALE to się dzieje naprawdę bardzo, bardzo rzadko.
do naprawy
[edit]- kategorie na Commons, które mają szablon Zabytek oraz pusty Wikidata infobox, czyli nie ma w wikidanych elementu, który jest do tej kategorii przypisany
Jak szukać prawidłowych Q?
[edit]- po linkujących do miasta/wsi.
- W WD wyszukujesz odpowiednią miejscowość
- klikasz "Narzędzia" -> "Linkujące" (albo ctrl+alt+J)
- i szukasz :-)
- to dobrze działa przy wsiach i małych miejscowościach.
- po mapie
- mapa konkursowa
- mapa ze sparql, można zmieniać parametry
- Openrefine - metoda wymagająca wgryzienia się i czasochłonnego przygotowania, za to potem dostajesz wyszukiwarkę na sterydach.
Stara wersja strony
[edit]Z problemami
[edit]problem | gdzie znaleźć | uwagi/recepty |
---|---|---|
Brak współrzędnych geograficznych | * woj. opolskie - zabytki bez współrzędnych | Jest dość jeszcze skomplikowany sposób wyciągania współrzędnych z zabytek.pl; jeśli uda mi się go uprościć, to się podzielę. |
Brak Inspire ID | [1] | Spoiler alert. Tutaj sporo faktycznie nie ma, bo już ich nie ma w aktualnej wersji rejestru. |
zabytki na plwiki bez inspire id
MAPA z podziałem na kolory (pomorskie) |
||
Zabytki na commons bez powiązania z WD: brak szablonu wikidata infobox | Pomorskie: zabytki - kategorie na commons bez szablonu {{Wikidata infobox}} | Sposób 1
Sposób 2 Jeśli typ zabytku jest jakoś sensownie określony, to można wyciągnąć listę na wikidanych. Przykład: kościoły w Pucku |
Zabytki na commons bez powiązania z WD: z pustym szablonem wikidata infobox | o ten oto petscan | rozwiązanie jak wyżej |
Duplikaty | patrz niżej | |
artykuły na plwiki bez elementu WD | [2] |
Duplikaty
[edit]Problem: wiele obiektów występuje na WD podwójnie, najczęściej z powodu:
- importu danych na podstawie INSPIRE id, gdy sporo zabytków wprowadzanych wcześniej tego id nie miało.
- dodania nowego artykułu na Wikipedii i przypisania go do nowego elementu, zamiast do już istniejącego.
Rozwiązania, czyli jak wyszukać zabytki z problemami
[edit]Z mapą
[edit]Szukanie po mapie.
- Używa się mapki do konkursu Wilki Lubi Zabytki
- Tam: zoom na wybraną okolicę.
- Szukamy miejsca, gdzie w grupce pojawia się > 1 zabytek i tam:
- zdarza się, że dwie kropki występują w jednym miejscu albo bardzo blisko siebie, czyli mogą być duplikatami;
- warto też patrzeć na listę zabytków po lewej. Podejrzane są sytuacje pt. "Kościół św. X" - bez podanej nazwy miejscowości, wówczas często jest też analogiczna pozycja "Kościół św. X w miejscowości Y".
Artykuły z Wikipedii z niepełnymi WD
[edit](dla pustych artykułów z Wikipedii) - szukanie poprzez PetScan
recepta na naprawianie
[edit]- Wybieramy sobie dowolną listę z podanych niżej.
- Potem szukamy w WD miejscowości, do której przynależy dany obiekt;
- na miejscowości klikamy "Linkujące";
- szukamy naszego duplikatu - najczęściej to będzie nazwa bez miasta, np. samo "Kościół św. Anny" zamiast "Kościół św. Anny w Myszkowie";
- scalamy oba.
- Po scaleniu często pojawiają się dwie lokalizacje (mapka). Należy wybrać jedną i ustawić jej rangę "preferowana".
Przykłady do wyszukiwania
[edit](da się wymyślić dużo więcej kombinacji przyjmując różne założenia, czego nie wypełniono w WD):
- Zapytanie dla kościołów: wyniki dla WD - mniej przyjazne, ale mniej klikania lub wyniki dla plwiki - przyjaźniejsze, ale trzeba się i tak wklikać w WD
- Lista artykułów, które są w rozmaitych podkategoriach "Zabytków", ale nie mają inspire id
są na plwiki, ale bez parametru inspire id na WD.
[edit]Najczęściej duplikaty czegoś istniejącego już w bazie: |petscan - pomorskie | [ https://petscan.wmflabs.org/?psid=24825132 | petscan - cała Polska]
OpenRefine
[edit]- Skomplikowana metoda uwzględniająca OpenRefine. Nie będę opisywać, wymaga wielu godzin pracy wcześniej.
Zabawki
[edit]- Pomorskie: kościoły szachulcowe do oznaczenia jako made from material (P186):wattle and daub (Q1368940) (uwaga, potem trzeba się oczywiście przeklikać i dodać źródło z zabytek.pl)