Dane o liczbie ludności – czego oczekują badacze? - Obserwatorium Polityki Miejskiej IRMiR
OPM
1901.2023

Dane o liczbie ludności – czego oczekują badacze?

  • Agnieszka Gajda
  • Artykuł

Szczegółowe dane o liczbie ludności są Świętym Graalem badań społeczno-ekonomicznych, zarządzenia kryzysowego i geomarketingu. Wykorzystywane przez specjalistów – nie tylko z wymienionych dziedzin – pozwalają skutecznie kreować polityki na szczeblu lokalnym i regionalnym.

Łatamy dziury w statystyce publicznej

W wielu krajach informacje o liczbie ludności na poziomie kwartałów, a przynajmniej dzielnic, są ogólnodostępne. Dużym krokiem naprzód w polskiej statystyce publicznej w 2011 roku było opublikowanie danych z Narodowego Spisu Powszechnego 2011 w formie wizualnej, na siatce 1×1 km. Od tego czasu ze strony GUS zapanowała jednak „cisza w eterze”. Każdy, kto kiedykolwiek próbował wykorzystać dane ludnościowe Banku Danych Lokalnych szybko odkrywał, że z rzeczywistą liczbą ludności mają one niewiele wspólnego (z kilku powodów – ale o nich nie dziś).

Ratunkiem dla szczegółowych analiz prowadzonych w Instytucie Rozwoju Miast i Regionów są od lat dane statystyczne z rejestru bazy PESEL. Pochodzące z niej dane punktowe, które pozwalają na dowolną agregację, są dla nas bezcenne, chociaż ich opracowywanie wymaga sporo pracy. To niestety nie jedyna wada – zawierają one wyłącznie informacje o osobach zameldowanych, co przy polskim podejściu do obowiązku meldunkowego obniża ich wartość. Pytanie zawsze brzmiało: jak dalece? Próbowaliśmy się posiłkować danymi dotyczącymi liczby podatników, liczby mieszkańców według deklaracji „śmieciowych” czy według zużycia wody – ale pozyskanie ich dla całego kraju okazywało się nierealne.

Dane z NSP 2021 – czy jednak do czegoś nam się przydały?

I oto nadszedł kolejny spis powszechny – Narodowy Spis Powszechny Ludności i Mieszkań 2021. Tym, co różni go od poprzednich, jest przypisywanie ankietowanych do miejsca zamieszkania, a nie zameldowania. W grudniu 2022 roku Główny Urząd Statystyczny zaprezentował dane ludnościowe z NSP 2021 na wspomnianej wyżej siatce 1×1 km. Dość szybko pojawiły się wykorzystujące je opracowania, np. porównujące liczbę ludności z 2011 i 2021 roku (niestety często nie uwzględniające różnicy w metodologii obu badań). W IRMiR-ze poszliśmy w innym kierunku. W związku z tym, że dysponujemy danymi statystycznymi pochodzącymi z rejestru bazy PESEL według stanu na dzień 31 grudnia 2021 roku (opierającymi się na informacji o miejscu zameldowania), postanowiliśmy porównać je z danymi z NSP 2021, które odnoszą się do rezydentów. Czy wyniki okazały się zaskakujące? Spójrzcie sami! Przygotowaliśmy zestawienie różnic na poziomie gmin oraz wskazaliśmy obszary o największym niedoszacowaniu liczby mieszkańców w największych miastach.

Na poziomie gmin zaskoczenia nie ma – największe niedoszacowania dotyczą dużych miast i ich otoczenia – obszarów, które również w perspektywie długoterminowej zyskują mieszkańców. Na drugim biegunie są gminy wyludniające się – nadwyżka meldunków nad rezydentami tylko to potwierdza.

Poniższa mapa jest dostępna w formie interaktywnej na naszym Geoportalu: https://bit.ly/geoportal-daneollud

Mapa przedstawiająca różnicę między liczbą rezydentów wg NSP 2021 a danymi statystycznymi pochodzącymi z rejestru bazy PESEL

W tabelach przedstawiono różnicę między liczbą rezydentów, a liczba meldunków z bazy PESEL.

Ciekawsza wydaje się kwestia obszarów o największym niedoszacowaniu liczby mieszkańców w miastach (poniżej).

  1. Kraków – na czele ex aequo dwa kwadraty – osiedla Avia/Dywizjonu 303 oraz fragment osiedla Ruczaj. Jeśli jednak porównamy odsetek „nadmiarowych” mieszkańców, zdecydowanie wygrywa Ruczaj.

 

2. Warszawa – tu również brak zaskoczenia. Na czerwono zaświecił się kwadrat, w którym jest zlokalizowane Miasteczko Wilanów

3. W Trójmieście niekwestionowanym zwycięzcą jest kwadrat obejmujący fragment osiedla Zaspa, jednak, znowu, jeśli weźmiemy pod uwagę odsetek ludności, wygrywa fragment intensywnie rozwijającej się w ostatnich latach dzielnicy Łostowice.

Co zaskakujące, na tym kończy się dominacja różnic na nowych osiedlach. Pozostałe miasta to obszary o znacznie starszej zabudowie.

4. Szczecin – fragment śródmieścia w okolicy alei Piastów.

5. Poznań – osiedle Jeżyce.

6. Łódź – południowa część Bałut.

7. Wrocław – Śródmieście w okolicy dworca kolejowego.

8. Konurbacja katowicka – śródmieście Chorzowa.

Jakość danych to jakość badań, czyli walcząc z ograniczeniami

Każdy, kto pracuje z danymi, szczególnie zaś z danymi ilościowymi, ma świadomość, że do prowadzenia rzetelnych analiz są niezbędne rzetelne (tj. odpowiadające stanowi faktycznemu) dane. Zgodnie z oczekiwaniami badaczy dane wykorzystywane na potrzeby zarządzania, prac naukowych i badawczo-rozwojowych powinny być przypisane nie do gminy, a – o ile to możliwe – do punktu adresowego. Stan technologii na to pozwala.

Ograniczenia w rozdzielczości, jakości i dokładności danych, których doświadczamy, zmuszają nas, badaczy, do poszukiwania alternatywnych źródeł bądź generalizacji, na które wewnętrznie się nie zgadzamy. W konsekwencji mogą one prowadzić do niedomówień lub po prostu błędnego wnioskowania – ale to już temat na inny wpis.

Źródła danych:

www.stat.gov.pl (dane  z NSP2021)

Dane statystyczne pochodzące z rejestru bazy PESEL (stan na 31.12.2021)

www.geoportal.gov.pl – Ortofotomapa