Zum Inhalt springen

Benutzer Diskussion:Yellowcard/Zensus-Daten ohne Wikidata-Zuordnung

Seiteninhalte werden in anderen Sprachen nicht unterstützt.
aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 18. Februar 2022 um 23:09 Uhr durch G-41614 (Diskussion | Beiträge) (Neue WD-Datensätze). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Letzter Kommentar: vor 3 Jahren von G-41614 in Abschnitt Neue WD-Datensätze

Neue WD-Datensätze

Hallo Benutzer:Yellowcard, könntest du mir bitte kurz rückmelden, ob dieser neue Eintrag so in Ordnung ist: Equality (Q110630407). Ein Datensatz ist ja grundsätzlich in die Bereiche "Aussagen" und "Identifikatoren" aufgeteilt. Ich habe allerdings nirgendwo gesehen, wie man das "Identifikatoren"-Kapitel als solches anlegt, weiß allerdings auch nicht, ob man das tatsächlich so braucht (bzw. ob das für uns tatsächlich relevant ist). Noch eine Anmerkung: Bei neuen Datensätzen meckert WD, wenn man FIPS 55-3 (Orte in USA) (P774) anlegt, ohne gleichzeitig Staat (P17) anzulegen.

Bei der Formatierung der FIPS-Codes ist mir noch aufgefallen, dass teilweise der Bindestrich zwischen Bundesstaat-Code und Ortscode aufgeführt wird, teilweise wird er aber auch weggelassen. Vgl. Wilton Manors (Q940061) versus Valdosta (Q1010240). Kann man davon ausgehen, dass das egal ist? LG Stefan 00:11, 21. Jan. 2022 (CET)Beantworten

Edit: Soll man die Einwohnerzahl samt Quelle gleich mit einfügen - wie ich das in diesem Falle jetzt gemacht habe? Ich frage mich nur, weil sie in deiner umseitigen Anleitung nicht gefordert ist. LG Stefan 00:34, 21. Jan. 2022 (CET)Beantworten
Moin Stefan, erstmal danke für die viele Unterstützung. Equality (Q110630407) sieht doch sehr gut aus. Die Unterscheidung in "Aussagen" und "Identifikatoren" ist nur eine Darstellung auf Wikidata und wird automatisch generiert, in der Datenbank dahinter gibt es diese Unterscheidung gar nicht. Sobald Du die Seite aktualisierst (F5), sollte diese Unterscheidung erscheinen. Für uns macht das jedenfalls tatsächlich keinen Unterschied und ist völlig irrelevant.
Und Du hast recht, ich glaube, man benötigt noch ein paar Aussagen mehr, um ein "sauberes" Datenelement zu generieren. Staat (P17) hast Du ja schon erwähnt, und zusätzlich braucht man auch noch liegt in der Verwaltungseinheit (P131), wo man entweder den Bundesstaat oder sogar das/die County(s) angibt. Über diese Eigenschaft hole ich mir die jeweiligen Orte zu einem bestimmten Bundesstaat, insofern wäre das auch nicht unwichtig. Schreibe ich umseitig mal mit dazu.
Was die Einwohnerzahlen angeht: Das ist natürlich Premium, dass Du die 2010er-Zahlen mit aufgenommen hast. Das wäre zu diesem Zeitpunkt aber nicht zwingend notwendig, denn wenn das Item erstellt wurde (mit mindestens den Eigenschaften FIPS 55-3 (Orte in USA) (P774) und (131)), dann kriegt das jeweilige Item relativ zeitnah die 2020er-Zensuszahlen von mir verpasst (im ersten Durchlauf Einwohner, im weiteren dann Land- und Wasserfläche, und abschließend hoffentlich die Anzahl der Haushalte, da muss ich mich nochmal nach der korrekten Datenquelle im Wust der ganzen Zensus-Daten wühlen).
Bindestrich im FIPS-Code: Auf Wikipedia/Wikidata scheint es Konsens zu sein, zwischen zweistelligem Staatskürzel und dem fünfstelligen Code einen Bindestrich zu machen; in den Zensus-Daten findet sich hingegen kein Bindestrich. Für die Zuordnung filtere ich den Bindestrich eh heraus, für unseren Zweck ist das also egal. Ich denke, zwecks Einheitlichkeit auf Wikidata sollten wir den Bindestrich dort einfügen, aber wie gesagt - für unseren Zweck ohne Bedeutung, beide Wege funktionieren.
Nochmal danke! Liebe Grüße Yellowcard (D.) 09:21, 21. Jan. 2022 (CET)Beantworten
Danke für deine Rückmeldung. Habe jetzt schon einiges abgearbeitet. Eine letzte Frage noch: Ich gehe davon aus, dass es für uns auch keine Rolle spielt, wenn ein Ort umbenannt wurde? Hatte 3-4 Orte, wo das der Fall war, mir die aber jetzt nicht gemerkt. Ursprünglich wollte ich die Lemmata bei WD verschieben, hatte dann aber auf Anhieb keinen Hinweis gefunden, wie das geht. Habe dann lediglich jeweils den FIPS hinzugefügt. LG Stefan 01:09, 28. Jan. 2022 (CET)Beantworten
Hallo Stefan, wow, vielen Dank. Dann kann es ja mit Arkansas direkt weitergehen, was den Datenupload angeht. Ich schaue mal, ob ich heute Abend dazu komme!
Was das "Lemma" angeht, ein solches Lemma wie in WP haben die Wikidata-Einträge ja gar nicht, sondern ihre Eindeutigkeit kommt über die ID (Qxxxx). Dazu gibt es noch "Bezeichnung" und "Beschreibung" ist allen möglichen Sprachen, Du meintest wohl die Bezeichnung (die fehlt bei vielen Einträgen sogar für die deutsche Sprache; es wird dann als Fallback die englische Bezeichnung angezeigt. Die kann man über den "bearbeiten"-Link ganz oben rechts ändern. Ist aber für unseren Zweck tatsächlich völlig irrelevant - wir verbinden die Zensus-Daten mit den Wikidata-Einträgen ausschließlich über den FIPS-Code und liegt in der Verwaltungseinheit (P131), wo der Bundesstaat oder eine darunter liegende Einheit (z.B. das County) stehen muss; alle anderen Angaben sind egal. --Yellowcard (D.) 10:36, 28. Jan. 2022 (CET)Beantworten
Moin, kannst Du mir zwischendurch kurz sagen, ob es irgendwo eine FIPS-Suche nach Nummern gab? Frage mich immer wieder, wo die "falschen" FIPS-Codes herkommen und würde gerne nachschauen. Sorry wenn ihc mich mal wieder zu dämlich anstelle und das irgendwo ganz dick draufsteht. Gruß, --G-41614 (Diskussion) 12:55, 31. Jan. 2022 (CET)Beantworten
@G-41614 Versuche mal diesen Weg, auch wenn er nicht ganz so einfach ist: GNIS-Suche, Felder "State" (entspricht den ersten beiden Stellen des FIPS-Code) und "Census" (hier die letzten 5 Ziffern des FIPS-Code eingeben) ausfüllen und dann auf "Query" klicken. Man erhält Informationen zu County, Koordinaten etc. und kann damit den gesuchten Ort ermitteln. Gruß --Yellowcard (D.) 14:55, 31. Jan. 2022 (CET)Beantworten
Einfach genug, wenn man nicht so blöd ist, den Value unter Census Code zu übersehen - denken müsste man können. Ergebnis - den Code gibt es in dem Staat nicht. Tje nun - so wichtig, das ich alle 50 durchsuche, ist mir das dann auch nicht. Merci, --G-41614 (Diskussion) 15:27, 31. Jan. 2022 (CET)Beantworten

G-41614, Stefan: Habe einige Bundestaaten (Georgia, Hawaii, Idaho, Indiana, Illinois) ergänzt. Die Liste ist riesig lang, das liegt an Illinois. Ich vermute fast, dass da irgendein Bug oder irgendeine Illinois-spezifische Besonderheit drin ist, habe es mir jetzt aber noch nicht im Detail angesehen. Wer eine Erklärung hat, bitte melden - ich hoffe nicht, dass wir diese Liste wirklich abarbeiten müssen... Gruß Yellowcard (D.) 21:31, 31. Jan. 2022 (CET)Beantworten

Frage: In dieser Version war Marco Island, FL noch Teil der Liste. Bei deinem Update von gerade eben ist der Ort aber dann plötzlich verschwunden. Dass der Ort vorher noch da war, könnte womöglich ein technisches Problem gewesen sein, so wie jetzt mutmaßlich bei Illinois? Lake Worth Beach habe ich wohl auch eine eigentlich richtige FIPS-Nummer in eine falsche geändert, siehe unten. Irgendwie bin ich gerade verwirrt. LG Stefan 21:52, 31. Jan. 2022 (CET)Beantworten
Danke für den Hinweis zu Marco Island, das ist mir mit diesem Edit passiert. Das war ein Patzer beim Nutzen des Visual Editors, hat mit der Illinois-Situation aber (leider) nichts zu tun. Bei dem anderen schaue ich unten mal. Gruß --Yellowcard (D.) 22:09, 31. Jan. 2022 (CET)Beantworten
Bei Illinois scheint es tatsächlich so zu sein, dass es sehr viele Villages gibt, für die das Census Bureau einzeln die Einwohnerzahl erhoben hat, die zu einem großen Teil auch Wikidata-Items haben, dort aber die FIPS-Codes nicht enthalten sind. Puh, viel eintönige Arbeit, die da wartet. --Yellowcard (D.) 10:13, 1. Feb. 2022 (CET)Beantworten
Da müssen wir wohl durch. Ich habe eben Angelika Lindner angeschrieben, von der ich weiß, dass sie gerade im Bereich Illinois sehr aktiv war. Evtl. bekommt sie meine Anfrage ja mit. LG Stefan 12:01, 1. Feb. 2022 (CET)Beantworten

Nur dass (mir) das auch wirklich klar ist - wenn in der Liste ein Eintrag ohne WD-Objekt auftaucht wird das angelegt, egal ob es irgendwo im Wikiverse etwas damit zu verlinken gibt oder nicht. Korrekt? --G-41614 (Diskussion) 12:50, 4. Feb. 2022 (CET)Beantworten

@G-41614: Korrekt. Die Relevanzkriterien auf Wikidata sind erfüllt, und früher oder später werden die zugehörigen Artikel in der ein oder anderen Sprachversion ja auch entstehen. Und selbst wenn nicht, zur vollständigen Abdeckung seitens Wikidata gehören die Einträge eh dazu, auch wenn zunächst kein Wikipedia-Projekt profitiert. Liebe Grüße, --Yellowcard (D.) 00:11, 6. Feb. 2022 (CET)Beantworten
Heeey! Kleinen Moment mal eben, ich muß mal eben mein Konto verschieben. Neuer Benutzername: Sisyphos. --G-41614 (Diskussion) 22:12, 9. Feb. 2022 (CET)Beantworten
Neuanlagen sind in meiner Wahrnehmung aber derzeit so gut wie gar nicht notwendig, zumindest wenn ich mir Illinois anschaue. LG Stefan 11:28, 12. Feb. 2022 (CET)Beantworten
Von WD-Objekten? Ich glaube, eines war's bei mir bis jetzt, bei IL keines. Ließ sich alles finden, wobei mir massenhaft Objekte untergekommen sind, die sich mangels englischer Beschreibung nur auf französisch oder spanisch fanden. Respekt - willst Du so weitermachen? Wenn Du bei Arbeitsbeginn hier kurz erwähnen könntest, wo Du dran bist, könnte man sich bei Überschneidungen eine andere Ecke vornehmen. Gruß, --G-41614 (Diskussion) 11:55, 12. Feb. 2022 (CET)Beantworten
Ich fange jetzt einfach mal von vorne an, du könntest ja hinten anfangen und wir treffen uns in der Mitte. LG Stefan 15:01, 12. Feb. 2022 (CET)Beantworten
Senkrecht - was bei meiner Einzelstaatsorientierung bedeutet, das ich hinten bei IL weitermache. Wenn Yellowcard inzwischen Lust hat und dazu kommt, mitzumischen, steht Dir IA zur Gänze zur Verfügung. Aber nur, bis wir mit IL fertig geworden sind. :) --G-41614 (Diskussion) 16:47, 12. Feb. 2022 (CET)Beantworten
Ihr seid echt Spitze. Leider komme ich momentan kaum dazu. Ohne euch beiden würde das ganze Projekt gerade definitiv stehen. Dadurch dass ihr hier so fleißig seid, kann ich mich oft abends auch noch motivieren, ein paar zu erledigen oder aber schon die nächsten Staaten zu laden. Es ist zwar mühselig, aber wir kommen voran, 12 Bundesstaaten haben bereits die Einwohnerzahlen von 2020. Das schöne ist, dass damit auch die Grundlage gelegt ist für alle möglichen anderen Daten wie Anzahl der Haushalte, Medianeinkommen und so weiter.
Zumindest so lange, bis sich das Census Bureau entschließt, nicht mehr den FIPS-Code sondern den GNIS-Code zu verwenden. Das wollen sie ja iiiirgendwann machen. Dann geht unsere Arbeit von vorne los. Aber da die Ankündigung schon weit vor 2010 kam, glaube ich, wird das bis auf Weiteres nix - gut für uns. :) Nochmals, riesen Dankeschön an euch beide. --Yellowcard (D.) 21:48, 12. Feb. 2022 (CET)Beantworten
Immer langsam - im Moment ist Stefan hier alleine tätig, und ob ich heute abend noch ein paar schaffe glaube ich kaum. Am unteren Ende von M/IL habe ich schon ein paar erledigt, aber löschen möchte ich erst, wenn ich den Buchstaben durch habe. --G-41614 (Diskussion) 22:13, 12. Feb. 2022 (CET)Beantworten
Spätzündung - und daran erinnert der mich jetzt! Verdammt, da hätte man die GNIS gleich mit reinpflegen können ... nee, nicht ernsthaft. Danke, das Du das jetzt erst erwähnst, das hat auch so schon genug Zeit verschlungen! :) --G-41614 (Diskussion) 22:22, 12. Feb. 2022 (CET)Beantworten
Naja, die GNIS-Daten fehlen nach meiner Wahrnehmung allerdings deutlich seltener als die FIPS-Codes. Der Aufwand dürfte deutlich überschaubarer sein als der jetzige. Und außerdem wären eh noch 10 Jahre bis dahin. :-) Illinois sowie die Iowa-Places sind fertig. Muss man bei den County-Subdivisions irgendetwas gesondert beachten? Gerne kannst du @Yellowcard schon mal die nächsten Bundesstaaten hochladen. LG Stefan 16:12, 13. Feb. 2022 (CET)Beantworten
Du oben, ich unten. --G-41614 (Diskussion) 16:41, 13. Feb. 2022 (CET)Beantworten
Oder auch nicht. Die untersten drei Einträge existieren alle im GNIS nicht, zumindest dem FIPS nach, die angegebenen GNIS ergeben alle eine andere FIPS-Nummer, und die Rücksuche mit der aus Yellowcards Liste entnommenen FIPS ergeben Null, auch bekannt als gibt's nicht. Ehe ich da einfach auffindbare GNIS samt FIPs mit vollständig neuen FIPS ersetze würde ich da gerne Rücksprache halten - weiß jemand, wsa da los ist? Wurden da sämtliche GNIS und FIPS geändert? --G-41614 (Diskussion) 16:57, 13. Feb. 2022 (CET)Beantworten
Die Frage ist doch, was hat es mit diesen "county subdivisions" im Gegensatz zu den "Places" auf sich? Beispiel Sioux City: Der Census führt für die Stadt den FIPS-Code 1973335 (ganz unten in der Tabelle) an, der auch im WD-Eintrag bereits völlig korrekt eingetragen war. Ohne genau zu wissen, was das für Gebilde sind, stelle ich mal ganz spontan die Frage, ob wir die überhaupt brauchen? LG Stefan 17:52, 13. Feb. 2022 (CET)Beantworten
Die County Subdivisions sind mir auch ein Rätsel. Die Struktur und Bedeutung ist wohl von Bundesstaat zu Bundesstaat unterschiedlich. In einigen ist es offensichtlicher "Datenmüll" (also für uns sinnlos), dann habe ich sie direkt rausgeschmissen. In anderen Staaten sind sie überaus wichtig, insbesondere scheint das in New England der Fall zu sein - dort sind das nämlich die Towns und Townships. Wie das in Illinois ist, weiß ich natürlich nicht. Wenn ihr den Eindruck habt, dass die nicht sinnvoll zu nutzen sind (d.h. keine Artikel dazu sinnvoll wären), lasst uns da keine weitere Arbeit reinstecken.
Ich schaue mal, dass ich zeitnah die nächsten Datensätze aufbereite. Viele Grüße --Yellowcard (D.) 18:06, 13. Feb. 2022 (CET)Beantworten
Umseitig hat Sioux City 1993925, was mich dazu veranlasst hat, obige Frage zu stellen. Wenn wir die nicht brauchen, kann man sie weglassen, aber ich habe nun einmal keine Ahnung, was das ist. Wenn es in der Tabelle auftaucht, muss es auch in irgendeiner Form existieren und eine definierbare Eigenschaft haben und damit WD-fähig sein. Ob wir das dann doch nicht brauchen, keine Ahnung. Ansonsten gehe ich davon aus das wir, je nach Vermögen, so weitermachen wie bisher - einer unten, einer oben, so weit möglich. --G-41614 (Diskussion) 18:19, 13. Feb. 2022 (CET)Beantworten
Kannst gerne schon weitermachen, ich komme evtl. später am Abend wieder dazu. LG Stefan 18:24, 13. Feb. 2022 (CET)Beantworten
:J. Habe gerade einen Blick auf die County subdivisions in Kansas geworfen. Bel Air existiert als WD-Objekt zu Bel Air City mit GNIS/FIPS zu einem populated place Bel Air/Bellair; Bel Air wurde 1980 als City incorporiert. Mir fehlt da das genaue Wissen, aber ein pop. place ist, wenn ich das richtig verstehe, einfach eine physisch existierende Siedlung und eine City eine politische Abgrenzung. Eigentlich kein Problem, nur unterscheiden sich die Codes für GNIS/FIPS, so das eine eindeutige Zuordnung zwei WD-Objekte erfordert, denn zwei unterschiedliche FIPS in einem Objekt scheint mir nicht das Richtige zu sein. Da das WD-Objekt sich lt. Aussagen auf eine City bezieht, ändere ich das mal. Die Codes für den populated place müssten dann in ein separates Objekt gestellt werden. --G-41614 (Diskussion) 18:34, 13. Feb. 2022 (CET)Beantworten
Ich könnte mir zwei FIPS in einem Objekt schon vorstellen (auch wenn die Einstellungen auf Wikidata derzeit so sind, dass dann gemeckert wird - aber so intensiv wie wir hat da bislang wohl kaum jemand reingeschaut). Die Frage ist vermutlich: Unterscheiden sich das Objekt zum CDP und zum Populated Place so eindeutig, dass es auch nach unserem Verständnis zwei verschiedene Dinge sind (dann zwei WD-Objekte), oder ist es derselbe Ort, warum auch immer das Census Bureau da zwei FIPS-Codes vergibt (dann ein WD-Objekt)? Das sind vermutlich inhaltliche Fragen, die im Einzelfall geklärt werden müssten. Zu viel Zeit würde ich in einen Einzelfall, in Anbetracht der riesigen Menge an Daten, aber nicht stecken.
Zu Sioux City: In den Zensus-Daten gibt es einmal den "place" Sioux City city (FIPS-Code: 1973335, 85.797 Einwohner) und einmal die sub-county division (FIPS-Code: 1993925, 6 Einwohner, das ist der Eintrag, der in umseitiger Liste steht). Ich habe das Gefühl, dieses Ding mit den 6 Einwohnern ist "Datenmüll". Meine Meinung: Aus der Liste rausschmeißen, fertig, nächstes. ein SmileysymbolVorlage:Smiley/Wartung/:d  Grüße, Yellowcard (D.) 18:58, 13. Feb. 2022 (CET)Beantworten
Ich erlaube mir mal die Löschung dieser Einträge. LG Stefan 20:43, 13. Feb. 2022 (CET)Beantworten

Zwischenstand: Kansas und Kentucky in umseitige Liste hinzugefügt, Datenupload zu Illinois gestartet. Das sind immerhin die Bevölkerungsdaten zu 3040 Orten. Nicht schlecht. Yellowcard (D.) 18:51, 13. Feb. 2022 (CET)Beantworten

Kansas fast entsorgt. County Subdivision Bel Air FIPS-gleich mit place Bel Aire city 8als Anschauungsobjekt noch in der Tabelle, FIPS sollte stimmen), die anderen beiden habe ich mir nicht angeschaut. --G-41614 (Diskussion) 19:49, 13. Feb. 2022 (CET)Beantworten
Das ging ja schnell. Wer macht Kentucky? Wir brauchen wieder mehr Datensätze. :-) LG Stefan 20:01, 13. Feb. 2022 (CET)Beantworten
Und ich fand mich gerade sooo großzügig, das ich Dir KY gelassen habe. :) Imho kann man die letzten beiden Kansas-Zeilen entfernen - der FIPS ist der gleiche, das sieht aus, als sei da irgendwo ein Fehler in den Basisdaten passiert. Ich mach Schicht - genauer gesagt Abendessen. Gruß, --G-41614 (Diskussion) 20:09, 13. Feb. 2022 (CET)Beantworten
Kentucky ist erledigt. Der Eintrag Louisville/Jefferson County metro government (balance), Kentucky kann ja dann analog zu den Georgia-Countys nachbehandelt werden. LG Stefan 20:32, 13. Feb. 2022 (CET)Beantworten

Bevor hier wieder tonnenweise Datensätze zu County Subdivisions im Orkus verschwinden möchte ich vorschlagen, das man das zumindest für ME/MA nicht einfach so macht, sondern vorher sich das mal anschaut. Neu England tickt da manchmal anders als der Rest der Staaten. Ist ja auch die schönere Ecke :) Ich hatte eigentlich vor, LA heute noch fertig zu machen, aber aus Prinzip fange ich, wenn ich weiter mache, wieder unten an, im Moment also in MA. Gruß, --G-41614 (Diskussion) 18:52, 14. Feb. 2022 (CET)Beantworten

+1. Bei Maine ist es definitiv so, dass diese Einträge einen genauso großen Wert haben wie die CDPs, da die Towns dort als "county subdivision" geführt werden. Das habe ich letzten Sommer noch nicht gewusst, weswegen diese größtenteils bei dem Lauf mit den 2010er-Zensusdaten leer ausgegangen sind. Wenn wir die Wikidata-Einträge also alle auf Stand haben und für 2020 durch sind, würde ich da den 2010er-Lauf ggf. noch nachholen. Yellowcard (D.) 19:29, 14. Feb. 2022 (CET)Beantworten
Anders bei MA: habe nach ein paar Einträgen aufgehört, da die umseitig angegebenen FIPS samt und sonders zu anderen Orten vergeben sind. Bspw. Leominster, 34795 ist der FIPS der Town of Leicester, Millville, 41340 ist die Town of Millbury, bei ein paar anderen war das vergleichbar. Müsste man ggf. mal noch die ganze Liste durchgehen, aber bis jetzt gehörte jeder Fips zu einem anderen place. --G-41614 (Diskussion) 14:30, 15. Feb. 2022 (CET)Beantworten
Danke für den Hinweis, das schaue ich mir bei nächster Gelegenheit nochmal an. Vielleicht ist mir da auch irgendwo ein Fehler passiert, denn das klingt irgendwie eigenartig. --Yellowcard (D.) 16:06, 15. Feb. 2022 (CET)Beantworten
@Yellowcard: Verdammi, bloß nicht! Habe vergessen zu erwähnen, dass das nur für die County Subdivisions gilt!!! Sorry! --G-41614 (Diskussion) 16:38, 15. Feb. 2022 (CET)Beantworten
Solange das ungeklärt ist, würde ich mich von den Subdivisions fernhalten. LG Stefan 18:18, 15. Feb. 2022 (CET)Beantworten
Edit: Ich will aber noch dazu sagen, dass das bei Iowa genau dasselbe Problem war. Wenn die FIPS-Codes nicht zueinander passen, ist das für mich ein starker Hinweis, dass es sich bei diesen Subdivisions um ein Gebilde handelt, das aus unserer Sicht redundant zu den Ortsartikeln ist und auf WP zumindest mal nicht mit eigener Infobox abgebildet werden muss. Und darum geht es hier ja eigentlich. LG Stefan 18:27, 15. Feb. 2022 (CET)Beantworten
Nicht in Maine, die kann man abarbeiten. Bin da gerade ein wenig dran, aber wenn Du mir entgegenkommen möchtest lass Dich nicht aufhalten. Was die CDP angeht: Ich habe das mittlerweile in NH, ME und MA gesehen. Da gibt es eine Town mit einem CDP, der zur Gänze in dieser Town liegt und nicht eigenständig verwaltet ist, aber im Census separat erfasst. Vgl. Rumford (Maine), da ist das so. En:WP hat sogar getrennte Artikel. In MA sind mir bis jetzt zwei Orte begegnet, wo CDP=Town, was Fläche und Einwohner betrifft. Also ja, das gibt's. Gruß, --G-41614 (Diskussion) 15:54, 16. Feb. 2022 (CET)Beantworten
Und noch ein hübsches Beispiel zu Thema CDP's: Haverhill (New Hampshire) ist eine Town, zu der North Haverhill, Woodsville, Mountain Lakes und Pike gehören. Das macht die Town, drei CDP und ein Unincorporated Village, alle mit eigenen GNIS/FIPS-Codes. Im Artikel steht das alles noch nicht, der war schon blau, also habe ich daran noch nicht rumgestoppelt, also weiß ich einstweilen nicht, wie das mit den Verwaltungen aussieht. Gruß, --G-41614 (Diskussion) 16:05, 16. Feb. 2022 (CET)Beantworten
Du hast ja Penobscot Indian Island Reservation, Rumford town und South Oxford UT bearbeitet. Die kann man dann auch löschen, oder? Ich habe bisher gar nicht verstanden, was der Unterschied zwischen einem CDP und einem UT ist. Demzufolge verstehe ich auch nicht, wieso das eine unter "Place" und das andere unter "County Subdivision" geführt wird. Schwere Kost da im Nordosten... LG Stefan 17:41, 16. Feb. 2022 (CET)Beantworten
Sorry, wollte Dir noch weiter entgegen kommen, aber hier gab's Zustand. Hab sie gerade gelöscht. Wenn ich Dich und die WP an anderen Stellen richtig verstanden habe ist ein CDP eine statistische Einheit. Dagegen ist ein UT ein nicht administrativ zugeordnetes und politisch nicht definiertes Gebiet. Das mit dem Unterschied zwischen County Subdivisions und den places ist mir auch nicht klar, und der Versuch, auf den Census-Seiten etwas dazu zu finden, verlief bisher ergebnislos. Aber wo ich gerade wieder bei CDPs bin und von wegen statistisch: Mountain Lakes CDP liegt in den Towns Haverhill und Bath, und der Teil in Haverhill hat seine eigene Verwaltung mit dreiköpfigem Rat. Gruß, --G-41614 (Diskussion) 18:48, 16. Feb. 2022 (CET)Beantworten
Wie ist denn hier der Zwischenstand, gibt es noch generell ungeklärte Fragen (außer der Feststellung, dass man bei den county subdivisions bei jedem Bundesstaat neu beurteilen muss, ob sie für uns sinnvoll sind oder nicht)? Das Thema MA schaue ich mir gleich mal an, da gibt es ja noch Widersprüche in den FIPS-Codes, korrekt? --Yellowcard (D.) 19:13, 16. Feb. 2022 (CET)Beantworten
Nochmal zu diesem Thema, county subdivisions in Massachussets.
In den Zensus-Daten stehen seit 2020 nicht mehr konkret die FIPS-Codes, sondern eine "US Geo ID". Aus dieser habe ich versucht, den FIPS-Code zu extrahieren, und vielleicht klappt das bei den county subdivisions nicht so recht. Für Leominster, MA lautet dieser Code: 0600000US2502734795. Als System hatte ich eigentlich erkannt, dass die beiden Zeichen nach dem US plus die letzten fünf Ziffern den FIPS-Code ergeben. Die drei Zeichen dazwischen sind wohl eine weitere Untergliederung. Das hat bislang auch gut gepasst.
Bei Massachussets passt dies ebenfalls bei den "places", aber nicht bei den county subdivisions, und zwar durch die Bank nicht. Die so entstehenden FIPS-Codes gehören zu anderen Orten.
Ich schlage daher vor: Informationen zu county subdivisions in MA völlig ignorieren, ich lösche sie aus der Tabelle. Hattet ihr auf Basis dieser Tabelle für Orte, die als county subdivisions in MA in der Liste standen schon FIPS-Codes auf Wikidata geändert? Das müsste man dann wohl rückgängig machen. --Yellowcard (D.) 19:30, 16. Feb. 2022 (CET)Beantworten
Ich nicht. Aber ich glaube, wir brauchen dann demnächst Nachschub! :) Gruß, --G-41614 (Diskussion) 19:32, 16. Feb. 2022 (CET)Beantworten
Zu MA: Das bedeutet leider, dass ich zu einigen Orten wie bspw. Aquinnah (Q2418318) keine Einwohnerzahlen hochladen kann, obwohl diese in den Zensus-Daten vorhanden sind. Aber ich finde keinerlei Verbindung zwischen dem Code 0600000US2500577570 in den Zensus-Daten zu den Identifiern auf Wikidata. Wenn ihr da irgendeine Systematik findet, wie man die Informationen matchen könnte, bitte dringend her damit - sonst bleibt das ein kleiner Wermutstropfen.
Nachschub: Muss gleich los, aber ich bemühe mich vorher noch was zu generieren :) --Yellowcard (D.) 19:36, 16. Feb. 2022 (CET)Beantworten
In den county subdivisons ist ein Fehler in meinen Zensus-Daten. Die Zuordnung ist jeweils um eine Zeile verschoben. Das könnte die Erklärung für die ganze Verwirrung sein. Uff. Die Fehlersuche wird aber wohl bis zum Wochenende dauern. Bis dahin müssten wir uns auf die Places fokussieren, Nachschub kommt gleich. Verdammte Scheiße, hoffe, ich habe damit jetzt keine Nonsense-Daten auf Wikidata hochgeladen ... Muss ich mir in Ruhe ansehen. --Yellowcard (D.) 19:45, 16. Feb. 2022 (CET)Beantworten
Der Fehler scheint bei MA/MI zu beginnen und sich dann durch die Daten zu ziehen. Also Fehler rechtzeitig bemerkt. Gut dass ihr hier am Start seid. Fehler muss ich in Ruhe suchen (oder die Daten zu den county subdivisions ab MA neu herunterladen, vielleicht ist dabei auch irgendwo ein Fehler passiert), aber bislang nichts weiter passiert. Hab schon gedacht, dass ich da zu einem Großteil Murks-Daten nach WD hochgeladen hätte - zum Glück nicht.
So, genug Monolog, muss jetzt IRL-bedingt los. Ich bleibe aber dran, danke euch einmal mehr für die gewissenhafte Unterstützung, ich weiß nicht, wie zeitig mir das aufgefallen wäre ... Grüße in die Runde! --Yellowcard (D.) 19:58, 16. Feb. 2022 (CET)Beantworten

Fehler behoben. Habe jetzt die nicht gematchten Einträge zu Massachusetts, Michigan, Minnesota und Missouri hochgeladen. Kann sein, dass da jetzt durch diese Aktion ein paar bereits erledigte Einträge bei sind, dann tut es mir leid. Habe es zunächst auch nicht weiter auf Sinnhaftigkeit geprüft, in dem Sinne, ob die FIPS-Codes auf Wikidata nachgetragen werden sollten. Ein paar Einträge, die offenbar wenig sinnvoll sind, springen direkt ins Auge. Viele Grüße, Yellowcard (D.) 16:59, 17. Feb. 2022 (CET)Beantworten

Northview MO, letzter Eintrag. Wenn ich das richtig sehe gibt es eine Township of Northview, Webster County, 2806135, wo die ehemalige Township West Ozark ist, aber in keiner von beiden Listen (neu/verschwunden) auftaucht. Daneben gibt es die gleichnamige unincorporated community 735753 auf en:wp, samt WD-Objekt. Jetzt frage ich mich - neues WD-Objekt (einfache Lösung), oder gibt es statt der unincorporated community jetzt die umbenannte Township, und man müsste Objekt und en:wp ändern? GNIS ist nicht immer aktuell, scheint mir. Darüber Marshfield Twp East & Twp West, decken zusammen das Gebiet der City of Marshfield ab. Alle drei mit eigenen Codes und im Cenus. Denke im Moment, das erfordert zwei neue WD-Objekte, wobei ich im Moment keine Möglichkeit sehe herauszufinden, ob da vor den Twp's ausser der City noch etwas war, oder ob das komplette Neuschöpfungen sind. Wollte mal ganz allgemein nach Kommentaren fragen. Gruß, --G-41614 (Diskussion) 17:16, 18. Feb. 2022 (CET)Beantworten

Unklare Fälle

erledigtErledigt

Georgia ist erledigt, bis auf folgende vier Fälle:

  • Echols County consolidated government, Georgia
  • Georgetown-Quitman County unified government, Georgia
  • Macon-Bibb County, Georgia
  • Webster County unified government, Georgia

Dabei handelt es sich jeweils um das o. g. Verwaltungsgebilde (wäre auch mal als Artikel in de-WP interessant). Ich frage mich hier grundsätzlich, ob der FIPS-Code für Orte tatsächlich eingetragen werden soll, wenn bereits der County-Code eingetragen ist. Ich bin mir allerdings auch unsicher, ob das Problem in diesen vier Fällen überhaupt der fehlende FIPS-Code oder nicht etwas ganz Anderes ist. Vielleicht hat ja hier jemand einen besseren Überblick als ich. LG Stefan 00:19, 3. Feb. 2022 (CET)Beantworten

Meines Erachtens sind hier die FIPS-Codes für Orte nicht richtig und die FIPS-Codes für Counties schon korrekt. Würde die Einträge daher streichen. Diese Countys können die Daten dann mit dem Durchlauf auf County-Durchlauf erhalten. --Yellowcard (D.) 13:24, 8. Feb. 2022 (CET)Beantworten

Kaneohe Base CDP, Hawaii

erledigtErledigt

WD bietet als Eintrag die Marine Corps Base Hawaii (Q1887264) an, GNIS die Marine Corps Base Kaneheo, allerdings ohne den FIPS-Code, mit dem der Ort zweifelsfrei identifizierbar wäre. en:Marine Corps Base Hawaii sagt, das Census Bureau nennt diesen Ort Kaneohe Station (wenn es der gesuchte ist). LG Stefan 00:33, 3. Feb. 2022 (CET)Beantworten

Die Base gibt es beim Census als Suchergebnis, aber nicht in der Liste mit FIPS-Codes, die ich gefunden habe, die kannte nur Kaneohe und Kaneohe Station ... könnte was veraltetes sein. Da waren ein paar GNIS-ID mit nicht mehr passender FIPS in HI, die älter waren als die GNIS/FIPS aus der Liste. GNIS spuckt für die Kanehoe Base-FIPS Kanehoe CDP aus, witzigerweise würden die Koordinaten zur Basis passen, wenn die am Airfield liegt. Vllt. haben die da beim GNIS einfach nur das Wörtchen "base" vergessen? Nacht allerseits, --G-41614 (Diskussion) 01:23, 3. Feb. 2022 (CET)Beantworten
Genau so scheint es zu sein, habe den FIPS-Code in dem o.g. Item hinterlegt. Damit wäre Hawaii ja auch erledigt, klasse. Werde zeitnah für die nächsten Staaten die Liste aktualisieren - Illinois ist ja eher ein Projekt für sich bei der schieren Masse. Yellowcard (D.) 15:03, 8. Feb. 2022 (CET)Beantworten

Veazie CDP, Maine

Der CDP wird an der gleichen Stelle wie die Kleinstadt Veazie mit der selben Anzahl Einwohner verortet. Eine Stadt, die gleichzeitig auch ein CDP ist? Der FIPS-Code für die Stadt ist laut GNIS korrekt. Daher könnte man den Eintrag als Müll einfach löschen, oder? LG Stefan 18:14, 15. Feb. 2022 (CET)Beantworten

Hab's entsorgt. Die WPs, die einen CDP-Artikel darauf verlinken, müssen halt ein neues Objekt anlegen. Gruß, --G-41614 (Diskussion) 19:41, 16. Feb. 2022 (CET)Beantworten

Places in Massachusetts

Ich bin jetzt wirklich überfragt, ob es sich bei diesen Orten um jene handelt, die man in WD findet. Hier haben viele den Zusatz "Town", den man auch bei GNIS findet. In WD haben aber alle Einträge diesen Zusatz nicht und auch andere FIPS-Nummern. Aber andere Orte sind es deswegen doch nicht? Vielleicht kann @G-41614 als Neuengland-Experte sich das mal anschauen, bevor ich lauter WD-Dubletten anlege. LG Stefan 21:18, 15. Feb. 2022 (CET)Beantworten

Sorry, heute nicht mehr. Ich schau mal, das ich morgen dazu komme. --G-41614 (Diskussion) 23:44, 15. Feb. 2022 (CET)Beantworten
Zwischenbericht: Ich glaube, die Erklärung findet sich in der en:wp hier: en:Agawam, Massachusetts#Government. Dem EN kann ich nicht folgen, ich kriege eine Fehlermeldung, weil die Seite mich als Proxy-Server ansieht. Wäre gut, wenn einer von Euch da mal nachschauen kann. Wenn ich richtig liege, fehlt in den jeweiligen WD-Objekten einfach das Alias, und Town of Agawam City, oder Agawam Town city, ist das WD-Objekt Q577215 "Agawam". Über so etwas bin ich auch schon gestolpert und habe mir den Kopf zerbrochen, was da los ist, bis ich kapiert habe, das Town Namensbestandteil ist und nicht mehr zu bedeuten hat. DAs Problem scheint mir eher auf WD bei den vorhandenen FIPS-Codes zu bestehen. Dieses Objekt hat deren zwei, wobei 00840 die City Town of Agawam ist und 00765 Agawam Populated Place, was meines Wissens (danke für die Blumen, aber Experte bin ich noch nicht mal für NH, nur ein wenig, äh, fixiert) einfach eine Siedlung ohne politische oder Census-behaftete Bedeutung ist. Anhand der GNIS-Daten für den pop.place und die city gehe ich davon aus, das es sich dabei um nicht identische Angelegenheiten handelt und der Pop. Place einfach ein Ort innerhalb des Gebietes der City ist, aber ich kann das nicht belegen und mag mich irren. Soweit erstmal, Gruß --G-41614 (Diskussion) 13:05, 16. Feb. 2022 (CET)Beantworten
Bei der angegebenen Quelle kommt bei mir dieselbe Fehlermeldung. Es handelt sich also konkret um die Frage, ob in den WD-Datensätzen a) Agawam (Q577215), b) Amesbury (Q54176), c) Amherst (Q49164), d) Braintree (Q16101), e) Bridgewater (Q2086280), f) Easthampton (Q1988974), g) Franklin (Q942254) und h) North Attleborough (Q660960) der Code korrigiert werden muss oder nicht. Die Datensätze a, f und g haben einen GNIS-Link als Quelle, der nicht mehr abrufbar ist. b, c, d und e beziehen sich auf eine WP-Sprachversion und bei h fehlt der FIPS-Code ganz. LG Stefan 15:47, 16. Feb. 2022 (CET)Beantworten
Alle auf City-GNIS/FIPS geändert und aus Liste gelöscht. --G-41614 (Diskussion) 21:45, 16. Feb. 2022 (CET)Beantworten

County Subdivisions in Massachusetts

Was machen wir jetzt mit denen? Beispiel Barnstable: Der Census liefert die Ergebnisse Barnstable Town city, Massachusetts und Barnstable Town city, Barnstable County, Massachusetts mit jeweils genau derselben Einwohnerzahl. Im EN-Artikel heißt es nur, dass die Stadt aus mehreren Villages besteht. LG Stefan 18:06, 16. Feb. 2022 (CET)Beantworten

Das ist das gleiche. Wie bist Du drauf gekommen? Die Census-Suche gibt mir so etwas aus, je nachdem, welchen Suchbegriff ich eingebe, aber das ist die City (Verwaltungsform) Town of Barnstable (Name). In WD gehört da GNIS/FIPS zu Town of Barnstable City, aber der richtige, denn 00000 gibt es nicht. Wenn Du ein wenig mit den Ohren schlackern möchtest, versuch's mal mit dem nächsten Satz: lt. Tabelle 25-70605 Wellfleet, lt. GNIS ist 25-70605 die Town of Truro. Sorry, aber unter den gegebenen Umständen fasse ich das auch nicht an und warte ab, was Yellowcard dazu sagt. Gruß, --G-41614 (Diskussion) 18:35, 16. Feb. 2022 (CET)Beantworten
Ok, das ist wirklich schofel. Sorry, Yellowcard, aber die Liste vergibt 25-01370 zweimal, einmal an County Subdivision Belchertown town, einmal an die Town of Amherst city. Keine Ahnung, was da los ist, aber wenn hier jemand auf die Idee kommt, das samt und sonders zu löschen und zu ignorieren wird von mir derzeit kein Einspruch kommen. Gruß, --G-41614 (Diskussion) 19:29, 16. Feb. 2022 (CET)Beantworten
Siehe oben: Die Einträge zu county subdivisions ab MA folgend sind falsch. Nichts für ungut. Gut, dass ihr aufgepasst habt. --Yellowcard (D.) 20:00, 16. Feb. 2022 (CET)Beantworten