Viac

Výpočet plošného váženého priemeru atribútov v jednej vrstve podľa tvaru v inej pomocou ArcGIS pre počítač?


Pre projekt, na ktorom pracujem, by som chcel pretínať okresy reakcie hasičských staníc s údajmi o príjme a určiť stredný príjem na okres zásahu. Okraje vrstiev sa však zjavne nezhodujú. Aký je najlepší spôsob manipulácie s údajmi, aby výstup ukazoval stredný príjem na základe okresov odpovedí?

Pre túto analýzu používam ArcMap 10.2.2. Mám polygónový tvarový súbor s informáciami o mediáne a polygónový tvarový súbor hasičských staníc najskôr v oblastiach odpovedí.


Som si istý, že ide o duplikát niečoho, ale je jednoduchšie ho práve teraz napísať. Pretože máte konštantnú hodnotu stredného príjmu, na dosiahnutie priemerného stredného príjmu potrebujete iba percento oblasti reakcie na oheň, ktoré predstavuje každý príjem.

Uistite sa, že máte vo svojich dvoch súboroch atribút oblasti, ktorý je oddelený od automaticky sledovaného (ak existuje - nebude v súbore tvarov), ktorý sa počíta pre celý tvar.

Pretínajte svoju oblasť reakcie na oheň a polygóny s príjmom. Výsledkom by mala byť sada mnohouholníkov s rozrezanými úrovňami príjmu a identifikovanými podľa oblasti odozvy. Vytvorte nové pole v tejto tabuľke, aby ste udržali percento z celkovej plochy. A ak nie je, potrebujete nové pole oblasti pre nové vyrezané tvary. Vypočítajte pole, ktoré predstavuje nové pole, aby sa vydelila celková plocha zóny reakcie na oheň (mala by byť atribútom pre každý riadok) oblasťou tohto skutočného kusu.

Teraz vytvorte ďalšie nové pole a vypočítajte pole tak, aby to bolo percentuálne vyjadrené ako stredný príjem. Na záver použite súhrnnú štatistiku s ID zóny požiarnej odozvy ako pole PRÍPAD a vaše percento stredného poľa ako štatistické pole s typom sumy. Nakoniec otvorte túto tabuľku a potom pridajte posledné pole, ktoré vydelí túto sumu frekvenčným poľom. To by mal byť stredný príjem pre zónu. Aby ste dostali atribút do tvaru, budete musieť pripojiť túto tabuľku späť k zónam reakcie na oheň (alebo použiť Pripojiť pole) na základe ID.


Vykonajte analýzu

Táto téma pojednáva o štandardných nástrojoch priestorovej analýzy dostupných na portáli. Informácie o nástrojoch analýzy veľkých dát nájdete v časti Vykonanie analýzy veľkých dát. V časti Pochopenie analýzy v ArcGIS Enterprise nájdete prehľad každej sady nástrojov.

Predstavte si, že ste dostali za úlohu vyhodnotiť potenciálne stránky pre nový sklad. Toto hodnotenie má byť založené na prístupe k doprave, prítomnosti zvláštnych obmedzení, ako sú blízke historické štvrte, prístup k reštauráciám a iným zariadeniam, ktoré môžu zamestnanci potrebovať, prístup k verejnej doprave pre zamestnancov a blízke využitie pôdy, ktoré môže obmedzovať alebo zlepšovať rozvoj . Ako hodnotíte tieto stránky vyčísliteľným a obhájiteľným spôsobom? Potrebujete samozrejme údaje, ale tiež potrebujete nástroje, ktoré dokážu analyzovať a merať geografické vzťahy.

Kedykoľvek sa pozriete na mapu, začnete ju premieňať na informácie tým, že budete hľadať vzory, hodnotiť trendy alebo robiť rozhodnutia. Tento proces sa nazýva priestorová analýza a je to to, čo naše oči a mysle robia prirodzene, kedykoľvek sa pozrieme na mapu.

Ale veľa vzorov a vzťahov nie je vždy zrejmých pri pohľade na mapu. Často je príliš veľa údajov na to, aby ste ich mohli prehľadať a zobraziť na mape súvisle. Spôsob, akým zobrazujete údaje na mape, môže zmeniť vzory, ktoré vidíte. Nástroje priestorovej analýzy vám umožňujú kvantifikovať vzory a vzťahy v dátach a zobraziť výsledky ako mapy, tabuľky a grafy. Nástroje priestorovej analýzy vám umožňujú odpovedať na otázky a robiť dôležité rozhodnutia pomocou viac ako vizuálnej analýzy.

Ak sa chcete dozvedieť viac o prístupe a spustení nástrojov, prečítajte si tému Používanie analytických nástrojov. Prehľad každého z týchto nástrojov nájdete nižšie. Analytické nástroje sú usporiadané do kategórií. Tieto kategórie sú logické zoskupenia a nijako neovplyvňujú spôsob, akým k úlohám pristupujete alebo ich používate.

Ak ste vývojári, k týmto nástrojom máte prístup prostredníctvom rozhrania REST API služby Spatial Analysis Service a rozhrania ArcGIS API pre Python.

Ak nevidíte tlačidlo Analýza v Prehliadači máp, kontaktujte svojho správcu portálu. Váš portál nemusí byť nakonfigurovaný na používanie analytických nástrojov alebo nemáte oprávnenie na spustenie týchto nástrojov. Ak nemáte potrebné povolenia pre nástroj, nástroj pre vás nebude viditeľný.


Výpočet plochy, dĺžky a ďalších geometrických vlastností

Nástroj Vypočítať geometriu vám umožňuje prístup k geometrii prvkov vo vrstve. Nástroj môže vypočítať hodnoty súradníc, dĺžky a plochy v závislosti od geometrie vstupnej vrstvy. Plochu, dĺžku alebo obvod prvkov môžete vypočítať, iba ak je premietaný použitý súradnicový systém. Majte na pamäti, že rôzne projekcie majú rôzne priestorové vlastnosti a skreslenia. Ak súradnicový systém zdroja údajov a údajového rámca nie sú rovnaké, môžete pri výpočte geometrie pomocou súradnicového systému údajového rámca získať iný výsledok, ako pri výpočte pomocou súradnicového systému zdroja údajov. Pri výpočte plôch sa odporúča použiť projekciu na rovnakú plochu.

Ak chcete vypočítať Xmin, Xmax, Ymin alebo Ymax, môžete to urobiť pomocou Pythonu s poľnou kalkulačkou, pozri Príklady výpočtu poľa.

Dialógové okno Vypočítať geometriu môžete použiť na aktualizáciu oblasti, dĺžky alebo obvodu prvkov tvarového súboru, pretože tieto vlastnosti sa pri úprave prvkov v tvarových súboroch neaktualizujú automaticky.

Hodnoty súradníc z alebo 3D merania môžete vypočítať, iba ak je objekt z vedomý. Hodnoty súradníc Z a 3D merania je možné vypočítať bez ohľadu na zvolený súradnicový systém. Jednotky uvedené pre výpočty z a 3D sú rovinné (míle, metre atď.), Pokiaľ bol pre vrstvu definovaný vertikálny súradnicový systém. Ak údaje nemajú definovaný vertikálny súradnicový systém, jednotky sa zobrazia ako neznáme. Ďalšie informácie o hodnotách z a typoch geometrie prvkov nájdete v časti Základné informácie o triede prvkov.

Výpočty môžete robiť bez toho, aby ste boli v relácii úprav. V takom prípade však neexistuje žiadny spôsob, ako vrátiť späť výsledky.

Geometrické výpočty môžete vykonávať iba v tabuľkách atribútov.

Môžete tiež stlačiť kombináciu klávesov CTRL + SHIFT + G a otvoriť dialógové okno Vypočítať geometriu.

K dispozícii sú rôzne vlastnosti v závislosti od typu vrstvy, ktorú používate.

Ak počítate do textového poľa, môžete si do výpočtu pridať skratku jednotiek. Napríklad 47 5673 metrov štvorcových je príkladom výstupu plochy vypočítanej do textového poľa so skratkou jednotiek.

Výpočet poľa nemôžete vrátiť späť, keď sa vykonáva mimo relácie úprav.

Ak sa chcete vyhnúť varovnej správe pri pokuse o výpočet hodnôt mimo relácie úprav, môžete v správe začiarknuť políčko Neupozorňovať ma znova. Varovnú správu môžete znova zapnúť na karte Tabuľky v dialógovom okne Možnosti ArcMap.

Dialógové okno Vypočítať geometriu rešpektuje počet desatinných miest (štandardne tri) zadaný na karte Všeobecné v dialógovom okne Možnosti úprav. Ak chcete toto nastavenie zmeniť, kliknite na ponuku Editor na paneli nástrojov Editora a potom na položku Možnosti. Toto nastavenie je uložené v mapovom dokumente.


2. Metódy

2.1. Štúdijná populácia

SEER-Medicare predstavuje dátovú väzbu medzi údajmi o rakovine SEER a tvrdeniami Medicare (Engels et al., 2011). SEER je program Národného inštitútu pre rakovinu, ktorý zhromažďuje individuálne informácie o incidencii a prežívaní rakoviny na úrovni jednotlivcov z 18 populačných registrov rakoviny, ktoré pokrývajú 28% USA. Medicare je americký federálny program zdravotného poistenia pre kvalifikovaných jednotlivcov & # x0226565 rokov, pokrývajúci 97 % tejto vekovej skupiny, okrem tých & # x0003c65 rokov s terminálnym ochorením obličiek (ESRD) alebo zdravotným postihnutím. Všetci príjemcovia v rámci programu Medicare majú nárok na časť A (nemocenské poistenie), približne 96% sa zaregistruje v časti B (zdravotné poistenie), 24% sa zaregistruje do programu Medicare Advantage alebo na plán riadenej starostlivosti (napr. Organizácia na údržbu zdravia [HMO]) a 38% zapísať sa do časti D pokrytie liekov na predpis (Engels et al., 2011 The Kaiser Family Foundation, 2007). Časť C nespracováva účty prostredníctvom služby Medicare. Dátové spojenie SEER-Medicare obsahuje všetky prípady rakoviny SEER aj v registračnej databáze Medicare. Nároky Medicare sú spojené s prípadmi prostredníctvom osobných identifikátorov, napr. Rodného čísla. Prepojenie údajov z roku 2012 zahŕňa prípady SEER od roku 1991 do roku 2009 a žiadosti Medicare od roku 1991 do roku 2010. Prepojenie SEER-Medicare je 94% úspešné u osôb starších ako 65 rokov (3% starších ľudí nedostáva Medicare a 3% nemajú dostatočné informácie o prepojení ). Údaje o rakovine SEER pre celý štát Kalifornia sú k dispozícii od roku 2000 (National Cancer Institute, 2015).

2.2. Zistenie prípadu a kontroly

Účastníci štúdie boli spôsobilí na zaradenie do tejto štúdie, ak boli známi rasy a obyvatelia Kalifornie mali najmenej 13 mesiacov nepretržitej časti A a B, pokrytie inými ako HMO a aspoň jedno kalifornské poštové smerovacie číslo (používa sa) pre doručenie pošty v USA) k dispozícii v čase diagnostiky / výberu. Spis zahŕňal iba prípady rakoviny pečene. Prípady boli definované pomocou nasledujúcich kritérií: Medzinárodná klasifikácia chorôb pre onkológiu, tretie vydanie (ICD-O-3), topografický kód C22.0 (primárny karcinóm pečene) a histologické kódy ICD-O-3 8170 až 8175 (Fritz a kol. , 2000) diagnostické potvrdenie (napr. Pozitívna histológia) s výnimkou iba klinickej diagnózy (Davila et al., 2005) sekvenčné číslo 00 alebo 01 hlásené do kalifornského registra rakoviny diagnostikované v rokoch 2000 až 2009 a nehlásené iba prostredníctvom pitvy alebo úmrtného listu. Kontroly boli vybrané z 5% náhodnej vzorky príjemcov Medicare s bydliskom v geografických oblastiach SEER. Počas kontrolnej selekcie sa použil iba súbor prípadov rakoviny pečene a 5% náhodná vzorka jedincov bez rakoviny. (Davila a kol., 2005 Welzel a kol., 2011). Prípady pôvodne zaradené do 5% náhodnej vzorky (päťpercentná značka) boli pridané späť do náhodnej vzorky, ktorá sa má zohľadniť pri výbere kontroly (Engels et al., 2011). Pre každý rok medzi rokmi 2000 a 2009 (obdobie, počas ktorého sú údaje SEER k dispozícii pre Kaliforniu) boli vymenované oprávnené kontroly, ktoré od 1. júla daného roku neexistovali a boli živé. Medzi oprávnené kontroly mohli patriť prípady diagnostikované po 1. júli v roku výberu. Prípady a kontroly boli frekvenčne zosúladené podľa veku, pohlavia, rasy (biele, čierne, ázijské, iné, hispánske, indiánske) a rokov (trvania) nepretržitého pobytu v Kalifornii (pomocou dostupných PSČ poskytovaných spoločnosťou Medicare, kategorizovaných použitie tertiles medzi prípadmi: 1 & # x020135, 6 & # x0201310, & # x0226511). K prípadom v každej vrstve bolo priradených najviac päť kontrol. Z kontrol sa odobrali vzorky.

2.3. Expozícia pesticídom

Skúmané časové obdobie expozície pesticídom bolo 1974 až do roku pred diagnózou / selekciou (rok diagnózy / selekcie je medzi rokmi 2000 a 2009). Expozícia poľnohospodárskych pesticídov sa odhadovala na úrovni PSČ prepojením údajov správy o použití pesticídov (PUR) Kalifornského ministerstva pre reguláciu pesticídov (CDPR) s dostupnými PSČ poskytnutými spoločnosťou Medicare v GIS. Údaje PUR zahŕňajú libru aplikovaných pesticídov (1 libra predstavuje 0,45 kg), chemický názov, dátum a konkrétny oddiel systému verejnej pozemnej geodetiky (PLSS) o rozlohe 2,59 km 2 (1 mi 2), kde sa pesticídy aplikovali (Kalifornské ministerstvo pre reguláciu pesticídov , 2014). PUR na poľnohospodárske použitie sa v rokoch 1974 až 2008 kontrolovali na chyby (napr. Duplikáty). Mimoriadne hustoty používania pesticídov (kg / km 2) definované pomocou značiek CDPR (napr. & # X0003e22 417 kg / km 2, ak nefumantný pesticíd) od roku 1990 do roku 2008 a ako & # x0003e22 417 kg / km 2 (& # x0003e112 085 kg / km 2, ak je fumigant) alebo 50-násobok strednej hustoty použitia pre všetky použitia daného pesticídu, plodiny, typu jednotky a typu záznamu v rokoch 1974 až 1989, boli nahradené celoštátnou strednou hustotou použitia v danom roku (Rull a Ritz, 2003). Libry aktívnej zložky sa prepočítali pomocou PUR počtu ošetrených akrov (1 aker predstavuje 0,004 km2).

Aplikácie pesticídov patriacich do chemických skupín organofosfátov, organochlórov a karbamátov, ktoré boli predtým spojené s HCC, boli extrahované zo záznamov PUR (doplnková tabuľka 1) (Cordier a kol., 1993 Ezzat a kol., 2005 Persson a kol., 2012). Pre každý rok v rokoch 1974 až 2008 boli libry párované a sčítané podľa oddielu PLSS a vydelené plochou úseku, aby sa vypočítali hustoty použitia pesticídov (kg / km 2) pre každý oddiel PLSS (Bell a kol., 2001 Clary a Ritz, 2003 Reynolds a kol., 2004 Rull a Ritz, 2003). Sekcie PLSS a California TIGER / Line & # x000ae Tabulačné oblasti poštových smerovacích čísel (ZCTA slúžiace na aproximáciu hraníc poštových smerovacích čísel pre všetky roky v rokoch 1974 až 2008) sa pretínali (U.S. Census Bureau, 2000). Hustoty použitia pesticídov v sekcii PLSS boli priestorovo agregované (tj. Zväčšené) na úroveň PSČ, aby sa vypočítali hustoty použitia pesticídov na úrovni PSČ pomocou váženia oblastí v GIS, kde boli miery sekcií vážené pomerom plochy PSČ tvorenej touto oblasťou. oddiel.

Poštové smerovacie čísla poskytované spoločnosťou Medicare (posledné fakturačné PSČ v danom roku) boli k dispozícii pre každý študijný predmet od roku 1991 do roku 2009 v závislosti od veku a zápisu do Medicare a slúžili na určenie bydliska v Kalifornii alebo mimo nej. Predpokladali sme, že každý najskôr študovaný subjekt a # x02019s dostupné poštové smerovacie číslo poskytnuté spoločnosťou Medicare bolo jeho poštovým smerovacím číslom bydliska späť do roku 1974 (tj. Prenesené späť). Väčšina najstarších dostupných PSČ poskytovaných spoločnosťou Medicare medzi prípadmi (86,4%) a kontrolami (85,6%) zahrnutými do štúdie bola v Kalifornii a v súbore PSČ TIGER / Line & # x000ae. Medzi prípadmi a kontrolami chýbali zvyšné najskôr dostupné poštové smerovacie čísla poskytnuté spoločnosťou Medicare (8,6%, 8,9%), kalifornské poštové smerovacie číslo sa nenašlo v súbore PSČ TIGER / Line & # x000ae (1,8%, 2,1%) alebo nie Kalifornské PSČ (3,3%, 3,4%).

Hustoty použitia pesticídov na úrovni PSČ (zvýšené od sekcií PLSS) boli spojené s každým poštovým smerovacím číslom poskytovaným Medicare od roku 1974 do roku pred diagnostikou / výberom, ktoré boli v Kalifornii a v súbore TIGER / Line & # x000ae ZIP Súbor s kódom. Inými slovami, pobyt mimo Kalifornie sa vo výpočte expozície nezohľadňoval. Medzi prípadmi (n = 93 849 PSČ od roku 1974 do roku pred diagnostikovaním zahŕňa prenesenie späť) a kontrolnými vzorkami (n = 463 700 PSČ od roku 1974 do roku pred selekciou) zahrnutými do štúdie bolo 88,9% (kontroly 88,3%) zo všetkých ZIP Kódy sa našli v Kalifornii a v súbore PSČ TIGER / Line & # x000ae, chýbalo 6,7% (6,9%), 2,9% (3,0%) nebolo v Kalifornii a 1,6% (1,8%) bolo v Kalifornii, ale nie v súbore PSČ TIGER / Line & # x000ae. Hustoty použitia pesticídov pre každý subjekt štúdie a # x02019s PSČ boli sčítané a vydelené počtom rokov pobytu v Kalifornii (tj počet rokov s kalifornskými PSČ v súbore TIGER / Line a # x000ae PSČ), aby sa vypočítal priemerný ročný pesticíd. hustota použitia (Ritz a kol., 2009 Rull a Ritz, 2003 Wang a kol., 2011). Do ročného výpočtu hustoty použitia pesticídov boli zahrnuté poštové smerovacie čísla v Kalifornii a v súbore PSČ TIGER / Line & # x000ae spojenom s hustotou použitia pesticídov 0 kg / km 2.

2.4. Kovariates

Nasledujúce údaje boli extrahované z lôžkových (časť A), ambulantných (časť B) a nosných (napr. Lekár) tvrdení Medicare: HCV (ICD-9-CM [deviata revízia, klinická modifikácia] kódy 070,41, 070,44, 070,51, 070,54, 070,70, V02.62), HBV (070,22, 070,23, 070,32, 070,33, V02,61), nešpecifikovaná hepatitída (070,9, 070,59, 070,49, 571,4, 571,8, 571,9), cukrovka (250), obezita (278,00, 278,01, 278,02) , V77.8, 259,9), alkoholické ochorenie pečene (571,0, 571,1, 571,2, 571,3 571,5 alebo 571,6 v prítomnosti 303, 291, 305,0, V11.3 alebo V79.1), nešpecifická cirhóza (571,5 alebo 571,6) nie v prítomnosti HCV, HBV, nešpecifikovanej hepatitídy alebo alkoholického ochorenia pečene), zriedkavé genetické poruchy (& # x003b11 nedostatok antitrypsínu 273,4, hemochromatóza 275,0, porfýria 277,1, tyrozinémia 270,2, Wilsonova choroba 275,1), vírus ľudskej imunodeficiencie (HIV) ( 042, V08) a fajčenie (V15.82, 305.1, 989.84 neustále fajčenie, pretože nie je dostatok informácií na identifikáciu bývalých fajčiarov) (Davila a kol., 2005 Welzel a kol., 2013 W elzel a kol., 2011). Ochorenie pečene je trojstupňová kategorická premenná používaná pri štatistickom modelovaní, ktorá je definovaná ako žiadna (žiadna hepatitída, alkoholické ochorenie pečene a nešpecifická cirhóza), iba hepatitída (hepatitída bez alkoholického ochorenia pečene a cirhózy) a cirhóza (alkoholické ochorenie pečene). alebo nešpecifická cirhóza s hepatitídou alebo bez nej). V analýze podskupiny bolo ochorenie pečene (áno / nie) definované ako ochorenie s ktorýmkoľvek z nasledujúcich stavov: hepatitída, alkoholické ochorenie pečene alebo nešpecifická cirhóza. Podmienky sa považovali za prítomné, ak existovala jedna diagnóza časti A alebo dve diagnózy časti B alebo nosiča s odstupom najmenej 30 dní (Engels et al., 2011). Z dôvodu rozdielnej dostupnosti údajov o nárokoch v závislosti od toho, kedy boli diagnostikované prípady (žiadosti od roku 1991 do roku 2010, ak boli diagnostikované pred rokom 2003, od roku 1998 do roku 2010, ak boli diagnostikované medzi rokmi 2003 a 2005, od roku 2000 do roku 2010, ak boli diagnostikované medzi rokmi 2006 a 2007, a od roku 2002 do roku 2010, ak boli diagnostikované. medzi rokmi 2008 a 2009) (National Cancer Institute, 2014d), boli preskúmané tvrdenia Medicare počas šiestich rokov pred diagnostikovaním / výberom. Tvrdenia do jedného roka pred diagnostikovaním / výberom boli vylúčené z dôvodu možnej zaujatosti lekárskou detekciou (Engels et al., 2011). Pretože sa od požadovaných subjektov štúdie vyžadovalo najmenej 13 mesiacov nepretržitej časti A a B registrácie bez HMO pred diagnostikovaním / výberom, žiadne diagnostické kódy tvrdenia Medicare identifikujúce konkrétny zdravotný stav nenaznačovali absenciu tohto stavu (tj. v našej štúdii chýbajúce premenné).

Ako indikátor sociálno-ekonomického stavu sa použil štátny buy-in alebo sporiace programy Medicare, v ktorých štáty platia za poistné, odpočítateľné položky a / alebo spoluúčasť na Medicare (Centers for Medicare & # x00026 Medicaid Services, 2014 Davila et al. , 2005). Štátny buy-in sa považoval za prítomný, ak bol subjekt zaradený do štátneho buy-inu časti A alebo B kedykoľvek od roku pred diagnostikovaním / výberom. Podiel každej poštovej PSČ & # x02019s & # x0226516-ročnej populácie zamestnanej v poľnohospodárskom priemysle poskytol súhrnný súbor sčítania ľudu z roku 2000 (U.S. Census Bureau, 2002). PSČ poskytnuté spoločnosťou Medicare v roku 2000 alebo najbližšie k nemu bolo zhodné s údajmi zo sčítania ľudu.

2.5. Analýza podskupiny: Obyvatelia Kalifornie poľnohospodársky náročných oblastí

V podskupinovej analýze sa štatistické analýzy obmedzili na obyvateľov Kalifornie v poľnohospodársky náročných oblastiach, ktorí sú definovaní ako jedinci s možnosťou (t. J. V riziku) vystavenia sa poľnohospodárskym pesticídom na základe bydliska v Kalifornii, ktoré sa väčšinou skladajú z poľnohospodárskej pôdnej pokrývky. V tejto štúdii boli použité rastrové súbory National Land Cover Database (NLCD) z rokov 1992, 2001 a 2006, čo je štandardný americký zdroj údajov o krajinnej pokrývke odvodený z klasifikovaných 30 m snímok Landsat (Homer et al., 2012). Kalifornské súbory z roku 1992 boli mozaikované alebo kombinované. Všetky súbory NLCD boli podrobené väčšinovému filtru (filter 3 & # x000d73) na zníženie náhodného šumu (Fuller a Brown, 1996 Stow a kol., 1989). Každý rastrový súbor bol preklasifikovaný na poľnohospodársku pôdnu pokrývku (NLCD triedy 81 a # x0201385) oproti všetkým ostatným krajinným pokrývkam a skombinovaný pomocou mapovej algebry. Poľnohospodárska rastrová vrstva bola prevedená na vektorovú vrstvu a pretínaná kalifornskými PSČ. Pri použití najčastejšie sa vyskytujúceho PSČ (označovaného ako režim PSČ) boli do tejto analýzy vybrané prípady a kontroly nachádzajúce sa v PSČ s väčšinovou oblasťou (& # x0226550%) pretínajúcou poľnohospodársku pôdnu pokrývku.

2.6. Štatistická analýza

Expozícia pesticídom sa skúmala kombináciou všetkých chemických tried pesticídov (organofosfáty, organochlóry a karbamáty) a každou triedou zvlášť (Gunier a kol., 2001 Reynolds a kol., 2005). Chemické triedy pesticídov navzájom veľmi korelovali, a preto neboli zahrnuté ako prediktory do jedného štatistického modelu (Spearmanova korelácia pre organofosfáty a organochlóry 0,90, p & # x0003c0 0001 organofosfáty a karbamáty 0,92, p & # x0003c0 0001 organochlóry a karbamáty 0,88. , p & # x0003c0.0001). Spočiatku sme použili logistickú regresiu s náhodným zachytením, aby sme preskúmali, do akej miery môžu mať jednotlivci v rámci toho istého PSČ podobné riziko pre HCC. Po začlenení náhodného zachytenia definovaného ako PSČ pri diagnostike / výbere a režimu PSČ, nízky korelačný koeficient v rámci triedy (0,03) naznačil malú variabilitu medzi klastrami (PSČ) a náhodný zachytenie nebolo potrebné. Na posúdenie asociácie medzi každou premennou a stavom prípadovej kontroly sa použila nemenná podmienená logistická regresia pomocou robustného odhadu odchýlky a stratifikácie podľa (podmieňovania) faktorov zhody frekvencie roku, veku, pohlavia, rasy a bydliska v Kalifornii. Na hodnotenie asociácie medzi každou premennou a expozíciou pesticídom sa použila chí-kvadrát, jednosmerná analýza odchýlky (ANOVA) a Kruskal-Wallisove testy. Pri výbere premenných, ktoré boli buď významne spojené s expozíciou HCC alebo pesticídom (p & # x0003c0.05), boli na zostavenie použité metódy spätnej eliminácie (p & # x0003e0.20 odstránené), potvrdené priamym výberom (p & # x0003c0.20). finálne modely. Na konečných modeloch bola vykonaná regresná diagnostika (napr. Správnosť prispôsobenia, kolineárnosť, linearita logitu, odľahlé hodnoty, vplyvové body). OR a 95% CI boli odhadnuté pomocou konečných viacnásobne premenných modelov podmienenej logistickej regresie (robustný odhad odchýlky) podmienených faktormi párovania frekvencií.

Modely boli stratifikované podľa vidieckeho / mestského bydliska pomocou kódov Rural-Urban Continuum Codes (RUCC), ktoré definujú americké kraje ako metropolitné vs. nemetropolitné pomocou informácií o obyvateľstve, dochádzaní za prácou a metropolitných susedoch (americké ministerstvo poľnohospodárstva, 2013). Krajom bol pridelený kód RUCC režimu pomocou údajov z rokov 1974, 1983, 1993 a 2009, ak neexistovala jasná väčšina, bol pridelený mestský kód RUCC. Po pretínaní krajov TIGER / Line & # x000a9 a poštových smerovacích čísel v GIS (PSČ sa zhodovalo s krajom, ktorý obsahuje väčšinu jeho oblasti), sa každému študijnému predmetu pridelili krajské kódy RUCC podľa PSČ jeho režimu. Kódy RUCC boli rozdelené do troch skupín: mestské (kódy RUCC 0 a # x020133 metropolitných oblastí s & # x0003c250 000 až & # x0003e1 miliónov obyvateľov), vidiecke & # x0226520 000 obyvateľov (4 & # x020135) a vidiecke & # x0003c20, 000 obyvateľov (6 & # x020139) (McCall-Hosenfeld et al., 2014). Vidiecky / mestský obytný stav sa považoval za konštantný bez ohľadu na štátne hranice. Interakcie medzi expozíciou pesticídom a každým kovariátom a zodpovedajúcim faktorom rizika HCC sa skúmali individuálne zahrnutím výrazu medziproduktu do modelu a testovaním jeho významnosti. Keď sa zistila významná interakcia, vytvorili sa samostatné modely, stratifikované podľa kovariancie alebo faktora, aby sa odhadol vplyv pesticídov na riziko HCC v rámci vrstvy. Skúmal sa účinok 10, 15 a 20-ročných oneskorení, pri ktorých sa brala do úvahy expozícia pesticídom, ktorá sa vyskytla mimo okna oneskorenia (pred diagnostikou / výberom). Hustoty použitia pesticídov boli kategorizované pomocou tertilov alebo 75. percentilu medzi kontrolami (McGlynn a kol., 2006 Reynolds a kol., 2005 Rignell-Hydbom a kol., 2009). Všetky uvádzané p-hodnoty sú obojstranné. Analýzy sa uskutočňovali v roku 2014 pomocou SAS verzie 9.4 (SAS Institute, Inc., Cary, Severná Karolína). Všetky priestorové údaje boli premietnuté do súradnicového systému California Teale Albers (NAD83 datum meter) a všetky geopriestorové analýzy boli vykonané v roku 2014 pomocou programu ArcGIS (Esri, 2012).

2.7. Priestorové analýzy: priestorová autokorelácia a problém modifikovateľnej plošnej jednotky (MAUP)

Potenciálna priestorová autokorelácia rezíduí z konečného multivariabilného modelu podmienenej logistickej regresie (celá vzorka všetkých tried) bola skúmaná pomocou globálneho testu Moran & # x02019s I (vzhľadom na režim PSČ a diagnostiku / výber PSČ). Pokiaľ ide o možný vplyv MAUP na výsledky štúdie, globálne testy Moran & # x02019s I s hustotami používania pesticídov na úrovni sekcií PLSS (všetky triedy) sa počítali pre každý rok od roku 1974 do roku 2008. Po pretínaní sekcií PLSS s poštovými smermi, ročne v rámci Poštové smerovacie číslo Variabilita hustoty použitia pesticídov v sekcii PLSS od roku 1974 do roku 2008 sa skúmala pomocou priemerných mediánov a priemerných medzikvartilných rozsahov (IQR) hustôt použitia sekcie PLSS v rámci každého PSČ. Pomocou poštového smerovacieho čísla režimu bola v Kalifornii skúmaná globálna a lokálna priestorová autokorelácia rezidenčných lokalít študovaného subjektu (podiel študovanej populácie s celkovým počtom obyvateľov sídliacich v každom PSČ a stratifikovanej podľa stavu prípadovej kontroly) pomocou globálnych Moran & # x02019s I a Anselin Local Moran & # x02019s testujem.


Nakoniec môžeme spojiť vetvy v celom modeli.
Všimnite si, ako som tu nemusel používať model_a alebo model_s. Môžete to urobiť, ak chcete, ale tieto podmodely nie sú potrebné, iba ak by ste ich neskôr chceli získať jednotlivo pre iné účely. (Aj keď ste ich vytvorili, na ich použitie nie je potrebné meniť nižšie uvedený kód, sú už súčasťou rovnakého grafu)

Pretože výstup je teraz 2D, nie je problém s „categorical_crossentropy“, môj komentár bol kvôli pochybnostiam o výstupnom tvare.


Ako extrahovať konvolučnú neurónovú sieť z objektu modelu Keras na objekt Networkx DiGraph, pričom váhy sú ako okrajový atribút?

Mám záujem o použitie balíka Networkx Python na vykonávanie sieťovej analýzy na konvolučných neurónových sieťach. Aby som to dosiahol, chcem z objektov modelu Keras extrahovať informácie o hranách a váhe a vložiť ich do objektu Networkx Digraph, kde je možné ich (1) zapísať do súboru graphml a (2) podrobiť nástrojom na analýzu grafov, ktoré sú k dispozícii v Networkx .

Pred ďalším skokom mi dovoľte objasniť, ako a ako uvažovať o združovaní. Združovanie (príklady: max. Alebo priemer) znamená, že položky v konvolučnom okne budú agregované, čím sa vytvorí nejednoznačnosť v tom, ktorý „záznam“ sa použije v grafe, ktorý chcem vytvoriť. Ak to chcete vyriešiť, bol by som rád, keby všetky možnosti zahrnuli do grafu, pretože podľa potreby to môžem neskôr zohľadniť.

Pre príklad zvážme, či to urobiť s VGG16. Vďaka protokolu Keras je veľmi ľahký prístup k váham pri prechádzaní vrstvami.

Ktorý vytlačí nasledovné:

Pre konvolučné vrstvy som čítal, že n-tice budú predstavovať (filter_x, filter_y, filter_z, num_filters), kde filter_x, filter_y, filter_z dávajú tvar filtra a num_filters je počet filtrov. Pre každý filter existuje jeden výraz skreslenia, takže posledná n-tica v týchto riadkoch sa bude rovnať počtu filtrov.

Aj keď som čítal vysvetlenia, ako sa konvolúcie v rámci konvolučnej neurónovej siete správajú koncepčne, zdá sa mi, že mám mentálny blok, keď sa dostanem k manipulácii s tvarmi vrstiev v modeli.

Keď budem vedieť, ako sa prechádzať cez okraje modelu Keras, pomocou Networkx by som mal byť schopný ľahko kódovať konštrukciu objektu Networkx. Kód pre toto by sa mohol voľne podobať niečomu podobnému, kde keras_edges je iterovateľný objekt, ktorý obsahuje n-tice formátované ako (in_node, out_node, edge_weight).

Aby som bol konkrétny, ako sa môžem prehnúť cez všetky okraje spôsobom, ktorý zohľadňuje tvar vrstiev a združovanie spôsobom, ktorý som opísal vyššie?


Ako implementovať vyrovnanie vrstvy s veľkosťou dávky & gt 1 v Pytorch (Pytorch_Geometric)

Som v Pytorch nový a pokúšam sa preniesť môj predchádzajúci kód z Tensorflow do Pytorch kvôli problémom s pamäťou. Pri pokuse o reprodukciu Sploštenej vrstvy sa však stále vyskytovali niektoré problémy.

V mojom objekte DataLoader je batch_size zmiešaný s prvou dimenziou vstupu (v mojom GNN má vstup rozbalený z objektu DataLoader veľkosť [batch_size * node_num, attribute_num], napr. [4 * 896, 32] po vrstvách GCNConv). V zásade, ak implementujem torch.flatten () po GCNConv, vzorky sa zmiešajú dokopy (do [4 * 896 * 32]) a z tejto siete bude iba 1 výstup, zatiaľ čo očakávam výstupy #batch_size. A ak namiesto toho použijem nn.Flatten (), zdá sa, že sa nič nestalo (stále [4 * 896, 32]). Mám nastaviť batch_size ako prvý stlmenie vstupu na samom začiatku, alebo mám priamo použiť funkciu view ()? Vyskúšal som to priamo pomocou view () a (zdá sa, že) fungovalo, aj keď si nie som istý, či je to to isté ako Flatten. Prečítajte si môj kód uvedený nižšie. Momentálne používam global_max_pool, pretože to funguje (môže priamo oddeliť batch_size).

Mimochodom, nie som si istý, prečo je v Pytorchovi tréning taký pomalý. Keď sa node_num zvýši na 13000, potrebujem hodinu, aby som prešiel epochou, a mám 100 epoch na testovací záhyb a 10 skúšobných záhybov. V tensorflow trvá celý tréningový proces iba niekoľko hodín. Rovnaká sieťová architektúra a nespracované vstupné údaje, ako je tu uvedené v ďalšom mojom príspevku, ktorý tiež popisoval problémy s pamäťou, s ktorými som sa stretol pri používaní TF.

Boli na chvíľu dosť frustrovaní. Skontroloval som tento a tento príspevok, ale zdá sa, že ich problémy sa od tých mojich trochu líšia. Veľmi by som ocenil každú pomoc!


Abstrakt

MeteoInfo je sada softvérových nástrojov vyvinutých pre vizualizáciu a analýzu meteorologických údajov. Zahŕňa knižnicu triedy .NET pre vývojárov softvéru a desktopovú aplikáciu pre koncových používateľov. MeteoInfo podporuje aj niekoľko základných funkcií GIS a dokáže čítať rôzne použité formáty meteorologických údajov, ako sú NetCDF a GRIB. Komplexné meteorologické analýzy údajov o mriežke a stanici je možné spracovať pomocou poskytnutých dátových modelov. Knižnicu tried možno pohodlne použiť na vývoj softvérových rutín na manipuláciu s priestorovými a meteorologickými údajmi. Desktopová aplikácia má užívateľsky prívetivé grafické užívateľské rozhranie a je mocným nástrojom na prezeranie a skúmanie súborov meteorologických údajov. MeteoInfo je možné spustiť aj automaticky pomocou skriptovania v jazyku IronPython. Copyright © 2012 Kráľovská meteorologická spoločnosť


Ako pridať ďalšiu vrstvu do vopred načítanej siete?

Načítam neurónovú sieť pomocou notového zápisu tensorflow a colab z google. A chcem odstrániť úplne spojenú vrstvu výstupnej vrstvy a pridať ďalšiu úplne spojenú iba s jedným neurónom a chcem zmraziť ďalšie vrstvy a trénovať práve túto pridanú výstupnú vrstvu. Používam tf.keras.application.MobileNetV2 a používam súbory mledu-datasets / cats_and_dogs.

Ja som serarcha v tensorflow API a testoval som metódy na pridanie a nemám úspech. Môj kód je nasledovný

Očakávam, že pridám plne pripojenú vrstvu do siete, ale nepridáva sa to vôbec.


Závery

In the context of the most populous city in Europe, the significant association between walkability and walking, even after adjustment for individual-level sociodemographic factors and for area deprivation, highlights the potential importance of the physical environment of the neighbourhood in eliciting physical activity in individuals and thereby promoting public health at a population level. The most basic walkability index model constructed here may offer urban planners and public health professionals a simple tool in building and maintaining healthy neighbourhoods.

In future work, the walkability index could be used to assess relationships between walkability and walking in regionally or nationally representative samples, and for different age groups. Previous work revealed lack of associations between walkability and overall physical activity in the study cohort, suggesting a neighbourhood supportive of walking is not necessarily conducive to other physical activities [43]. Therefore, investigation of associations of walkability with specific types of physical activity within particular domains using a regionally or nationally representative sample is warranted.


Pozri si video: GIS 2 Part1 (Septembra 2021).