Viac

Ako vylúčiť odľahlé hodnoty z rastra pomocou ArcGIS pre počítač?


Zakrivenie terénu som vypočítal z DEM. Použitý DEM je interpolovaný z údajov o nadmorskej výške bodu. Všeobecne sa DEM javí ako dobrý, ale existujú určité artefakty z interpolácie. Tieto artefakty spôsobujú extrémne hodnoty zakrivenia. Asi 90% hodnôt zakrivenia je medzi -25 a 25, ale ďalších 10% je medzi -500 a 500.

Na správne vizualizovanie rastra zakrivenia môžem použiť vyrovnanie histogramu. Pre ďalšiu analýzu by som však chcel nahradiť tieto extrémne hodnoty.

Moja otázka teda znie: Ako môžem vylúčiť tieto extrémne hodnoty z rastra? Predstavujem si, že by niečo také fungovalo (pseudokód):

m = medián ("zakrivenie") IF ("curvature.value")> m * 10 POTOM ("curvature.value") = m * 10 IF ("curvature.value") 

Aký nástroj by som na to použil? Vyskúšal som Raster Calculator, ale nepodarilo sa mi správne zadať syntax.

Softvér: ArcGIS 10 s priestorovým a 3D analytikom


Nechystal by som sa upnúť hodnoty, ako to naznačuje pseudokód, pretože artefakty zakrivenia nemusia nevyhnutne zodpovedať oblastiam s vysokým zakrivením. Medzi lepšie spôsoby riešenia tohto problému patria:

  1. Pred výpočtom zakrivenia zvážte vyhladenie DEM. To by mierne znížilo väčšinu zakrivení, ale mohlo by to poskytnúť primerané hodnoty zakrivenia na všetkých miestach. Vyrovnanie DEM je možné vykonať miestnymi mediánmi alebo prostriedkami.

  2. Nájdite spoľahlivý spôsob odhadu zakrivenia. (Toto nenájdete v žiadnom softvéri Arc *, ale s dostupnosťou nástrojov na všeobecné použitie akoR, toto je uskutočniteľné odporúčanie.) Všeobecne sa zakrivenie odhaduje tak, že do každého susedstva zapadne kvadratický (alebo nejaký špecializovaný polynóm nízkeho rádu). Obvyklou metódou prispôsobenia sú najmenšie štvorce, ktoré môžu byť citlivé na mierne miestne odchýlky. Rozšírením okolia a použitím metódy prispôsobenia, ktorá zníži váhu odľahlých zvyškov (napríklad IWLS), môžete získať reprezentatívne a presné odhady zakrivenia všade.

  3. Hodnoty extrémneho zakrivenia nahraďte NoData. Toto je stále drakonické opatrenie, ale bolo by vhodné, ak by extrémne hodnoty boli skutočne artefaktmi interpolácie (a preto neodrážajú skutočne vysoké zakrivenia).

  4. Vyberte si metódu interpolácie, ktorá vytvára hladšie povrchy!

Syntax 'mapovej algebry' na nahradenie hodnôt NoData používa príkaz SetNull, ako v

SetNull (Abs ([Mriežka zakrivenia])> 10 * Abs (m), [Mriežka zakrivenia])

Mimochodom, m by malo nie bude stredná krivka: stredná hodnota sa bude často blížiť k nule a nebude odrážať typické veľké zakrivenia (kladné alebo záporné). Veľký násobok strednej hodnoty absolútna zakrivenie môže byť rozumnou voľbou. Ešte lepšie je preskúmať histogram kriviek, aby ste zistili, kde treba hodnoty odrezať.

Ak prístup SetNull prepichne príliš veľa otvorov NoData v mriežke, zamyslite sa nad tým, či by sa mriežka zakrivenia mala plynulo meniť. Ak je to tak, a ak tieto otvory majú tendenciu byť izolované (alebo v úzkych pruhoch - čo by bolo silným indikátorom toho, že bol použitý zlý interpolátor), môžete ich vyplniť výpočtom ohniskovej strednej hodnoty a prilepením priemerných hodnôt cez otvory. Prilepenie sa vykonáva s podmieneným operátorom, ako v

Con (IsNull ([mriežka so zmeneným zakrivením]), [mriežka ohniskového priemeru], [mriežka so zmeneným zakrivením])

Všimnite si použitie IsNull na detekciu buniek NoData.


Každý priečinok v časopriestorovej kocke má hodnotu LOCATION_ID, time_step_ID, COUNT a všetky súhrnné polia alebo premenné, ktoré boli zahrnuté pri vytváraní kocky. Zásobníky spojené s rovnakým fyzickým umiestnením budú zdieľať rovnaké ID umiestnenia a budú spolu predstavovať časovú sériu. Koše spojené s rovnakým intervalom časových krokov budú zdieľať rovnaké ID časového kroku a spolu budú obsahovať časový úsek. Hodnota počtu pre každú priehradku odráža počet nehôd alebo záznamov, ktoré sa vyskytli na pridruženom mieste v rámci súvisiaceho časového intervalu.

Tento nástroj analyzuje premennú v kocke vstupného časopriestoru netCDF pomocou časopriestorovej implementácie štatistiky Anselin Local Moran's I.

Výstupné funkcie sa pridajú na tablu Obsah s vykreslením, ktoré sumarizuje výsledky časopriestorovej analýzy pre všetky analyzované umiestnenia. Ak zadáte masku na analýzu mnohouholníkov, budú sa analyzovať tie miesta, ktoré spadajú do masky analýzy, inak budú analyzované polohy s najmenej jedným bodom najmenej v jednom časovom intervale.

Okrem výstupných funkcií sa súhrn analýzy počas vykonávania nástroja zapisuje ako správy do dolnej časti tably Geoprocessing. K správam máte prístup tak, že umiestnite kurzor myši na indikátor priebehu a kliknete na vyskakovacie tlačidlo alebo rozšírenie časti podrobností o správy na table Geoprocesing. K správam pre predtým spustený nástroj môžete tiež pristupovať cez históriu geografického spracovania na table katalóg.

Nástroj Local Outlier Analysis identifikuje štatisticky významné klastre a odľahlé hodnoty v kontexte času aj času. Prečítajte si viac informácií o tom, ako nástroj Local Outlier Analysis funguje pre definície predvolených kategórií výstupov, a ďalšie informácie o algoritmoch použitých v tomto analytickom nástroji.

Na identifikáciu klastrov a odľahlých hodnôt v časopriestorovej kocke tento nástroj využíva časopriestorovú implementáciu štatistiky Anselin Local Moran's I, ktorá berie do úvahy hodnotu pre každý kôš v kontexte hodnôt pre susedné koše.

Na určenie, ktoré koše budú zahrnuté do každého susedstva analýzy, nástroj najskôr nájde susedné koše, ktoré spadajú do špecifikovanej Konceptualizácie priestorových vzťahov. Ďalej pre každú z týchto nádob obsahuje koše na rovnakých miestach z N predchádzajúcich časových krokov, kde N je hodnota kroku času v okolí, ktorú určíte.

Vaša voľba pre parameter Konceptualizácia priestorových vzťahov by mala odrážať inherentné vzťahy medzi funkciami, ktoré analyzujete. Čím realistickejšie budete môcť modelovať vzájomné pôsobenie funkcií v priestore, tým presnejšie budú vaše výsledky. Odporúčania sú uvedené v dokumente Výber konceptualizácie priestorových vzťahov: Osvedčené postupy.

Predvolená Konceptualizácia priestorových vzťahov je Pevná vzdialenosť. Zásobník sa považuje za suseda, ak jeho ťažisko spadá do vzdialenosti susedstva a jeho časový interval je v rámci vami zadaného kroku času susedstva. Ak nezadáte hodnotu susedskej vzdialenosti, jedna sa pre vás vypočíta na základe priestorového rozloženia vašich bodových údajov. Ak nezadáte hodnotu Časový krok susedstva, nástroj použije predvolenú hodnotu 1 intervalu časového kroku.

Parameter Počet susedov môže prepísať susedskú vzdialenosť pre voľbu Pevná vzdialenosť alebo rozšíriť vyhľadávanie susedov iba pre možnosti Hrany susedstva a Rohy hrany hrany. V týchto prípadoch sa ako minimálny počet použije počet susedov. Napríklad, ak zadáte Fixed distance with a Neighborhood Distance of 10 miles and 3 for the Number of Neighbors parameter, all bins will receive a minimum of 3 spatial Neighbors, even if the Neighborhood Distance must be increased to find them. Vzdialenosť sa zvyšuje iba pre tie koše, kde nie je splnený minimálny počet susedov. Rovnako, s možnosťami súvislostí, pre koše s menším počtom susedných susedov sa vyberú ďalší susedia na základe blízkosti ťažiska.

Hodnota Neighborhood Time Step je počet intervalov časových krokov, ktoré sa majú zahrnúť do okolia analýzy. Ak je časový interval pre vašu kocku napríklad tri mesiace a pre krok času v susedstve zadáte 2, všetky počty košov v rámci zadanej Konceptualizácie priestorových vzťahov a všetky ich priradené koše pre predchádzajúce dva časové kroky intervaly (pokrývajúce deväťmesačné časové obdobie) budú zahrnuté do susedstva analýzy.

Permutácie sa používajú na určenie toho, aké je pravdepodobné zistenie skutočného priestorového rozloženia hodnôt, ktoré analyzujete. Pre každú permutáciu sú hodnoty susedstva okolo každého koša náhodne usporiadané a je vypočítaná hodnota Local Moran's I. Výsledkom je referenčné rozdelenie hodnôt, ktoré sa potom porovnáva so skutočným pozorovaným Moranovým I, aby sa určila pravdepodobnosť, že by sa pozorovaná hodnota mohla nájsť v náhodnom rozdelení. Predvolená hodnota je 499 permutácií, náhodná distribúcia vzoriek sa však zvyšuje so zvyšovaním permutácií, čo zvyšuje presnosť pseudo-hodnoty.

Ak je parameter Počet permutácií nastavený na 0, výsledkom bude tradičná hodnota p namiesto pseudo hodnoty p.

Permutácie využívané týmto nástrojom môžu využívať výhody zvýšeného výkonu dostupného v systémoch, ktoré používajú viac CPU (alebo viacjadrové CPU). Nástroj bude predvolene bežať s 50% dostupných procesorov, počet použitých procesorov je však možné zvýšiť alebo znížiť pomocou prostredia Parallel Processing Factor. Zvýšená rýchlosť spracovania je najvýraznejšia na väčších časopriestorových kockách alebo behoch nástrojov s väčším počtom permutácií.

Funkčná vrstva Maska analýzy mnohouholníka môže obsahovať jeden alebo viac polygónov definujúcich oblasť študovanej analýzy. Tieto mnohouholníky označujú, kde by sa mohli bodové prvky vyskytnúť, a mali by vylučovať oblasti, kde by body boli nemožné. Ak napríklad analyzujete trendy vlámania do domácnosti, môžete pomocou masky na analýzu mnohouholníkov vylúčiť veľké jazero, regionálne parky alebo iné oblasti, kde nie sú žiadne domy.

Maska analýzy mnohouholníka sa pretína s rozsahom časovej kocky vstupného priestoru a nebude rozširovať rozmery kocky.

Ak maska ​​na analýzu polygónu, ktorú používate na nastavenie svojej študijnej oblasti, pokrýva oblasť presahujúcu rozsah vstupných funkcií, ktoré boli použité pri počiatočnom vytváraní kocky, možno budete chcieť znova vytvoriť svoju kocku pomocou masky na analýzu polygónu ako rozsahu prostredia. . Takto zabezpečíte, že celá oblasť pokrytá maskou analýzy mnohouholníka je zahrnutá v nástroji Local Outlier Analysis. Použitie masky na analýzu polygónu ako nastavenia rozsahu počas vytvárania kocky zabezpečí, že rozsah kocky sa zhoduje s maskou na analýzu polygónu.

  • Počet odľahlých hodnôt
  • Percento odľahlých hodnôt
  • Počet nízkych klastrov
  • Percento nízkych klastrov
  • Počet nízkych odľahlých hodnôt
  • Percento nízkych odľahlých hodnôt
  • Počet vysokých klastrov
  • Percento vysokých klastrov
  • Počet vysokých odľahlých hodnôt
  • Percentuálna hodnota odľahlých hodnôt
  • miesta bez priestorových susedov
  • miesta s odľahlou hodnotou v poslednom časovom kroku
  • Typ odľahlého klastra
  • a ďalšie súhrnné štatistiky

Cluster Outlier Type bude vždy indikovať štatisticky významné klastre a odľahlé hodnoty pre 95-percentnú hladinu spoľahlivosti a iba štatisticky významné koše budú mať hodnoty v tomto poli. Tento význam odráža korekciu rýchlosti falošného objavu (FDR).

Aby sa zabezpečil aspoň 1 dočasný sused pre každé miesto, nevypočíta sa pre prvý rez miestny moranský index. Hodnoty zásobníka v prvom reze sú však zahrnuté do výpočtu globálneho priemeru.

Spustenie analýzy miestneho odľahlého bodu pridá výsledky analýzy späť do časovej kocky vstupného priestoru netCDF. Každý kôš je analyzovaný v kontexte susedných košov na meranie zhlukovania pre vysoké aj nízke hodnoty a na identifikáciu akýchkoľvek priestorových a časových odľahlých hodnôt v týchto zhlukoch. Výsledkom tejto analýzy je index Local Moran I, pseudo hodnota p (alebo hodnota p, ak sa nepoužívali žiadne permutácie) a typ klastra alebo odľahlej hodnoty (CO_TYPE) pre každý priečinok v časopriestorovej kocke.

Súhrn premenných pridaných do časovej kocky vstupného priestoru je uvedený nižšie:

Vypočítaný index Local Moran's I.

Trojrozmerné: jedna hodnota indexu Local Moran's I pre každý kôš v časopriestorovej kocke.

Anselin Local Moran's I štatistická pseudo-hodnota alebo p-hodnota, ktorá meria štatistickú významnosť hodnoty Local Moran's I.

Trojrozmerné: jedna hodnota p alebo pseudo hodnota p pre každý priečinok v časopriestorovej kocke.

Typ kategórie výsledkov rozlišujúci medzi štatisticky významným zhlukom vysokých hodnôt (High-High), zhlukom nízkych hodnôt (Low-Low), odľahlou hodnotou, v ktorej je vysoká hodnota obklopená predovšetkým nízkymi hodnotami (vysoká-nízka), a odľahlou v ktoré je nízka hodnota obklopená predovšetkým vysokými hodnotami (Low-High).

Trojrozmerné: jeden klaster alebo odľahlý typ pre každý kôš v časopriestorovej kocke. Zásobník je založený na korekcii FDR.

Označuje polohy, ktoré majú priestorových susedov a tie, ktoré sa spoliehajú iba na dočasných susedov.

Dvojrozmerné: jedna klasifikácia pre každé umiestnenie. Výsledkom analýzy miest, ktoré nemajú priestorových susedov, budú výpočty založené výlučne na časových susedoch.


Geografické informačné systémy (GIS) boli použité na podporu analýz rybolovu zameraných na sledovanie lovu harpúny mečiara a na analýzu časových a priestorových vzorov distribúcie úlovkov, a to aj vo vzťahu k environmentálnemu parametru Sea Surface Temperature (SST). Štúdia sa uskutočnila v dôležitej reprodukčnej oblasti Stredozemného mora vrátane Messinského prielivu a blízkych oblastí (juhovýchodné Tyrhénske more a severozápadné Iónske more). Tieto polohy tiež predstavujú jedinečný rybársky revír lovu harpúny talianskej mečiara veľkého.

Údaje o rybolove, environmentálne a biologické údaje sa zbierali v rokoch 2002 až 2011 z lodných denníkov rybárov a pozorovaniami na palube rybárskych plavidiel počas sezóny lovu harpúny mečiara veľkého (máj až august). Údaje boli usporiadané do databázy a štruktúrované na geografickom základe, aby bolo možné kvantitatívne viacparametrické modelovanie pomocou nástrojov GIS.

Aplikácia GIS umožnila dobrú vizualizáciu vzorov distribúcie úlovkov, čím sa zdôraznili ročné a mesačné rozdiely v dostupnosti zdrojov pre rybolov. Analýza GIS máp ukázala zmenu v správaní mečiara obyčajného, ​​pravdepodobne súvisiacu s anomáliami SST a v dôsledku toho rozdiel vo vzorcoch rozloženia úlovkov a rybolovného úsilia. Tieto rozdiely boli zreteľnejšie, ak sa uvažovalo o pároch rýb. Ukázalo sa, že GIS je dôležitým a mocným nástrojom na analýzu informácií o rybolove, výroba georeferencovaných máp pomáha vedcom k ľahšej interpretácii údajov o veľkých pelagických zdrojoch. Navrhovaná analýza založená na GIS môže pridať nové informácie o mečiaroch a pomôcť osobám s rozhodovacími právomocami v oblasti riadenia mečúňa stredomorského.


Do dnešného dňa sa trieda konala v Albany, Syracuse, Mt. Morris a Long Island. Budúce kurzy sa budú konať v Albany v rámci Konferencie spoločenstiev kvality 22. októbra 2002. Bezplatná trieda je k dispozícii štátnym agentúram, miestnym vládam a členom NYS GIS Data Sharing Cooperative. Viac informácií o nadchádzajúcich hodinách a registrácii online, keď je plánovaný čas, nájdete na internetovej stránke GIS Clearinghouse NYS na adrese gis.ny.gov/resource.htm. Kvôli očakávanému vysokému dopytu sa nezabudnite zaregistrovať online, aby ste zaistili dostupnosť miest na sedenie. Ak máte akékoľvek otázky, neváhajte kontaktovať Elizabeth Novak z Úradu pre technológiu na čísle 518 / 443-2042. Poďte sa dozvedieť viac o tejto vzrušujúcej technológii a o tom, ako ju môžete uviesť do práce vo svojej organizácii!

V polovici druhého roka sa po celom štáte rozširuje New York Statewide Digital Orthoimagery Program (NYSDOP). Od podpísania zmluvy vo februári 2001 bola veľká časť východného New Yorku letecky prevezená v apríli 2002 a verejnosti sú k dispozícii nové ortografické snímky. Lety nad západnou časťou štátu boli dokončené v apríli 2002 a tieto ortografické snímky by mali byť k dispozícii na jar 2003. Štátny technologický úrad (OFT) vypracoval plán na pokrytie zvyšku štátu a dokončenie prvého cyklu NYSDOP v r. 2003.

Väčšina ortografických snímok pre 17 krajov preletených v ročnom súbore 2001 je prístupná verejnosti v New York State Plane Coordinate System. Ortografické snímky boli dodané každému okresu. Kópie ortografických snímok si môžete stiahnuť z GIS Clearinghouse v štáte New York. Ďalšie kópie v súradnicovom systéme Universal Transverse Mercator budú k dispozícii na jeseň 2002

Keď sú k dispozícii snímky z letov z roku 2001, letecké snímky ročnej šarže 2002 sa menia na ortografické snímky. Táto výročná časť sa týka 19 krajov, čo je oblasť zahŕňajúca mestské oblasti Buffalo, Rochester a Binghamton. Práce sa riadia agresívnym harmonogramom, ktorého cieľom je sprístupniť snímky nalietané v apríli 2002 začiatkom roka 2003.

Sekcia fotogrametrie a sekcia prieskumu newyorského ministerstva dopravy prehodnocujú ortografiu, aby zabezpečili priestorovú presnosť a kvalitu obrazu. OFT je preto potešený, že spoločnosť VARGIS, LLC, štátny dodávateľ, plní očakávania štátu na zlepšenie už existujúceho celoštátneho pokrytia vytváraním kvalitných snímok.

Cyklický charakter NYSDOP pokračuje, keďže OFT už plánuje výrobu ortografických snímok pre stredný a severný New York v roku 2003. Dokončenie tejto oblasti by znamenalo koniec prvého cyklu NYSDOP. Cieľom je nadviazať na úspechy z rokov 2001 a 2002 produkciou a dodávkou vysoko kvalitných ortografických snímok v štáte New York začiatkom roku 2004 a následnou pravidelnou aktualizáciou snímok v nasledujúcich rokoch. Informácie o stave NYSDOP možno získať na http://gis.ny.gov. Ďalšie informácie vám poskytne Tim Ruhren z Úradu pre technológiu na čísle 518 / 443-2042.


Abstrakt

Pozadie

Hepatocelulárny karcinóm (HCC), najbežnejší typ primárnej rakoviny pečene, je spájaný s nízkym prežitím. Americké štúdie, ktoré skúmajú vystavenie pesticídov, ktoré sami hlásia, vo vzťahu k HCC preukázali nepresvedčivé výsledky. Naším cieľom bolo objasniť súvislosť medzi expozíciou pesticídom a HCC implementáciou novej dátovej väzby medzi údajmi Surveillance, Epidemiology a End Results (SEER) -Medicare a California Pesticide Report (PUR) pomocou geografického informačného systému (GIS).

Metódy

Kontroly boli frekvenčne porovnané s prípadmi HCC diagnostikovanými v rokoch 2000 až 2009 v Kalifornii podľa roku, veku, rasy, pohlavia a dĺžky pobytu v Kalifornii. Potenciálni zmätení boli extrahovaní z tvrdení Medicare. V rokoch 1974 až 2008 sa libry (1 libra predstavuje 0,45 kg) aplikovaných organofosfátových, organochlórových a karbamátových pesticídov poskytovaných v PURs agregovali na úroveň PSČ pomocou plošného váženia v GIS. Odhady expozície podľa PSČ boli spojené s pacientmi, ktorí na výpočet expozície pesticídom používali PSČ poskytované spoločnosťou Medicare. Obyvatelia poľnohospodárstva boli definovaní ako obyvatelia žijúci v poštových smerovacích číslach s väčšinou oblastí pretínajúcich poľnohospodársku pôdnu pokrývku podľa rastrov Národnej databázy pôdneho pokryvu (NLCD) z rokov 1992, 2001 a 2006. Na odhad asociácie medzi expozíciou pesticídom a HCC sa použila podmienená logistická regresia s viacerými premennými.

Výsledky

Medzi obyvateľmi Kalifornie v poľnohospodársky intenzívnych oblastiach bola predchádzajúca ročná expozícia na úrovni PSČ viac ako 14,53 kg / km 2 organochlórových pesticídov (75. percentil medzi kontrolami) spojená so zvýšeným rizikom HCC po úprave na ochorenie pečene a cukrovku (upravené šance pomer [OR] 1,87, 95% interval spoľahlivosti [CI] 1,17, 2,99 p= 0,0085). Organochlóry na úrovni PSČ boli významne spojené so zvýšeným rizikom HCC u mužov (upravené OR 2,76, 95% CI 1,58, 4,82 p= 0,0004), ale nesúvisí s HCC u žien (upravené OR 0,83, 95% CI 0,35, 1,93 p= 0,6600) (interakcia p=0.0075).

Závery

Toto je prvá epidemiologická štúdia, ktorá používa odhady expozície na základe GIS na štúdium expozície pesticídom a HCC. Naše výsledky naznačujú, že organochlórové pesticídy sú spojené so zvýšením rizika HCC u mužov, ale nie u žien.


Abstrakt

Na identifikáciu oblastí v Mexiku s vysokým potenciálom pre produkciu mikrorias bol zostavený model geografického informačného systému. Vstupné údaje boli získané z rôznych národných a medzinárodných zdrojov. Model bol zostavený pomocou viacerých kritérií pre umiestnenie zariadenia vrátane nasledujúcich charakteristík a zdrojov krajiny: využitie krajiny, topografický sklon, teplota, odparovanie, slnečné žiarenie, vegetácia, voda a CO2 zdroje, čističky odpadových vôd, rieky a jazerá, mestá a cesty, prírodné chránené územia, historické pamiatky, ramsarské náleziská, polohy letísk a geologické poruchy. Rôzne modely boli skonštruované tak, že sa dátovým vrstvám priradili váhy podľa vhodnosti. Vhodné oblasti na produkciu mikrorias boli identifikované až v 26,8% krajiny, čo zodpovedá 526 672 km 2. Konkrétne štáty Jalisco, Oaxaca a Veracruz mali najväčšie plochy vhodné na pestovanie mikrorias s potenciálnou produkciou suchej biomasy okolo 9 miliónov ton yr -1, čo predstavuje uskutočniteľnosť produkcie mikrorias v krajine.


5. Diskusia a záver

Výsledky ilustrujú dôležitosť použitia kvalitných referenčných údajov na účely geokódovania. Popri manuálnej digitalizácii malo komerčné riešenie PxPoint a súvisiace produkty, vrátane PxP-P, PxP-N a PxP-U, vynikajúcu pozičnú presnosť ako iné riešenia v strednom Texase a v celom štáte. Toto zistenie možno nie je prekvapujúce, pretože CoreLogic sa špecializuje na realitný priemysel a venoval obrovské úsilie a zdroje do katastrálnych údajov (napr. Parciel a nehnuteľností), čo je zásadné pri poskytovaní presných základných máp pre geokódovanie. Dominantné internetové geokódovacie služby, ako sú Google, Yahoo! a Bing, poskytovali dobrú pozičnú presnosť podobného rozsahu, ako sa predtým uvádzalo (Swift, Goldberg a Wilson 2008) licencovaním mapových údajov od iných dodávateľov geopriestorových údajov. Bezplatné geokódovacie služby OSM a Geocoder.us preukázali slušnú polohovú presnosť využitím crowdsourcingu alebo otvorených zdrojov. Aj keď otázka QC zostáva výzvou, pokiaľ ide o údržbu veľkých súborov geografických údajov v rozsiahlom regióne, táto štúdia predstavuje empirický dôkaz potenciálu základných máp založených na VGI v OSM poskytovať presné geokódovanie (Haklay 2010). V porovnaní so štúdiou Swift, Goldberg a Wilson (2008) boli značné rozdiely v pozičnej presnosti v geokódovaní Geocoder.us, TAMU a geokódovanie ArcGIS. Toto zistenie bolo pravdepodobne výsledkom rozdielnych referenčných údajov použitých medzi týmito dvoma štúdiami. Napríklad geokódovanie TAMU bolo pôvodne vyvinuté v južnej Kalifornii (predtým USC geokódovanie) a jeho národná databáza balíkov nebola v tejto štúdii k dispozícii (Goldberg, osobná komunikácia, 1. novembra 2013). Lepšiu výkonnosť geokódovania ArcGIS v iných štúdiách (Zhan a kol. 2006 Schootman a kol. 2007 Swift, Goldberg a Wilson 2008) možno v tejto štúdii pripísať použitiu vylepšených údajov StreetMap USA namiesto údajov TIGER / Line. Je však pozoruhodné, že táto celoštátna štúdia sa líši od väčšiny predchádzajúcich štúdií uskutočňovaných v urbanizovaných metropolitných oblastiach (Zhan et al. 2006 Schootman et al. 2007 Swift, Goldberg a Wilson 2008).

Medián, ako aj 5% upravená stredná hodnota boli nižšie ako priemerné pozičné chyby vo všetkých geokódovacích riešeniach, čo naznačuje pozitívne skreslené rozdelenie s malým, ale dôležitým podielom odľahlých hodnôt s veľmi vysokými chybami (tabuľky 2 a 3). Všeobecne sa zdalo, že rozdelenie bimodálnych chýb z tejto štúdie je konzistentné s distribúciou bimodálnych chýb od Swiftovej, Goldbergovej a Wilsonovej (2008), kde veľa pozorovaní malo všeobecne nízku polohovú chybu okolo 10 m, ale menší počet nesprávnych zhôd s vysokou polohovou chybou do 1 km alebo viac. Maximálne pozičné chyby na všetkých platformách uvádzané v tejto štúdii boli oveľa väčšie ako maximálna chyba okolo niekoľkých stoviek metrov uvedená v iných štúdiách (Zhan a kol. 2006 Schootman a kol. 2007). Ako však vyplýva z tabuliek 2 a 3, stredné pozičné chyby v Texase sa pohybovali od 5 do približne 100 m a sú podobné stredným chybám v podobných štúdiách (Whitsel a kol. 2006 Zimmerman a kol. 2007 Schootman a kol. 2007). Vysoké chyby v polohe z malého, ale dôležitého počtu odľahlých hodnôt tiež ilustrujú praktickú výzvu spočívajúcu v udržaní kvality geokódovania v rozsiahlej oblasti, ako je Texas.

Pri porovnaní dvoch experimentov uskutočňovaných v strednom Texase a v celom štáte bola pozičná chyba väčšiny riešení geokódovania, s výnimkou PxP-P a TAMU, vyššia v experimente využívajúcom ako referenčné údaje manuálnu digitalizáciu ako v prípade experimentu používajúceho GPS (tabuľky 2 a 3) . Aj keď by medzi používaním GPS a manuálnou digitalizáciou ako referenčnými údajmi boli rozdiely, podpísaná stredná chyba medzi manuálnou digitalizáciou a GPS bola zanedbateľná a v porovnaní s ostatnými geokódovacími riešeniami neodhalila žiadne smerové skreslenie (obrázky 3 a 4). Ak vylúčime triviálny vplyv z dôvodu rozdielu v referenčných údajoch, všeobecné zvýšenie priemernej polohovej chyby môže byť spôsobené geografickými oblasťami skúmanými v týchto dvoch experimentoch. Je pravdepodobné, že začlenenie rozsiahlych vidieckych oblastí po celom Texase do štúdie mohlo viesť k všeobecne vyšším pozičným chybám. Je zaujímavé, že táto štúdia tiež zistila, že geokódovanie ArcGIS má tendenciu sa zhlukovať na východnej strane súboru referenčných údajov (obrázok 3) - pozorovanie podobné predpojatosti ložiska uvádzanej v Schootman et al. (2007).

Zatiaľ čo väčšina geokodérov má veľmi vysokú mieru zhody, lepšiu ako 95%, Geocoder.us a OSM majú relatívne nízku mieru zhody, najmä v strednom Texase. Aj keď je pochopiteľné, že miera zhody OSM závisí od úplnosti VGI z crowdsourcingu, Geocoder.us trpí nedostatkom zdrojov na aktualizáciu svojich databáz máp ako bezplatná a otvorená verejná služba. Je tiež zaujímavé poznamenať, že v Texase došlo k miernemu zvýšeniu miery zhody ako v strednom Texase pre všetky geokódovacie riešenia, s výnimkou malého poklesu v platforme CoreLogic (tj. PxPoint, PxP-N, PxP-P a PxP-U. ). Jedným z možných vysvetlení je, že rýchly rozvoj v strednom Texase, jednom z najrýchlejšie rastúcich regiónov v krajine, vyústil do dlhšieho oneskorenia pri aktualizácii základných máp ako v iných častiach Texasu. Napríklad metropolitná štatistická oblasť Austin-Round Rock-San Marcos v Texase zaznamenala medzi rokmi 2000 a 2010 nárast populácie o 37,3% (U.S. Census Bureau 2010).

Na udržanie vysokej miery zhody medzi konkurenčnými geokódovacími službami sa očakáva, že poskytovatelia geokódovania budú naďalej licencovať vysoko kvalitné referenčné údaje od dodávateľov geopriestorových údajov a skúmať spôsoby integrácie VGI na zlepšenie svojich produktov geokódovania (Dobson 2013). Napriek nízkej miere zhody 14% v strednom Texase a 27% v Texase geokódovanie OSM odhalilo slušnú presnosť, pokiaľ ide o orezanú 5% strednú chybu a strednú chybu, čo naznačuje potenciál prístupu crowdsourcing na vytvorenie súboru geopriestorových údajov pre geokódovanie s porovnateľnými údajmi. pozičná presnosť pozdĺž týchto opatrení necitlivých na odľahlé hodnoty (napr. stredná hodnota a orezaná stredná chyba 5%). Ako už bolo spomenuté, QC vo VGI by bolo potrebné presadzovať prísnejšie, aby sa zmiernila veľká chyba vyvolaná odľahlými hodnotami.

V strednom Texase (tabuľka 5) mali všetci geokodéry okrem Bing a Geocoder.us nižšiu polohovú chybu v mestských oblastiach ako vo vidieckych oblastiach, ako to naznačujú predchádzajúce štúdie (Bonner et al. 2003 Cayo a Talbot 2003 Ward et al. 2005. Kravets a Hadden 2007). V celom štáte však malo šesť geokodérov vyššie pozičné chyby v mestských oblastiach ako vo vidieckych oblastiach, medzi ktorými spoločnosti Google, PxP-P a ArcGIS odhalili významné geografické rozdiely (tabuľka 6). Bolo tiež poznamenané, že päť z jedenástich platforiem geokódovania, vrátane Bing, OSM, PxPoint, PxP-N a PxP-U, odhalilo meniacu sa polaritu geografických rozdielov medzi 95% a úplnými vzorkami (tabuľka 7). Dôležitejšie je, že geografické rozdiely medzi Bingom a PxPointom boli štatisticky významné (p <0,001), ale odhalil opačný trend pri použití 100%, respektíve 95% vzoriek (tabuľky 5 a 6). Meniaca sa polarita navyše nemala jednoznačný vzorec, čo mohlo byť buď preto, že polohová chyba v mestských oblastiach bola väčšia ako vo vidieckych oblastiach alebo naopak. Aj keď sa akýkoľvek pokus o vyradenie odľahlých hodnôt z akejkoľvek analýzy musí vykonať opatrne a musí byť podložený vedeckým zdôvodnením, táto komparatívna analýza odhalila dôležitosť priestorového vzorkovania z hľadiska pozitívne skreslenej povahy distribúcie chýb. Toto zistenie naznačuje potrebu dobre navrhnutej stratégie priestorového vzorkovania na ďalšie skúmanie geografických rozdielov, ak existujú dôkazy na akceptovanie výskumnej hypotézy tak či onak. Existovalo najmenej sedem geokódovacích platforiem, ktoré uvádzali významný rozdiel medzi mestskými a vidieckymi oblasťami z týchto dvoch experimentov v rôznej mierke, čo naznačovalo existenciu geografického rozdielu v kvalite geokódovania v Texase (tabuľky 4–6). Zatiaľ čo hodnoty Mann – Whitney U v strednom Texase (tabuľka 5) majú tendenciu byť vyššie ako celoštátny experiment (tabuľky 5 a 6), niekoľko vzoriek vo vidieckych oblastiach v strednom Texase bolo nepresvedčivých, čo naznačuje, že existujú menšie geografické rozdiely. v miestnom regióne.

Táto celoštátna štúdia poskytuje systematické hodnotenie kvality geokódovania v rozsiahlom regióne a základ na uľahčenie priestorovo reprezentatívnej stratégie vzorkovania s cieľom ďalej preskúmať geografické rozdiely. Empirické výsledky presne určili a syntetizovali priestorové rozloženie pozičných chýb pre každú platformu geokódovania v Texase (obrázok 5 (a) - (k)). Pre poskytovateľov geokódovania tieto mapy identifikujú oblasti s rôznym stupňom kvality geokódovania a pomáhajú rozhodovaciemu procesu uprednostňovať miesta náchylné na vysoké chyby polohy a podľa toho prideľovať zdroje.

Obmedzením tejto štúdie, ako aj akýchkoľvek podobných výskumov je, že hodnotenie presnosti poskytuje iba snímku kvality geokódovania bežných platforiem, ktoré sú predmetom dynamického obchodného partnerstva s cieľom uspokojiť neustálu potrebu údržby referenčných údajov pre geokódovanie. Okrem toho je licenčná zmluva na údaje často majetková, a preto bola táto štúdia nepresvedčivá, pokiaľ ide o vyvodzovanie vzťahu medzi kvalitou referenčných údajov používaných jednotlivými platformami geokódovania a pozičnou presnosťou. Napríklad po dokončení tohto projektu spoločnosť Yahoo! začala vypínať svoje Map Web Services a prešla na platformu HERE vlastnenú spoločnosťou Nokia. Spoločnosť Microsoft Bing tiež poskytla licenciu na priestorové údaje od spoločnosti Nokia ako jedného z ich dodávateľov údajov. Geokódovanie TAMU má proprietárne údaje na úrovni balíkov na porovnávanie adries, ale kvôli licenčnej zmluve nebolo k dispozícii pre bezplatné geokódovanie.

Ako ukazuje táto štúdia, existujúce dôkazy si vyžadujú ďalší výskum s cieľom preskúmať geografické rozdiely medzi pozičnými chybami medzi rôznymi platformami geokódovania. Since many epidemiological and health studies rely on geocoded location of patients to explore their ecological relationship and environmental pathways, future research should examine the propagation of geocoding error and its geographic disparity, if there is any and in which polarity would affect subsequent analysis and policy implications (Zinszer et al. 2010 Goldberg and Cockburn 2012 ). While Zhan et al. ( 2006 ) reported no significant difference in classifying geocoded locations within 1500 m from toxic release inventory, the varying degree and higher range of positional errors reported in this study calls for further investigation across emerging geocoding platforms. Depending on the biased bearing and positional error relative to the census boundary, this study echoed a previous study (Schootman et al. 2007 ) that reported small but important wrong allocation of census geography.


How to exclude outliers from raster using ArcGIS for Desktop? - Geografické informačné systémy

Stack Exchange network consists of 177 Q&A communities including Stack Overflow, the largest, most trusted online community for developers to learn, share their knowledge, and build their careers.

Current community

Your communities

More stack exchange communities

Connect and share knowledge within a single location that is structured and easy to search.

I have been working in the GIS industry since 1992, originally in capture for over 6 years and then in 1999 moved on to ArcInfo workstation and AML development.

Since the release of ArcGIS 8.3 I have been developing with ArcObjects, initially in VBA and then VB6. I started learning .net when ESRI announced they were discontinuing support for VBA and VB6, since then I have become fluent in VB.net and C# using ArcObjects.

I have had some success in using GDAL/OGR in C++ and .net and have written successful and useful programs.

I have developed with python since ArcGis 9.2 through several versions of geoprocessor.


Pozri si video: Stredná hodnota: intuitívne vysvetlenie a príklady. Elea: Nauč sa matiku (Október 2021).