Viac

Konvertovanie GRIB na NetCDF s časovou dimenziou pomocou netcdfAll?


Snažím sa previesť súbory grib na NetCDF. Súbory grib obsahujú súbory subdát, ktoré súvisia s časom. Použitie knižnice Java netcdfAll s knižnicou NetCDF-4 C funguje dobre.

java -Xmx1g -classpath netcdfAll -4.5.jar ucar.nc2.dataset.NetcdfDataset -in ECM_DSD_2015021700_0000 -out ECM_DSD_2015021700_0000.nc -isLargeFile -netcdf4

Výsledný súbor NetCDF-4:

gdalinfo ECM_DSD_2015021700_0000.nc so zoznamom všetkých podskupiny dátovej sady, ako Subdatasets: SUBDATASET_1_NAME = HDF5 "ECM_DSD_2015021700_0000.nc": // GaussianLatLon_1280X2560-p07028S-179p9W / 100_metre_U_wind_component_surface SUBDATASET_1_DESC = [1x1280x2560] // GaussianLatLon_1280X2560-p07028S-179p9W / 100_metre_U_wind_component_surface (32-bit plávajúce -bod) SUBDATASET

Metatada jednej podmnožiny zobrazuje prázdny zoznam dimenzií a chýbajúcu časovú dimenziu:

gdalinfo HDF5: "ECM_DSD_2015021700_0000.nc": // GaussianLatLon_1280X2560-p07028S-179p9/100_metre_U_wind_component_surface Band 1 Block = 2560x25 Type = Float32, ColorInterp = Undefined Min = -25.70 StdDev = 7,106 Metadáta: GaussianLatLon_1280X2560-p07028S-179p9W_100_metre_U_wind_component_surface__Netcdf4Dimid = 15 GaussianLatLon_1280X2560-p07028S-179p9W_100_metre_U_wind_component_surface_coordinates = čas GaussianLatLon_1280X2560-p07028S-179p9W_100_metre_U_wind_component_surface_DIMENSION_LIST = GaussianLatLon_1280X2560-p07028S-179p9W_100_metre_U_wind_component_surface_Grib1_Center = 98 GaussianLatLon_1280X2560-p07028S-179p9W_100_metre_U_wind_component_surface_Grib1_Level_Desc = zem alebo povrchová voda GaussianLatLon_1280X2560-p07028S-179p9W_100_metre_U_wind_component_surface_Grib1_Level_Type = 1 GaussianLatLon_1280X2560 -p07028S-179p9W_100_metre_U_wind_component_surface_Grib1_Parameter = 246 GaussianLatLon_1280X2560-p07028S-179p9W_100_metre_U_wind_compo nent_surface_Grib1_Parameter_Name = 100U GaussianLatLon_1280X2560-p07028S-179p9W_100_metre_U_wind_component_surface_Grib1_Subcenter = 0 GaussianLatLon_1280X2560-p07028S-179p9W_100_metre_U_wind_component_surface_Grib1_TableVersion = 228 GaussianLatLon_1280X2560-p07028S-179p9W_100_metre_U_wind_component_surface_Grib_Variable_Id = VAR_98-0-228-246_L1 GaussianLatLon_1280X2560-p07028S-179p9W_100_metre_U_wind_component_surface_long_name = 100 meter U veterné zložka @ podzemných alebo povrchových vôd GaussianLatLon_1280X2560-p07028S- 179p9W_100_metre_U_wind_component_surface_missing_value = 1. # QNAN GaussianLatLon_1280X2560-p07028S-179p9W_100_metre_U_wind_component_surface_units = ms ** - 1 STATISTICS_MAXIMUM = 30,284362792969 STATISTICS_MEAN =, 49316239946346 STATISTICS_MINIMUM = -25,969543457031 STATISTICS_STDDEV = 7,1061257055032

Aký je teda trik na konverziu údajov s časovou dimenziou? Našiel som niekoľko pythonových skriptov [1] a nástroj ncks [2], mám prepnúť na jeden z nich?

Potom, čo chcem previesť každý subdataset na jeden GeoTiff, ale malo by to byť jednoduchšie, keď bol raz zachránený časový rozmer :-)

Pracujem s GDAL 1.11 a netcdfAll 4.5

[1] http://pysclint.sourceforge.net/pycdf/pycdf.html a https://readchunks.wordpress.com/ [2] http://linux.die.net/man/1/ncks


netcdfAll 4.6 je vo verzii beta a čoskoro by sa malo objaviť stabilné vydanie 4.6.1. Séria 4.6 má vylepšenú podporu GRIB, takže by bolo dobré to skúsiť. Tiež by som skontroloval, čoncdumpz balíka C netcdf hovorí o obsahu súboru, takže môžete určiť, či sú problémy vo vrstve Java netcdf alebo GDAL.

Ak si myslíte, že došlo k chybe, môžete problém otvoriť na stránke http://www.github.com/unidata/thredds/issues.


Konvertovanie GRIB na NetCDF s časovou dimenziou pomocou netcdfAll? - Geografické informačné systémy

Dostupnosť: ncbo, ncea, ncecat, ncflint, ncks, ncpdq, ncra, ncrcat, ncwa
Krátke možnosti: „-d dim, [min] [, [max] [, [krok]]]]
Dlhé možnosti: „ -dimenzia stlmená, [min] [, [max] [, [krok]]]],
„--Dmn dim, [min] [, [max] [, [krok]]]]

Na ukážku sily a pohodlia podpory UDUnits stačia dva príklady. Najprv zvážte extrakciu premennej obsahujúcej nezáznamové súradnice s fyzickými rozmermi uloženú v jednotkách MKS. V nasledujúcom príklade používateľ extrahuje všetky vlnové dĺžky vo viditeľnej časti spektra z hľadiska jednotiek veľmi často používaných vo viditeľnej spektroskopii, mikrónov:

Hyperšlab vracia správne hodnoty, pretože premenná wvl je uložená na disku s dĺžkovým rozmerom, ktorý UDUnits rozpoznáva v atribúte units. Automagický algoritmus, ktorý implementuje túto funkciu, stojí za to popísať, pretože jeho porozumenie vám pomôže vyhnúť sa niektorým potenciálnym nástrahám.

Používateľ najskôr zahrnie fyzické jednotky dimenzií hyperslab, ktoré dodáva, oddelené jednoduchým priestorom od číselných hodnôt limitov hyperslab. Všetky špecifikácie súradníc uzatvára do úvodzoviek, aby škrupina neporušila hodnotovo-priestorová jednotka reťazec do samostatných argumentov pred ich odovzdaním poddôstojníkovi. Na tento účel platia rovnako dvojité úvodzovky („foo“) alebo jednoduché úvodzovky („foo“).

Translácia a dimenzionálna interpretácia časových súradníc ukazuje výkonnejšiu a pravdepodobne bežnejšiu aplikáciu UDUnits. V tomto prípade používateľ vytlačí všetky údaje od 16:00 do 19:00 8. decembra 1999 z premennej, ktorej časový rozsah je od roku 1900 hodiny:

Tu používateľ vyvolá schopnosť kroku (pozri časť Krok), aby získal každý ďalší časový úsek. Je to možné, pretože funkcia UDUnits je aditívna, nie exkluzívna - funguje v spojení so všetkými ostatnými možnosťami hyperslabingu (pozri časť Hyperslabs) a vo všetkých operátoroch, ktoré hyperslabbing podporujú. Nasledujúci príklad ukazuje, ako je možné priemerovať údaje v časovom období rozloženom do viacerých vstupných súborov

Všimnite si toho, že pred alebo za jednotlivými prvkami argumentu „-d“ nie je nadbytočné medzery. To je dôležité, pretože, pokiaľ vie shell, „-d“ trvá iba jeden argument príkazového riadka. Analýza tohto argumentu na jeho prvky dim, [min] [, [max] [, [stride]]] (pozri časť Hyperslabs) je úlohou poddôstojníka. Keď je medzi týmito prvkami prázdny prázdny priestor, škrupina prechádza fragmentmi arugmentu NCO, ktoré sa nebudú analyzovať podľa plánu.

Poddôstojník implementoval podporu pre knižnicu UDUnits2 verzie 3.9.2 (august 2007). Balík UDUnits2 podporuje znaky iné ako ASCII a logaritmické jednotky. Zaujíma nás spätná väzba používateľov na tieto funkcie.

Táto flexibilita za behu môže umožniť plnú funkčnosť vopred pripravených binárnych súborov na počítačoch s knižnicami na rôznych miestach.

Dokumentácia balíka UDUnits popisuje podporované formáty časových dimenzií. Medzi konvencie metadát, ktoré sa držia týchto formátov, patria dohovory o klíme a predpovedi (CF) a dohovory o kooperatívnom výskume údajov o oceáne/atmosfére (COARDS). Nasledujúce „argumenty -d“ extrahujú rovnaké údaje pomocou bežne používaných formátov časovej dimenzie:

Všetky tieto formáty obsahujú najmenej jednu pomlčku - na mieste, ktoré nie je znakom začiatku (pomlčka na pozícii vedúceho znaku je záporným znakom). Poddôstojník predpokladá, že neprekračujúca pomlčka v reťazci limitov naznačuje, že je požadovaná konverzia dátumu UDUnits.

„365_day“/„noleap“, „360_day“, „gregorian“, „standard“

Nepodporované typy sú predvolene zmiešané ako gregoriánske/juliánske podľa definície v UDUnits.

Príklad: Zoberme si nasledujúcu premennú netCDF


Abstrakt

V hydrologickom výskume je potrebné spravovať, archivovať a publikovať údaje zistiteľným spôsobom, aby sa zvýšilo opätovné použitie, transparentnosť a reprodukovateľnosť údajov. V hydrologickom výskume sa bežne používajú viacrozmerné časopriestorové údaje a na zdieľanie a výmenu týchto údajov sú potrebné systémy. Jednoduchá výmena súborov môže viesť k strate informácií o metaúdajoch a môže byť náročná, ak sú súbory veľké. Vyvinuli sme prístup k správe, zdieľaniu a publikovaniu viacrozmerných časopriestorových údajov v HydroShare, hydrologickom informačnom systéme ďalšej generácie a úložisku špecifickom pre doménu. Tento článok predstavuje návrh, vývoj a testovanie tohto prístupu. Ako podkladový dátový model sme vybrali Network Common Data Form (NetCDF). Definovali sme špecifické prvky metadát na ukladanie a správu viacrozmerných časopriestorových údajov. Prijali sme a upravili existujúci softvér na automatické získavanie údajov, podporu zadávania metadát a zavedenie štandardizovaných dátových služieb, ktoré slúžia a zlepšujú prístup k súborom údajov zdieľaným v programe HydroShare.


Konvertovanie GRIB na NetCDF s časovou dimenziou pomocou netcdfAll? - Geografické informačné systémy

Noky SYNTAX [-3] [-4] [-6] [-A] [-a] [-B] [-b binárny súbor] [-C] [-c] [--cnk_dmn nm, sz] [ --cnk_map mapa] [--cnk_plc plc] [--cnk_scl sz] [-D dbg] [-d dim, [min] [, [max] [, [krok]]] [--fix_rec_dmn] [-F ] [-H] [-h] [--hdr_pad nbr] [-L dfl_lvl] [-l cesta] [-M] [-m] [--mk_rec_dmn dim] [-O] [-o výstupný súbor] [-P] [-p cesta] [-Q] [-q] [-R] [-r] [-s formát] [-u] [-v var [. ]] [-X . ] [-x] vstupný súbor [[výstupný súbor]]

ncks kombinuje vybrané funkcie ncdump, ncextr a nccut a ncpaste do jedného všestranného pomocného programu. ncks extrahuje podmnožinu údajov zo vstupného súboru a vytlačí ich ako text ASCII na výstup, zapíše ich v plochom binárnom formáte do binárneho súboru a zapíše (alebo vloží) vo formáte netCDF do výstupného súboru.

ncks vytlačí údaje netCDF vo formáte ASCII na výstup, ako ncdump, ale s týmito rozdielmi: ncks vytlačí údaje v tabuľkovom formáte, ktorý má uľahčiť vyhľadávanie požadovaných údajov, jeden nulový bod na riadok obrazovky, so všetkými indexovými indexmi a súradnicami hodnoty (ak existujú) predchádzajúce vzťažnému bodu. Možnosť „-s“ (alebo dlhé možnosti „--sng_fmt“ a „--string“) umožňuje používateľovi naformátovať údaje pomocou reťazcov vo formáte C.

Možnosti '-a', '-F', '-H', '-M', '-m', '-P', '-Q', '-q', '-s' a '-u “(a ich dlhé náprotivky) ovládajú formátovaný vzhľad údajov.

ncks extrahuje (a voliteľne vytvorí nový súbor netCDF pozostávajúci z) iba vybraných premenných zo vstupného súboru (podobne ako stará špecifikácia ncextr). Špecificky môžu byť zahrnuté alebo vylúčené iba premenné a súradnice - všetky globálne atribúty a všetky atribúty súvisiace s extrahovanou premennou sa skopírujú do obrazovky a/alebo výstupného súboru netCDF. Možnosti „-c“, „-C“, „-v“ a „-x“ (a ich dlhé synonymá možností) určujú, ktoré premenné sa majú extrahovať.

ncks extrahuje hyperslabs zo zadaných premenných (ncks implementuje pôvodnú špecifikáciu nccut). Voľba „-d“ riadi špecifikáciu hyperslab. Vstupné dimenzie, ktoré nie sú priradené k žiadnej výstupnej premennej, sa vo výstupnom netCDF nezobrazia. Táto funkcia odstráni nadbytočné rozmery zo súborov netCDF.

ncks pripojí premenné a atribúty zo vstupného súboru k výstupnému súboru, ak je výstupným súborom už existujúci súbor netCDF, ktorého príslušné rozmery zodpovedajú rozmerom vstupného súboru. Pripojovacie funkcie ncks majú poskytnúť základný spôsob pridávania údajov z jedného súboru netCDF do druhého, vyhovujúceho súboru netCDF. Ak medzi týmito dvoma súbormi existujú konflikty pomenovania, údaje vo výstupnom súbore sa zvyčajne prepíšu zodpovedajúcimi údajmi zo vstupného súboru. Pri pripájaní by teda mal užívateľ zálohovať výstupný súbor pre prípad, že by sa nechtiac prepísali cenné údaje.

Ak existuje výstupný súbor, používateľ bude požiadaný, či hovor ncks prepíše, pripojí alebo úplne ukončí. Voľba prepísania zničí existujúci výstupný súbor a vytvorí úplne nový z výstupu hovoru ncks. Pripojenie má rôzne účinky v závislosti od jedinečnosti výstupov premenných a atribútov pomocou ncks: Ak premenná alebo atribút extrahovaný zo vstupného súboru nemá konflikt názvov s členmi výstupného súboru, bude pridaný do výstupného súboru bez prepísaním ktoréhokoľvek z existujúceho obsahu výstupného súboru. V tomto prípade musia príslušné dimenzie súhlasiť (zhodovať sa) medzi týmito dvoma súbormi, nové dimenzie sa vytvoria vo výstupnom súbore podľa potreby. Keď dôjde ku konfliktu názvov, globálny atribút zo vstupného súboru prepíše zodpovedajúci globálny atribút z výstupného súboru. Ak dôjde k konfliktu názvov pre nezaznamenateľnú premennú, potom musia rozmery a typ premennej (a jej súradnicových dimenzií, ak existujú) súhlasiť (v zhode) v oboch súboroch. Potom hodnoty premenných (a všetky hodnoty rozmerov súradníc) zo vstupného súboru prepíšu zodpovedajúce hodnoty premenných (a hodnoty súradnicových dimenzií, ak existujú) vo výstupnom súbore 41.

Pretože v súbore môže byť iba jedna dimenzia záznamu, dimenzia záznamu musí mať v oboch súboroch rovnaký názov (nie však nevyhnutne rovnakú veľkosť), ak sa má pripojiť premenná dimenzie záznamu. Ak majú rozmery záznamu rôzne veľkosti, záznamový rozmer výstupného súboru sa stane väčšou z dvoch veľkostí záznamových rozmerov, premenná záznamu zo vstupného súboru prepíše akýkoľvek náprotivok vo výstupnom súbore a hodnoty výplne sa zapíšu do ľubovoľného medzery vo zvyšku záznamových premenných (myslím). Vo všetkých prípadoch sú atribúty premenných vo výstupnom súbore nahradené atribútmi rovnakého mena zo vstupného súboru a ponechané osamote, ak nedochádza ku konfliktu názvov.

Niektorí používatelia sa môžu chcieť vyhnúť interaktívnym dotazom o tom, či prepísať existujúce údaje. Dávkové skripty napríklad zlyhajú, ak ncks nedostane odpovede na svoje dotazy. K dispozícii sú možnosti „-O“ a „-A“ na vynútenie prepísania existujúcich súborov a premenných.
Možnosti špecifické pre ncks

Nasledujúci zoznam poskytuje krátky súhrn funkcií jedinečných pre ncks. Funkcie spoločné pre mnoho operátorov sú popísané v časti Spoločné funkcie. ‘-a‘ Extrahované polia neaplikujte podľa abecedy. Štandardne sa uvedené výstupné premenné extrahujú, vytlačia a zapíšu na disk v abecednom poradí. To má za následok uľahčenie vyhľadávania dlhých výstupných zoznamov pre konkrétne premenné. Zadaním -a sa premenné extrahujú, vytlačia a zapíšu na disk v poradí, v akom boli uložené do vstupného súboru. -A zachováva pôvodné usporiadanie premenných. Tiež „--abc“ a „-abecedne“.

„-B súbor“ Aktivuje zápis pôvodného strojového binárneho výstupu do predvoleného binárneho súboru ncks.bnr. Prepínač -B je nadbytočný, keď je zadaná možnosť súboru -b, a natívny binárny výstup bude smerovaný do súboru binárnych súborov. Tiež „--bnr“ a „--binárne“. Zápis premenných v binárnom formáte nie je podporovaný.

'-B súbor'Aktivuje zápis natívnych strojových binárnych výstupov do súboru binárnych súborov. Tiež „--fl_bnr“ a „--binary-file“. Zápis premenných v binárnom formáte nie je podporovaný.

‘-D dim, [min] [, [max] [, [krok]]]]‘ Pridajte krokový argument do hyperslabberu. Úplný popis argumentu krok je v kroku.

„--Fix_rec_dmn’Zmeňte všetky rozmery záznamu vo vstupnom súbore na pevné rozmery vo výstupnom súbore. Tiež „--no_rec_dmn“.

„--Mk_rec_dmn dim“ Zmeňte existujúcu dimenziu dimenzie na rekordnú dimenziu vo výstupnom súbore. Ďalšie metódy zmeny variabilnej dimenzionality vrátane dimenzie záznamu nájdete v časti Ncecat netCDF Encable Concatenator a ncpdq netCDF Permute Dimensions Quickly.

'-H'Tlač údajov na obrazovku. Tiež sa aktivuje pomocou „--print“ alebo „--prn“. Štandardne ncks vytlačí všetky metadáta a údaje na obrazovku, ak nie je zadaný žiadny výstupný súbor netCDF. „-H“ použite na tlač údajov na obrazovku, ak je zadaný výstup netCDF, alebo na obmedzenie tlače na údaje (žiadne metadáta), ak nie je zadaný žiadny výstup netCDF. Pokiaľ nie je uvedené inak (s -s), každý prvok hyperslabu údajov tlačí na samostatnom riadku obsahujúcom názvy, indexy a prípadné hodnoty všetkých dimenzií premenných. Indexy dimenzií a premenných sa týkajú umiestnenia zodpovedajúceho dátového prvku vzhľadom na premennú uloženú na disku (t. J. Nie v hyperslabe). % ncks -C -v three_dmn_var in.nc lat [0] = -90 lev [0] = 100 lon [0] = 0 three_dmn_var [0] = 0 lat [0] = -90 lev [0] = 100 lon [ 1] = 90 three_dmn_var [1] = 1 lat [0] =-90 lev [0] = 100 lon [2] = 180 three_dmn_var [2] = 2. lat [1] = 90 lev [2] = 1000 lon [1] = 90 three_dmn_var [21] = 21 lat [1] = 90 lev [2] = 1000 lon [2] = 180 three_dmn_var [22] = 22 lat [ 1] = 90 lev [2] = 1000 osamelých [3] = 270 three_dmn_var [23] = 23

Vytlačenie tej istej premennej pomocou možnosti '-F' ukazuje rovnakú premennú indexovanú podľa fortranských konvencií % ncks -F -C -v three_dmn_var in.nc lon (1) = 0 lev (1) = 100 lat (1) = -90 three_dmn_var (1) = 0 lon (2) = 90 lev (1) = 100 lat (1) =-90 three_dmn_var (2) = 1 lon (3) = 180 lev (1) = 100 lat (1) =-90 three_dmn_var (3) = 2.

Tlač hyperplátky nemá vplyv na indexy premenných alebo dimenzií, pretože tieto indexy sú relatívne k úplnej premennej (uložené vo vstupnom súbore) a vstupný súbor sa nezmenil. Ak je však hyperslab uložený do výstupného súboru a tieto hodnoty sú vytlačené, indexy sa zmenia: % ncks -H -d lat, 90,0 -d lev, 1000,0 -v three_dmn_var in.nc out.nc. lat [1] = 90 lev [2] = 1000 lon [0] = 0 three_dmn_var [20] = 20 lat [1] = 90 lev [2] = 1000 lon [1] = 90 three_dmn_var [21] = 21 lat [ 1] = 90 lev [2] = 1000 lon [2] = 180 three_dmn_var [22] = 22 lat [1] = 90 lev [2] = 1000 lon [3] = 270 three_dmn_var [23] = 23 % ncks -C -v three_dmn_var out.nc lat [0] = 90 lev [0] = 1000 lon [0] = 0 three_dmn_var [0] = 20 lat [0] = 90 lev [0] = 1000 lon [1] = 90 three_dmn_var [ 1] = 21 lat [0] = 90 lev [0] = 1000 lon [2] = 180 three_dmn_var [2] = 22 lat [0] = 90 lev [0] = 1000 lon [3] = 270 three_dmn_var [3] = 23

‘-M’Tlač na zobrazenie globálnych metadát opisujúcich súbor. To zahŕňa súhrnné informácie o súboroch a globálne atribúty. Tiež „--Mtd“ a „--Metadata“. V predvolenom nastavení ncksprints vytlačí globálne metadáta na obrazovku, ak nie je zadaný žiadny výstupný súbor netCDF ani zoznam extrakcie premenných (s „-v“). Ak je zadaný výstup netCDF alebo ak je zadaný zoznam extrakcie premenných (s „-v“), na tlač globálnych metaúdajov na obrazovku použite „-M“.

Rôzne kombinácie tlačových spínačov môžu byť mätúce. V snahe predvídať, čo chce väčšina používateľov robiť, používa ncks na tlač predvolené nastavenia závislé od kontextu. Našim cieľom je minimalizovať používanie prepínačov potrebných na vykonávanie bežných operácií. Predpokladáme, že používatelia vytvárajúci nový súbor alebo prepisujúci (napr. „-O“) existujúci súbor zvyčajne chcú skopírovať do nového súboru všetky globálne atribúty špecifické pre premenné.Naproti tomu predpokladáme, že používatelia, ktorí pripájajú (napr. Pomocou výrazu „-A“ explicitný zoznam premenných z jedného súboru do druhého, zvyčajne chcú skopírovať do výstupného súboru iba atribúty špecifické pre premennú. Prepínače „-H“, „-M Prepínače 'a' -m sú implementované ako prepínače, ktoré zvrátia predvolené správanie. Najzamotanejšie na tom je, že '-M' bráni kopírovaniu globálnych metadát v režime prepisovania a spôsobuje kopírovanie globálnych metadát v režime pridávania. ncks -O in.nc out.nc # Kopírovať VA a GA ncks -O -v jeden in.nc out.nc # Kopírovať VA a GA ncks -O -M -v jeden in.nc out.nc # Kopírovať VA nie GA ncks -O -m -v jeden vstup.nc výstup.nc # Kopírovať GA nie VA ncks -O -M -m -v jeden vstup.nc výstup.nc # Kopírovať iba údaje (bez attov) ncks -A vstup.nc výstup.nc # Pripojte konektory VA a GA -A -v jeden in.nc von.nc # Pripojte VAs nie -GAs ncks -A -M -v jeden in.nc výstup.nc # Pripojte VA a GAs ncks -A -m -v jeden in. nc out.nc # Pripojiť iba údaje (bez prekážok) ncks -A -M -m -v jeden vstup.nc výstup.nc # Pripojiť GA nie VA

kde VA a GA označujú variabilné a globálne atribúty.

'-M'Tlač metadát premennej na obrazovku (podobne ako ncdump -h). Zobrazia sa všetky metadáta týkajúce sa každej premennej, jedna premenná naraz. To zahŕňa informácie o vlastnostiach ukladacieho priestoru premennej, napríklad o tom, či používa blokovanie, kompresiu alebo balenie. Tiež sa aktivuje pomocou „--mtd“ a „--metadata“. Predvolené správanie ncks je tlač metadát premenných na obrazovku, ak nie je zadaný žiadny výstupný súbor netCDF. Ak je zadaný výstup netCDF, pomocou „-m“ vytlačíte na obrazovku premenné metaúdaje.

‘-P’ Vytlačte údaje, metadáta a jednotky na zobrazenie. Prepínač „-P“ je praktická skratka pre „-C -H -M -m -u“. Tiež sa aktivuje pomocou „--print“ alebo „--prn“. Táto sada prepínačov je užitočná pri skúmaní obsahu súboru.

‘-Q’Prepínať tlač indexov dimenzií a hodnôt súradníc pri tlači polí. Názov každej premennej sa vo výstupe zobrazí zarovnaný doľava. Pomáha to nájsť konkrétne premenné v zoznamoch s mnohými premennými a rôznymi dimenziami.

'-Q'Vypnite všetku tlač na obrazovku. Toto prepíše nastavenie všetkých tlačiarní súvisiacich prepínačov, ekvivalentných -H -M -m v režime tlače jedného súboru. Pri vyvolaní pomocou -R (pozri Zachovanie načítaných súborov) ncks automaticky nastaví -q. To umožňuje ncks načítať vzdialené súbory bez toho, aby sa ich automaticky pokúšali vytlačiť. Tiež „-ticho“.

„-S format“ Formát reťazca pre textový výstup. Prijíma únikové sekvencie jazyka C a formáty printf (). Tiež „-reťazec“ a „--sng_fmt“.

‘-U’ Prepnite tlač atribútu jednotiek premennej, ak existuje, s jeho hodnotami. Tiež „-jednotky“.

Zobraziť všetky údaje v netCDF in.nc, vytlačené podľa Fortranových indexovacích konvencií: ncks -F in.nc

Skopírujte súbor netCDF in.nc do súboru out.nc. ncks in.nc out.nc

Teraz súbor out.nc obsahuje všetky údaje z in.nc. Medzi in.nc a out.nc. sú však dva rozdiely. Najprv bude globálny atribút history (pozri Atribút histórie) obsahovať príkaz použitý na vytvorenie out.nc. Za druhé, premenné v out.nc budú definované v abecednom poradí. Interné ukladanie premenných v súbore netCDF by malo byť pre používateľa samozrejme transparentné, existujú však prípady, keď je užitočná abeceda súboru (pozri popis prepínača -a).

Skopírujte všetky globálne atribúty (a žiadne premenné) z in.nc do out.nc: ncks -A -x

Prepínač „-x“ prikazuje poddôstojníkovi, aby použil doplnok zoznamu extrakcií (pozri podmnožiny premenných). Pretože nie je výslovne uvedený žiadny zoznam extrakcie (s '-v'), predvolene je extrahovať všetky premenné. Doplnkom všetkých premenných nie sú žiadne premenné. Bez extrahovania akýchkoľvek premenných musí príkaz append („-A“) (pozri Pripojenie premenných) iba extrahovať a skopírovať (tj. Pripojiť) globálne atribúty do výstupného súboru.

Vytlačte premennú three_dmn_var zo súboru in.nc s predvolenými zápismi. Ďalej vytlačte three_dmn_var ako anotovaný textový stĺpček. Potom vytlačte three_dmn_var podpísané s veľmi vysokou presnosťou. Nakoniec vytlačte three_dmn_var ako zoznam oddelený čiarkami. % ncks -C -v three_dmn_var in.nc lat [0] = -90 lev [0] = 100 lon [0] = 0 three_dmn_var [0] = 0 lat [0] = -90 lev [0] = 100 lon [ 1] = 90 three_dmn_var [1] = 1. lat [1] = 90 lev [2] = 1000 lon [3] = 270 three_dmn_var [23] = 23 % ncks -s ' % f n' -C -v three_dmn_var in.nc 0,000000 1,000000. 23,000000 % ncks -s ' % +16,10f n' -C -v three_dmn_var in.nc +0,0000000000 +1,0000000000. +23,0000000000 % ncks -s ' % f,' -C -v three_dmn_var in.nc 0,000000, 1,000000,. 23.000000,

Druhá a tretia možnosť sú užitočné pri vkladaní údajov do textových súborov, ako sú správy alebo dokumenty. Bližšie informácie o formátovaní reťazcov a špeciálnych znakoch nájdete v ncatted netCDF Attribute Editor.

Jednorozmerné polia znakov uložených ako premenné netCDF sa automaticky vytlačia ako reťazce bez ohľadu na to, či sú ukončené NULOU, napr. Ncks -v fl_nm in.nc

Formátovací kód %c je užitočný na tlač viacrozmerných polí znakov predstavujúcich reťazce pevnej dĺžky ncks -s ' %c' -v fl_nm_arr in.nc

Použitie kódu formátu %s na reťazce, ktoré nie sú zakončené NULOU (a teda nie sú technicky reťazcami), pravdepodobne spôsobí jadrový výpis.


Glosár pojmov NCL a HLU

Sekvencia dvoch alebo viacerých obrazov, ktoré, ak sú zobrazené v rýchlom slede, poskytujú ilúziu súvislého pohybu.

anotácia Zobraziteľný objekt, ktorého poloha a zvyčajne veľkosť sú nastavené relatívne k zobrazovanému priestoru alebo priestoru súradníc údajov základného grafu. Existujú tri druhy anotácií: vnútorné anotácie, vložené anotácie a externé anotácie.

anotačné funkcie Funkcie používané na pridávanie a odstraňovanie anotácií do a z objektov vykresľovania. Konkrétne ide o tieto funkcie NhlAddAnnotation a NhlRemoveAnnotation pre rozhrania C a Fortran.

anotačný dej Anotácia, ktorá je grafickým objektom, a nie iba viditeľným objektom. Anotačný diagram je podriadený základný diagram.

ANSI Americký národný inštitút pre štandardy, nezávislá nezisková organizácia, ktorá vytvára a publikuje národné normy USA (ako napríklad Fortran, C, CGM atď.) A ktoré vstupujú zo všetkých sektorov technickej komunity a širokej verejnosti. ANSI tiež spolupracuje s inými normalizačnými organizáciami, ako sú ISO (Medzinárodná organizácia pre normalizáciu) a IEEE (Inštitút elektrotechnických a elektronických inžinierov).

žiadosť Program napísaný v jazyku C, Fortran alebo NCL, ktorý využíva akúkoľvek z funkcií NCAR Graphics.

aplikačná trieda Vzťahuje sa konkrétne na triedu Aplikácia. Objekty, ktoré sú inštanciami tejto triedy, sa používajú na sledovanie databáz zdrojov. Každá aplikácia musí vytvoriť aspoň jeden objekt App (to sa vykoná automaticky, ak ho použijete NhlOpen).

Prgramovacie prostredie aplikácií Programovacie rozhrania (C, Fortran a NCL) k balíku NCAR Graphics. Tieto rozhrania poskytujú prístup k podporným funkciám definovaným v týchto triedach a poskytujú ďalšie užitočné funkcie.

súbor prostriedku aplikácie Súbor zdrojov, ktorý je špecifický pre konkrétnu aplikáciu. Existujú dva súbory zdrojov špecifické pre aplikáciu: súbor zdrojov pre konkrétnu systémovú aplikáciu a súbor zdrojov pre konkrétnu aplikáciu. Užívateľ môže určiť, v ktorých adresároch sa nachádzajú súbory zdrojov špecifické pre aplikáciu. V predvolenom nastavení je súbor prostriedkov pre konkrétnu aplikáciu v miestnom aktuálnom adresári a súbor zdrojov pre konkrétnu systémovú aplikáciu je v adresári určenom nastavením prostredia. premenná NCARG_SYSAPPRES. Prostriedky definované v súbore prostriedkov konkrétnej užívateľskej aplikácie prepíšu zdroje definované v súbore zdrojov systémovej aplikácie.

vzor výplne oblasti Vzor, ktorý sa má použiť na vyplnenie polygonálnej oblasti. Vzory sa vyberajú pomocou celočíselného indexu výplne do tabuľky vzorov.

aritmetický operátor Operátor, ktorý platí pre premenné s číselným údajovým typom. Príklady sú „+“ (sčítanie) a „*“ (násobenie).

ASCII Označuje „americký štandardný kód na výmenu informácií“. Toto je štandard ANSI, ktorý špecifikuje množinu 128 znakov s ich priradenými kódovanými celočíselnými reprezentáciami.

Súbor ASCII NCL: Dátový súbor, ktorý obsahuje celé čísla alebo hodnoty údajov s pohyblivou rádovou čiarkou vo formáte ASCII.

pomer strán Určuje pomer výšky k šírke grafu. Tento výraz sa vzťahuje aj na postavy. Napríklad postavy s pomerom strán 2,0 sú dvakrát vyššie ako široké.

asociatívny operátor Binárny operátor, ktorý sa riadi zákonom asociativity: t.j. binárny operátor „R“ taký, že (aRb) Rc = aR (bRc) pre všetky právne operandy a, b a c.

atribút NCL: Jednoducho dimenzovaný nulový bod akéhokoľvek typu, ktorý je priradený k premennej pomocou operátora ' @'. Atribút premennej obsahuje popisné informácie o premennej.

základný pozemok Objekt grafu zodpovedný za nastavenie oblasti zobrazenia nula alebo viacerých členov grafu vzhľadom na jeho vlastnú oblasť zobrazenia. Existujú dva druhy základného diagramu: primárne základné grafy a podriadené základné grafy. Pri vytváraní je akýkoľvek objekt grafu primárnym základným diagramom. Objekt sprisahania prestane byť základným grafom, keď je pridaný k inému objektu grafu ako prekrytie. Keď sa objekt sprisahania pridá ako anotáciu, stane sa podriadeným základným pozemkom. Objekt grafu musí byť primárnym základným pozemkom, aby ho mohli používatelia nakresliť alebo zmeniť pracovnú stanicu.

binárny súbor Súbor, ktorého obsah sa má interpretovať ako sekvencia bitov, nie ako znaky. Binárne súbory majú rôzne príchute. „Plochý“ binárny súbor je postupnosť bitov bez pomocných informácií o obsahu súboru. Tento typ súboru vytvárajú a čítajú programy C. Fortran vytvára a číta ploché binárne súbory iba v režime priameho prístupu. Všetky záznamy majú rovnakú veľkosť v plochom binárnom súbore. Fortran štandardne vytvára iný typ binárnych súborov, ktoré môžu obsahovať záznamy s premennou dĺžkou. Toto sa nazýva binárny súbor so sekvenčným prístupom. V binárnom súbore sekvenčného prístupu sú informácie o dĺžke záznamu vložené pred každý záznam.

blokové vyhlásenie Príkaz, ktorý vyžaduje jeden alebo viac jednotlivých príkazov uzavretých oddeľovačmi, ktoré označujú začiatok a koniec bloku. Príklady blokových príkazov sú: do-end do, if-then-end if, setvalues-end setvalues.

ohraničujúci box Pre Zobraziť triedu Pri ohraničených objektoch je ohraničovací rámček pre tieto objekty najmenší obdĺžnik v priestore NDC, ktorý obsahuje všetky značky, ktoré by sa objavili na výstupnej pracovnej stanici, ak by bol objekt nakreslený.

vstavaná funkcia alebo postup Vstavaná funkcia alebo postup v NCL je integrovaná do kódu pre NCL, a preto na jej použitie nemusíte načítať žiadne skripty NCL. Medzi príklady vstavaných funkcií patrí fspan a pridať súbor. Príklady postupov zahŕňajú systém a vymazať. Príkladom funkcie, ktorá sa nepovažuje za vstavanú funkciu, je gsn_open_wks.

karteziánska mriežka Kartézska mriežka je najjednoduchšia forma štruktúrovanej mriežky. Skladá sa jednoducho zo štvorcových buniek usporiadaných rovnomerne v matici. Bunky mriežky sú rovnomerne rozložené vo všetkých smeroch a pre každý stĺpec je rovnaký počet riadkov a naopak.

Formát pásky CCM s históriou Patentovaný formát údajov používaný modelmi simulácie atmosférického podnebia vyvinutými v NCAR. (CCM je skratka pre komunitný klimatický model.)

Prototyp funkcie C. Deklarácia funkcie C, ktorá deklaruje návratový typ funkcie, koľko argumentov funkcia obsahuje a typy argumentov.

    1. B dedí databázu zdrojov A. Ak je zobraziteľný, B sa zobrazí na rovnakej pracovnej stanici ako A, ak A je pracovná stanica, potom B nakreslí do A.
    2. Zničenie A zničí B.
    3. Prostriedky je možné zadať v súboroch zdrojov ako: . . . . : .

    trieda Šablóna na definovanie objektov, ktoré špecifikujú premenné, a postupov, ktoré na týchto premenných pôsobia. V kontexte knižnice NCAR HLU sa premenné triedy nazývajú zdroje a postupy triedy sa nazývajú podporné funkcie. Objekty sú členmi alebo inštanciami triedy tvorenej priradením konkrétnych hodnôt premenným v triede.

    triedna hierarchia Každá trieda, okrem základnej triedy, je odvodená od inej triedy. Stromová štruktúra určená vzťahmi odvodenej triedy/nadtriedy medzi všetkými triedami sa nazýva hierarchia tried. Hierarchia tried by sa nemala zamieňať s hierarchiou podriadeného/rodiča.

    index farieb Celočíselná hodnota, ktorá predstavuje index do aktuálnej farebnej mapy pracovnej stanice. Index 0 predstavuje farbu pozadia a 1 farbu popredia. Hodnoty sú obmedzené od 0 do 255, pretože farebná mapa pracovnej stanice nemôže mať viac ako 256 farieb. Použitie indexovaných farieb sa odporúča pred indexovanými farbami. Pozri tiež gsn_draw_colormap.

    farebná tabuľka Tabuľka, ktorá spája celočíselné hodnoty (nazývané farebné indexy) s hodnotami farieb RGB. V NCL obsahujú tabuľky farieb až 256 farieb (vrátane farieb pozadia a popredia). Existuje niekoľko preddefinovaných tabuliek farieb, alebo si môžete definovať vlastnú. Pozri tiež gsn_draw_colormap.

    príkaz NCL: Rovnaké ako vyhlásenie NCL.

    riadok komentárov Riadok v kóde NCL začínajúci bodkočiarkou (). Riadok v súbore zdrojov NCL začínajúci výkričníkom (!). Riadky komentárov obsahujú popisné informácie o kóde.

    zložená trieda Trieda, ktorá kombinuje zdroje iných tried s vlastnými. Zložená trieda dedí zdroje a funkcie zo svojej nadtriedy a zdieľa zdroje od svojich zložených členov v procese presmerovania zdrojov. Ak majú členovia zloženej triedy podporné funkcie, tieto funkcie sa nevzťahujú na zloženú triedu.

    zložený člen triedy Trieda používaná ako súčasť funkcionality zloženej triedy.

    zdroj kompozitnej triedy Prostriedok dostupný kompozitnej triede prostredníctvom presmerovania zdrojov z členskej triedy kompozitnej triedy.

    Metasúbor počítačovej grafiky Metasúbor grafiky je súbor, ktorý obsahuje kódované prvky vektorovej grafiky, ako sú čiary, farby, čiarkové vzory, značky atď. Computer Graphics Metafile (CGM) je presne definované formátovanie pre grafický metasúbor, ako ho definuje a štandardizuje ANSI. NCL produkuje verziu CGM, ktorá sa nazýva a vyhovujúce súkromné ​​kódovanie ktoré je možné ľahko previesť na a zo štandardného CGM pomocou filtrov ncgm2cgm a cgm2ncgm. Súkromné ​​kódovanie NCAR sa nazýva aj NCAR CGM alebo NCGM.

    vrstevnicová zápletka Graf 2D údajov obsahujúcich vrstevnice (čiary označujúce body s rovnakou nadmorskou výškou) na označenie tvaru povrchu. Obrysové grafy môžu mať medzi vrstevnicami farebnú výplň a môžu mať pruhy štítkov a anotácie.

    súradnicové adresovanie Spôsob indexovania prvkov poľa zadaním hodnôt súradníc namiesto bežných celočíselných indexov poľa. Adresovanie súradníc sa vykonáva pomocou súradnicových premenných.

    koordinovať predplatné Indexy súradníc používajú premenné súradníc priradené k premennej na určenie, ktoré indexy sa používajú pri výbere. Pri zadávaní dolného indexu súradníc zátvorky „<“ a „>“ označujú počiatočné a koncové hodnoty súradnicovej premennej, ktoré sa použijú na výber indexov.

    súradnicová premenná Ďalšie slovo pre súradnicovú premennú.

    súradnicová premenná NCL: Hodnota priradená k pomenovanej dimenzii premennej alebo súborovej premennej, ktorá obsahuje informácie o číselných súradniciach pre každý index dimenzie. Súradnicové premenné musia mať jednotlivo dimenzované hodnoty. Výstrahy sa zobrazujú, ak pole priradených hodnôt monotónne nerastie alebo neklesá.

    ctrans Tlmočník NCGM distribuovaný s NCL.

    krivočiare mriežka Zakrivená mriežka je taká, ku ktorej nemôže byť jedinečný prístup pomocou dvojice jednorozmerných súradnicových polí. Tieto mriežky vyžadujú pár dvojrozmerných polí na opis umiestnenia bodov mriežky.

    dátové triedy Ktorákoľvek z tried, ktoré sa používajú na poskytnutie vstupných údajov používateľa ľubovoľnému z objektov, ktoré tieto údaje používajú. Tieto triedy sú Trieda CoordArrays, Trieda CoordArrTablea ScalarField trieda.

    konverzia dát Proces prevodu údajov uložených v jednom formáte do iného formátu, ako je napríklad konverzia údajov uložených ako celé čísla na údaje uložené ako čísla s pohyblivou rádovou čiarkou. Niektoré objekty, ako napríklad ScalarField, vykonávajú automatické prevody údajov.

    priestor súradníc údajov Priestor súradníc, ktorý je vhodný na zadávanie údajov. Transformácie je možné vykonávať medzi priestorom súradníc údajov a NDC (pozri Normalizované súradnice zariadenia).

    dátovo špecifický zdroj Prostriedok konkrétnej triedy, ako je napríklad trieda XyPlot, ktorý je možné použiť na úpravu atribútov údajov dodávaných prostredníctvom DataSpec objekt. Prostriedky špecifické pre údaje je možné použiť na ovládanie atribútov, ako sú farby kriviek, čiarkové vzory, veľkosti značiek, farby značiek a podobne.

    transformácia dát Proces, ktorý transformuje údaje z jedného súradnicového priestoru do druhého, ako je napríklad transformácia údajov v logaritmickom priestore na údaje v lineárnom priestore.

    Dátový typ Dátový typ je reprezentácia údajov, ktorá definuje veľkosť a platný rozsah pre číselné údaje alebo poskytuje odkaz na súbor alebo grafický objekt HLU.

    rozhodovací príkaz Jazykový konštrukt, ktorý umožňuje podmienené spustenie programu na základe pravdy alebo nepravdy výrazu. Základné rozhodnutie v NCL je, ak.

    degenerovaný rozmer O poli sa hovorí, že má degenerované rozmery, ak sa niektorá z jeho veľkostí rozmerov rovná 1. Ak máte napríklad trojrozmerné pole s rozmermi 1 000 x 1 x 60, stredný rozmer sa nazýva degenerovaný rozmer. Tieto rozmery sa niekedy označujú ako singleton rozmery.

    DOD Distribuované údaje o oceáne. Teraz sa označuje ako OPeNDAP.

    kresliaca funkcia Konkrétne buď NhlDraw funkcia rozhraní C alebo Fortran alebo kresliaca funkcia NCL, ktorá sa vyvolá na vykreslenie a Zobraziť objekt.

    Zapuzdrený PostScript Encapsulated PostScript (EPS) je podmnožinou bežného PostScriptu. Obmedzenia uložené na súboroch EPS slúžia na to, aby bol vhodný formát pre import do aplikácií, ktoré importujú PostScript.

    Encapsulated PostScript Interchange Format Súbory EPSI (Encapsulated PostScript Interchange Format) sú zapuzdrené súbory PostScript, ktoré majú „bitovú mapu náhľadu“, ktorá predstavuje obrázok PostScript obsiahnutý v súbore. Bitmapu (a je to bitmapa, nie farebná mapa) môže importujúca aplikácia použiť na rýchle zobrazenie obrázku importovaného súboru.

    endian [Poznámka: táto definícia bola prevzatá priamo z Wikipédie]
    Endianita sa všeobecne vzťahuje na metódy sekvenovania používané v jednorozmernom systéme (ako je zápis alebo pamäť počítača). Dva hlavné typy endianity sú známe ako big-endian a small-endian. Systémy, ktoré vykazujú aspekty oboch konvencií, sa často opisujú ako stredné endiány. Pokiaľ ide konkrétne o bajty vo výpočtovej technike, endianita sa označuje aj ako poradie bajtov.

    enumerický Vo verzii NCL 5.2.0 boli pridané nové dátové typy: int64 (aka dlhý dlhý), uint64 (dlhý bez znamienka), ulong (bez dlhého znamienka), uint (bez dlhého bez znamienka) a ushort (bez znamienka). Tieto dátové typy sú spoločne známe ako enumerický typy. Sú súčasťou superčíselného typu tzv snumerický, ktorý zahŕňa oboje číselné a enumerický.

    Ďalšie informácie nájdete v časti Prehľad typov údajov NCL v Referenčnom manuáli.

    chybová trieda Trieda, ktorá sa používa na konfiguráciu modulu hlásenia chýb knižnice HLU. Pre každú aplikáciu existuje presne jedna chybový objekt vytvorené a automaticky sa vytvorí za vás. Trieda chýb definuje niekoľko zdrojov na kontrolu hlásenia chýb.

    výraz NCL: Akákoľvek sekvencia operátorov a operandov NCL, ktorá vedie k výpočtu hodnoty. Konkrétne, každá doslovná hodnota je výraz a každá premenná je výraz. Polia sú tiež výrazmi a funkciami. Operátory aplikované na výrazy sú výrazy.

    externá anotácia Anotácia pozostávajúca z ľubovoľného používateľsky vytvoreného zobraziteľného objektu pridaného k objektu vykresľovania. Užívateľ ovláda umiestnenie a veľkosť vzhľadom na základný diagram manipuláciou so zdrojmi, ktoré sú pre užívateľa prístupné AnnoManager objekt.

    prípona názvu súboru Prípona pripojená k názvu súboru na označenie jeho typu. NCL rozpoznáva nasledujúce podporované prípony: „.nc“ pre netCDF, „.hdf“ pre HDF, „.h5“ pre HDF5, „.he“ „.he2“ pre HDF-EOS, „.he5“ pre HDF-EOS5, „.grb“ „.grib“ „.grb2“ „.grib2“ pre GRIB, „.shp“ pre súbor tvarov a „.ccm“ pre pásku histórie CCM. Rozpozná sa aj zastaraná prípona „.cdf“ pre súbor netCDF.

    premenná súboru NCL: Premenná vytvorená NCL pridať súbor funkcia, ktorá obsahuje odkaz na súbor.

    hodnota výplne NCL: To isté ako chýbajúca hodnota.

    pevná mriežka Pevná mriežka je typ priamočiarej mriežky, v ktorej je ku každému bodu mriežky jedinečný prístup pomocou jednorozmerných, monotónne rastúcich alebo klesajúcich polí (t. J. Súradnice sú ortogonálne). V karteziánskych súradniciach sa môžu vzťahovať na súradnice „x“ a „y“, zatiaľ čo na zemeguli to sú polia zemepisnej dĺžky a šírky. Rozstup mriežky sa môže líšiť v súradniciach zemepisnej šírky (y) a zemepisnej dĺžky (x), ale je konštantný.

    Špeciálny prípad, keď sú rozstupy mriežky v smere zemepisnej šírky/dĺžky rovnaké, sa nazýva „rovnomerne rozmiestnená“ mriežka. Body pólov môžu, ale nemusia byť prítomné. Niektoré príklady zahŕňajú: mriežky 1x1, 2x5 a 2,5x2,5 stupňa.

    pevná ofsetová mriežka Pevne odsadená mriežka je analogická pevnej mriežke, ale týka sa špeciálneho prípadu, keď sú mriežky zemepisnej šírky a dĺžky odsadené pre tradičný greenwichský poludník alebo póly.

    fontcap Súbor, ktorý obsahuje podrobné informácie používané na vykreslenie znakov. Fontcaps má ľudsky čitateľnú formu ASCII a binárnu formu, ktorá je čitateľná pomocou ctrans.

    farba popredia Farba priradená k indexu farieb 1. Toto sa používa ako predvolená farba pri kreslení zobraziteľných objektov.

    Blok rozhrania Fortran 90 Sekvencia príkazov Fortran 90 (uzavretých špeciálnymi oddeľovacími príkazmi) použitá na opis rozhrania procedúry. Príkazy v bloku rozhrania obsahujú deklaráciu postupu a vyhlásenia falošných argumentov a žiadne spustiteľné príkazy.

    funkcie HLU: Každý člen funkcií NCL alebo API HLU.
    NCL: Identifikátor so zoznamom parametrov oddelený čiarkami a uzavretý v zátvorkách. Funkcie pri volaní vracajú hodnoty. Funkcia je definovaná zdrojom NCL na rozdiel od vnútornej funkcie NCL.

    GIF Formát súboru používaný na ukladanie a online získavanie bitmapových grafických údajov. Skratka GIF znamená „Graphical Interchange Format“, ktorú vytvorila spoločnosť CompuServe Corporation v roku 1987.

    graf Súbor, ktorý obsahuje podrobné informácie používané na definovanie možností konkrétneho vykresľovacieho zariadenia. Grafické karty majú ľudsky čitateľnú formu ASCII alebo binárnu formu, ktorá je čitateľná pomocou ctrans.

    grafický objekt NCL: Hodnota NCL typovej grafiky. Grafický objekt je identifikátor objektu HLU.

    Grafické užívateľské rozhranie Neprogramové, grafické rozhranie k funkčnosti NCAR Graphics. Takéto rozhranie sa niekedy označuje ako rozhranie „ukáž a klikni“, pretože tým sa interakcia dosiahne.

    GRIB GRIB (GRIdded Binary) je dátový formát používaný na ukladanie historických a predpovedaných údajov o počasí. Formát je štandardizovaný Svetovou meteorologickou organizáciou (WMO). Existujú dve verzie: GRIB1 a GRIB2. NCL podporuje obe verzie.

    GSUN Skratka pre „Začíname používať NCL“.

    Skripty GSUN NCL skripty, ktoré poskytujú "jednoduché" rozhranie pre grafické schopnosti NCL. Niektoré príklady sú gsn_xy a gsn_csm_contour_map.

    HDF4 HDF4 (tiež známy ako HDF) je knižničný a viacobjektový súborový formát na ukladanie a správu údajov medzi počítačmi. Existujú dve verzie technológií HDF, ktoré sú úplne odlišné: HDF4 a HDF5. HDF4 je prvý formát HDF.

    HDF5 HDF5 (Hierarchical Data Format) je dátový model, knižnica a súborový formát na ukladanie a správu údajov. Podporuje neobmedzené množstvo dátových typov a je navrhnutý pre flexibilné a efektívne I/O a pre veľké objemy a komplexné údaje.

    HDF-EOS HDF-EOS (Hierarchical Data Format-Earth Observing System) je samopopisujúci formát súboru na prenos rôznych typov údajov medzi rôznymi strojmi na základe HDF. HDF-EOS je štandardný formát na ukladanie údajov zhromaždených zo satelitov EOS: Terra, Aqua a Aura. Boli vyvinuté dve verzie knižníc HDF-EOS: HDF-EOS2 na základe HDF4 a HDF-EOS5 na základe HDF5.

    Pomôcky na vysokej úrovni Objekty, ako sú objekty XyPlot, objekty Contour, objekty TextItem atď., Ktoré je možné vytvárať a manipulovať pomocou sady funkcií knižnice, ktoré je možné vyvolať buď z programu C, z programu Fortran, z príkazového jazyka NCAR alebo z grafického rozhrania. Pomôcky na vysokej úrovni sa tiež označujú ako HLU a je potrebné ich odlišovať od pomôcok na nízkej úrovni alebo LLU.

    Reťazec zdrojov HLU Reťazec znakov identifikujúci konkrétny zdroj triedy. Toto sú zdroje uvedené v popisoch tried.

    HSV Skratka pre odtieň/sýtosť/hodnotu. Systém aditívnych farieb založený na atribútoch farby (odtieň), percentuálneho podielu bielej (sýtosť) a hodnoty (jas alebo intenzita).

    okamžitý režim Režim používaný určitými funkciami API, ktorý vytvára okamžité kreslenie bez vyvolania funkcie kreslenia.

    inštancia Keď sú všetkým zdrojom definovaným v triede priradené konkrétne hodnoty, výsledkom je inštancia tejto triedy. Akákoľvek inštancia akejkoľvek triedy sa nazýva objekt. Pred vytvorením objektu existujú predvolené hodnoty pre všetky zdroje. Používatelia môžu prepísať všetky predvolené hodnoty.

    hierarchia inštancií Rovnaké ako podriadená/rodičovská hierarchia.

    dedičnosť O triede sa hovorí, že dedí zdroje alebo podporné funkcie zo svojich nadtried, pretože tieto funkcie a zdroje sú dostupné podtriede. Pozri nadtriedu, a zložená trieda.

    tlmočník Program, ktorý naraz transformuje príkazy do strojového kódu. Spustiteľný súbor ncl je tlmočníkom jazyka NCL.

    vnútorná anotácia Anotácia je k dispozícii ako člen kompozitnej triedy PlotManager trieda. Vnútorné anotácie sú k dispozícii pre všetky triedy objektov grafu a zahŕňajú TickMark, Názov, LabelBara Legenda anotácie. PlotManager spravuje tieto anotácie interne.

    vnútorná funkcia NCL: Identifikátor so zoznamom parametrov, pričom parametre sú oddelené čiarkami a v zátvorkách. Vnútorné funkcie pri volaní vracajú hodnoty. Vnútorná funkcia nie je definovaná zdrojom NCL, je to rutina C alebo Fortran, ktorá bola pridaná do sady funkcií NCL. Vnútorné funkcie často vykonávajú operácie, ktoré zdroj NCL nepodporuje.

    nepravidelný obdĺžnikový súradnicový priestor Dvojrozmerná obdĺžniková mriežka, ktorá má nerovnaké rozstupy pozdĺž osí X a/alebo Y.

    ISO Medzinárodná organizácia pre normalizáciu, ktorá vydáva medzinárodné normy. (pozri ANSI).

    vnútorný postup NCL: Identifikátor so zoznamom parametrov, pričom parametre sú oddelené čiarkami v zátvorkách. Vnútorný postup nie je definovaný zdrojom NCL, je to rutina C alebo Fortran, ktorá bola pridaná do sady procedúr NCL. Vnútorné procedúry často vykonávajú operácie, ktoré zdroj NCL nepodporuje.

    lenivé hodnotenie NCL: Proces, pri ktorom sa vzťahovým výrazom priradí hodnota hneď, ako je to možné, bez toho, aby sa nevyhnutne hodnotili všetky zložky vo výraze. Napríklad výraz (1 .lt. 3). Alebo. (2 .lt. 1) je možné priradiť hodnotu True bezprostredne po vyhodnotení (1 .lt. 3) bez toho, aby bolo potrebné hodnotiť (2 .lt. 1).

    legenda Špecializovaná anotácia, ktorá formátuje sériu riadkov alebo značiek rôznych štýlov spolu s priľahlými vysvetlivkami. Legendy sú navrhnuté tak, aby slúžili ako „kľúče“ pre pridružený dej.

    doslovné pole NCL: Súbor hodnôt špecifikovaných pomocou doslovných hodnôt, pričom tieto hodnoty sú oddelené čiarkami a uzavreté znakom „( /“ a „ /)“.

    doslovná hodnota NCL: Jedna skalárna hodnota vyjadrená skutočnou hodnotou reťazca (t. J. Neodkazuje na ňu premenná). Napríklad 1, 1,414 a „reťazec“ sú doslovné hodnoty.

    miestnych zdrojov, Prostriedky definované v konkrétnej triede, ktoré nie sú zdedené z inej triedy.

    logický operátor Operátor, ktorý vracia skutočnú hodnotu alebo falošnú hodnotu v závislosti od pravdivosti alebo nepravdivosti svojich operandov. Logickými operátormi v NCL sú:. A.,. Alebo.,. Xor.,. Nie. .

    príkaz slučky Jazyková konštrukcia, ktorá umožňuje opakovanie kódu s prírastkovými hodnotami nastavenými pre premennú alebo premenné. Opakujúce sa príkazy v NCL sú: do and do while.

    Pomôcky na nízkej úrovni Tradičná grafika NCAR, ako existovala pred vyvinutím HLU alebo NCL. Je to balík asi 500 grafických rutín. Položky používateľov majú rozhranie C aj Fortran.

    členská trieda Jedna z komponentov triedy kompozitnej triedy.

    metadáta NCL: Informácie používané na opis údajov, ako sú názvy dimenzií, atribúty premenných, platné rozsahy atď.

    metasúbor Súbor obsahujúci kódované grafické prvky. Metasúbory sa používajú na ukladanie a prenos grafických obrazov. V kontexte NCL a NCAR Graphics je „quotmetafile“ spravidla synonymom NCGM.

    chýbajúca hodnota NCL: Špeciálna hodnota pre prvok premennej alebo poľa, ktorá naznačuje, že pre toto množstvo neboli určené žiadne právne údaje. Informácie o tom, ako sa zaobchádza s týmito chýbajúcimi hodnotami, nájdete v časti o chýbajúcich údajoch pri hodnotení výrazov v dokumentácii NCL Language.

    monotónny Sekvencia číselných hodnôt je monotónna (alebo monotónna), ak buď: každý prvok v sekvencii je väčší ako (alebo rovnaký) ako jeho predchodca, alebo je každý prvok v sekvencii menší (alebo rovnaký) ako jeho predchodca. Sekvencia sa monotónne zvyšuje, ak je každý prvok v sekvencii väčší ako jej predchodca, sekvencia sa monotónne znižuje, ak je každý prvok v sekvencii menší ako jej predchodca. Sekvencia je monotónne neklesajúca, ak je každý prvok v sekvencii väčší alebo rovnaký ako jej predchodca. Sekvencia sa monotónne nezvyšuje, ak je každý prvok v sekvencii menší alebo rovný jej predchodcovi.

    pomenovaná dimenzia NCL: Dimenzia premennej alebo súborovej premennej, ktorej bol priradený názov pomocou „!“ operátor.

    NaN NaN znamená „nie je číslo“. Obvykle predstavuje nedefinované alebo nereprezentovateľné číselné hodnoty, napríklad z operácie delenia nulou. NCL nedokáže spracovať hodnoty NaN. Predtým, ako budete môcť vykonávať akékoľvek výpočty alebo vykresľovanie, musia byť prevedené na chýbajúce hodnoty. Pozrite si funkcie isnan_ieee a nahradiť_ieeenan.

    natívna mriežka Natívna mriežka je údaj o lat/lon mriežke, ktorý sa premieta do konkrétnej projekcie mapy, napríklad do Lambertovej konformnej mapy. Ak máte údaje v natívnej mriežke a poznáte presné parametre projekcie mapy, potom NCL dokáže údaje vykresliť bez toho, aby potrebovala pole zemepisnej šírky/dĺžky.

    Príkazový jazyk NCAR Jazyk napísaný za účelom interaktívnej manipulácie a zobrazovania údajov. NCL má rozhranie príkazového riadka a bude akceptovať vstupné súbory netCDF-3, netCDF-4, HDF4, HDF-EOS, HDF5, HDF-EOS5, GRIB1, GRIB2, shapefile alebo ASCII. NCL tiež poskytuje jednoduché rozhranie pre HLU.

    Zoznam zdrojov NCL NCL: Zoznam zdrojov NCL je zoznam reťazcov zdrojov HLU, za ktorými nasleduje „:“ a za ním platný výraz NCL.

    NDC Normalizované súradnice zariadenia. Súradnicový systém, ktorý popisuje polohy na zariadení virtuálneho vykresľovania. Dolný ľavý roh zodpovedá (0,0) a pravý horný roh (1,1). Priestor NDC bude mapovaný na najväčší štvorec, ktorý sa zmestí do skutočného vykresľovacieho zariadenia. PostScriptový výstup je v predvolenom nastavení na stred stránky, ale existujú možnosti umiestnenia výstupu PostScript kdekoľvek na stránke. Pozrite si Pracovná stanica PS pre podrobnosti.

    ncl Vzťahuje sa na tlmočníka, ktorý interpretuje príkazy NCL.

    netCDF NetCDF (Network Common Data Form) je rozhranie pre prístup k vedeckým údajom a knižnica, ktorá poskytuje implementáciu rozhrania. Existujú rôzne druhy súborov NetCDF: klasický, 64-bitový offset, netCDF-4 classic a netCDF-4. Ďalšie informácie nájdete v častých otázkach k serveru NetCDF.

    netCDF 64-bitový offset V roku 2004 bol pridaný variant 64-bitového ofsetového formátu. Takmer identický s klasickým formátom netCDF umožňuje užívateľom vytvárať a pristupovať k oveľa väčším množinám údajov, ako bolo možné v pôvodnom formáte. (Na zápis alebo čítanie 64-bitových ofsetových súborov netCDF nie je potrebná 64-bitová platforma.)

    klasická netCDF Klasický formát bol jediným formátom pre údaje netCDF vytvorené v rokoch 1989 až 2004. Od netCDF verzie 4.2.X, je to stále predvolený formát pre nové dátové súbory netCDF a forma, v ktorej je uložená väčšina údajov netCDF. Niektorí používatelia to chápu ako „netCDF-3“.

    netCDF-4 classic V rovnakom čase, ako bol zavedený formát netCDF-4, bol pridaný formát „netCDF-4 classic“ pre používateľov, ktorí potrebovali výkonnostné výhody nového formátu (napríklad kompresiu) bez zložitosti nového programovacieho rozhrania alebo vylepšenia dátový model.

    netCDF-4 V roku 2008 bol pridaný formát netCDF-4 na podporu kompresie podľa premennej, viacerých neobmedzených rozmerov, komplexnejších dátových typov a lepšieho výkonu, a to navrstvením vylepšeného prístupového rozhrania netCDF na formát HDF5.

    sieťovo transparentný dátový formát Formát na kódovanie údajov, ktorý odstraňuje všetky strojové závislosti, ktoré môžu byť zahrnuté v kódovaní údajov. Typickými príkladmi takýchto dátových formátov sú netCDF a HDF.

    číselné Akýkoľvek typ údajov, ktorý predstavuje číselnú hodnotu. The číselné Dátové typy sú: double, float, int64 (aka long long), uint64 (unsigned long long), long, ulong (unsigned long), integer, uint (unsigned int), short, ushort (unsigned short), and byte.

    Vo verzii NCL 5.2.0 boli pridané nové dátové typy: int64 (aka dlhý dlhý), uint64 (dlhý bez znamienka), ulong (bez dlhého znamienka), uint (bez dlhého bez znamienka) a ushort (bez znamienka). Tieto typy údajov sú spoločne označované ako enumerický typy.

    Aby bola NCL spätne kompatibilná, ponechali sme názov číselné odkazovať na dátové typy double, float, long, integer, short a byte, ale vytvoril nový názov snumerický (superčíselné) na reprezentáciu oboch číselné a enumerický.

    Ďalšie informácie nájdete v časti Prehľad typov údajov NCL v Referenčnom manuáli.

    číselný typ údajov Dátový typ pre číselné veličiny. V NCL sú číselné dátové typy: double, float, int64, uint64, long, ulong, integer, uint, short, ushort a byte.

    nečíselný typ údajov Dátový typ pre nečíselné veličiny. V NCL sú nečíselné dátové typy: reťazec, znak, grafika, súbor a logické.

    OPenDAP OPeNDAP, skratka pre „Open-source Project for a Network Data Access Protocol“, je architektúra a protokol prenosu dát, ktorý široko používajú vedci Zeme a ktorý zjednodušuje všetky aspekty vytvárania sietí vedeckých dát a umožňuje jednoduchý prístup k vzdialeným údajom. Viac informácií nájdete na www.opendap.org.

    prekrytie Transformácia prekrytá na základnom grafe pomocou funkcie pridať prekrytie. Základný diagram nastaví výrez prekrytia tak, aby zodpovedal jeho vlastnému, a transformuje údaje súradníc prekrytia do vlastného súradnicového priestoru. Na výstupe grafu bude viditeľná iba tá časť súradnicového priestoru prekrytia, ktorá pretína priestor súradníc riadiaceho grafu. Ak je prekrytím objekt vykresľovania, vzdá sa svojho základného stavu vykreslenia. Základný diagram, ku ktorému je pridané prekrytie, preberá zodpovednosť za správu členov vykresľovania prekrytia.

    funkcie prekrytia Funkcie používané na pridávanie a odstraňovanie prekrytí do a z objektov vykresľovania. Konkrétne ide o tieto funkcie NhlAddOverlay a NhlRemoveOverlay pre rozhrania C a Fortran.

    prekryvná zápletka Prekrytie vytvorené skôr z objektu zápletky než z jednoduchej transformácie.

    sekvencia prekrytia Poradie transformácií v grafe alebo podzákroku, ktorý obsahuje prekrytia. Základný diagram je vždy na prvom mieste, za ním nasleduje každé prekrytie v poradí, s ktorým je možné manipulovať pomocou funkcií prekrytia. Sekvencia prekrytia určuje základné poradie kresby grafu. Základný diagram sa nakreslí ako prvý a každé nasledujúce prekrytie sa nakreslí nad predchádzajúce transformácie. Anotácie nie sú ovplyvnené sekvenciou prekrytia, ktorú vždy nakreslili po všetkých transformáciách.

    PDF Skratka pre Portable Document Format, formát súboru vytvorený spoločnosťou Adobe Systems, Inc. Používa jazyk popisu tlačiarne PostScript a je veľmi prenosný na rôznych počítačových platformách. Dokumenty PDF sú vytvárané pomocou programu Adobe Acrobat alebo iných programov a je možné ich zobrazovať v programe Adobe Acrobat Reader a ďalších programoch na čítanie PDF.

    1. Objekt pozemku.
    2. Primárna základná zápletka a všetci jej členovia.
    3. Výstup vyplývajúci z nakreslenia primárneho základného diagramu a všetkých jeho prvkov grafu.
    4. Výstup vyplývajúci z kreslenia ľubovoľnej zbierky viditeľných objektov.

    plot_class NCL: Trieda plot_class v NCL je rovnaká ako ukazovateľ triedy HLU použitý v HLU API na určenie, aký typ objektu sa má vytvoriť. Identifikátor NCL plot_class je napísaný rovnako ako ukazovateľ triedy HLU.

    člen sprisahania Viditeľný objekt spravovaný základným pozemkom. Ak je základný pozemok podriadeným základným pozemkom, potom je objekt nepriamo členom grafu celého grafu spravovaného primárnym základným pozemkom. Nakreslenie primárneho základného grafu spôsobí nakreslenie všetkých jeho prvkov grafu. Člen sprisahania je buď prekrytie, alebo anotácia. Aj keď anotáciou môže byť ľubovoľné zobrazenie, prekrytím musí byť pohľad patriaci do triedy Transform. Člen grafu musí patriť k tej istej pracovnej stanici ako jeho základný graf a nemôže byť nakreslený samostatne. Pohľad nemôže ako člen grafu patriť viac ako jednému základnému grafu súčasne.

    pozemkový objekt Objekt Transform vytvorený ako aktívny PlotManager. Vo všeobecnosti, ak ich konkrétna trieda neobmedzuje inak, objekty vykresľovania majú schopnosť spravovať iné prezerateľné objekty ako prvky vykreslenia a byť spravované ako samotné prvky vykresľovania. Objekt vykresľovania, ktorý spravuje členy grafu, sa nazýva základný diagram. Ak je riadiaci objekt grafu sám spravovaný ako prvok grafu, je to podriadený základný diagram. Ak to zvládne sám (tj nie člen sprisahania) je to primárny základný pozemok. Pri vytváraní sú všetky objekty vykresľovania primárnymi základnými grafmi.

    polymarker Pole súradníc určujúcich polohy, do ktorých budú vynesené určité určené symetrické symboly (značky), ako sú kruhy, bodky atď.

    portrétny režim (Definícia prevzatá z Wikipédie) Režim na výšku a na šírku sa týka orientácie textu (a obrázkov) na vytlačenej stránke. (Papier musí mať obdĺžnik, ale v praxi sa štvorcové listy takmer nikdy nepoužívajú.) In portrét v režime je text vytlačený na papier tak, že čítačka otočí dlhú stranu papiera zvisle a krátku stranu vodorovne. V krajina na druhej strane je dlhá strana horizontálna a krátka strana vertikálna (ako väčšina krajinomaľieb).

    PostScript Univerzálny programovací jazyk, ktorý obsahuje bohatú sadu grafických operátorov. PostScript je produkovaný mnohými populárnymi balíkmi na spracovanie textu a grafikou a je možné ho zobrazovať na rôznych tlačiarňach, plotroch a obrazovkách pracovných staníc.

    pozemok primárnej základne Samosprávny pozemok. Základný diagram, ktorý priamo spravuje ľubovoľný počet členov grafu, pozostávajúci z prekrytí a anotácií, ale sám nie je členom grafu. Pri vytváraní sú všetky objekty vykresľovania primárnymi základnými grafmi. Objekt grafu musí byť primárny základný diagram, aby ho užívateľ mohol nakresliť alebo zmeniť svoju pracovnú stanicu.

    postup NCL: Identifikátor so zoznamom parametrov, pričom tieto parametre sú oddelené čiarkami a uzavreté v zátvorkách. Procedúry pri volaní nevracajú hodnoty.

    relačný operátor Operátor, ktorý vracia skutočnú hodnotu alebo falošnú hodnotu v závislosti od vzťahu medzi svojimi operandmi. Relačné operátory v NCL sú: .le., .Lt., .Ge., .Gt., .Ne.,. Ekv. .

    zdroj Premenná definovaná ako súčasť definície triedy. Hodnoty zdrojov v predmety je možné nastaviť pomocou a NhlCreate funkciu alebo a Hodnoty NhlSet funkciu. Hodnoty zdrojov je možné získať pomocou a NhlGetValues funkciu.

    zdrojový súbor Súbor, ktorý možno použiť na nastavenie hodnôt zdrojov. Existujú štyri rôzne súbory zdrojov. Pozrite si súbor systémových zdrojov a súbor používateľských zdrojov.

    presmerovanie zdrojov Technika, ktorá sprístupňuje zdroje členských tried zloženej triede.

    RGB Stojí za červený, zelený, modrý farebný priestor kde farby sú uvedené ako triplety čísel s pohyblivou rádovou čiarkou od 0,0 do 1,0 vrátane. Triplet udáva percentuálne intenzity pre červenú, zelenú a modrú zložku farby. Triplet by znamenal napríklad úplné percento červenej a žiadne zelené alebo modré percento.

    RGBA Stojí za červený, zelený, modrý, alfa farebný priestor kde farby sú špecifikované ako štvorčatá s číslami s pohyblivou rádovou čiarkou medzi 0,0 a 1,0 vrátane. Prvé tri hodnoty štvorice udávajú percentuálne intenzity pre červenú, zelenú a modrú zložku farby. Štvrtá hodnota udáva percento nepriehľadnosti tejto farby. Hodnota opacity 1,0 znamená, že farba je úplne nepriehľadná a hodnota 0,0 znamená, že je úplne priehľadná. Štvornásobok <1, .0., 0., 0.5> gt indikuje červenú farbu pri polovičnej opacite. Použitie farieb RGBA bolo predstavené v NCL V6.1.0.

    skalárny_logický_výraz NCL: Hodnota jedného prvku logického dátového typu bez chýbajúcich hodnôt.

    rozsah NCL: Rozsah alebo oblasť v programe, v ktorej má identifikátor zmysel.

    scenár Súbor obsahujúci sekvenciu programových príkazov, ktoré je možné odoslať tlmočníkovi na vykonanie.

    samopopisujúci dátový formát Formát na kódovanie údajov, ktorý môže obsahovať informácie, ktoré opisujú kódované údaje. Typickými príkladmi takýchto dátových formátov sú netCDF, HDF a HDF5.

    tvar Počet dimenzií poľa. Príkaz a = nový (( / 2, 3, 5 /), float) by vytvoril pole a tvaru 3 (t.j. a má tri rozmery).

    shapefile Tvarový súbor je populárny formát geopriestorových údajov pre softvér geografických informačných systémov. Je vyvinutý a regulovaný spoločnosťou Esri ako (väčšinou) otvorená špecifikácia pre interoperabilitu údajov medzi ESRI a inými softvérovými produktmi. „Tvarový súbor“ bežne označuje zbierku súborov s príponou „.shp“, „.shx“, „.prj“, „.dbf“ a ďalšie rozšírenia o spoločný názov predpony (napr. „Jazerá.*“). NCL

    jednoduché prekrytie Prekrytie vytvorené jednoduchou transformáciou.

    jednoduchá transformácia Transformačný objekt vytvorený bez aktívnej položky PlotManager. Na rozdiel od objektu sprisahania, jednoduchá transformácia nemôže spravovať žiadne členy grafu, ani ako anotácie, ani ako prekrytia. Jediné prvky, ktoré sa objavia pri nakreslení jednoduchej transformácie, sú preto prvky implementované v samotnom objekte. Pokiaľ to však nie je obmedzené jeho konkrétnou triedou, jednoduchá transformácia sa môže sama stať anotáciou alebo prekrytím základného diagramu. Pretože plotový objekt má všetky možnosti jednoduchej transformácie a žiadne z obmedzení, hlavným dôvodom pre vytvorenie jednoduchej transformácie by bola úspora systémových zdrojov, keď schopnosti PlotManager nie sú požadované.

    singletonova dimenzia Vidieť degenerovaný rozmer.

    veľkosť Počet prvkov v dimenziách poľa. Príkaz a = nový (( / 2, 3, 5 /), float) by vytvoril pole a, ktoré má prvý rozmer veľkosti 2, druhý rozmer veľkosti 3 a tretí rozmer veľkosti 5.

    snumerický V NCL verzii 5.2.0 tzv nový dátový typ snumerický bol pridaný, čo je skratka pre superčíslice. Tento typ zahŕňa oboje číselné a enumerický typy. snumerický typy zahŕňajú double, float, int64 (aka long long), uint64 (unsigned long long), long, ulong (unsigned long), integer, uint (unsigned int), short, ushort (unsigned short), and byte.

    Ďalšie informácie nájdete v časti Prehľad typov údajov NCL v Referenčnom manuáli.

    vyhlásenie Riadok kódu, ktorý nekomentuje (alebo riadok kódu pred akýmkoľvek komentovaním). Riadok kódu NCL obsahuje všetky pokračovania vyplývajúce z použitia symbolu "".

    bodka Na pokrytie oblasti malými bodkami.

    zefektívniť Cesta, ktorou by sa idealizovaná častica uberala, ak by bola zavedená do prúdu vetra alebo tekutiny. Napríklad (ako aproximácia k ideálu) by cesta, ktorou by sa vo vetre uberala smietka prachu.

    Zefektívnite zápletku Graf predstavujúci vektorové pole pomocou zjednodušených línií na základe 2-rozmerných údajov. Môže tiež obsahovať značky začiarknutia a názvy.

    kráčať Indikátor prírastku v špecifikátore dolného indexu. Použitie m: n: i ako dolného indexu znamená vziať jednotlivé hodnoty dolného indexu začínajúce sa m a končiace n v krokoch i. Krok musí byť vždy celé číslo a mal by byť chápaný ako indikátor preskočenia, nie ako aditívna prírastková hodnota, pretože súpisové súradnice nemusia byť vždy celé čísla. Krok 2 znamená vziať každú druhú hodnotu po prvej, krok 3 znamená vziať každú tretiu hodnotu atď.

    vyhlásenie NCL: Jednojazyčný konštrukt v rámci NCL, ktorý vykonáva konkrétnu úlohu.

    zoznam výpisov NCL: Sekvencia príkazov oddelených znakom vozíka vracia ( n).

    štruktúrovaná mriežka Štruktúrované mriežky sú pravým opakom neštruktúrovaných sietí. Štruktúrovaná mriežka je pomenovaná podľa povahy štruktúry, ktorá je implicitne definovaná usporiadaním údajov. Štruktúrovaná mriežka má základnú obdĺžnikovú maticovú štruktúru, ktorá uľahčuje ukladanie a používanie, pretože na prístup k jednotlivým dátovým bodom je možné použiť celočíselné posuny (spravidla pomenované i, j a k). Dátové body sú usporiadané do obdĺžnikových alebo kubických štruktúr jednoduchým prepojením so susednými bunkami i, j a k. Tri typy štruktúrovaných mriežok zahrnujú kartézske, priamočiare a krivočiare mriežky.

    podtrieda Trieda B je podtriedou A, ak má B všetky zdroje a podporné funkcie A (B môže mať aj ďalšie zdroje a podporné funkcie). Ak B je trieda odvodená od A, potom sa hovorí o B. dediť jeho zdroje a podporné funkcie od A. Ak B je odvodené od A, potom sa tiež hovorí, že B je podtriedou A.

    podradená základná zápletka Člen sprisahania, ktorý je anotačným diagramom. Podriadený základný plot nastavuje výrez členov grafu, ktoré ovláda, zatiaľ čo jeho vlastný výrez je nastavený základným pozemkom, ktorý ho ovláda. Na rozdiel od primárneho základného grafu používateľ nemôže priamo kresliť ani meniť pracovnú stanicu podriadeného základného grafu. Podriadený základný obrázok a členovia grafu, ktoré spravuje, sú spoločne známe ako podkres.

    podkres Časť sprisahania, ktorá je spravovaná podriadeným základným výkresom.

    nadtrieda Trieda A je nadtrieda triedy B, ak je A na rovnakej vetve stromu hierarchie tried a A je na tejto vetve vyššie.

    zdroj nadtriedy Prostriedok, ktorý jedna trieda dedí z nadtriedy.

    podporovaný dátový formát Akýkoľvek z formátov, ktoré môže čítať NCL pridať súbor funkciu. Podporované formáty sú: netCDF, HDF, HDF-EOS, HDF5, HDF-EOS5, GRIB (1 a 2), shapefile a CCM History Tape. Aby ste ich mohli používať s NCL, nemusíte poznať detaily týchto formátov.

    podporná funkcia Funkcia definovaná ako súčasť definície triedy.

    súbor systémových zdrojov Existujú štyri súbory, kde je možné nastaviť prostriedky - dva z týchto súborov sú súbormi systémových zdrojov a ďalšie dva sú súbormi používateľských zdrojov. Názov jedného zo súborov systémových prostriedkov je určený nastavením premennej prostredia NCARG_SYSRESFILE, druhý súbor systémových prostriedkov je špecifikovaný spôsobom špecifickým pre aplikáciu. Pozrite si súbor zdrojov aplikácie.

    "). Kódy textových funkcií poskytujú možnosť výberu rôznych písem, vytvárania horných a dolných indexov, úplnej kontroly nad vzájomným umiestnením znakov a v neposlednom rade" približovania "znakov na šírku alebo na výšku, príp. obaja.

    zaškrtávacie značky Značky pozdĺž osi grafu, ktoré sú kolmé na os a slúžia na rozdelenie osi (alebo častí osi) na rovnaké alebo logaritmeticky rozmiestnené časti.

    Transformačná trieda The Transformovať class je podtrieda triedy View, ktorá podporuje transformácie z priestoru súradníc údajov do priestoru NDC obsadeného výrezom inštancie triedy Transform. Transformačné podtriedy môžu zahŕňať PlotManager triedy ako zloženého člena triedy. Trieda Transform poskytuje zdroj na aktiváciu alebo deaktiváciu PlotManager pri vytváraní inštancie Transform. Trieda Transform navyše poskytuje podporné funkcie na prevod medzi priestorom súradníc údajov a priestorom NDC, na kreslenie grafických primitívov okamžitého režimu a na pridávanie a odstraňovanie prekrytí a anotácií z objektov vykresľovania.

    Transformovaný objekt Objekt, ktorý je inštanciou triedy Transform. Transformované objekty sa stanú vykreslenými objektmi, keď sú vytvorené s aktívnymi PlotManager inštancia. Transformačný objekt vytvorený bez aktívneho PlotManagera sa nazýva jednoduchá transformácia.

    neštruktúrovaná sieťovina Neštruktúrované siete sú pravým opakom štruktúrovaných mriežok, v ktorých musí byť prepojenie medzi bodmi výslovne definované pre každú množinu bodov. To ich robí podstatne ťažšími a komplexnejšími a pekné vzťahy medzi susednými bunkami alebo hranami už nie sú automatické a musia sa vytvárať ručne. Sú však oveľa flexibilnejšie v schopnosti definovať zložité tvary, pretože na ich usporiadanie nie sú žiadne obmedzenia.

    Neštruktúrované siete sú typicky definované ako body a bunky. Bunky sú zbierky bodov na definovanie základných 2D alebo 3D primitívov, ako sú trojuholníky, kocky a štvorsteny.

    súbor používateľských zdrojov Existujú štyri súbory, kde je možné nastaviť zdroje - dva z týchto súborov sú súbory používateľských zdrojov a ďalšie dva sú súbory systémových zdrojov. Názov jedného zo súborov používateľských zdrojov je určený nastavením premennej prostredia NCARG_USRRESFILE, druhý súbor používateľských zdrojov je špecifikovaný spôsobom špecifickým pre aplikáciu. Pozrite si súbor zdrojov aplikácie.

    Vektorový graf Graf predstavujúci vektorové pole nakreslením glyfov, ktoré predstavujú veľkosť a smer v bodoch mriežky na základe 2-rozmerných údajov. Môže tiež obsahovať značky začiarknutia, názvy alebo štítok. K dispozícii sú tri štýly glyfov: základná šípka čiarami, vyplnená šípka s okrajom opcie a štandardný veterný protihrot.

    viditeľný objekt Objekt, ktorý je inštanciou triedy View.

    Zobraziť triedu Objekt je možné nakresliť, iba ak je to inštancia triedy View. Trieda View poskytuje prostriedky na dimenzovanie a umiestnenie objektov na výstupnom zariadení (pracovnej stanici). Trieda View tiež poskytuje podpornú funkciu na určenie ohraničujúceho rámčeka daného objektu v triede. Objekt triedy View musí mať príponu Pracovná stanica triedny rodič.

    výrez V prípade objektov Zobraziť je zobrazená oblasť obdĺžniková podoblasť priestoru NDC, ktorá určuje, kam bude pri zobrazení nakreslený objekt Zobraziť. Presný význam zobrazenej oblasti závisí od objektu Zobraziť. Napríklad pre objekty XyPlot zobrazená oblasť určuje, kde bude umiestnená mriežka obsahujúca krivky a označenie (ak existuje) sa nakreslí mimo zobrazenú oblasť. Na druhej strane, pre objekty TextItem bude výrezom obdĺžnik obklopujúci textový reťazec.

    vizualizačný blok NCL: Skupina zdrojov NCL uvedených v príkaze na vytvorenie, nastavenie hodnôt alebo získanie hodnôt NCL. Vizualizačné bloky sa používajú na vytváranie, úpravu alebo zisťovanie hodnôt zdrojov objektov.

    trieda pracovnej stanice Trieda, ktorá poskytuje rozhrania pre konkrétne výstupné zariadenia.

    blok rozhrania wrapit Sekvencia príkazov Fortran 77, ktoré špecifikujú postup a jeho argumenty, podobné prototypom funkcií C a blokom rozhrania Fortran 90. Bloky rozhrania Wrapit používa wrapit77, program na generovanie obalov.

    funkcia obalu Funkcia C, ktorá poskytuje rozhranie medzi NCL a existujúcim podprogramom alebo funkciou Fortran alebo C. Obálka zachytí funkciu alebo postup NCL, vykoná príslušné kontroly argumentov a prevedie ich a potom zavolá existujúci kód.


    Webová integrácia a interoperabilita údajov pre rozsiahly priestorovo-časový súbor údajov o povodí rieky Heihe

    Na vyriešenie chaotického problému s dátovými typmi a vytvorenie jednotného riešenia na spracovanie údajov boli údaje v povodí rieky Heihe najskôr roztriedené do piatich typov, aby sa integrovali a dosiahla jednotná správa údajov a metadát, čím sa predíde strate metadát v údajoch. model rámca eScience. Vzhľadom na mnohé z výziev, ktoré existujú pri vytváraní online platformy pre časovú integráciu a interoperabilitu priestorovo-časových údajov a interoperability eScience, sme použili otvorené dátové rozhrania a štandardy, ako napríklad rozhranie Common DataModel (CDM), spoločné modelovanie vedeckých údajov (tj. NetCDF, GRIB a HDF) a štandardy Open Geospatial Consortium (OGC). Prostredníctvom platformy eScience sme tiež poskytli online nástroje na spracovanie údajov zhromažďovaním bezplatných nástrojov (napr. Nástroj NetCDF, nástroj na kontrolu kvality). Táto platforma eScience umožňuje výskumným pracovníkom plne využívať informácie a výsledky vedeckého výskumu a uľahčuje spoluprácu, najmä medzi komunitou GIS a ostatnými členmi komunity vedy o Zemi, s cieľom vytvoriť online platformu jednotných priestorových údajov z povodia rieky Heihe. prostredníctvom spoločného modelovania vedeckých údajov.

    1. Úvod

    Moderná geoveda často vyžaduje rozsiahle súbory údajov a obrovské množstvo výpočtov na numerickú simuláciu a spracovanie údajov a potreby údajov sa každým dňom zvyšujú [1–4]. V oblasti vedy o Zemi a životnom prostredí je správa údajov stále náročnejšia [5–7]. Objemy geografických údajov boli zozbierané pomocou moderných akvizičných techník, ako sú globálne systémy určovania polohy (GPS), diaľkové snímanie, bezdrôtový senzor a prieskumy [8–12]. Nárast objemu dát viedol k distribuovanejšej archivácii a v dôsledku toho je ťažšie analyzovať údaje na jednom mieste a uložiť ich lokálne [13, 14]. „Big Data“ sa stal všadeprítomným novým pojmom pre výskumníkov. Týka sa to nielen množstva údajov, ale aj aktuálnosti (rýchlosti), rozmanitosti a pravdivosti. Prostredie eScience plne využíva ľudí, údaje a počítačové zdroje. Softvér umožňuje pohodlné dátové aplikácie a šetrí pracovnú silu a zdroje [15]. Okrem výskumníkov má obrovský záujem aj vládny a súkromný priemysel o zhromažďovaní priestorových údajov a využívaní rozsiahlych zdrojov dátových súborov na rôzne aplikačné potreby, najmä webové potreby [16–19]. Prostredie eScience podporuje vyššie uvedené kombinované prostredie a poskytuje online pracovný tok vrátane integrácie, prístupu, analýzy, vizualizácie a kontroly kvality pre rôzne zdroje a formáty údajov [18, 20, 21]. V porovnaní s tradičnými metódami výskumu umožňujú aplikácie eScience výskumným pracovníkom naplno využiť vedecký výskum a uľahčiť medzinárodnú spoluprácu [22, 23]. Chen a kol. navrhol model pracovného toku geoprocesingu eScience na integráciu logických a fyzických procesov do zloženého reťazca procesov na pozorovanie senzorov [24]. Bola navrhnutá prípadová štúdia o elektronických katastroch s cieľom analyzovať výsledky prieskumu uskutočneného vo viacerých európskych katastrálnych agentúrach a odhadnúť výhody infraštruktúry priestorových údajov [25]. Úloha zostaviť vhodný dátový model pre výskum v povodí je skutočná a vyžaduje si lepšiu interoperabilitu údajov, vývoj lepších algoritmov a dobré prípadové štúdie.

    Štúdie v povodí rieky Heihe skúmali počasie, ekológiu, hydrológiu a vodné zdroje chladných a suchých oblastí. S rozvojom technológií diaľkového snímania a bezdrôtových senzorových sietí sa znásobilo množstvo dát, ktoré je potrebné získať, uložiť, spracovať a prenášať [26, 27]. Zhromažďovali a naďalej sa zbierajú údaje o štúdiu povodia rieky Heihe, ktoré sa stali základom pre prognózovanie a rozhodovaciu analýzu [28]. Keďže údaje z povodia rieky Heihe sú v časovom období a formáte rozmanitejšie, komplexnejšie, dynamickejšie, viacrozmernejšie a majú viac metadát ako kedykoľvek predtým, je ťažšie ich analyzovať a efektívne vizualizovať [29, 30]. Preto bolo vytvorenie kontextu eScience uznané za naliehavú potrebu jednotného spravovania údajov a metadát a zjednotenia formátov údajov z rôznych odborov.Kontext eScience poskytuje škálu priestorových údajov prostredníctvom webových služieb s efektívnymi algoritmami spracovania údajov a efektívnymi vizualizačnými prístupmi pre dátové aplikácie prostredníctvom dátového servera THREDDS (Thematic Real-time Environmental Distributed Data Services) (TSD), OGC (Web Coverage Servers) WCS/WMS (Web Map Service), NcML-GML (NetCDF Markup Language-Geography Markup Language) a technológia objektovo orientovaných komponentov [9, 10, 12, 31, 32]. Internetová platforma poskytuje pohodlný spôsob, ako dosiahnuť priestorovo-časovú ťažbu údajov, integráciu, analýzu a distribúciu, a môže pomôcť výskumníkom v plnom využití existujúcich zdrojov údajov. Maximalizácia existujúcich zdrojov môže obmedziť duplikáciu práce a poplatkov za zber a zber údajov, čo posilňuje spoluprácu, najmä medzi komunitou GIS a zvyškom komunity vedcov o Zemi.

    Otázky výskumu, ktoré je potrebné vyriešiť pre online integrovanú správu údajov povodia rieky Heihe, sú tieto. Po prvé, pri vytváraní online platformy na integráciu a interoperabilitu údajov majú údaje poskytnuté rôznymi používateľmi rôzne formáty, bezprecedentne veľkú veľkosť, neočakávané metadáta, vysokú dimenziu a heterogénne zdroje údajov. Tieto údaje zahrnujú údaje diaľkového snímania vo formátoch HDF5, JPGE a TIFF, rastrové údaje, radarové údaje, ktoré sú zhromažďované a spracovávané špeciálnym softvérom, pozorovania klímy vo formátoch GRIB, NetCDF a ASCII, tvarové súbory a súbory s voľným textom. (napr. TXT, word a CSV). Údaje v rôznych formátoch vyžadujú viac rozhraní a algoritmy služieb pre integráciu a interoperabilitu údajov, čo zvyšuje obtiažnosť zdieľania údajov a interoperability. Výpočtové algoritmy údajov sú zamerané na rôzne časové rozsahy a ciele výskumu, napríklad pomocou denných a mesačných priemerov predpovedí krátkodobého počasia a rozsiahlych klimatických zmien. Za druhé, bezproblémová správa je náročná, pretože údaje boli oddelené od metadát. Okrem toho je ťažké sťahovať údaje za určité obdobie z množiny údajov, prenášať údaje alebo zdieľať rôzne polia a softvérové ​​systémy. Metadáta je potrebné efektívne archivovať. Existuje naliehavá potreba navrhnúť užívateľsky prívetivé rozhranie na uľahčenie interoperability, geopočítačov a geovizualizácií. Po tretie, je tiež potrebné zjednotenie heterogenity existujúcich protokolov a štandardov v architektúre orientovanej na služby, napríklad tých, ktoré sa uplatňujú pri vytváraní štandardov GIS. Nakoniec experti z rôznych odborov sú oboznámení s ich špecifickým formátom údajov a softvérom na spracovanie. Pri prevode jedného formátu na druhý alebo pri strate informácií pri prevode formátov údajov sa stretávajú s problémami.

    Na vyriešenie týchto problémov boli priestorové a časové údaje z povodia v kontexte eScience zaradené do piatich kategórií podľa zdroja údajov. Dátový model je kľúčovým faktorom zdieľania údajov. Výber dátového modelu na integráciu časovo-priestorových údajov je veľmi dôležitý pre efektívne a bezproblémové riadenie v bazéne eScience. Model určuje, či dokážeme efektívne popísať stav alebo vývoj geografickej entity a efektívne vyriešiť rôzne problémy súvisiace s časom. Vzhľadom na kompatibilitu údajov je ťažké dosiahnuť jeden úplne jednotný dátový model, takže cieľom môže byť niekoľko dátových modelov. Platforma eScience povodia rieky Heihe vybrala formulár Common Common Data Form (NetCDF) (http://www.unidata.ucar.edu/software/netcdf/), Hierarchical Data Format (HDF) (http://www.hdfgroup.org /projects/) a GRib in Binary (GRIB) (http://www.wmo.int/pages/prog/www/) na integráciu a interoperáciu údajov podľa analýzy požiadaviek. Platforma integruje viaczdrojové a rôzne formátované údaje do niekoľkých dátových modelov. Dokáže vyriešiť rozpor medzi vysokovýkonnými výpočtami a nízkou účinnosťou spracovateľského softvéru, čím vytvorí štandardy správy pre rozsiahle priestorovo-časové súbory údajov a metadáta. Nový režim organizácie a prostredie spolupráce môžu zjednotiť disciplíny, regióny a časové škály a dosiahnuť prostredníctvom webových služieb [33] kompletný hodnotový reťazec dátovej integrácie, získavania, prenosu, ukladania, spracovania, aplikácií a služieb na tejto platforme eScience [33]. Rámec prostredia eScience je vhodný na spoluprácu medzi odborníkmi v rôznych oblastiach a zjednodušuje analýzu postprocesingu údajov a získavanie údajov. Prístup k nemu má otvorený a slobodný každý. Primárnym cieľom je zlepšiť interoperabilitu údajov a aplikácií prostredníctvom dátových modelov, rozhraní, štandardov a webových služieb.

    Tento článok sa zameriava na proces a metódy zjednocovania údajov z povodia rieky Heihe v systéme NetCDF a na zavedenie modulov online integrácie a interoperability údajov.

    2. Študijné oblasti

    Rieka Heihe je druhou najväčšou vnútrozemskou riekou v Číne. Je dlhý 821 km a pochádza z hory Qilianshan. Povodie Heihe je typické veľké vnútrozemské povodie, ktoré zaberá plochu približne 130 000 km 2 v suchej zóne severozápadnej Číny. Nachádza sa v strednej časti Hexiho koridoru provincie Gansu, ktorý sa skladá z horného, ​​stredného a dolného toku. Jeho horné toky pochádzajú z pohoria Qilian, kde pramenné toky vytvárajú silné drenáže, a dolné toky sa končia v púšti Vnútorného Mongolska. Stredné toky sú predovšetkým oázami obklopenými púšťou Gobi a krajina zahŕňa heterogénne rozmiestnené poľnohospodárske, lesné a obytné oblasti [34]. Študijná oblasť je znázornená na obrázku 1.


    Nástroje

    Súbor webových porovnávacích nástrojov na opätovnú analýzu (WRIT) je k dispozícii od divízie fyzikálnych vied NOAA ESRL a University of Colorado CIRES.

    Nástroj pre mapy „WRIT“ umožňuje užívateľom skúmať 20CR, ERA-Interim, ERA-20C, JRA-55, MERRA, MERRA-2, NCEP R1, NCEP R2 a NCEP CFSR znova analyzovať súbory údajov. Údaje o hladine tlaku sú k dispozícii pre väčšinu opätovných analýz a tiež 5 premenných na jednej úrovni vrátane tlaku v hladine mora, teploty vzduchu 2 m, vetra 10 m a zrážok. Mapy a úroveň tlaku podľa zemepisnej dĺžky a tlaku podľa zemepisnej šírky je možné generovať pre mesačné prostriedky, anomálie a klimatické zmeny. K dispozícii sú súbory pozorovacích údajov, ktoré je možné porovnať s teplotou vzduchu 2 m a zrážkami. Tieto množstvá sa môžu medzi súbormi údajov líšiť.

    Budúce vylepšenia zahŕňajú rôzne časové rozsahy.

    Časopisy a korelačný nástroj „WRIT“ je k dispozícii aj od WRIT. Umožňuje používateľom preskúmať 20CR, ERA-Interim, ERA-20C, JRA-55, MERRA, MERRA-2, NCEP R1, NCEP R2 a NCEP-CFSR, ako aj niektoré pozorovacie súbory údajov. Používatelia môžu porovnávať časové rady z rôznych množín údajov, oblastí, premenných a úrovní. K dispozícii sú tiež distribúcie, rozptylové grafy a automatická korelácia. Štatistiky pre každú sériu časov vrátane prostriedkov, skrytých odchýlok, sklonu a korelácií sú uvedené.

    Nástroj trajektórie „WRIT“ je nový nástroj dostupný od WRIT. Umožňuje používateľom vykresľovať trajektórie vpred a vzad z rôznych opakovaných analýz (v súčasnosti NCEP R1, NCEP R2 a 20CR s plánovanejšími). Používatelia môžu vykresliť trajektórie jednej alebo viacerých úrovní na jednom grafe. Výstup je vykreslený a je k dispozícii ako súbory netCDF a ako KMZ vhodné pre aplikáciu Google Earth.

    Plánujú sa ďalšie analytické produkty.

    Spätná väzba a návrhy sú vítané. Napíšte komentáre/problémy/návrhy v nižšie uvedenom komentári alebo otázke.

    Poďakovanie

    Projekt reanalyzy Twentieth Century (20CR) použil zdroje národného vedeckého výpočtového centra pre energetický výskum, ktoré spravuje Národné laboratórium Lawrence Berkeley, a počítačového zariadenia Leadership Computing Oak Ridge v národnom laboratóriu Oak Ridge, ktoré podporuje Vedecký úrad amerického ministerstva. energetiky podľa zmluvy č. DE-AC02-05CH11231 a zmluvy č. DE-AC05-00OR22725, v uvedenom poradí. Podporu poskytuje Ministerstvo energetiky USA, Inštitút vedy pre inovácie a nový výpočtový vplyv na teóriu a experiment (DOE INCITE), Úrad pre biologický a environmentálny výskum (BER) a Úrad pre klimatické programy Národnej správy pre oceán a atmosféru. . Údaje sú voľne dostupné od spoločností NOAA, NCAR, IRI, KNMI a DOE NERSC.

    Retrospektívna analýza modernej éry NASA pre výskum a aplikácie (MERRA) bola vyvinutá Globálnym modelovacím a asimilačným úradom (GMAO) a bola vytvorená prostredníctvom programu NASA Modeling, Analysis and Prediction (MAP) a je voľne dostupná od Goddard Earth Sciences (GES) Stredisko dátových informačných služieb (DISC).

    Opätovná analýza systému predpovedí klímy NCEP (CFSR) bola vyvinutá centrom environmentálneho modelovania (EMC) a bola čiastočne financovaná prostredníctvom kancelárie pre klimatický program NOAA. Verejnosť je bezplatne dostupná od NCDC aj NCAR.

    Priebežnú opätovnú analýzu ERA pripravuje Európske centrum pre strednodobé predpovede počasia (ECMWF) v britskom Readingu. Dočasné údaje ERA s aktualizáciami takmer v reálnom čase sú voľne dostupné z dátového servera ECMWF a z archívu údajov CISL pri NCAR.

    WRIT prispieva k iniciatíve Rekonštrukcie atmosférického obehu nad Zemou (ACRE).
    WRIT je čiastočne podporovaný NOAA a Ministerstvom energetiky USA (BER).


    8.2. Súbory mriežky

    GMT umožňuje čítanie mnohých formátov mriežky. Okrem predvoleného formátu netCDF môže používať binárne plávajúce body, krátke celé čísla, bajty a bity, ako aj 8-bitové rastrové súbory Sun (farebná mapa je ignorovaná). Môžu byť použité aj ďalšie formáty dodaním funkcií na čítanie a zápis a ich prepojením s knižnicami GMT. Zdrojový súbor gmt_customio.c obsahuje informácie, ktoré budú programátori potrebovať na rozšírenie GMT na čítanie súborov vlastnej mriežky. Ďalšie informácie nájdete v časti Špecifikácia formátu súboru Mriežka.

    8.2.1. Súbory NetCDF

    V predvolenom nastavení GMT ukladá 2-D mriežky ako súbory netCDF kompatibilné s COARDS. COARDS (čo znamená Cooperative Ocean/Atmosphere Research Data Service) je dohovor, ktorý používa mnoho agentúr distribuujúcich sieťové údaje na výskum oceánov a atmosféry. Dodržiavanie tohto dohovoru umožňuje GMT čítať mriežkové údaje poskytnuté inými ústavmi a inými programami. Naopak, ostatné všeobecné doménové programy budú schopné čítať mriežky vytvorené GMT. COARDS je podmnožinou rozsiahlejšej konvencie pre údaje netCDF s názvom CF-1.5 (Climate and Forecast, verzia 1.5). Mriežky GMT sú preto automaticky kompatibilné aj s CF-1.5. Pretože však CF-1.5 má všeobecnejšie použitie ako COARDS, nie všetky GMT súbory s CFCD-1.5 kompatibilné môžu byť prečítané.

    Súbor mriežky netCDF v GMT má na opis obsahu niekoľko atribútov (pozri tabuľku vo formáte netcdf). Rutina, ktorá sa zaoberá súbormi mriežky netCDF, je dostatočne flexibilná, takže je možné čítať aj súbory mriežky mierne odlišné od štandardov používaných GMT.


    Alternatíva 1

    Priestorové rozmery dátovej premennej (SST v nižšie uvedenom príklade) je potrebné pomenovať lon a lat. Okrem toho musia existovať súradnicové premenné lon a lat (časovo nezávislé!). Tieto musia mať správne atribúty premenných súradníc (pozri príklad nižšie).

    Alternatíva 2

    Priestorové rozmery a zodpovedajúce premenné existujú v zdrojovom súbore, ale nie sú označené ako lon a lat. Potom každá dátová premenná (v tomto prípade SST) musí mať atribúty, ktoré obsahujú názvy súradnicových premenných.

    Ak chýbajú súradnicové premenné, je ich možné vytvoriť pomocou operátora setgrid. Ak chceme do zdrojového súboru pridať definíciu mriežky, potrebujeme v textovom súbore definíciu mriežky zdrojového súboru (pozri „definovať mriežku“).


    Konvertovanie GRIB na NetCDF s časovou dimenziou pomocou netcdfAll? - Geografické informačné systémy

    Moderná geoveda často vyžaduje rozsiahle súbory údajov a obrovské množstvo výpočtov na numerickú simuláciu a spracovanie údajov a potreby údajov sa každým dňom zvyšujú [1 – 4]. V oblasti vedy o Zemi a životnom prostredí je správa údajov stále náročnejšia [5 – 7]. Objemy geografických údajov boli zhromaždené modernými akvizičnými technikami, ako sú globálne systémy určovania polohy (GPS), diaľkové snímanie, bezdrôtový senzor a prieskumy [8 – 12]. Nárast objemu dát viedol k distribuovanejšej archivácii a v dôsledku toho je ťažšie analyzovať údaje na jednom mieste a uložiť ich lokálne [13, 14]. “Veľké údaje ” sa stali všadeprítomným novým pojmom pre výskumníkov. Týka sa to nielen množstva údajov, ale aj aktuálnosti (rýchlosti), rozmanitosti a pravdivosti. Prostredie eScience plne využíva ľudí, údaje a počítačové zdroje. Softvér umožňuje pohodlné dátové aplikácie a šetrí pracovnú silu a zdroje [15]. Okrem výskumníkov má enormný záujem aj zber vládnych a súkromných odvetví, a to ako na zhromažďovaní priestorových údajov, tak aj na využívaní rozsiahlych zdrojov dátových súborov na rôzne aplikačné potreby, najmä webové potreby [16 – 19]. Prostredie eScience podporuje vyššie uvedené kombinované prostredie a poskytuje online pracovný tok vrátane integrácie, prístupu, analýzy, vizualizácie a kontroly kvality pre rôzne zdroje a formáty údajov [18, 20, 21]. V porovnaní s tradičnými metódami výskumu umožňujú aplikácie eScience výskumným pracovníkom naplno využiť vedecký výskum a uľahčiť medzinárodnú spoluprácu [22, 23]. Chen a kol. navrhol model pracovného toku geoprocesingu eScience na integráciu logických a fyzických procesov do kompozitného reťazca procesov na pozorovanie senzorov [24]. Bola navrhnutá prípadová štúdia o elektronických katastroch s cieľom analyzovať výsledky prieskumu uskutočneného vo viacerých európskych katastrálnych agentúrach a odhadnúť výhody infraštruktúry priestorových údajov [25]. Úloha zostaviť vhodný dátový model pre výskum v povodí je skutočná a vyžaduje si lepšiu interoperabilitu údajov, vývoj lepších algoritmov a dobré prípadové štúdie.

    Štúdie v povodí rieky Heihe skúmali počasie, ekológiu, hydrológiu a vodné zdroje chladných a suchých oblastí. S rozvojom technológií diaľkového snímania a bezdrôtových senzorových sietí sa znásobilo množstvo dát, ktoré je potrebné získať, uložiť, spracovať a prenášať [26, 27]. Zhromažďovali a naďalej sa zbierajú údaje o štúdiu povodia rieky Heihe, ktoré sa stali základom pre prognózovanie a rozhodovaciu analýzu [28]. Keďže údaje z povodia rieky Heihe sú v časovom období a formáte rozmanitejšie, komplexnejšie, dynamickejšie, viacrozmernejšie a majú viac metadát ako kedykoľvek predtým, je ťažšie ich analyzovať a efektívne vizualizovať [29, 30]. Preto bolo vytvorenie kontextu eScience uznané za naliehavú potrebu jednotného spravovania údajov a metadát a zjednotenia formátov údajov z rôznych odborov. Kontext eScience poskytuje škálu priestorových údajov prostredníctvom webových služieb s efektívnymi algoritmami spracovania údajov a efektívnymi vizualizačnými prístupmi pre dátové aplikácie prostredníctvom dátového servera THREDDS (Thematic Real-time Environmental Distributed Data Services) (TSD), OGC (Web Coverage Servers) WCS/WMS (Web Map Service), NcML-GML (NetCDF Markup Language-Geography Markup Language) a technológia objektovo orientovaných komponentov [9, 10, 12, 31, 32]. Internetová platforma poskytuje pohodlný spôsob, ako dosiahnuť priestorovo-časovú ťažbu údajov, integráciu, analýzu a distribúciu, a môže pomôcť výskumníkom v plnom využití existujúcich zdrojov údajov. Maximalizácia existujúcich zdrojov môže obmedziť duplikáciu práce a poplatkov za zber a zber údajov, čo posilňuje spoluprácu, najmä medzi komunitou GIS a zvyškom komunity vedcov o Zemi.

    Otázky výskumu, ktoré je potrebné vyriešiť pre online integrovanú správu údajov povodia rieky Heihe, sú tieto. Po prvé, pri vytváraní online platformy na integráciu a interoperabilitu údajov majú údaje poskytnuté rôznymi používateľmi rôzne formáty, bezprecedentne veľkú veľkosť, neočakávané metadáta, vysokú dimenziu a heterogénne zdroje údajov. Tieto údaje zahrnujú údaje diaľkového snímania vo formátoch HDF5, JPGE a TIFF, rastrové údaje, radarové údaje, ktoré sú zhromažďované a spracovávané špeciálnym softvérom, pozorovania klímy vo formátoch GRIB, NetCDF a ASCII, tvarové súbory a súbory s voľným textom. (napr. TXT, word a CSV). Údaje v rôznych formátoch vyžadujú viac rozhraní a algoritmy služieb pre integráciu a interoperabilitu údajov, čo zvyšuje obtiažnosť zdieľania údajov a interoperability. Výpočtové algoritmy údajov sú zamerané na rôzne časové rozsahy a ciele výskumu, napríklad pomocou denných a mesačných priemerov na predpovede krátkodobého počasia a rozsiahlych klimatických zmien. Za druhé, bezproblémová správa je náročná, pretože údaje boli oddelené od metadát. Okrem toho je ťažké sťahovať údaje v určenom období z množiny údajov, prenášať údaje alebo zdieľať rôzne polia a softvérové ​​systémy. Metadáta je potrebné efektívne archivovať. Existuje naliehavá potreba navrhnúť užívateľsky prívetivé rozhranie na uľahčenie interoperability, geopočítačov a geovizualizácií. Po tretie, je tiež potrebné zjednotenie heterogenity existujúcich protokolov a štandardov v architektúre orientovanej na služby, napríklad tých, ktoré sa uplatňujú pri vytváraní štandardov GIS. Nakoniec odborníci z rôznych odborov sú oboznámení s ich konkrétnym softvérom na formát údajov a spracovanie. Pri prevode jedného formátu na druhý alebo pri strate informácií pri prevode formátov údajov sa stretávajú s problémami.

    Na vyriešenie týchto problémov boli priestorové a časové údaje z povodia v kontexte eScience zaradené do piatich kategórií podľa zdroja údajov. Dátový model je kľúčovým faktorom zdieľania údajov. Výber dátového modelu na integráciu časovo-priestorových údajov je veľmi dôležitý pre efektívne a bezproblémové riadenie v bazéne eScience. Model určuje, či dokážeme efektívne popísať stav alebo vývoj geografickej entity a efektívne vyriešiť rôzne problémy súvisiace s časom. Vzhľadom na kompatibilitu údajov je ťažké dosiahnuť jeden úplne jednotný dátový model, takže cieľom môže byť niekoľko dátových modelov. Platforma eScience povodia rieky Heihe vybrala formulár Common Common Data Form (NetCDF) (http://www.unidata.ucar.edu/software/netcdf/), Hierarchical Data Format (HDF) (http://www.hdfgroup.org /projects/) a GRib in Binary (GRIB) (http://www.wmo.int/pages/prog/www/) na integráciu a interoperáciu údajov podľa analýzy požiadaviek. Platforma integruje viaczdrojové a rôzne formátované údaje do niekoľkých dátových modelov. Môže vyriešiť rozpor medzi vysokovýkonnými výpočtami a nízkou účinnosťou spracovateľského softvéru a vytvoriť štandardy správy pre rozsiahle priestorovo-časové súbory údajov a metadáta.Nový režim organizácie a prostredie spolupráce môžu zjednotiť disciplíny, regióny a časové škály a prostredníctvom webových služieb [33] dosiahnuť kompletný hodnotový reťazec integrácie, získavania, prenosu, ukladania, spracovania, aplikácií a služieb údajov na tejto platforme eScience [33]. Rámec prostredia eScience je vhodný na spoluprácu medzi odborníkmi v rôznych oblastiach a zjednodušuje analýzu postprocesingu údajov a získavanie údajov. Prístup k nemu má otvorený a slobodný každý. Primárnym cieľom je zlepšiť interoperabilitu údajov a aplikácií prostredníctvom dátových modelov, rozhraní, štandardov a webových služieb.

    Tento článok sa zameriava na proces a metódy zjednocovania údajov z povodia rieky Heihe v systéme NetCDF a na zavedenie modulov online integrácie a interoperability údajov.

    Rieka Heihe je druhou najväčšou vnútrozemskou riekou v Číne. Je dlhý 821 x 2009 km a pochádza z hory Qilianshan. Povodie Heihe je typické veľké vnútrozemské povodie, ktoré sa rozprestiera na ploche približne 130 000   km 2 v suchej zóne severozápadnej Číny. Nachádza sa v strednej časti Hexiho koridoru provincie Gansu, ktorý sa skladá z horného, ​​stredného a dolného toku. Jeho horné toky pochádzajú z pohoria Qilian, kde pramenné toky vytvárajú silné drenáže, a dolné toky sa končia v púšti Vnútorného Mongolska. Stredné toky sú predovšetkým oázami obklopenými púšťou Gobi a krajina zahŕňa heterogénne rozmiestnené poľnohospodárske, lesné a obytné oblasti [34]. Študijná oblasť je znázornená na obrázku 1.

    Mapa študijnej oblasti Povodia Heihe.

    Povodie Heihe, ako typická študijná oblasť pre vedu o Zemi, bolo predmetom nedávneho výskumu počasia, klímy a diaľkového prieskumu zeme, ekológie a hydrológie, ktoré často vyžadujú analýzu stoviek tisíc premenných. Pri spracovaní údajov vzniká veľké množstvo výsledkov, vysvetlení a ďalších informácií v rôznych formátoch a súboroch. V povodí rieky Heihe je hlavným zdrojom údajov a dôležitým základom výskumu vedy o zemských systémoch dlhodobé monitorovanie, testovanie a výskum. Riadenie a spracovanie údajov z dlhodobého monitorovania sú niektoré z dôležitých úloh výskumu povodí. Preto je v kontexte oblasti eScience v povodí potrebné pri návrhu a implementácii nových dátovo orientovaných infraštruktúr, služieb, štandardov a systémov riešiť otázky ako distribúcia, heterogenita a objem údajov.

    3. Metódy 3.1. Spoločný dátový model a priestorovo-dočasný dátový model pre kontext EScience

    Zvolený priestorovo-časový model údajov musí riešiť súlad platformy s rozhraniami modelu a niekoľkými protokolmi. Musí tiež zodpovedať architektúre orientovanej na služby prostredníctvom otvorených a bezplatných rozhraní, pretože kontext eScience je distribuované prostredie zamerané na služby, ktoré umožňuje vedcom zdieľať distribuované zdroje údajov a komponenty na spracovanie údajov. Unidata ’s Common Data Model (CDM) má jednotné rozhranie na prístup k súborom NetCDF, HDF a GRIB a vytvára most interoperability pre rôzne dátové modely. Rozhranie CDM sa používa na formovanie pracovného toku integrácie, vizualizácie, distribúcie a analýzy údajov v rámci eScience. Rozhrania na integráciu a interoperáciu údajov priestorovo-časových údajov sú uvedené na obrázku 2.

    Rozhrania na integráciu a interoperáciu údajov priestorovo-časových údajov.

    3.2. Klasifikácia údajov a archív v kontexte vedy povodia Heihe

    V povodí rieky Heihe je na generovanie formátu NetCDF z heterogénnych viaczdrojových údajov (napr. GeoTiff, ASCII, voľný text, súbor tvarov a mriežka) dôležité klasifikovať a archivovať údaje z povodia Heihe. Podľa charakteristík NetCDF a formátov údajov boli tieto formáty zaradené do piatich typov vrátane bodu bodu, bodu, mriežky, obrazu a radiálu, aby sa vyriešili chaotické problémy v údajových formátoch (tabuľka 1). Typy staníc opisujú údaje z časových radov pozorovania, ktoré zostávajú zafixované vo vesmíre a majú presný súbor špecifikovaných priestorových súradníc (napr. Údaje o hydrologických staniciach a údaje o meteostaniciach). Na rozdiel od bodov staníc môžu body meniť svoju polohu a nemusia mať medzi sebou žiadny vzťah. Môžu zaznamenávať údaje v textových formátoch. Mriežka obsahuje štruktúrované a neštruktúrované údaje. Prostredníctvom týchto typov je možné integrovať a archivovať niekoľko tradičných dátových súborov do jedného súboru NetCDF (napr. Údaje voľného textu), ako je uvedené v tabuľke 1. Štruktúra NetCDF poskytuje účinný mechanizmus na riešenie komplikovaných vedeckých pracovných tokov a rieši “messy ” problémy, ako sú tradičné viac súborov a heterogénne údaje.

    Klasifikácia a archív rôznych dátových typov.

    Platforma integrácie a interoperability priestorovo-dočasných údajov bola skonštruovaná na základe webovej služby architektúry B/S, aby sa zlepšilo zdieľanie a interoperabilita. Konštrukčné toky konverzie a interoperability údajov v rámci sú znázornené na obrázku 3. Rozhranie CDM bolo použité na prístup k rôznym vedeckým údajom vrátane NetCDF, HDF a GRIB. Na implementáciu rámca integrácie dát a interoperability sme okrem CDM použili aj ďalšie dve technológie (schémy XML a objektovo orientované komponenty). Dátový server TSD, NCML-GML a OGC WCS/WMS boli dosiahnuté hlavne prostredníctvom schém XML. Schémy XML riešia problémy so vzdialeným prístupom k údajom a uľahčujú interoperabilitu GIS a ďalších údajov prostredníctvom webových služieb. Technológia objektovo orientovaných komponentov riešila hlavne problémy, že rôzne domény vyvíjajú rôzne algoritmy na spracovanie údajov v rôznych počítačových jazykoch (napr. C, MATLAB a Fortran). Potrebovali sme poskytnúť objektovo orientovanú technológiu komponentov na výstavbu knižnice komponentov pomocou programu na zber údajov. Navyše k týmto trom dátovým formátom môžeme pristupovať prostredníctvom rozhraní CDM prostredníctvom protokolov OPeNDAP alebo HTTP. NcML-GML a WCS/WMS dosiahli webovú službu údajov GIS kódovaných v NetCDF. Rámec je vhodný pre štandardnú správu rozsiahlych časopriestorových údajov a uľahčuje kooperatívny výskum naprieč odbormi.

    Tok návrhu konverzie dátového formátu a interoperabilita v rámci.

    Obrázok 4 zobrazuje hlavné funkcie časovo-priestorových údajov na platforme eScience. Platforma poskytuje služby vrátane extrakcie metadát NetCDF, prevádzky s množinou údajov NetCDF, konverzie formátov údajov, vizualizácie údajov a prístupu k údajom. Ak rozhranie CDM nemôže dosiahnuť špeciálne spracovanie údajov, boli zvolené vhodné komponenty v knižniciach komponentov podľa požiadaviek výskumníkov. Ak komponent neexistuje, je možné navrhnúť nový komponent a pridať ho do knižníc komponentov.

    Primárne funkcie priestorovo-časovej integrácie údajov a interoperability v rámci eScience.

    Služby extrakcie metadát v NetCDF extrahujú informácie o atribútoch súboru údajov vrátane názvov oddelení, autorov, súradnicových systémov a atribútov. Tiež je možné ich extrahovať pomocou NcML. Služby prevádzky množiny údajov zahŕňajú základné operácie, ako je pripájanie časovo-priestorových údajov, premenovanie, úprava a odstraňovanie atribútov, premenných a dimenzií. Služby prevodu dátových formátov prevádzajú formáty bodových údajov, údajov diaľkového prieskumu, radarových údajov a mriežkových údajov na NetCDF a prevádzajú NetCDF na formát rastrových a vektorových údajov prostredníctvom softvéru tretej strany alebo knižnice online nástrojov, ako je softvér GIS, na podporu zdieľania a interoperabilita údajov. Vizualizačné služby NetCDF ponúkajú dynamickú vizualizáciu dlhodobých časopriestorových údajov na dosiahnutie pohodlného porovnávania a výberu údajov v študovanej oblasti prostredníctvom WCS/WMS alebo online nástrojov. Prístupové služby NetCDF získavajú údaje online prostredníctvom servera THREDDS Data Server a existujúcich protokolov (napr. OPeNDAP a ADDE). Keď používateľov nezaujímajú všetky údaje, môžu z týchto súborov údajov prostredníctvom webu extrahovať sekcie údajov pre určité premenné v určitých časoch alebo v určitých oblastiach. Analýza NetCDF realizuje aritmetické operácie prostredníctvom prehliadača na množinách údajov NetCDF, ako sú výpočtové priemery.

    3.4. Interoperabilita údajov NetCDF s technológiou TSD, OGC WCS/WFS a NcML-GML v EScience Framework

    Webová technológia poskytuje podporu pre rozvoj eScience prostredníctvom inovatívnych technológií a protokolov, formátu a algoritmov správ a kreatívnych služieb, ako sú Wikis, TSD a WCS [35, 36]. Rámec eScience je platforma interoperability orientovaná na služby pre veľké priestorovo-časové súbory údajov. Kľúčové technológie, THREDDS Data Server, OGC WCS/WFS a NcML-GML, uľahčujú interoperabilitu vedcov v rôznych disciplinárnych oblastiach, ako ukazuje obrázok 5. THREDDS Data Server (TDS) je webový server pre vedecké údaje a uvádza súbory údajov v katalógu THREDDS, čo je jednoducho súbor XML ponúkajúci dostupné súbory údajov a služby. Prostredníctvom TDS môžu užívatelia získať názov a umiestnenie množín údajov z rôznych inštitúcií a potom k nim pristupovať prostredníctvom protokolov OPeNDAP, ADDE alebo NetCDF/HTTP [37]. TDS môže slúžiť ľubovoľnému súboru údajov, ktorý môže knižnica NetCDF-Java čítať (napr. NetCDF-3, NetCDF-4, HDF-4, HDF-5, HDF-EOS, GRIB-1 a GRIB-2). Môže tiež poskytovať služby (podmnožinu) údajov (napr. OGC WMS a WCS), služby zberu údajov (napr. Agregácia) a služby metaúdajov (napr. NcML). Vedci môžu získať vybrané časti týchto súborov údajov prostredníctvom webového prehliadača (napr. Určité premenné v určitých časoch alebo oblastiach).

    Kľúčová technológia platformy interoperability eScience komunity GIS a ďalších komunít.

    Metadáta, ktoré sa majú pridať, odstrániť a zmeniť.

    Premenné sa majú premenovať, pridávať, odstraňovať a reštrukturalizovať.

    Agregované údaje z viacerých súborov CDM (napr. Union, JoinNew a JoinExisting).

    Ako príklad uvádzame údaje NetCDF o priemernej mesačnej teplote v povodí rieky Heihe. Údaje sú vo formáte NetCDF sťažností na CF a vizualizácia je zobrazená prostredníctvom online nástrojov na obrázku 6. NcML údajov je uvedený v prílohe.

    Kľúčová integrovaná dátová technológia NetCDF založená na webe prostredníctvom objektovo orientovanej metódy so zmiešaným riešením MATLAB a Java.

    Agregačná funkcia NcML je užitočná pre kombinácie údajov časových radov. Údaje viacerých časových radov NetCDF je možné agregovať do jednej logickej množiny údajov s niekoľkými typmi agregácie vrátane Union, JoinExisting a JoinNew. Na uľahčenie interdisciplinárnej práce medzi vedami o Zemi a komunitami GIS je NcML-GML vyvinutý tak, aby používal súbory údajov NetCDF v softvéri GIS a poskytoval im všetky potrebné metadáta vo forme rozšírení GML (Geography Markup Language) do NcML. GML je napísaný v schéme XML na ukladanie geografických informácií so sémantikou komunity GIS. NcML-GML podporuje odkazovanie na informácie o časopriestorových údajoch a realizáciu funkcie platformy, ktorá popisuje údaje o pokrytí odvodené z dátového súboru NetCDF. NcML-GML a WCS/WMS môžu mapovať model NetCDF do modelu GIS a uľahčovať interoperabilitu medzi týmito dvoma modelmi a rôznymi vedcami. Prostredníctvom vyššie uvedenej technológie môžu používatelia získavať metadáta a požadované časti údajov zo vzdialených súborov NetCDF v adresári prístupnom na webovom serveri.

    3.5. Kľúčové objektovo orientované komponentové technológie priestorovo-dočasnej online integrácie a spolupráce

    Aby sme zvýšili rýchlosť výpočtu a pohodlnú vizualizáciu údajov, vybrali sme zmiešané riešenie MATLAB a Java na dokončenie integrácie údajov na webe ako jeden z príkladov objektovo orientovanej metódy vytvárania komponentov. Komponenty kontroly kvality sú tiež postavené na objektovo orientovanej metóde. Obrázok 6 ukazuje technický rámec.

    Zmiešaným riešením MATLAB a Java je dokončenie vlastného rámca a rozhrania prostredníctvom technológie Java a Web pre špeciálne spracovanie a výpočet údajov prostredníctvom systému MATLAB s výkonnými schopnosťami maticovej a numerickej analýzy. Zmiešané riešenie môže vyriešiť problémy, ktoré prináša slabá interaktivita MATLABu a skutočnosť, že programy MATLAB nemožno spúšťať mimo prostredia. Okrem toho by sa dali využiť aj charakteristiky jazyka Java, ako napríklad kríženie platforiem a spracovanie výnimiek, viacvláknové spracovanie a stabilná a rýchla prevádzka.

    Obrázok 6 zobrazuje pracovný tok technológie zmiešaných riešení, kód MATLAB dopĺňa základné algoritmy integrácie NetCDF a generuje súbory m. Po druhé, súbory m sa potom transformujú na komponent, ktorý bude interagovať so serverovou stranou prostredníctvom jazyka Java bez prostredia MATLAB prostredníctvom kompilátora MATLAB a staviteľa MATLAB JA. Nakoniec by bola vyvolaná funkcia zapuzdrenia, aby sa dosiahol základný výpočet MATLAB a online výpočtov na webe prostredníctvom programu Java s dynamickou knižnicou MATLAB.

    Obrázok 7 zobrazuje príklad procesov v rámci vedeckého pracovného toku. Integračný proces NetCDF obsahuje integrovaný reťazec vyvolávajúci najskôr komponent na spracovanie údajov a potom integračný proces. Po vytvorení nového NetCDF komponent pridávania údajov pokračuje vo zvyšovaní premennej na NetCDF, predlžovaní časovej dimenzie alebo pridávaní ďalších premenných. CDM je k dispozícii ako bezplatný softvér na spracovanie NetCDF a v skutočnosti sa nazýva niekoľkokrát ako súčasť rôznych vedeckých pracovných tokov.

    Zjednodušený sekvenčný diagram pre integráciu NetCDF.

    3.6. Online metódy kontroly kvality priestorovo-dočasných údajov na platforme EScience

    Kvalita priestorových údajov bola v GIS uznaná za dôležitý problém. Online spracúvaniu údajov o časopriestorovej kvalite dát sa však venovala malá pozornosť. Nepravidelnosti spôsobujú nespoľahlivé výsledky, pretože akúkoľvek počiatočnú chybu priestorových údajov je možné šíriť prostredníctvom spracovania priestorových údajov. Na základe ľadovcov, permafrostu, púští a atmosférických, ekologických, environmentálnych, hydrologických a ďalších prvkov monitorovacie systémy zriadené v povodí rieky Heihe realizujú automatický prenos údajov a spájajú sa s kontextom povodia eScience. Pred integráciou a analýzou údajov dosahujeme detekciu a kalibráciu údajov v reálnom čase, aby sme zaistili kontrolu kvality údajov na platforme eScience.

    V tejto štúdii sa zameriavame predovšetkým na online kontrolu kvality údajov odľahlých hodnôt v priestorovo-časových údajoch pred konverziou na NetCDF. To je veľmi dôležité pre kontrolu kvality údajov, najmä pre prenos údajov v bezdrôtových senzorových sieťach pred tým, ako sa dátové formáty prevedú na súbory NetCDF. V knižnici komponentov sme poskytli komponenty na kontrolu kvality pre webové služby. Okrem toho budeme pokračovať v obohacovaní našej knižnice komponentov, aby sme uľahčili spracovanie údajov a kontrolu kvality údajov.

    Podľa požiadavky na údaje platforma eScience panvy poskytuje online metódy detekcie extrémnych hodnôt, vrátane extrémnych testovacích metód, testovacích metód 3 δ, testovacích metód Dixon ’s a Grubbs ’. Platforma poskytne pohodlnú detekciu abnormálnych dátových bodov, čo pomôže používateľom porozumieť pravidlám zmeny údajov v priebehu času a vnútorným vzťahom medzi údajmi. Na základe fyzikálnych charakteristík a štatistických skúseností rôznych prvkov extrémna testovacia metóda poskytuje maximálne a minimálne hodnoty údajov v reálnom čase. Pokiaľ ide o testovaciu metódu 3 δ, podľa teórie chyby sa náhodná chyba δ riadi normálnym rozdelením. Pretože štandardný diferenciál je všeobecne neznámy, namiesto δ sa obvykle používa S počítané podľa Bezierovho vzorca. Vo vzorci (1) je x - skutočná hodnota a x i sú údaje z pozorovania. Uvažujme (1) x - = 1 N ∑ 1 n   xi,   i = 1,2, 3, …, n, (2) S = ∑ i = 1 nvi 2 N - 1,   i = 1,2, 3, …, n.

    Pre údajový bod pozorovania xi, ak jeho zvyšky vi spĺňajú vi = | xi - x - | > 3 S, i = 1,2, 3, …, n, xi je označený ako odľahlé údaje . V prípade testovacej metódy Dixon ’ predpokladajme, že celkové údaje z pozorovania sú normálne distribuované. Vo vzorke x 1, x 2, x 3, …, xn, n je počet vzoriek a údaje z pozorovania sú usporiadané v poradí podľa veľkosti x ′ 1, x ′ 2, x & #x2032 3, …, x ′ n. V závislosti od počtu vzoriek vyberieme iný vzorec, napríklad vzorec (3). Označili sme r 10, r ′ 10, r 11, r ′ 11, r 21, r ′ 21, r 22 a r ′ 22 ako r i j a r ′ i j. Ak chcete určiť hladinu významnosti α, vyhľadajte prah D (α, n) v prahovej tabuľke Dixonovho testu. Ak r i j > r ′ i j, r i j > D (α, n), potom x ′ n sa hodnotí ako abnormálna hodnota. Ak r i j < r ′ i j, r i j > D (α, n), potom x ′ 1 sa hodnotí ako abnormálna hodnota. V opačnom prípade neexistujú žiadne abnormálne hodnoty. Testovacia metóda Dixon ’s je vhodná na kontrolu kvality údajov v reálnom čase. Uvažujme (3) r 10 = x ′ n - x ′ n - 1 x ′ n - x ′ 1,   r ′ 10 = x ′ 2 - x &# x2032 1 x ′ n - x ′ 1   3 ≤ n ≤ 7, r 11 = x ′ n - x ′ n - 1 x ′ n - x & #x2032 2,   r ′ 11 = x ′ 2 - x ′ 1 x ′ n - 1 - x ′ 1   8 ≤ n ≤ 10, r 21 = x ′ n - x ′ n - 2 x ′ n - x ′ 2,   r ′ 21 = x ′ 3 - x ′ 1 x & #x2032 n - 1 - x ′ 1   11 ≤ n ≤ 13, r 22 = x ′ n - x ′ n - 2 x ′ n - x ′ 3,   r ′ 22 = x ′ 3 - x ′ 1 x ′ n - 2 - x ′ 1   14 ≤ n ≤ 30.

    Pre testovaciu metódu Grubbs ’ sme predpokladali normálne nezávisle namerané vzorky x 1, x 2, x 3, …, xn, kde n je počet vzoriek, zvyšková absolútna hodnota údajov je xi a x - je maximum. x - je priemer vzoriek. Potom sme skonštruovali štatistiku (x i - x -) / S, pričom vzorec pre S je daný vzorcom (2). Na zvolenej hladine významnosti α získame prah G (α, n) podľa vzorca (4). α je zvyčajne hodnota 0,05 alebo 0,01. Uvažujme (4) P x i - x - S ≥ G α, n = α.

    Ak | x i - x - | ≥ G (α, n) S, potom x i je abnormálna hodnota a G (α, n) môže byť daná vyhľadávacou tabuľkou.

    Na platforme eScience zhromažďujeme aj množstvo otvorených a bezplatných nástrojov na spracovanie údajov a poskytujeme ich online, ako sú napríklad vizualizačné nástroje na uľahčenie spolupráce, ako napríklad nástroje NetCDF (http://www.unidata.ucar.edu/downloads).

    4. Výsledky 4.1. Prípadová štúdia priestorovo-dočasnej integrácie a interoperability údajov na platforme EScience

    V tomto príspevku sú údaje z pozorovania z miesta prenosu bezdrôtového senzora subfázie Mafengou v povodí rieky Heihe použité ako prípadová štúdia pre abnormálnu kontrolu kvality údajov. Údaje o teplote sa prenášajú každých 30 minút s celkovým počtom 73 záznamov.Obrázky 8 (a), 8 (b), 8 (c) a 8 (d) porovnávajú súbor údajov pred a po kontrole vonkajšej kvality so štyrmi metódami, extrémnym testom, testom 3 δ, Dixonovým testom a Grubbs ’ test, resp. Obrázok 8 (a) ukazuje, že extrémnou testovacou metódou sa zistili tri krajné hodnoty. Obrázok 8 (b) ukazuje, že testovacia metóda 3 δ našla zrejmé abnormálne údaje. Obrázok 8 (c) ukazuje, že pomocou metódy Dixon ’s bolo nájdených päť odľahlých hodnôt. Najlepšia je testovacia metóda Grubbs ’, ktorá našla sedem odľahlých hodnôt, ako je znázornené na obrázku 8 (d).

    (a), (b), (c) a (d) porovnať súbor údajov pred a po kontrole kvality odľahlých hodnôt s extrémnymi metódami, testmi 3 δ, Dixon ’s a Grubbs ’.

    Obrázok 9 zobrazuje nástroj NetCDF zobrazenie mriežkovej mapy teploty pre povodie rieky Heihe. Nástroje NetCDF môžu tiež prehľadávať vzdialené súbory údajov (napr. NetCDF, GRIB a HDF) prostredníctvom dátového servera TSD. Online knižnica nástrojov uľahčuje spracovanie údajov a súčinnosť kontextu eScience pomocou nástrojov, ktoré sú vedcom dobre známe.

    Príklad pomocou voľne dostupného softvéru (NetCDF (4.2) Tools) z online knižnice, ktorý dokáže spracovávať a vizualizovať súbory NetCDF a NcML a vzdialene pristupovať k súborom NetCDF, GRIB a HDF prostredníctvom TSD.

    4.2. Integrácia rastrových údajov

    Na demonštráciu integrácie údajov sme ako príklad zobrali rastrové údaje o priemerných mesačných teplotách povodia Heihe a integračné komponenty knižnice komponentov prostredníctvom webových služieb, ako je znázornené na obrázku 10. Nástroj dosiahol predovšetkým integráciu a agregáciu údajov. Najprv skonvertoval mriežkové údaje na ASCII a potom ich integroval online ako NetCDF, aby dokončil integráciu údajov dlhých sérií. V tomto prípade je veľkosť mriežky 500 metrov, číslo riadku 899, číslo stĺpca 1041, súradnica x ľavého dolného rohu je 666083,7 metra a súradnica y je 4008999,5 metra. Tieto parametre a súradnicový systém boli na webovej stránke potrebné. Pri generovaní súborov funkcií m vyberáme ako parametre funkcie a#x2019s pre integráciu údajov NetCDF veľkosť mriežky, poradové číslo mriežky a súradnice ľavého dolného rohu, čas ako neobmedzený parameter rozmerových premenných a súradnicový systém ako metadáta podľa CF. Komponenty môžu tiež pridávať premenné do NetCDF prostredníctvom agregácie. Obrázok 10 zobrazuje vizualizačnú mapu jednomesačných údajov z dátových súborov NetCDF údajov o teplote horného toku rieky Heihe v novembri 2005.

    Rastrové údaje boli integrované do NetCDF prostredníctvom knižnice komponentov založenej na webovej službe.

    4.3. Integrácia údajov bezdrôtovej siete Network Station

    Údaje o staničných bodoch z miesta prenosu bezdrôtových senzorov v povodí rieky Heihe boli použité ako prípadová štúdia na integráciu bodových údajov. Dáta boli prenášané každých 15 minút a skúmané prostredníctvom komponentov kontroly kvality uvedených v časti 4.4 pred konverziou na NetCDF. Údaje o pôdnej vlhkosti pozorovacích údajov boli definované v NetCDF. Integrácia NetCDF je rozdelená do dvoch častí: prvá popisuje informácie o čísle stanice, zemepisnej šírke, dĺžke a nadmorskej výške a druhá popisuje merania, ako sú meteorologické a hydrologické prvky. Vizualizačná mapa množiny údajov NetCDF pre vlhkosť pôdy bezdrôtovej senzorovej stanice subfázov Mafengou v októbri je znázornená na obrázku 11. Riadky s názvom pôdna vlhkosť1 a pôdna vlhkosť2 boli údajmi NetCDF z rôzneho času a riadky pôdnej vlhkosti10 boli agregáciou dvoch súborov údajov NetCDF s jedným z pôdnej vlhkosti1 NetCDF a pôdnej vlhkosti2 NetCDF.

    Agregované údaje o vlhkosti pôdy z rôznych časových radov s jedným NetCDF.

    < agregácia dimName = "time" type = "joinExisting" >

    4.4. Integračné príklady obrazových a radiálnych údajov

    Pri integrácii štruktúry poľa obrazových údajov do dátového modelu NetCDF zvažujeme nasledujúce premenné: riadok (počet riadkov skenovania satelitov), ​​elem (bod prvku na číslo riadka skenovania) a pásmo (počet pásiem pozorovaní ). Geografická poloha je opísaná zemepisnou šírkou a dĺžkou a pozorovacie hodnoty každého pásma sú definované ako hlavná dátová premenná NetCDF.

    Pri integrácii radiálnych údajov (napr. Radarových údajov) uvažujeme predovšetkým o umiestnení radiálnych údajov podľa azimutu, nadmorskej výšky, uhla a orientácie. Skenovací záznam sa skladá z radu susedných radiálnych dátových záznamov. Medzi hlavné premenné dátového modelu NetCDF v programe patrí brána (počet impulzov radiálneho záznamu údajov), radiálny (počet radiálnych údajov zaznamenaných skenovaním), sken (číslo skenovania), vzdialenosť (vzdialenosť pulz), čas (čas údajového záznamu), eleva (uhlový výškový rozdiel) a azim (azimut). V tomto príspevku sa NetCDF používa ako prípadová štúdia technológie na implementáciu rámca.

    Platforma eScience poskytuje efektívne stratégie prepojenia a interakcie pri spracovaní údajov, zdieľaní vedeckého výskumu a podpory rozhodovania so širokou verejnosťou. Je to dôležitá metóda na riešenie bežného problému informačných ostrovov tým, že ponúka prístup k verejným webovým údajom. Online integrácia heterogénnych zdrojov údajov poskytla používateľom jednotné rozhranie na prístup k údajom, ich analýzu a bezproblémové spravovanie a poskytuje štandardný formát pre programy na spracovanie údajov. Problém chaotických dátových formátov vyriešila platforma eScience. Zlepšila schopnosť používateľov skúmať komplexné javy, ako sú zmena klímy, hydrologické zmeny a dynamika pôdy. Nakoniec sa prostredie eScience bude postupne využívať na podporu rozhodovania v povodí rieky Heihe.

    V ďalšom výskume preskúmame metódy spracovania údajov HDF a GRIB a postupne vytvoríme jednotný online proces priestorových údajov v kontexte eScience pre povodie rieky Heihe, vyvinieme sadu efektívnych paralelných algoritmov a skonštruujeme knižnicu podporujúcu geovedné údaje vhodnú pre vysoké výkonový paralelný výpočet.

    Táto štúdia skonštruovala kontext integrácie údajov a interoperability eScience povodia rieky Heihe, ktorý integroval priestorovo-časové údaje a rôzne formáty do dátových modelov NetCDF. Rámec bol zostavený na základe HDF, NetCDF a GRIB na rovnomerné spravovanie priestorovo-časových údajov a metadát, ktoré boli dlhodobé, masívne a multidimenzionálne. Okrem toho môžeme k týmto dátovým formátom (napr. HDF, NetCDF a GRIB) pristupovať a analyzovať ich prostredníctvom rozhrania CDM, ktoré poskytuje pohodlný spôsob na dolovanie údajov, integráciu a analýzu časovo-priestorových údajov. Rámec môže vytvoriť kooperatívne pracovné prostredie eScience a podporovať efektívnu aplikáciu údajov prostredníctvom webových služieb. Je obzvlášť prospešné pre GIS a komunity vedy o Zemi pre kooperatívnu komunikáciu prostredníctvom platformy eScience.

    Platforma eScience pre integráciu a interoperabilitu údajov kombináciou technologických riešení môže dosiahnuť tieto ciele: (i) integrácia údajov v reálnom čase a s historickými údajmi (ii) riešenie problémov s aplikáciami údajov v rôznych oblastiach, oblastiach a disciplínach (iii) pohodlne prístup a analýzu dátových zdrojov z rôznych inštitúcií a (iv) riešenie problémov týkajúcich sa heterogénnych existujúcich štandardov a existujúcich protokolov prístupu k webovým údajom. Kombinácia zvolených riešení by mohla byť zaujímavá na dosiahnutie cieľov, ale jeden druh technológie ich nemôže dosiahnuť.


    Pozri si video: NetCDF with Python netCDF4 - Metadata, Dimensions, and Variables (Október 2021).