ERDDAP on tietopalvelin, joka tarjoaa yksinkertaisen ja johdonmukaisen tavan ladata tieteellisten tietojoukkojen osajoukkoja yleisissä tiedostomuodoissa ja tehdä kaavioita ja karttoja.
Sisällysluettelo
Ilman ERDDAP tä, kun henkilö (tai tietokoneohjelma) etsii Internetistä tietyntyyppistä tieteellistä tietoa (esimerkiksi satelliittien merenpinnan lämpötilatietoja), on ongelmia ...
- Mielenkiintoisia tietojoukkoja on vaikea löytää, koska niitä on monilla eri verkkosivustoilla.
- Jokainen sivusto vaatii eri protokollan tietojen pyytämiseen:
(esimerkiksi
HTTP GET
,
XML
,
SOAP+XML
,
OPeNDAP
,
WCS
,
WFS
,
SOS
tai HTML-lomake) .
- Jokainen sivusto palauttaa tiedot eri muodossa (esimerkiksi XML, SOAP+XML, OPeNDAP -binääritietovirta, ASCII-teksti, HDF 4, HDF 5, NetCDF, ...) eikä se ole yleinen tiedostomuoto, jonka käytät.
haluta.
- Eri sivustojen tietoja on vaikea verrata, koska päivämäärät+ajat on ilmaistu eri muodoissa, esimerkiksi "2.
tammikuuta 1985", "02-JAN-1985", "1/2/85", "2/1/85".
","1985-01-02"tai päiviä 1.
tammikuuta 1980 tai ...).
- Katso tämän ensimmäisen puoliskon
nopea esittely ERDDAP :iin
video
. (5 minuuttia)
Siinä tiedemies lataa merivirtojen ennustetiedot ERDDAP :sta mallintaakseen myrkkyvuodon valtameressä
NOAA :n GNOME -ohjelmistolla.
(5 minuutissa!).
Tämä video näyttää:
Kiitos Rich Signell.
(Yksi pieni virhe videossa:
kun haet tietojoukkoja, älä käytä AND merkkiä hakutermien välillä.
Se on implisiittinen.)
- ERDDAP voi saada tietoja paikallisista (palvelimen kiintolevyltä) ja etätietolähteistä (käytettävissä verkon kautta).
Katso
luettelo tietolähteistä, joita ERDDAP voi käyttää.
- ERDDAP voi palvella monenlaista tieteellistä dataa, ei vain merentutkimusta.
ERDDAP on tietopalvelin, joka on kirjoitettu
NOAA
NMFS
SWFSC
ERD :ssä.
ERD :n ERDDAP palvelin palvelee valtameritietoja, mutta ERDDAP (ohjelma) voi käyttää ja palvella mitä tahansa ruudukko- tai taulukkotietoa.
- ERDDAP tarjoaa useita tapoja etsiä kiinnostavia tietojoukkoja.
Esimerkiksi
kokotekstihaku,
haku kategorian mukaan (tunnetaan myös nimellä fasetoitu haku) ja
Tarkennettu haku .
Tarkennettu haku yhdistää kaikki hakutekniikat ja lisää haut tietojoukkoon, jotka sisältävät tietoja pituus-, leveysaste- ja aikavälillä, joten voit etsiä tietojoukkoja useiden eri kriteerien perusteella samanaikaisesti.
- ERDDAP avulla voit pyytää tietoja standardoidulla tavalla,
riippumatta tietolähteen pyyntöprotokollasta.
ERDDAP tarjoaa myös Data Access Forms -sivuja, jotka auttavat ihmisiä luomaan OPeNDAP pyyntöjä.
OPeNDAP :t
Data Access Protocol (DAP )
on yksi
NOAA :n Data Accessin teknisistä suosituksista
ja
NASA Earth Science Data and Information System (ESDIS) -standardi
.
(OPeNDAP on hieno!) ERDDAP kääntää pyyntösi OPeNDAP, WMS tai SOS -muodosta tietolähteen pyyntömuotoon ja muuntaa vastauksen johonkin ERDDAP :n sisäisestä tietorakenteesta.
Sitten ERDDAP alustaa tiedot uudelleen valitsemaasi yleiseen tiedostomuotoon (esimerkiksi .html-taulukkona, ESRI .asc, Google Earth .kml, .mat, .nc, ODV .txt, .csv, .tsv, .json, .xhtml, .png, .pdf) ja lähettää tiedoston sinulle.
Katso lista
griddap-tiedostotyypeistä ja luettelo
tabledap tiedostotyypeistä .
Muut protokollat tietojen pyytämiseen (esim.
WCS
) voidaan lisätä tulevaisuudessa.
ERDDAP on rakennettu näitä lisäyksiä varten, eikä sillä näytä olevan mitään esteitä.
- Ruudukkotietopyyntöjä voidaan tehdä käyttäjäyksiköissä.
Vaikka ERDDAP :n ruudukkotietojen pyyntöjä voidaan tehdä taulukon indekseillä (OPeNDAP määrityksen mukaisesti), pyynnöt voivat olla myös käyttäjäyksiköissä (esimerkiksi asteet itään)
sulkumerkinnällä, koska käyttäjät ajattelevat niissä yksiköissä, ei indekseissä.
- ERDDAP lähettää tulokset yleisissä tiedostomuodoissa.
Tulokset voidaan palauttaa missä tahansa useista yleisistä datatiedostomuodoista (esimerkiksi
HTTP GET
,
XML
,
SOAP+XML
,
OPeNDAP
,
WCS
,
WFS
,
SOS
tai HTML-lomake), pelkän alkuperäisen muodon tai vain OPeNDAP siirtomuodon sijaan (jolla ei ole vakiomuotoista tiedostomuotoa).
Nämä tiedostot luodaan lennossa.
Koska sisäisiä tietorakenteita on vähän, on helppo lisätä muita tiedostotyyppisiä ohjaimia.
Katso täydellinen luettelo
ruudukkotiedostotyypeistä ja
taulukkotiedostotyypeistä .
- ERDDAP standardoi muuttujien nimet ja yksiköt pituusasteelle, leveysasteelle, korkeudelle, syvyydelle ja ajalle tuloksissa.
Eri tietojoukkojen tietojen vertailun helpottamiseksi ERDDAP pyynnöt ja tulokset käyttävät standardoituja tila/aika-akseliyksiköitä:
- pituusaste on aina degrees_east .
- leveysaste on aina degrees_north .
- korkeus on aina metreissä positiivisella = ylös.
- syvyys on aina metreissä plus = alas.
- Numerona muotoiltu aika on aina"seconds since 1970-01-01T00:00:00Z"(tunnetaan nimellä
Unix-aika
tai epooksekuntia, joka onUDUNITS
-yhteensopiva) ja muotoiltuna merkkijonona se on muotoiltu
ISO 8601:2004"extended"-muodon mukaan
standardi (yyyy-MM-ddTHH:mm:ssZ, esimerkiksi "1985-01-02T00:00:00Z"). (Voit muuntaa numeeriset ajat ISO-merkkijonoaikiksi/-ajoiksi ERDDAP :n
aikamuuntimella .) Aikavyöhykkeen ja kesäajan sekaannusten välttämiseksi aika-arvot muunnetaan aina Zulu -aikavyöhykkeeksi (UTC, GMT).
Tämä helpottaa rajoitusten määrittämistä pyyntöihin ilman, että sinun tarvitsee huolehtia korkeustietomuodosta (ovatko positiiviset arvot ylös vai alas?
metreinä tai sylinä?) tai aikatietomuodosta (mahdollisten muotojen painajaismainen maailma, esimerkiksi"Jan"2, 1985", "02-JAN-1985", "1/2/85", "2/1/85", "1985-01-02" tai päiviä 1.
tammikuuta 1980 jälkeen).
Näin eri tietolähteistä saatuja tuloksia on helppo vertailla.
ERDDAP on apuohjelma, jolla
muunnetaan numeerinen aika merkkijonoajaksi/-ajasta .
Lisätietoja on artikkelissa
Miten ERDDAP käsittelee aikaa .
Koska pituus-, leveysaste-, korkeus- ja aikamuuttujat tunnistetaan erityisesti, ERDDAP on tietoinen kunkin tietojoukon maantieteellisistä/aikaisista ominaisuuksista.
Tämä on hyödyllistä, kun teet kuvia karttoja tai aikasarjoja ja tallennat tietoja maantieteellisesti viitattuihin tiedostotyyppeihin (esim.
.esriAscii, .geoJson ja .kml ).
Kaksi yleistä standardia mittayksiköiden kirjoittamiselle ovat:
- UDUNITSxternal link)"title="Tämä linkki ulkoiselle verkkosivustolle ei ole suositus."> -
Unidata
, jota käytetään
COARDS
,
CF
ja
NetCDF
tiedostot.
Esimerkiksi UDUNITS on useita Celsius-astevaihtoehtoja, mukaan lukien degree_C ja degC .
- UCUM
- yhtenäinen mittayksikkökoodi.
OGC
palvelut, kuten
SOS
,
WCS
ja
WMS
viitataan usein UCUM:iin UOM:na (mittayksiköt).
Esimerkiksi UCUM:ssa on vain yksi kirjainkoon erotteluvaihtoehto Celsius-asteille:
"Cel".
Vaikka ERDDAP ei vaadi kummankaan vakioyksikön käyttöä, useimmat ERDDAP asennukset suosivat jompaakumpaa.
(ERDDAP järjestelmänvalvojat:
voit määrittää tämän <units_standard> -tunnisteella setup.xml:ssä.) Voit muuntaa UDUNITS UCUM-yksiköiksi/-yksiköistä ERDDAP :n
yksikkömuuntimella .
Kun pyydät dataa tai kaaviota
tabledap tietojoukosta, voit liittää &units("UDUNITS") tai &units("UCUM") URL-osoitteen loppuun pyytääksesi UDUNITS tai UCUM-yksiköitä.
lisää tietoa
- ERDDAP voi lisätä tai muokata metatietoja.
Monissa tietolähteissä on vähän tai ei ollenkaan
metatietoja
(esimerkiksi
CF-metatiedot
) kuvaavat tiedot.
ERDDAP antaa (ja rohkaisee) järjestelmänvalvojan kuvailemaan metatietoja, jotka lisätään tietokokonaisuuksiin ja niiden muuttujiin lennossa.
Katso
järjestelmänvalvojille tarkoitettujen ohjeiden
AddAttributes -osio .
- ERDDAP avulla voit pyytää .png- ja .pdf-kuvatiedostoja, joissa on kaavioita ja karttoja
tiedoista todellisten tietojen lisäksi.
Ja ERDDAP :n Make A Graph -sovelluksella voit muokata kuvia.
Joitakin näiden kuvien erikoiskäyttöjä ovat:
- Pakattujen tiedostojen pyytäminen
ERDDAP ei tarjoa tuloksia, jotka on tallennettu pakattuihin tiedostoihin (esim.
.zip tai .gzip ), ellei lähdetiedostoa ole jo pakattu.
Sen sijaan ERDDAP etsii
hyväksymiskoodausta
asiakkaan lähettämässä HTTP GET -pyynnön otsikossa.
Jos tuettu pakkaustyyppi (gzip, x-gzip tai deflate ) löytyy hyväksymiskoodausluettelosta, ERDDAP sisällyttää content-encoding HTTP-vastauksen otsikkoon ja pakkaa tiedot lähettäessään sitä.
Asiakasohjelman tehtävänä on etsiä content-encoding ja purkaa tiedot.
Pakatut vastaukset ovat usein 3-10 kertaa nopeampia, vaikka pakattujen .png-tiedostojen pyytämisestä ei ole mitään hyötyä, koska tiedostojen sisältö on jo pakattu.
Selaimet ja OPeNDAP -asiakkaat tekevät tämän oletusarvoisesti.
He pyytävät pakattua tietoa ja purkaa palautetut tiedot automaattisesti.
Muiden asiakkaiden (esim.
Java ohjelmien) on tehtävä tämä erikseen.
Lisää curl komentoriville --compressed, jotta curl pyytää pakattua vastausta ja purkaa sen automaattisesti.
- ERDDAP tekee erityyppiset tietopalvelimet (OPeNDAP, OBIS, SOS, WMS, ...) yhteentoimivia.
Eri tieteellisissä yhteisöissä käytetään erityyppisiä tietopalvelimia.
Lähitulevaisuudessa on epätodennäköistä, että yksikään tyyppi tulee hallitsevaksi ja korvaisi muut.
ERDDAP toimii siis siltana erityyppisten asiakasohjelmien (verkkoselaimet, IDV, Matlab, netCDF-ohjelmat, ODV, WMS asiakkaat jne.) ja erityyppisten tietopalvelimien välillä.
- ERDDAP hyväksyy asiakkaiden tietopyynnöt eri muodoissa (esim.
OPeNDAP, WMS ).
- ERDDAP muuntaa tietyn pyynnön lähdetietopalvelimen käyttämään pyyntömuotoon (esim.
OPeNDAP, SOS, OBIS, ...) ja lähettää sen lähdetietopalvelimelle.
- ERDDAP muuntaa vastaustiedot lähdetietopalvelimelta sisäiseen muotoon, mukaan lukien muuntamalla kaikki aikatiedot yhteiseen muotoon:
"seconds since 1970-01-01T00:00:00Z".
- ERDDAP muuntaa tiedot sisäisestä tiedostomuodosta asiakkaan pyytämään tiedostomuotoon (esim.
.csv, Google Earth .kml, .htmlTable, .dods, .mat, .nc, ODV .txt, .png).
Asiakkaiden ei tarvitse huolehtia lähdetietopalvelimen tyypistä tai tietää siitä.
He vain saavat haluamansa tiedot haluamassaan tiedostomuodossa.
- ERDDAP käyttää vain kahta perustietorakennetta tietojen säilyttämiseen.
- Koska ihmis- ja tietokoneasiakkaiden on vaikea käsitellä monimutkaisia mahdollisia tietojoukkorakenteita, ERDDAP käyttää vain kahta perustietorakennetta:
- Kaikkea dataa ei tietenkään voida ilmaista näissä rakenteissa, mutta suuri osa siitä voi.
Erityisesti taulukot ovat erittäin joustavia tietorakenteita (katsokaa
relaatiotietokannan ilmiömäistä menestystä
ohjelmat).
- Tämä helpottaa tietokyselyjen muodostamista.
- Tämä tekee tietovastauksista yksinkertaisen rakenteen, mikä helpottaa tietojen toimittamista useammissa vakiotiedostotyypeissä (jotka usein tukevat vain yksinkertaisia tietorakenteita).
Tämä on tärkein syy siihen, että ERDDAP on perustettu tällä tavalla.
- Tämä puolestaan tekee meidän (tai kenen tahansa) erittäin helpoksi kirjoittaa asiakasohjelmistoa, joka toimii kaikkien ERDDAP tietosarjojen kanssa.
- Tämä helpottaa eri lähteistä saatujen tietojen vertaamista esimerkiksi Integrated Ecosystem Analysis (IEA) -analyysiin.
- Tiedämme hyvin, että jos olet tottunut työskentelemään muiden tietorakenteiden tietojen kanssa, saatat aluksi ajatella, että tämä lähestymistapa on yksinkertaistettu tai riittämätön.
Mutta kaikilla tietorakenteilla on kompromisseja.
Mikään ei ole täydellinen.
Jopa tee-se-all-rakenteilla on huonot puolensa:
niiden kanssa työskentely on monimutkaista ja tiedostot voidaan kirjoittaa tai lukea vain erityisillä ohjelmistokirjastoilla.
Jos hyväksyt ERDDAP :n lähestymistavan tarpeeksi yrittääksesi työskennellä sen kanssa, saatat huomata, että sillä on etunsa (erityisesti tuki useille tiedostotyypeille, jotka voivat sisältää datavastaukset).
Alkuperäinen ERDDAP -diaesitys (erityisesti
tietorakennedia) puhuu näistä asioista.
- Ja vaikka tämä lähestymistapa kuulostaakin sinusta oudolta, useimmat ERDDAP -asiakkaat eivät koskaan huomaa – he yksinkertaisesti näkevät, että kaikilla tietojoukoilla on mukava yksinkertainen rakenne, ja he ovat kiitollisia, että he voivat saada tietoja useista eri lähteistä.
laaja valikoima tiedostomuotoja.
- ERDDAP tarjoaa
sähköpostin/URL-osoitteen ja
RSS
tilauspalvelut, joten saat ilmoituksen aina, kun tietojoukko muuttuu.
- ERDDAP on erittäin hyvä havaitsemaan muutoksia ruudukkotietosarjoihin, koska se voi havaita milloin akseliarvot (esim.
aika-arvot) muuttuvat.
- ERDDAP ei ole kovin hyvä havaitsemaan muutoksia taulukkotietosarjoihin, koska metatietoihin ei yleensä tapahdu muutoksia, kun uusia tietoja lisätään.
- ERDDAP havaitsee, jos tietojoukko ei ole käytettävissä (mutta ei ehkä heti).
- ERDDAP havaitsee, milloin tietojoukko tulee jälleen saataville.
- ERDDAP ei lupaa näiden palvelujen soveltuvuutta tai tarkkuutta (katso
ERDDAP :n VASTUUVAPAUSLAUSEKKEET).
Sähköposti-/URL- tilaukset (ei saatavilla joissakin ERDDAP asennuksissa) Aina kun tietojoukko muuttuu, sähköposti-/URL-tilausjärjestelmä lähettää sinulle välittömästi sähköpostin tai ottaa yhteyttä määrittämääsi URL-osoitteeseen.
Sähköposti-/URL-tilaukset eivät ole saatavilla joissakin ERDDAP asennuksissa.
Voit määrittää sähköposti-/URL-tilauksen napsauttamalla yhtä kirjekuoren kuvakkeista
jotka näkyvät oikeassa reunassa ERDDAP -verkkosivuilla tietojoukkojen luetteloineen (esimerkki) ja Data Access Forms - ja Make A Graph -verkkosivuilla yksittäisille tietojoukoille (esimerkki), jos tämä ERDDAP asennus tukee sähköposti-/URL-tilauksia.
(Tietokoneohjelmoijat:
jos kirjoitat verkkopalveluita, voit URL-järjestelmän avulla saada ERDDAP ilmoittamaan verkkopalvelullesi välittömästi aina, kun tietojoukko muuttuu.)
RSS
Tilaukset RSS on vakiojärjestelmä, joka ilmoittaa käyttäjille, kun verkkosivuston sisältö on muuttunut.
Nykyaikaisissa verkkoselaimissa on sisäänrakennettu RSS asiakas tai voit käyttää erillistä
RSS lukijaa
.
ERDDAP tarjoaa jokaiselle tietojoukolle erillisen RSS 2.01 -syötteen, jotta saat selville, milloin kiinnostavat aineistot ovat muuttuneet.
Voit tilata tietojoukon RSS syötteen napsauttamalla yhtä RSS kuvakkeista
jotka näkyvät oikeassa reunassa ERDDAP -verkkosivuilla tietojoukkojen luetteloineen (esimerkki) tai yksittäisten tietojoukkojen Data Access Forms- ja Make A Graph -verkkosivuilla (esimerkki).
Vertailu RSS palvelu voi olla juuri sitä mitä etsit.
Se on mukava standardi.
Mutta jos sinun on tiedettävä mahdollisimman pian, kun tietojoukko muuttuu, käytä sähköposti-/URL-järjestelmää RSS :n sijaan.
RSS asiakkaat ajoittain (tunnin välein?) pyytävät ja lukevat RSS XML -dokumentin etsiäkseen muutoksia.
Joten yleensä RSS asiakasohjelma ei havaitse tietojoukon muutosta nopeasti (keskimäärin 30 minuutissa?).
Sen sijaan sähköposti-/URL-tilausjärjestelmä toimii välittömästi aina, kun ERDDAP havaitsee muutoksen tietojoukossa.
Sähköposti-/URL-järjestelmän ennakoivampi lähestymistapa on myös paljon tehokkaampi:
Voit ehkä asettaa RSS asiakasohjelmasi tarkistamaan muutokset minuutin välein (älä tee sitä!), mutta se johtaisi vain moniin tarpeellisiin pyyntöihin.
ERDDAP -palvelimelle, eikä se silti havaitse muutoksia välittömästi.
- ERDDAP on
verkkosovellus
(verkkosivut, joissa on lomakkeita selaimia käyttäville ihmisille)
ja
verkkopalvelu
(tietokoneohjelmien palveluilla).
Itse asiassa ERDDAP :n web-sivuilla olevat lomakkeet vain luovat erityisesti muotoiltuja URL-osoitteita, jotka lähetetään sitten ERDDAP :n verkkopalveluihin.
- ERDDAP on
REST
- ja
ROA
-tyylisiä linkkejä, jotka tuovat palvelunsa tietokoneohjelmien saataville.
Näiden ominaisuuksien avulla voidaan rakentaa toinen verkkopalvelu ERDDAP päälle (jolla ERDDAP tekee kaiken työn!).
ERDDAP ei ole tarkoitettu korkean tason tiedonhaku-/grafiikkapalveluksi.
Sen sijaan ERDDAP on tarkoitettu tarjoamaan palveluita tällaisille verkkosivustoille ja ohjelmille.
Joten jos sinulla on idea paremmasta käyttöliittymästä ERDDAP n palvelemiin tietoihin, suosittelemme rakentamaan oman verkkosovelluksesi tai verkkopalvelusi ja käyttämään ERDDAP perustana.
Lue lisää ERDDAP :n
tietokoneohjelmien palveluista .
- Suojaus - Oletusarvoisesti ERDDAP toimii täysin julkisena palvelimena ilman kirjautumisjärjestelmää tai rajoituksia tietojen käyttöön.
ERDDAP järjestelmänvalvoja voi kuitenkin määrittää ERDDAP rajoittamaan pääsyn joihinkin tai kaikkiin tietojoukkoihin kirjautuville käyttäjille, joille on määritetty tietyt roolit.
ERDDAP ssa on sisäänrakennetut todennusmenetelmät (sisäänkirjautuminen).
Jos ERDDAP asennuksessa on todennus käytössä, jokaisen verkkosivun yläosassa on"kirjaudu sisään"-linkki.
Käyttäjien ei koskaan tarvitse kirjautua sisään päästäkseen julkisesti saatavilla oleviin tietokokonaisuuksiin.
Käyttäjät, jotka ovat kirjautuneet sisään, voivat käyttää julkisia tietojoukkoja ja yksityisiä tietojoukkoja, joihin heillä on pääsy.
Käyttäjien on käytettävä https::tä (Secure Sockets Layer) kirjautuakseen sisään ja käyttääkseen yksityisiä tietojoukkoja.
Tietojoukot voidaan määrittää siten, että kaaviot ja kartat ovat julkisesti saatavilla, mutta tiedot ovat vain valtuutettujen käyttäjien käytettävissä.
(lisää tietoa)
- ERDDAP käsittelee tiedot paloina.
Säästääkseen muistia (iso ongelma) ja saadakseen vastaukset alkamaan nopeammin ERDDAP käsittelee tietopyynnöt paloina – saa toistuvasti osan dataa lähteestä ja puhdistaa sen (esimerkiksi lisäämällä
metatietoja
) ja lähettää sen asiakkaalle.
Monissa tietolähteissä tämä tarkoittaa, että ensimmäinen datapala (esimerkiksi ensimmäiseltä anturilta) saapuu asiakkaalle sekunneissa minuuttien sijaan (esimerkiksi sen jälkeen, kun tiedot viimeisestä anturista on haettu), mikä vakuuttaa asiakkaalle, että dataa tulee.
Muistin näkökulmasta tämä mahdollistaa useiden suurten pyyntöjen (jokainen suurempi kuin käytettävissä oleva muisti) käsittelyn samanaikaisesti.
- ERDDAP on modulaarinen rakenne.
ERDDAP on rakennettu niin, että siihen on helppo lisätä erilaisia komponentteja (esimerkiksi luokka, joka pyytää tietoja SOS palvelimelta ja tallentaa ne taulukkona).
Uusi komponentti saa sitten kaikki emon ominaisuudet ja ominaisuudet (esimerkiksi OPeNDAP pyyntöjen tuen ja mahdollisuuden tallentaa tiedot useisiin yleisiin tiedostomuotoihin).
- Tiedon levitys / tiedonjakeluverkot:
Push and Pull -tekniikka
Normaalisti ERDDAP toimii välittäjänä:
se ottaa pyynnön käyttäjältä; saa tietoja etätietolähteestä; alustaa tiedot uudelleen; ja lähettää sen käyttäjälle.
Pull
:
Mutta ERDDAP on myös mahdollisuus saada aktiivisesti kaikki saatavilla oleva data etätietolähteestä ja
tallentaa tiedoista paikallinen kopio .
Push -tekniikka
:
ERDDAP :n
tilauspalveluita käyttämällä voidaan ilmoittaa muille tietopalvelimille heti, kun uutta tietoa on saatavilla, jotta ne voivat pyytää tietoja (vetämällä tiedot).
ERDDAP :n
EDDGrid FromErddap ja
EDDTableFromErddap käyttävät ERDDAP :n tilauspalveluita ja
lippujärjestelmää niin, että niille ilmoitetaan välittömästi, kun uutta tietoa on saatavilla.
Voit yhdistää nämä suureen tehoon:
jos käärit EDDGrid kopion EDDGrid FromErddap -tietojoukon ympärille (tai käärit EDDTableCopyn EDDTableFromErddap-tietojoukon ympärille), ERDDAP luo automaattisesti paikallisen kopion toisen ERDDAP :n tietojoukosta ja ylläpitää sitä.
Koska tilauspalvelut toimivat heti, kun uutta tietoa on saatavilla, push-tekniikka levittää tiedot erittäin nopeasti (sekunneissa).
Tämä arkkitehtuuri asettaa jokaisen ERDDAP järjestelmänvalvojan vastuulle sen määrittämisestä, mistä hänen ERDDAP tietonsa ovat peräisin.
Muut ERDDAP järjestelmänvalvojat voivat tehdä saman.
Ylläpitäjien välistä koordinointia ei tarvita.
Jos monet ERDDAP järjestelmänvalvojat linkittävät toistensa ERDDAP :iin, muodostuu tiedonjakeluverkko.
Tiedot levitetään nopeasti, tehokkaasti ja automaattisesti tietolähteistä (ERDDAP :t ja muut palvelimet) tiedonjakosivustoille (ERDDAP ) kaikkialla verkossa.
Tietty ERDDAP voi olla sekä tietolähde joillekin tietojoukoille että uudelleenjakopaikka muille tietojoukoille.
Tuloksena oleva verkko on suunnilleen samanlainen kuin tiedonjakeluverkot, jotka on perustettu
Unidata IDD/IDM:n kaltaisilla ohjelmilla
, mutta vähemmän jäykkä.
DAP ?
OPeNDAP ?
DODS ?
ERDDAP ?
Mitä eroa? Minun (Bobin) käsitykseni on:
DODS (Distributed Oceanographic Data System) luotiin 1990-luvulla, ennen kuin http:
(!) oli olemassa.
DODS järjestelmä loi ja käytti dods:
protokollaa Internetissä.
Kun HTTP tuli ja menestyi niin hyvin, he vaihtoivat dods::stä http::ään.
Jossain vaiheessa he ymmärsivät, että järjestelmä oli hyödyllinen muullekin kuin vain valtameren tiedoille.
Joten he luopuivat tuosta DODS nimestä (vaikka se elää jossain koodissa), muodostivat pienen organisaation nimeltä
OPeNDAP
ja kirjoitti
DAP (Data Access Protocol) -määrityksen
, joka standardoi metatieto- ja/tai datapyyntöjen muodon ja vastaukset metadatan ja/tai datan kanssa.
OPeNDAP (organisaatio) paimene edelleen DAP (spesifikaatiota) ja on Hyrax (tietopalvelin, jota usein kutsutaan virheellisesti OPeNDAP :ksi) kirjoittaja.
Hyrax, THREDDS, GRADS, ERDDAP ja muut ovat tietopalvelimia (ohjelmistoja), jotka toteuttavat DAP .
Ne kumpikin toteuttavat DAP :n osajoukon, mutta tekevät muita asioita hyvin eri tavalla.
ERDDAP käyttää koodia ("dods"-hakemistossa) (todellisuudessa Jake Hamby NASA JPL:ssä) joidenkin ominaisuuksien lukemiseen ulkoisista DAP palvelimista.
ERDDAP käyttää omaa koodiaan DAP vastausten kirjoittamiseen.
Onko ERDDAP ratkaisu kaikkien tiedonjakelun/tietojen käyttöongelmiin?
Ei.
ERDDAP yrittää löytää hyvän paikan, joka on todella hyvä ratkaisu useimpiin kohtaamiimme tiedonjakeluongelmiin.
ERDDAP käyttää väliohjelmistolähestymistapaa:
Se voi saada tietoja useista erityyppisistä etätietopalvelimista ja antaa ne asiakkaille monissa eri tiedostomuodoissa.
Se on suunniteltu agnostiseksi ratkaisuksi, joka pyrkii tekemään muista tietopalvelimista (OPeNDAP, SOS, OBIS, WMS, ...) yhteentoimivia.
Onko olemassa yhtä täydellistä datapalvelinta, joka vastaa täydellisesti kaikkien tarpeisiin?
Emme usko niin.
Ja vaikka luulet, että on tai tulee olemaan, kestää kauan ennen kuin kaikki siirtyvät siihen, jos koskaan.
Siihen asti ERDDAP on käytettävissä juuri nyt, jotta muut tietopalvelimet saadaan yhteentoimiviksi ja palvelemaan tietoja juuri nyt.
ERDDAP voi käsitellä monia/useimpia tietojoukkoja sellaisenaan, mutta ei kaikkia. Kyse ei ole siitä, että loput tietojoukot (esim.
mallidata käyttäen kuutioitua palloprojektiota) eivät olisi tärkeitä.
ERDDAP :n tavoite palauttaa tiedot yleisissä tiedostomuodoissa (joista osa on melko yksinkertaisia) estää monimutkaisemman sisäisen tietorakenteen.
Monimutkaisempien tietorakenteiden parissa työskentelevillä tutkijaryhmillä on usein jo valmiiksi erikoistuneet tietopalvelimet ja erikoistuneet asiakasohjelmistot, jotka on räätälöity yhteisön tarpeisiin.
ERDDAP ei yleiskäyttöisenä tietopalvelimena yritä kilpailla näiden erikoistuneiden tietopalvelimien kanssa.
He ovat räätälöityjä yhteisönsä tarpeisiin ja tekevät hyvää työtä.
Kuitenkin usein vain kyseisen yhteisön erikoisohjelmistot"ymmärtävät"nämä tietojoukot.
Monimutkaisten tietojoukkojen ratkaisu – ERDDAP lla on tapa käsitellä monimutkaisia tietojoukkoja, joita se ei pysty käsittelemään suoraan.
Aivan kuin
relaatiotietokanta
voi tallentaa monimutkaisen tietojoukon käyttämällä vain yhtä yksinkertaista tietorakennetta (taulukkoa), ERDDAP voi palvella dataa monimutkaisemmista tietojoukoista jakamalla lähdetietojoukon muutamaksi ERDDAP -tietojoukoksi, joista jokaisella on samanlainen, yksinkertainen tietorakenne.
Esimerkiksi jotkin ruudukkopohjaiset ympäristömallitietojoukot voidaan tallentaa ERDDAP :hen laittamalla merenpinnan muuttujat ([aika][leveysaste][pituusaste]) yhteen ERDDAP -tietojoukkoon ja sijoittamalla muuttujat korkeudella ([aika][korkeus][ leveysaste][pituusaste]) toisessa ERDDAP tietojoukossa.
Tiedämme, että tämä ei ole ihanteellinen, mutta on välttämätöntä sallia ERDDAP palauttaa tiedot yleisissä tiedostomuodoissa (joista jotkin ovat melko yksinkertaisia).
Toinen tapa käsitellä monimutkaisia tietojoukkoja (esim.
mallidatalle kuutioitua palloprojektiota käyttäen) on myös tarjota datajoukosta uudelleen projisoitu versio ([aika][korkeus][leveysaste][pituusaste]), jonka kanssa ERDDAP voi työskennellä helposti.
Näitä yksinkertaisempia tietorakenteita ei ole tarkoitettu korvaamaan alkuperäisiä tietorakenteita, mutta ne voivat olla hyödyllinen tapa jakaa dataa laajemmalle yleisölle.
Kuinka kestävä ERDDAP -projekti on?
ERDDAP on erittäin kestävä.
Jotkut ihmiset ovat yllättyneitä ja pettyneitä kuullessaan, että ERDDAP on enimmäkseen kehittänyt yksi henkilö (oli Bob Simons, nyt Chris John).
[Muuten, tällä verkkosivulla olevat mielipiteet ovat henkilökohtaisia mielipiteitäni eivätkä välttämättä heijasta hallituksen tai National Oceanic and Atmospheric Administration kantaa.] He pelkäävät, että jos minulle tapahtuu jotain, se on ERDDAP n loppu.
Se ei yksinkertaisesti ole totta.
ERDDAP :n sijoittuminen pitkän aikavälin kestävyyteen on erinomainen ja lähellä parasta mitä se voi olla.
Kyllä, olen ERDDAP :n pääkehittäjä.
Olen täysin rahoitettu liittovaltion työntekijä.
Rahoitukseni ei ole"pehmeää"rahaa, joten en saa apurahoja tai luota niihin.
Käytän yli puolet ajastani ERDDAP kehittämiseen.
Loput ajastani kuluu tietojoukkojen hallintaan.
Tämä työ on hyödyllinen ERDDAP lle, koska minun on työskenneltävä oikeiden tietojoukkojen kanssa tietääkseni yksityiskohtaisesti, mitä ERDDAP on tehtävä.
Esimieheni tukevat täysin työtäni ERDDAP n parissa, koska se tekee sen, mihin minut palkattiin:
helpottaa kalastuksen tutkijoiden (ensisijaisesti, mutta todella kaikkien) tieteellisen tiedon saamista eri lähteistä.
Ohjelmiston ihmeellinen asia on, että sen kopioiminen ei maksa mitään. Joten tehdäkseni työtäni kirjoitan ERDDAP käytettäväksi ERD ssä.
Se on mielestäni paras tapa tehdä työtäni.
Pelkästään tämä syy oikeuttaa ERDDAP kehittämiskustannukset.
(Luulen, että voitaisiin osoittaa, että ERDDAP on säästänyt enemmän NOAA -tutkijan aikaa kuin mitä olen käyttänyt ERDDAP kehittämiseen .
Aika=rahaa.) Mutta sivuetu on, että mikä tahansa muu organisaatio voi
ladata, asentaa ja käyttää ERDDAP ilmaiseksi jakaakseen omia tietojaan.
tieteellistä tietoa.
Yli 90 organisaatiota vähintään 14 maassa käyttää ERDDAP :ta.
Ehkä on olemassa sellainen asia kuin ilmainen lounas.
ERDDAP on Java ohjelma.
Jokaisen version lähdekoodi on
GitHubissa
, yleisimmin käytetty järjestelmä yhteistyöohjelmistoprojekteihin.
Krediitit ERDDAP pisteet ovat nyt saatavilla
erillisellä sivulla .
Toivon, että muut lisäävät koodia tulevaisuudessa.
Jos minulle tapahtuu jotain, esimieheni palkkaavat sijaisen, jolla on tietty tavoite, että hän jatkaa ERDDAP n kehittämistä.
Lisäksi yritän kirjoittaa erittäin puhdasta koodia.
Kirjoitan Java Doc -kommentteja.
Kirjoitan kommentteja koodiin.
Valitsin muuttujien nimet huolellisesti.
Noudatan Java muotoiluohjeita.
Kaikki tämä on yritystä tehdä koodista luettavampi muille ohjelmoijille, jotka haluavat ymmärtää ja/tai muuttaa sitä, ja minulle, koska vuoden tai kahden kuluttua olen unohtanut yksityiskohdat siitä, miten ja miksi koodi oli kirjoitettu niin kuin se oli.
Puhdas koodi hyvillä kommenteilla helpottaa jatkuvaa ERDDAP työtäni, joten minulla on suuri kannustin kirjoittaa puhdasta koodia hyvillä kommenteilla.
Mutta kaikki vastaukseni tähän mennessä eivät ole kovin tärkeitä. Vain yksi asia on todella tärkeä.
Vain yksi asia takaa ERDDAP tai minkä tahansa ohjelmistoprojektin kestävyyden:
että ERDDAP on
ilmainen ja avoimen lähdekoodin ohjelmisto (FOSS)
.
Erityisesti ERDDAP käyttää
Apache-yhteensopivia ohjelmistolisenssejä
, joten kuka tahansa voi tehdä koodilla mitä haluaa.
Miksi se on tärkeää?
Voisi ajatella, että ohjelmistot ovat tulevaisuudessa luotettavasti saatavilla, koska sen takana on iso yritys.
Mutta esimerkiksi Google on keskeyttänyt useita projekteja (tässä on luettelo
).
En halua valita Googlea, koska pidän todella Googlesta ja se rahoittaa monia hienoja avoimen lähdekoodin projekteja.
Microsoft on keskeyttänyt projekteja.
Apple on keskeyttänyt projekteja.
...
Asia on siinä, että pelkkä suuren yrityksen tuki ei takaa hankkeen jatkumista.
Ohjelmiston käyttäjät eivät ole onnekkaita, ellei ohjelmisto ollut (ja siksi on aina) ilmainen ja avoimen lähdekoodin ohjelmisto (FOSS).
Sitten aina, kun yksikin kehittäjä on kiinnostunut, projekti voi kehittyä ja kehittyy edelleen.
FOSS on vakuutus.
Itse asiassa FOSS on ainoa vakuutus, ainoa vakuutus, jolla on merkitystä.
FOSS varmistaa, että ohjelmistolla on aina tie eteenpäin.
Se on oikeus, jota kukaan ei voi koskaan ottaa pois.
Voidaan myös ajatella, että ohjelmistot, joissa on suuri kehittäjätiimi, ovat kestävämpiä kuin ohjelmistot, joissa on yksi pääkehittäjä.
Mutta monet kehittäjät tarvitsevat yleensä paljon rahoitusta.
Tiedän kuuluisan, kohtuullisen suuren projektin, jossa on 10 kehittäjää (en nolaa heitä nimeämällä heitä), joka on jatkuvassa vakavassa vaarassa keskeyttää projektin, koska heillä ei ole tarpeeksi rahoitusta.
He luottavat avustuksiin.
Heillä on aina vaje.
Heidän suojelijansa on aina pelastanut heidät viime hetkellä, mutta on todella kyllästynyt heidän pelastamiseen.
Joten jos he eivät pysty keräämään miljoonaa dollaria vuodessa apuraharahoja (tai suojelija kyllästyy liian pelastamaan heitä), he lopettavat.
Ja ryhmä ei voi kuvitella, että sillä olisi alle 10 kehittäjää.
Jokaisella kehittäjällä on oma roolinsa ryhmässään.
Tämän valossa minusta näyttää olevan hieno merkki siitä, että vain yksi pääkehittäjä (joka on täysin rahoitettu) voi kehittää ja kehittää aktiivisesti ERDDAP :tä muutaman muun epävirallisella avustuksella.
Jos tosiasia, se olisi huono merkki, jos ERDDAP vaatisi useita kehittäjiä.
Se, että ERDDAP lla on vain yksi pääkehittäjä, tarkoittaa, että se ei ole valtava tehtävä, joka vaatii massiivista jatkuvaa rahoitusta; se on suhteellisen pieni tehtävä, joka vaatii vain vähän vaivaa ja rahoitusta.
Se on kestävämpää, ei vähemmän.
Voisi ajatella, että sopimusyrityksen palkkaaminen ohjelmistojen kirjoittamiseen on hyvä idea. Maksua vastaan he tarjoavat kehittäjille ja lupaavat jatkuvuuden (mikä on hyvä, elleivät / kunnes he lopettavat toimintansa).
Mutta heillä on myös tynnyri:
sinun on maksettava heille mitä he pyytävät, tai kehitystä ei enää tehdä, ellei ohjelmisto ole FOSS ja maksat heille vain koodin työstämisestä.
FOSS:n avulla sinulla on aina valinnanvaraa siitä, miten edetä.
Koska ERDDAP on FOSS, urakoitsijat ovat aina hyvä vaihtoehto sinulle tai kenelle tahansa ERDDAP n suhteen:
jos minulle (yksi pääkehittäjälle) tapahtuu jotain tai jos minulla ei ole aikaa tehdä jotain haluamaasi muutosta, tai minä jää eläkkeelle ja et pidä sijaiseni työstä, voit aina palkata urakoitsijan tekemään haluamasi muutokset (tai tehdä ne itse).
Yhteenvetona voidaan todeta, että ERDDAP on kaksi tärkeintä kestävän kehityksen ominaisuutta:
- ERDDAP on pieni projekti (tarpeeksi pieni yhden pääkehittäjän hoitamaan muutaman muun epävirallisen avun kanssa), joten se ei vaadi valtavia resursseja.
- ERDDAP on ilmainen ja avoimen lähdekoodin ohjelmisto, joten kukaan ei voi koskaan estää sinua tai ketään muuta työskentelemästä ERDDAP parissa.
En voi kuvitella parempaa tilannetta.
Toivon, että se helpottaa sinua (tai kenenkään muun) ERDDAP :n kestävyyttä koskevia pelkoja.
Jos kuulet ihmisten kyseenalaisen tai estävän ERDDAP n käyttöä, koska siellä on vain yksi pääkehittäjä, opastaa heidät yllä olevaan keskusteluun tässä URL-osoitteessa:
https://coastwatch.pfeg.noaa.gov/erddap/information.
html#kestävä .
Tietojoukon lainaaminen paperissa
On tärkeää kertoa lukijoille, miten olet saanut paperissasi käyttämäsi tiedot.
Katso jokaisen käyttämäsi tietojoukon metatiedot .html-sivun alareunassa olevasta Dataset Attribute Structure -osiosta, esim.
https://coastwatch.pfeg.noaa.gov/erddap/griddap/jplMU RSS T41.html .
Metatiedot sisältävät joskus vaaditun tai ehdotetun lainausmuodon tietojoukolle.
"Lisenssi"-metatiedoissa luetellaan joskus tietojen käyttöä koskevia rajoituksia.
Luodaksesi sitaatti tietojoukolle:
Jos pidät tietojoukkoa tieteellisenä artikkelina, voit luoda lainauksen tekijän (katso"creator_name"tai"institution"metatiedot), tietojen latauspäivämäärän, otsikon (katso"title"-metatiedot) perusteella.
) ja julkaisija (katso"julkaisijan_nimi"-metatiedot).
Jos mahdollista, liitä mukaan tiedot lataamiseen käytetyt URL-osoitteet.
Jos tietojoukon metatiedot sisältävät
digitaalisen objektitunnisteen (DOI )
, sisällytä se luomaasi lainaukseen.
Kuinka lainata ERDDAP tä paperissa
Jos haluat lainata itse ERDDAP tieteellisessä artikkelissa, käytä jotain vastaavaa
Simons, RA ja Chris John.
2022.
ERDDAP .
https://coastwatch.pfeg.noaa.gov/erddap.
Monterey, CA:
NOAA / NMFS / SWFSC / ERD .
Mitä lyhenne" ERDDAP "tarkoittaa?
" ERDDAP "oli aiemmin lyhenne, mutta se kasvoi alkuperäisen kuvauksen ulkopuolelle.
Ajattele sitä nyt vain nimenä, ei lyhenteenä.
Tiedonjakelujärjestelmiä koskevat ohjeet
Bobin mielipiteet tiedonjakelujärjestelmien suunnittelusta ja arvioinnista löytyvät
täältä .
Voit
perustaa oman ERDDAP palvelimen ja palvella omia tietojasi.
- Pieni vaiva ERDDAP perustamiseksi tuo monia etuja.
- Jos sinulla on jo verkkopalvelu tietojesi jakeluun, voit määrittää ERDDAP käyttämään tietojasi olemassa olevan palvelun tai lähdetiedostojen tai tietokannan kautta.
Tämän jälkeen ihmisillä on toinen tapa päästä käsiksi tietoihisi ja he voivat ladata tiedot muissa tiedostomuodoissa tai kaavioina tai karttoina.
- Jos sinulla on paljon kysyttyjä tietojoukkoja, voit asentaa
useita ERDDAP -tiedostoja, jotka toimivat yhdessä skaalautuakseen ja vastatakseen suuren tiedonjakelukeskuksen tarpeisiin.
Jos sinulla on kysymyksiä, ehdotuksia tai kommentteja ERDDAP stä yleensä (ei tästä tietystä ERDDAP asennuksesta), lähetä sähköpostia osoitteeseen
erd dot data at noaa dot gov ja liitä mukaan ERDDAP URL-osoite, joka liittyy suoraan kysymykseesi tai kommenttiisi.
Tai voit liittyä ERDDAP Google-ryhmään/postituslistaan käymällä osoitteessa
https://groups.google.com/forum/#!forum/erddap 
ja klikkaa"Hae jäsenyyttä".
Kun olet jäsen, voit lähettää kysymyksesi sinne tai etsiä, onko kysymys jo esitetty ja siihen on vastattu.
VASTUUVAPAUSLAUSEKE:
Tällä verkkosivulla olevat mielipiteet ovat Bob Simonsin henkilökohtaisia mielipiteitä, eivätkä ne välttämättä heijasta hallituksen tai National Oceanic and Atmospheric Administration kantaa.