Hantering av geografiska data


(utdrag ur Delin, 2000)

Filtrering av data

I vissa fall kan rådata från en provtagning delvis bestå av mätvärden som till följd av mätfel är direkt felaktiga. Vid skördekartering registreras skördemängder som är lika med noll i början av ett kördrag, eftersom kärnorna ännu inte nått fram till mätutrustningen. Låga skördevärden registreras också om man inte kör med full skärbordsvidd. Felaktiga data bör filtreras bort innan man fortsätter sin geografiska analys. Detta kan till stor del göras genom en rutinmässig databearbetningsprocedur. Man kan t.ex. filtrera bort orimligt höga eller låga värden eller ta bort de första observationerna i varje kördrag (se figuren nedan).

Överst är två ofiltrerade kartor, dels med faktiska mätpunkter och dels med interpolerade värden. Under har data filtrerats. Exemplet visar effekten av tegkörning och kördrag på de övre kartorna där skärbordsvidden inte varit fullt utnyttjad. Efter filtrering av data (under) blir resultatet mycket jämnare.
Överst är två ofiltrerade kartor, dels med faktiska mätpunkter och dels med interpolerade värden. Under har data filtrerats. Exemplet visar effekten av tegkörning och kördrag på de övre kartorna där skärbordsvidden inte varit fullt utnyttjad. Efter filtrering av data (under) blir resultatet mycket jämnare.
Kontinuerliga ytor från punktdata
Nästan all information vi skaffar oss från ett fält genom diverse provtagningar är information om punkter. Men ofta är man intresserad av information kontinuerligt över ytan. Punktdata kan användas för att uppskatta variationen över ytan.

Interpolering
Interpolering är en metod att mellan provpunkter skatta värden på platser som inte är provtagna och på så sätt omvandla data från punktobservationer till kontinuerliga ytor. Beräkning av värden på platser utanför det provtagna området benämns extrapolering. Det finns flera metoder att interpolera mellan mätpunkter, vilket beskrivs nedan:

Närmaste granne
En enkel interpoleringsmetod är att ge varje okänd punkt samma värde som närmast belägna kända punkt. Om mätpunkterna är oregelbundet spridda innebär detta att fältet kommer delas upp i homogena polygoner av olika storlek och form. (Figur 6a). Övergångarna blir skarpa, och det uppskattade värdet i en viss punkt avgörs endast av det värde som uppmätts i den punkt som råkar ligga närmast. Denna metod är enkel, men i de flesta fall inte den lämpligaste för variabler som förändras gradvis över ytan. Om det gäller kvalitativa data som jordartsklass är det svårt att interpolera, och då kan närmaste granne vara den bästa metoden. Men kvalitativa data används sällan i precisionsodlingssammanhang.

Invers distans
Interpolering med invers distans (Figur 6b) ger gradvisa förändringar över ytan. Vid varje punkt beräknas ett medelvärde för omkringliggande punkter och varvid s.k. viktning görs så att närmre belägna punkter får större betydelse än punkter som ligger längre bort. Varje provtagningspunkt får viktningsfaktorn 1/avståndetr, där r avser sökradien som motsvarar avståndet till de mest avlägset belägna punkterna som beaktas. Viktningsfaktorn anger hur stor vikt observationen får i det beräknade medelvärdet. Exponenten r kan ha olika värden. Ju mer man vill framhäva nära belägna punkter, desto högre exponent väljs. Vanligt är att r = 2. Oftast vill man inte inkludera alla observationer från fältet när man beräknar ett nytt värde i en punkt. Man anger därför en sökradie. Punkter utanför sökradien exkluderas.

Invers distans är en enkel metod som är vanlig inom precisionsodling vid framställning av både skördekartor och markkartor. Ofta är det fullt tillräckligt att använda denna metod, särskilt om man har gjort täta observationer. Men för att veta om och hur variationerna är

rumsligt korrelerade, så att interpoleringen kan utföras på bästa sätt, bör man helst först analysera sina data geostatistiskt. För geostatistiska beräkningar och interpoleringsmetoder (kriging m.fl.) finns speciella datorprogram att tillgå. Men då detta är både tidskrävande och kunskapskrävande är det normalt rimligt att nöja sig med vanliga kartprogram som begränsar sig till att interpolera med invers distans.

Kriging
Om en variabel (exempelvis pH) i en punkt sannolikt är mer lik värdet av samma variabel i en närliggande punkt finns det ett rumsligt samband. Detta rumsliga samband kan beräknas med hjälp av geostatistik och användas vid interpolering. För att uppskatta värden av en variabel på punkter, där inga observationer gjorts, kan den geostatistiska interpoleringsmetoden kriging användas (figur 6c). Kriging är liksom invers distans en metod med vilken man viktar omkringliggande värden till ett medelvärde. Med kriging görs dock en optimal beräkning, eftersom det framräknade värdet i krigingprocessen är det mest sannolika som kan göras utifrån de tillgängliga mätvärdena. Det finns olika typer av kriging. I punktkriging uppskattar man värdet i en punkt, medan man i blockkriging uppskattar medelvärdet i ett område av en viss storlek runt punkten. Mer vikt ges åt en mätpunkt nära den punkt där uppskattning ska beräknas. Om flera punkter är grupperade tätt tillsammans ges mindre vikt till varje enskild mätpunkt. På så vis blir det de punkter som ligger närmast i varje riktning som påverkar uppskattningen. Om sambandet ser olika ut i skilda riktningar, kan man ta hänsyn till detta vid kriging.

En fördel med kriging framför invers distans är att hänsyn tas till mätpunkternas konfiguration, så att inte tätt provtagna områden får större vikt. En annan fördel är att man har möjlighet att ta hänsyn till om det geografiska sambandet varierar i olika riktningar. Dessutom får man en mer välgrundad viktning av data med avseende på avstånd. Nackdelen med kriging är att den kräver mer arbete, kunskap och relativt avancerade datorprogram. I fall där man har tätt mellan provtagningspunkterna och jämn spridning på dem finns inte så mycket att tjäna på krging jämfört med invers distans.

Interpolering med stödvariabel
Om man har glest med data av en variabel (exempelvis lerhalt), men tätare med data av en annan variabel (stödvariabel; exempelvis konduktivitet) som varierar enligt samma mönster, finns det olika metoder för interpolering där stödvariabelns värde kan inkluderas i beräkningen, vilket kan göra att den resulterande kartbilden blir mer exakt. Ett exempel på en sådan metod är cokriging (figur 6d). Då styrs interpoleringen av både observationerna och variationen av stödvariabeln.

Lerhaltskartor framställda med olika interpoleringsmetoder (a, b, c) på basis av ett dataset med 20 provpunkter analyserade med avseende på lerhalt, samt med cokriging (d) varvid ca 480 punkter med bestämning av elektriskt ledningstal har använts.
Lerhaltskartor framställda med olika interpoleringsmetoder (a, b, c) på basis av ett dataset med 20 provpunkter analyserade med avseende på lerhalt, samt med cokriging (d) varvid ca 480 punkter med bestämning av elektriskt ledningstal har använts
Klassificering
Vid klassificering delas fältet in i olika områden med avseende på klasser. Detta kan göras av olika anledningar. Om fältet har abrupta gränser mellan olika delar, bör klassificeringen göras före interpolering. Men om man gör klassindelning av andra skäl, t.ex. om det är praktiskt ur brukningssynpunkt, kan man göra det efteråt. Ibland finns det skarpa gränser i rådata mellan olika fältdelar med avseende på markegenskaper. Det kan inte interpoleringsmetoder som kriging och invers distans hantera. Interpolering görs lämpligen bara inom områden där förändringarna är kontinuerliga. Plötsliga hopp längs en linje på ett fält måste identifieras innan man interpolerar.

Regression
Man kan vilja undersöka om det finns samband mellan olika parametrar som uppmätts på fältet. Detta kan göras med regressionsanalys. Om man mätt alla variabler med liknande support (d.v.s. den yta eller volym ett prov representerar) och vid samma koordinater kan man göra regressionsanalysen utan att lägga in data i ett GIS. Men om observationerna är gjorda vid olika koordinater och med annorlunda support krävs interpolering och standardisering av vilken yta som informationen ska representera. Det är t.ex. inte lämpligt att jämföra skörden med elektriskt ledningstal om det förra representeras av 10 kvadratmeter och det senare av en kvadratcentimeter. Ännu sämre är det om mätningen av elektriskt ledningstal skett ett par meter eller mer utanför det område där skörden mätts. Bättre är då att interpolera fram nya värden för skörd och elektriskt ledningstal som har gemensamma koordinater och support (grid- och blockstorlekar).

Sidan uppdaterad 2010-10-28 av Ulrika Williamsson
Relaterade länkar
EU Jordbruk- och Landsbygdsutveckling Länsstyrelsernas hemsida LRF:s hemsida Jordbruksverkets hemsida Samarbetspartners
Greppa är ett samarbete mellan Jordbruksverket, LRF, länsstyrelserna och flera andra rådgivningsorganisationer i Sverige.
Greppa Näringen
Telefon växel 0771-57 34 56
E-post info@greppa.nu
Kontakt