Metadata - en nøkkel til samhandling
Metadata er informasjon om informasjon. Så enkelt. De fleste nettaviser legger allerede inn metadata. De fleste legger inn fakta om hvem som har skrevet artikkelen, og når ble den skrevet. Vi genererer metainnhold for å bli fanget opp av søkemotorer. Det er i de fleste mediehus økende fokus på å bedre og rikere metadata. Et eksempel er deskriptive metatags: Hva handler saken om? Et annet er geodata: Hvilket geografisk sted er det snakk om? Samtidig, når antallet kanaler øker, trenger mediehusene styringsdata for innholdet sitt: Hva skal publiseres hvor? Et internt system som forenkler flyten mellom weptop, apps og papirutgaver. Dette er prosesser som de fleste mediehus har et forhold til, særlig i en verden der antallet flater vi skal produsere for øker, dramatisk. Bedre strukturert innhold er viktig, i et kostnadsperspektiv. Men hva så med inntektene?
I dag skjer diskusjonene innenfor konsernets trygge vegger. Man forholder seg i stor grad til egne kanaler. Man holder hardt på "koblingen" mellom innholdsproduksjon og distribusjon. Samtidig ser vi at digitale medier i økende grad distribueres via kanaler man selv ikke har kontroll over. Fenomenet Social Newspapers har sett dagens lys. Tjenester som flipboard og paper.li bruker lenker som distribueres i sosiale nettverk og aggregerer "aviser" on the fly. Rupert Murdoch valgte betalingsmuren for en del av sine publikasjoner. Men har han dermed også gjort innholdet utilgjengelig for lenkeflyten og den åpne diskusjonen som preger det frie nettet i økende grad. (Facebook distribuerer i dag 30 miliarder lenker, bilder etc per måned). Den anonyme advokaten som blogget for the Times meldte nylig overgang til The Guardian. Han valgte åpenhet framfor lukkethet. "inside the paywall no-one can even hear you scream", konstaterte han.
Det finnes stadig tydeligere stemmer som mener at metadata er et alternativ til betalingsmuren. Det finnes modeller som ivaretar den frie distribusjonen som preger nettet og sikrer at man bidrar til å utvide informasjonsveven og samtidg behovet for å få betalt for godt innhold. Google har tidligere snakket om at avisen forretningsmodell var preget av "bundling", eller sammenveving, av redaksjonelt innhold, kjøpte flater og distribusjon. Nettets frie anarki bryter forretningsmodellen ned til sine enkelte bestanddeler. Søkemotorer og sosiale nettverk oppløser det integrerte produktet til enkeltartikler. En kjempeutfordring. Men finnes det et mulighetsrom her?
Vi mener det. Og vi mener at mulighetsrommet knyttet til metadata handler om langt mer enn bedre produksjonsflyt og kreative muligheter for presentasjonslaget på den enkelte nettavis. Metadata er nøkkelen til strategisk samhandling. Metadata er potensielt en universalnøkkelen som forbedrer ulike plattformers "interoperability" eller samfunksjonsevne. Metadata kontekstualiserer og strukturerer. Derfor tror vi norske medier bør bruke felles arenaer for å utforske dette mulighetsrommet.

En av dem som har begynt utforskningen er Associated Press, som har etablert sin "News Registry", en tjeneste som gjør det mulig å tracke hvor ofte en sak er blitt lest. Det åpne for en "omsetnings-optimalisering" av det innholdet man velger å tilgjengeliggjøre fra AP. I Storbrittannia står Linked Data og standardisering av utvekslingsformater veldig sentralt i diskusjonen om nettets framtid. Media Standards Trust har sammen med Web Science Trust utviklet løsningen Value Added News, et system bestående av standardiserte mikroformater der særlig rettighetsklarering står sentralt. Brukerne av systemet kan selv etablere sine egne lisensmodeller, og slik åpne for ryddig, sporbar og kommersialiserbar videredistribusjon via tredjepartsaktører. Systemet generer også deskriptive tags og geotags, og gjør det enklere for brukerne av systemet å autotagge arkivinnhold. Under finner du et eksempel på betingelsene knyttet til gjenbruk av APs nyheter.
Her ser man blant annet at AP åpner distribusjonen av innholdet sitt, mot at distributøren inkluderer annonsen, subsidiært mot en abonnementsløsning basert på sirkulasjon eller antall visninger. Dette systemet er muliggjort av metadata om rettigheter knyttet til den enkelte artikkel. Og vi minner om: Dette er et tidligfase-eksperiment. Bør vi ta høyde for slikt også i Norge? Hva skal til for å åpne for denne typen distribusjon i den norske innholdsøkologien?
1. Bruk eksterne deskriptor-biblioteker. Man henter referansene til descriptive tags fra en kilde utenfor det enkelte mediehus. Med andre ord gjør man metainformasjon til Linked Data. Man bygger altså ikke opp biblioteket i egen regi, men kobler det mot eksistererende biblioteker, som for eksempel dbpedia. Her ligger det allerede mange referanser. Et eksempel er URIen (unformed resource identifactor) til Bergens Tidende. Siden svært mange datakilder er sammenbundet på metanivå, åpner Linked Data for storstilt integrering av ekstern innhold mot eget innhold. Et eksempel på dette er deskriptorene som brukes av New York Times (som er gjenbrukbart for andre via et eget API). Et eksempel på et nordisk nettmedium som har begynt å ta ut potensialet i integrasjon av eksternt innhold, er Information.dk
2. Fokuser på rettigheter og forretningslogikk. Man bør jobbe sammen, på tvers av mediehus, med generiske viderebruks-standarder og forretningsmodeller knyttet til metadatastandarder. Det vil si at metadata-prosjekter i mindre grad gjøres til proprietære prosjekter, men prosjekter som regulerer samhandling mellom ulike partnere.
3. Ta utgangspunkt i norsk språk og innholdsøkologi. Når metadata pares med semantisk teknologi (eller språklogikk) oppstår en rekke spennende muligheter, ikke minst for aktivering av sovende arkivmateriale. Eksisterende tjenester, som Open Calais er at det ikke kommer i norskspråklige versjoner. Norge er et bittelite land, norsk er et bittelite språk. Det betyr at man må utvikle tjenester som skjønner norsk, noe eksempelvis bergensbaserte Texturgy leverer. Å være enige om et sett av deskriptorer ville gjort det enklere å bygge inn intelligent språklogikk for hvert begrep.
4. Gjør metadata rikere. Finnes det en mulighet for å samfinansiere ulike webservicer som beriker innholdet basert på metadata? Vi tror det. Men hva mener vi med "beriking"? En vanlig tag i dag er en såkalt "freetag". Det er et begrep som kun peker på seg selv. Ved å hente tags fra en eksisterende ontologi (begrepsliste) kan vi både forankre taggen i en definisjon, men også gi begrepene referanser til andre tilstøtende informasjonsressurser. Taggen "Bergen Kommune" kunne eksempelvis også vært bærer av vektordata som angir kommunegrensene på et kart og kommunens offisielle nettadresse. Taggen Audun Lysbakken kunne vært beriket med Audun Lysbakkens twitterkonto, blogg-rss, voterings- og interpellasjonsdata fra stortinget etc. Den vanlige firedelingen av deskriptive tags er personer, foretak, steder, deskriptorer. Det finnes offentlige registre som kunne utgjort "bibiloteket" for alle disse kategoriene.
Vårt utgangspunkt er at den norske medieøkonomien er velegnet for eksperimentering rundt metadata-baserte forretningsmodeller. Et overkommelig antall aktører, et marginalt språk og et høyt digitalt mediekonsum gjør at man kan komme opp med modeller som også har eksportpotensiale.
Vi i MediArena ønsker fremover å være en pådriver og bidra til slike prosesser.
Er vi på rett spor?

