Googling ja, men vær kritisk og pas på datamining

Google blev oprettet i 1998 af to ph.d.-studerende ved Stanford University. Dengang eksisterede der allerede mange store søgemaskiner, fx Altavista, men de to iværksættere udviklede en søge-algoritme, som var bedre end konkurrenternes, og desuden tilbød de nogle søgemuligheder, som ingen andre havde.

I dag tilbyder Google – ud over søgefunktionen – mange forskellige tjenester på nettet, bl.a. gratis software, film (You Tube) og Google Earth.

Det hele er ”gratis” – det vil sige ikke nødvendigvis finansieret af dig! – men virksomheden finansieres af reklameindtægter, og hvilket firma er ikke interesseret i et medie, der besøges af mere end 200 millioner hver eneste dag.

Google er eksperter i at skabe netop de få, men rigtige reklamer på en hjemmeside. Det kan man gøre på baggrund af fx adgang til følsomme data fra brugerne. Det opfattes af mange som en trussel mod privatlivets fred.

En søgning er ikke – som mange måske tror – neutral. Firmaer og andre der måtte ønske det, kan betale for at blive vist som første søgeresultat eller vist i spalten til højre for søgeresultatet.I 2008 erkendte Microsoft, at Google’s satsning på nettet og ”gratis” strategi var blevet en alvorlig trussel. Derfor købte de verdens næststørste søgemaskine Jahoo for mere end 200 milliarder. En svimlende pris, som dokumenterede værdien af det annoncemarked på Internettet, som Microsoft vil have adgang til.

 

Kildekritik på nettet

Der er al mulig grund til at være kritisk når man søger data og informationer på nettet. Der er kun et enkelt klik mellem kvalitets informationer og det rene vrøvl (I mange tilfælde løgn og manipulation).
Derfor er det en god ide at være opmærksom på følgende:

  • Hvem er afsenderen? Er det skrevet af en professionel eller en selvudnævnt ekspert? Hvilke kvalifikationer har den pågældende?
  • Der skal altid være en kontaktadresse på hjemmesiden.
  • Hvem er udgiveren – en privatperson, institution, organisation eller virksomhed.
  • Hvad er hjemmesidens formål? Hvem er målgruppen? Er informationerne korrekte – eller er der noget, der ikke harmonere med din egen viden og erfaringer?
  • Aktualitet. Bliver hjemmesiden vedligeholdt? Er der døde links? Hvornår er siden sidst blevet opdateret. Nettet er lagerplads for store mængder forældet information.
  • Kildehenvisninger. Det øger troværdigheden. Det samme gør links til andre sider.

Der er mange flere ting som skal være opfyldt, for at undgå, at alarmklokkerne ringer. Men den allersikreste måde at kontrollerer informationerne på er at bruge det journalistiske grundprincip, byg altid en historie på flere kilder. D.v.s. brug kun informationer, som kan bekræftes af flere uafhængige hjemmesider.

  • Det er klogt at se sig godt omkring, selvom det er tidskrævende. Det er nødvendigt, fordi enhver idiot kan lægge sine synspunkter og ”videnskabelige” analyser på nettet.
  • Kontra-googling
    Aktive og bevidste forbrugere bruger Google, inden de træffer et valg. Samsung eller Sony? Google gør dem klogere. Omvendt kan Google også gøre virksomheden klogere på sine forbrugere. Nettet indeholder uanede mængder af personlig information, hvorfor ikke udnytte det og overraske kunderne?

Datamining

Minedrift* i et datalager handler om at få ”vredet” alle de informationer ud af de data man allerede har.

Når mange tusinde svarer på spørgsmål, køber varer eller blot surfer på nettet, så efterlader det langt flere elektroniske spor end de fleste aner.

Man kan i høj grad bruge datamining til at søge efter skjulte mønstre i en stor gruppe af data, så man kan tegne profiler af de mennesker, som disse data vedrører.

Talknuseri

Datamining er blevet muligt fordi vi er blevet i stand til at beregne og analysere store mængder af data. Det er nu muligt at finde meningsfulde sammenhænge selvom de udgør en brøkdel af et kæmpestort datamateriale.

Man kan også inddrage offentligt tilgængelige eksterne data, som virksomheder, organisationer, private og offentlige institutioner har lagt på nettet.
www.berg-marketing.dk har følgende eksempel på konkret datamining.

Googling your mind and the truth

”A good example of data mining is a Midwest grocery chain that used the data mining capacity of Oracle software to analyze local buying patterns. They discovered that when men bought diapers on Thursday and Saturdays, they also tended to buy beer. Further analysis showed that these shoppers typically did their weekly grocery shopping on Saturdays. On Thursdays, however, they only bought a few items. The retailer concluded that they purchased the beer to have it available for the upcoming weekend. The grocery chain could use this newly discovered information in various ways to increase revenue. For example, they could move the beer display closer to the diaper display. And, they could make sure beer and diapers were sold at full price on Thursdays.”Kilde: Aaker, David A. & V. Kumar & George S. Day: Marketing Research. 7th ed, John Wiley & Sons, New York 2001.

 

 

 

 

 

 

 

 

 

Det, som den amerikanske detailhandelskæde (minder fx om den danske Kvickly kæde) gjorde, ville være klart ulovligt i Danmark, hvor lovgivningen kræver, at data kun må bruges til deres oprindelige formål – det som kilden er bekendt med.

Men det er harmløst i forhold til den datamining som måske allerede gennemføres, er mulig eller på vej.

Markedskontrol

Sindelagskontrol. Forestil dig, at man gennemførte en datamining på alle de bøger du har lånt på biblioteket siden første klasse. Dine uddannelsessteder og karakterer i forskellige fag, medlemsskaber i foreninger, økonomi, bopæl, familieforhold og ikke mindst din adfærd, når du surfer på nettet, så ville man med næsten 100 % nøjagtighed kunne afgøre hvilket parti du sympatiserer med, eller om du foretrækker de autonome.

Monopol på sandheden. Internettets styrke, er samtidig dets svaghed. Via Google kan man i runde tal søge på 10 milliarder hjemmesider, 3 milliarder billeder og nær 1 milliard nyhedsgrupper.  Her finder man løgne, manipulationer og det rene vrøvl side om side med sande informationer.

Derfor bruger Google og alle andre, der driver søgemaskiner milliardbeløb på at finde et værktøj der kan sikre, at når du “Googler” på Internettet, så finder du ikke bare de informationer du ønsker, men også informationer der er sande!Det man søger at udvikle er en ”sandheds-algoritme”*, som er lige så unik, som den algoritme der styrer Google´s søgemaskine, og som er omgæret af lige så megen hemmelighed som recepten på Coca Cola.

Men en ”sandheds-algoritme” kræver både datamining og at man definerer, hvad der er sandt, og hvem kan egentlig det!

Lige meget, hvem der udvikler dette værktøj, så vil det betyde en meget stor kulturel og politisk indflydelse, når en betydelig del af hele verdens informationer bliver filtreret fx gennem Google´s optik.

Kulturimperialisme

I Frankrig, hvor man har stærke traditioner for at beskytte landets selvstændighed både økonomisk, militært og kulturelt opfatter man nogle af Google´s initiativer som udtryk for amerikansk kulturimperialisme, på samme måde, som man tidligere opfattede Disneys dominans på tegnefilmsmarkedet.

Det er tankevækkende, at den browser-software, der i dag forsøger at beskytte brugerne mod uønsket indtrængning udefra, samtidig selv kan gennemføre datamining helt ind på den enkelte PC´s harddisk.
De informationer kan så bruges til at udvikle en søgemaskine, der kan overgå Google fordi den bl.a. kan sortere ”sande” og ”falske” informationer!