Bedre søk på din egen nettside med Solr

Einar Ryvarden

Einar Ryvarden, digitalsjef, Tidsskrift for Den norske legeforening deler sine beste tips for et godt internt søk på nettsider.

Av Einar Ryvarden, digitalsjef, Tidsskrift for Den norske legeforening, Tlf: 98 21 66 65

Jeg deler utfordringene og valgene vi i Tidsskriftet for Den norske legeforening har gjort med søket på Tidsskriftet.no, bygget med søketeknologien Solr. Internsøk er komplisert å sette opp. Vi lærte følgende etter hvert som interne og eksterne brukere gav innspill på et nytt internsøk i 2020.

Hovedutfordringen er at forskjellige interne og eksterne brukere har veldig forskjellig forventninger og ønsker: Både ansatte, forskere, praktiserende leger, pasienter og pårørende privatpersoner bruker søker for å finne kunnskap på forskjellige måter. Innspillene man får spriker derfor i mange retninger. 

Mange forventer at søket fungerer som Google. Hvorfor kan jeg ikke som på Google bare få en liste med relevante treff? Vel, Google sorterer noen milliarder treff og har gjort noen valg de også, det er bare ikke så lett å se dem. Ansatte leter kanskje om artikler de vet skal finnes eller mener burde komme opp på et søk, men på Google vet du ikke hva som blir utelatt. Og Google presenterer mange veldig gamle lenker.

Her er innstillingene vi har valgt.

  • Vi bruker ikke Solr-funksjonen stemming. Vi fant ut at stemming gav for mange uønskede treff, særlig med korte ord. Søkte man på «ord» fikk man artikler med «orden» og «ordfører». Ulempen er at et søk på «hjerte» ikke viser artikler hvor bare ordet «hjerter» forekommer. 
  1. Vi serverer i utgangspunktet treffene kronologisk, men man kan velge relevans. Vi tror kronologisk er viktigst når vi bare har 40.000 artikler. Og vi synes Google serverer for mye gammelt innhold.
  2. Vi gir brukerne en del valg rundt søket, f eks. søk bare i titler og ingresser/første avsnitt, velg år, forfatter og artikkeltype. Men putter man på for mange valg, blir det forvirrende og tar for mye plass på mobil.
  3. Tidsskriftet er et vitenskapelig publikasjon der artikler har referanser, men vi har ekskludert referansene i artiklene fra søket, både fordi de gir mange lite relevante treff og de ligger på bunnen av artiklene. Så vurder om det er noen faste biter av sidene dine du ikke vil skal være med i søket.
  4. Man kan også gjøre boosting (øke relevansen på utvalgte sider), legg til synonymer (søk etter ordet X viser også artikler med ordet Y), men ikke noe vi ser noe behov for. Kan være riktig for andre, særlig innen netthandel.
  5. Vi holder på med å få på plass Facets og Suggester, to Solr-funksjoner. Fasetter (Facets) gir navigering og sortering av søkeresultatene i stikkord du kan klikke på. På Tidsskriftet.no vil søkeresultatene øverst få en rad med artikkeltypene (fks. kommentar) og antall treff innen dem. Et klikk på "Kommentar" vil begrense søketreff-listen til Kommentar-artikler. Suggester gir som på Google en liste over søkeforslag mens du skriver inn det du vil søke etter. 

I tillegg er testing/kvalitetssikring av søk tidskrevende. Man må teste alle opsjoner, f.eks. et ord, flere ord, kombinasjoner og andre funksjoner som bare søk i titler. Det er komplisert å sjekke om alle riktige sider med i treffene og om man har fått servert falske treff. Ofte må man sammenligne med Google eller liste-sider og de kan ha feil. 

Så gjør noe valg, sjekk søketrafikken og bestem deg for hvor mye tid du skal bruke på internsøket.

Ønsker du å vite mer om muligheter for å lage et bedre søk på dine nettsider, enten med Drupals interne søk eller Solr. Ta kontakt med Stephan Zeidler for mer informasjon.

Latest news

We have gathered some reasons why Drupal could be a better choice for your needs.
 

Yngve W. Bergheim
Yngve W. Bergheim

Cookies have played a significant role in the digital landscape for quite some time, offering various benefits. However, as online information becomes more abundant, the search giant Google is taking a decisive step by phasing out third-party cookies in its Chrome browser. 

Pierre Aryee
Perry Aryee

With Drupal 9 having reached its end of life (EOL) on November 1, it’s time to start planning for an upgrade.

Pierre Aryee
Perry Aryee

Drupal has been a robust choice for building and maintaining websites for decades. Like all other CMS systems, technological advancements and security requirements continually evolve at rapid speed and older software versions will be taken off the market.
 

Nina
Nina Holzapfel