Indledning
Styrelsen for Arbejdsmarked og Rekruttering (STAR) har indgået en aftale med Ankiro om levering af crawlede jobopslag til Jobnet og Work in Denmark (WIDK).
Crawlede jobopslag adskiller sig fra de andre jobopslag i Jobnet og WIDK ved, at de ikke har været igennem menneskehænder; de er datafanget maskinelt.
Denne guide er skrevet til Supporten i STAR (oprindeligt som "pixibog" af Aase Bundgaard fra Ankiro i samarbejde med STAR's 7. kontor) for at hjælpe med at besvare henvendelser fra jobcentrenes medarbejdere samt borgere og arbejdsgivere, der anvender Jobnet.
Hovedflow

Arbejdsgiver
En virksomhed lægger et jobopslag på internettet. Virksomheden kan aktivt lægge det på et vilkårligt antal sites, og når det først ligger dér, kan det crawles og lægges på yderligere et vilkårligt antal sites. Det er hyppigt forekommende.
Crawling
Ankiro indsamler elektroniske jobopslag ved hjælp af en såkaldt crawler, der besøger jobportaler, vikarbureauer, arbejdsgivernes egne websites m.m.
Job/ikke
Ankiros jobgenkender vurderer ved hjælp af sproglaget, om der er tilstrækkeligt mange jobrelaterede ord og vendinger på de enkelte sider til, at det er sandsynligt, at der er tale om et jobopslag.
Sproglaget
Se beskrivelse under "Teknologien bag".
Parsing
Parseren leder efter ord i en given sammenhæng. Den leder efter oplysninger som stillingsbetegnelse, arbejdsgivernavn, ansøgningsfrist, ansættelsesdato og arbejdsstedets postnummer. Den leder efter kendte ord, men ser også på, hvilke sammenhænge ordene står i. Eksempelvis kan stillingsbetegnelser forekomme i flere sammenhænge i et jobopslag, f.eks. som benævnelse for selve jobbet, som forudsætning for at søge jobbet, som benævnelse af dem, man skal arbejde sammen med, og som kontaktpersonens stillingsbetegnelse. Kombinationen af stillingsbetegnelse, og hvor den findes i jobopslaget, får en vægt, der i sidste ende er afgørende for, hvilken stillingsbetegnelse der vælges som den primære stillingsbetegnelse.
Resultatet af parsingen er, at der er datafanget indhold til en række felter, også kaldet metadata.
Klassifikation
På baggrund af det udfyldte feltindhold søges jobopslaget klassificeret i henhold til diverse systemer, f.eks. DISCO og DB07 (branche).
Det færdigklassificerede jobopslag gemmes i jobdatabasen.
Dubletkontrol
Hvert jobopslag kan forekomme på mange sites på internettet, også i lidt forskellige afskygninger. Dubletkontrollen matcher og udstiller mulige dubletter på leverancesitet. Jobnets egne jobopslag indgår i denne kontrol.
Kvalitetskontrol
Kvalitetskontrollen sikrer at der kun kommer jobopslag med i leverancen, der lever op til STAR's krav om indhold. Kvalitetskontrollen frasorterer mao. jobopslag, der set med andre øjne godt kunne tages med.
Filtrering
STAR kan markere jobopslag fra visse adresser eller sites som uønskede eller visse ord som uønskede. Det drejer sig f.eks. om opfordringer til pyramidespil, sexannoncer, men også om virksomheder der har frabedt sig at blive vist i Jobnet/WIDK. Alt dette registreres i filtre på leverancesitet, som desuden viser status på servicemålene.
Webservice (WSDL)
Jobopslagene hentes via en webservice. Datasæt gøres klar til udlevering hver dag inden kl. 10 og kl. 14. Webservice kan altid tilgås for genlevering.
Jobredigering og analyse
Se beskrivelse under Teknologi.
Teknologien bag
Ankiros jobløsning er bygget op over 15 år. Fra starten har målet været at finde mange jobopslag med en minimal manuel indsats. Det har kunnet lade sig gøre ved hjælp af to centrale teknologier:
• Fuzzylogik
• Sprogteknologi
Fuzzylogik
Fuzzylogik (fuzzy logikc) er en cirkalogik i modsætning til en binær logik (sandt eller falsk). Hvis 1,80 defineres som høj om en person, hvad er personen så, hvis hun måler 1,79? I binær logik vil svaret være ikke-høj. I fuzzylogik gives en værdi for i hvor grad kriteriet er opfyldt. Fuzzylogik gradbøjer, populært sagt, og er i særlig grad interessant når der stilles flere kriterier op for udvælgelse. At Ankiro anvender fuzzylogik i en række algoritmer, gør det muligt at finde de dokumenter der opfylder flest mulige kriterier med højest mulig vægt bedst muligt.
Sprogteknologi
Sprogteknologien danner grundlaget for Ankiros anvendelse af fuzzylogik, idet ordudvidelser, bøjninger, synonymer og andre relationer mellem ord og begreber udgør den base fuzzylogikken benytter sig af når den skal vægte opfyldelsen af de forskellige kriterier.
Sprogteknologien består af viden samt en række værktøjer til strukturering og beskrivelse af denne viden. Ankiro har lingvister ansat som udfører dette arbejde.
Sproglaget
Sproglaget er en samlebetegnelse for Ankiros ordbøger og ontologier med jobmarkedsord og -vendinger. Ontologierne indeholder bl.a. kategorier og underkategorier, f.eks. stillingsbetegnelsen sygeplejerske og understillingsbetegnelserne barneplejerske, anæstesisygeplejerske, operationssygeplejerske, psykiatrisk sygeplejerske m.fl. Ordbøgerne indeholder synonymer, f.eks. apoteksassistent og farmakonom.

Comments
0 comments
Article is closed for comments.